JP3876584B2 - 画像検出装置及び画像検出方法 - Google Patents

画像検出装置及び画像検出方法 Download PDF

Info

Publication number
JP3876584B2
JP3876584B2 JP2000029070A JP2000029070A JP3876584B2 JP 3876584 B2 JP3876584 B2 JP 3876584B2 JP 2000029070 A JP2000029070 A JP 2000029070A JP 2000029070 A JP2000029070 A JP 2000029070A JP 3876584 B2 JP3876584 B2 JP 3876584B2
Authority
JP
Japan
Prior art keywords
pixel
value
luminance
determination
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000029070A
Other languages
English (en)
Other versions
JP2001222681A (ja
Inventor
景泰 宮原
征寛 今村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000029070A priority Critical patent/JP3876584B2/ja
Publication of JP2001222681A publication Critical patent/JP2001222681A/ja
Application granted granted Critical
Publication of JP3876584B2 publication Critical patent/JP3876584B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、ディジタル画像中に含まれる記号部分を検出する画像検出に関するものであり、特に情景画像中に含まれる文字や図形などの記号部分を検出する画像検出装置及び画像検出方法、さらに検出された画像から文字を認識する文字認識装置及び文字認識方法に関するものである。
【0002】
【従来の技術】
図13は、例えば特開平3−43881号公報に示された従来の文字列検出装置を示す構成図である。図13において、100は原画像中の画像検出の対象となる所定領域のディジタル信号を入力し入力画像とする画像入力部、101は画像入力部100から入力する入力画像の各画素について移動平均値を求める移動平均部、102は前記入力画像と移動平均部101が算出する移動平均値とで減算を行い高周波画像を生成する画像差分部、103は画像差分部102で生成された高周波画像に対して上下限リミッタ処理を行なう上下限リミッタ、104は上下限リミッタ処理の加わった高周波画像に対して部分領域毎にヒストグラムを作成して2値化処理を行うヒストグラム作成・2値化部、105は文字列近傍のみを検出して2値画像を生成する論理演算部である。
【0003】
次に、前記の従来技術として示す文字列検出装置の動作を説明する。まず、画像入力部100は、画像検出を行う原画像のうち所定領域のディジタル信号を入力する。画像入力部100で得られる入力画像は、各画素が輝度に応じた0から255までの階調数に画素値をとるグレースケール画像であるものとする。以下では、入力画像に含まれる各画素の量子化された画素値を「原画素値」と呼ぶ。この入力画像には、文字や図形などの記号部分として検出されるべき対象部分が含まれている。検出されるべき画像は、一定の太さからなる線素で構成されている。以下では、入力画像のうち文字や図形などの記号部分として検出されるべき対象部分を「文字部」と、それ以外の部分を「背景部」と呼ぶ。
【0004】
次に、移動平均部101は入力画像を構成する各画素について、当該画素を中心とした縦1画素、横p画素の部分領域を特定し、当該部分領域に含まれる全画素の原画素値から、その部分領域に関する平均画素値を算出する。平均画素値算出の対象となる部分領域の大きさは、部分領域の幅の画素数pによって規定される。このpの値は、検出したい文字の幅の数倍程度になるように、予め設定しておく。移動平均部は、平均値画素値算出の対象となる画素及びその画素に対応する部分領域を順次換えながら、入力画像の全画素について、対応する平均画素値を算出する。
【0005】
次に、画像差分部102は、入力画像の画素について原画素値と移動平均部101の求めた平均画素値とで減算を行う。この原画素値と平均画素値の減算結果を、以下では「高周波画素値」とする。画像差分部は、画像検出の対象となる全画素について高周波画素値を算出し、その結果から演算処理された画像を生成する。この演算処理された画像を、以下では「高周波画像」とする。この高周波画像においては、各画素の高周波画素値は以下のような特徴を有する。まず、文字部を構成し原画素値が大きい画素では、高周波画素値は大きくプラスに偏移する。次に、背景部であって文字部の近傍にある画素では、高周波画素値は大きくマイナスに偏移する。最後に、原画素値がなだらかに変化しているところでは、高周波画素値がほぼゼロになる。
【0006】
次に、上下限リミッタ103は、この高周波画像を対象として、上下限リミッタ処理を行なう。すなわち、高周波画素値があらかじめ定めた上限値より大きい場合には、当該高周波画素値を上限値に制限し、逆に、高周波画素値があらかじめ定めた下限値より小さい場合には、当該高周波画素値を下限値に制限する。
【0007】
次に、ヒストグラム作成・2値化部104は、前記上下限リミッタ処理の加わった高周波画像を、適当な大きさで複数の部分領域に分割し、各部分領域について上下限リミッタ処理された高周波画素値のヒストグラムを作成する。さらに、ヒストグラム生成・2値化部は、各部分領域高周波画素値のヒストグラムから各部分領域内の高周波画素値の平均と分散を算出し、下記式1の条件に従って高輝度2値画像H(x,y)と低輝度2値画像L(x,y)を作成する。これらの2値画像では、前記の高周波画像の特性により、画素値が大きい文字部ではH(x,y)が1となり、その背景部であって文字部の近傍にある画素ではL(x,y)が1となる。
【0008】
【数1】
Figure 0003876584
【0009】
最後に、論理演算部105は、高輝度2値画像H(x,y)および低輝度2値画像L(x,y)について、下記式2の論理演算を行なう。式2において、lは検出対象とする文字部の線素の太さに相当する画素数であり、予め設定しておく。この論理演算により、両サイドのL(x,y)が1で中央のH(x,y)が1の部分と、両サイドのH(x,y)が1で中央のL(x,y)が1の部分だけが1となり、文字部の輪郭だけが検出された検出画像が生成される。
【0010】
{(H(x,y)∩L(x-l,y))∩(H(x,y)∩L(x+l,y))}∪{(H(x-l,y)∩L(x,y))∩(H(x+l,y)∩L(x,y))} … (式2)
【0011】
【発明が解決しようとする課題】
前記、従来の文字列検出装置では、検出対象とする文字や図形などの記号部分の検出に、記号部分の大きさや線素の太さなどに依存した定数(前記p及びl)を用いている。したがって、入力画像中に含まれる文字や図形などの記号部分の大きさ及び線素の太さが予め明らかでない場合には正確に文字や図形などの記号部分の検出を行うことができない、という問題があった。
【0012】
また、従来の文字列検出装置では、一度の検出処理を通じ前記文字列検出に用いる定数(前記p及びl)が固定されている。したがって、入力画像中に幅や線素の太さの異なる文字や図形などの記号部分が含まれている場合にはそれらを同時に検出することができない、という問題もあった。
【0013】
本発明は、前記課題を解決するためになされたものであり、検出されるべき入力画像中の図形や文字などの記号部分の大きさや線素の太さに関係なくこれらを検出することができ、記号部分の大きさや線素の太さ等が予め明らかでない場合や、入力画像中に幅や線素の太さの大きく異なる記号部分が含まれている場合であっても、これらを正確に検出することが可能な画像検出装置及び画像検出方法、並びに文字認識装置及び文字認識方法を得ることを目的としており、さらに画像検出処理や文字認識処理に要する記憶容量や処理時間をできるだけ増大させずに、高輝度の記号部分と低輝度の記号部分とを同時に検出することが可能な、画像検出装置及び画像検出方法、並びに文字認識装置及び文字認識方法を提供するものである。
【0014】
【課題を解決するための手段】
【0015】
前記の課題を解決し、目的を達成するために、本発明にかかる画像検出装置にあっては、入力画像を入力する画像入力手段と、この画像入力手段で入力された入力画像から画素判定の対象とする注目画素に対して大きさの異なる複数の参照領域を特定する参照領域特定手段と、この参照領域特定手段で特定された前記参照領域に含まれる画素の原画素値に基づいて、前記参照領域ごとに参照値を算出する参照値算出手段と、この参照値算出手段が算出した前記参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と文字部判定用の閾値との比較に基づいて前記注目画素を前記入力画像の文字部と判定する画素判定手段とを備えたことを特徴とする。
【0016】
本発明にかかる画像検出装置にあっては、前記参照領域特定手段は、前記参照領域と同じ大きさで前記注目画素との相対的な位置が異なる複数の参照領域からなる参照領域群を特定し、前記参照値算出手段は、前記参照領域特定手段が特定した前記参照領域群を構成する参照領域の参照値を算出し、前記画素判定手段は、参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と第1の文字部判定用の閾値との比較に基づいて前記注目画素が前記文字部と判定されるとき、この参照領域を含む参照領域群の参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と第2の文字部判定用の閾値との比較に基づいて前記注目画素を前記文字部と判定することを特徴とする。
【0017】
本発明にかかる画像検出装置にあっては、前記画素判定手段は、前記差分値と文字部判定用の閾値との比較に基づいて前記参照領域の参照値より大きい原画素値をもつ前記注目画素を高輝度文字部とする文字部判定を行い、高輝度文字部か否かを示す判定結果を出力することを特徴とする。
【0018】
本発明にかかる画像検出装置にあっては、前記画素判定手段は、前記差分値と文字部判定用の閾値との比較に基づいて前記参照領域の参照値より小さい原画素値をもつ前記注目画素を低輝度文字部とする文字部判定を行い、低輝度文字部か否かを示す判定結果を出力することを特徴とする。
【0019】
本発明にかかる画像検出装置にあっては、前記画素判定手段は、前記参照値算出手段が算出した前記参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と高輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より大きい原画素値をもつ前記注目画素を高輝度文字部とする文字部判定を行い、高輝度文字部か否かを示す判定結果を出力するとともに、前記差分値と低輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より小さい原画素値をもつ前記注目画素を低輝度文字部とする文字部判定を行い、低輝度文字部か否かを示す判定結果を出力することを特徴とする。
【0020】
本発明にかかる画像検出装置にあっては、前記画素判定手段は、前記参照値算出手段が算出した前記参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と高輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より大きい原画素値をもつ前記注目画素を高輝度文字部とする文字部判定と前記差分値と低輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より小さい原画素値をもつ前記注目画素を低輝度文字部とする文字部判定を行い、前記注目画素が高輝度文字部または低輝度文字部またはこれら文字部以外のいずれかを示す判定結果を出力することを特徴とする。
【0021】
本発明にかかる文字認識装置にあっては、本発明にかかる画像検出装置に、前記画素判定手段が前記注目画素に対して文字部判定して出力した判定結果に基づいて文字認識する文字認識手段を備えたことを特徴とする。
【0022】
本発明にかかる画像検出方法にあっては、入力画像を入力する画像入力工程と、この画像入力工程で入力された入力画像から画素判定の対象とする注目画素に対して大きさの異なる複数の参照領域を特定する参照領域特定工程と、この参照領域特定工程で特定された前記参照領域に含まれる画素の原画素値に基づいて、前記参照領域ごとに参照値を算出する参照値算出工程と、この参照値算出工程が算出した前記参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と文字部判定用の閾値との比較に基づいて前記注目画素を前記入力画像の文字部と判定する画素判定工程とを有することを特徴とする。
【0023】
本発明にかかる画像検出方法にあっては、前記参照領域特定工程は、前記参照領域と同じ大きさで前記注目画素との相対的な位置が異なる複数の参照領域からなる参照領域群を特定し、前記参照値算出工程は、前記参照領域特定工程が特定した前記参照領域群を構成する参照領域の参照値を算出し、前記画素判定工程は、参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と第1の文字部判定用の閾値との比較に基づいて前記注目画素が前記文字部と判定されるとき、この参照領域を含む参照領域群の参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と第2の文字部判定用の閾値との比較に基づいて前記注目画素を前記文字部と判定することを特徴とする。
【0024】
本発明にかかる画像検出方法にあっては、前記画素判定工程は、前記差分値と文字部判定用の閾値との比較に基づいて前記参照領域の参照値より大きい原画素値をもつ前記注目画素を高輝度文字部とする文字部判定を行い、高輝度文字部か否かを示す判定結果を出力することを特徴とする。
【0025】
本発明にかかる画像検出方法にあっては、前記画素判定工程は、前記差分値と文字部判定用の閾値との比較に基づいて前記参照領域の参照値より小さい原画素値をもつ前記注目画素を低輝度文字部とする文字部判定を行い、低輝度文字部か否かを示す判定結果を出力することを特徴とする。
【0026】
本発明にかかる画像検出方法にあっては、前記画素判定工程は、前記参照値算出工程が算出した前記参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と高輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より大きい原画素値をもつ前記注目画素を高輝度文字部とする文字部判定を行い、高輝度文字部か否かを示す判定結果を出力するとともに、前記差分値と低輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より小さい原画素値をもつ前記注目画素を低輝度文字部とする文字部判定を行い、低輝度文字部か否かを示す判定結果を出力することを特徴とする。
【0027】
本発明にかかる画像検出方法にあっては、前記画素判定工程は、前記参照値算出工程が算出した前記参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と高輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より大きい原画素値をもつ前記注目画素を高輝度文字部とする文字部判定と前記差分値と低輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より小さい原画素値をもつ前記注目画素を低輝度文字部とする文字部判定を行い、前記注目画素が高輝度文字部または低輝度文字部またはこれら文字部以外のいずれかを示す判定結果を出力することを特徴とする。
【0028】
本発明にかかる文字認識方法にあっては、本発明にかかる画像検出方法に、前記画素判定工程が前記注目画素に対して文字部判定して出力した判定結果に基づいて文字認識する文字認識工程を有することを特徴とする。
【0029】
【発明の実施の形態】
実施の形態1.
図1は、本実施の形態1にかかる文字認識装置の構成図である。図1において、1は画像検出の対象となる原画像を入力する画像入力部、2は画像入力部1で入力された入力画像に含まれる複数の部分領域を参照領域として特定する参照領域特定部、3は参照領域特定部2で特定された複数の参照領域について参照値を算出する参照値算出部、4は画像検出を行う所定領域に含まれる全画素について画素判定を行う画素判定部、5は画素判定部4の出力である画素判定結果を記憶して2値画像を生成する検出画像記憶部、6は検出画像記憶部5で生成された2値画像から文字を認識する文字認識部である。
【0030】
以下、前記のように構成される文字認識装置の動作を図面に従って説明する。図2は、前記文字認識装置の処理フロー図である。まず、画像入力部1が画像検出を行う原画像のうち所定領域のディジタル信号を入力する(ステップS1)。画像入力部1で得られる入力画像は、各画素が輝度に応じた0から255までの階調数に量子化された画素値をとるグレースケール画像であり、明るい画素ほど大きな画素値になるものとする。
【0031】
次に、参照領域特定部2は、入力画像に含まれる複数の部分領域(#1#N、Nは特定される参照領域の数)を参照領域として特定する(ステップS2)。図3は、参照領域特定部2で特定される参照領域を示した模式図である。図3において、7は文字部であるか背景部であるかの画素判定の対象となる画素、810は参照領域として特定される部分領域である。以下では、画像検出を行う所定の領域に含まれる、文字部であるか背景部であるかの画素判定の対象となる画素を「注目画素」と呼ぶ。図3では、特に参照領域特定部2が注目画素を中心として形状が同じで大きさの異なる三つの部分領域を参照領域として特定した場合について示している。この場合は、特定される参照領域の数Nは3である。ここで、参照領域特定部2は、最小の部分領域8を第1番目(#1)の参照領域として、中間の大きさの部分領域9を第2番目(#2)の参照領域として、最大の部分領域10を第3番目(#3)の参照領域として特定する。ここで、最小の部分領域8の大きさは、入力画像の大きさなどに応じて予め定めておく。
【0032】
次に、参照値算出部3は、参照領域に含まれる全画素の原画素値の平均値をそれぞれ計算し、これを注目画素についての参照値とする(ステップS3)。ここでは、ひとつの注目画素について、特定された参照領域は複数あるので、算出される参照値も、参照領域それぞれに対応し複数算出される。
【0033】
参照値算出部3は、入力画像のうち画像検出を行う所定領域内に含まれる全画素について、注目画素を順次換えながら前記参照値算出を繰り返し、画像検出を行う所定領域内に含まれる全画素のそれぞれに対応する複数の参照値(#1#3)を求める。
【0034】
次に、画素判定部4は、入力画像の原画素値と、参照値算出部3で参照された当該画素に対応する複数の参照値とを比較して画像検出を行なう(ステップS4)。以下、ひとつの注目画素についての画素判定処理を図4により説明する。図4は、画素判定処理の処理フロー図である。図4において、nは参照値を特定するために示す変数である。nは参照値が算出対象とされた参照領域の大きさが小さい順に対応付けられており、n=1ならば最小の参照領域についての参照値を、n=Nならば最大の参照領域についての参照値を示す。
【0035】
まず、画素判定部4はnを1に初期化し(ステップS11)、最小の参照領域についての参照値と注目画素の原画素値とを式3に従って比較し、注目画素が文字部であるか判定を行う(ステップS12)。ここで式3は、周辺より輝度が高い画素、すなわち背景部と比較して高輝度の文字部を検出するために用いる比較条件式である。
【0036】
原画素値−参照値 > C1 … (式3)
ただし、C1は定数である。
【0037】
次に、画素判定部は前記式3が成立したか判断し(ステップS13)、成立した場合は(ステップS13、Yes)、当該注目画素を文字部と判定して画素判定結果の出力を1とし(ステップS14)、画素判定処理を終了する。一方、ステップS13で前記式3が成立しなかった場合は(ステップS13、No)、nに1加算した後(ステップS15)、nが最大値Nより大きな値になったか判定する(ステップS16)。この判定の結果、nがN以下の場合には(ステップS16、No)、前回比較した参照値よりも1段階大きな参照領域から算出された参照値に基づいて、当該注目画素についての画素判定処理を繰り返す(ステップS12、ステップS13)。ステップS16で、nがNより大きな値になった場合は(ステップS16、No)、全参照値との比較の結果文字部と判定されなかったので、当該注目画素を背景部と判定して画素判定結果の出力を0とし(ステップS17)、画素判定処理を終了する。
【0038】
画素判定部4は、入力画像中の画像検出を行う所定領域内に含まれる全画素について、注目画素を順次換えながら前記画素判定処理を繰り返し行う。検出画像記憶部5は、画素判定部の出力を記憶し、文字部を構成する画素のみが検出された2値画像を生成する(ステップS4)。最後に、文字認識部6は、検出画像記憶部で生成された2値画像から文字認識を行う(ステップS5)。2値画像からの文字認識法としては、例えば、電子情報通信学会論文誌D−II,Vol.J81−D−II,No.10,pp.2280−2287(1998年)「部分文字列の配置規則を考慮したナンバープレート領域抽出」に記載の方法を用いる。
【0039】
なお、以上、画素判定部4による画素判定処理では、上述の図4に示す画素判定処理フローのステップS13において、画素判定の条件として前記式3を使用し、背景部より輝度の高い文字部を検出する方法について説明したが、画素判定の条件として、式3に換えて式4を使用することで、周囲より輝度の低い画素、すなわち背景部と比較して低輝度の文字部を検出することが可能である。
【0040】
参照値−原画素値 > C2 … (式4)
ただし、C2は定数である。
【0041】
次に、本実施の形態1を、入力画像中に大きさ及び線素の太さが異なる文字部が含まれている場合の前記文字認識処理に適用する場合を、図面に従って説明する。図5は、図3に示す参照領域の特定の概要を示す模式図である。図5において、11は文字板の撮像、12及び13は文字部を構成する画素、14は背景部を構成する画素、15〜17は画素12に対応する参照領域として特定される部分領域、18〜20は画素13に対応する参照領域として特定される部分領域、21〜23は画素14に対応する参照領域として特定される部分領域、24は情景画像部である。
【0042】
入力画像には、画像検出処理の対象となる文字板の撮像11と、その外側に画像検出処理の対象とならない情景画像部24が含まれている。文字板の撮像11には、背景部より高い輝度の文字部として、大きさ及び線素の太さが異なる文字部である「6」及び「7」の文字が含まれている。図5において、文字の撮像11内の「6」の文字は、線素が太くかつ大きな文字部であり、同じく「7」の文字は、線素が細くかつ小さな文字部である。
【0043】
まず、画素12が注目画素とされた場合は、画素12の原画素値は最小の部分領域15について算出された参照値と比較される。部分領域15では、背景部の占める割合が大きく、参照値は原画素値より小さくなるため、前記式3を満足して画素12は文字部と判定される。
【0044】
次に、画素13が注目画素とされた場合は、原画素値は最小の部分領域18について算出された参照値と比較される。しかし、部分領域18には輝度の高い文字部の画素のみしか含まれていないので、参照値は注目画素の原画素値とほぼ同じ値となり、式3を満足しない。この場合には、一段階大きな部分領域19について算出される参照値と原画素値との比較判定が行われる。しかし、部分領域19にも輝度の高い文字部の画素のみしか含まれていないので、同様に式3は満足しない。さらに、最大の部分領域20について算出される参照値と原画素値との比較判定が行われる。部分領域20には背景部が含まれているため、参照値は原画素値より小さくなり、前記式3を満足して画素13が文字部と判定される。
【0045】
最後に、画素14が注目画素とされた場合には、部分領域21〜23のいずれにも背景部しか含まれないため、各参照領域について算出される参照値と原画素値との比較においては式3が満足されることはない。したがって、画素14は最終的に背景部と判定される。
【0046】
なお、画素12のように、注目画素が文字板の撮像11の端にある場合に、たとえば部分領域17のごとき大きな参照領域が最初から特定されると、当該参照領域内に文字板の撮像の外部にある情景画像部24も含まれることになる。この場合には、情景画像部の輝度に応じて算出される参照値が変化することとなり、画素判定部は注目画素12の画素判定処理を正確に行うことができない。そこで本実施の形態1に示す文字認識装置では、大きさが異なる複数の参照領域を特定し、参照領域の大きさが小さい順に参照値と原画素値とを比較することにより、文字板の撮像の外部にある情景画像部の影響をできる限り受けないように注目画素の原画素値と参照値との比較を行う。
【0047】
このような構成とすることで、本実施の形態1の文字認識装置は、入力画像中に含まれる文字部の大きさや線素の太さに関係なくこれらを検出することができ、文字部の大きさや線素の太さ等が予め明らかでない場合や、入力画像中に幅や線素の太さの大きく異なる文字部が含まれている場合であっても、これらを正確に画像検出及び文字認識を行うことが可能となる。また、ひとつの入力画像中に、大きさや線素の太さが大きく異なる複数の文字が含まれている場合にも、これらを同時に画像検出および文字認識することが可能である。さらに、検出されるべき文字が文字板の撮像の端にある場合でも、文字板の撮像の外部にある情景画像に影響されることなく正確に文字部の検出を行うことができる。また、注目画素を中心とした部分領域を参照領域として特定し周辺領域にある画素の原画素値を参照値の算出に反映することで、輝度の高低に偏りなく画像検出を行うことができる。
【0048】
なお、本実施の形態1では、参照領域特定部で特定される参照領域の数を三つとしたが、これは二つでも良く四つ以上であっても良い。また、参照値算出部の算出する参照値として、本実施の形態1では「参照領域に含まれる全画素の原画素値の平均値」を使用したが、これは、例えば、電子通信学会論文誌、’80/4、Vol.J63−D、No.4,p.349−356「判別および最小2乗規準に基づく自動しきい値選定法」に記載の方法を用いてもよく、その他「参照領域に含まれる全画素の原画素値のうちの中間値」や「参照領域に含まれる全画素の原画素値のうち出現回数が最も多い画素値」など参照領域内に含まれる画素の原画素値から算出される値を用いてもよい。さらに、2値画像からの文字認識方法は、前記文献記載の方法としたが、これは他の方法でも良い。
【0049】
実施の形態2.
本実施の形態2においては、原画像中に、背景部よりも高輝度の文字部と背景部よりも低輝度の文字部の両方が含まれている場合に、これら両方の文字部について一度の処理で画像検出を行い、その結果から高輝度の文字と低輝度の文字の両方を文字認識するものである。以下では、画像検出の対象となる背景部よりも高輝度の文字部を「高輝度文字部」と呼び、背景部よりも低輝度の文字部を「低輝度文字部」と呼ぶ。
【0050】
図6は、文字認識装置の本実施の形態2の構成図である。なお、本実施の形態2は、先に説明した実施の形態1とは、画素判定部、検出画像記憶部、及び文字認識部が異なるものであり、その他の構成は同様であるから、同一の符号を付して説明を省略する。4aは、画像検出を行う所定領域に含まれる全画素について画素判定を行う画素判定部で、注目画素が、高輝度文字部であるか否かの判定をおこないその判定結果を出力すると共に、低輝度文字部であるか否かの判定を行いその判定結果を出力する。次に5aは、入力画像の画素判定結果を記憶して2値画像を生成する検出画像記憶部で、画素判定部4aから出力される高輝度文字部であるか判定結果から高輝度文字部の2値画像を生成すると共に、低輝度文字部であるか判定結果から低輝度文字部の2値画像を生成する。6aは、生成された2値画像から文字を認識する文字認識部で、検出画像生成部5aで生成される高輝度文字部の2値画像から高輝度の文字を認識し、低輝度文字部の2値画像から低輝度の文字を認識する。
【0051】
以下、前記のように構成される文字認識装置における画像検出処理及び文字認識処理を説明する。なお、本実施の形態2の文字認識装置の全体の処理フローは、前述の図2に示した実施の形態1の処理フローとは画像検出及び文字認識(ステップS4、S5)のみが異なるものであるため、それ以外の処理ステップについては説明を省略する。
【0052】
まず、画素判定部4aは、注目画素が高輝度文字部であるか判定しその判定結果を出力すると共に、注目画素が低輝度文字部であるかを判定しその判定結果を出力する。ここで画素判定部の出力は、注目画素が高輝度文字部である場合には、高輝度文字部であるかの判定結果が1、他低輝度文字部であるかの判定結果が0となる(画素判定部4aの出力は[1,0])。逆に、注目画素が低輝度文字部である場合には、低輝度文字部であるかの判定結果が1、他方高輝度文字部であるかの判定結果が0となる([0,1])。注目画素が背景部である場合には、高輝度文字部であるかの判定結果も低輝度文字部であるかの判定結果も0となる([0,0])。
【0053】
以下、本実施の形態2における画素判定部4aの処理を、図面に従って説明する。図7は、画素判定処理4aの処理フロー図である。まず、参照領域を示す変数nを1で初期化し(ステップS21)、最小の参照領域について算出された参照値と注目画素の原画素値とを比較する(ステップS22)。次に、実施の形態1で示した式3を高輝度文字部判定の条件式として、高輝度文字部の条件が成立したかを判定し(ステップS23)、条件が成立した場合には(ステップS23、Yes)、当該注目画素が高輝度文字部である判定して(ステップS24)、高輝度文字部であるかの判定結果を1とし、当該注目画素に関する画素判定処理を終了する。この場合、画素判定部4aの出力は[1,0]となる。
【0054】
高輝度文字部の条件が成立しなかった場合は(ステップS23、No)、実施の形態1で示した式4を低輝度文字部判定の条件式として、低輝度文字部の条件が成立したかを判定し(ステップS25)、条件が成立と判定される場合には(ステップS25、Yes)、当該注目画素が低輝度文字部である判定して(ステップS26)、低輝度文字部であるかの判定結果を1とし、当該注目画素に関する画素判定処理を終了する。この場合、画素判定部4aの出力は[0,1]となる。
【0055】
低輝度文字部の条件も成立しなかった場合は(ステップS25、No)、nに1加算し(ステップS27)、nが特定された参照領域の数Nより大きな値であるか、すなわち当該注目画素に対応した全参照値との比較が終了したかを否かを判定する(ステップS28)。この結果、nがN以下の場合には(ステップS28、No)、ステップS22へ戻って、前回比較した参照値よりも1段階大きな参照領域について算出された参照値と注目画素の原画素値とを比較し、注目画素に関する画素判定を繰り返す(ステップS23、S25)。一方、ステップS28における判定の結果、nがNより大きな値である場合には(ステップS28、Yes)、当該注目画素を背景部と判定して(ステップS29)、低輝度文字部であるかの判定結果と高輝度文字部であるかの判定結果とを共に0として出力し([0,0])、当該注目画素に関する画素判定処理を終了する。
【0056】
画素判定部4aは、入力画像内の画像検出を行う所定領域内に含まれる全画素について、注目画素を順次換えながら前記画素判定処理を繰り返し行う。この結果、各画素について、高輝度文字部であるかの判定結果と、低輝度文字部であるかの判定結果の二つの判定結果が出力される。次に、検出画像記憶部5aは、これらの出力を記憶し、高輝度文字部であるかの判定結果から高輝度文字の2値画像を生成し、低輝度文字部であるかの判定結果から、低輝度文字部の2値画像を生成する。
【0057】
最後に、文字認識部6aは、検出画像記憶部で生成された二つの2値画像から文字認識を行う。本実施の形態2では、まず高輝度文字部の2値画像について、例えば実施の形態1で示す方法により文字認識を行って、入力画像中に含まれる白文字等の高輝度文字を認識し、その後、低輝度文字部の2値画像について同様に文字認識を行って、黒文字等の輝度文字を認識する。
【0058】
このように、本実施の形態2においては、入力画像中に高輝度文字部あるいは低輝度文字部のいずれか一方、もしくはその両方が含まれている場合であって、それぞれの大きさや線素の太さが予め明らかでない場合でも、正確に画像検出及び文字認識を行うことが可能である。したがって、入力画像中に含まれる文字部が、背景部と比較して低輝度なのか或いは高輝度なのか予測できない場合であっても、確実に文字認識を行うことができる。さらに、一枚の入力画像について、一回の画像検出処理で高輝度文字部と低輝度文字部の両方を検出することができるため、画像入力から文字認識までに要する処理時間を短縮する効果も期待できる。
【0059】
実施の形態3.
本実施の形態3の文字認識装置は、前述の図6に示す実施の形態2の文字認識装置とは参照領域特定部2の構成のみが異なる。参照領域特定部2は、注目画素を含み、注目画素との相対的な位置と大きさの異なる複数の部分領域を参照領域として特定し、これらの複数の参照領域より算出される参照値より注目画素の画素判定を行う。なお、本実施の形態3の全体の処理フローも、前述の図2で示す処理フローと同じである。
【0060】
参照領域特定部2は、図8に示す方法により、入力画像に含まれる複数の部分領域を参照領域として特定する。図8は、本実施の形態3の参照領域特定部で特定される参照領域を示した模式図である。図8において、25〜29は参照領域として特定される部分領域である。まず、参照領域特定部2は、注目画素7を中心とした部分領域25を参照領域A1として特定する。さらに、参照領域特定部2は、注目画素を右端中央とする部分領域26を参照領域B1、注目画素を左端中央とする部分領域27を参照領域C1、注目画素を上端中央とする部分領域28を参照領域D1、注目画素を下端中央とする部分領域29を参照領域E1として、それぞれ特定する。参照領域B1〜E1は、すべて参照領域A1と同じ大きさ及び同じ形状である。これらの同じ大きさの部分領域である参照領域A1〜E1は、ひとつの参照領域群(#1)として特定される。
【0061】
次に、参照領域特定部2は、部分領域の大きさを変えて参照領域群の特定を繰り返し行い、複数の参照領域群(#1〜#N)を指定する。なお、Nは参照領域特定部2により特定される参照領域群の数とする。この複数の参照領域群の特定の方法について、図に従って説明する。図9は、参照領域群の特定の概要を示した模式図である。図9で、まず参照領域特定部2は、最小の参照領域A1〜E1から構成される一番目の参照領域群(#1)を特定する。次に、部分領域の大きさ一段大きくして、注目画素との相対的な位置が異なり大きさと形状が同じである参照領域A2〜E2を二番目の参照領域群(#2)として特定する。本実施の形態3では、特定される参照領域群の数は三つであるものとし、この場合Nは3となる。なお、図9では、参照領域群#1及び#2の特定についてのみ示されており、部分領域の大きさが最大となる三目の参照領域群(#3)の特定については省略されている。
【0062】
次に、参照値算出部3は、特定された複数の参照領域群について参照値の算出を行う。本実施の形態3では、参照値算出部3は、ひとつの参照領域群について、複数の参照領域に関する参照値を算出する。例えば、参照領域群(#1)は、五つの参照領域A1〜E1から構成されているが、これらすべてについて参照値の算出を行う。以下では、参照領域A1から算出した参照値を参照値a1と、参照領域B1から算出した参照値を参照値b1と、参照領域C1から算出した参照値を参照値c1と、参照領域D1から算出した参照値を参照値d1と、参照領域E1から算出した参照値を参照値e1と、表わす。なお、参照領域特定部2は、前述のごとく複数の参照領域群(#1#3)を特定しているので、参照値算出部3は、それぞれの参照領域群について複数の参照値(a1〜e1、a2〜e2、a3〜e3)の算出を繰り返し行う。
【0063】
次に、画素判定部4aは、注目画素の原画素値と当該画素に対応する参照値とを比較して画像検出を行なう。以下、本実施の形態3における画素判定部の処理を、図面に従って説明する。図10は、画素判定処理の処理フロー図である。以下では、nは参照領域群を特定する変数とする。まず、nを初期化し(ステップS31)、最小の参照領域A1から算出された参照値a1と注目画素の原画素値とを比較する(ステップS32)。次に、前記式3を高輝度文字部判定の条件1として、当該注目画素が高輝度文字部であるかを判定する(ステップS33)。この結果、条件1について高輝度文字部と判定される場合には(ステップS33、Yes)、引き続き参照領域群(n=1)の参照値b1〜e1と注目画素の原画素値とを比較する(ステップS34)。ここでは、高輝度文字部判定の条件2として下記の式5を使用する。
【0064】
原画素値−MAX(参照値bn,参照値cn,参照値dn,参照値en)> C3 … (式5)
ただし、MAXは最大値を示す演算子であり、C3は定数である。
【0065】
この結果、ステップS35で条件2について高輝度文字部と判定される場合には(ステップS35、Yes)、当該注目画素を高輝度文字部と判定して(ステップS36)、高輝度文字部であるかの判定結果を1、低輝度文字部であるかの判定結果を0として出力し([1,0])、当該注目画素に関する画素判定処理を終了する。
【0066】
ステップS33において高輝度文字部判定の条件1が成立しなかった場合には(ステップS33、No)、前記式4を低輝度文字部判定の条件1として、当該注目画素が低輝度文字部であるかを判定する(ステップS37)。この結果、条件1について低輝度文字部と判定される場合には(ステップS37、Yes)、高輝度文字部の検出の場合と同様に、参照値b1〜e1と注目画素の原画素値とを比較する(ステップS38)。ここでは、低輝度文字部判定の条件2として下記の式6を使用する。
【0067】
MIN(参照値bn,参照値cn,参照値dn,参照値en)−原画素値> C4 … (式6)
ただし、MINは最小値を示す演算子であり、C4は定数である。
【0068】
この結果、ステップS39で条件2について低輝度文字部と判定される場合には(ステップS39、Yes)、当該注目画素を低輝度文字部と判定して(ステップS40)、低輝度文字部であるかの判定結果を1、高輝度文字部であるかの判定結果を0として出力し([0,1])、当該注目画素に関する画素判定処理を終了する。
【0069】
この画素判定処理において、参照値bn〜enとの比較は、原画素値の輝度の変化の方向性を考慮した検定としての意味を持つ。実際の画素判定処理では、画素判定処理に、注目画素を中心とする参照領域から算出された参照値anだけを用いると、参照領域内であって検出されるべき文字部の周辺にある、濃淡変動の大きなエッジ領域が文字部と判定される場合がある。そこで、注目画素を上下左右端に含む部分領域も参照領域として特定しそれぞれ参照値を算出した上で、これらの参照値の全てより大きい画素(全てより小さい画素)が高輝度文字部(低輝度文字部)であるという高輝度文字部判定(低輝度文字部判定)の条件2によってさらに画素判定を行うことで、文字を構成する線素のように、背景部よりも高輝度(低輝度)な文字部の画素を確実に判定することができる。
【0070】
ステップS33及びS37において低輝度文字部あるいは高輝度文字部のいずれとも判定されなかった場合(ステップS37、No)、またはステップS35において高輝度文字部判定の条件2が成立しなかった場合(ステップS35、No)、またはステップS39において低輝度文字部判定の条件2が成立しなかった場合(ステップS39、No)、には、nに1加算(ステップS41)した後、nが参照領域の数N(=3)より大きな値になったか判定する(ステップS42)。この判定の結果、nがN以下の場合には(ステップS42、No)、次の一段大きな部分領域で構成される参照領域群ついて画素判定処理を繰り返す(ステップS32〜S35、ステップS37〜S39)。ステップS42で、nがNより大きな値になった場合は(ステップS42、Yes)、当該注目画素を背景部と判定して(ステップS43)、低輝度文字部であるかの判定結果と高輝度文字部であるかの判定結果とを共に0として出力し([0,0])、当該注目画素に関する画素判定処理を終了する。
【0071】
画素判定部4aは、入力画像内の画像検出を行う所定領域内に含まれる全画素について、注目画素を順次換えながら前記画素判定処理を繰り返し行う。検出画像記憶部5aは、これらの出力を記憶し、高輝度文字部であるかの判定結果から高輝度文字の2値画像を生成し、低輝度文字部であるかの判定結果から、低輝度文字部の2値画像を生成する。最後に、文字認識部6aは、検出画像記憶部5aで生成された二つの2値画像から文字認識を行う。
【0072】
このように、本実施の形態3に示す文字認識装置では、入力画像中に含まれる文字の大きさや線素の太さが予め明らかでない場合でも、画像検出及び文字認識を行うことが可能である。また文字部の周辺にある濃淡変動の大きなエッジ領域を確実に背景部と判定するため、正確に画像検出を行うことができ、ひいては文字認識の精度をいっそう向上させることが可能な文字認識装置を得ることができる。
【0073】
なお、本実施の形態3では、ひとつの大きさで特定される参照領域群に含まれる参照領域として、注目画素を中心とする部分領域と、注目画素をそれぞれ右端中央、左端中央、上端中央、下端中央に含む部分領域の五つが特定されたが、これは注目画素との相対的な位置が異なる二つ以上の部分領域であればいくつでも良く、注目画素と参照領域との相対的な位置関係も、必ずしも前記のごとく特定されるわけではない。また、参照領域特定部で特定される参照領域群の数を三つとしたが、これは複数であればいくつであっても良い。さらに、本実施の形態3は、実施の形態2の文字認識装置に、注目画素を含み、注目画素との相対的な位置と大きさの異なる複数の参照領域特定する参照領域特定部を備えたことにより、画像検出の精度を向上させるものであるが、実施の形態1の画像認識装置に、前記参照領域特定部を適用することでも同様の効果が期待できる。
【0074】
実施の形態4.
本実施の形態4においては、画素判定部は、注目画素が高輝度文字部であるか、低輝度文字部であるか、又は背景部であるかの3値化された判定結果を出力し、検出画像記憶部はこれを3値画像として記憶し、この3値画像を基に文字認識部は高輝度文字及び低輝度文字の認識を行う。
【0075】
本実施の形態4の文字認識装置は、前述の図1に示した文字認識装置とは、画素判定部、検出画像記憶部、及び文字認識部が異なるものであり、その他の構成は同様であるから、同一の符号を付して説明を省略する。4は注目画素が高輝度文字部、低輝度文字部、又は背景部のいずれであるかを判定し、3値化された判定結果を出力する画素判定部、5は入力画像中の各画素について画素判定部4の出力である3値化された判定結果を記憶して3値画像を生成する検出画像記憶部、6は検出画像記憶部5で生成された3値画像から高輝度文字及び低輝度文字を認識する文字認識部である。また、本実施の形態4における文字認識装置の全体の処理フローは、図2に示す実施の形態1の処理フローと同じであるため、以下では特に画像検出及び文字認識(ステップS4及びS5)について説明する。
【0076】
画素判定部4は、注目画素の原画素値と参照値とを比較して、当該注目画素が高輝度文字部であるか、低輝度文字部であるか、又は背景部であるかを判定しその判定結果を3値化された判定結果として出力する。以下で、本実施の形態4に示す画素判定部における画素判定処理の処理フローを前述の図7を用いて説明する。
【0077】
まず、参照領域を示す変数nを1で初期化し(ステップS21)、最小の参照から算出された参照値と注目画素の原画素値とを前述の式3及び式4に従って比較する(ステップS22)。次に、式3の高輝度文字部の条件が成立したかどうかどうかを判定し(ステップS23)、成立した場合は(ステップS23、Yes)、注目画素を高輝度文字部と判定して(ステップS24)、当該注目画素の画素判定結果を2として画素判定処理を終了する。
【0078】
次に、ステップS23で高輝度文字部の条件が成立しなかった場合は(ステップS23、No)、さらに式4の低輝度文字部の条件が成立したかどうかどうかを判定し(ステップS25)、これが成立した場合は(ステップS25、Yes)、注目画素を低輝度文字部と判定して(ステップS26)、当該注目画素の画素判定結果を1として画素判定処理を終了する。
【0079】
さらに、ステップS25で低輝度文字部の条件も成立しなかった場合は(ステップS25、No)、nに1加算した後(ステップS27)、nがNより大きな値になったか、すなわち全参照値との比較が終了したかどうかを検査する(ステップS28)。nがN以下の場合には(ステップS28、No)、ステップS22へ戻って、前回比較した参照値よりも1段階大きな参照領域から算出された参照値によって、注目画素についての画素判定を繰り返す(ステップS23、S25)。nがNより大きな値になった場合は(ステップS28、Yes)、当該画素を背景部と判定し(ステップS29)、当該注目画素の画素判定結果を0として画素判定処理を終了する。
【0080】
画素判定部4は、入力画像内の画像検出を行う所定領域内に含まれる全画素について、注目画素を順次換えながら前記画素判定処理を繰り返し、3値化された画素判定結果(2/1/0)を出力する。次に、検出画像記憶部4は、画素判定部の出力である3値化された画素判定結果を3値画像として記憶する。この3値画像では、一枚の検出画像に高輝度文字部の検出結果と低輝度文字部の検出結果の両方が含まれる。
【0081】
最後に文字認識部6は、前記3値画像から文字認識を行う。本実施の形態4では、まず、3値画像のうち高輝度文字部、即ち画素判定結果が2である画素のみを文字部と、他を背景部とみなして文字認識を行う。次に、低輝度文字部、即ち画素判定結果が1である画素のみを文字部と、他を背景部とみなして文字認識を行う。
【0082】
このように、本実施の形態4に示す文字認識装置では、入力画像中に含まれる文字の大きさや線素の太さが不明な場合でも、画像検出及び文字認識を行うことが可能である。さらに、高輝度文字部と低輝度文字部の両方の検出結果を一つの3値画像として生成し、これを基に文字認識を行うため、高輝度文字部の検出結果と低輝度文字部の検出結果をそれぞれ独立した二枚の2値画像に保存する場合に比べると、検出画像全体としての情報量を低減することが可能であり、少ない記憶容量であっても、低輝度文字部及び高輝度文字部の画像検出及び文字認識を行うことが可能な文字認識装置を得ることが可能である。
【0083】
実施の形態5.
本実施の形態5の文字認識装置は、図1に示す実施の形態1の文字認識装置と参照領域特定部のみが異なるものであり、その他の構成は同様であるから、同一の符号を付して説明を省略する。2は、大きさ及び形状の異なる複数の部分領域を参照領域として特定する参照領域特定部である。
【0084】
本実施の形態5では、参照領域特定部2は、図11に示す方法により、大きさ及び形状の異なる複数の部分領域を参照領域(#1〜#N、Nは特定される参照領域の数)として特定する。図11は、参照領域特定部2の参照領域特定の方法を示した模式図である。図11において、30〜32は注目画素7に対応する参照領域として特定される部分領域である。図11では、特に参照領域特定部が注目画素を中心として大きさと形状の異なる三つの部分領域を参照領域として特定した場合について示しており、この場合は、特定される参照領域の数Nは3である。最小の部分領域30は、注目画素を中心とする正方形の領域であり、1番目の参照領域(#1)として特定される。次に大きな部分領域31は、注目画素を中心とする横方向に長い長方形の領域であり、2番目の参照領域(#2)として特定される。最大の部分領域34は、注目画素を中心とする横方向に長い長方形の領域であり、3番目の参照領域(#3)として特定される。
【0085】
図12は、本実施の形態5の参照領域の特定の概要を示す模式図である。図12において、33は文字板の撮像である。入力画像には、画像検出処理の対象となる文字板の撮像33と、その外側に画像検出処理の対象とならない情景画像部24が含まれている。さらに、文字板の撮像33には、「74」の文字で示される背景部より高輝度の文字部が含まれている。
【0086】
図12に示すように、検出されるべき文字部の上下端が、文字板の撮像の端に近接しているような場合には、参照領域の形状が全て正方形で同じであるとすると、面積の大きな参照領域では、その内部に文字板の撮像の外部にある情景画像部24も相当の割合で含まれることになる。この場合には、情景画像部の輝度に影響されて算出される参照値が大きく変化することとなり、画素判定部は注目画素7の画素判定処理を正確に行うことができない。そこで、本実施の形態5における参照領域特定部では、参照領域内に含まれる情景画像部の影響をできるだけ低減するために、部分領域30〜32のように、大きな部分領域は横方向に長い長方形の形状の領域として、これらを参照領域として特定する。
【0087】
以降、前記実施の形態1または2の文字認識装置と同様に、参照値算出部3は参照領域特定部2で特定された参照領域のそれぞれについて参照値の算出を行い、画素判定部4は、参照値と注目画素の原画素値とを比較して文字部の検出をおこない、検出画像記憶部5は、画素判定部4の検出結果から2値画像を生成し、最後に、文字認識部6は2値画像から文字認識を行う。
【0088】
このように、本実施の形態5の文字認識装置では、入力画像中に含まれる文字部の大きさや線素の太さが不明な場合でも、画像検出及び文字認識を行うことが可能であるとともに、検出されるべき文字や図形などの記号部分が文字板の撮像の端に近接したような場合でも、文字板の撮像内における文字部の配置を考慮し、文字板の撮像の外部にある情景画像部の影響をできるだけ低減して正確に文字部の検出を行うことができる。
【0089】
なお、本実施の形態5では、参照領域の形状を、大きいものほど横方向に長い長方形となるように特定したが、大きいものほど縦方向に長い長方形となるように特定しても良い。また、例えば、小さいものは正方形で、大きいものは円形あるいは三角形というように部分領域の形状を変えてもよく、逆に小さいものは円形で、大きなものは正方形あるいは長方形というように部分領域の形状を変えても良い。また、本実施の形態5では、注目画素を中心とした複数の参照領域を特定して画素判定を行っているが、前記実施の形態3と同様に、注目画素を中心とした参照領域だけでなく、注目画素を右端中央、左端中央、上端中央、下端中央に含む参照領域も含めて、これらを参照領域群として特定し、これを基に画素判定処理を行うことも、当然に可能である。
【0090】
以上、実施の形態1ないし5に記載の文字認識装置では、検出画像記憶部5、5a及び文字認識部6、6aを備え、画素判定部4、4aの出力である画素判定結果から、2値画像を生成し文字認識を行うものであるが、これら検出画像記憶部及び文字認識部を排して、画像入力部、参照領域特定部、参照値算出部及び画素判定部から構成される画像検出装置を得ることが可能である。
【0091】
このような画像検出装置では、まず画像入力部は、画像検出を行う原画像のうち所定領域のディジタル信号を入力して入力画像を得る。次に、参照領域特定部は、入力画像に含まれる複数の部分領域を参照領域として特定する。次に、参照値算出部は、特定された複数の参照領域のそれぞれについて参照値を算出する。最後に、画素判定部は、入力画像の原画素値と当該画素に対応する複数の参照値とを比較して画像検出を行ない画素判定結果を直接出力する。
【0092】
このような画像検出装置では、入力画像中に含まれる文字や図形などの記号部分について、その大きさや線素の太さが予め明らかでない場合にも、正確に検出対象である文字や図形などの記号部分を検出することが可能である。また、一つの入力画像中に、大きさや線素の太さが異なる複数の文字や図形などの記号部分が混在しているような場合であっても、これらを同時に検出することができる。したがって、例えば交通標識の自動検出装置などに適用することにより、認識すべき対象となる入力画像に、文字の他、記号や簡単な線図などが含まれる場合に、その大きさや線素の太さに関係無く正確に検出することができるといった効果が期待でき有用である。
【0093】
【発明の効果】
以上のように、本発明によれば、注目画素を含む大きさの異なる複数の参照領域を特定し、これらの参照領域各々について参照値を算出して、参照領域の参照値と注目画素の画素値との差分値に基づき、当該注目画素の画素判定を行うような構成としたことにより、入力画像中に含まれる文字や図形などの文字部の大きさや線素の太さに関係無く、文字部の検出を正確に行うことができる。したがって、大きさ及び線素の太さが予め明らかでない場合でも画像検出を行うことが可能となり、ひとつの入力画像中に大きさ及び線素の太さが異なる複数の文字部が含まれている場合であっても、一度の画像検出処理でこれら全てを同時に検出することができる。さらに、注目画素が画像検出の対象となる所定領域の端に近い位置にある場合であっても、情景画像部の影響を低減させて正確に画像検出を行うことができる。
【0094】
また、注目画素を含み注目画素との相対的な位置と大きさの異なる複数の参照領域を特定し、これらの参照領域各々について参照値を算出して、参照領域の参照値と注目画素の画素値との差分値に基づき、当該注目画素の画素判定を行うような構成としたことにより、入力画像中に含まれる文字や図形などの文字部の大きさや線素の太さに関係無く、文字部の検出を正確に行うことができる。したがって、入力画像中に含まれる文字や図形などの文字部の大きさ及び線素の太さが予め明らかでない場合でも画像検出を行うことができ、ひとつの入力画像中に大きさ及び線素の太さが異なる複数の文字部が含まれている場合であっても、一度の画像検出処理でこれら全てを同時に検出することができる。さらに、文字部の周辺にある濃淡変動の大きなエッジ領域を確実に文字部以外と判定するため、画像検出の精度を高めることができる。
【0096】
また、以上のような効果を有する画像検出装置に、さらに文字を認識する文字認識手段を備えることにより、入力画像中に含まれる文字の大きさ及び線素の太さが予め明らかでない場合でも、正確に文字認識を行うことが可能である。また、ひとつの入力画像中に大きさ及び線素の太さが異なる複数の文字が含まれている場合であっても、一度の文字認識処理でこれら全ての文字を同時に認識することができる。
【0097】
また、注目画素が高輝度の文字部であるか否かを判定しその判定結果を出力するとともに、当該注目画素が低輝度の文字部であるか否かを判定しその判定結果を出力するような構成としたことにより、入力画像中に高輝度の文字部あるいは低輝度の文字部のいずれか一方、もしくはその両方が含まれている場合であって、文字部それぞれの大きさや線素の太さが予め明らかでない場合でも、正確に画像検出を行うことが可能である。さらに、ひとつの入力画像について、一回の画像検出処理で高輝度の文字部と低輝度の文字部の両方を検出することができるため、画像検出処理に要する処理時間が長くなるのを回避することができる。
【0098】
また、注目画素が高輝度の文字部であるかまたは低輝度の文字部であるか或いは文字部以外であるかを判定しその判定結果を出力し、この判定結果から高輝度の文字および低輝度の文字の両方を認識するような構成としたことにより、入力画像中に含まれる文字部の大きさや線素の太さが不明な場合でも、画像検出処理及び文字認識処理を行うことが可能である
【図面の簡単な説明】
【図1】 本発明にかかる文字認識装置の実施の形態1の構成図である。
【図2】 本発明の実施の形態1の文字認識装置の処理フロー図である。
【図3】 本発明の実施の形態1の参照領域特定部で特定される参照領域を示した模式図である。
【図4】 本発明の実施の形態1の画素判定処理の処理フロー図である。
【図5】 本発明の実施の形態1の参照領域の特定の概要を示した模式図である。
【図6】 本発明にかかる文字認識装置の実施の形態2の構成図である。
【図7】 本発明の実施の形態2の画素判定処理の処理フロー図である。
【図8】 本発明の実施の形態3の参照領域特定部で特定される参照領域を示した模式図である。
【図9】 本発明の実施の形態3の参照領域群の特定の概要を示した模式図である。
【図10】 本発明の実施の形態3の画素判定処理の処理フロー図である。
【図11】 本発明の実施の形態5の参照領域特定部で特定される参照領域を示した模式図である。
【図12】 本発明の実施の形態5の参照領域の特定の概要を示した模式図である。
【図13】 従来の文字列検出装置を示した構成図である。
【符号の説明】
1 画像入力部
2 参照領域特定部
3 参照値算出部
4、4a 画素判定部
5、5a 検出画像記憶部
6、6a 文字認識部
7 注目画素
8、9、10、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32 参照領域として特定される部分領域
11、33 文字板の撮像
12、13、14 画素
24 情景画像部

Claims (4)

  1. 入力画像を入力する画像入力手段と、
    この画像入力手段で入力された入力画像から画素判定の対象とする注目画素に対して大きさの異なる複数の参照領域を特定する参照領域特定手段と、
    この参照領域特定手段で特定された前記参照領域に含まれる画素の原画素値に基づいて、前記参照領域ごとに参照値を算出する参照値算出手段と、
    この参照値算出手段が算出した前記参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と高輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より大きい原画素値をもつ前記注目画素を高輝度文字部とする文字部判定を行い、高輝度文字部か否かを示す判定結果を出力するとともに、前記差分値と低輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より小さい原画素値をもつ前記注目画素を低輝度文字部とする文字部判定を行い、低輝度文字部か否かを示す判定結果を出力する処理を、前記参照領域の大きさが小さい参照領域から順に、前記注目画素が高輝度文字部または低輝度文字部のいずれかに判定されるまで繰り返し、すべての前記参照領域に対する前記処理が終了しても高輝度文字部または低輝度文字部のいずれにも判定されない前記注目画素を高輝度文字部または低輝度文字部のいずれでもない画素と判定して、前記注目画素が高輝度文字部か否かを示す判定結果および低輝度文字部か否かを示す判定結果を出力する画素判定手段と
    を備えたことを特徴とする画像検出装置。
  2. 入力画像を入力する画像入力手段と、
    この画像入力手段で入力された入力画像から画素判定の対象とする注目画素に対して大きさの異なる複数の参照領域を特定する参照領域特定手段と、
    この参照領域特定手段で特定された前記参照領域に含まれる画素の原画素値に基づいて、前記参照領域ごとに参照値を算出する参照値算出手段と、
    この参照値算出手段が算出した前記参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と高輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より大きい原画素値をもつ前記注目画素を高輝度文字部とする文字部判定と前記差分値と低輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より小さい原画素値をもつ前記注目画素を低輝度文字部とする文字部判定を、前記参照領域の大きさが小さい参照領域から順に、前記注目画素が高輝度文字部または低輝度文字部のいずれかに判定されるまで繰り返し、すべての前記参照領域に対する前記文字部判定が終了しても高輝度文字部または低輝度文字部のいずれにも判定されない前記注目画素を高輝度文字部または低輝度文字部のいずれでもない画素と判定して、前記注目画素が高輝度文字部、低輝度文字部またはこれらのいずれでもない画素のいずれであるかを示す判定結果を出力する画素判定手段と
    を備えたことを特徴とする画像検出装置。
  3. 入力画像を入力する画像入力工程と、
    この画像入力工程で入力された入力画像から画素判定の対象とする注目画素に対して大きさの異なる複数の参照領域を特定する参照領域特定工程と、
    この参照領域特定工程で特定された前記参照領域に含まれる画素の原画素値に基づいて、前記参照領域ごとに参照値を算出する参照値算出工程と、
    この参照値算出工程が算出した前記参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と高輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より大きい原画素値をもつ前記注目画素を高輝度文字部とする文字部判定を行い、高輝度文字部か否かを示す判定結果を出力するとともに、前記差分値と低輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より小さい原画素値をもつ前記注目画素を低輝度文字部とする文字部判定を行い、低輝度文字部か否かを示す判定結果を出力する処理を、前記参照領域の大きさが小さい参照領域から順に、前記注目画素が高輝度文字部または低輝度文字部のいずれかに判定されるまで繰り返し、すべての前記参照領域に対する前記処理が終了しても高輝度文字部または低輝度文字部のいずれにも判定されない前 記注目画素を高輝度文字部または低輝度文字部のいずれでもない画素と判定して、前記注目画素が高輝度文字部か否かを示す判定結果および低輝度文字部か否かを示す判定結果を出力する画素判定工程と
    を有することを特徴とする画像検出方法。
  4. 入力画像を入力する画像入力工程と、
    この画像入力工程で入力された入力画像から画素判定の対象とする注目画素に対して大きさの異なる複数の参照領域を特定する参照領域特定工程と、
    この参照領域特定工程で特定された前記参照領域に含まれる画素の原画素値に基づいて、前記参照領域ごとに参照値を算出する参照値算出工程と、
    この参照値算出工程が算出した前記参照領域の参照値と前記注目画素の原画素値との差分値を求め、この差分値と高輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より大きい原画素値をもつ前記注目画素を高輝度文字部とする文字部判定と前記差分値と低輝度文字部判定用の閾値との比較に基づいて前記参照領域の参照値より小さい原画素値をもつ前記注目画素を低輝度文字部とする文字部判定を、前記参照領域の大きさが小さい参照領域から順に、前記注目画素が高輝度文字部または低輝度文字部のいずれかに判定されるまで繰り返し、すべての前記参照領域に対する前記文字部判定が終了しても高輝度文字部または低輝度文字部のいずれにも判定されない前記注目画素を高輝度文字部または低輝度文字部のいずれでもない画素と判定して、前記注目画素が高輝度文字部、低輝度文字部またはこれらのいずれでもない画素のいずれであるかを示す判定結果を出力する画素判定工程と
    を有することを特徴とする画像検出方法。
JP2000029070A 2000-02-07 2000-02-07 画像検出装置及び画像検出方法 Expired - Fee Related JP3876584B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000029070A JP3876584B2 (ja) 2000-02-07 2000-02-07 画像検出装置及び画像検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000029070A JP3876584B2 (ja) 2000-02-07 2000-02-07 画像検出装置及び画像検出方法

Publications (2)

Publication Number Publication Date
JP2001222681A JP2001222681A (ja) 2001-08-17
JP3876584B2 true JP3876584B2 (ja) 2007-01-31

Family

ID=18554386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000029070A Expired - Fee Related JP3876584B2 (ja) 2000-02-07 2000-02-07 画像検出装置及び画像検出方法

Country Status (1)

Country Link
JP (1) JP3876584B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5073075B2 (ja) * 2011-03-31 2012-11-14 株式会社ナナオ 細線・文字検出方法及び装置

Also Published As

Publication number Publication date
JP2001222681A (ja) 2001-08-17

Similar Documents

Publication Publication Date Title
US8059892B1 (en) Image enhancement method and apparatus
US8417033B2 (en) Gradient based background segmentation and enhancement of images
KR100371470B1 (ko) 기울기-기반 지역 에지 검출을 위한 신규한 지각적 문턱값정하기 방법
JP4264553B2 (ja) 画像処理装置、撮像装置、画像出力装置、これらの装置における方法およびプログラム
EP1918872B1 (en) Image segmentation method and system
JP4153108B2 (ja) 画像処理方法、画像処理装置及び記録媒体
US9619897B2 (en) Correction of blotches in component images
EP1596323B1 (en) Specified object detection apparatus
US20070076951A1 (en) Image recognition device
JP2000149018A (ja) 画像処理方法、画像処理装置及び記録媒体
WO2015070723A1 (zh) 眼部图像处理方法和装置
Várkonyi-Kóczy et al. Gradient-based synthesized multiple exposure time color HDR image
JP2000148980A (ja) 画像処理方法、画像処理装置及び記録媒体
Fernández-Caballero et al. Display text segmentation after learning best-fitted OCR binarization parameters
JP4861922B2 (ja) 車色判定装置
JPH10320566A (ja) 画像処理装置、画像処理方法及びその方法を記憶した記憶媒体
JP3876584B2 (ja) 画像検出装置及び画像検出方法
CN112070771B (zh) 基于hs通道的自适应阈值分割方法、装置和存储介质
CN112470165B (zh) 图像处理装置及图像处理方法
JP2004320447A (ja) 画像処理装置、画像処理方法、およびコンピュータが実行するためのプログラム
JP4935561B2 (ja) 画像処理装置
JP6790611B2 (ja) 生体画像処理装置、生体画像処理方法、および生体画像処理プログラム
JPH1185976A (ja) 画像ノイズ分析方法および記録媒体
JPH10200755A (ja) 画像ノイズ分析方法
JP2001143074A (ja) 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060519

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060825

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061010

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061023

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091110

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101110

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111110

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121110

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121110

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131110

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees