JP4213357B2 - 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム - Google Patents

画像処理装置、画像処理方法及び該方法を実行させるためのプログラム Download PDF

Info

Publication number
JP4213357B2
JP4213357B2 JP2001075290A JP2001075290A JP4213357B2 JP 4213357 B2 JP4213357 B2 JP 4213357B2 JP 2001075290 A JP2001075290 A JP 2001075290A JP 2001075290 A JP2001075290 A JP 2001075290A JP 4213357 B2 JP4213357 B2 JP 4213357B2
Authority
JP
Japan
Prior art keywords
image
connected component
extracting
brightness
circumscribed rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001075290A
Other languages
English (en)
Other versions
JP2002279345A (ja
Inventor
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001075290A priority Critical patent/JP4213357B2/ja
Publication of JP2002279345A publication Critical patent/JP2002279345A/ja
Application granted granted Critical
Publication of JP4213357B2 publication Critical patent/JP4213357B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は画像処理装置、画像処理方法及び該方法を実行させるためのプログラムに関し、特に明度反転文字の認識に関する。
【0002】
【従来の技術】
文書を書く場合、特に強調したい部分を目立たせることはごく自然なことである。目立たせることによって、重要な部分を漏らさず読者に伝えることができるからである。強調する方法にはさまざまなものが考えられるが、その中に明度反転文字を利用するという方法が考えられる。図10はその一例である。この例では、文書が遠足の告知であることを明度反転文字にすることで読者の注意を喚起している。しかし、このような文字を光学的文字認識装置(以下OCRと略す)で明度反転しない文字と区別せずに文字認識するのは難しい。一般にOCRは二値画像の黒画素あるいは白画素のどちらか一方を、文字を構成する要素と見なして認識するように作られているからである。従って、従来のOCRでは明度反転文字領域を文字認識処理以前に検出し、その部分の画像を黒画素で構成される文字領域に変換して文字認識を行っていた。
【0003】
そこで、従来より明度反転文字領域を検出する方法がいくつか提案されている。その一つとして、特開平9−269970号公報(以下従来例と称す)には、二値の原画像を対象にした方法が提案されている。この従来の方法によれば、黒画素の連結成分を抽出し、連結成分の外接矩形の幅、高さから文字領域と非文字領域に分ける。非文字領域の射影ヒストグラムを求め、その形状から反転文字領域を判定する。あるいは、内部の黒画素数や白画素数、そして白画素の分布状況をもとに反転文字領域を判定している。
【0004】
【発明が解決しようとする課題】
しかしながら、上記従来例では対象が二値画像に限定されている。明度反転文字が二値画像とは限らず、例えば青色の地に水色の文字が書かれている場合もある。また、このような原稿の場合はさまざまな色が使用されている場合があり、一律の閾値で画像全体を二値化する場合には最適な閾値を求めることが困難であり、安定した結果が得られないという問題点がある。
【0005】
本発明はこれらの問題点を解決するためのものであり、処理対象の画像が多値画像又は二値画像にかかわらず明度反転文字領域を抽出することができ、よっていかなる画像に対しても精度良く、かつ高速に文字認識が可能となる画像処理装置、画像処理方法及び該方法を実行させるためのプログラムを提供することを目的とする。
【0006】
【課題を解決するための手段】
前記問題点を解決するために、本発明の画像処理装置は、処理対象の画像を格納する画像格納手段と、画像中の明度反転領域候補を抽出する明度反転領域候補抽出手段と、原画像が多値画像の場合は抽出した明度反転領域候補内を二値化する領域内二値化手段と、二値化された明度反転領域候補内の白画素と黒画素の分布状況をもとに明度反転領域であるかどうかを判定する明度反転領域判定手段とを備えている。そして、本発明の画像処理装置における明度反転領域候補抽出手段は、処理対象の画像の背景を構成する画素と前景を構成する画素を分離する背景画素分離手段と、前景を構成する画素の連結成分を抽出する前景画素連結成分抽出手段と、連結成分の外接矩形を抽出する外接矩形抽出手段と、外接矩形の幅と高さの比が予め定められた値の範囲内にあるか否かに応じて外接矩形の形状を判定し、判定結果に基づいて明度反転領域候補を出力する外接矩形形状判定手段とを備え、更には明度反転領域判定手段が、領域内の白画素の連結成分を抽出する白画素連結成分抽出手段と、抽出した連結成分の大きさに基づいて明度反転領域であるか否かを判定する判定手段とを備えたことに特徴がある。よって、処理対象の画像が多値画像又は二値画像にかかわらず明度反転領域候補を精度良く判定し明度反転文字領域を抽出することができ、よっていかなる画像に対しても精度良く文字認識が可能となる。
【0012】
更に、判定手段が、明度反転領域内の文字サイズを推定する文字サイズ推定手段と、推定した文字サイズに近い大きさの連結成分を計数する推定文字サイズ近似連結成分計数手段と、文字サイズに近い大きさの連結成分数の全連結成分数に対する比を計算する連結成分数比算出手段とを備えたことにより、明度反転領域候補を精度良く判定することができる。
【0013】
また、文字サイズ推定手段が、当該明度反転領域の幅、高さのうち短い方の長さの予め定められた係数倍を文字サイズと判定する手段を備えたことにより、文字サイズを精度良く判定することができる。
【0015】
また、別の発明としての画像処理方法は、処理対象の画像を画像格納手段に格納する画像格納工程と、画像中の明度反転領域候補を画像抽出手段によって抽出する明度反転領域候補抽出工程と、原画像が多値画像の場合は抽出した明度反転領域候補内を二値化手段によって二値化する領域内二値化工程と、二値化された明度反転領域候補内の白画素と黒画素の分布状況をもとに明度反転領域であるかどうかを判定する明度反転領域判定工程とを有している。そして、別の発明の画像処理方法において、明度反転領域候補抽出工程は、処理対象の画像の背景を構成する画素と前景を構成する画素を背景画像分離手段によって分離する背景画素分離工程と、前景を構成する画素の連結成分を前景画像連結成分抽出手段によって抽出する前景画素連結成分抽出工程と、連結成分の外接矩形を外接矩形抽出手段によって抽出する外接矩形抽出工程と、外接矩形の幅と高さの比が予め定められた値の範囲内にある否かに応じて外接矩形形状判定手段によって外接矩形の形状を判定し、判定結果に基づいて明度反転領域候補を出力する外接矩形形状判定工程とを有し、明度反転領域判定工程が、領域内の白画素の連結成分を白画素連結成分抽出手段によって抽出する白画素連結成分抽出工程と、抽出した連結成分の大きさに基づいて明度反転領域である否かを判定する判定工程とを有することに特徴がある。よって、処理対象の画像が多値画像又は二値画像にかかわらず明度反転領域候補を精度良く判定し明度反転文字領域を抽出することができ、よっていかなる画像に対しても精度良く文字認識が可能となる。
【0016】
更に、別の発明としての画像処理プログラムは、コンピュータに、処理対象の画像を画像格納手段に格納する画像格納手順と、画像中の明度反転領域候補を画像抽出手段によって抽出する明度反転領域候補抽出手順と、原画像が多値画像の場合は抽出した明度反転領域候補内を二値化手段によって二値化する領域内二値化手順と、二値化された明度反転領域候補内の白画素と黒画素の分布状況をもとに明度反転領域であるかどうかを判定する明度反転領域判定手順とを実行させるためのプログラムである。そして、本発明の画像処理プログラムにおける明度反転領域候補抽出手順は、処理対象の画像の背景を構成する画素と前景を構成する画素を背景画像分離手段によって分離する背景画素分離手順と、前景を構成する画素の連結成分を前景画像連結成分抽出手段によって抽出する前景画素連結成分抽出手順と、連結成分の外接矩形を外接矩形抽出手段によって抽出する外接矩形抽出手順と、外接矩形の幅と高さの比が予め定められた値の範囲内にある否かに応じて外接矩形形状判定手段によって外接矩形の形状を判定し、判定結果に基づいて明度反転領域候補を出力する外接矩形形状判定手順とを含み、明度反転領域判定手順が、領域内の白画素の連結成分を白画素連結成分抽出手段によって抽出する白画素連結成分抽出手順と、抽出した連結成分の大きさに基づいて明度反転領域である否かを判定する判定手順とを含んでいることに特徴がある。よって、既存のシステムを変えることなく、かつ画像処理システムを構築する装置を汎用的に使用することができる。
【0017】
【発明の実施の形態】
本発明の画像処理装置は、処理対象の画像を格納する画像格納手段と、画像中の明度反転領域候補を抽出する明度反転領域候補抽出手段と、原画像が多値画像の場合は抽出した明度反転領域候補内を二値化する領域内二値化手段と、二値化された明度反転領域候補内の白画素と黒画素の分布状況をもとに明度反転領域であるかどうかを判定する明度反転領域判定手段とを備えている。そして、本発明の画像処理装置における明度反転領域候補抽出手段は、処理対象の画像の背景を構成する画素と前景を構成する画素を分離する背景画素分離手段と、前景を構成する画素の連結成分を抽出する前景画素連結成分抽出手段と、連結成分の外接矩形を抽出する外接矩形抽出手段と、外接矩形の幅と高さの比が予め定められた値の範囲内にあるか否かに応じて外接矩形の形状を判定し、判定結果に基づいて明度反転領域候補を出力する外接矩形形状判定手段とを備え、更には明度反転領域判定手段が、領域内の白画素の連結成分を抽出する白画素連結成分抽出手段と、抽出した連結成分の大きさに基づいて明度反転領域であるか否かを判定する判定手段とを備えた
【0018】
【実施例】
図1は本発明の第1の実施例に係る画像処理装置の構成を示すブロック図である。本実施例においては多値で入力した文書画像から、明度反転文字領域を判別する場合について説明する。同図において、本実施例の画像処理装置は、処理対象の画像を格納する画像格納手段11と、明度反転した文字領域の候補領域を画像から抽出する明度反転領域候補抽出手段12と、明度反転した文字領域候補領域内を、処理対象が多値画像の場合に二値化する領域内二値化手段13と、明度反転した文字領域の候補領域の中から、実際に反転文字が含まれる領域を判定する明度反転領域判定手段14とを含んで構成されている。
【0019】
次に、図1に示す構成を有する本実施例の画像処理装置の動作について図2に示す動作フローに従って説明する。
先ず、処理対象の文書の画像をスキャナ等により光学的に読み取り、読み取った画像データを画像格納手段11に格納する(ステップS101)。明度反転領域候補抽出手段12を用いて明度反転している文字領域の候補領域を抽出する(ステップS102)。原画像が多値画像であるかを判定し、多値画像である場合は、領域内二値化手段13を用いて候補領域内を二値化する(ステップS103S;YES、ステップS104)。一方、二値画像の場合は二値化する必要がない(ステップS103;NO)。ここで、二値化の方法にはさまざまなものが考えられるが、候補領域内の各画素の明度情報を用い、白画素を構成する画素群と黒画素を構成する画素群の群間分散が最大になるように二値化閾値を設定する方法などが考えられる。この手法はいわゆる判別分析法と呼ばれる方法である。このように、各領域内で二値化閾値を設定することで、画像全体で一つの閾値を設定する場合に比べてより各領域に適合した二値化閾値を設定することができる。そして、明度反転領域判定手段14を用い、明度反転領域候補内の二値画像情報を吟味し、その領域が実際に明度反転文字が含まれた領域かどうかを判定する(ステップS105)。全ての候補領域を判定するまでステップS103から繰り返して同じ処理を行う(ステップS106)。判定が終了すれば結果を出力して(ステップS107)、処理を終了する。
【0020】
次に、図2のステップS102における明度反転領域候補の抽出について、図1の明度反転領域候補抽出手段12の構成を示すブロック図である図3と明度反転領域候補抽出の動作を示すフローチャートである図4を用いて説明する。
先ず、図3の背景画素分離手段1201を用い、処理対象画像の背景を構成する画素と、前景を構成する画素を分離する(ステップS201)。分離する手法にはさまざまなものが考えられる。例えば、多値画像であれば画像全体を二値化し、黒画素を前景、白画素背景とする手法が考えられる。また、画像を構成する画素を画素値をもとに色クラスタリングを行い、各クラスのうち、最も所属する画素数が多いクラスを背景色とみなし、このクラス以外に属している画素を前景色とする方法などがある。次に、図3の前景画素連結成分抽出手段202で前景画素の連結成分を抽出し(ステップS202)、図3の外接矩形抽出手段1203でこの連結成分の外接矩形を求める(ステップS203)。そして、図3の外接矩形形状判定手段1204で外接矩形の縦横比を判定する(ステップS204)。縦横比、すなわち高さと幅の比が大きく横長あるいは縦長の場合、図10のような反転文字領域の可能性がある。外接矩形形状判定手段1204を用い、外接矩形の縦横比が予め定められた範囲内にある場合は(ステップS205;YES)、これを明度反転領域候補と判定する(ステップS206)。そうでないものは明度反転領域ではないと判定する(ステップS205;NO、ステップS207)。全ての外接矩形の吟味が終了するまでステップS204からの処理を繰り返し(ステップS208)、終了したら次の処理へ進む。
【0021】
続いて、図2のステップS105における明度反転領域判定について、図1の明度反転領域判定手段15の構成を示すブロック図である図5と明度反転領域判定の動作を示すフローチャートである図6を用いて説明する。
【0022】
先ず、候補領域の二値画像をもとに、図5の白黒画素数比算出手段1401により、候補領域内の白画素と黒画素の比を求める(ステップS301)。白画素の割合が予め定められた値以上の場合は(ステップS1302;YES)、反転文字領域ではないと判定する(ステップS308)。一方、白画素の割合が予め定められた値以上でない場合は(ステップS1302;NO)、図5の白画素連結成分抽出手段1402で、候補領域内の白画素の連結成分を求める(ステップS303)。そして、図5の文字サイズ推定手段1403で、領域内の文字サイズを推定する(ステップS304)。この方法にはさまざまなものが考えられるが、例えば、横長の領域の場合は領域の高さと文字サイズに相関関係があると考え、高さのある係数倍を文字サイズとする方法がある。縦長の領域の場合は、高さの代わりに幅の係数倍を文字サイズとする。次に、推定された文字サイズに近い連結成分を図5の推定文字サイズ近似連結成分計数手段1404を用い、推定文字サイズに近い大きさを持つ連結成分の数を数える(ステップS305)。全連結成分数に占める、文字サイズに近い連結成分の割合を図5の連結成分数比算出手段1405により求め、この値が所定の割合以上である場合は(ステップS306;YES)、文字が含まれていると見なして反転文字領域であると判定する(ステップS307)。そうでない場合は反転文字領域ではないと判定する(ステップS308)。
【0023】
以上説明した第1の実施例によれば、二値画像、多値画像に関わりなく反転文字領域が精度よく抽出できる。
【0024】
図7は本発明の第2の実施例に係る画像処理装置の構成を示すブロック図である。同図において、図1と同じ参照符号は同じ構成要素を示す。図8は実施例2の構成図である。図1の第1の実施例と異なる構成要素として、第2の実施例の画像処理装置は、圧縮画像生成手段21と座標値変換手段22とを含んで構成されている。第2の実施例によれば、処理対象画像が高い解像度を持つ場合原画像をそのまま用いずに、これを圧縮した画像を処理に利用すれば精度を低下させることなく第1の実施例に比べて高速な処理が期待できる。
【0025】
次に、第2の実施例の画像処理装置の動作について、動作フローを示す図8に従って説明する。
先ず、処理対象の文書の画像をスキャナ等により光学的に読み取り、読み取った画像データをもとに、圧縮画像を生成して画像格納手段11に格納する(ステップS401,S402)。圧縮方法は画素を単純に間引くなどの方法が考えられる。明度反転領域候補抽出手段12を用いて明度反転している文字領域の候補領域を抽出する(ステップS403)。原画像が多値画像であるかを判定し、多値画像である場合は、領域内二値化手段13を用いて候補領域内を二値化する(ステップS404S;YES、ステップS405)。一方、二値画像の場合は二値化する必要がない(ステップS404;NO)。そして、明度反転領域判定手段14を用い、明度反転領域候補内の二値画像情報を吟味し、その領域が実際に明度反転文字が含まれた領域かどうかを判定する(ステップS406)。全ての候補領域を判定するまでステップS404から繰り返して同じ処理を行う(ステップS407)。圧縮画像で算出した反転文字領域は、その位置座標が圧縮画像上のものである。従って、出力する座標値は原画像上のものに変換しておく必要がある。すべての候補領域の吟味が終了したのち、ステップS408で座標値の変換処理を行って、結果を出力する(ステップS409)。よって、本実施例によれば、圧縮画像は情報量が少ないので計算量も少なくなり、処理の高速化が期待できる。
【0026】
次に、図9は本発明のシステム構成を示すブロック図である。つまり、同図は上記実施例における画像処理方法によるソフトウェアを実行するマイクロプロセッサ等から構築されるハードウェアを示すものである。同図において、画像処理システムはインターフェース(以下I/Fと略す)91、CPU92、ROM93、RAM94、表示装置95、ハードディスク96、キーボード97及びCD−ROMドライブ98を含んで構成されている。また、汎用の処理装置を用意し、CD−ROM99などの読取可能な記憶媒体には、本発明の画像処理方法を実行するプログラムが記憶されている。更に、I/F91を介して外部装置から制御信号が入力され、キーボード97によって操作者による指令又は自動的に本発明のプログラムが起動される。そして、CPU92は当該プログラムに従って上述の画像処理方法に伴う処理を施し、その処理結果をRAM94やハードディスク96等の記憶装置に格納し、必要により表示装置95などに出力する。以上のように、本発明の画像処理方法を実行するプログラムが記憶された記憶媒体を用いることにより、既存のシステムを変えることなく、かつ画像処理システムを構築する装置を汎用的に使用することができる。
【0027】
なお、本発明は上記実施例に限定されるものではなく、特許請求の範囲内の記載であれば多種の変形や置換可能であることは言うまでもない。
【0028】
【発明の効果】
以上説明したように、本発明の画像処理装置は、処理対象の画像を格納する画像格納手段と、画像中の明度反転領域候補を抽出する明度反転領域候補抽出手段と、原画像が多値画像の場合は抽出した明度反転領域候補内を二値化する領域内二値化手段と、二値化された明度反転領域候補内の白画素と黒画素の分布状況をもとに明度反転領域であるかどうかを判定する明度反転領域判定手段とを備えている。そして、本発明の画像処理装置における明度反転領域候補抽出手段は、処理対象の画像の背景を構成する画素と前景を構成する画素を分離する背景画素分離手段と、前景を構成する画素の連結成分を抽出する前景画素連結成分抽出手段と、連結成分の外接矩形を抽出する外接矩形抽出手段と、外接矩形の幅と高さの比が予め定められた値の範囲内にあるか否かに応じて外接矩形の形状を判定し、判定結果に基づいて明度反転領域候補を出力する外接矩形形状判定手段とを備え、更には明度反転領域判定手段が、領域内の白画素の連結成分を抽出する白画素連結成分抽出手段と、抽出した連結成分の大きさに基づいて明度反転領域であるか否かを判定する判定手段とを備えたことに特徴がある。よって、処理対象の画像が多値画像又は二値画像にかかわらず明度反転領域候補を精度良く判定し明度反転文字領域を抽出することができ、よっていかなる画像に対しても精度良く文字認識が可能となる。
【0035】
また、文字サイズ推定手段が、当該明度反転領域の幅、高さのうち短い方の長さの予め定められた係数倍を文字サイズと判定する手段を備えたことにより、文字サイズを精度良く判定することができる。
【0036】
更に、処理対象の画像を圧縮した圧縮画像を生成する圧縮画像生成手段と、処理対象の画像上の座標値に圧縮画像上の対応する座標値を変換する座標値変換手段を備えたことにより、高速に文字認識が可能となる。
【0037】
また、別の発明としての画像処理方法は、処理対象の画像を画像格納手段に格納する画像格納工程と、画像中の明度反転領域候補を画像抽出手段によって抽出する明度反転領域候補抽出工程と、原画像が多値画像の場合は抽出した明度反転領域候補内を二値化手段によって二値化する領域内二値化工程と、二値化された明度反転領域候補内の白画素と黒画素の分布状況をもとに明度反転領域であるかどうかを判定する明度反転領域判定工程とを有している。そして、別の発明の画像処理方法において、明度反転領域候補抽出工程は、処理対象の画像の背景を構成する画素と前景を構成する画素を背景画像分離手段によって分離する背景画素分離工程と、前景を構成する画素の連結成分を前景画像連結成分抽出手段によって抽出する前景画素連結成分抽出工程と、連結成分の外接矩形を外接矩形抽出手段によって抽出する外接矩形抽出工程と、外接矩形の幅と高さの比が予め定められた値の範囲内にある否かに応じて外接矩形形状判定手段によって外接矩形の形状を判定し、判定結果に基づいて明度反転領域候補を出力する外接矩形形状判定工程とを有し、明度反転領域判定工程が、領域内の白画素の連結成分を白画素連結成分抽出手段によって抽出する白画素連結成分抽出工程と、抽出した連結成分の大きさに基づいて明度反転領域である否かを判定する判定工程とを有することに特徴がある。よって、処理対象の画像が多値画像又は二値画像にかかわらず明度反転領域候補を精度良く判定し明度反転文字領域を抽出することができ、よっていかなる画像に対しても精度良く文字認識が可能となる。
【0038】
更に、別の発明としての画像処理プログラムは、コンピュータに、処理対象の画像を画像格納手段に格納する画像格納手順と、画像中の明度反転領域候補を画像抽出手段によって抽出する明度反転領域候補抽出手順と、原画像が多値画像の場合は抽出した明度反転領域候補内を二値化手段によって二値化する領域内二値化手順と、二値化された明度反転領域候補内の白画素と黒画素の分布状況をもとに明度反転領域であるかどうかを判定する明度反転領域判定手順とを実行させるためのプログラムである。そして、本発明の画像処理プログラムにおける明度反転領域候補抽出手順は、処理対象の画像の背景を構成する画素と前景を構成する画素を背景画像分離手段によって分離する背景画素分離手順と、前景を構成する画素の連結成分を前景画像連結成分抽出手段によって抽出する前景画素連結成分抽出手順と、連結成分の外接矩形を外接矩形抽出手段によって抽出する外接矩形抽出手順と、外接矩形の幅と高さの比が予め定められた値の範囲内にある否かに応じて外接矩形形状判定手段によって外接矩形の形状を判定し、判定結果に基づいて明度反転領域候補を出力する外接矩形形状判定手順とを含み、明度反転領域判定手順が、領域内の白画素の連結成分を白画素連結成分抽出手段によって抽出する白画素連結成分抽出手順と、抽出した連結成分の大きさに基づいて明度反転領域である否かを判定する判定手順とを含んでいることに特徴がある。よって、既存のシステムを変えることなく、かつ画像処理システムを構築する装置を汎用的に使用することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係る画像処理装置の構成を示すブロック図である。
【図2】第1の実施例の画像処理装置の動作を示すフローチャートである。
【図3】図1の明度反転領域候補抽出手段12の構成を示すブロック図である。
【図4】明度反転領域候補抽出の動作を示すフローチャートである。
【図5】図1の明度反転領域判定手段15の構成を示すブロック図である。
【図6】明度反転領域判定の動作を示すフローチャートである。
【図7】本発明の第2の実施例に係る画像処理装置の構成を示すブロック図である。
【図8】第2の実施例の画像処理装置の動作を示すフローチャートである。
【図9】本発明のシステム構成を示すブロック図である。
【図10】明度反転文字の一例を示す図である。
【符号の説明】
11;画像格納手段、12;明度反転領域候補抽出手段、
13;領域内二値化手段、14;明度反転領域判定手段、
21;圧縮画像生成手段、22;座標値変換手段。

Claims (9)

  1. 処理対象の画像を格納する画像格納手段と、画像中の明度反転領域候補を抽出する明度反転領域候補抽出手段と、原画像が多値画像の場合は抽出した前記明度反転領域候補内を二値化する領域内二値化手段と、二値化された前記明度反転領域候補内の白画素と黒画素の分布状況をもとに明度反転領域であるかどうかを判定する明度反転領域判定手段とを備えた画像処理装置において
    前記明度反転領域候補抽出手段は、処理対象の画像の背景を構成する画素と前景を構成する画素を分離する背景画素分離手段と、前景を構成する画素の連結成分を抽出する前景画素連結成分抽出手段と、前記連結成分の外接矩形を抽出する外接矩形抽出手段と、前記外接矩形の幅と高さの比が予め定められた値の範囲内にあるか否かに応じて前記外接矩形の形状を判定し、判定結果に基づいて明度反転領域候補を出力する外接矩形形状判定手段とを備え、
    前記明度反転領域判定手段が、領域内の白画素の連結成分を抽出する白画素連結成分抽出手段と、抽出した前記連結成分の大きさに基づいて明度反転領域であるか否かを判定する判定手段とを備えたことを特徴とする画像処理装置。
  2. 前記判定手段が、明度反転領域内の文字サイズを推定する文字サイズ推定手段と、推定した文字サイズに近い大きさの連結成分を計数する推定文字サイズ近似連結成分計数手段と、前記文字サイズに近い大きさの連結成分数の全連結成分数に対する比を計算する連結成分数比算出手段とを備えた請求項1記載の画像処理装置。
  3. 前記文字サイズ推定手段が、前記明度反転領域の幅、高さのうち短い方の長さの予め定められた係数倍を文字サイズと判定する手段を備えた請求項2記載の画像処理装置。
  4. 処理対象の画像を画像格納手段に格納する画像格納工程と、画像中の明度反転領域候補を画像抽出手段によって抽出する明度反転領域候補抽出工程と、原画像が多値画像の場合は抽出した前記明度反転領域候補内を二値化手段によって二値化する領域内二値化工程と、二値化された前記明度反転領域候補内の白画素と黒画素の分布状況をもとに明度反転領域であるかどうかを判定する明度反転領域判定工程とを有する画像処理方法において、
    前記明度反転領域候補抽出工程は、処理対象の画像の背景を構成する画素と前景を構成する画素を背景画像分離手段によって分離する背景画素分離工程と、前景を構成する画素の連結成分を前景画像連結成分抽出手段によって抽出する前景画素連結成分抽出工程と、前記連結成分の外接矩形を外接矩形抽出手段によって抽出する外接矩形抽出工程と、前記外接矩形の幅と高さの比が予め定められた値の範囲内にある否かに応じて外接矩形形状判定手段によって前記外接矩形の形状を判定し、判定結果に基づいて明度反転領域候補を出力する外接矩形形状判定工程とを有し、
    前記明度反転領域判定工程が、領域内の白画素の連結成分を白画素連結成分抽出手段によって抽出する白画素連結成分抽出工程と、抽出した連結成分の大きさに基づいて明度反転領域である否かを判定する判定工程とを有することを特徴とする画像処理方法
  5. 前記判定工程が、明度反転領域内の文字サイズを文字サイズ推定手段によって推定する文字サイズ推定工程と、推定した文字サイズに近い大きさの連結成分を推定文字サイズ近似連結成分計数手段によって計数する工程と、前記文字サイズに近い大きさの連結成分数の全連結成分数に対する比を連結成分数比算出手段によって計算する工程とを有する請求項記載の画像処理方法
  6. 前記文字サイズ推定工程が、前記明度反転領域の幅、高さのうち短い方の長さの予め定められた係数倍を文字サイズと判定する工程を有する請求項記載の画像処理方法
  7. コンピュータに、処理対象の画像を画像格納手段に格納する画像格納手順と、画像中の明度反転領域候補を画像抽出手段によって抽出する明度反転領域候補抽出手順と、原画像が多値画像の場合は抽出した前記明度反転領域候補内を二値化手段によって二値化する領域内二値化手順と、二値化された前記明度反転領域候補内の白画素と黒 画素の分布状況をもとに明度反転領域であるかどうかを判定する明度反転領域判定手順とを実行させるためのプログラムにおいて、
    前記明度反転領域候補抽出手順は、処理対象の画像の背景を構成する画素と前景を構成する画素を背景画像分離手段によって分離する背景画素分離手順と、前景を構成する画素の連結成分を前景画像連結成分抽出手段によって抽出する前景画素連結成分抽出手順と、前記連結成分の外接矩形を外接矩形抽出手段によって抽出する外接矩形抽出手順と、前記外接矩形の幅と高さの比が予め定められた値の範囲内にある否かに応じて外接矩形形状判定手段によって前記外接矩形の形状を判定し、判定結果に基づいて明度反転領域候補を出力する外接矩形形状判定手順とを含み、
    前記明度反転領域判定手順が、領域内の白画素の連結成分を白画素連結成分抽出手段によって抽出する白画素連結成分抽出手順と、抽出した連結成分の大きさに基づいて明度反転領域である否かを判定する判定手順とを含んでいることを特徴とする画像処理プログラム
  8. 前記判定手順が、明度反転領域内の文字サイズを文字サイズ推定手段によって推定する文字サイズ推定手順と、推定した文字サイズに近い大きさの連結成分を推定文字サイズ近似連結成分計数手段によって計数する手順と、前記文字サイズに近い大きさの連結成分数の全連結成分数に対する比を連結成分数比算出手段によって計算する手順とを含んでいる請求項7記載の画像処理プログラム
  9. 前記文字サイズ推定手順が、前記明度反転領域の幅、高さのうち短い方の長さの予め定められた係数倍を文字サイズと判定する手順を含む請求項8記載の画像処理プログラム
JP2001075290A 2001-03-16 2001-03-16 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム Expired - Fee Related JP4213357B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001075290A JP4213357B2 (ja) 2001-03-16 2001-03-16 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001075290A JP4213357B2 (ja) 2001-03-16 2001-03-16 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム

Publications (2)

Publication Number Publication Date
JP2002279345A JP2002279345A (ja) 2002-09-27
JP4213357B2 true JP4213357B2 (ja) 2009-01-21

Family

ID=18932394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001075290A Expired - Fee Related JP4213357B2 (ja) 2001-03-16 2001-03-16 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム

Country Status (1)

Country Link
JP (1) JP4213357B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4322041B2 (ja) * 2003-04-25 2009-08-26 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体
JP5455038B2 (ja) 2009-12-28 2014-03-26 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP5730274B2 (ja) 2012-11-27 2015-06-03 京セラドキュメントソリューションズ株式会社 画像処理装置
WO2020089985A1 (ja) * 2018-10-29 2020-05-07 株式会社Pfu 画像処理装置、制御方法及び制御プログラム

Also Published As

Publication number Publication date
JP2002279345A (ja) 2002-09-27

Similar Documents

Publication Publication Date Title
US10455117B2 (en) Image processing apparatus, method, and storage medium
US6263113B1 (en) Method for detecting a face in a digital image
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7170647B2 (en) Document processing apparatus and method
JP4522468B2 (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
JP2008148298A (ja) 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
WO2009114967A1 (zh) 基于移动扫描的图像处理方法及装置
JP4558232B2 (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003152995A (ja) 画像処理装置
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
US8300927B2 (en) Mouth removal method for red-eye detection and correction
JP4213357B2 (ja) 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP2000013596A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
KR100449486B1 (ko) 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
WO2002017220A1 (fr) Procede d'extraction de zones de caracteres dans une image
JPH09204525A (ja) 画像像域分離装置及びその方法
KR20100048436A (ko) 마커를 이용한 문자열 추출 시스템 및 그 방법
JP4228905B2 (ja) 画像処理装置及びプログラム
US11778122B2 (en) Apparatus, method, and storage medium for removing shading dots

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081028

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081030

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131107

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees