JP4322041B2 - 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体 - Google Patents
画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体 Download PDFInfo
- Publication number
- JP4322041B2 JP4322041B2 JP2003122089A JP2003122089A JP4322041B2 JP 4322041 B2 JP4322041 B2 JP 4322041B2 JP 2003122089 A JP2003122089 A JP 2003122089A JP 2003122089 A JP2003122089 A JP 2003122089A JP 4322041 B2 JP4322041 B2 JP 4322041B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- determination
- pixels
- area
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
【発明の属する技術分野】
この発明は画像処理装置、画像処理プログラム、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体に関し、特に、入力された画像に含まれる文字を認識する画像処理装置、画像処理プログラム、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体に関する。
【0002】
【従来の技術】
従来、紙等の記録媒体に形成された文字や手書き文字などの画像を光学的に読取り、文字データに変換する光学式文字読取装置(OCR:Optical Character Reader)が知られている。このOCRで読取の対象となる画像には、文字だけでなく、写真、図、手書きメモなどが含まれ、紙面に形成される画像の状態は多種多様である。文字に限っても、反転文字、デザイン文字などがあり、文字部分の表現のバリエーションは多く、正確に認識するのが困難になっている。このような文字の中で、反転文字は、注意を促すための表現として多く利用される。この反転文字を検出する技術が、たとえば特許2743378号公報(特許文献1)に記載されている。特許文献1では、入力画像の一部分が指定され、その指定された指定領域について2値画素数の割合から2値の一方を生地としているか、他方を生地としているかを判定する。
【0003】
【特許文献1】
特許2743378号公報
【0004】
【発明が解決しようとする課題】
しかしながら、特許2743378号公報に記載の技術では、反転しているか否かの判定は、ユーザにより指定された指定領域について行なうため、ユーザが領域を指定する必要があり、操作が煩雑であるといった問題がある。
【0005】
また、反転しているか否かの判定を、白と黒の2値画素数の割合から行なうため、次のような問題がある。
【0006】
(1) 指定領域に含まれる反転文字の数によって判定結果が異なる。
図19および図20は、指定領域の一例を示す図である。図19を参照して、指定領域には、複数の文字が含まれ、そのうち「反転」の2文字が反転画像として表わされている。この場合、反転画像として表されている文字に対する生地の画素数が、指定領域全体の画素数に対して少ない。図20を参照して、指定領域には複数の文字が含まれ、そのうち「反転」、「所定領域」、「反転文字」の文字が反転画像として表わされている。この場合は、反転画像として表された文字(反転文字)に対する生地の画素数が、指定領域全体の画素数に対して図19に示した指定領域に比較して大きい。
【0007】
反転しているか否かを判定するためのしきい値が高いと、図20に示した指定領域を反転していると判定することはできるが、図19に示した指定領域を反転していると判定することはできない。これに対応するために、しきい値を図19の指定領域を反転していると判定可能な値にまで小さくすると、反転文字を含まない指定領域をも反転していると誤って判定してしまう場合がある。
【0008】
(2) 文字の書体により判定結果が異なる。
図21および図22は、指定領域の一例を示す図である。図21を参照して、指定領域には太線の書体で「08」の数字が黒で表わされている。指定領域の画素の95%が黒画素である。図22を参照して、指定領域には通常の書体で「0」の文字が反転文字で表わされている。指定領域の画素の90%が黒画素である。図21の指定領域は反転文字を含まないが、図22の指定領域は反転文字を含む。反転しているか否かを判定するためのしきい値を90%とすれば、図21に示した指定領域が反転していないにもかかわらず、反転していると判定されてしまう。これに対応するために、しきい値を95%とすると、図22に示した指定領域が反転しているにもかかわらず、反転していないと判定されてしまう。また、しきい値を85%とすると、図21に示した指定領域が反転していないにもかかわらず反転していると判定されてしまう。
【0009】
この発明は上述した問題点を解決するためになされたもので、この発明の目的の1つは、入力された画像中から反転文字を正確に検出することが可能な画像処理装置、画像処理プログラム、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体を提供することである。
【0010】
【課題を解決するための手段】
上記課題を解決するために、本発明のある局面によれば、画像処理装置は、画像情報のライン方向に、同一の濃度の画素の連続する数を検出するための検出手段と、検出手段で1ラインから検出された前記連続する画素数のうちの最大値が第1しきい値以上であるラインが、前記ラインの直交する方向に連続している場合に、連続している画素の濃度に対応する色を画像情報の生地色と決定して、生地色に基づいて、画像情報が少なくとも前記生地色より高い濃度の文字が描かれた画像であるか、少なくとも生地色より低い濃度の文字が描かれた画像であるかを判定するための反転画像判定手段とを備える。
【0011】
好ましくは、反転画像判定手段は、2色の画素について、検出手段で1ラインから検出された連続する画素数のうちの最大値が第1しきい値以上であるラインが、ラインの直交する方向に連続している場合に、画像情報のうち連続する画素数の最大値が最も大きい画素に対応する色を、画像情報の生地色と決定する。
【0012】
より好ましくは、反転画像判定手段は、上記2色の画素の、画像情報のうち連続する数の最大値が等しい場合、上記2色の画素についての、画像情報内の各ラインの連続する画素数のうちの最大値の総和の差分が第2しきい値以上であるときに、総和の大きい画素に対応する色を画像情報の生地色と決定する。
好ましくは、画像処理装置は、検出手段で1ラインから検出された連続する画素数のうちの最大値の、1ラインを構成する総画素数に対する比率を算出するための算出手段をさらに備え、反転画像判定手段は、比率が第3しきい値以上であるラインが、ラインの直交する方向に連続しているか否かに基づいて前記画像情報の生地色を決定する。
【0013】
この発明の他の局面によれば、画像処理装置は、画像情報に対してその画像情報のサイズをもとに所定サイズの部分領域を定め、該部分領域をもとに判定領域を抽出するための判定領域抽出手段と、判定領域のライン方向に、同一の濃度の画素の連続する数を検出するための検出手段と、検出手段で1ラインから検出された連続する画素数のうちの最大値がしきい値以上であるラインが、ラインの直交する方向に連続している場合に、連続している画素の濃度に対応する色を判定領域の生地色と決定して、生地色に基づいて、判定領域が少なくとも生地色より高い濃度の文字が描かれた画像であるか、少なくとも生地色より低い濃度の文字が描かれた画像であるかを判定するための反転画像判定手段とを備える。
【0014】
好ましくは、判定領域抽出手段は、所定サイズの部分領域をもとに所定形状の領域を含む領域を再設定し、判定領域として出力することを特徴とする。
【0015】
好ましくは、判定領域抽出手段は、所定サイズの部分領域をもとに帯状の領域を抽出し、判定領域として出力することを特徴とする。
【0016】
好ましくは、判定領域抽出手段は、所定サイズの部分領域に対する直交軸の一方の軸についてエッジ値が所定以上の画素数のヒストグラムを求め、部分領域の中央からもう一方の軸の+方向および−方向にヒストグラムの走査を行ない、ヒストグラムの変化が所定条件を満たす領域を判定領域として抽出することを特徴とする。
【0017】
好ましくは、判定領域抽出手段は、所定サイズの部分領域に対する直交軸の一方の軸についてラン長さを求め、部分領域の中央部からもう一方の軸の+方向および−方向にラン長さの走査を行ない、ラン長さの変化が所定条件を満たす領域を判定領域として抽出することを特徴とする。
【0018】
好ましくは、反転画像判定手段は、判定領域の画素数を計測し、白画素数と黒画素数とを比較することで、反転画像か否かを判定することを特徴とする。
【0019】
好ましくは、反転画像判定手段は、判定領域の画素数を計測し、白画素数と黒画素数との比を求め、所定比率と比較することで、反転画像か否かを判定することを特徴とする。
【0020】
好ましくは、反転画像判定手段は、判定領域の画像情報に対するラン長さから反転画像か否かを判定する。
【0021】
この発明の他の局面によれば、画像処理プログラムを記録したコンピュータ読取可能な記録媒体は、画像情報に対してその画像情報のサイズをもとに所定サイズの部分領域を定め、該部分領域をもとに判定領域を抽出する判定領域抽出ステップと、判定領域のライン方向に、同一の濃度の画素の連続する数を検出する検出ステップと、検出ステップで1ラインから検出された連続する画素数のうちの最大値がしきい値以上であるラインが、ラインの直交する方向に連続している場合に、連続している画素の濃度に対応する色を判定領域の生地色と決定して、生地色に基づいて、判定領域が少なくとも生地色より高い濃度の文字が描かれた画像であるか、少なくとも生地色より低い濃度の文字が描かれた画像であるかを判定する反転画像判定ステップとをコンピュータに実行させることにより、判定領域の反転画像判定を行なう。
【0022】
この発明の他の局面によれば、画像処理方法は、画像情報に対してその画像情報のサイズをもとに所定サイズの部分領域を定め、該部分領域をもとに判定領域を抽出する判定領域抽出ステップと、判定領域のライン方向に、同一の濃度の画素の連続する数を検出する検出ステップと、検出ステップで1ラインから検出された連続する画素数のうちの最大値がしきい値以上であるラインが、ラインの直交する方向に連続している場合に、連続している画素の濃度に対応する色を判定領域の生地色と決定して、生地色に基づいて、判定領域が少なくとも生地色より高い濃度の文字が描かれた画像であるか、少なくとも生地色より低い濃度の文字が描かれた画像であるかを判定する反転画像判定ステップとを備え、判定領域の反転画像判定を行なう。
【0023】
この発明のさらに他の局面によれば、画像処理プログラムは、画像情報に対してその画像情報のサイズをもとに所定サイズの部分領域を定め、該部分領域をもとに判定領域を抽出する判定領域抽出ステップと、判定領域のライン方向に、同一の濃度の画素の連続する数を検出する検出ステップと、検出ステップで1ラインから検出された連続する画素数のうちの最大値がしきい値以上であるラインが、ラインの直交する方向に連続している場合に、連続している画素の濃度に対応する色を判定領域の生地色と決定して、生地色に基づいて、判定領域が少なくとも生地色より高い濃度の文字が描かれた画像であるか、少なくとも生地より低い濃度の文字が描かれた画像であるかを判定する反転画像判定ステップとをコンピュータに実行させることにより、判定領域の反転画像判定を行なう。
【0024】
この発明に従えば、画像入力手段から入力された画像に対して、所定サイズの部分領域を定め、部分領域をもとに画像反転を判定するための判定領域を抽出し、反転画像か否かを判定するため、反転処理が必要な領域のみ画像反転が行なえる。また、自動的に判定領域のサイズが設定されるため、画像反転している領域の大きさにかかわらず、反転画像の判定、画像反転処理が行なえる。
【0025】
さらに、画像入力された画像全体に、画像反転を判定するための判定領域の抽出を繰返すことで、さまざまな大きさの反転領域が複数ある場合も、反転領域の画像反転を行なえるため、容易に精度よい文字認識が行なえる。
【0026】
また、反転画像の判定にラン長さを用いるため、文字が判定領域の大半を占めるような場合でも、反転画像の判定処理を正しく行なえるため、さまざまな大きさの文字に対しても精度よい文字認識が行なえる。
【0027】
ここで、ラン長さとは、画像情報を一方向に計測して、同一の濃度の画素が連続する長さのことである。
【0028】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰返さない。なお、以下で説明する実施の形態は本発明を実施するための一例であって、本発明を実現する上で制限されるものではない。
【0029】
図1は、本発明の実施の形態における画像処理装置の全体構成を示す図である。図を参照して、画像処理装置は、画像処理装置の全体を制御するための制御部2と、紙などの記録媒体に形成された画像を読取り、読取った画像を制御部2へ出力するためのスキャナ1と、制御部に接続され情報を一時的に記憶するためのランダムアクセスメモリ(RAM)等からなる一時記憶部3と、制御部2に接続され、制御部2からの指示に基づき所定の情報を表示すための表示部11と、制御部2および一時記憶部3に接続され画像に含まれる文字を認識するための文字認識処理部12と、制御部2に接続され、画像中から判定領域を抽出するための判定領域抽出部7と、判定領域抽出部7および一時記憶部3に接続され、判定領域が反転画像か否かを判定するための反転画像判定部9と、判定領域抽出部7および反転画像判定部9に接続され、反転画像と判定された判定領域を反転処理するための画像反転処理部8と、制御部2に接続され、記録媒体14に記録されたプログラムやデータを読取または書込するための記憶装置13とを含む。
【0030】
スキャナ1は、紙などの原稿に形成された画像を光学的に読取って光電変換し、電子データに変換された画像を制御部2へ出力する。制御部2は、スキャナから受信した画像を一時記憶部3に記憶する。なお、制御部2に対して電子データとしての画像を出力することが可能であれば、スキャナ1に代えて、デジタルカメラ、ビデオカメラなどの撮像装置、記憶装置13から記録媒体14に記録された画像を読取って制御部2へ出力するようにしてもよい。
【0031】
表示部11は、液晶表示装置、プラズマディスプレイパネル、陰極線管(CRT)等の表示装置である。制御部2からの指示に基づき、表示部11には、スキャナ1で読取った画像、後述する反転処理が実行されたの後の画像等が表示される。
【0032】
記憶装置13は、CD−ROM(Compact Disc Read Only Memory)ドライブであり、記録媒体14にデータやプログラムを書込みまたは記録媒体14からそれらを読込むことが可能である。記録媒体14としては、CD−ROMに代えて、FD(Flexible Disc、ハードディスク、磁気テープ、カセットテープ、光ディスク(MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc))、ICカード(メモリカードを含む)、光カード、マスクROM、EPROM、EEPROM、フラッシュROMなどの半導体メモリとすることができる。記憶装置13は、記録媒体14に対応する装置とすればよい。
【0033】
判定領域抽出部7、画像反転処理部8および反転画像判定部9は、制御部2とは別の回路として備えるようにしたが、これらは、制御部2で画像処理プログラムが実行されることにより制御部2で実現するようにしてもよい。このような画像処理プログラムは、一般的に記録媒体14に記録されて流通する。記録媒体14に記録された画像処理プログラムは、記憶装置13で読取られ、制御部2において読取った画像処理プログラムが実行される。制御部2で画像処理プログラムが実行されることにより、判定領域抽出部7、画像反転処理部8および反転画像判定部9が制御部2で実現される。文字認識処理部12についても、同様にして制御部2で実現するようにしてもよい。
【0034】
また、ここでいう画像処理プログラムとは、制御部2で直接実行可能なプログラムだけでなく、ソースプログラム形式のプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む概念である。
【0035】
図2は、文字認識処理部の機能の詳細を示す機能ブロック図である。図2を参照して、文字認識処理部12は、文章領域抽出部4と、行領域抽出部5と、文字領域抽出部6と、文字照合部10とを含む。文章領域抽出部4は、スキャナ1が出力した画像を一時記憶部3から読出し、その画像から文字を含む文章領域を抽出する。文章領域の抽出は、たとえば、画像の濃度分布を測定し、所定の濃度しきい値以下の領域を文章領域として抽出する。濃度しきい値は、文章領域抽出部4に予め保持されている。そして、抽出した文章領域の画像を一時記憶部3に格納した後、その旨を制御部2へ通知する。
【0036】
行領域抽出部5は、文章領域抽出部4で抽出された文章領域の画像を一時記憶部3から読出し、その画像のX軸方向に画素のヒストグラムを求める。そして、ヒストグラムの値がしきい値以上であるX軸方向の画素の配列(ライン)からなる領域を行として抽出する。抽出された領域について、その領域の画像中の位置を示す行情報(行数、各行の位置)を求めて一時記憶部3に格納する。その後、制御部2に行領域の抽出が終了したことを通知する。
【0037】
文字領域抽出部6は、一時記憶部3に格納されている行情報をもとに、行ごとにY軸方向に画素のヒストグラムを求める。そして、ヒストグラムがしきい値以上である部分を仮文字領域として抽出し、仮文字領域間の空白が文字領域抽出部6に予め記憶している文字領域間空白サイズと比較し、文字領域間空白サイズより小さい仮文字領域間の空白は文字内の空白とし、仮文字領域の統合を行なうことで文字領域を抽出し、文字情報(行内の位置)を求めて、一時記憶部3に格納する。そして、文字領域の抽出が終了したことを制御部2に通知する。
【0038】
文字照合部10は、一時記憶部3に格納されている行情報をもとに処理対象とする行領域の画像を一時記憶部3から読出して、その画像から文字を切り出す。そして、文字照合部10に内蔵の文字認識辞書と切り出された文字との照合を行なうことにより、文字認識を行なう。そして、文字認識の結果を、一時記憶部3に格納する。
【0039】
図3は、本実施の形態における画像処理装置で実行される処理の流れを示すフローチャートである。図3を参照して、画像処理装置のユーザが、スキャナ1で文書原稿を読取って、画像を入力すると、スキャナ1は読取った原稿を電子データに変換し、電子データである画像を制御部2に転送する。制御部2は、転送されてきた画像の傾きを、補正して一時記憶部3に格納する。画像の傾き補正は、周知の技術を用いることができる。そのような技術としては、たとえば、特開平5−182022号公報に記載されている。
【0040】
制御部2は、文字認識処理部12の文章領域抽出部4に対して、文章領域の画像の抽出を指示する。文章領域抽出部4は、一時記憶部3に記憶されている画像から文字が表わされた文章領域を抽出し、抽出した文章領域の画像を一時記憶部3に格納する。そして、処理が終了したことを制御部2に通知する(S101)。
【0041】
図4は、スキャナ1で原稿を読取って得られる画像の一例を示す図である。図4を参照して、画像30には、文字が表わされた文章領域31,32,33を含む。文章領域抽出部4は、画像30から文章領域31,32,33を抽出する処理を実行するものである。この文章領域の抽出は、画像30の濃度分布を測定し、その濃度分布を濃度しきい値と比較することにより行われ、濃度分布が文章領域の濃度しきい値以下の領域が文章領域として抽出される。これにより、文章領域31,32,33それぞれの画像が一時記憶部3に格納される。
【0042】
図3に戻って、制御部2は、文章領域抽出部4から処理が終了した旨を受信すると、行領域抽出部5に行領域の抽出を指示する。これにより、行領域抽出部5は、一時記憶部3に格納されている文章領域の画像から行領域を抽出する(S102)。
【0043】
図5は、行領域抽出処理の一例を説明するための図である。行領域抽出部5は、一時記憶部3に格納されている文章領域の画像を読取る。この読取った文章領域の画像には、文字が配列された行61,62が含まれる。行領域抽出部5では、この行61,62の領域を抽出する処理を実行するものである。このため、行領域抽出部5は、一時記憶部3から読出した文章領域の画像について、X軸方向(図面横方向)に画素のヒストグラムを求める。これは、文章領域の画像を予め2値化し、黒画素の数をラインごとに累積した値を求めるものである。求められたヒストグラムの値がしきい値Hth以上のライン(画素の横方向の配列)を行領域として抽出するものである。このようにして求められた行領域について、その画像中の座標から行情報(行数、各行の位置)を求めて一時記憶部3に格納する。図5においては、行61,62のヒストグラムの値が、しきい値Hth以上となっているため、行61,62が抽出されて、文章領域の画像中から抽出された行の数(番号)と、各行の画像中の位置とが一時記憶部3に格納される。
【0044】
図3に戻って、制御部2は、行領域抽出部5から処理が終了した旨を受信すると、文字領域抽出部6に文章領域の各行について、文字領域の抽出を指示する。文字領域抽出部6は、制御部2から指示を受信すると、一時記憶部3に格納されている行情報をもとに、行ごとに文字領域を抽出し、抽出した文字領域の情報を求めて一時記憶部3に格納する。そして、制御部2に文字領域の抽出が終了したことを通知する(S103)。文字領域抽出部6は、処理対象とする画像を一時記憶部3に記憶されている行情報に基づき決定する。したがって、文字領域抽出部6が処理対象とする画像は、行領域抽出部5で抽出された行領域の画像である。また、文字領域抽出部6は、行領域ごとに文字領域を抽出するものである。
【0045】
図6は、文字領域抽出処理の一例を説明するための図である。図6を参照して、ここでは、行領域抽出部5で抽出された行領域の一部分である「が反転し」の文字が表わされた部分を示している。また、「反転」の文字が反転文字として表された例を示している。文字領域抽出部6は、一時記憶部3に格納されている行情報をもとに、ある行領域の画像を読出し、Y軸方向に画素のヒストグラムを求める。図6の下方に、その画素のヒストグラムを示している。これは、文字領域の画像を予め2値化し、黒画素の数をY軸方向にカウントしてヒストグラムを求めるものである。そして、ヒストグラムの値がしきい値PNth以上である部分を仮文字領域として抽出する。仮文字領域間の空白Bi,Bi+1,Bi+2を文字領域抽出部6が予め記憶している文字領域間空白サイズと比較し、仮文字領域間の空白が文字領域間空白サイズより小さい場合には、仮文字領域間の空白を文字内の空白とし、仮文字領域の統合を行なう。これにより、たとえば図6に示す「が」の文字が1文字の領域として抽出されることになる。仮文字領域間の空白が文字領域間空白サイズ以上の場合には、文字間の空白とし、別の文字領域として抽出する。図6に示した例では、仮文字領域間の空白Biが文字領域間空白サイズより小さいとされ、仮文字領域間の空白Bi+1,Bi+2が文字領域間空白サイズより大きいとされる。この結果、文字領域としては、「が」の文字が表わされた領域Cjと、「反転」の文字が表わされた領域Cj+1と、「し」が表わされた領域Cj+2がそれぞれ文字領域とて抽出される。このようにして抽出された文字領域の行内の位置が文字領域情報として求められ、一時記憶部3に格納される。
【0046】
図3に戻って、制御部2は、文字領域抽出部6から処理が終了した旨を受信すると、判定領域抽出部7に判定領域の抽出を指示する。判定領域抽出部7は、一時記憶部3に格納されている文字領域情報をもとに、文字領域ごとに判定領域の抽出を行なう。そして、判定領域の抽出が終了すると反転画像判定部9に判定領域情報を転送し、判定処理を行なうことを指示する(S104)。
【0047】
そして、反転画像判定部9は、判定領域抽出部7より送られてきた判定領域情報をもとに、判定領域の画像が反転画像か否かを判定し、その判定結果を画像反転処理部8に通知する(S105)。画像反転処理部8は、反転画像判定部9の判定結果が反転画像であれば、一時記憶部3に格納されている画像に対して、判定領域に対応する部分の画像を反転する処理を行なう。そして、判定領域抽出部7に画像反転処理が終了したことを通知する(S106)。判定領域抽出部7は、一時記憶部3に記憶されている行情報に対応する全ての行に対する処理が終了するまで処理を繰返す。そして、全ての行に対する処理が完了すると制御部2に処理が終了したことを通知する。
【0048】
その後、制御部2は、文字照合部10に対して、文字認識を行なうことを指示する。文字照合部10は、一時記憶部3に格納されている行情報をもとに文字を切り出し(S107)、文字照合部10に内蔵の文字認識辞書と切り出された文字との照合を行なうことにより文字認識を行なう(S108)。文字照合部10が文字を切出す元になる画像は、反転文字が反転処理された後の画像である。そして、文字照合部10は、認識結果を一時記憶部3に格納する。
【0049】
そして、すべての行に対する文字認識が終了すると、文字照合部10は、制御部2に処理が終了したことを通知する。制御部2は、一時記憶部3に格納されている文字認識結果を表示部11に表示し、入力画像の文字認識を完了する。
【0050】
なお、本実施の形態における画像処理装置では、画像をスキャナ1から入力された画像として説明したが、デジタルカメラ、ビデオカメラなどの撮像機器により撮像されて出力される画像を入力するようにしてもよい。また、記録媒体14に記録されている画像を記憶装置13で読取ることにより入力するようにしてもよい。さらに、画像処理装置とローカルエリアネットワーク等で接続された他の装置から画像を受信するようにしてもよい。この場合に、画像処理装置と他の装置との接続は、有線であっても無線であってもよく、放送電波を用いた通信による接続であってもよい。
【0051】
次に、判定領域抽出部7で実行される判定領域の抽出処理について説明する。判定領域抽出部7は、制御部2から判定領域の抽出の指示を受け、一時記憶部3から文字領域を読込む。図7は、文字領域の一例を示す図である。図7(A)は、文章領域33の一例を示している。文章領域33には、行領域63を含んでいる。行領域63は、複数の文字領域を含んでいる。行領域63は、ここでは、電子メールアドレス「Email ABCD@efg.co」を含む文字が表わされている。文字領域20は、その電子メールアドレスの一部である。文字領域抽出部6では、この文字領域20を抽出する際に、文字領域情報として、行領域63における文字領域20の番号、行領域63の高さLH、幅を記憶する。判定領域抽出部7は、この記憶された文字領域情報を用いて、一時記憶部3に記憶されている画像から文字領域情報で特定される画像を読出す。
【0052】
判定領域抽出部7は、文字領域20の長さ方向の中央部に部分領域21を設定する。この部分領域21は、部分領域の幅を文字領域20の幅RLの30%、高さは文字領域20を含む行領域の平均高さLHとする。そして、次の手順で判定領域の抽出を行なう。
【0053】
(1) 部分領域21の画像に対して各画素のエッジ値を算出する。エッジ値とは、周辺画素との画素値の差であり、画像がグレースケールの場合、ソーベルオペレータ、ラプラシアンなど多くの周知の手法を用いて算出することができる。画像が2値画像、カラー画像の場合でも、これら周知の手法を用いることによってエッジ値を算出することができる。
【0054】
(2) 部分領域のY軸に対してX軸方向にエッジ値がしきい値以上の画素(有効エッジ)数のヒストグラムを求める。図8は、部分領域のエッジ画像とそのヒストグラムの一例を示す図である。図8(A)は、部分領域21のエッジ画像21Aを示し、図8(B)は、有効エッジ数のヒストグラムを示す図である。図8を参照して、エッジ画像は、文字の輪郭と反転文字の生地の輪郭とが表われる画像となる。このため、有効エッジのヒストグラムは、それぞれの輪郭の画素数をX軸方向に合計した値となる。すなわち、生地部分ではヒストグラムは低い値となり、文字の輪郭部分および生地の輪郭部分で高い値となる。
【0055】
(3) 部分領域21の中央から(2)で求めたヒストグラムを走査し、次の条件を満たす領域を判定領域の高さRH、部分領域の幅を判定領域の幅RWとして、判定領域を設定する。
【0056】
(条件1)有効エッジ数Eiがしきい値Eth1より少なくなってから、Ei<Eth1の状態が所定のライン数だけ続く。
【0057】
(条件2)有効エッジ数Eiがしきい値Eth2より少なくなってからEi≧Eth2となる。
【0058】
なお、ここでは、部分領域21を文字領域20から設定するようにしたが、部分領域21を設定することなく、文字領域20全体から判定領域を抽出するようにしてもよい。
【0059】
図9は、本実施の形態における画像処理装置で実行される判定領域抽出処理の流れを示すフローチャートである。ここでは、図7に示した文字領域20が抽出された場合を例に説明する。図9を参照して、まず、一時記憶部3に記憶されている文字領域情報に基づき、その文字領域の画像が取得される(S01)。そして、取得された文字領域20のほぼ中央部に部分領域21が設定される(S02)。この部分領域21は、文字領域20の中央としたが、位置はこれに限られず、文字領域20内であればよく、たとえば端部であってもよい。また上述したように、部分領域を設定する処理は、必ずしも必要でない。部分領域を設定しない場合には、文字領域全体に対して以降の処理が実行される。本実施の形態においては、部分領域を設定した場合について説明するが、部分領域を設定しない場合には、説明において部分領域は文字領域と読替えられる。部分領域を設定する理由は、処理対象とする画素数を少なくすることにより、処理速度を速めるためである。
【0060】
ステップS02で部分領域21が設定されると、設定された部分領域21のエッジ画像21Aが算出される(S03)。さらに、算出されたエッジ画像21Aから、それぞれのラインにおいてX軸方向にエッジ画素をカウントして、ヒストグラムEiが作成される(S04)。このヒストグラムEiは、図8(B)に示したヒストグラムである。
【0061】
次に、作成されたヒストグラムEiをエッジ画像21AのY軸方向のほぼ中央から部分領域端部に向かってY軸方向に走査を行なう(ステップS05乃至ステップS12)。Y軸方向は、+側と−側と2方向になるが、それぞれの方向において、以下に説明する処理が実行されることになる。
【0062】
ステップS05では、走査の開始するラインを決定するため、走査が開始されるラインが部分領域21のY軸方向のほぼ中央となるように、変数iに部分領域21のほぼ中央のラインに対応する値が設定される。
【0063】
そして、次のステップS06においては、ラインをY軸方向の+側に走査する場合には、変数iがインクリメントされ、−側に走査する場合には変数iがデクリメントされる。
【0064】
次のステップS07では、ヒストグラムの値Eiがしきい値Eth1より小さいか否かが判断される。真の場合にはステップS08に進み、偽の場合にはステップS10に進む。ステップS08では、変数jがインクリメントされる。変数jは、ヒストグラムの値Eiがしきい値Eth1より小さいラインの数をカウントするための変数である。これは、上述した条件1を判断するために用いられる。そして次のステップS09では、次のラインがあるか否かが判断され、次のラインがある場合にはステップS06に戻り、そうでない場合にはステップS13に進む。
【0065】
一方、ステップS10では、変数jが定数C1よりも大きいか否かが判断される。真の場合にはステップS11へ進み、そうでない場合にはステップS09に進む。定数C1は、ヒストグラムの値がしきい値Eth1のラインが連続する数を定めるためのしきい値である。このしきい値は、条件1を判定するためのしきい値である。
【0066】
ステップS11では、ヒストグラムの値Eiがしきい値Eth2以上であるか否かが判断され、真の場合にはステップS12へ進み、偽の場合にはステップS09に進む。これは、上述した条件2を判定するための処理である。そして、ステップS12では、ステップS11でヒストグラムの値Eiがしきい値Eth2以上となったラインiを、判定領域を定めるための、ラインに決定する。このようにして決定されたラインiは、判定領域の上下の輪郭を特定するX軸に平行な直線である。ヒストグラムの走査は、Y軸の+側に走査した場合には、ラインiは判定領域の上側の輪郭を特定するラインとなり、Y軸の−方向に走査した場合には、ラインiは判定領域の下側の輪郭を特定するラインとなる。
【0067】
ステップS13では、ステップS12で決定されたY軸の+側の走査により決定されたラインiおよびY軸の−側の走査により決定されたラインiと、ステップS02で決定された部分領域の横方向の輪郭を特定するライン(Y軸に平行なライン)とで定まる判定領域を決定する。ここで、図8を再度参照して、判定領域抽出処理により抽出される判定領域は、上下方向の距離がRHとなり、横方向の距離がRWとなる。
【0068】
このように、判定領域抽出処理では、部分領域のエッジ画素数のラインごとの累計を用いて抽出するため、反転画像の生地の境界が判定領域の境界とされる。このため、後に画像反転処理を実行する際に、反転画像の生地を境界まで確実に反転処理することができる。したがって、反転画像の生地の周辺にある反転されていない画素に対して反転処理が実行されることがないため、反転画像の生地だけを確実に反転処理させることができる。
【0069】
<判定領域抽出処理の変形例>
上述した判定領域抽出処理は、部分領域におけるエッジ画素のヒストグラムを用いて判定領域を抽出するようにした。変形された判定領域抽出処理においては、X軸方向に連続する黒画素の数(黒ラン)を用いて判定領域を抽出するものである。判定領域抽出部7は、以下の手順で判定領域を抽出する。ここでもまた、図7に示した文字領域20を処理対象とする場合について説明する。
【0070】
(1) 文字領域20のY軸に対して、X軸方向の黒ランのヒストグラムを求める。図10は、黒ランを説明するための図である。図10(A)は、部分領域21を示し、図10(B)は、ラインiにおける画素の配列を示す図である。部分領域21におけるX軸方向に平行なラインi上にある画素は、図10(B)に示すように黒画素と白画素がそれぞれ連続する配列となっている。図中左方向から、黒画素の配列BR1,BR2,BR3と、白画素の配列WR1,WR2,WR3が含まれる。各配列は、黒画素または白画素が連続する。本実施の形態における黒ランとは、ラインiにおける黒ランの最大値をいう。図10(B)においては、黒ランBRiはBR3となる。
【0071】
ヒストグラムは、各ラインごとの黒ランの値を示すものである。図11は、黒ランのヒストグラムの一例を示す図である。図11(A)は、部分領域21の画像を示し、図11(B)は、黒ランのヒストグラムを示す。図を見て明らかなように、部分領域21には、反転文字を含むため、その生地の領域で黒ランが最大値、すなわち部分領域21の幅RW分の画素数と等しい値となっている。
【0072】
(2) 部分領域21の中央部から、(1)で求めた黒ランのヒストグラムを走査し、次の条件を満たす領域を部分領域から抽出して判定領域とする。部分領域に基づき後述する画像反転処理を実行する場合には、部分領域が判定領域となるように、部分領域が再設定される。
【0073】
(条件1) 黒ランBRiがしきい値BRthより大きくなってから、BRi≧BRthのラインが所定ライン連続する。ここで、しきい値BRthは、たとえば、部分領域21の幅RWに対する割合とすることができ、好ましくは10%である。
【0074】
(条件2) 黒ランBRiがしきい値BRthより少なくなってからBRi<BRthのラインが所定のラインだけ連続する。
【0075】
この2つの条件を満たすラインが抽出され、それら抽出されたラインは、判定領域の輪郭を特定するラインとなる。図11においては、それらのラインは、Y軸方向の位置がH1,H2のX軸に平行なラインである。このようにして決定されたラインにより特定される判定領域が設定される。
【0076】
図12は、本実施の形態における画像処理装置で実行される変形された判定領域抽出処理の流れを示すフローチャートである。図12を参照して、ステップS21およびステップS22は、図9に示した判定領域抽出処理のステップS01およびステップS02とそれぞれ同じ処理である。したがって、ここでは説明を繰返さない。
【0077】
ステップS23では、ステップS22で抽出された部分領域の画像を2値化する。これにより、白画素と黒画素との2値とからなる部分領域の2値画像が取得される。そして、X軸方向の黒ランのヒストグラムBRiを作成する(S24)。この処理により、図11(B)に示したヒストグラムBRiが作成される。
【0078】
そして、ヒストグラムを部分領域21のY軸方向のほぼ中央からY軸+方向および−方向それぞれにラインを走査する(ステップS25乃至ステップS32)。
【0079】
このため、ステップS25では、走査を開始するための最初のラインiが部分領域21のY軸方向のほぼ中央となるように、中央ラインの値を変数iに設定する(ステップS25)。
【0080】
そして、Y軸の+方向に走査する場合には変数iをインクリメントし、Y軸の−方向に走査する場合には変数iをデクリメントする(ステップS26)。
【0081】
ステップS27では、ラインiの黒ランBRiがしきい値BRth以上であるか否かが判断され、真の場合にはステップS28へ進み、偽の場合にはステップS30へ進む。
【0082】
ステップS28では、変数jがインクリメントされる。変数jは、黒ランBRiがしきい値BRth以上のラインiが所定数連続することを判定するための変数である。これは、上述した条件1を判定するためである。ステップS28で変数jがインクリメントされた後、処理はステップS29に進む。ステップS29では、次に走査するラインが存在するか否かが判定され、ある場合にはステップS26へ進み、ない場合にはステップS33へ進む。
【0083】
一方、ステップS30では、変数jが定数C3より大きいか否かが判断され、真の場合にはステップS31へ進み、偽の場合にはステップS29に進む。定数C3は、上述した条件1を判定するために、黒ランBRiがしきい値BRth以上のラインの連続する数を判定するためのしきい値である。
【0084】
そして、ステップS31では、黒ランBRiがしきい値BRthより小さくなったか否かが判断され、真の場合にはステップS32へ進み、偽の場合にはステップS29に進む。これは、上述した条件2を判定するためのものである。黒ランBRiがしきい値BRthより小さくなった場合には、反転文字の生地の境界のラインを示すものである。このため、そのようなラインiを判定領域の輪郭を定めるラインとして決定する(ステップS32)。その後処理はステップS33へ進む。
【0085】
ステップS33では、ステップS32で決定されたラインiと、部分領域の左右を定めるライン(Y軸の平行なライン)とで定まる判定領域を抽出する(ステップS33)。
【0086】
ステップS32で決定されるラインiは、Y軸の+方向に走査して決定されるラインiと、Y軸の−方向に走査して決定されるラインiとの2つがある。Y軸の+方向に走査して決定されるラインiは、判定領域の上側の境界を定めるラインであり、Y軸の−方向に走査して決定されるラインiは判定領域の下側の輪郭を定めるラインである。また、判定領域の左右の境界は、部分領域の左右の境界とされる。このため、抽出される判定領域は、帯状(矩形)の領域である。
【0087】
このように、変形された判定領域抽出処理においては、各ラインの黒ランの変化に基づいて判定領域を抽出するようにしたので、反転画像の生地の境界を判定領域の境界とすることができる。このため、後に行なわれる画像反転処理において、反転画像の生地だけを確実に反転処理させることができ、反転画像の生地の周辺の画素を反転処理させることがない。
【0088】
なお、本実施の形態においては、黒ランの変化に基づいて判定領域を抽出するようにしたが、白ランの変化に基づいて判定領域を抽出するようにしてもよい。この場合には、条件1は、白ランWRiがしきい値WRthより小さくなってから、WRi≦WRthのラインが所定ライン続くとされる。また、条件2は、白ランWRiがしきい値WRthより大きくなってから、WRi>WRthの状態のラインが連続するとされる。
【0089】
次に、判定領域の画像を用いて、文字領域が反転画像であるか否かを判定する反転画像判定処理について説明する。この反転画像判定処理は、上述した図3のステップS105において、反転画像判定部9で実行される処理である。反転画像判定部9は、次の手順で反転画像の判定を行なう。
【0090】
(1) 判定領域情報をもとに、一時記憶部3から判定領域を読出し、2値化する。
【0091】
(2) 判定領域のY軸方向に対して、次の式によりX軸方向の黒ランBRLiと白ランWRLiを求める。黒ランBRLiは、上述したように、ラインiにおける連続する黒画素の最大値であり、白ランWRLiは、ラインiにおける白画素の連続する数の最大値である。
【0092】
BRLi=Max(BRk) … (1)
WRLi=Max(WRl) … (2)
ただし、i=−RH/2〜RH/2、k=1〜m、l=1〜nである。
【0093】
図10に示した判定領域においては、BRLi=BR3であり、WRLi=WR3である。
【0094】
(3) 判定領域のY軸方向の中央部から+方向および−方向にラインを走査し、黒ランBRLiおよび白ランWRLiを用いて次の条件に従って生地の色と判定する。
【0095】
(3−1) 一方の色のランのみしきい値RLth以上のラン長さが連続する場合は、その色を生地の色とし、次の(3−4)の判断が実行される。これ以外の場合は(3−2)の判断が実行される。しきい値RLthは、たとえば、判定領域22の幅RLの90%とするのが好ましい。
【0096】
(3−2) 黒ランおよび白ランともしきい値RLth以上のラン長さが連続する場合は、最長ランの比較を行ない、長い方のランの色を生地の色とし、(3−4)の判断が実行される。この場合以外は(3−3)の判断が実行される。
【0097】
(3−3) 黒ランおよび白ランともにラン長さの総和TBR,TWRを求め、TBR−TWR≧TRLthのとき黒を生地の色とし、TBR−TWR<TRLthのとき白を生地の色とし、(3−4)の判断が実行される。しきい値TRLthは、たとえば、判定領域22の面積の80%とするのが好ましい。
【0098】
(3−4) 生地の色が黒であれば反転画像、生地の色が白であれば非反転画像と判定する。
【0099】
図13は、本実施の形態における画像処理装置で実行される反転画像判定処理の流れを示すフローチャートである。図13を参照して、まず、反転画像判定部9は、一時記憶部3に記憶されている判定領域情報に基づき、判定領域の画像を一時記憶部3から取得する(S51)。そして、取得した判定領域の画像を2値化する(S52)。
【0100】
さらに、2値化した判定領域の画像の黒画素の連続する配列の最大値である黒ランBRLi、および、白画素の連続する配列の最大値である白ランWRLiを算出し(S53)、ヒストグラムを作成する(S54)。
【0101】
図14は、黒ランおよび白ランそれぞれのヒストグラムの一例を示す図である。図14(A)は、判定領域22を示し「Email」の文字を表わした反転画像が示されている。判定領域22の横方向の長さはRLであり、縦方向の長さRHである。図14(B)は、黒ランのヒストグラムを示し、図14(C)は白ランのヒストグラムを示す。
【0102】
図13に戻って、ステップS55では、ステップS54で作成されたヒストグラムを、Y軸方向のほぼ中央部から+方向および−方向にそれぞれ走査する(S55)。したがって、ステップS56以下のステップは、Y軸の+方向および−方向の走査それぞれに対して実行される。
【0103】
ステップS56では、ラインiの黒ランBRLiがしきい値RLthよりも大きく、かつ、そのようなラインiが連続するか否かが判断される。連続すると判断された場合には、ステップS57に進み、そうでない場合にはステップS58に進む。
【0104】
ステップS57では、ラインiの白ランWRLiがしきい値RLthよりも大きく、かつ、そのようなラインiが連続するか否かが判断される。連続すると判断された場合にはステップS61へ進み、そうでない場合にはステップS60に進む。ステップS61へ進む場合には、上述した処理(3−3)が実行される場合である。
【0105】
ステップS60では、生地色を黒と判定する。この処理は、黒ランBRLiがしきい値RLthよりも大きいラインiが連続し、白ランWRLiはしきい値RLthよりも大きくないラインを連続している場合である。この場合には、上述した処理(3−1)の判断に基づき、黒を生地色として判定する。
【0106】
一方、ステップS56において、ラインiの黒ランBRLiがしきい値RLthよりも大きくないと判断された場合には、ステップS58において、白ランWRLiがしきい値RLthよりも大きく、かつ、そのようなラインiが連続するか否かが判断される。連続すると判断された場合にはステップS59へ進み、そうでない場合にはステップS61へ進む。ステップS59へ進む場合には、しきい値RLthよりも大きい白ランWRLiのみが所定数連続する場合であり、黒ランBRLiはしきい値RLthよりも大きくない場合である。このような場合には、白を生地色として判定する(S59)。この場合は、上述した(3−1)の判断に基づき、白を生地色として判定する。
【0107】
ステップS61に進む場合には、ラインiの黒ランBRLiおよび白ランWRLiそれぞれが、しきい値RLthよりも大きいラインiが連続し、かつ、白ランWRLiがしきい値RLthよりも大きいラインが連続する場合である。そのような場合には、上述した処理(3−2)の判断に従う。したがって、黒ランBRLiの最大値MAX(BRLi)と、白ランWRLiの最大値MAX(WRLi)とを比較する。両者が同じ場合にはステップS64に進み、前者が後者よりも小さい場合にはステップS62へ進み、前者が後者よりも大きい場合にはステップS63へ進む。
【0108】
ステップS62では、黒ランBRLiの最大値MAX(BRLi)が白ランWRLiの最大値MAX(WRLi)よりも小さい場合であり、この場合には、生地色を白と判断し、ステップS68へ進む。
【0109】
ステップS63では、黒ランBRLiの最大値MAX(BRLi)が白ランWRLiの最大値MAX(WRLi)よりも大きい場合であり、このような場合には生地色を黒と判定し、ステップS68へ進む。
【0110】
ステップS64においては、黒ランBRLiの最大値MAX(BRLi)が白ランWRLiの最大値MAX(WRLi)と等しい場合である。この場合には、上述した(3−3)の判断に従う。このため、判定領域における黒画素の総和TBRと、判定領域における白画素の総和TWRとを算出し(S64)、両者の差をしきい値TRLthと比較する(S65)。すなわち、TBR−TWR≧TRLthが真か否かを判定する。真の場合にはステップS66に進み、偽の場合にはステップS67に進む。
【0111】
ステップS66では、生地色を黒としてステップS68に進み、ステップS67では生地色を白としてステップS68に進む。ステップS68では、上記処理により生地色が黒と判定されたか否かが判定される。そして、黒と判定された場合にはステップS69に進み、そうでない場合にはステップS70に進む。ステップS69では、判定領域を反転画像と判定して処理を終了する。一方、ステップS70では、判定領域が非反転画像と判定して処理を終了する。
【0112】
以上説明したように、本実施の形態における画像処理装置においては、判定領域の黒ランおよび白ランに基づき画像が反転しているか否かを判定するようにしている。このため、文字が判定領域の大半を占めているような場合であっても、生地部分のラン長さを用いて判定するため、反転画像が否かを正確に判定することができる。
【0113】
<反転画像判定処理の第1の変形例>
次に、反転画像判定処理の第1の変形例について説明する。上述した反転画像判定処理は、ラン長さを用いて反転画像か否かを判定するようにしたが、第1の変形例における反転画像判定処理は、黒ランBRLiの判定領域のX軸方向の長さRLに対する割合および白ランWRLiの判定領域のX軸方向の長さRLに対する割合とに基づき判定する点で異なる。以下、上述した反転画像判定処理と異なる点についてのみ説明する。
【0114】
図15は、本実施の形態における画像処理装置で実行される反転画像判定処理の第1の変形例の流れを示すフローチャートである。図15を参照して、図13に示した反転画像判定処理と異なるところは、ステップS56A,S57A,S58Aである。その他の処理は、図13に示した処理と同様であるので、ここでは説明を繰返さない。
【0115】
ステップS56Aにおいては、黒ランBRLiと判定領域22のX軸方向の長さRLとの比がしきい値Rthよりも大きく、かつ、そのようなラインiが連続するか否かが判断される。連続すると判断された場合にはステップS57Aに進み、そうでない場合にはステップS58Aに進む。しきい値Rthは、たとえば、90%であるのが好ましい。
【0116】
ステップS57AおよびステップS58Aにおいては、同じ判断が実行される。すなわち、白ランWRLiと判定領域22のX軸方向の長さRLとの比がしきい値Rthよりも大きく、かつ、そのようなラインiが連続するか否かが判断される。ステップS57Aにおいては、真の場合にはステップS61へ進み、偽の場合にはステップS60へ進む。一方、ステップS58Aでは、真の場合にはステップS59に進み、偽の場合にはステップS61へ進む。
【0117】
上述したように、ラン長さを所定のしきい値RLthと比較するのに代えて、黒ランおよび白ランそれぞれの判定領域のX軸方向の長さに対する割合を、所定のしきい値Rthと比較するようにした。このため、判定領域22のX軸方向の長さが変動した場合であっても、しきい値Rthを変更することなく、判定を行なうことができる。したがって、判定領域22のX軸方向の長さRLが変動した場合にも、正確に反転画像を判定することが可能となる。
【0118】
<反転画像判定処理の第2の変形例>
反転画像判定処理の第2の変形例は、判定領域22における黒画素数の総和BPと、白画素数の総和WPとに基づき判定領域の画像が反転画像か否かを判定するものである。図16は、反転画像判定処理の第2の変形例の流れを示すフローチャートである。図16を参照して、ステップS81では、一時記憶部3に記憶されている判定領域情報に基づき、判定領域の画像を取得する。そして、取得した判定領域の画像を2値化する(S82)。
【0119】
2値化された判定領域の画像において、黒画素数の総和BPと白画素数の総和WPとが算出される(S83)。そして、白画素数の総和WPと黒画素数の総和BPとの差が、しきい値Pth1以下か否かが判断される(S84)。真の場合にはステップS85へ進み、偽の場合にはステップS86に進む。
【0120】
ステップS85では、判定領域の画像が反転画像であると設定され、処理を終了する。ステップS86では、判定領域の画像が非反転画像と設定され処理を終了する。
【0121】
図17は、判定領域の黒画素数および白画素数の分布を示す図である。図17(A)は判定領域22を示し、図17(B)は判定領域22における黒画素数のラインごとのヒストグラムを示し、図17(C)は判定領域22の白画素数のラインごとのヒストグラムを示す。図17(B)および図17(C)を比較すると明らかなように、黒画素数の総和が白画素数の総和よりも大きくなっている。このような場合には、判定領域22は反転画像と判定する。
【0122】
第2の変形例における反転画像判定処理では、判定領域中に含まれる黒画素数および白画素数に基づいて反転画像が否かを判断するので、白画素数と黒画素数とをカウントするだけの簡単な構成で反転画像か否かを判定することができる。
【0123】
<反転画像判定処理の第3の変形例>
第2の変形例における反転画像判定処理では、判定領域22における黒画素数および白画素数との差をしきい値と比較することにより反転画像か否かを判定するようにしたが、第3の変形例における反転画像判定処理では、判定領域22に含まれる黒画素数と白画素数との割合に基づいて反転画像か否かを判定するものである。
【0124】
図18は、反転画像判定処理の第3の変形例の流れを示すフローチャートである。図16に示した第2の変形例における反転画像判定処理の流れと異なる点は、ステップS84がステップS84Aに変更された点である。その他のステップは図16に示した第2の変形例における反転画像判定処理と同様であるのでここでは説明を繰返さない。
【0125】
ステップS84Aにおいては、ステップS83で求められた黒画素数の総和BPと白画素数の総和WPとの比率(BP/WP)が、所定のしきい値Pth2と比較される。黒画素数の総和BPの白画素数の総和WPに対する比率(BP/WP)がしきい値Pth2よりも大きい場合にはステップS85へ進み、そうでない場合にはステップS86に進む。
【0126】
このように、黒画素数と白画素数の比率を用いて反転画像か否かを判定するようにしたので、判定領域の大きさにかかわらず、固定したしきい値Pth2を用いることができる。このため、判定領域の大きさを異なった場合でも反転画像か否かを判定することができる。
【0127】
【発明の効果】
以上説明したように、本実施の形態における画像処理装置は、所定の画像情報に対して反転画像判定手段によりラン長さを用いて反転画像判定処理を行なうものである。したがって、本発明の画像処理装置によれば、反転画像判定処理にラン長さを用いるため、文字が判定領域である所定の画像情報の大半を占めていても、正しく反転画像の判定処理を行なうことができる。
【0128】
また、本発明の画像処理装置によれば、反転画像判定処理を行なう対象である所定の画像情報の長さとラン長さとの比により判定するため、所定の画像情報のサイズに影響されることなく、文字が所定の画像情報の大半を占めている場合であっても、正しく反転画像の判定処理を行なうことができる。たとえば、図21に示した画像で画素数による反転画像判定を行なうと、黒画素数が画像の大半を示すため、生地が黒色であると判断されるため、反転画像であると判定されてしまう。しかしながら、本発明においては、ラン長さを用いて判定するため、画像幅のラン長さの白ランが出現するため、生地を白色と判定することができ、その結果、反転画像でないものと判定することができる。
【0129】
さらに、本発明の画像処理装置は、画像情報から部分領域を定め、部分領域をもとに判定領域抽出手段により判定領域を抽出し、その判定領域に対して反転画像判定手段により反転画像判定処理を行なう。したがって、本発明の画像処理装置によれば、判定領域抽出手段で反転画像か否かを判定するための判定領域を抽出して反転画像の判定を行なうため、反転処理が必要な領域に画像判定処理を行なうことができる。その結果、処理対象とする画素数を少なくすることができ、処理速度を高速化することができる。
【0130】
また、本発明の画像処理装置は、判定領域抽出手段が、予め設定されている部分領域をもとに判定領域の再設定を行なうものである。したがって、さまざまなサイズの反転領域に対して、正しく判定領域の抽出が行なえるため、反転画像の判定を正しく行なうことができる。
【0131】
また、本発明の画像処理装置は、判定領域抽出手段が、帯状の領域の抽出を行なうものであり、通常、文章中の文字および文字列の反転部分は帯状であることから、帯状の情報を利用することにより、画像中の文字部分の抽出を効率化することができる。
【0132】
また、本発明の画像処理装置は、判定領域抽出手段が、エッジ値が所定値以上の画素数のヒストグラムを用いて、部分領域の中央部から所定条件の領域を抽出するものである。したがって、予め設定されている部分領域内に画像反転している領域がある場合でも、画像反転している領域のエッジ値のヒストグラムを利用することで、正しく判定領域を抽出することができる。
【0133】
また、本発明の画像処理装置は、判定領域抽出手段が、入力される部分領域に対する直交軸の一方向の軸についてラン長さを求め、部分領域の中央部から所定条件の領域を抽出するものである。したがって、予め設定される部分領域に画像反転している領域がある場合でも、画像反転している領域のラン長さを利用することで、正しく判定領域の抽出を行なうことができる。
【0134】
また、本発明の画像処理装置は、反転画像判定処理への白画素と黒画素の利用に関するものである。したがって、白画素と黒画素をカウントすることにより実現できるので、簡単な構成で反転画像判定処理を実現することができる。
【0135】
また、本発明の画像処理装置は、画像情報から部分領域を定め、部分領域をもとに判定領域抽出手段により判定領域を抽出し、その判定領域に対してラン長さを用いて反転画像判定手段によって反転画像判定処理を行なうものである。したがって、本発明の画像処理装置によれば、判定領域抽出手段で反転画像か否かを判定するための判定領域を抽出し、反転画像判定手段でラン長さを用いて反転画像の判定を行なうため、判定処理が必要な領域のみ反転画像の判定処理が行なえ、しかも、判定領域のサイズに影響されることなく、文字が判定領域の大半を占めていても反転処理が必要な領域のみ画像反転処理を行なうことができる。
【0136】
また、本発明のプログラム記録媒体は、画像情報から部分領域を定め、部分領域をもとに反転画像か否かを判定するための判定領域を抽出し、その判定領域に対して反転画像判定を行なうものである。したがって、本発明のプログラム記録媒体によれば、反転画像か否かを判定するための判定領域を抽出して、反転画像の判定を行なうため、反転処理が必要な領域のみ画像反転できる。
【0137】
なお、本発明は、次の概念で捉えることも可能である。
(1) 画像を入力する手段と、
前記入力された画像から判定領域を抽出する判定領域抽出手段と、
前記判定領域に含まれる画素の画素値を第1画素および第2画素のいずれかに分類する2値化手段と、
前記判定領域に含まれる前記第1画素または第2画素がライン方向に連続する数をカウントし、前記第1画素および第2画素の連続する数に基づき、反転文字が表わされた画像か否かを判定する判定手段とを備えた、画像処理装置。
【0138】
(2) 画像を入力する入力手段と、
前記入力された画像から判定領域を抽出する判定領域抽出手段と、
前記判定領域に含まれる画素の画素値を第1画素および第2画素のいずれかに分類する2値化手段と、
前記判定領域に含まれる前記第1画素または第2画素の数または比率に基づき、反転文字が表わされた画像か否かを判定する判定手段とを備えた、画像処理装置。
【0139】
(3) (1)に記載の画像処理装置において、前記判定手段は、前記第1画素および第2画素の連続する数を第1しきい値と比較する比較手段を含む。
【0140】
(4) (3)に記載の画像処理装置において、前記判定手段は、前記第1画素の連続する数が前記第1しきい値を超えるラインが所定数連続し、前記第2画素の連続する数が前記第1しきい値を超えるラインが所定数連続しない場合に、反転画像と判定する。
【0141】
(5) (4)に記載の画像処理装置において、前記判定手段は、前記第1画素の連続する数が前記第1しきい値を超えるラインが所定数連続し、前記第2画素の連続する数が前記第1しきい値を超えるラインが所定数連続する場合に、前記第1画素の連続する数の最大値と前記第2画素の連続する最大値とを比較する最大値比較手段を含み、
前記最大値比較手段により、前記第1画素の連続する数の最大値が前記第2画素の連続する数の最大値よりも大きいとされた場合に、反転画像と判定する。
【0142】
(6) (5)に記載の画像処理装置において、前記判定手段は、前記最大値比較手段により前記第1画素の連続する数の最大値が前記第2画素の連続する数の最大値と等しいとされた場合に、前記第1画素の総数と前記第2画素の総数とを比較する総数比較手段をさらに含み、
前記総数比較手段は、前記第1画素の総数が前記第2画素の総数よりも大きいとされた場合に、反転画像と判定する。
【0143】
(7) (1)に記載の画像処理装置において、前記判定手段は、前記第1画素の連続する数と前記判定領域のライン方向に配列された画素数との第1の比、および、前記第2画素の連続する数と前記判定領域のライン方向に配列された画素数との第2の比それぞれを、第2しきい値と比較する比較手段を含む。
【0144】
(8) (7)に記載の画像処理装置において、前記判定手段は、前記第1の比が前記第2しきい値を超えるラインが所定数連続し、前記第2の比が前記第2しきい値を超えるラインが所定数連続しない場合に、反転画像と判定する。
【0145】
(9) (8)に記載の画像処理装置において、前記判定手段は、前記第1の比が前記第2しきい値を超えるラインが所定数連続し、前記第2の比が前記第2しきい値を超えるラインが所定数連続する場合に、前記第1画素の連続する数の最大値と前記第2画素の連続する数の最大値とを比較する最大値比較手段を含み、
前記最大値比較手段により、前記第1画素の連続する数の最大値が前記第2画素の連続する数の最大値よりも大きいとされた場合に、反転画像と判定する。
【0146】
(10) (9)に記載の画像処理装置において、前記判定手段は、前記最大値比較手段により前記第1画素の連続する数の最大値が前記第2画素の連続する数の最大値と等しいとされた場合に、前記第1画素の総数と前記第2画素の総数とを比較する総数比較手段をさらに含み、
前記総数比較手段は、前記第1画素の総数が前記第2画素の総数よりも大きいとされた場合に、反転画像と判定する。
【0147】
(11) (1)または(2)に記載の画像処理装置において、前記判定領域抽出手段は、前記入力された画像から文字が表わされた文字領域を抽出する文字領域抽出手段を含み、
前記抽出された文字領域の少なくとも一部を含む矩形の領域を判別領域として抽出する。
【0148】
(12) (11)に記載の画像処理装置において、前記文字領域抽出手段は、前記入力された画像から文字が表わされた文章領域を抽出する文章領域抽出手段と、
前記抽出された文章領域から複数の文字が配列された文字配列領域を抽出する文字配列領域抽出手段とを含み、
前記抽出された文字配列領域から少なくとも1文字を含む文字領域を抽出する。
【0149】
(13) (11)に記載の画像処理装置において、前記判定領域抽出手段は、前記文字領域の長辺方向と平行なラインと直交する方向に、ラインを中央から2つの端部それぞれに向かって走査する走査手段と、
前記文字領域に含まれるエッジ画素の数をラインごとに第3しきい値または第4のしきい値と比較する比較手段と、
エッジ画素数が前記第3しきい値以下のラインが所定数連続した後、前記第4しきい値以上となるラインが検出された場合、前記第4のしきい値以上となるラインで特定される領域を判定領域として決定する判定領域決定手段とを含む。
【0150】
(14) (11)に記載の画像処理装置において、前記判定領域抽出手段は、前記文字領域の長辺方向と平行なラインと直交する方向に、ラインを中央から2つの端部それぞれに向かって走査する走査手段と、
前記文字領域に含まれる前記第1画素が連続する数をラインごとに第5しきい値または第6しきい値と比較手段と、
前記第1画素が連続する数が第5しきい値以上のラインが所定ライン数を連続した後、前記第1画素が連続する数が第6しきい値より少ないラインが検出された場合、前記第1画素が連続する数が第6しきい値より少ないラインで特定される領域を判定領域として決定する判定領域決定手段とを含む。
【0151】
(15) (13)または(14)に記載の画像処理装置において、前記判定領域決定手段は、ライン方向と直交する任意の2つの直線で挟まれる領域を判定領域として決定する。
【0152】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【図面の簡単な説明】
【図1】 本発明の実施の形態における画像処理装置の全体構成を示す図である。
【図2】 文字認識処理部の詳細な機能を示す機能ブロック図である。
【図3】 本実施の形態における画像処理装置で実行される処理の流れを示すフローチャートである。
【図4】 スキャナで画像を読取って得られる画像の一例を示す図である。
【図5】 行領域抽出処理の一例を説明するための図である。
【図6】 文字領域抽出処理の一例を説明するための図である。
【図7】 文字領域の一例を示す図である。
【図8】 部分領域のエッジ画像とそのヒストグラムの一例を示す図である。
【図9】 本実施の形態における画像処理装置で実行される判定領域抽出処理の流れを示すフローチャートである。
【図10】 黒ランを説明するための図である。
【図11】 黒ランのヒストグラムの一例を示す図である。
【図12】 変形された判定領域抽出処理の流れを示すフローチャートである。
【図13】 本実施の形態における画像処理装置で実行される反転画像判定処理の流れを示すフローチャートである。
【図14】 白ランおよび黒ランそれぞれのヒストグラムの一例を示す図である。
【図15】 本実施の形態における画像処理装置で実行される反転画像判定処理の第1の変形例の流れを示すフローチャートである。
【図16】 本実施の形態における画像処理装置で実行される反転画像判定処理の第2の変形例の流れを示すフローチャートである。
【図17】 黒画素および白画素のヒストグラムの一例を示す図である。
【図18】 本実施の形態における画像処理装置で実行される反転画像判定処理の第3の変形例の流れを示すフローチャートである。
【図19】 指定領域の一部が反転している画像の一例を示す図である。
【図20】 指定領域の複数の部分が反転している画像の一例を示す図である。
【図21】 太線の書体の文字の非反転画像を含む指定領域の一例を示す図である。
【図22】 標準の書体の非反転画像を含む指定領域の一例を示す図である。
【符号の説明】
1 スキャナ、2 制御部、3 一時記憶部、4 文章領域抽出部、5 行領域抽出部、6 文字領域抽出部、7 判定領域抽出部、8 画像反転処理部、9反転画像判定部、10 文字照合部、11 表示部、12 文字認識処理部、13 記憶装置、14 記録媒体。
Claims (27)
- 画像情報のライン方向に、同一の濃度の画素の連続する数を検出するための検出手段と、
前記検出手段で1ラインから検出された前記連続する画素数のうちの最大値が第1しきい値以上であるラインが、前記ラインの直交する方向に連続している場合に、連続している画素の濃度に対応する色を前記画像情報の生地色と決定して、前記生地色に基づいて、前記画像情報が少なくとも前記生地色より高い濃度の文字が描かれた画像であるか、少なくとも前記生地色より低い濃度の文字が描かれた画像であるかを判定するための反転画像判定手段とを備える、画像処理装置。 - 前記反転画像判定手段は、2色の画素について、前記検出手段で1ラインから検出された前記連続する画素数のうちの最大値が前記第1しきい値以上であるラインが、前記ラインの直交する方向に連続している場合に、前記画像情報のうち前記連続する画素数の最大値が最も大きい画素に対応する色を、前記画像情報の生地色と決定する、請求項1に記載の画像処理装置。
- 前記反転画像判定手段は、前記2色の画素の、前記画像情報のうち前記連続する数の最大値が等しい場合、前記2色の画素についての、前記画像情報内の各ラインの前記連続する画素数のうちの最大値の総和の差分が第2しきい値以上であるときに、前記総和の大きい画素に対応する色を前記画像情報の生地色と決定する、請求項2に記載の画像処理装置。
- 前記検出手段で1ラインから検出された前記連続する画素数のうちの最大値の、1ラインを構成する総画素数に対する比率を算出するための算出手段をさらに備え、
前記反転画像判定手段は、前記比率が第3しきい値以上であるラインが、前記ラインの直交する方向に連続しているか否かに基づいて前記画像情報の生地色を決定する、請求項1〜3のいずれかに記載の画像処理装置。 - 画像情報に対して前記画像情報のサイズをもとに所定サイズの部分領域を定め、該部分領域をもとに判定領域を抽出するための判定領域抽出手段と、
前記判定領域のライン方向に、同一の濃度の画素の連続する数を検出するための検出手段と、
前記検出手段で1ラインから検出された前記連続する画素数のうちの最大値がしきい値以上であるラインが、前記ラインの直交する方向に連続している場合に、連続している画素の濃度に対応する色を前記判定領域の生地色と決定して、前記生地色に基づいて、前記判定領域が少なくとも前記生地色より高い濃度の文字が描かれた画像であるか、少なくとも前記生地色より低い濃度の文字が描かれた画像であるかを判定するための反転画像判定手段とを備える、画像処理装置。 - 前記判定領域抽出手段は、所定サイズの部分領域をもとに所定形状の領域を含む領域を再設定し、判定領域として出力することを特徴とする、請求項5に記載の画像処理装置。
- 前記判定領域抽出手段は、所定サイズの部分領域をもとに帯状の領域を抽出し、判定領域として出力することを特徴とする、請求項5に記載の画像処理装置。
- 前記判定領域抽出手段は、所定サイズの部分領域に対する直交軸の一方の軸についてエッジ値が所定以上の画素数のヒストグラムを求め、部分領域の中央からもう一方の軸の+方向および−方向にヒストグラムの走査を行ない、ヒストグラムの変化が所定条件を満たす領域を判定領域として抽出することを特徴とする、請求項5に記載の画像処理装置。
- 前記判定領域抽出手段は、所定サイズの部分領域に対する直交軸の一方の軸方向に、同一の濃度の画素の連続する数を求め、部分領域の中央部からもう一方の軸の+方向および−方向に、前記同一の濃度の画素の連続する数の走査を行ない、前記同一の濃度の画素の連続する数の変化が所定条件を満たす領域を判定領域として抽出することを特徴とする、請求項5に記載の画像処理装置。
- 前記検出手段で検出する前記同一の濃度の画素は黒色画素または白色画素であり、
前記反転画像判定手段は、前記生地色を白と決定した場合には少なくとも前記生地色より高い濃度の文字が描かれた画像であると判定し、前記生地色を黒と決定した場合には少なくとも前記生地色より低い濃度の文字が描かれた画像であると判定する、請求項1〜9のいずれかに記載の画像処理装置。 - 画像情報に対して前記画像情報のサイズをもとに所定サイズの部分領域を定め、該部分領域をもとに判定領域を抽出する判定領域抽出ステップと、
前記判定領域のライン方向に、同一の濃度の画素の連続する数を検出する検出ステップと、
前記検出ステップで1ラインから検出された前記連続する画素数のうちの最大値がしきい値以上であるラインが、前記ラインの直交する方向に連続している場合に、連続している画素の濃度に対応する色を前記判定領域の生地色と決定して、前記生地色に基づいて、前記判定領域が少なくとも前記生地色より高い濃度の文字が描かれた画像であるか、少なくとも前記生地色より低い濃度の文字が描かれた画像であるかを判定する反転画像判定ステップとをコンピュータに実行させることにより、判定領域の反転画像判定を行なう画像処理プログラムを記録したコンピュータ読取可能な記録媒体。 - 画像情報に対して前記画像情報のサイズをもとに所定サイズの部分領域を定め、該部分領域をもとに判定領域を抽出する判定領域抽出ステップと、
前記判定領域のライン方向に、同一の濃度の画素の連続する数を検出する検出ステップと、
前記検出ステップで1ラインから検出された前記連続する画素数のうちの最大値がしきい値以上であるラインが、前記ラインの直交する方向に連続している場合に、連続している画素の濃度に対応する色を前記判定領域の生地色と決定して、前記生地色に基づいて、前記判定領域が少なくとも前記生地色より高い濃度の文字が描かれた画像であるか、少なくとも前記生地色より低い濃度の文字が描かれた画像であるかを判定する反転画像判定ステップとを備え、
判定領域の反転画像判定を行なう、画像処理方法。 - 画像情報に対して前記画像情報のサイズをもとに所定サイズの部分領域を定め、該部分領域をもとに判定領域を抽出する判定領域抽出ステップと、
前記判定領域のライン方向に、同一の濃度の画素の連続する数を検出する検出ステップと、
前記検出ステップで1ラインから検出された前記連続する画素数のうちの最大値がしきい値以上であるラインが、前記ラインの直交する方向に連続している場合に、連続している画素の濃度に対応する色を前記判定領域の生地色と決定して、前記生地色に基づいて、前記判定領域が少なくとも前記生地色より高い濃度の文字が描かれた画像であるか、少なくとも前記生地色より低い濃度の文字が描かれた画像であるかを判定する反転画像判定ステップとをコンピュータに実行させることにより、判定領域の反転画像判定を行なう画像処理プログラム。 - 画像を入力する手段と、
前記入力された画像から判定領域を抽出する判定領域抽出手段と、
前記判定領域に含まれる画素の画素値を第1画素および第2画素のいずれかに分類する2値化手段と、
前記判定領域のライン方向に、前記第1画素または前記第2画素の連続する数を検出するための検出手段と、
前記検出手段で1ラインから検出された前記連続する画素数のうちの最大値が第1しきい値以上であるラインが、前記ラインの直交する方向に連続している場合に、連続している前記第1画素または前記第2画素に対応する色を前記判定領域の生地色と決定して、前記生地色に基づいて、前記判定領域が反転文字が表わされた画像か否かを判定する判定手段とを備えた、画像処理装置。 - 画像を入力する入力手段と、
前記入力された画像から判定領域を抽出する判定領域抽出手段と、
前記判定領域に含まれる画素の画素値を第1画素および第2画素のいずれかに分類する2値化手段と、
前記判定領域のライン方向に、前記第1画素または前記第2画素の連続する数を検出するための検出手段と、
前記検出手段で1ラインから検出された前記連続する数のうちの最大値の、当該ラインを構成する総画素数に対する比率を算出するための算出手段と、
前記比率がしきい値以上であるラインが、前記ラインの直交する方向に連続している場合に、連続している前記第1画素または前記第2画素に対応する色を前記判定領域の生地色と決定して、前記生地色に基づいて、前記判定領域が反転文字が表わされた画像か否かを判定する判定手段とを備えた、画像処理装置。 - 前記判定手段は、前記第1画素の連続する数が前記第1しきい値を超えるラインが所定数連続し、前記第2画素の連続する数が前記第1しきい値を超えるラインが所定数連続しない場合に、反転画像と判定する、請求項14に記載の画像処理装置。
- 前記判定手段は、前記第1画素の連続する数が前記第1しきい値を超えるラインが所定数連続し、前記第2画素の連続する数が前記第1しきい値を超えるラインが所定数連続する場合に、前記第1画素の連続する数の最大値と前記第2画素の連続する最大値とを比較する最大値比較手段を含み、
前記最大値比較手段により、前記第1画素の連続する数の最大値が前記第2画素の連続する数の最大値よりも大きいとされた場合に、反転画像と判定する、請求項16に記載の画像処理装置。 - 前記判定手段は、前記最大値比較手段により前記第1画素の連続する数の最大値が前記第2画素の連続する数の最大値と等しいとされた場合に、前記第1画素の総数と前記第2画素の総数とを比較する総数比較手段をさらに含み、
前記総数比較手段は、前記第1画素の総数が前記第2画素の総数よりも大きいとされた場合に、反転画像と判定する、請求項17に記載の画像処理装置。 - 前記判定手段は、前記第1画素の連続する数と前記判定領域の1ラインを構成する総画素数との第1の比、および、前記第2画素の連続する数と前記判定領域の1ラインを構成する総画素数との第2の比それぞれを、第2しきい値と比較する比較手段を含む、請求項14に記載の画像処理装置。
- 前記判定手段は、前記第1の比が前記第2しきい値を超えるラインが所定数連続し、前記第2の比が前記第2しきい値を超えるラインが所定数連続しない場合に、反転画像と判定する、請求項19に記載の画像処理装置。
- 前記判定手段は、前記第1の比が前記第2しきい値を超えるラインが所定数連続し、前記第2の比が前記第2しきい値を超えるラインが所定数連続する場合に、前記第1画素の連続する数の最大値と前記第2画素の連続する数の最大値とを比較する最大値比較手段を含み、
前記最大値比較手段により、前記第1画素の連続する数の最大値が前記第2画素の連続する数の最大値よりも大きいとされた場合に、反転画像と判定する、請求項20に記載の画像処理装置。 - 前記判定手段は、前記最大値比較手段により前記第1画素の連続する数の最大値が前記第2画素の連続する数の最大値と等しいとされた場合に、前記第1画素の総数と前記第2画素の総数とを比較する総数比較手段をさらに含み、
前記総数比較手段は、前記第1画素の総数が前記第2画素の総数よりも大きいとされた場合に、反転画像と判定する、請求項21に記載の画像処理装置。 - 前記判定領域抽出手段は、前記入力された画像から文字が表わされた文字領域を抽出する文字領域抽出手段を含み、
前記抽出された文字領域の少なくとも一部を含む矩形の領域を判別領域として抽出する、請求項14または15に記載の画像処理装置。 - 前記文字領域抽出手段は、前記入力された画像から文字が表わされた文章領域を抽出する文章領域抽出手段と、
前記抽出された文章領域から複数の文字が配列された文字配列領域を抽出する文字配列領域抽出手段とを含み、
前記抽出された文字配列領域から少なくとも1文字を含む文字領域を抽出する、請求項23に記載の画像処理装置。 - 前記判定領域抽出手段は、前記文字領域の長辺方向と平行なラインと直交する方向に、ラインを中央から2つの端部それぞれに向かって走査する走査手段と、
前記文字領域に含まれるエッジ画素の数をラインごとに第3しきい値または第4しきい値と比較する比較手段と、
エッジ画素数が前記第3しきい値以下のラインが所定数連続した後、前記第4しきい値以上となるラインが検出された場合、前記第4しきい値以上となるラインで特定される領域を判定領域として決定する判定領域決定手段とを含む、請求項23に記載の画像処理装置。 - 前記判定領域抽出手段は、前記文字領域の長辺方向と平行なラインと直交する方向に、ラインを中央から2つの端部それぞれに向かって走査する走査手段と、
前記文字領域に含まれる前記第1画素が連続する数をラインごとに第5しきい値または第6しきい値と比較する比較手段と、
前記第1画素が連続する数が第5しきい値以上のラインが所定ライン数を連続した後、前記第1画素が連続する数が第6しきい値より少ないラインが検出された場合、前記第1画素が連続する数が第6しきい値より少ないラインで特定される領域を判定領域として決定する判定領域決定手段とを含む、請求項23に記載の画像処理装置。 - 前記判定領域決定手段は、ライン方向と直交する任意の2つの直線で挟まれる領域を判定領域として決定する、請求項25または26に記載の画像処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003122089A JP4322041B2 (ja) | 2003-04-25 | 2003-04-25 | 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体 |
EP04728271A EP1619605B1 (en) | 2003-04-25 | 2004-04-19 | Image processing device, image processing method, image processing program, and computer-readable recording medium containing the program for dealing with inverted characters |
PCT/JP2004/005582 WO2004097721A1 (ja) | 2003-04-25 | 2004-04-19 | 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003122089A JP4322041B2 (ja) | 2003-04-25 | 2003-04-25 | 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004326568A JP2004326568A (ja) | 2004-11-18 |
JP2004326568A5 JP2004326568A5 (ja) | 2005-12-22 |
JP4322041B2 true JP4322041B2 (ja) | 2009-08-26 |
Family
ID=33410061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003122089A Expired - Fee Related JP4322041B2 (ja) | 2003-04-25 | 2003-04-25 | 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP1619605B1 (ja) |
JP (1) | JP4322041B2 (ja) |
WO (1) | WO2004097721A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4281807B2 (ja) | 2007-02-07 | 2009-06-17 | セイコーエプソン株式会社 | 画像処理装置、複写装置、画像処理方法及びそのプログラム |
JP4924623B2 (ja) * | 2009-01-23 | 2012-04-25 | セイコーエプソン株式会社 | 画像処理装置、複写装置、画像処理方法及びそのプログラム |
JP2010221463A (ja) * | 2009-03-23 | 2010-10-07 | Seiko Epson Corp | シリアルプリンター |
JP2011055284A (ja) * | 2009-09-02 | 2011-03-17 | Seiko Epson Corp | 画像処理装置、画像処理方法、および、プログラム |
JP5487813B2 (ja) * | 2009-09-02 | 2014-05-14 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法、および、プログラム |
CN102096906B (zh) * | 2010-12-13 | 2012-11-28 | 汉王科技股份有限公司 | 用于全景二值图像的反白处理方法和装置 |
CN105528600A (zh) * | 2015-10-30 | 2016-04-27 | 小米科技有限责任公司 | 区域识别方法及装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6073793A (ja) * | 1983-09-29 | 1985-04-25 | Fujitsu Ltd | 光学文字読取装置 |
US5113266A (en) * | 1987-06-12 | 1992-05-12 | Minolta Camera Kabushiki Kaisha | Run length encoder |
JP2743378B2 (ja) * | 1988-04-30 | 1998-04-22 | セイコーエプソン株式会社 | 文字認識方法 |
JP3163698B2 (ja) * | 1991-12-24 | 2001-05-08 | 松下電器産業株式会社 | 文字認識方法 |
US5594814A (en) * | 1992-10-19 | 1997-01-14 | Fast; Bruce B. | OCR image preprocessing method for image enhancement of scanned documents |
JP3275475B2 (ja) * | 1993-08-30 | 2002-04-15 | オムロン株式会社 | 文字配列が既知の対象文字列の認識装置 |
JPH08249421A (ja) * | 1995-03-13 | 1996-09-27 | Fuji Electric Co Ltd | 反転文字の認識方法 |
JPH09114925A (ja) * | 1995-10-18 | 1997-05-02 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
JPH09269970A (ja) * | 1996-04-01 | 1997-10-14 | Canon Inc | 文字認識方法とその装置 |
JP2000163512A (ja) * | 1998-11-27 | 2000-06-16 | Ricoh Co Ltd | 文書画像処理方法、装置および記録媒体 |
JP4213357B2 (ja) * | 2001-03-16 | 2009-01-21 | 株式会社リコー | 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム |
-
2003
- 2003-04-25 JP JP2003122089A patent/JP4322041B2/ja not_active Expired - Fee Related
-
2004
- 2004-04-19 WO PCT/JP2004/005582 patent/WO2004097721A1/ja active Search and Examination
- 2004-04-19 EP EP04728271A patent/EP1619605B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2004097721A1 (ja) | 2004-11-11 |
JP2004326568A (ja) | 2004-11-18 |
EP1619605A1 (en) | 2006-01-25 |
EP1619605B1 (en) | 2011-11-23 |
EP1619605A4 (en) | 2008-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP4525787B2 (ja) | 画像抽出装置、及び画像抽出プログラム | |
US6738154B1 (en) | Locating the position and orientation of multiple objects with a smart platen | |
JP3883696B2 (ja) | 多数の写真をスキャンしかつ検出するとともに人工エッジを除去するための方法 | |
US7738734B2 (en) | Image processing method | |
US7567708B2 (en) | Apparatus and method for image processing | |
JP4522468B2 (ja) | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 | |
JP2005173646A (ja) | コード種類判別方法、およびコード境界検出方法 | |
JP2001109895A (ja) | 複数のディジタル画像の処理方法 | |
JP3411472B2 (ja) | パターン抽出装置 | |
JP4322041B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体 | |
JP2018128825A (ja) | 画像処理装置及び画像処理プログラム | |
JP4049560B2 (ja) | 網点除去方法及びシステム | |
JP5005732B2 (ja) | 画像形成装置及び画像処理方法 | |
JP4132766B2 (ja) | 画像処理装置および方法 | |
JP3268552B2 (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
EP0975146B1 (en) | Locating the position and orientation of multiple objects with a smart platen | |
CN113569859A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
JPH03126181A (ja) | 文書画像の領域分割方法 | |
JP4847378B2 (ja) | 画像処理装置、画像処理方法、プログラム及びコンピュータ読取可能な記録媒体 | |
JP3960756B2 (ja) | 文書画像レイアウト識別方法および装置 | |
JPH11288453A (ja) | 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム | |
JP4738645B2 (ja) | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 | |
JPH03126180A (ja) | 画像処理装置 | |
JP2723075B2 (ja) | 表認識装置及び表枠線の途切れ補間方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051107 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090303 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090526 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090602 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4322041 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120612 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120612 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130612 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |