JP2002279345A - 画像処理装置、画像処理方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体 - Google Patents

画像処理装置、画像処理方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体

Info

Publication number
JP2002279345A
JP2002279345A JP2001075290A JP2001075290A JP2002279345A JP 2002279345 A JP2002279345 A JP 2002279345A JP 2001075290 A JP2001075290 A JP 2001075290A JP 2001075290 A JP2001075290 A JP 2001075290A JP 2002279345 A JP2002279345 A JP 2002279345A
Authority
JP
Japan
Prior art keywords
image
image processing
brightness
brightness inversion
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001075290A
Other languages
English (en)
Other versions
JP4213357B2 (ja
Inventor
Fumihiro Hasegawa
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001075290A priority Critical patent/JP4213357B2/ja
Publication of JP2002279345A publication Critical patent/JP2002279345A/ja
Application granted granted Critical
Publication of JP4213357B2 publication Critical patent/JP4213357B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 本発明は処理対象の画像が多値画像又は二値
画像にかかわらず明度反転文字領域を抽出することがで
き、よっていかなる画像に対しても精度良く、かつ高速
に文字認識が可能となる。 【解決手段】 本発明の画像処理装置は、処理対象の画
像を格納する画像格納手段と、画像中の明度反転領域候
補を抽出する明度反転領域候補抽出手段と、原画像が多
値画像の場合は抽出した明度反転領域候補内を二値化す
る領域内二値化手段と、二値化された明度反転領域候補
内の白画素と黒画素の分布状況をもとに明度反転領域で
あるかどうかを判定する明度反転領域判定手段とを備え
た。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像処理装置、画像
処理方法及び該方法を実行するためのプログラムを格納
したコンピュータ読み取り可能な記憶媒体に関し、特に
明度反転文字の認識に関する。
【0002】
【従来の技術】文書を書く場合、特に強調したい部分を
目立たせることはごく自然なことである。目立たせるこ
とによって、重要な部分を漏らさず読者に伝えることが
できるからである。強調する方法にはさまざまなものが
考えられるが、その中に明度反転文字を利用するという
方法が考えられる。図10はその一例である。この例で
は、文書が遠足の告知であることを明度反転文字にする
ことで読者の注意を喚起している。しかし、このような
文字を光学的文字認識装置(以下OCRと略す)で明度
反転しない文字と区別せずに文字認識するのは難しい。
一般にOCRは二値画像の黒画素あるいは白画素のどち
らか一方を、文字を構成する要素と見なして認識するよ
うに作られているからである。従って、従来のOCRで
は明度反転文字領域を文字認識処理以前に検出し、その
部分の画像を黒画素で構成される文字領域に変換して文
字認識を行っていた。
【0003】そこで、従来より明度反転文字領域を検出
する方法がいくつか提案されている。その一つとして、
特開平9−269970号公報(以下従来例と称す)に
は、二値の原画像を対象にした方法が提案されている。
この従来の方法によれば、黒画素の連結成分を抽出し、
連結成分の外接矩形の幅、高さから文字領域と非文字領
域に分ける。非文字領域の射影ヒストグラムを求め、そ
の形状から反転文字領域を判定する。あるいは、内部の
黒画素数や白画素数、そして白画素の分布状況をもとに
反転文字領域を判定している。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来例では対象が二値画像に限定されている。明度反転文
字が二値画像とは限らず、例えば青色の地に水色の文字
が書かれている場合もある。また、このような原稿の場
合はさまざまな色が使用されている場合があり、一律の
閾値で画像全体を二値化する場合には最適な閾値を求め
ることが困難であり、安定した結果が得られないという
問題点がある。
【0005】本発明はこれらの問題点を解決するための
ものであり、処理対象の画像が多値画像又は二値画像に
かかわらず明度反転文字領域を抽出することができ、よ
っていかなる画像に対しても精度良く、かつ高速に文字
認識が可能となる画像処理装置、画像処理方法及び該方
法を実行するためのプログラムを格納したコンピュータ
読み取り可能な記憶媒体を提供することを目的とする。
【0006】
【課題を解決するための手段】前記問題点を解決するた
めに、本発明の画像処理装置は、処理対象の画像を格納
する画像格納手段と、画像中の明度反転領域候補を抽出
する明度反転領域候補抽出手段と、原画像が多値画像の
場合は抽出した明度反転領域候補内を二値化する領域内
二値化手段と、二値化された明度反転領域候補内の白画
素と黒画素の分布状況をもとに明度反転領域であるかど
うかを判定する明度反転領域判定手段とを備えたことに
特徴がある。よって、処理対象の画像が多値画像又は二
値画像にかかわらず明度反転文字領域を抽出することが
でき、よっていかなる画像に対しても精度良く文字認識
が可能となる。
【0007】また、明度反転領域候補抽出手段は、処理
対象の画像の背景を構成する画素と前景を構成する画素
を分離する背景画素分離手段と、前景を構成する画素の
連結成分を抽出する前景画素連結成分抽出手段と、連結
成分の外接矩形を抽出する外接矩形抽出手段と、外接矩
形の幅と高さの比が予め定められた値の範囲内にあるか
否かに応じて前記外接矩形の形状を判定し、判定結果に
基づいて明度反転領域候補を出力する外接矩形形状判定
手段とを備えたことにより、明度反転領域後方を精度良
く抽出することができる。
【0008】更に、背景画素分離手段は、処理対象の画
像が多値画像の場合、画像の二値化を行い、処理対象の
画像が二値画像の場合、画像の黒画素を前景、白画素を
背景と判定する。また、背景画素分離手段は、画像中の
色のクラスタリングを行う。よって、明度反転領域候補
を精度良く抽出することができる。
【0009】また、領域内二値化手段では二値化閾値を
明度反転領域毎に設定することが好ましい。
【0010】更に、明度反転領域判定手段が、黒画素数
と白画素数の比率を計算する白黒画素数比算出手段を備
えたことにより、明度反転領域候補を精度良く抽出する
ことができる。
【0011】また、明度反転領域判定手段が、領域内の
白画素の連結成分を抽出する白画素連結成分抽出手段
と、抽出した連結成分の大きさに基づいて明度反転領域
であるか否かを判定する判定手段とを備えたことによ
り、明度反転領域候補を精度良く抽出することができ
る。
【0012】更に、判定手段が、明度反転領域内の文字
サイズを推定する文字サイズ推定手段と、推定した文字
サイズに近い大きさの連結成分を計数する推定文字サイ
ズ近似連結成分計数手段と、文字サイズに近い大きさの
連結成分数の全連結成分数に対する比を計算する連結成
分数比算出手段とを備えたことにより、明度反転領域候
補を精度良く判定することができる。
【0013】また、文字サイズ推定手段が、当該明度反
転領域の幅、高さのうち短い方の長さの予め定められた
係数倍を文字サイズと判定する手段を備えたことによ
り、文字サイズを精度良く判定することができる。
【0014】更に、処理対象の画像を圧縮した圧縮画像
を生成する圧縮画像生成手段と、処理対象の画像上の座
標値に圧縮画像上の対応する座標値を変換する座標値変
換手段を備えたことにより、高速に文字認識が可能とな
る。
【0015】また、別の発明としての画像処理方法は、
処理対象の画像を格納する画像格納工程と、画像中の明
度反転領域候補を抽出する明度反転領域候補抽出工程
と、原画像が多値画像の場合は抽出した明度反転領域候
補内を二値化する領域内二値化工程と、二値化された明
度反転領域候補内の白画素と黒画素の分布状況をもとに
明度反転領域であるかどうかを判定する明度反転領域判
定工程とを有するコとに特徴がある。よって、処理対象
の画像が多値画像又は二値画像にかかわらず明度反転文
字領域を抽出することができ、よっていかなる画像に対
しても精度良く文字認識が可能となる。
【0016】更に、上記記載の画像処理方法を実行する
ためのプログラムを格納したコンピュータ読み取り可能
な記憶媒体に特徴がある。よって、既存のシステムを変
えることなく、かつ画像処理システムを構築する装置を
汎用的に使用することができる。
【0017】
【発明の実施の形態】本発明の画像処理装置は、処理対
象の画像を格納する画像格納手段と、画像中の明度反転
領域候補を抽出する明度反転領域候補抽出手段と、原画
像が多値画像の場合は抽出した明度反転領域候補内を二
値化する領域内二値化手段と、二値化された明度反転領
域候補内の白画素と黒画素の分布状況をもとに明度反転
領域であるかどうかを判定する明度反転領域判定手段と
を備えた。
【0018】
【実施例】図1は本発明の第1の実施例に係る画像処理
装置の構成を示すブロック図である。本実施例において
は多値で入力した文書画像から、明度反転文字領域を判
別する場合について説明する。同図において、本実施例
の画像処理装置は、処理対象の画像を格納する画像格納
手段11と、明度反転した文字領域の候補領域を画像か
ら抽出する明度反転領域候補抽出手段12と、明度反転
した文字領域候補領域内を、処理対象が多値画像の場合
に二値化する領域内二値化手段13と、明度反転した文
字領域の候補領域の中から、実際に反転文字が含まれる
領域を判定する明度反転領域判定手段14とを含んで構
成されている。
【0019】次に、図1に示す構成を有する本実施例の
画像処理装置の動作について図2に示す動作フローに従
って説明する。先ず、処理対象の文書の画像をスキャナ
等により光学的に読み取り、読み取った画像データを画
像格納手段11に格納する(ステップS101)。明度
反転領域候補抽出手段12を用いて明度反転している文
字領域の候補領域を抽出する(ステップS102)。原
画像が多値画像であるかを判定し、多値画像である場合
は、領域内二値化手段13を用いて候補領域内を二値化
する(ステップS103S;YES、ステップS10
4)。一方、二値画像の場合は二値化する必要がない
(ステップS103;NO)。ここで、二値化の方法に
はさまざまなものが考えられるが、候補領域内の各画素
の明度情報を用い、白画素を構成する画素群と黒画素を
構成する画素群の群間分散が最大になるように二値化閾
値を設定する方法などが考えられる。この手法はいわゆ
る判別分析法と呼ばれる方法である。このように、各領
域内で二値化閾値を設定することで、画像全体で一つの
閾値を設定する場合に比べてより各領域に適合した二値
化閾値を設定することができる。そして、明度反転領域
判定手段14を用い、明度反転領域候補内の二値画像情
報を吟味し、その領域が実際に明度反転文字が含まれた
領域かどうかを判定する(ステップS105)。全ての
候補領域を判定するまでステップS103から繰り返し
て同じ処理を行う(ステップS106)。判定が終了す
れば結果を出力して(ステップS107)、処理を終了
する。
【0020】次に、図2のステップS102における明
度反転領域候補の抽出について、図1の明度反転領域候
補抽出手段12の構成を示すブロック図である図3と明
度反転領域候補抽出の動作を示すフローチャートである
図4を用いて説明する。先ず、図3の背景画素分離手段
1201を用い、処理対象画像の背景を構成する画素
と、前景を構成する画素を分離する(ステップS20
1)。分離する手法にはさまざまなものが考えられる。
例えば、多値画像であれば画像全体を二値化し、黒画素
を前景、白画素背景とする手法が考えられる。また、画
像を構成する画素を画素値をもとに色クラスタリングを
行い、各クラスのうち、最も所属する画素数が多いクラ
スを背景色とみなし、このクラス以外に属している画素
を前景色とする方法などがある。次に、図3の前景画素
連結成分抽出手段202で前景画素の連結成分を抽出し
(ステップS202)、図3の外接矩形抽出手段120
3でこの連結成分の外接矩形を求める(ステップS20
3)。そして、図3の外接矩形形状判定手段1204で
外接矩形の縦横比を判定する(ステップS204)。縦
横比、すなわち高さと幅の比が大きく横長あるいは縦長
の場合、図10のような反転文字領域の可能性がある。
外接矩形形状判定手段1204を用い、外接矩形の縦横
比が予め定められた範囲内にある場合は(ステップS2
05;YES)、これを明度反転領域候補と判定する
(ステップS206)。そうでないものは明度反転領域
ではないと判定する(ステップS205;NO、ステッ
プS207)。全ての外接矩形の吟味が終了するまでス
テップS204からの処理を繰り返し(ステップS20
8)、終了したら次の処理へ進む。
【0021】続いて、図2のステップS105における
明度反転領域判定について、図1の明度反転領域判定手
段15の構成を示すブロック図である図5と明度反転領
域判定の動作を示すフローチャートである図6を用いて
説明する。
【0022】先ず、候補領域の二値画像をもとに、図5
の白黒画素数比算出手段1401により、候補領域内の
白画素と黒画素の比を求める(ステップS301)。白
画素の割合が予め定められた値以上の場合は(ステップ
S1302;YES)、反転文字領域ではないと判定す
る(ステップS308)。一方、白画素の割合が予め定
められた値以上でない場合は(ステップS1302;N
O)、図5の白画素連結成分抽出手段1402で、候補
領域内の白画素の連結成分を求める(ステップS30
3)。そして、図5の文字サイズ推定手段1403で、
領域内の文字サイズを推定する(ステップS304)。
この方法にはさまざまなものが考えられるが、例えば、
横長の領域の場合は領域の高さと文字サイズに相関関係
があると考え、高さのある係数倍を文字サイズとする方
法がある。縦長の領域の場合は、高さの代わりに幅の係
数倍を文字サイズとする。次に、推定された文字サイズ
に近い連結成分を図5の推定文字サイズ近似連結成分計
数手段1404を用い、推定文字サイズに近い大きさを
持つ連結成分の数を数える(ステップS305)。全連
結成分数に占める、文字サイズに近い連結成分の割合を
図5の連結成分数比算出手段1405により求め、この
値が所定の割合以上である場合は(ステップS306;
YES)、文字が含まれていると見なして反転文字領域
であると判定する(ステップS307)。そうでない場
合は反転文字領域ではないと判定する(ステップS30
8)。
【0023】以上説明した第1の実施例によれば、二値
画像、多値画像に関わりなく反転文字領域が精度よく抽
出できる。
【0024】図7は本発明の第2の実施例に係る画像処
理装置の構成を示すブロック図である。同図において、
図1と同じ参照符号は同じ構成要素を示す。図8は実施
例2の構成図である。図1の第1の実施例と異なる構成
要素として、第2の実施例の画像処理装置は、圧縮画像
生成手段21と座標値変換手段22とを含んで構成され
ている。第2の実施例によれば、処理対象画像が高い解
像度を持つ場合原画像をそのまま用いずに、これを圧縮
した画像を処理に利用すれば精度を低下させることなく
第1の実施例に比べて高速な処理が期待できる。
【0025】次に、第2の実施例の画像処理装置の動作
について、動作フローを示す図8に従って説明する。先
ず、処理対象の文書の画像をスキャナ等により光学的に
読み取り、読み取った画像データをもとに、圧縮画像を
生成して画像格納手段11に格納する(ステップS40
1,S402)。圧縮方法は画素を単純に間引くなどの
方法が考えられる。明度反転領域候補抽出手段12を用
いて明度反転している文字領域の候補領域を抽出する
(ステップS403)。原画像が多値画像であるかを判
定し、多値画像である場合は、領域内二値化手段13を
用いて候補領域内を二値化する(ステップS404S;
YES、ステップS405)。一方、二値画像の場合は
二値化する必要がない(ステップS404;NO)。そ
して、明度反転領域判定手段14を用い、明度反転領域
候補内の二値画像情報を吟味し、その領域が実際に明度
反転文字が含まれた領域かどうかを判定する(ステップ
S406)。全ての候補領域を判定するまでステップS
404から繰り返して同じ処理を行う(ステップS40
7)。圧縮画像で算出した反転文字領域は、その位置座
標が圧縮画像上のものである。従って、出力する座標値
は原画像上のものに変換しておく必要がある。すべての
候補領域の吟味が終了したのち、ステップS408で座
標値の変換処理を行って、結果を出力する(ステップS
409)。よって、本実施例によれば、圧縮画像は情報
量が少ないので計算量も少なくなり、処理の高速化が期
待できる。
【0026】次に、図9は本発明のシステム構成を示す
ブロック図である。つまり、同図は上記実施例における
画像処理方法によるソフトウェアを実行するマイクロプ
ロセッサ等から構築されるハードウェアを示すものであ
る。同図において、画像処理システムはインターフェー
ス(以下I/Fと略す)91、CPU92、ROM9
3、RAM94、表示装置95、ハードディスク96、
キーボード97及びCD−ROMドライブ98を含んで
構成されている。また、汎用の処理装置を用意し、CD
−ROM99などの読取可能な記憶媒体には、本発明の
画像処理方法を実行するプログラムが記憶されている。
更に、I/F91を介して外部装置から制御信号が入力
され、キーボード97によって操作者による指令又は自
動的に本発明のプログラムが起動される。そして、CP
U92は当該プログラムに従って上述の画像処理方法に
伴う処理を施し、その処理結果をRAM94やハードデ
ィスク96等の記憶装置に格納し、必要により表示装置
95などに出力する。以上のように、本発明の画像処理
方法を実行するプログラムが記憶された記憶媒体を用い
ることにより、既存のシステムを変えることなく、かつ
画像処理システムを構築する装置を汎用的に使用するこ
とができる。
【0027】なお、本発明は上記実施例に限定されるも
のではなく、特許請求の範囲内の記載であれば多種の変
形や置換可能であることは言うまでもない。
【0028】
【発明の効果】以上説明したように、本発明の画像処理
装置は、処理対象の画像を格納する画像格納手段と、画
像中の明度反転領域候補を抽出する明度反転領域候補抽
出手段と、原画像が多値画像の場合は抽出した明度反転
領域候補内を二値化する領域内二値化手段と、二値化さ
れた明度反転領域候補内の白画素と黒画素の分布状況を
もとに明度反転領域であるかどうかを判定する明度反転
領域判定手段とを備えたことに特徴がある。よって、処
理対象の画像が多値画像又は二値画像にかかわらず明度
反転文字領域を抽出することができ、いかなる画像に対
しても精度良く文字認識が可能となる。
【0029】また、明度反転領域候補抽出手段は、処理
対象の画像の背景を構成する画素と前景を構成する画素
を分離する背景画素分離手段と、前景を構成する画素の
連結成分を抽出する前景画素連結成分抽出手段と、連結
成分の外接矩形を抽出する外接矩形抽出手段と、外接矩
形の幅と高さの比が予め定められた値の範囲内にあるか
否かに応じて前記外接矩形の形状を判定し、判定結果に
基づいて明度反転領域候補を出力する外接矩形形状判定
手段とを備えたことにより、明度反転領域後方を精度良
く抽出することができる。
【0030】更に、背景画素分離手段は、処理対象の画
像が多値画像の場合、画像の二値化を行い、処理対象の
画像が二値画像の場合、画像の黒画素を前景、白画素を
背景と判定する。また、背景画素分離手段は、画像中の
色のクラスタリングを行う。よって、明度反転領域候補
を精度良く抽出することができる。
【0031】また、領域内二値化手段では二値化閾値を
明度反転領域毎に設定することが好ましい。
【0032】更に、明度反転領域判定手段が、黒画素数
と白画素数の比率を計算する白黒画素数比算出手段を備
えたことにより、明度反転領域候補を精度良く抽出する
ことができる。
【0033】また、明度反転領域判定手段が、領域内の
白画素の連結成分を抽出する白画素連結成分抽出手段
と、抽出した連結成分の大きさに基づいて明度反転領域
であるか否かを判定する判定手段とを備えたことによ
り、明度反転領域候補を精度良く抽出することができ
る。
【0034】更に、判定手段が、明度反転領域内の文字
サイズを推定する文字サイズ推定手段と、推定した文字
サイズに近い大きさの連結成分を計数する推定文字サイ
ズ近似連結成分計数手段と、文字サイズに近い大きさの
連結成分数の全連結成分数に対する比を計算する連結成
分数比算出手段とを備えたことにより、明度反転領域候
補を精度良く判定することができる。
【0035】また、文字サイズ推定手段が、当該明度反
転領域の幅、高さのうち短い方の長さの予め定められた
係数倍を文字サイズと判定する手段を備えたことによ
り、文字サイズを精度良く判定することができる。
【0036】更に、処理対象の画像を圧縮した圧縮画像
を生成する圧縮画像生成手段と、処理対象の画像上の座
標値に圧縮画像上の対応する座標値を変換する座標値変
換手段を備えたことにより、高速に文字認識が可能とな
る。
【0037】また、別の発明としての画像処理方法は、
処理対象の画像を格納する画像格納工程と、画像中の明
度反転領域候補を抽出する明度反転領域候補抽出工程
と、原画像が多値画像の場合は抽出した明度反転領域候
補内を二値化する領域内二値化工程と、二値化された明
度反転領域候補内の白画素と黒画素の分布状況をもとに
明度反転領域であるかどうかを判定する明度反転領域判
定工程とを有するコとに特徴がある。よって、処理対象
の画像が多値画像又は二値画像にかかわらず明度反転文
字領域を抽出することができ、よっていかなる画像に対
しても精度良く文字認識が可能となる。
【0038】更に、上記記載の画像処理方法を実行する
ためのプログラムを格納したコンピュータ読み取り可能
な記憶媒体に特徴がある。よって、既存のシステムを変
えることなく、かつ画像処理システムを構築する装置を
汎用的に使用することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係る画像処理装置の構
成を示すブロック図である。
【図2】第1の実施例の画像処理装置の動作を示すフロ
ーチャートである。
【図3】図1の明度反転領域候補抽出手段12の構成を
示すブロック図である。
【図4】明度反転領域候補抽出の動作を示すフローチャ
ートである。
【図5】図1の明度反転領域判定手段15の構成を示す
ブロック図である。
【図6】明度反転領域判定の動作を示すフローチャート
である。
【図7】本発明の第2の実施例に係る画像処理装置の構
成を示すブロック図である。
【図8】第2の実施例の画像処理装置の動作を示すフロ
ーチャートである。
【図9】本発明のシステム構成を示すブロック図であ
る。
【図10】明度反転文字の一例を示す図である。
【符号の説明】
11;画像格納手段、12;明度反転領域候補抽出手
段、13;領域内二値化手段、14;明度反転領域判定
手段、21;圧縮画像生成手段、22;座標値変換手
段。

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 処理対象の画像を格納する画像格納手段
    と、画像中の明度反転領域候補を抽出する明度反転領域
    候補抽出手段と、原画像が多値画像の場合は抽出した前
    記明度反転領域候補内を二値化する領域内二値化手段
    と、二値化された前記明度反転領域候補内の白画素と黒
    画素の分布状況をもとに明度反転領域であるかどうかを
    判定する明度反転領域判定手段とを備えたことを特徴と
    する画像処理装置。
  2. 【請求項2】 前記明度反転領域候補抽出手段は、処理
    対象の画像の背景を構成する画素と前景を構成する画素
    を分離する背景画素分離手段と、前景を構成する画素の
    連結成分を抽出する前景画素連結成分抽出手段と、前記
    連結成分の外接矩形を抽出する外接矩形抽出手段と、前
    記外接矩形の幅と高さの比が予め定められた値の範囲内
    にあるか否かに応じて前記外接矩形の形状を判定し、判
    定結果に基づいて明度反転領域候補を出力する外接矩形
    形状判定手段とを備えた請求項1記載の画像処理装置。
  3. 【請求項3】 処理対象の画像が多値画像の場合、前記
    背景画素分離手段が、画像の二値化を行う二値化手段を
    備えた請求項2記載の画像処理装置。
  4. 【請求項4】 処理対象の画像が二値画像の場合、前記
    背景画素分離手段が、画像の黒画素を前景、白画素を背
    景と判定する手段を備えた請求項2記載の画像処理装
    置。
  5. 【請求項5】 前記背景画素分離手段が、画像中の色の
    クラスタリングを行う手段を備えた請求項2記載の画像
    処理装置。
  6. 【請求項6】 前記領域内二値化手段が、二値化閾値を
    明度反転領域毎に設定する手段を備えた請求項1記載の
    画像処理装置。
  7. 【請求項7】 前記明度反転領域判定手段が、黒画素数
    と白画素数の比率を計算する白黒画素数比算出手段を備
    えた請求項1記載の画像処理装置。
  8. 【請求項8】 前記明度反転領域判定手段が、領域内の
    白画素の連結成分を抽出する白画素連結成分抽出手段
    と、抽出した前記連結成分の大きさに基づいて明度反転
    領域であるか否かを判定する判定手段とを備えた請求項
    1記載の画像処理装置。
  9. 【請求項9】 前記判定手段が、明度反転領域内の文字
    サイズを推定する文字サイズ推定手段と、推定した文字
    サイズに近い大きさの連結成分を計数する推定文字サイ
    ズ近似連結成分計数手段と、前記文字サイズに近い大き
    さの連結成分数の全連結成分数に対する比を計算する連
    結成分数比算出手段とを備えた請求項8記載の画像処理
    装置。
  10. 【請求項10】 前記文字サイズ推定手段が、前記明度
    反転領域の幅、高さのうち短い方の長さの予め定められ
    た係数倍を文字サイズと判定する手段を備えた請求項9
    記載の画像処理装置。
  11. 【請求項11】 処理対象の画像を圧縮した圧縮画像を
    生成する圧縮画像生成手段と、処理対象の画像上の座標
    値に前記圧縮画像上の対応する座標値を変換する座標値
    変換手段を備えた請求項1〜10のいずれかに記載の画
    像処理装置。
  12. 【請求項12】 処理対象の画像を格納する画像格納工
    程と、画像中の明度反転領域候補を抽出する明度反転領
    域候補抽出工程と、原画像が多値画像の場合は抽出した
    前記明度反転領域候補内を二値化する領域内二値化工程
    と、二値化された前記明度反転領域候補内の白画素と黒
    画素の分布状況をもとに明度反転領域であるかどうかを
    判定する明度反転領域判定工程とを有することを特徴と
    する画像処理方法。
  13. 【請求項13】 前記明度反転領域候補抽出工程は、処
    理対象の画像の背景を構成する画素と前景を構成する画
    素を分離する背景画素分離工程と、前景を構成する画素
    の連結成分を抽出する前景画素連結成分抽出工程と、前
    記連結成分の外接矩形を抽出する外接矩形抽出工程と、
    前記外接矩形の幅と高さの比が予め定められた値の範囲
    内にある否かに応じて前記外接矩形の形状を判定し、判
    定結果に基づいて明度反転領域候補を出力する外接矩形
    形状判定工程とを有する請求項12記載の画像処理方
    法。
  14. 【請求項14】 処理対象の画像が多値画像の場合、前
    記背景画素分離工程が、画像の二値化を行う二値化工程
    を有する請求項13に記載の画像処理方法。
  15. 【請求項15】 処理対象画像が二値画像の場合、前記
    背景画素分離工程が、画像の黒画素を前景、白画素を背
    景と判定する工程を有する請求項13記載の画像処理方
    法。
  16. 【請求項16】 前記背景画素分離工程が、画像中の色
    のクラスタリングを行う工程を有する請求項13記載の
    画像処理方法。
  17. 【請求項17】 前記領域内二値化工程が、二値化閾値
    を明度反転領域毎に設定する工程を有する請求項12に
    記載の画像処理方法。
  18. 【請求項18】 前記明度反転領域判定工程が、黒画素
    数と白画素数の比率を計算する白黒画素数比算出工程を
    有する請求項12に記載の画像処理方法。
  19. 【請求項19】 前記明度反転領域判定工程が、領域内
    の白画素の連結成分を抽出する白画素連結成分抽出工程
    と、抽出した連結成分の大きさに基づいて明度反転領域
    である否かを判定する判定工程とを有する請求項12に
    記載の画像処理方法。
  20. 【請求項20】 前記判定工程が、明度反転領域内の文
    字サイズを推定する文字サイズ推定工程と、推定した文
    字サイズに近い大きさの連結成分を計数する工程と、前
    記文字サイズに近い大きさの連結成分数の全連結成分数
    に対する比を計算する工程とを有する請求項19記載の
    画像処理方法。
  21. 【請求項21】 前記文字サイズ推定工程が、前記明度
    反転領域の幅、高さのうち短い方の長さの予め定められ
    た係数倍を文字サイズと判定する工程を有する請求項2
    0記載の画像処理方法。
  22. 【請求項22】 処理対象の画像を圧縮した圧縮画像を
    生成する工程と、処理対象の画像上の座標値に前記圧縮
    画像上の対応する座標値を変換する工程を有する請求項
    12〜21のいずれかに記載の画像処理方法。
  23. 【請求項23】 請求項12〜22のいずれかに記載の
    画像処理方法を実行するためのプログラムを格納したコ
    ンピュータ読み取り可能な記憶媒体。
JP2001075290A 2001-03-16 2001-03-16 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム Expired - Fee Related JP4213357B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001075290A JP4213357B2 (ja) 2001-03-16 2001-03-16 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001075290A JP4213357B2 (ja) 2001-03-16 2001-03-16 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム

Publications (2)

Publication Number Publication Date
JP2002279345A true JP2002279345A (ja) 2002-09-27
JP4213357B2 JP4213357B2 (ja) 2009-01-21

Family

ID=18932394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001075290A Expired - Fee Related JP4213357B2 (ja) 2001-03-16 2001-03-16 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム

Country Status (1)

Country Link
JP (1) JP4213357B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004097721A1 (ja) * 2003-04-25 2004-11-11 Sharp Kabushiki Kaisha 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体
US8401303B2 (en) 2009-12-28 2013-03-19 Canon Kabushiki Kaisha Method and apparatus for identifying character areas in a document image
US9153057B2 (en) 2012-11-27 2015-10-06 Kyocera Document Solutions Inc. Image processing apparatus that detects an ordinary character and a density reversed character
CN110555839A (zh) * 2019-09-06 2019-12-10 腾讯云计算(北京)有限责任公司 缺陷检测识别方法、装置、计算机设备及存储介质
WO2020089985A1 (ja) * 2018-10-29 2020-05-07 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
JP2021071763A (ja) * 2019-10-29 2021-05-06 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004097721A1 (ja) * 2003-04-25 2004-11-11 Sharp Kabushiki Kaisha 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体
US8401303B2 (en) 2009-12-28 2013-03-19 Canon Kabushiki Kaisha Method and apparatus for identifying character areas in a document image
US9153057B2 (en) 2012-11-27 2015-10-06 Kyocera Document Solutions Inc. Image processing apparatus that detects an ordinary character and a density reversed character
WO2020089985A1 (ja) * 2018-10-29 2020-05-07 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
JPWO2020089985A1 (ja) * 2018-10-29 2021-05-13 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
JP7106672B2 (ja) 2018-10-29 2022-07-26 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
CN110555839A (zh) * 2019-09-06 2019-12-10 腾讯云计算(北京)有限责任公司 缺陷检测识别方法、装置、计算机设备及存储介质
JP2021071763A (ja) * 2019-10-29 2021-05-06 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP7508212B2 (ja) 2019-10-29 2024-07-01 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
JP4213357B2 (ja) 2009-01-21

Similar Documents

Publication Publication Date Title
US10455117B2 (en) Image processing apparatus, method, and storage medium
US7233697B2 (en) Character recognition device and a method therefor
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP2008148298A (ja) 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US11935314B2 (en) Apparatus for generating a binary image into a white pixel, storage medium, and method
JP4558232B2 (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP2009032299A (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
JP3753357B2 (ja) 文字抽出方法および記録媒体
JP4408495B2 (ja) 画像処理方法及び画像処理装置
US6269186B1 (en) Image processing apparatus and method
JPH05166002A (ja) ソース画像を分析する方法
JP2001043313A (ja) 文字切出し方法
JP2002279345A (ja) 画像処理装置、画像処理方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP2005275854A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP3215163B2 (ja) 罫線識別方法及び領域識別方法
KR100449486B1 (ko) 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
JP2003087562A (ja) 画像処理装置および画像処理方法
JP2006344242A (ja) カラー画像認識方法および装置
JP3835652B2 (ja) 文書画像の日本語英語判定方法および記録媒体
JP4409713B2 (ja) 文書画像認識装置及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081028

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081030

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131107

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees