JP3966448B2 - 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体 - Google Patents

画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP3966448B2
JP3966448B2 JP2001052900A JP2001052900A JP3966448B2 JP 3966448 B2 JP3966448 B2 JP 3966448B2 JP 2001052900 A JP2001052900 A JP 2001052900A JP 2001052900 A JP2001052900 A JP 2001052900A JP 3966448 B2 JP3966448 B2 JP 3966448B2
Authority
JP
Japan
Prior art keywords
detection
shadow
character
edge
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001052900A
Other languages
English (en)
Other versions
JP2002262074A (ja
Inventor
敏 大内
徳子 宮城
幸二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001052900A priority Critical patent/JP3966448B2/ja
Publication of JP2002262074A publication Critical patent/JP2002262074A/ja
Application granted granted Critical
Publication of JP3966448B2 publication Critical patent/JP3966448B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、例えば原稿をスキャナなどにより読み込み、像域分離技術によって原稿中から高精度に文字領域を検出する画像処理装置に関し、デジタル複写機、デジタルカラー複写機、ファクシミリなどの画像再生装置に適用される技術である。
【0002】
【従来の技術】
画像データ中から文字エッジを検出する従来の技術として、例えば、黒画素と白画素のそれぞれの連続性を基にエッジ領域を検出する方法(「文字/絵柄(網点、写真)混在画像の像域分離方式」(電子情報通信学会論文誌Vol.J75−DII No.1 pp.39−47 1992年1月)を参照)、4方向の画像の連続性を基に文字を検出する方法(特開平1−174452号公報を参照)などがある。
【0003】
【発明が解決しようとする課題】
上記した従来の方法では、例えば鉛筆文字に代表されるような低コントラスト文字まで、文字として十分に検出できるようなパラメータを設定した場合、切り貼り原稿の影あるいは厚紙を白い原稿押さえ板を背景にして読み込んだ場合の縁の影のような領域までを文字として検出してしまう。
【0004】
加えて、通常、文字領域に対しては解像度を向上させたり、コントラストを強調させる処理を施すことから、実際には情報として不要なこれら「影」も一層強調されてしまう。
【0005】
本発明は上記した問題点に鑑みてなされたもので、
本発明の目的は、原稿の縁に発生する影を文字として検出することなく、低コントラスト文字を精度よく検出する画像処理装置を提供することにある。
【0006】
【課題を解決するための手段】
本発明では、文字エッジの検出と並行して、文字領域の特徴と影領域の特徴を検出し、検出された特徴を基に文字エッジの検出結果が、真の文字エッジであるか否かを判定する。文字領域/影領域の特徴として、エッジ勾配、エッジ勾配の方向性などを用い、局所的な画像処理によって特徴の抽出や算出を行う。
【0007】
また、本発明では、制御系が2値処理ではなく、多段階の制御が可能である場合には、文字検出を文字エッジ量のように多値出力で行う。つまり、文字エッジの検出、前記各領域の特徴量算出を2値または多値で行うとき、その使用目的に応じて何れかを選択することが可能である。
【0008】
本発明の一実施例では、入力された画像情報に対して、文字エッジに相当する画素領域を検出あるいは、文字のエッジ領域である確率を表す文字エッジ量を検出する画像認識装置において、入力された画像情報に対し、局所情報に基づいて文字画素領域あるいは文字エッジ量を検出する第一の手段と、切り貼りの縁あるいは厚紙原稿の縁などに代表されるそれらの影に相当する画素領域の検出あるいは影領域である確率を表す値の算出、あるいは影に相当しない画素領域の検出あるいは影領域ではない確率を表す値の算出を行う第二の手段を備え、第一の手段の結果を、第二の手段の結果に基づいて補正する。
【0009】
【発明の実施の形態】
以下、本発明の一実施例を図面を用いて具体的に説明する。
【0010】
図1は、本発明の実施例の構成を示す。本発明の装置を複写機などへ搭載(例えば空間フィルタ制御など)した場合を想定して以下、説明する。画像入力装置1は、600dpi、8bitの概ね反射率リニア信号を出力するスキャナであり、カラースキャナであればグリーン信号や輝度信号を算出して以下の処理に使用する。
【0011】
γ変換回路2は、反射率リニアの信号を、後述する特徴量算出のし易さを考慮して、濃度リニア信号などに変換するためのテーブルであり、これにより低コントラスト文字が検出し易くなる効果も期待できる。
【0012】
文字エッジ(またはエッジ量)検出回路3は、ロバストに低コントラスト文字を検出する回路である。補正値算出回路4は、文字領域ならば例えば高い値(多値のとき大きな値、2値のとき”1”)を、影領域ならば例えば低い値(多値のとき小さな値、2値のとき”0”)を発生する回路であり、遅延回路5は、補正値算出回路4の方が、文字エッジ(またはエッジ量)検出回路2よりもラインバッファを多く必要とするので、そのタイミングを調整するために設けている。
【0013】
総合判定回路6では、遅延回路5からの出力と補正値算出回路3からの出力を基に、文字エッジ(またはエッジ量)検出回路3で検出された文字エッジが真の文字エッジ領域あるいは真の文字エッジ量であるか否かを判定する。
【0014】
以下、本実施例を詳述すると、画像入力装置1は、600dpi、8bit(0〜255)で原稿をスキャニングすることにより信号出力することが可能な装置である。ここで、出力信号は反射率リニアな信号とする。また、画像入力装置はカラーであるRGB信号を出力する装置でも良く、その場合には適当な線形一次式からコンボリューションにより目的の信号を得れば良い。また、処理対象の画像信号はネットワーク上から取り込んだ画像信号でもよい。
【0015】
γ変換回路2は、テーブル変換などによる一次変換を行う回路である。本発明の主旨から、低コントラスト部分に信号(の段数)を多く割り当てるような変換を行えば、文字エッジと影を分離する上で有利となる。説明の都合上、γ変換回路後の信号は、原稿の紙白側の値を「0」、黒を「255」とする。
【0016】
文字エッジ(またはエッジ量)検出回路3は、コントラストのはっきりした通常の文字は勿論、低コントラスト文字も文字として検出するような回路である。ここでは、前掲した論文に記載のエッジ領域検出の部分を利用する。すなわち、γ変換後の画像データにエッジ強調を施した後、2種の固定閾値(白画素<16 黒画素≧32)で3値化を行う。3値化後の黒画素と白画素が連続する箇所をパターンマッチングで検出する。使用するパターンは、文字のエッジ部がある方向性を持つことに注目したパターンである。パターンにマッチングした場合、中心画素を黒連続画素、白連続画素とし、5×5画素のブロックにおいて黒連続画素と白連続画素が、両者とも1個以上存在するとき、注目ブロックをエッジ領域と判定する。
【0017】
黒画素と白画素のそれぞれの連続性を基にエッジ領域を検出する、上記した検出方法においては、二つの閾値を使って前処理として3値化を行うが、この閾値を、検出すべき低コントラスト文字を考慮して設定する。つまり、特に黒画素を検出する閾値を一般の文字を検出する場合に比べて、小さく設定する必要がある。また、多段階制御(フィルタリング、墨発生など)を前提にしたエッジ量が必要であれば、例えば特開平11−8775号公報に記載された仮エッジ量算出回路(5×5のラプラシアンフィルタによってエッジ画素を検出した後、所定の閾値で2値化し、5×5のマスク内で検出される2値化後の画素をカウントし、さらにカウント数を0〜255にテーブル変換する。例えば、カウント数が0のとき注目画素の仮エッジ量は0であり、カウント数が1のとき仮エッジ量は25であり、2のとき51、3のとき76、10以上のとき255となる)を利用すれば良い。
【0018】
補正値算出回路4は、例えば文字領域と影領域を分離する回路あるいは、それらの確率を表すような多段階な値を出力する回路であり、以下に幾つかの実施例を示す。
【0019】
<エッジの勾配を利用した補正回路>
文字はその字体などの特性から、影領域に比べて大きなエッジ勾配を持つ部分が多い。ここでは、このような特性を利用して補正値を算出する。
【0020】
図2は、補正値算出回路の第1の例を示す。エッジ勾配検出フィルタ10では、エッジ勾配を検出するが、図3でその詳細を説明する。すなわち、注目画素を挟んで位置する画素からその勾配を算出するが、それを異なる4方向で算出してそれらの最大値をとることにより、より敏感にエッジの勾配を検出することが可能となる。これを式で記述すれば、次の通りである。
X=max(|A−B|,|C−D|,|E−F|,|G−H|)
次に、二値化回路11では、所定の値(文字部に大きくレスポンスし、影部にレスポンスしないような値)で二値化する。その後、計数回路12では、例えば7×7程度のマスクにおいて、アクティブ画素を計数し、γ変換回路13では計数値に対し適当な変換を行って出力信号(例えば0〜15)を得る。あるいは計数値に対し二値化判定を行って、二値の出力信号(”0”/”1”)を得ることも可能であり、必要に応じて二値出力/多値出力を選択すれば良い。
【0021】
<エッジの勾配の方向性を利用した補正回路>
エッジ勾配の方向性と言う点では、文字領域と影領域は次のような特徴を持つ。文字は形が複雑であり、局所領域において画像データ上ではエッジ勾配の方向は比較的ばらばらであるが、一方、影領域は、印画紙を貼り付けた場合などが顕著であるが、影のエッジ勾配の方向は直線的である。ここではこの特性を利用して補正値を算出する。
【0022】
図4は、補正値算出回路の第2の例を示す。まず、図3を用いてエッジ勾配/方向検出フィルタ20を説明する。すなわち、注目画素を挟んで位置する画素からその勾配を算出するが、それを異なる4方向で算出してそれらの最大値をとることにより、より敏感にエッジの勾配を検出することが可能となる。これを式で記述すれば、次の通りである。
X=max(|A−B|,|C−D|,|E−F|,|G−H|)
まず、X>Th20であって(そうでない時は、「0」を出力)、
|A−B|が4つの最大であり、A>Bならば「1」を出力
|A−B|が4つの最大であり、A<Bならば「2」を出力
|C−D|が4つの最大であり、C>Dならば「3」を出力
|C−D|が4つの最大であり、C<Dならば「4」を出力
|E−F|が4つの最大であり、E>Fならば「5」を出力
|E−F|が4つの最大であり、E<Fならば「6」を出力
|G−H|が4つの最大であり、G>Hならば「7」を出力
|G−H|が4つの最大であり、G<Hならば「8」を出力する。
【0023】
次に、計数回路21では、例えば9×9程度のマスクにおいて、1〜8の値をそれぞれ計数(それぞれ計数値を、Y1〜Y8)する。
【0024】
そして、総合判定回路22においては、Y1〜Y8を所定値で閾値判定し、例えばY1とY2の他に、他の計数値(Yx)も閾値を越える場合を文字領域”1”とし、そうでない場合を影領域”0”として判定出力する。
【0025】
文字領域判定ケースの他の方法を以下に示す。つまり、
Y3とY4とそれ以外の値(Yx)が閾値を超える。
Y5とY6とそれ以外の値(Yx)が閾値を超える。
Y7とY8とそれ以外の値(Yx)が閾値を超える。
また、これを多段階出力としたい場合には、最後段で適当な平滑化フィルタを施せば良い。
【0026】
<エッジ境界の直線性を利用した補正回路>
エッジ境界の直線性と言う点では、一般には切り貼り原稿などは矩形である場合が多く、エッジ境界の方向性としては直線であることが多い。これに対して文字のそれは直線であっても短いし、また所々大きな曲率を持つ。ここではこの特性を利用して補正値を算出する。なお、曲率の算出方法としては、画像のエッジ部のラスターデータをベクターデータに変換し、例えば従来技術である特開平63−298576などを利用して算出することも可能であるが、複写機などへの応用を考慮した場合には、処理量・リアルタイム性などの点で実現性が難しく、実現性がより高い簡易な方法を以下に示す。
【0027】
図5は、補正値算出回路の第3の例を示す。二値化回路30では、注目画像の領域が、低コントラスト文字や影のような部分であるので、それら低濃度を考慮した固定閾値で二値化する手段を採ることができるが、ここではフロー型の閾値で二値化する。すなわち、注目画素を含む所定のマスク領域において平均値を算出し、基本的にその値を基に二値化した方がよりセンシティブに特徴を抽出することができる。
【0028】
二値化の結果に対し、パターンマッチング回路31で直線性を検出する。図6(a)、(b)は、横方向の例を示す(図中、黒丸は黒画素、白丸は白画素、パターンの中心が注目画素である)。以下、エッジに対する横方向の直線性検出を例に説明するが、縦方向、斜め方向も同様である。
【0029】
さて、注目画素が図6にマッチングした場合、その結果を一画素分記憶するとともに、注目画素の左の画素までのパターンマッチングの結果(正確には、前画素まで計数値)を参照する。計数回路32では、パターンマッチングのヒットが続く限り連続する画素数を計数し、逆にマッチングしない場合には、計数回路32は、計数値を「0」にリセットする。ここでは横方向に対し、横方向エッジパターンにヒットした画素が連続している数をn30とし、縦方向のそれをn31とする。
【0030】
総合判定回路33では、注目画素に対するn30あるいはn31が所定の値以上であれば、影領域と判定し”0”を出力し、そうでなければ文字領域と判定し”1”を出力する。さらに膨張回路34では、影領域を膨張するための補正として、例えば注目画素を含む5×5のマスクにおいて一つでも”0”があれば、注目画素を”0”とするような処理を施す。また、これを多段階出力とする場合には、最後段で適当な平滑化フィルタを施せば良い。
【0031】
<文字領域特有の二次元的濃度検出を利用した補正回路>
文字領域は、特徴のある二次元的濃度変化部を有することが多い。ここでは多値データに対して、それらの局所パターンを検出し、補正値を算出する。図7は、補正値算出回路の第4の例を示す。
【0032】
二次元的濃度変化検出回路40については、幾つかの実施例を後述する。密度補正回路41では、二次元的濃度変化検出回路40で文字領域に存在すると判定された結果(文字領域候補画素)に対し、例えば7×7程度のマスクにおいて、文字領域候補画素を計数し、その計数値が所定の値以上であれば、マスク内注目画素ないしマスク内画素を文字領域画素として判定する。さらに、前述した膨張回路と同様にして膨張回路42で膨張処理を行う。また、これを多段階出力する場合には、最後段で適当な平滑化フィルタを施せば良い。
【0033】
(a)ラプラシアンフィルタを用いた二次元的濃度変化検出回路の例
文字領域は、例えば「×」の中心のようにクロスする部分を多く含む。一方、影領域にはほとんど含まれない。この特徴を利用して、例えば図8のようなラプラシアンフィルタを画像データに施し、そのフィルタ出力値が所定値以上であれば、注目画素を二次元的濃度変化の大きな画素領域とする。
【0034】
(b)ピーク画素検出フィルタを用いた二次元的濃度変化検出回路の例
上記(a)で述べた特徴を、例えば、前掲した論文に記載されたピーク画素検出方法(3×3のブロックにおいて中心画素の濃度レベルLが周囲のすべての画素の濃度レベルより高くあるいは低く、Lと中心画素を挟んで対角線に存在する対画素の濃度レベルa,bが、4対とも、|2×L−a−b|>固定の閾値、である場合に、中心画素をピーク画素とする)を利用して検出する。
【0035】
前掲した論文は、網点ドットを検出する処理として記述しているが、文字部のクロス領域にもレスポンスする検出方法である。なお、文字部と網点部のピーク画素の密度は比較にならないほど後者の方が多いが、文字部のクロス部検出のために、その論旨を変更するものではない。
【0036】
(c)尾根画素検出フィルタを用いた二次元的濃度変化検出回路の例
文字領域も切り貼り原稿などの影部も、共に尾根状になっている。ここではさらに、文字部はその背景が例えば均一の白地であること、一方、影部は切り貼りの場合、その背景色が変わる可能性があることを利用して、山の対称性・非対称性(図9を参照)を利用して両者を分離する。
【0037】
従来から、尾根画素検出方法は、例えば特開平3−82269号公報などに記載されている(局所領域内の中心画素の濃度レベルをLcとし、かつ中心画素Lcを中に挟んで任意の対称位置にある画素対の濃度レベルをそれぞれLa、Lbとするとき、局所領域内で、Lc−La≧THかつLc−Lb≧THが1つでも成り立てば、中心画素Lcを尾根画素として検出する)。
【0038】
ここでは、その濃度勾配の対称性を付加するような条件を従来の処理に付加する。濃度勾配の対称性を検出するフィルタ例を図10に示す。図10において、上記した尾根画素検出方法によって例えばAB方向に山の尾根が続くと判断された場合に、|E−F|<Th80のとき、二次元的濃度変化検出回路40は、濃度勾配に対称性があると判断し、注目画素(尾根画素)Lを文字領域として検出する。
【0039】
(d)二次元的白黒変化の検出処理を用いた二次元的濃度変化検出回路の例
文字領域は所定領域における濃度変化の頻度が大きいのに対し、影領域のそれは小さい。ここでは所定の方法(前述したようなフロー型の閾値で二値化を行うのがよい)で二値化後、その二値化データに対し、二次元的広がりを持ったマスクにおいて主副それぞれの走査方向に対して、白から黒あるいは黒から白への変化点数を計数し、その計数値が所定値以上であれば、マスク内注目画素あるいはマスク内の全画素を二次元的濃度変化の大きな画素領域とする。
【0040】
<文字領域特有の二次元的形状検出を利用した補正回路>
文字領域は、特徴のある二次元的形状を有することが多い。ここでは、二値化処理後のデータに対して、あるいは、従来の特開平3−82269号公報に記載されたような尾根画素検出結果に対し、文字部特有に存在する局所パターンを検出し、補正値を算出する。
【0041】
図11は、補正値算出回路の第5の例を示す。二値化回路50では、所定の方法(前述したようなフロー型の閾値で二値化を行うのがよい)で二値化するか、あるいは尾根画素検出を行なっても良い。次いで、以下に詳述する、文字部に存在する特徴ある形状をパターンマッチング回路51で検出する。さらに、先に説明した膨張回路52で膨張処理を行う。また、これを多段階出力する場合には、最後段で適当な平滑化フィルタを施せば良い。
【0042】
(a)文字のクロス部をパターンマッチングで検出
文字部にはクロス部が多く、一方、影部にはクロス部がほとんどない。この特徴を利用して、図12に示すようなパターン(図中、黒丸は黒画素、白丸は白画素、他はドントケア、パターンの中心が注目画素、以下同様)を準備し、パターンマッチングによって検出を行う。もちろん、「×」のようなパターンを準備しても有効である。
【0043】
(b)文字の「T」部をパターンマッチングで検出
文字部には「T」のような交叉部が多く、一方、影部にはほとんどない。この特徴を利用して、図13に示すようなパターンを準備し、パターンマッチングによって検出を行う。もちろん、図13のパターンを回転したようなパターンを準備しても有効である。
【0044】
(c)文字の端部をパターンマッチングで検出
文字部には端部が多く、一方、影部にはほとんどない。この特徴を利用して、図14に示すようなパターンを準備し、パターンマッチングによって検出を行う。もちろん、これを回転したようなパターンを準備しても有効である。
【0045】
<背景地の検出を利用した補正回路>
文字の背景領域は、白地が代表的例であるが、いずれにしても均一であることが多く、切り貼りの影領域は、貼った紙の地レベルと貼られた紙の地レベルが異なることが多い。ここでは、その特徴を利用して補正値を算出する。また、説明簡単のためと、実用上でのハードウェア量の低減化を考慮して、ここでは主走査方向のみの演算とする。もちろん、副走査方向に対して本実施例を適応すれば補正は高精度となるが、コストなどを考慮して適宜選択して実施すれば良い。
【0046】
図15は、補正値算出回路の第6の例を示す。平均値算出回路60では、図16に示すように注目画素を挟んで、主走査方向に所定の距離(L60)だけ離れた二つの画素(A60,B60)の周辺画素領域(例えば7×7画素)に対して、平均値(n60,n61)を求める。次いで、差分算出回路61では、|n60−n61|を算出し、さらにその値をγ変換回路62で所望の変換を行う(差分値が小さければ小さいほど文字領域確率が高くなるような多値出力)か、二値判定結果(差分値が小さい場合は文字領域”1”、そうでない場合は影領域”0”)を出力する。なお、画像処理系などとの関係を考慮して、γ変換回路62の結果に対して膨張処理などを必要に応じて行っても良い。
【0047】
ところで、平均値(n60,n61)は、より大きなマスクで算出するほど高精度な演算が可能となるが、一方で背景地以外の情報たとえば文字部などが含まれる可能性も大きくなる。従って、平均値を求める場合に、所定値以上の濃度値を持つような画素値に関しては、その値をリジェクトするような手法も非常に有効である。また、本実施例では、スキャナなどで読み取った画像データを利用してエッジ領域の背景が、均一の紙からなるものか、複数の紙からなるものかを判断しているが、たとえば紙表面の光沢度を計測するセンサー(例えばニチコン製)を用いた紙の自動認識も可能であり、将来的にはこのようなセンサーを複数利用して、所定エッジ近傍における紙の単数/複数認識も可能である。
【0048】
<線幅の検出を利用した補正回路>
図9からも分かるように、文字のエッジ、影のエッジともに勾配方向が正反対のペアエッジからなっている。ここでは、影エッジの方は、そのペアエッジの幅(線幅)がほとんど均一であること、文字の線幅は影部に比べ比較的不均一であることを利用して補正値を算出する。また、説明簡単のためと、実用上でのハードウェア量の低減化を考慮して、ここでは主走査方向のみの演算とする。もちろん、副走査方向に対して本実施例を適応すれば補正は高精度となるが、コストなどを考慮して適宜選択して実施すれば良い。
【0049】
図17は、補正値算出回路の第7の例を示す。線の太さ算出回路70では、注目画素を挟んで、主走査方向に所定の距離だけ離れた二つの画素あるいは周辺画素領域に対して、文字幅、影幅の値n70、n71を求める。その算出方法としては、ここでは、例えば従来装置である特開平8−130636号公報に記載の文字幅判定部のエリアサイズ判定までを利用する。次いで、差分算出回路71では、|n70−n71|を算出し、さらにその値をγ変換回路72で所望の変換を行う(差分値が小さいほど文字領域である確率が低くなるような多値出力)か、二値判定結果(差分値が小さい場合は影領域”0”、そうでない場合は文字領域”1”)を出力する。もちろん、画像処理系などとの関係を考慮して、γ変換回路72の結果に対して膨張処理などを必要に応じて行っても良い。
【0050】
図1に戻り、遅延回路5は、文字エッジ(またはエッジ量)検出回路3と補正値算出回路4の同期をとるための回路であり、必要に応じて文字エッジ(またはエッジ量)検出回路3側の出力を遅延させる。
【0051】
総合判定回路6は、文字エッジ(または文字エッジ量)検出回路3からの結果と補正値算出回路4からの結果を基に最終的な判定値を算出する。文字エッジ(または文字エッジ量)検出回路3と補正値算出回路4が共に二値出力であれば、総合判定回路6は論理積に相当する処理を施す。従って、検出回路3で文字エッジが検出され、かつ補正値算出回路4で文字領域が算出されたときのみ、真の文字エッジが検出される。また、検出回路3と算出回路4が、多値同士の出力であれば、総合判定回路6では乗算器を使った乗算を行って多値の文字エッジ検出結果を出力し、あるいは総合判定回路6が、2入力1出力の適当な変換用テーブルで構成され、2入力値に応じた変換後の出力値を出力する。
【0052】
本発明は上記した実施例に限定されず、種々の変更が可能である。例えば、文字の周囲には文字が存在する確率は、それなりに高く、すなわち、文字エッジ密度は、影エッジ密度より一般的に大きいと言う性質を利用して、総合判定回路6の結果に対し、適当なサイズのマスクにおいて密度を利用した補正を行うことも、また有効である。具体的には、マスク内の文字画素のフラグ”1”や確率値を合算し、それらを閾値判定(多段階出力が必要な場合は、複数の閾値を使用)して出力する処理回路(総合判定された文字エッジ画素が所定の密度以上存在するときのみ、文字エッジとして出力する回路)である。その他、総合判定回路6に入力する前の文字エッジ(またはエッジ量)検出回路3の出力に対しても、上記したと同様の補正処理を行ってもよい。
【0053】
上記したように、本発明は専用のハードウェアによって実施してもよいことは当然であるが、汎用のコンピュータシステムを利用し、ソフトウェアで実施してもよい。ソフトウェアで実施する場合には、本発明の画像処理機能(文字エッジ検出、補正値算出、γ変換、判定処理など)や処理手順を実現するプログラムが記録媒体などに記録されていて、該記録媒体などからプログラムがコンピュータシステムに読み込まれてCPUによって実行されることにより、本発明の画像処理手順が実施される。画像データは、例えばスキャナなどから読み込んだ原稿画像データや予めハードディスクなどに用意された画像データであり、あるいはネットワークを介して取り込んだ画像データである。
【0054】
【発明の効果】
以上、説明したように、本発明によれば、低コントラスト文字までも文字として検出し、その検出結果を局所情報を参照して補正しているので、文字を検出する一方で、切り貼り原稿や白い原稿押さえ板を使用した場合の原稿の縁に発生する影を文字として検出しない。
【図面の簡単な説明】
【図1】 本発明の実施例の構成を示す。
【図2】 補正値算出回路の第1の例を示す。
【図3】 エッジ勾配検出フィルタの例を示す。
【図4】 補正値算出回路の第2の例を示す。
【図5】 補正値算出回路の第3の例を示す。
【図6】 横直線エッジを検出するパターン例を示す。
【図7】 補正値算出回路の第4の例を示す。
【図8】 ラプラシアンフィルタの例を示す。
【図9】 文字領域と影領域における濃度の断面を示す。
【図10】 尾根画素に対称性の条件を付加したフィルタを示す。
【図11】 補正値算出回路の第5の例を示す。
【図12】 文字部パターン「+」の例を示す。
【図13】 文字部パターン「T」の例を示す。
【図14】 文字部パターン「端部」の例を示す。
【図15】 補正値算出回路の第6の例を示す。
【図16】 エッジ近傍の背景の濃度差を検出する例を示す。
【図17】 補正値算出回路の第7の例を示す。
【符号の説明】
1 画像入力装置
2 γ変換回路
3 文字エッジ検出回路
4 補正値算出回路
5 遅延回路
6 総合判定回路

Claims (10)

  1. 所定画像から文字エッジ領域を検出する第1の検出手段と、前記所定画像から影に相当する領域または影に相当しない領域を検出する第2の検出手段と、前記第2の検出手段の検出結果を参照して、前記第1の検出手段の検出結果を判定する判定手段とを備え、前記第2の検出手段は、エッジの曲率を基に前記影に相当する領域または影に相当しない領域を検出することを特徴とする画像処理装置。
  2. 前記第1の検出手段の検出結果を、所定サイズの領域について参照することにより前記検出結果を補正する補正手段をさらに備え、前記判定手段は、前記第2の検出手段の検出結果を参照して、前記補正された検出結果を判定することを特徴とする請求項1記載の画像処理装置。
  3. 前記エッジの曲率は、注目画素近傍における直線性であることを特徴とする請求項記載の画像処理装置。
  4. 所定画像から文字エッジ領域を検出する第1の検出手段と、前記所定画像から影に相当する領域または影に相当しない領域を検出する第2の検出手段と、前記第2の検出手段の検出結果を参照して、前記第1の検出手段の検出結果を判定する判定手段とを備え、前記第2の検出手段は、線幅を基に前記影に相当する領域または影に相当しない領域を検出することを特徴とする画像処理装置。
  5. 前記第1の検出手段の検出結果を、所定サイズの領域について参照することにより前記検出結果を補正する補正手段をさらに備え、前記判定手段は、前記第2の検出手段の検出結果を参照して、前記補正された検出結果を判定することを特徴とする請求項記載の画像処理装置。
  6. 前記第2の検出手段は、エッジ幅の均一性を検出することにより、前記線幅を検出することを特徴とする請求項記載の画像処理装置。
  7. 所定画像から文字エッジ領域を検出する第1の検出工程と、前記所定画像から影に相当する領域または影に相当しない領域を検出する第2の検出工程と、前記第2の検出工程の検出結果を参照して、前記第1の検出工程の検出結果を判定する判定工程とを備え、前記第2の検出工程は、エッジの曲率を基に前記影に相当する領域または影に相当しない領域を検出することを特徴とする画像処理方法。
  8. 所定画像から文字エッジ領域を検出する第1の検出工程と、前記所定画像から影に相当する領域または影に相当しない領域を検出する第2の検出工程と、前記第2の検出工程の検出結果を参照して、前記第1の検出工程の検出結果を判定する判定工程とを備え、前記第2の検出工程は、線幅を基に前記影に相当する領域または影に相当しない領域を検出することを特徴とする画像処理方法。
  9. 請求項7または8記載の画像処理方法の各工程をコンピュータに実行させるためのプログラム。
  10. 請求項7または8記載の画像処理方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2001052900A 2001-02-27 2001-02-27 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体 Expired - Fee Related JP3966448B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001052900A JP3966448B2 (ja) 2001-02-27 2001-02-27 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001052900A JP3966448B2 (ja) 2001-02-27 2001-02-27 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2002262074A JP2002262074A (ja) 2002-09-13
JP3966448B2 true JP3966448B2 (ja) 2007-08-29

Family

ID=18913449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001052900A Expired - Fee Related JP3966448B2 (ja) 2001-02-27 2001-02-27 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3966448B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4615462B2 (ja) * 2006-03-15 2011-01-19 株式会社リコー 画像処理装置、画像形成装置、プログラムおよび画像処理方法
JP5660275B2 (ja) * 2010-01-25 2015-01-28 富士ゼロックス株式会社 画像処理装置、画像形成装置、画像処理プログラム
WO2013005357A1 (ja) * 2011-07-06 2013-01-10 パナソニック株式会社 エッジ方向検出装置、エッジ補正装置、エッジ方向検出方法、及びエッジ補正方法

Also Published As

Publication number Publication date
JP2002262074A (ja) 2002-09-13

Similar Documents

Publication Publication Date Title
JP4219542B2 (ja) 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体
JP3276985B2 (ja) イメージピクセル処理方法
JP2001251507A (ja) 画像処理装置
US20080137159A1 (en) Image forming apparatus and image quality improving method thereof
JP2007067932A (ja) 画像処理装置及びその方法
JPH10341336A (ja) 画像処理装置および二次元線特徴量算出装置
JP4140519B2 (ja) 画像処理装置、プログラムおよび記録媒体
JP3966448B2 (ja) 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体
JP4010440B2 (ja) 影検出を伴う画像処理装置
JPH0851538A (ja) 画像処理装置
JP4035696B2 (ja) 線分検出装置及び画像処理装置
JP7413751B2 (ja) 画像処理システムおよびプログラム
JP7377435B2 (ja) 画像処理装置
JPH06150059A (ja) 像域分離装置
JP2002158873A (ja) 画像処理装置、画像形成装置、画像処理方法及び記録媒体
JP2007243330A (ja) 画像処理装置、および網点文字の情報出力方法
JP2005020413A (ja) 画像処理装置、画像処理方法およびその方法をコンピュータに実行させるためのプログラム
JP3004244B2 (ja) 領域分離装置
JP3605773B2 (ja) 画像領域判別装置
JPH03153167A (ja) 文字領域分離方式
JPH0385061A (ja) 文字領域分離方式
JP2853141B2 (ja) 画像領域識別装置
JPH01286571A (ja) 画像領域識別装置
JP2001312726A (ja) 画像処理装置および方法
JP2000353247A (ja) 白黒画像情報の領域判別方法および装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070524

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110608

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110608

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130608

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees