JP2010225047A - ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 - Google Patents
ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 Download PDFInfo
- Publication number
- JP2010225047A JP2010225047A JP2009073844A JP2009073844A JP2010225047A JP 2010225047 A JP2010225047 A JP 2010225047A JP 2009073844 A JP2009073844 A JP 2009073844A JP 2009073844 A JP2009073844 A JP 2009073844A JP 2010225047 A JP2010225047 A JP 2010225047A
- Authority
- JP
- Japan
- Prior art keywords
- value
- histogram
- threshold value
- threshold
- frequency distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
【課題】 グラデーションのような画像領域が含まれている場合に、適切な閾値を設定することができなかった。
【解決手段】 矩形領域の検出(S1)では、画像データの中で文字や絵柄が含まれる矩形領域を設定する。矩形領域の特徴値検出(S2)では、各矩形領域のヒストグラムから歪度、尖度、最頻値、中央値、平均値を求める。ヒストグラムの形状判定(S3)では、特徴値をもとにヒストグラムの形状を判定する。矩形領域の閾値設定(S4)では、判定されたヒストグラムの形状に対応した手法で閾値を算出する。二値化(S5)では、設定された閾値を用いて画像を二値化する。本発明は、入力画像の文字や絵柄を矩形領域として検出し、検出した矩形領域内のヒストグラムの形状を五つの類型に判別し、それぞれのヒストグラムの形状に対応した手法で適切な閾値を設定する。
【選択図】 図1
【解決手段】 矩形領域の検出(S1)では、画像データの中で文字や絵柄が含まれる矩形領域を設定する。矩形領域の特徴値検出(S2)では、各矩形領域のヒストグラムから歪度、尖度、最頻値、中央値、平均値を求める。ヒストグラムの形状判定(S3)では、特徴値をもとにヒストグラムの形状を判定する。矩形領域の閾値設定(S4)では、判定されたヒストグラムの形状に対応した手法で閾値を算出する。二値化(S5)では、設定された閾値を用いて画像を二値化する。本発明は、入力画像の文字や絵柄を矩形領域として検出し、検出した矩形領域内のヒストグラムの形状を五つの類型に判別し、それぞれのヒストグラムの形状に対応した手法で適切な閾値を設定する。
【選択図】 図1
Description
本発明は、ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体に関する。
特許文献1に開示される従来技術では、原稿の二値化画像から文字領域を含む複数の領域に分割し、文字領域が適切に二値化されているかどうか判定を行い、その判定結果により文字領域の二値化が不適切である場合は、その文字領域を再度二値化する。
より具体的には、この技術では以下の処理を行う。
1.領域の判定方法としては、二値化画像から検出した黒画素を中心とする周辺の8画素を連結した周辺8連結を走査していく。連結した一つの塊の大きさを判定値に用いており、各領域を文字またはそれ以外の絵(図)、表(枠)、線といったものに分割する。
2.1の処理で文字以外と判定された領域については、縦長、横長、斜め線状の場合、線として判定する。
3.2の処理で線と判定されなかった場合は、領域の輪郭が四角形であるかないかで四角形でない場合は、絵(図)として判定する。
4.3の処理にて絵(図)以外と判定された領域は領域内の白画素塊が四角形である場合は表(枠)として判断し、それ以外の場合は絵(図)として判定する。
5.1〜4の処理にて文字、絵(図)領域と判定されたものの集合を文字領域とし、その領域内の小さな黒画素塊をノイズと考え、そのノイズ塊の高さ平均を求める。
6.5の処理で求めたノイズ塊の高さ平均を用いて、小黒画素塊、大黒画素塊に分類する。
7.以下の条件を満たす場合、文字領域に再二値化が必要であると判断する。
・大黒画素塊に対する小黒画素塊の個数が所定の割合以上である。
・大黒画素塊に隣りあう全ての小黒画素塊の水平距離が全て所定値以下である。
・ノイズ塊の数が所定値以上である。
8.7の処理にて再二値化が必要な場合は、文字色と背景色のピークを検出し、それらが最も良く分離できる値を閾値とする。
これによりグラデーション等の二値化結果が良好に得られるとされている。
1.領域の判定方法としては、二値化画像から検出した黒画素を中心とする周辺の8画素を連結した周辺8連結を走査していく。連結した一つの塊の大きさを判定値に用いており、各領域を文字またはそれ以外の絵(図)、表(枠)、線といったものに分割する。
2.1の処理で文字以外と判定された領域については、縦長、横長、斜め線状の場合、線として判定する。
3.2の処理で線と判定されなかった場合は、領域の輪郭が四角形であるかないかで四角形でない場合は、絵(図)として判定する。
4.3の処理にて絵(図)以外と判定された領域は領域内の白画素塊が四角形である場合は表(枠)として判断し、それ以外の場合は絵(図)として判定する。
5.1〜4の処理にて文字、絵(図)領域と判定されたものの集合を文字領域とし、その領域内の小さな黒画素塊をノイズと考え、そのノイズ塊の高さ平均を求める。
6.5の処理で求めたノイズ塊の高さ平均を用いて、小黒画素塊、大黒画素塊に分類する。
7.以下の条件を満たす場合、文字領域に再二値化が必要であると判断する。
・大黒画素塊に対する小黒画素塊の個数が所定の割合以上である。
・大黒画素塊に隣りあう全ての小黒画素塊の水平距離が全て所定値以下である。
・ノイズ塊の数が所定値以上である。
8.7の処理にて再二値化が必要な場合は、文字色と背景色のピークを検出し、それらが最も良く分離できる値を閾値とする。
これによりグラデーション等の二値化結果が良好に得られるとされている。
上述した特許文献1の技術においては、上記1〜7の処理を行なうもののグラデーションのような画像を適切に二値化することはできない。
グラデーションのような画像は段階的に濃度が変化しているため、ある一定の閾値で二値化した場合、閾値以上と閾値以下の境目がはっきりする。従来技術のような判定では、縦長、横長、四角形などに領域画判定されて、線や表(枠)などに判定されてしまい、必ずしも適切な結果とはならない。例えば、黒枠線で囲まれたグラデーションのような画像において、特に顕著である。
グラデーションのような画像は段階的に濃度が変化しているため、ある一定の閾値で二値化した場合、閾値以上と閾値以下の境目がはっきりする。従来技術のような判定では、縦長、横長、四角形などに領域画判定されて、線や表(枠)などに判定されてしまい、必ずしも適切な結果とはならない。例えば、黒枠線で囲まれたグラデーションのような画像において、特に顕著である。
また、グラデーションの画像領域において再二値化が必要であると判断された場合も、文字色と背景色のピークを検出し、それらが最も良く分離できる値を閾値とする方法や周知の方法を使用することが示されている。
しかし、グラデーションの画像領域のヒストグラムは段階的な濃度変化であるため、細かなピークがある山なりのヒストグラムになる。そのため、文字と背景を分離するようなピークの検出は難しい。
しかし、グラデーションの画像領域のヒストグラムは段階的な濃度変化であるため、細かなピークがある山なりのヒストグラムになる。そのため、文字と背景を分離するようなピークの検出は難しい。
一方、周知の方法としてPタイル法、モード法や判別分析法が知られているが、上記のグラデーションのようなヒストグラムについて適切な閾値を求めることは難しい。
さらに、対象とするグラデーションの領域における文字が黒文字か白抜き文字かにより、適切な閾値の値は異なるという課題があった。
さらに、対象とするグラデーションの領域における文字が黒文字か白抜き文字かにより、適切な閾値の値は異なるという課題があった。
本発明の目的は、原稿にグラデーションのような画像領域が含まれている場合に適切にグラデーション領域であることを判別し、また、グラデーション領域における黒文字、白抜き文字に関係なく適切な閾値を設定することにある。
上記課題を解決するため、本発明においては、上記画像データにおける所定の領域を処理対象として設定する処理対象設定手段と、
上記画像データにおける上記設定された領域を対象として各画素の階調値の度数分布を求める度数分布取得手段と、
上記度数分布の度数分布状況にもとづき、同度数分布の形状として歪度を求める形状判定手段と、
判定された度数分布の形状に対応づけられた手法で上記閾値を設定する閾値設定手段と、
上記閾値を利用して上記画像データから不要な成分を除去するノイズ成分除去手段とを具備する構成としてある。
上記画像データにおける上記設定された領域を対象として各画素の階調値の度数分布を求める度数分布取得手段と、
上記度数分布の度数分布状況にもとづき、同度数分布の形状として歪度を求める形状判定手段と、
判定された度数分布の形状に対応づけられた手法で上記閾値を設定する閾値設定手段と、
上記閾値を利用して上記画像データから不要な成分を除去するノイズ成分除去手段とを具備する構成としてある。
上記のように構成した本発明においては、処理対象設定手段が上記画像データにおける所定の領域を処理対象として設定すると、度数分布取得手段は上記画像データにおける上記設定された領域を対象として各画素の階調値の度数分布を求める。そして、形状判定手段が上記度数分布の度数分布状況にもとづいて同度数分布の形状として歪度を求めると、閾値設定手段は判定された度数分布の形状に対応づけられた手法で上記閾値を設定し、ノイズ成分除去手段が上記閾値を利用して上記画像データから不要な成分を除去する。
本発明の他の態様においては、上記形状判定手段は、上記歪度として度数分布における左右の非対称性の指標を求める構成としてある。
上記のように構成した本態様においては、形状判定手段は上記度数分布における分布状況の形状を判定するにあたり、度数分布における左右の非対称性の指標を歪度として求める。
上記のように構成した本態様においては、形状判定手段は上記度数分布における分布状況の形状を判定するにあたり、度数分布における左右の非対称性の指標を歪度として求める。
本発明の他の態様においては、上記形状判定手段は、上記度数分布の度数分布状況にもとづいて尖度を求め、
上記閾値設定手段は、形状判定手段で求められた尖度と上記歪度とに対応づけられた手法で上記閾値を設定する構成としてある。
上記のように構成した本態様においては、形状判定手段は、上記度数分布の度数分布状況にもとづいて上記歪度に加えて尖度を求め、閾値設定手段は求められた尖度と歪度とに対応づけられた手法で上記閾値を設定する。
上記閾値設定手段は、形状判定手段で求められた尖度と上記歪度とに対応づけられた手法で上記閾値を設定する構成としてある。
上記のように構成した本態様においては、形状判定手段は、上記度数分布の度数分布状況にもとづいて上記歪度に加えて尖度を求め、閾値設定手段は求められた尖度と歪度とに対応づけられた手法で上記閾値を設定する。
本発明の他の態様においては、上記形状判定手段は、上記尖度として正規分布と対比した分布の尖り具合の指標を求める構成としてある。
上記のように構成した本態様においては、形状判定手段は上記度数分布における分布状況の形状を判定するにあたり、正規分布と対比した分布の尖り具合の指標を求める。
上記のように構成した本態様においては、形状判定手段は上記度数分布における分布状況の形状を判定するにあたり、正規分布と対比した分布の尖り具合の指標を求める。
本発明の他の態様においては、上記形状判定手段は、上記画像データにおける階調値の平均値と最頻値とを求め、
上記閾値設定手段は、求められた平均値と最頻値との差異が所定の値より大きいときに対応した手法で上記閾値を算出する構成としてある。
上記のように構成した本態様においては、形状判定手段は、上記歪度などに加え、上記画像データにおける階調値の平均値と最頻値とを求め、閾値設定手段は、求められた平均値と最頻値との差異が所定の値より大きいときに対応した手法で上記閾値を算出する。
上記閾値設定手段は、求められた平均値と最頻値との差異が所定の値より大きいときに対応した手法で上記閾値を算出する構成としてある。
上記のように構成した本態様においては、形状判定手段は、上記歪度などに加え、上記画像データにおける階調値の平均値と最頻値とを求め、閾値設定手段は、求められた平均値と最頻値との差異が所定の値より大きいときに対応した手法で上記閾値を算出する。
本発明の他の態様においては、上記形状判定手段は、上記画像データにおける階調値の平均値と最頻値とを求め、
上記閾値設定手段は、求められた平均値と最頻値との差異が所定の値より小さいときに対応した手法で上記閾値を算出する構成としてある。
上記のように構成した本態様においては、形状判定手段は、上記歪度などに加え、上記画像データにおける階調値の平均値と最頻値とを求め、閾値設定手段は、求められた平均値と最頻値との差異が所定の値より小さいときに対応した手法で上記閾値を算出する。
上記閾値設定手段は、求められた平均値と最頻値との差異が所定の値より小さいときに対応した手法で上記閾値を算出する構成としてある。
上記のように構成した本態様においては、形状判定手段は、上記歪度などに加え、上記画像データにおける階調値の平均値と最頻値とを求め、閾値設定手段は、求められた平均値と最頻値との差異が所定の値より小さいときに対応した手法で上記閾値を算出する。
本発明の他の態様においては、上記閾値設定手段は、上記画像データを対象として階調値が大きく変化する境界領域を検出するとともに、上記境界領域における明度の高い側の画素の階調値の平均値を取得し、かつ、上記領域内の平均値と対比し、同対比結果に対応した手法で上記閾値を算出する構成としてある。
上記のように構成した本態様においては、閾値設定手段は、上記画像データを対象として階調値が大きく変化する境界領域を検出するとともに、上記境界領域における明度の高い側の画素の階調値の平均値を取得し、かつ、上記領域内の平均値と対比し、同対比結果に対応した手法で上記閾値を算出する。
上記のように構成した本態様においては、閾値設定手段は、上記画像データを対象として階調値が大きく変化する境界領域を検出するとともに、上記境界領域における明度の高い側の画素の階調値の平均値を取得し、かつ、上記領域内の平均値と対比し、同対比結果に対応した手法で上記閾値を算出する。
本発明の他の態様においては、上記画像データにおける所定の領域を処理対象として設定する処理対象設定ステップと、
上記画像データにおける上記設定された領域を対象として各画素の階調値の度数分布を求める度数分布取得ステップと、
上記度数分布の度数分布状況にもとづき、同度数分布の形状として歪度を求める形状判定ステップと、
判定された度数分布の形状に対応づけられた手法で上記閾値を設定する閾値設定ステップと、
上記閾値を利用して上記画像データから不要な成分を除去するノイズ成分除去ステップとを具備する構成としてある。
上記画像データにおける上記設定された領域を対象として各画素の階調値の度数分布を求める度数分布取得ステップと、
上記度数分布の度数分布状況にもとづき、同度数分布の形状として歪度を求める形状判定ステップと、
判定された度数分布の形状に対応づけられた手法で上記閾値を設定する閾値設定ステップと、
上記閾値を利用して上記画像データから不要な成分を除去するノイズ成分除去ステップとを具備する構成としてある。
上記のように構成した本態様においては、処理対象設定ステップにて上記画像データにおける所定の領域を処理対象として設定すると、度数分布取得ステップでは上記画像データにおける上記設定された領域を対象として各画素の階調値の度数分布を求める。そして、形状判定ステップにて上記度数分布の度数分布状況にもとづいて同度数分布の形状として歪度を求めると、閾値設定ステップでは判定された度数分布の形状に対応づけられた手法で上記閾値を設定し、ノイズ成分除去ステップにて上記閾値を利用して上記画像データから不要な成分を除去する。
むろん、その記録媒体は、磁気記録媒体であってもよいし光磁気記録媒体であってもよいし、今後開発されるいかなる記録媒体においても全く同様に考えることができる。また、一次複製品、二次複製品などの複製段階については全く問う余地無く同等である。その他、供給方法として通信回線を利用して行なう場合でも本発明が利用されていることにはかわりない。
さらに、一部がソフトウェアであって、一部がハードウェアで実現されている場合においても発明の思想において全く異なるものではなく、一部を記録媒体上に記憶しておいて必要に応じて適宜読み込まれるような形態のものとしてあってもよい。
さらに、一部がソフトウェアであって、一部がハードウェアで実現されている場合においても発明の思想において全く異なるものではなく、一部を記録媒体上に記憶しておいて必要に応じて適宜読み込まれるような形態のものとしてあってもよい。
本発明をソフトウェアで実現する場合、ハードウェアやオペレーティングシステムを利用する構成とすることも可能であるし、これらと切り離して実現することもできる。例えば、各種の演算処理といっても、その実現方法はオペレーティングシステムにおける所定の関数を呼び出して処理することも可能であれば、このような関数を呼び出すことなくハードウェアから入力することも可能である。そして、実際にはオペレーティングシステムの介在のもとで実現するとしても、プログラムが媒体に記録されて流通される過程においては、このプログラムだけで本発明を実施できるものと理解することができる。
また、本発明をソフトウェアで実施する場合、発明がプログラムを記録した媒体として実現されるのみならず、本発明がプログラム自体として実現されるのは当然であり、プログラム自体も本発明に含まれる。
上記のように構成した本発明によれば、文字などを含む領域では、その階調の度数分布状況に特徴が見られ、その形状を判定することで適切な二値化を設定できる。
また、請求項2の発明によれば、形状判定に利用する歪度を容易に求めることができる また、請求項3の発明によれば、歪度に加えて尖度も利用することにより、形状判定の対応度合いを上げて、より適切な閾値を設定することができる。
また、請求項2の発明によれば、形状判定に利用する歪度を容易に求めることができる また、請求項3の発明によれば、歪度に加えて尖度も利用することにより、形状判定の対応度合いを上げて、より適切な閾値を設定することができる。
また、請求項4の発明によれば、形状判定に利用する尖度を容易に求めることができる。
また、請求項5の発明によれば、歪度などに加えて平均値と最頻値とを利用することにより、形状判定の対応度合いを上げて、より適切な閾値を設定することができる。
また、請求項6の発明によれば、歪度などに加えて平均値と最頻値とを利用することにより、形状判定の対応度合いを上げて、より適切な閾値を設定することができる。
また、請求項5の発明によれば、歪度などに加えて平均値と最頻値とを利用することにより、形状判定の対応度合いを上げて、より適切な閾値を設定することができる。
また、請求項6の発明によれば、歪度などに加えて平均値と最頻値とを利用することにより、形状判定の対応度合いを上げて、より適切な閾値を設定することができる。
また、請求項7の発明によれば、上記境界領域における明度の高い側の画素である白いエッジは、黒い文字(黒文字)あるいは白抜きの文字(白文字)に関する情報を有しているおり、形状判定の一つとしてその階調値の平均値を取得しつつ元の画像データの平均値と対比することにより、例えばグラデーションにおける黒文字、グラデーションにおける白文字を判定することできる。そして、それぞれに適切な閾値を算出する。
また、請求項8の発明によれば、文字などを含む領域では、その階調の度数分布状況に特徴が見られ、その形状を判定することで適切な二値化を設定できる。
また、請求項8の発明によれば、文字などを含む領域では、その階調の度数分布状況に特徴が見られ、その形状を判定することで適切な二値化を設定できる。
以下、図面を参照しながら、本発明の実施の形態について、詳細に説明する。
図1は、ノイズ成分除去処理のフローチャートである。
同図は、メインルーチンとして、矩形領域の検出(S1)、矩形領域の特徴値検出(S2)、ヒストグラムの形状判定(S3)、矩形領域の閾値設定(S4)、二値化(S5)の各処理を示している。
図1は、ノイズ成分除去処理のフローチャートである。
同図は、メインルーチンとして、矩形領域の検出(S1)、矩形領域の特徴値検出(S2)、ヒストグラムの形状判定(S3)、矩形領域の閾値設定(S4)、二値化(S5)の各処理を示している。
次に、これらについて説明する。
矩形領域の検出(S1)は、画像データの中で文字や絵柄が含まれる矩形領域を設定する処理である。矩形領域の特徴値検出(S2)は、各矩形領域のヒストグラムから歪度、尖度、最頻値、中央値、平均値を求める処理である。ヒストグラムの形状判定(S3)は、特徴値をもとにヒストグラムの形状を判定する処理である。矩形領域の閾値設定(S4)は、判定されたヒストグラムの形状に対応した手法で閾値を算出する処理である。二値化(S5)は、設定された閾値を用いて画像を二値化する処理である。
矩形領域の検出(S1)は、画像データの中で文字や絵柄が含まれる矩形領域を設定する処理である。矩形領域の特徴値検出(S2)は、各矩形領域のヒストグラムから歪度、尖度、最頻値、中央値、平均値を求める処理である。ヒストグラムの形状判定(S3)は、特徴値をもとにヒストグラムの形状を判定する処理である。矩形領域の閾値設定(S4)は、判定されたヒストグラムの形状に対応した手法で閾値を算出する処理である。二値化(S5)は、設定された閾値を用いて画像を二値化する処理である。
次に、これらの関係について説明する。
矩形領域の検出(S1)にて検出された各矩形領域毎に、矩形領域の特徴値検出(S2)はヒストグラムを作成し、同ヒストグラムを利用して形状判定に利用する特徴値を取得する。矩形領域の特徴値検出(S2)にて各矩形領域毎に特徴値を取得した後、ヒストグラムの形状判定(S3)では同特徴値を利用してヒストグラムの形状判定(S3)を行う。ヒストグラムの形状判定(S3)により各矩形領域毎にヒストグラムの形状が判定されるので、矩形領域の閾値設定(S4)では判定された形状に対応した手法で閾値を設定する。矩形領域の閾値設定(S4)にて設定された閾値を利用し、二値化(S5)では、取得して画像データを二値化する。
矩形領域の検出(S1)にて検出された各矩形領域毎に、矩形領域の特徴値検出(S2)はヒストグラムを作成し、同ヒストグラムを利用して形状判定に利用する特徴値を取得する。矩形領域の特徴値検出(S2)にて各矩形領域毎に特徴値を取得した後、ヒストグラムの形状判定(S3)では同特徴値を利用してヒストグラムの形状判定(S3)を行う。ヒストグラムの形状判定(S3)により各矩形領域毎にヒストグラムの形状が判定されるので、矩形領域の閾値設定(S4)では判定された形状に対応した手法で閾値を設定する。矩形領域の閾値設定(S4)にて設定された閾値を利用し、二値化(S5)では、取得して画像データを二値化する。
本発明は、文字認識のための前処理という位置づけにある。例えば、文字を印刷した書類などをスキャナーなどで多値画像で読み込んだり、風景の中に文字が含まれる写真の画像データなどを処理対象とする。入力が直にスキャナーやデジタルスチルカメラなどである必要はなく、他の機器で取得された画像データを通信によって取得する場合でも全く同様である。文字認識には、いわゆる文字だけでなく、記号等の認識も当然に含まれる。
このような文字認識では処理対象とする画像データが文字部分と背景とに明確に分離されているほど認識効率が良いため、文字以外の成分をノイズ成分として除去する本発明の処理が利用される。
このような文字認識では処理対象とする画像データが文字部分と背景とに明確に分離されているほど認識効率が良いため、文字以外の成分をノイズ成分として除去する本発明の処理が利用される。
各処理の詳細については、順次説明する。
本発明の原理は、入力画像の文字や絵柄を矩形領域として検出し、検出した矩形領域内のヒストグラムの形状を双峰型のヒストグラム、グラデーションにおける黒文字のヒストグラム、グラデーションにおける白文字のヒストグラム、右肩上がりのヒストグラム、左肩上がりのヒストグラムに判別し、それぞれのヒストグラムの形状に対応した手法で適切な閾値を設定する。
本発明の原理は、入力画像の文字や絵柄を矩形領域として検出し、検出した矩形領域内のヒストグラムの形状を双峰型のヒストグラム、グラデーションにおける黒文字のヒストグラム、グラデーションにおける白文字のヒストグラム、右肩上がりのヒストグラム、左肩上がりのヒストグラムに判別し、それぞれのヒストグラムの形状に対応した手法で適切な閾値を設定する。
図2は、矩形領域の検出を説明する図である。
矩形領域を検出する手法としては、ある一定の閾値で二値化した画像またはエッジ画像(エッジとそれ以外の画素とを二値で示した画像)についてラベリングまたは輪郭追跡を行うことにより検出された領域の外接矩形を設定する方法が知られている。
本図では、矩形領域の検出を行った場合の模式図を示している。
同図は上下二段に図を並べており、上段には左右に図を二つ並べて示している。上段左方が多値の入力画像のイメージを示しており、まず、一定の閾値で単純二値化する。二値化後のイメージを上段右方に示している。さらに、この二値化後の画像データを処理対象として輪郭追跡し、概説矩形を取得すると、下段に示すイメージの矩形領域を設定できる。
矩形領域を検出する手法としては、ある一定の閾値で二値化した画像またはエッジ画像(エッジとそれ以外の画素とを二値で示した画像)についてラベリングまたは輪郭追跡を行うことにより検出された領域の外接矩形を設定する方法が知られている。
本図では、矩形領域の検出を行った場合の模式図を示している。
同図は上下二段に図を並べており、上段には左右に図を二つ並べて示している。上段左方が多値の入力画像のイメージを示しており、まず、一定の閾値で単純二値化する。二値化後のイメージを上段右方に示している。さらに、この二値化後の画像データを処理対象として輪郭追跡し、概説矩形を取得すると、下段に示すイメージの矩形領域を設定できる。
なお、二値化の閾値については画像全体のヒストグラムのピークを背景領域の濃度分布と考え、そのピークに一番近い谷を領域分離の二値化閾値として用いている。
また、先にエッジ画素を検出してその結果をエッジ画像とし、このエッジ画像について輪郭追跡を行なって外接矩形領域を検出して各矩形領域を設定することもできる。
本実施例ではこの手法で矩形領域を設定する。
また、先にエッジ画素を検出してその結果をエッジ画像とし、このエッジ画像について輪郭追跡を行なって外接矩形領域を検出して各矩形領域を設定することもできる。
本実施例ではこの手法で矩形領域を設定する。
図3は、左肩上がりのヒストグラムを説明する図である。
ここで、矩形領域の特徴値検出(S2)について説明する。矩形領域の特徴値検出(S2)では、各矩形領域ごとにヒストグラム(度数分布)を求める工程と、求められたヒストグラムから歪度、尖度、最頻値、中央値、平均値を求める工程とからなる。なお、これらは必ずしもヒストグラムを求める工程を必須とするものでもない。
すなわち、歪度と尖度は、矩形領域内の総画素数、各画素の階調値、階調値の平均値、標準偏差が分かれば求められる。中央値はヒストグラムから求めるのが最も容易であるが、必須ではない。平均値は総画素数と各画素の階調値とから求められる。
ここで、矩形領域の特徴値検出(S2)について説明する。矩形領域の特徴値検出(S2)では、各矩形領域ごとにヒストグラム(度数分布)を求める工程と、求められたヒストグラムから歪度、尖度、最頻値、中央値、平均値を求める工程とからなる。なお、これらは必ずしもヒストグラムを求める工程を必須とするものでもない。
すなわち、歪度と尖度は、矩形領域内の総画素数、各画素の階調値、階調値の平均値、標準偏差が分かれば求められる。中央値はヒストグラムから求めるのが最も容易であるが、必須ではない。平均値は総画素数と各画素の階調値とから求められる。
以下に、歪度、尖度の公式を示す。これらは統計学で使用される値である。
歪度は、度数分布の左右の非対称性の指標を定義する値である。
歪度が正の場合は値が大きいほどヒストグラムの右の裾野が長く、負の場合は値が小さいほどヒストグラムの左の裾野が長いことを示す。
歪度は、度数分布の左右の非対称性の指標を定義する値である。
歪度が正の場合は値が大きいほどヒストグラムの右の裾野が長く、負の場合は値が小さいほどヒストグラムの左の裾野が長いことを示す。
尖度は、正規分布を基準とした度数分布の尖り具合を定義する値である。
尖度が正の場合はヒストグラムが正規分布に比べ尖っていることを示し、負の場合は反対に平坦であることを示す。
なお、「歪度」、「尖度」の公式におけるnは矩形領域内の総画素数、xiは階調値、μは平均値、Sは標準偏差、iは1,2〜nの整数を示す。
尖度が正の場合はヒストグラムが正規分布に比べ尖っていることを示し、負の場合は反対に平坦であることを示す。
なお、「歪度」、「尖度」の公式におけるnは矩形領域内の総画素数、xiは階調値、μは平均値、Sは標準偏差、iは1,2〜nの整数を示す。
図3〜図7は、矩形領域の検出(S1)で使用した画像と、各矩形領域の特徴値を記している。
各図は上段に全幅方向の第一の領域を有し、下段には左右方向に区切られつつ、左方には上下に区切られた領域を有しており、左方の上段を第二の領域、左方の下段を第三の領域、右方を第四の領域と呼ぶ。そして、第一の領域には、形状判定された名称を示し、第二領域には画像のイメージを示し、第三領域には特徴値のリストを示し、第四領域にはヒストグラムを示している。第三領域では、上方から、平均値、最頻値、中央値、歪度、尖度の順に示している。
各図は上段に全幅方向の第一の領域を有し、下段には左右方向に区切られつつ、左方には上下に区切られた領域を有しており、左方の上段を第二の領域、左方の下段を第三の領域、右方を第四の領域と呼ぶ。そして、第一の領域には、形状判定された名称を示し、第二領域には画像のイメージを示し、第三領域には特徴値のリストを示し、第四領域にはヒストグラムを示している。第三領域では、上方から、平均値、最頻値、中央値、歪度、尖度の順に示している。
なお、ヒストグラムの横軸は階調値を示し、「0〜255」はデータを8bitで扱った場合を想定している。階調値と明るさは、階調値「0」が最も暗く、「255」に近づくほど画像が明るくなっていく関係にある。また、縦軸は矩形領域内の画素が示す階調値の度数を示しており、各図において各升目ごとに同数の画素数として記している。
図3は左肩上がりのヒストグラム(S25)と形状判定される矩形領域についての図を示している。画像は、下地が濃いめで、白抜きの文字を有している。ヒストグラムは下地成分を反映して暗い側に一つの大きなピークを有し、白抜きの文字を反映して明るい側に一つの小さなピークを有している。
図3は左肩上がりのヒストグラム(S25)と形状判定される矩形領域についての図を示している。画像は、下地が濃いめで、白抜きの文字を有している。ヒストグラムは下地成分を反映して暗い側に一つの大きなピークを有し、白抜きの文字を反映して明るい側に一つの小さなピークを有している。
図4は、右肩上がりのヒストグラムと形状判定される矩形領域についての図を示している。画像は、下地が薄目で、黒文字を有している。ヒストグラムは薄目の下地成分を反映して明るい一つの大きなピークを有し、黒文字を反映して暗い側に複数の小さめのピークを有している。
図5は、双峰型のヒストグラムと形状判定される矩形領域についての図を示している。画像は、下地がほとんど無く、黒文字だけを有している。ヒストグラムは紙色成分を反映して暗い側に一つの大きなピークを有し、黒文字を反映して明るい側に一つの大きめピークを有している。
図5は、双峰型のヒストグラムと形状判定される矩形領域についての図を示している。画像は、下地がほとんど無く、黒文字だけを有している。ヒストグラムは紙色成分を反映して暗い側に一つの大きなピークを有し、黒文字を反映して明るい側に一つの大きめピークを有している。
図6は、グラデーションにおける黒文字のヒストグラムと形状判定される矩形領域についての図を示している。画像は、背景のグラデーションを反映して暗い側から明るい側にわたって広く分布している。しかし、後述するように白文字か黒文字かの判定結果によって、着目すべき谷が異なっている。黒文字の場合は、ヒストグラムの左の端の谷に着目する。
図7は、グラデーションにおける白文字のヒストグラムと形状判定される矩形領域についての図を示している。画像は、背景のグラデーションを反映して暗い側から明るい側にわたって広く分布している。しかし、後述するように白抜きの文字か、黒文字かの判定結果によって、着目すべき谷が異なっている。白文字の場合は、ヒストグラムの右の端の谷に着目する。
図7は、グラデーションにおける白文字のヒストグラムと形状判定される矩形領域についての図を示している。画像は、背景のグラデーションを反映して暗い側から明るい側にわたって広く分布している。しかし、後述するように白抜きの文字か、黒文字かの判定結果によって、着目すべき谷が異なっている。白文字の場合は、ヒストグラムの右の端の谷に着目する。
図8は、ヒストグラムの形状判定のフローチャートである。
同図は、ヒストグラムの形状判定ルーチンとして、歪度と尖度の閾値との対比(S21)、中央値と平均値の差と閾値との対比(S22)、最頻値と平均値との対比(S23)、右肩上がりのヒストグラム(S24)、左肩上がりのヒストグラム(S25)、グラデーションのヒストグラム(S26)、双峰型のヒストグラム(S27)の各処理を示している。
同図は、ヒストグラムの形状判定ルーチンとして、歪度と尖度の閾値との対比(S21)、中央値と平均値の差と閾値との対比(S22)、最頻値と平均値との対比(S23)、右肩上がりのヒストグラム(S24)、左肩上がりのヒストグラム(S25)、グラデーションのヒストグラム(S26)、双峰型のヒストグラム(S27)の各処理を示している。
次に、これらについて説明する。
歪度と尖度の閾値との対比(S21)は、歪度と尖度について絶対値を閾値と対比する処理である。中央値と平均値の差と閾値との対比(S22)は、中央値と平均値の差の絶対値を求め、閾値と対比する処理である。最頻値と平均値との対比(S23)は、最頻値と平均値とを対比する処理である。右肩上がりのヒストグラム(S24)は、判定結果は右肩上がりのヒストグラムである。左肩上がりのヒストグラム(S25)は、判定結果は左肩上がりのヒストグラムである。グラデーションのヒストグラム(S26)は、判定結果はグラデーションのヒストグラムである。双峰型のヒストグラム(S27)は、判定結果は双峰型のヒストグラムである。
歪度と尖度の閾値との対比(S21)は、歪度と尖度について絶対値を閾値と対比する処理である。中央値と平均値の差と閾値との対比(S22)は、中央値と平均値の差の絶対値を求め、閾値と対比する処理である。最頻値と平均値との対比(S23)は、最頻値と平均値とを対比する処理である。右肩上がりのヒストグラム(S24)は、判定結果は右肩上がりのヒストグラムである。左肩上がりのヒストグラム(S25)は、判定結果は左肩上がりのヒストグラムである。グラデーションのヒストグラム(S26)は、判定結果はグラデーションのヒストグラムである。双峰型のヒストグラム(S27)は、判定結果は双峰型のヒストグラムである。
次に、これらの関係について説明する。
歪度と尖度の閾値との対比(S21)にて、歪度の絶対値が第一の閾値よりも大きく、かつ、尖度の絶対値が第二の閾値よりも大きいと判断される場合には、中央値と平均値の差と閾値との対比(S22)にて、中央値と平均値との差を求めつつ、同差が第三の閾値よりも小さいか判断する。歪度と尖度の閾値との対比(S21)にて、歪度の絶対値が第一の閾値よりも大きくなく、あるいは、尖度の絶対値が第二の閾値よりも大きくないと判断される場合には、最頻値と平均値との対比(S23)にて、最頻値が平均値よりも大きいか判断する。中央値と平均値の差と閾値との対比(S22)により、中央値と平均値との差を求めつつ、同差が第三の閾値よりも小さいと判断された場合には、グラデーションのヒストグラム(S26)にて、ヒストグラムがグラデーションの形状と判定する。中央値と平均値の差と閾値との対比(S22)にて、中央値と平均値との差を求めつつ、同差が第三の閾値よりも小さくないと判断された場合には、双峰型のヒストグラム(S27)にてヒストグラムが双峰型の形状と判定する。最頻値と平均値との対比(S23)にて、最頻値が平均値よりも大きいと判断された場合には、右肩上がりのヒストグラム(S24)にて、ヒストグラムが右肩上がりの形状と判定する。最頻値と平均値との対比(S23)にて、最頻値が平均値よりも大きくないと判断された場合には、左肩上がりのヒストグラム(S25)にて、ヒストグラムが左肩上がりの形状と判定する。
歪度と尖度の閾値との対比(S21)にて、歪度の絶対値が第一の閾値よりも大きく、かつ、尖度の絶対値が第二の閾値よりも大きいと判断される場合には、中央値と平均値の差と閾値との対比(S22)にて、中央値と平均値との差を求めつつ、同差が第三の閾値よりも小さいか判断する。歪度と尖度の閾値との対比(S21)にて、歪度の絶対値が第一の閾値よりも大きくなく、あるいは、尖度の絶対値が第二の閾値よりも大きくないと判断される場合には、最頻値と平均値との対比(S23)にて、最頻値が平均値よりも大きいか判断する。中央値と平均値の差と閾値との対比(S22)により、中央値と平均値との差を求めつつ、同差が第三の閾値よりも小さいと判断された場合には、グラデーションのヒストグラム(S26)にて、ヒストグラムがグラデーションの形状と判定する。中央値と平均値の差と閾値との対比(S22)にて、中央値と平均値との差を求めつつ、同差が第三の閾値よりも小さくないと判断された場合には、双峰型のヒストグラム(S27)にてヒストグラムが双峰型の形状と判定する。最頻値と平均値との対比(S23)にて、最頻値が平均値よりも大きいと判断された場合には、右肩上がりのヒストグラム(S24)にて、ヒストグラムが右肩上がりの形状と判定する。最頻値と平均値との対比(S23)にて、最頻値が平均値よりも大きくないと判断された場合には、左肩上がりのヒストグラム(S25)にて、ヒストグラムが左肩上がりの形状と判定する。
ヒストグラムの形状判定(S3)について説明する。このヒストグラムの形状判定(S3)では、矩形領域の特徴値検出(S2)で求めた各特徴値をもとにヒストグラムの形状を判定する。
図3に示す左肩上がりのヒストグラムの場合は、歪度が「1.941」であり、尖度が「1.946」である。第一の閾値(閾値1)として、「1.5」、第二の閾値として「1.5」として設定してあれば、歪度の絶対値が閾値1よりも大きく、かつ、尖度の絶対値が閾値2よりも大きいことになるので、処理S21にてYesと判定される。
次に、最頻値は「61」であり、平均値は「85」である。このため、処理21にてNoと判定され、処理(S25)において左肩上がりのヒストグラムと形状判定される。なお、同処理では後述する閾値設定のために判定結果を示すフラグをオンにするといった処理を行う。
次に、最頻値は「61」であり、平均値は「85」である。このため、処理21にてNoと判定され、処理(S25)において左肩上がりのヒストグラムと形状判定される。なお、同処理では後述する閾値設定のために判定結果を示すフラグをオンにするといった処理を行う。
図4に示す右肩上がりのヒストグラムの場合は、歪度の絶対値が「2.509」であり、尖度が「5.120」である。上述した第一の閾値(閾値1)と第二の閾値との対比の結果、歪度の絶対値が閾値1よりも大きく、かつ、尖度の絶対値が閾値2よりも大きいことになるので、処理S21にてYesと判定される。
次に、最頻値は「211」であり、平均値は「194」である。このため、処理21にてYesと判定され、処理(S24)において右肩上がりのヒストグラムと形状判定される。同処理では判定結果を示すフラグをオンにする。
次に、最頻値は「211」であり、平均値は「194」である。このため、処理21にてYesと判定され、処理(S24)において右肩上がりのヒストグラムと形状判定される。同処理では判定結果を示すフラグをオンにする。
図5に示す双峰型のヒストグラムの場合は、歪度の絶対値が「0.315」であり、尖度の絶対値が「0.315」である。上述した第一の閾値(閾値1)と第二の閾値との対比の結果、歪度の絶対値が閾値1よりも小さく、また、尖度の絶対値が閾値2よりも小さいことになるので、処理S21にてNoと判定され、処理S22の判定を行う。
処理S22では、中央値と平均値との差の絶対値と、第三の閾値(閾値3)と対比する。中央値は「238」であり、平均値は「158」であるから、差は「80」となり、閾値3として「50」を設定している場合、対比の結果はNoと判定され、処理(S27)にて双峰型のヒストグラムと形状判定される。同処理では判定結果を示すフラグをオンにする。
処理S22では、中央値と平均値との差の絶対値と、第三の閾値(閾値3)と対比する。中央値は「238」であり、平均値は「158」であるから、差は「80」となり、閾値3として「50」を設定している場合、対比の結果はNoと判定され、処理(S27)にて双峰型のヒストグラムと形状判定される。同処理では判定結果を示すフラグをオンにする。
図6に示すグラデーションにおける黒文字のヒストグラムの場合は、歪度の絶対値が「0.322」であり、尖度の絶対値が「1.068」である。上述した第一の閾値(閾値1)と第二の閾値との対比の結果、歪度の絶対値が閾値1よりも小さく、また、尖度の絶対値が閾値2よりも小さいことになるので、処理S21にてNoと判定され、処理S22の判定を行う。
中央値は「99」であり、平均値は「106」であるから、差は「7」となり、閾値3として「50」を設定している場合、処理22での対比の結果はYesと判定され、処理(S28)にてグラデーションのヒストグラムと形状判定される。
中央値は「99」であり、平均値は「106」であるから、差は「7」となり、閾値3として「50」を設定している場合、処理22での対比の結果はYesと判定され、処理(S28)にてグラデーションのヒストグラムと形状判定される。
また、図7に示すグラデーションにおける白文字のヒストグラムの場合は、歪度の絶対値が「0.369」であり、尖度の絶対値が「0.929」である。上述した第一の閾値(閾値1)と第二の閾値との対比の結果、歪度の絶対値が閾値1よりも小さく、また、尖度の絶対値が閾値2よりも小さいことになるので、処理S21にてNoと判定され、処理S22の判定を行う。
中央値は「105」であり、平均値は「114」であるから、差は「9」となり、閾値3として「50」を設定している場合、処理22での対比の結果はYesと判定され、処理(S28)にてグラデーションのヒストグラムと形状判定される。
中央値は「105」であり、平均値は「114」であるから、差は「9」となり、閾値3として「50」を設定している場合、処理22での対比の結果はYesと判定され、処理(S28)にてグラデーションのヒストグラムと形状判定される。
図9は、グラデーションにおける黒文字と白文字のヒストグラムを説明する図である。引き続き、形状判定について説明する。
同図は、左右方向にグラデーションにおける黒文字の場合と、グラデーションにおける白文字の場合について、分けて説明している。それぞれにおいて、最上段には表題として黒文字と、白文字の区別を表記しており、中段では左方に該当する画像のイメージを記載するとともに、右方には上段に領域内の全ての画素を対象とした階調値のヒストグラムを記載し、下段に領域内の白いエッジに該当する画素だけの階調値を対象としたヒストグラムを記載している。そして、最下段にはそれぞれの判定式を示している。
同図は、左右方向にグラデーションにおける黒文字の場合と、グラデーションにおける白文字の場合について、分けて説明している。それぞれにおいて、最上段には表題として黒文字と、白文字の区別を表記しており、中段では左方に該当する画像のイメージを記載するとともに、右方には上段に領域内の全ての画素を対象とした階調値のヒストグラムを記載し、下段に領域内の白いエッジに該当する画素だけの階調値を対象としたヒストグラムを記載している。そして、最下段にはそれぞれの判定式を示している。
黒文字と判定されるのは、矩形領域内の全画素の階調値の平均値(Hmean)が白いエッジの画素の階調値の平均値(Hmean_W)と等しいか大きい場合である。
一方、白文字と判定されるのは、矩形領域内の全画素の階調値の平均値(Hmean)が白いエッジの画素の階調値の平均値(Hmean_W)よりも小さい場合である。
グラデーションのヒストグラムの処理(S26)では、この対比を行なうことで、グラデーションのヒストグラムについて、黒文字と白文字の区別の判定を行う。
一方、白文字と判定されるのは、矩形領域内の全画素の階調値の平均値(Hmean)が白いエッジの画素の階調値の平均値(Hmean_W)よりも小さい場合である。
グラデーションのヒストグラムの処理(S26)では、この対比を行なうことで、グラデーションのヒストグラムについて、黒文字と白文字の区別の判定を行う。
同処理では、グラデーションのヒストグラムについて、矩形領域内の白エッジのヒストグラムの平均値を求める処理と、この白いエッジの平均値と矩形領域内の全体の平均値とを対比する処理とを実行する。そして、両者の大小関係から黒文字か、白文字かを判定する。グラデーションにおける黒文字のヒストグラムなのかグラデーションにおける白文字のヒストグラムなのかを判断する。
ここで、エッジとは隣接あるいは近隣の範囲の画素間で階調値が大きく変化する境界領域と定義づけることができ、さらに白いエッジとは境界領域における明るい側の画素を指す。このようにして判定される白いエッジの画素の階調値について、階調値ごとに画素の度数を求める。
なお、最終的に使用するのは平均値だけであるから、ヒストグラムの作成は必須ではない。
なお、最終的に使用するのは平均値だけであるから、ヒストグラムの作成は必須ではない。
図9で左方に示すグラデーションにおける黒文字のヒストグラムの場合、領域全体の画素の階調値の平均値は「105」であり、白いエッジの画素の階調値の平均値は「99」である。従って、Hmean>Hmean_Wとなり、左方の最下段に示す判定式が成立するので、グラデーションにおける黒文字のヒストグラムと形状判定されることになる。
一方、右方に示すグラデーションにおける白文字のヒストグラムの場合、領域全体の画素の階調値の平均値は「114」であり、白いエッジの画素の階調値の平均値は「189」である。従って、Hmean<Hmean_Wとなり、右方の最下段に示す判定式が成立するので、グラデーションにおける白文字のヒストグラムと形状判定されることになる。
以上の判定が処理(S26)内で行われる。
以上の判定が処理(S26)内で行われる。
このように、ヒストグラムの形状判定(S3)により形状判定が行われるので、矩形領域の閾値設定(S4)では、判定されたヒストグラムの形状に応じた手法で閾値を設定する。
各形状判定結果と閾値の算出手法との対応関係は以下のようにしている。
・双峰型のヒストグラムの場合、二値化閾値は領域内の全画素の階調値の平均値とする。
・グラデーションにおける黒文字のヒストグラムの場合、二値化閾値は、領域内の全画素の階調値のヒストグラムにおける左端の谷の階調値を設定する。
・グラデーションにおける白文字のヒストグラムの場合、二値化閾値は、領域内の全画素の階調値ヒストグラムにおける右端の谷の階調値を設定する。
・右肩上がりのヒストグラムの場合、二値化閾値は、(2×平均値−最頻値)を設定する。
・左肩上がりのヒストグラムの場合、二値化閾値は、(2×平均値−最頻値)を設定する。
・双峰型のヒストグラムの場合、二値化閾値は領域内の全画素の階調値の平均値とする。
・グラデーションにおける黒文字のヒストグラムの場合、二値化閾値は、領域内の全画素の階調値のヒストグラムにおける左端の谷の階調値を設定する。
・グラデーションにおける白文字のヒストグラムの場合、二値化閾値は、領域内の全画素の階調値ヒストグラムにおける右端の谷の階調値を設定する。
・右肩上がりのヒストグラムの場合、二値化閾値は、(2×平均値−最頻値)を設定する。
・左肩上がりのヒストグラムの場合、二値化閾値は、(2×平均値−最頻値)を設定する。
なお、右肩上がりのヒストグラムと左肩上がりのヒストグラムは二値化閾値の算出方法が同じであるため、ヒストグラムの形状判定(S3)にて、「偏りがあるヒストグラム」として同じ判定結果とし、同じ手法で閾値を設定しても良い。
図10は、処理S1〜処理S4を経て求められた閾値を利用して二値化した結果の画像を示している。
同図では左列の上段に濃い下地に白抜きの文字が記載された入力画像の二値化結果を示し、左列の中段には下地のある領域に黒文字が記載された入力画像の二値化結果を示し、左列の下段には下地がほぼ無い領域に黒文字が記載された入力画像の二値化結果を示している。
また、中央列にはグラデーションに黒文字が記載された入力画像の二値化結果を示し、右列にはグラデーションに白抜きの文字が記載された入力画像の二値化結果を示している。
いずれの場合にも、記載されている文字と背景とを正確に区別して二値化、すなわちノイズ成分を除去している。
なお、応用として、上記処理にてエッジ検出の結果を考慮することでより鮮明な二値化結果となる。例えば、小さなフォントサイズ(6ptなど)の文字や込み入った文字の部分では文字のにじみ部分が発生し、文字と背景との境目にちょうど中間的な階調値をもった画素が存在してしまう。しかし、予めエッジ検出処理を実行すると、エッジが強調されて境目に生じる中間的な階調値がなくなる。従って、この後で二値化処理を行うと小さな文字や込み入った部分でも文字部分と背景とを明確に分離することができるようになる。むろん、小さな文字や込み入った部分以外にも同様の効果を奏する部分もあり、単純二値化に加えてエッジ検出の結果を考慮することが有効といえる。
同図では左列の上段に濃い下地に白抜きの文字が記載された入力画像の二値化結果を示し、左列の中段には下地のある領域に黒文字が記載された入力画像の二値化結果を示し、左列の下段には下地がほぼ無い領域に黒文字が記載された入力画像の二値化結果を示している。
また、中央列にはグラデーションに黒文字が記載された入力画像の二値化結果を示し、右列にはグラデーションに白抜きの文字が記載された入力画像の二値化結果を示している。
いずれの場合にも、記載されている文字と背景とを正確に区別して二値化、すなわちノイズ成分を除去している。
なお、応用として、上記処理にてエッジ検出の結果を考慮することでより鮮明な二値化結果となる。例えば、小さなフォントサイズ(6ptなど)の文字や込み入った文字の部分では文字のにじみ部分が発生し、文字と背景との境目にちょうど中間的な階調値をもった画素が存在してしまう。しかし、予めエッジ検出処理を実行すると、エッジが強調されて境目に生じる中間的な階調値がなくなる。従って、この後で二値化処理を行うと小さな文字や込み入った部分でも文字部分と背景とを明確に分離することができるようになる。むろん、小さな文字や込み入った部分以外にも同様の効果を奏する部分もあり、単純二値化に加えてエッジ検出の結果を考慮することが有効といえる。
以上、説明したように、本実施例では、以下の作用と効果を有する。
入力画像の文字や絵柄を矩形領域として検出し、検出した矩形領域内のヒストグラムの形状を判定し文字領域について高精度な二値化閾値を求める。
ヒストグラムの形状には様々ものがあり、文字領域についてその形状を判定することで適切な二値化閾値が設定できる。
入力画像の文字や絵柄を矩形領域として検出し、検出した矩形領域内のヒストグラムの形状を判定し文字領域について高精度な二値化閾値を求める。
ヒストグラムの形状には様々ものがあり、文字領域についてその形状を判定することで適切な二値化閾値が設定できる。
形状の判定は、矩形領域内のヒストグラムの形状をテキストにおける双峰型のヒストグラム、グラデーションにおける黒文字のヒストグラム、グラデーションにおける白文字のヒストグラム、右肩上がりのヒストグラム、左肩上がりのヒストグラムに判別する。
文字領域のヒストグラムとしては、上記した5つに判別することでより適切な二値化の閾値を設定できる。
文字領域のヒストグラムとしては、上記した5つに判別することでより適切な二値化の閾値を設定できる。
ヒストグラムの判別には歪度、尖度、平均値、最頻値、中央値を用いる。
判定値に歪度、尖度、平均値、最頻値、中央値を使用することで双峰型のヒストグラム、グラデーションのヒストグラム、右肩上がりのヒストグラム、左肩上がりのヒストグラムを簡単に判別できる。
さらに、矩形領域内の白いエッジのヒストグラムを用いることでグラデーションにおける黒文字のヒストグラム、グラデーションにおける白文字のヒストグラムを判定する。
判定値に歪度、尖度、平均値、最頻値、中央値を使用することで双峰型のヒストグラム、グラデーションのヒストグラム、右肩上がりのヒストグラム、左肩上がりのヒストグラムを簡単に判別できる。
さらに、矩形領域内の白いエッジのヒストグラムを用いることでグラデーションにおける黒文字のヒストグラム、グラデーションにおける白文字のヒストグラムを判定する。
白いエッジのヒストグラムを用いることでグラデーションにおける黒文字のヒストグラム、グラデーションにおける白
文字のヒストグラムを簡単に判別できる。
双峰型のヒストグラムとして判別された場合は矩形領域内のヒストグラムの平均値を二値化閾値として用いる。
グラデーションにおける黒文字のヒストグラムとして判別された場合は矩形領域内のヒストグラムの左端の谷の階調値値を二値化閾値として用いる。
文字のヒストグラムを簡単に判別できる。
双峰型のヒストグラムとして判別された場合は矩形領域内のヒストグラムの平均値を二値化閾値として用いる。
グラデーションにおける黒文字のヒストグラムとして判別された場合は矩形領域内のヒストグラムの左端の谷の階調値値を二値化閾値として用いる。
グラデーションにおける白文字のヒストグラムとして判別された場合は矩形領域内のヒストグラムの右端の谷の階調値を二値化閾値として用いる。
右肩上がりのヒストグラム、左肩上がりのヒストグラムとして判別された場合は矩形領域内の二値化閾値を(2×ヒストグラムの平均値−ヒストグラムの最頻値)とする。
このように、各形状に合わせて閾値の設定方法を変えることにより精度の良い閾値を設定できる。
右肩上がりのヒストグラム、左肩上がりのヒストグラムとして判別された場合は矩形領域内の二値化閾値を(2×ヒストグラムの平均値−ヒストグラムの最頻値)とする。
このように、各形状に合わせて閾値の設定方法を変えることにより精度の良い閾値を設定できる。
また、本発明の要旨は、入力画像の文字や絵柄を矩形領域として検出し、検出した矩形領域内の輝度分布(以降、ヒストグラムと記す)の形状を判定し文字領域について高精度な二値化閾値を求めることといえる。
次に、特許請求の範囲の記載と実施例の各構成部品との対応を示す。
特許請求の範囲に記載した処理対象設定手段は、矩形領域の検出(S1)の処理によって構成されている。
特許請求の範囲に記載した度数分布取得手段は、矩形領域の特徴値検出(S2)の処理によって構成されている。
特許請求の範囲に記載した形状判定手段は、矩形領域の特徴値検出(S2)と、ヒストグラムの形状判定(S3)と、歪度と尖度の閾値との対比(S21)と、中央値と平均値の差と閾値との対比(S22)と、最頻値と平均値との対比(S23)と、右肩上がりのヒストグラム(S24)と、左肩上がりのヒストグラム(S25)と、グラデーションのヒストグラム(S26)と、双峰型のヒストグラム(S27)との各処理によって構成されている。
特許請求の範囲に記載した処理対象設定手段は、矩形領域の検出(S1)の処理によって構成されている。
特許請求の範囲に記載した度数分布取得手段は、矩形領域の特徴値検出(S2)の処理によって構成されている。
特許請求の範囲に記載した形状判定手段は、矩形領域の特徴値検出(S2)と、ヒストグラムの形状判定(S3)と、歪度と尖度の閾値との対比(S21)と、中央値と平均値の差と閾値との対比(S22)と、最頻値と平均値との対比(S23)と、右肩上がりのヒストグラム(S24)と、左肩上がりのヒストグラム(S25)と、グラデーションのヒストグラム(S26)と、双峰型のヒストグラム(S27)との各処理によって構成されている。
特許請求の範囲に記載した閾値設定手段は、矩形領域の閾値設定(S4)の処理によって構成されている。
特許請求の範囲に記載したノイズ成分除去手段は、二値化(S5)の処理によって構成されている。
特許請求の範囲に記載したノイズ成分除去手段は、二値化(S5)の処理によって構成されている。
特許請求の範囲に記載した処理対象設定ステップは、矩形領域の検出(S1)の処理によって構成されている。
特許請求の範囲に記載した度数分布取得ステップは、矩形領域の特徴値検出(S2)の処理によって構成されている。
特許請求の範囲に記載した形状判定ステップは、矩形領域の特徴値検出(S2)と、ヒストグラムの形状判定(S3)と、歪度と尖度の閾値との対比(S21)と、中央値と平均値の差と閾値との対比(S22)と、最頻値と平均値との対比(S23)と、右肩上がりのヒストグラム(S24)と、左肩上がりのヒストグラム(S25)と、グラデーションのヒストグラム(S26)と、双峰型のヒストグラム(S27)との各処理によって構成されている。
特許請求の範囲に記載した度数分布取得ステップは、矩形領域の特徴値検出(S2)の処理によって構成されている。
特許請求の範囲に記載した形状判定ステップは、矩形領域の特徴値検出(S2)と、ヒストグラムの形状判定(S3)と、歪度と尖度の閾値との対比(S21)と、中央値と平均値の差と閾値との対比(S22)と、最頻値と平均値との対比(S23)と、右肩上がりのヒストグラム(S24)と、左肩上がりのヒストグラム(S25)と、グラデーションのヒストグラム(S26)と、双峰型のヒストグラム(S27)との各処理によって構成されている。
特許請求の範囲に記載した閾値設定ステップは、矩形領域の閾値設定(S4)の処理によって構成されている。
特許請求の範囲に記載したノイズ成分除去ステップは、二値化(S5)の処理によって構成されている。
特許請求の範囲に記載したノイズ成分除去ステップは、二値化(S5)の処理によって構成されている。
なお、本発明はソフトウェアを利用して各構成手段を実現しているが、ハードウェア、例えばアナログ回路やデジタル回路で実現することもできるし、ASICのような論理的作用をなすICなどで実現することも可能である。
なお、本発明は上記実施例に限られるものでないことは言うまでもない。当業者であれば言うまでもないことであるが、
・上記実施例の中で開示した相互に置換可能な部材および構成等を適宜その組み合わせを変更して適用すること
・上記実施例の中で開示されていないが、公知技術であって上記実施例の中で開示した部材および構成等と相互に置換可能な部材および構成等を適宜置換し、またその組み合わせを変更して適用すること
・上記実施例の中で開示されていないが、公知技術等に基づいて当業者が上記実施例の中で開示した部材および構成等の代用として想定し得る部材および構成等と適宜置換し、またその組み合わせを変更して適用すること
は本発明の一実施例として開示されるものである。
なお、本発明は上記実施例に限られるものでないことは言うまでもない。当業者であれば言うまでもないことであるが、
・上記実施例の中で開示した相互に置換可能な部材および構成等を適宜その組み合わせを変更して適用すること
・上記実施例の中で開示されていないが、公知技術であって上記実施例の中で開示した部材および構成等と相互に置換可能な部材および構成等を適宜置換し、またその組み合わせを変更して適用すること
・上記実施例の中で開示されていないが、公知技術等に基づいて当業者が上記実施例の中で開示した部材および構成等の代用として想定し得る部材および構成等と適宜置換し、またその組み合わせを変更して適用すること
は本発明の一実施例として開示されるものである。
本発明は、ノイズ成分除去プログラムを記録した媒体に利用することができる。
S1…矩形領域の検出、S2…矩形領域の特徴値検出、S3…ヒストグラムの形状判定、S4…矩形領域の閾値設定、S5…二値化、S21…歪度と尖度の閾値との対比、S22…中央値と平均値の差と閾値との対比、S23…最頻値と平均値との対比、S24…右肩上がりのヒストグラム、S25…左肩上がりのヒストグラム、S26…グラデーションのヒストグラム、S27…双峰型のヒストグラム
Claims (8)
- 多数の画素からなる画像における多値の画像データを入力し、所定の閾値を設定してノイズ成分を除去する(同画像データを二値化する)ノイズ成分除去装置において、
上記画像データにおける所定の領域を処理対象として設定する処理対象設定手段と、
上記画像データにおける上記設定された領域を対象として各画素の階調値の度数分布を求める度数分布取得手段と、
上記度数分布の度数分布状況にもとづき、同度数分布の形状として歪度を求める形状判定手段と、
判定された度数分布の形状に対応づけられた手法で上記閾値を設定する閾値設定手段と、
上記閾値を利用して上記画像データから不要な成分を除去するノイズ成分除去手段とを具備することを特徴とするノイズ成分除去装置。 - 上記形状判定手段は、上記歪度として度数分布における左右の非対称性の指標を求めることを特徴とする請求項1に記載のノイズ成分除去装置。
- 上記形状判定手段は、上記度数分布の度数分布状況にもとづいて尖度を求め、
上記閾値設定手段は、形状判定手段で求められた尖度と上記歪度とに対応づけられた手法で上記閾値を設定することを特徴とする請求項1または請求項2のいずれかに記載のノイズ成分除去装置。 - 上記形状判定手段は、上記尖度として正規分布と対比した分布の尖り具合の指標を求めることを特徴とする請求項3に記載のノイズ成分除去装置。
- 上記形状判定手段は、上記画像データにおける階調値の平均値と最頻値とを求め、
上記閾値設定手段は、求められた平均値と最頻値との差異が所定の値より大きいときに対応した手法で上記閾値を算出することを特徴とする請求項1〜請求項4のいずれかに記載のノイズ成分除去装置。 - 上記形状判定手段は、上記画像データにおける階調値の平均値と最頻値とを求め、
上記閾値設定手段は、求められた平均値と最頻値との差異が所定の値より小さいときに対応した手法で上記閾値を算出することを特徴とする請求項1〜請求項4のいずれかに記載のノイズ成分除去装置。 - 上記閾値設定手段は、上記画像データを対象として階調値が大きく変化する境界領域を検出するとともに、上記境界領域における明度の高い側の画素の階調値の平均値を取得し、かつ、上記領域内の平均値と対比し、同対比結果に対応した手法で上記閾値を算出することを特徴とする請求項5または請求項6のいずれかに記載のノイズ成分除去装置。
- 多数の画素からなる画像における多値の画像データを入力し、所定の閾値を設定してノイズ成分を除去する(同画像データを二値化する)ノイズ成分除去プログラムを記録した媒体において、
上記画像データにおける所定の領域を処理対象として設定する処理対象設定ステップと、
上記画像データにおける上記設定された領域を対象として各画素の階調値の度数分布を求める度数分布取得ステップと、
上記度数分布の度数分布状況にもとづき、同度数分布の形状として歪度を求める形状判定ステップと、
判定された度数分布の形状に対応づけられた手法で上記閾値を設定する閾値設定ステップと、
上記閾値を利用して上記画像データから不要な成分を除去するノイズ成分除去ステップとを具備することを特徴とするノイズ成分除去プログラムを記録した媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009073844A JP2010225047A (ja) | 2009-03-25 | 2009-03-25 | ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009073844A JP2010225047A (ja) | 2009-03-25 | 2009-03-25 | ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010225047A true JP2010225047A (ja) | 2010-10-07 |
Family
ID=43042141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009073844A Withdrawn JP2010225047A (ja) | 2009-03-25 | 2009-03-25 | ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010225047A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016203922A1 (ja) * | 2015-06-16 | 2016-12-22 | 株式会社日立国際電気 | 撮像装置及び画像処理方法 |
JP2018050114A (ja) * | 2016-09-20 | 2018-03-29 | コニカミノルタ株式会社 | 画像形成装置およびプログラム |
EP3467710A2 (en) | 2017-09-14 | 2019-04-10 | Seiko Epson Corporation | Image processing apparatus, binary image production method, and image processing program |
CN111508017A (zh) * | 2020-04-08 | 2020-08-07 | 中导光电设备股份有限公司 | 一种弱对比度定位标记中心的方法和系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232926A (ja) * | 1996-12-20 | 1998-09-02 | Canon Inc | 画像処理装置及びその方法 |
JP2002223355A (ja) * | 2001-01-25 | 2002-08-09 | Olympus Optical Co Ltd | 画像処理装置および画像処理プログラムを記録した記録媒体 |
JP2003123023A (ja) * | 2001-10-12 | 2003-04-25 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識方法及び文字認識装置、文字認識プログラム並びにそのプログラムを記録した記録媒体 |
JP2003189096A (ja) * | 2001-12-21 | 2003-07-04 | Minolta Co Ltd | 画像処理装置 |
JP2005058315A (ja) * | 2003-08-08 | 2005-03-10 | Fuji Photo Film Co Ltd | 画像の縮率計算方法 |
JP2008073280A (ja) * | 2006-09-22 | 2008-04-03 | Institute Of National Colleges Of Technology Japan | 眼底画像処理装置 |
-
2009
- 2009-03-25 JP JP2009073844A patent/JP2010225047A/ja not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232926A (ja) * | 1996-12-20 | 1998-09-02 | Canon Inc | 画像処理装置及びその方法 |
JP2002223355A (ja) * | 2001-01-25 | 2002-08-09 | Olympus Optical Co Ltd | 画像処理装置および画像処理プログラムを記録した記録媒体 |
JP2003123023A (ja) * | 2001-10-12 | 2003-04-25 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識方法及び文字認識装置、文字認識プログラム並びにそのプログラムを記録した記録媒体 |
JP2003189096A (ja) * | 2001-12-21 | 2003-07-04 | Minolta Co Ltd | 画像処理装置 |
JP2005058315A (ja) * | 2003-08-08 | 2005-03-10 | Fuji Photo Film Co Ltd | 画像の縮率計算方法 |
JP2008073280A (ja) * | 2006-09-22 | 2008-04-03 | Institute Of National Colleges Of Technology Japan | 眼底画像処理装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016203922A1 (ja) * | 2015-06-16 | 2016-12-22 | 株式会社日立国際電気 | 撮像装置及び画像処理方法 |
JPWO2016203922A1 (ja) * | 2015-06-16 | 2018-05-24 | 株式会社日立国際電気 | 撮像装置及び画像処理方法 |
JP2018050114A (ja) * | 2016-09-20 | 2018-03-29 | コニカミノルタ株式会社 | 画像形成装置およびプログラム |
EP3467710A2 (en) | 2017-09-14 | 2019-04-10 | Seiko Epson Corporation | Image processing apparatus, binary image production method, and image processing program |
US10769486B2 (en) | 2017-09-14 | 2020-09-08 | Seiko Epson Corporation | Image processing apparatus, binary image production method, and image processing program |
CN111508017A (zh) * | 2020-04-08 | 2020-08-07 | 中导光电设备股份有限公司 | 一种弱对比度定位标记中心的方法和系统 |
CN111508017B (zh) * | 2020-04-08 | 2023-11-03 | 中导光电设备股份有限公司 | 一种弱对比度定位标记中心的方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3768052B2 (ja) | カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体 | |
JP5810628B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR101597739B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체 | |
JP5337563B2 (ja) | 帳票認識方法および装置 | |
US10455163B2 (en) | Image processing apparatus that generates a combined image, control method, and storage medium | |
JP5301694B2 (ja) | 画像処理装置、画像処理方法、プログラムおよびその記録媒体 | |
KR101058726B1 (ko) | 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법 | |
JP2010225047A (ja) | ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 | |
US9332154B2 (en) | Image binarization using dynamic sub-image division | |
JP2014107685A (ja) | 画像処理装置 | |
JP2010232795A (ja) | 階調数低減装置、階調数低減方法 | |
JP2010186246A (ja) | 画像処理装置、方法、及び、プログラム | |
JP4867903B2 (ja) | 画像処理プログラム及び画像処理装置 | |
JP3906221B2 (ja) | 画像処理方法及び画像処理装置 | |
JP2010219858A (ja) | ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 | |
JP6317413B1 (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP5262877B2 (ja) | ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 | |
JP3830350B2 (ja) | カラー画像処理方法、カラー画像処理装置、プログラム、及び記録媒体 | |
JP6677209B2 (ja) | 画像処理装置、処理方法、プログラム | |
JP5272841B2 (ja) | ノイズ成分除去装置、ノイズ成分除去方法 | |
JP3966448B2 (ja) | 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体 | |
TWI382359B (zh) | 影像處理裝置及方法 | |
JP6493559B2 (ja) | 文字認識装置及び文字認識方法 | |
JP2000331118A (ja) | 画像処理装置及び記録媒体 | |
JP5453193B2 (ja) | 傾き検出装置、撮像装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120828 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20120924 |