JP4383797B2 - 傾き検出方法、傾き検出装置およびプログラム - Google Patents
傾き検出方法、傾き検出装置およびプログラム Download PDFInfo
- Publication number
- JP4383797B2 JP4383797B2 JP2003289216A JP2003289216A JP4383797B2 JP 4383797 B2 JP4383797 B2 JP 4383797B2 JP 2003289216 A JP2003289216 A JP 2003289216A JP 2003289216 A JP2003289216 A JP 2003289216A JP 4383797 B2 JP4383797 B2 JP 4383797B2
- Authority
- JP
- Japan
- Prior art keywords
- inclination
- circumscribed rectangle
- rectangle
- document image
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Description
スキャンして得られた文書画像に対する傾きの検出方法には特許文献1などの方法が知られている。同発明のように圧縮画像より文字成分外接矩形を抽出する方法は、文字行方向に対し長めの矩形を抽出することができ、傾き検出に有用な行方向の判別や、文字領域と図や写真領域などの領域判別にも寄与する。同発明によると、スキャン画像を圧縮して文字成分外接矩形を抽出し、図8のように矩形間の仰角を求め、仰角の頻度分布(ヒストグラム)によって文書画像の傾きを求めるようにしている。そのほかの傾き検出方法としては、画像上の黒画素の連結矩形の代表点列に対して、相関係数や回帰係数を利用して傾きを求める方法もある(例えば特許文献2)。
本発明は、上述した実情を考慮してなされたものであって、文字成分外接矩形が文字行方向に長くなった場合でも正確に傾きを求めることができる文書画像の傾き検出方法、傾き検出方法およびプログラムを提供することを目的とする。
また、請求項2にかかる発明は、請求項1にかかる発明において、前記黒画素連結成分の外接矩形の幅が所定の長さより長い場合は、該外接矩形の幅方向に複数の領域を設定し、各領域内で黒画素連結成分の外接矩形を再抽出することを特徴とする。
また、請求項3にかかる発明は、請求項1または2にかかる発明において、前記回帰直線を求める際に使用する基準点を各矩形内に存在する画素の重心とすることを特徴とする。
また、請求項5にかかる発明は、請求項2にかかる発明において、前記複数の領域を設定する際、前記黒画素連結成分の外接矩形幅方向に連続して領域を分割することを特徴とする。
また、請求項6にかかる発明は、文書画像を圧縮し、該圧縮画像から黒画素連結成分の外接矩形を求め、該外接矩形の横方向を複数の領域が重なり合うように分割して設定し、該領域から文字列に相当する矩形を判別し、該判別された文字列に相当する矩形において一乃至複数の基準点を設定し、前記文字列に相当する矩形の横方向における近傍位置にある近傍矩形の基準点間を結ぶ直線の傾きのヒストグラムを作成し、該作成されたヒストグラムを基に前記圧縮画像の横方向の傾きと確信度とを算出し、該算出された横方向の傾きを前記文書画像の第1の傾き候補とし、前記黒画素連結成分の外接矩形が所定の長さより長い場合、該外接矩形内に存在する全画素の分布状態から回帰直線と確信度とを求め、該求めた回帰直線の傾きを前記文書画像の第2の傾き候補として、前記第1および第2の傾き候補から前記確信度に基づいて最終的に文書画像の傾きを決定することを特徴とする。
また、請求項8にかかる発明は、文書画像を圧縮する画像圧縮手段と、該画像圧縮手段によって圧縮された圧縮画像から横方向を複数の領域が重なり合うように設定された文字連結成分の外接矩形を求める外接矩形抽出手段と、求められた各外接矩形において一乃至複数の基準点を設定し、前記外接矩形の横方向における近傍位置にある近傍矩形の基準点間を結ぶ直線の傾きのヒストグラムを作成するヒストグラム作成手段と、該作成されたヒストグラムを基に前記圧縮画像の横方向の傾きと確信度とを算出し、該算出された横方向の傾きを前記文書画像の傾きとする文書画像の傾き検出装置において、前記黒画素連結成分の外接矩形の幅が所定の長さより長い場合は、該外接矩形の幅方向に複数の領域を設定し、各領域内で黒画素連結成分の外接矩形を再抽出する領域分割手段を備えたことを特徴とする。
また、請求項9にかかる発明は、文書画像を圧縮する画像圧縮手段と、該画像圧縮手段によって圧縮された圧縮画像から横方向を複数の領域が重なり合うように設定された文字連結成分の外接矩形を求める外接矩形抽出手段と、求められた各外接矩形において一乃至複数の基準点を設定し、前記外接矩形の横方向における近傍位置にある近傍矩形の基準点間を結ぶ直線の傾きのヒストグラムを作成するヒストグラム作成手段と、該作成されたヒストグラムを基に前記圧縮画像の横方向の傾きと確信度とを算出し、該算出された横方向の傾きを前記文書画像の傾き候補とする第1の傾き候補導出手段と、前記各矩形のうち横方向の近傍矩形の基準点を用いて回帰直線と確信度とを求める回帰直線導出手段と、前記求めた回帰直線の傾きを前記文書画像の傾き候補とする第2の傾き候補導出手段と、前記第1および第2の傾き候補から前記確信度に基づいて最終的に文書画像の傾きを決定する傾き決定手段とを備えたことを特徴とする。
また、請求項11にかかる発明は、コンピュータを、請求項8、9または10記載の傾き検出装置として機能させるためのプログラムである。
また、請求項2にかかる傾き検出方法は、外接矩形が長い時更に外接矩形の再抽出をすることで、傾き検出を確実にしている。
また、請求項3、4、5にかかる傾き検出方法は、それぞれ傾き検出を確実にする。
また、請求項6、7にかかる傾き検出方法は、長い外接矩形のまま回帰直線をもとめて文書の傾きを求めるようにしたものである。
また、請求項8にかかる傾き検出装置は、領域分割手段にて外接矩形が長い時更に外接矩形の再抽出をすることで、傾き検出を確実にしている。
また、請求項9にかかる傾き検出装置は、近傍矩形の基準点を利用した直線の傾きのヒストグラムと回帰直線の傾きとから傾きを検出しており、従来技術では適切に文書画像の傾きを求めることが困難な場合においても、適切に文書の傾きを求めることができる。
また、請求項10にかかる傾き検出装置は、長い外接矩形のまま回帰直線をもとめて文書の傾きを求めるようにしたものである。
また、請求項11にかかるプログラムは、上記傾き検出のコンピュータ処理を可能とする。
図1は、本発明の実施形態を示す文書画像の傾き検出装置の機能構成を示すブロック図である。画像入力手段100は文書画像を得るためのものである。この入力手段はスキャナなどでもよく、また既に電子ファイリングされているものを利用してもよい。画像圧縮手段101は、画像入力手段100が入力した文書画像を圧縮するためのものである。この圧縮方法としては種々の方法があるが、例えば入力画像が400dpi程度とすると、8×8画素を処理単位として、8×8画素の内の1つでも黒画素がある場合に、圧縮画素を黒とする方式を採る。この方式による8画素単位の処理は計算機の処理に適しているので処理速度が速く、また各文字または文字列が一つの連結成分となることが多い。
文字成分抽出手段102は、文字成分外接矩形を得るためのものである。この文字成分外接矩形は、各文字または文字列が一つの連結成分となることが多く、また図や写真などの領域も一塊となる特性がある。この方法は、特許文献1に記載されている黒画素連結成分の外形矩形を求めるなど公知のものを用いればよい。矩形形状判定手段103は、文字成分外接矩形の形状を判定するものである。ここでは文字成分外接矩形が横長であるかについての判定を行う。この判定の簡便な例としては、文字成分外接矩形の縦横比を用いて幅/高さが所定の値より大きい場合を横長と判定する。
ヒストグラム作成手段105は、文字成分外接矩形間の横並びの仰角および縦並びの仰角をそれぞれヒストグラムにしてピークとなる角度を検出するものである。縦横別々にヒストグラムを作成する目的は、文書画像の行間が狭いために画像圧縮によって異なる行の文字列が融合して横方向に正しい傾きを求めることができない場合でも、縦方向に正しい傾きを求めることができるようにするためである。しかし、本発明のように、別の方法と併用して傾きを求めるような場合では、横方向だけのヒストグラムを作成すれば良い。
回帰直線導出手段106は、複数の文字成分外接矩形の特性値(重心位置や左下、中心等の代表位置)の分布から回帰直線の方程式を求めるものである。特許文献2に開示されているような代表位置列の回帰直線の回帰係数を利用する方法を用いれば良い。傾き決定手段107は、ヒストグラムによる方法、あるいは回帰直線による方法のそれぞれで得られた傾き角候補から最良と思われる角度を決定するためのものである。
以上の手段は、ハードウエア的には図示しないCPU、RAM(メモリ)、コンピュータの周辺装置、およびコンピュータプログラムで実現される。なお、108は、各手段とデータの交換を行うためのバスである。
図2は、本発明の文書画像傾き検出を行う処理フローチャートである。画像入力手段100を用いて画像を入力し(ステップ201)、画像圧縮手段101は入力画像を圧縮する(ステップ202)。そして、文字成分抽出手段102は、上記したようにして圧縮された画像から連結成分を抽出し、その文字外接矩形を求める(ステップ203)。矩形形状判定手段103は、矩形の形状を判断し(ステップ204)、横長と判断した場合は領域分割手段104により、文字成分外接矩形の横方向に対し、図3のように複数の領域を設定し、再度これらの領域の各々に対して領域内で文字成分抽出手段102による矩形抽出を行う(ステップ205)。図4は横長の文字外接矩形を分割して再度文字外接矩形を抽出した時の図である。この図4の例では、矩形の特徴点を矩形の左下にしているが、その他の方法で特徴点を求めても良い。このように横長の矩形を複数の矩形に分割することにより同一行に対し、充分な数の矩形を得ることができる。
矩形形状判定手段103が、横長と判断しなかった場合は(ステップ204でNo)、既に複数の文字外接矩形が抽出されているので、文字外接矩形の分割および再抽出の必要はない。
次にヒストグラムを用いて傾き角を求める。この方法は特許文献1に記載された方法と同一である。各文字成分外接矩形の特徴点(代表位置)を用いて、ヒストグラム作成手段105により、横方向の近傍にある他の矩形との角度を求め、ヒストグラムを作成する(ステップ207)。必要に応じて縦方向も同様に行っても良い。そして、ヒストグラムでピークを示す角度を傾き候補とする(ステップ208)。もし、ピークが顕著でない場合は、必要に応じてステップ205の文字矩形再抽出以降を行うようにすると良い。
そして、最後に異なる方法で導出した傾き候補から文書画像の傾き角を決定する(ステップ209)。決定の方法は確信度の一番高い候補角を採用する。確信度は、ヒストグラムにおいては最頻値と全体の平均頻度、あるいは最頻値と第2頻度値との比を用いる。また、回帰直線についての確信度としては、相関係数を用いる。
また、横長か否かの判定(ステップ204)の代わりに、文字成分外接矩形の幅が所定の長さより長いか否かを判定してもよい。この判定は同一行に対し、十分な数の矩形を得ることができるかどうかという点においては横長か否かの判定と同様である。従って判定後の処理もこの場合と同様にしてもよい。
なお、上で説明した文字成分外接矩形の横方向に対し、分割して複数の領域を設定する際、互いの領域が重なりを持つように設定してもよい。1画素ずつずらした場合、特徴点の軌跡が連続的なものとなる。図7は、矩形分割に際し1画素ずつずらして矩形を設定した時の特徴点の軌跡を示している。
また、以上の説明では横方向に着目した場合について説明してきたが、縦方向の処理についても同様である。この場合、画像を90°回転させて取り扱うことで対応させてもよい。
101 画像圧縮手段
102 文字成分抽出手段
103 矩形形状判定手段
104 領域分割手段
105 ヒストグラム作成手段
106 回帰直線導出手段
107 傾き決定手段
Claims (11)
- 文書画像を圧縮し、該圧縮画像から黒画素連結成分の外接矩形を求め、前記外接矩形の横方向を複数の領域が重なり合うように分割して設定し、該領域から文字列に相当する矩形を判別し、該判別された文字列に相当する矩形において一乃至複数の基準点を設定し、前記文字列に相当する矩形の横方向における近傍位置にある近傍矩形の基準点間を結ぶ直線の傾きのヒストグラムを作成し、該作成されたヒストグラムを基に前記圧縮画像の横方向の傾きと確信度とを求め、前記求めた横方向の傾きを前記文書画像の第1の傾き候補とし、前記各矩形のうち横方向の近傍矩形の基準点を用いて回帰直線と確信度とを求め、前記求めた回帰直線の傾きを文書画像の第2の傾き候補として、前記第1および第2の傾き候補から前記確信度に基づいて最終的に文書画像の傾きを決定することを特徴とする文書画像の傾き検出方法。
- 請求項1記載の傾き検出方法において、前記黒画素連結成分の外接矩形の幅が所定の長さより長い場合は、該外接矩形の幅方向に複数の領域を設定し、各領域内で黒画素連結成分の外接矩形を再抽出することを特徴とする傾き検出方法。
- 請求項1または2記載の傾き検出方法において、前記回帰直線を求める際に使用する基準点を各矩形内に存在する画素の重心とすることを特徴とする傾き検出方法。
- 請求項2記載の傾き検出方法において、前記複数の領域を設定する際、隣接する領域で重なり合うように領域を分割することを特徴とする傾き検出方法。
- 請求項2記載の傾き検出方法において、前記複数の領域を設定する際、前記黒画素連結成分の外接矩形幅方向に連続して領域を分割することを特徴とする傾き検出方法。
- 文書画像を圧縮し、該圧縮画像から黒画素連結成分の外接矩形を求め、前記外接矩形の横方向を複数の領域が重なり合うように分割して設定し、該領域から文字列に相当する矩形を判別し、該判別された文字列に相当する矩形において一乃至複数の基準点を設定し、前記文字列に相当する矩形の横方向における近傍位置にある近傍矩形の基準点間を結ぶ直線の傾きのヒストグラムを作成し、該作成されたヒストグラムを基に前記圧縮画像の横方向の傾きと確信度とを算出し、該算出された横方向の傾きを前記文書画像の第1の傾き候補とし、前記黒画素連結成分の外接矩形が所定の長さより長い場合、該外接矩形内に存在する全画素の分布状態から回帰直線と確信度とを求め、前記求めた回帰直線の傾きを前記文書画像の第2の傾き候補として、前記第1および第2の傾き候補から前記確信度に基づいて最終的に文書画像の傾きを決定することを特徴とする文書画像の傾き検出方法。
- 請求項6記載の傾き検出方法において、前記回帰直線は最小2乗法を用いて求めることを特徴とする傾き検出方法。
- 文書画像を圧縮する画像圧縮手段と、該画像圧縮手段によって圧縮された圧縮画像から横方向を複数の領域が重なり合うように設定された文字連結成分の外接矩形を求める外接矩形抽出手段と、求められた各外接矩形において一乃至複数の基準点を設定し、前記外接矩形の横方向における近傍位置にある近傍矩形の基準点間を結ぶ直線の傾きのヒストグラムを作成するヒストグラム作成手段と、該作成されたヒストグラムを基に前記圧縮画像の横方向の傾きと確信度とを算出し、該算出された横方向の傾きを前記文書画像の傾きとする文書画像の傾き検出装置において、前記黒画素連結成分の外接矩形の幅が所定の長さより長い場合は、該外接矩形の幅方向に複数の領域を設定し、各領域内で黒画素連結成分の外接矩形を再抽出する領域分割手段を備えたことを特徴とする文書画像の傾き検出装置。
- 文書画像を圧縮する画像圧縮手段と、該画像圧縮手段によって圧縮された圧縮画像から横方向を複数の領域が重なり合うように設定された文字連結成分の外接矩形を求める外接矩形抽出手段と、求められた各外接矩形において一乃至複数の基準点を設定し、前記外接矩形の横方向における近傍位置にある近傍矩形の基準点間を結ぶ直線の傾きのヒストグラムを作成するヒストグラム作成手段と、該作成されたヒストグラムを基に前記圧縮画像の横方向の傾きと確信度とを算出し、該算出された横方向の傾きを前記文書画像の傾き候補とする第1の傾き候補導出手段と、前記各矩形のうち横方向の近傍矩形の基準点を用いて回帰直線と確信度とを求める回帰直線導出手段と、前記求めた回帰直線の傾きを前記文書画像の傾き候補とする第2の傾き候補導出手段と、前記第1および第2の傾き候補から前記確信度に基づいて最終的に文書画像の傾きを決定する傾き決定手段とを備えたことを特徴とする文書画像の傾き検出装置。
- 文書画像を圧縮する画像圧縮手段と、該画像圧縮手段によって圧縮された圧縮画像から横方向を複数の領域が重なり合うように設定された文字連結成分の外接矩形を求める外接矩形抽出手段と、求められた各外接矩形において一乃至複数の基準点を設定し、前記外接矩形の横方向における近傍位置にある近傍矩形の基準点間を結ぶ直線の傾きのヒストグラムを作成するヒストグラム作成手段と、該作成されたヒストグラムを基に前記圧縮画像の横方向の傾きと確信度とを算出し、該算出された横方向の傾きを前記文書画像の傾き候補とする第1の傾き候補導出手段と、前記黒画素連結成分の外接矩形が所定の長さより長い場合、該外接矩形内に存在する全画素の分布状態から回帰直線と確信度とを求め、前記求めた回帰直線の傾きを前記文書画像の傾き候補とする第2の傾き候補導出手段と、前記第1および第2の傾き候補から前記確信度に基づいて最終的に文書画像の傾きを決定する傾き決定手段とを備えたことを特徴とする文書画像の傾き検出装置。
- コンピュータを、請求項8、9または10記載の傾き検出装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003289216A JP4383797B2 (ja) | 2003-08-07 | 2003-08-07 | 傾き検出方法、傾き検出装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003289216A JP4383797B2 (ja) | 2003-08-07 | 2003-08-07 | 傾き検出方法、傾き検出装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005056346A JP2005056346A (ja) | 2005-03-03 |
JP4383797B2 true JP4383797B2 (ja) | 2009-12-16 |
Family
ID=34367622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003289216A Expired - Fee Related JP4383797B2 (ja) | 2003-08-07 | 2003-08-07 | 傾き検出方法、傾き検出装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4383797B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6105521B2 (ja) * | 2014-06-24 | 2017-03-29 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、プログラム及び画像形成装置 |
CN112257710A (zh) * | 2020-10-26 | 2021-01-22 | 北京云杉世界信息技术有限公司 | 一种带文字平面的图片倾斜度检测方法及装置 |
JPWO2022162766A1 (ja) * | 2021-01-27 | 2022-08-04 |
-
2003
- 2003-08-07 JP JP2003289216A patent/JP4383797B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005056346A (ja) | 2005-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9805281B2 (en) | Model-based dewarping method and apparatus | |
EP0621554B1 (en) | Method and apparatus for automatic determination of text line, word and character cell spatial features | |
CN108665495B (zh) | 图像处理方法及装置、移动终端 | |
US6771842B1 (en) | Document image skew detection method | |
JP4383797B2 (ja) | 傾き検出方法、傾き検出装置およびプログラム | |
JPH0418351B2 (ja) | ||
JPH09311905A (ja) | 行検出方法および文字認識装置 | |
JP4224328B2 (ja) | 車番認識装置 | |
JP4208520B2 (ja) | 画像処理装置および画像処理方法、プログラムおよび記憶媒体 | |
JP3303246B2 (ja) | 画像処理装置 | |
JP3187895B2 (ja) | 文字領域抽出方法 | |
JP4244692B2 (ja) | 文字認識装置及び文字認識プログラム | |
JP3281469B2 (ja) | 文書画像の傾き検出方法および装置 | |
JP4194309B2 (ja) | 文書方向推定方法および文書方向推定プログラム | |
JP2007295210A (ja) | 画像処理装置、画像処理方法、画像処理プログラム、およびこれを記録した記録媒体 | |
JP2005165925A (ja) | 2値化処理装置、および2値化処理方法 | |
Lu et al. | Document image rectification using fuzzy sets and morphological operators | |
JPS6361382A (ja) | 線画像からの文字成分除去方法 | |
JP3712825B2 (ja) | 画像処理方法、装置および記録媒体 | |
JP3915974B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記録媒体 | |
CN112801090A (zh) | 文字区域检测方法及装置 | |
KR101786734B1 (ko) | 문자 세선화 장치 및 방법 | |
JP2003187249A (ja) | 画像の傾き検出方法及び画像の傾き補正方法 | |
JP2009054112A (ja) | 画像処理装置及び画像処理方法 | |
JP2001312726A (ja) | 画像処理装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060511 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060601 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090915 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090924 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121002 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131002 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |