JP2010081604A - デジタル画像のテキストの位置決定を行う方法およびシステム - Google Patents
デジタル画像のテキストの位置決定を行う方法およびシステム Download PDFInfo
- Publication number
- JP2010081604A JP2010081604A JP2009217821A JP2009217821A JP2010081604A JP 2010081604 A JP2010081604 A JP 2010081604A JP 2009217821 A JP2009217821 A JP 2009217821A JP 2009217821 A JP2009217821 A JP 2009217821A JP 2010081604 A JP2010081604 A JP 2010081604A
- Authority
- JP
- Japan
- Prior art keywords
- block
- bimodal
- value
- threshold
- contrast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
【解決手段】本発明のデジタル画像のテキスト位置決定方法は、デジタル画像を複数のブロックに分割し、ブロックに含まれる複数の画素の画素値に関するコントラスト量を求め、ブロックに含まれる複数の画素の画素値のヒストグラムに関する画素値二峰性評価値を求め、複数の上記コントラスト量に基づくコントラスト閾値を求め、複数の上記画素値二峰性評価値に基づく二峰性閾値を求め、上記ブロックをテキストブロックまたは非テキストブロックとして分類する。上記分類においては、上記コントラスト量および上記画素値二峰性評価値が、上記コントラスト閾値および上記二峰性閾値に基づいた第1基準を満たしている上記ブロックを、テキストブロックとして分類し、上記第1基準を満たしていない上記ブロックを、非テキストブロックとして分類する。
【選択図】図3
Description
ブロックblock(i,j) のテキストタイプが標準テキストである場合、
ブロックblock(i,j) のテキストタイプが標準テキストである場合、
上記第1ブロックに関する上記コントラスト量が、上記第1ブロックに関する上記コントラスト閾値に関する第2基準を満たさない、または、上記第1ブロックに関する上記二峰性量が上記二峰性閾値に関する第3基準を満たさない場合に、上記第1ブロックを非テキストブロックとして分類するよう構成してもよい。
102 コントラスト量決定部
103 二峰性評価値決定部
104 コントラスト閾値決定部
105 二峰性閾値決定部
106 分類部
Claims (10)
- デジタル画像を複数のブロックに分割する分割ステップと、
各ブロックについて、当該ブロックに含まれる複数の画素の画素値に関するコントラスト量を求めるコントラスト量決定ステップと、
各ブロックについて、当該ブロックに含まれる複数の画素の画素値のヒストグラムに関する二峰性の評価値を画素値二峰性評価値として求める第1二峰性評価値決定ステップと、
複数のブロックに対して求められた複数の上記コントラスト量を用いてコントラスト閾値を求めるコントラスト閾値決定ステップと、
複数のブロックに対して求められた複数の上記画素値二峰性評価値を用いて二峰性閾値を求める二峰性閾値決定ステップと、
第1基準を満たす上記ブロックをテキストブロックとして分類し、上記第1基準を満たさない上記ブロックを非テキストブロックとして分類する分類ステップとを含み、
上記分類ステップにおいては、上記ブロックについて、上記コントラスト量が上記コントラスト閾値よりもコントラストが強いことを示し、かつ、上記画素値二峰性評価値が上記二峰性閾値よりも二峰性が高いことを示す場合に、当該ブロックは上記第1基準を満たすとし、上記コントラスト量が上記コントラスト閾値よりもコントラストが強くないことを示す、または、上記画素値二峰性評価値が上記二峰性閾値よりも二峰性が高くないことを示す場合に、当該ブロックは上記第1基準を満たさないとすることを特徴とするデジタル画像のテキスト位置決定方法。 - 上記コントラスト閾値決定ステップにおいては、上記コントラスト閾値によって上記複数のブロックのコントラスト量を第1コントラストクラスと第2コントラストクラスとに分割したときに、第1コントラストクラスと第2コントラストクラスとのクラスの分離度が最大になるような上記コントラスト閾値を求め、
上記二峰性閾値決定ステップにおいては、上記二峰性閾値によって上記複数のブロックの画素値二峰性評価値を第1画素値二峰性評価値クラスと第2画素値二峰性評価値クラスとに分割したときに、第1画素値二峰性評価値クラスと第2画素値二峰性評価値クラスとのクラスの分離度が最大になるような上記二峰性閾値を求めることを特徴とする請求項1に記載のデジタル画像のテキスト位置決定方法。 - デジタル画像を複数のブロックに分割する分割ステップと、
各ブロックについて、当該ブロックに含まれる複数の画素の画素値に関するコントラスト量を求めるコントラスト量決定ステップと、
各ブロックについて、当該ブロックに含まれる複数の画素の画素値のヒストグラムに関する二峰性の評価値を画素値二峰性評価値として求める第1二峰性評価値決定ステップと、
複数のブロックについての複数の上記コントラスト量に基づくコントラスト閾値を求めるコントラスト閾値決定ステップと、
複数のブロックについての複数の上記画素値二峰性評価値に基づく二峰性閾値を求める二峰性閾値決定ステップと、
上記複数のブロックの画素値二峰性評価値のヒストグラムに関する二峰性の評価値を分布二峰性評価値として求める第2二峰性評価値決定ステップと、
第1基準を満たす上記ブロックをテキストブロックとして分類し、上記第1基準を満たさない上記ブロックを非テキストブロックとして分類する分類ステップとを含み、
上記分布二峰性評価値が所定の限界値よりも二峰性が高いことを示す場合は、上記分類ステップにおいて、上記ブロックについて、上記コントラスト量が上記コントラスト閾値よりもコントラストが強いことを示し、かつ、上記画素値二峰性評価値が上記二峰性閾値よりも二峰性が高いことを示す場合に、当該ブロックは上記第1基準を満たすとし、上記コントラスト量が上記コントラスト閾値よりもコントラストが強くないことを示す、または、上記画素値二峰性評価値が上記二峰性閾値よりも二峰性が高くないことを示す場合に、当該ブロックは上記第1基準を満たさないとし、
上記分布二峰性評価値が所定の限界値よりも二峰性が高くないことを示す場合は、上記分類ステップにおいて、上記ブロックについて、上記コントラスト量が上記コントラスト閾値よりもコントラストが強いことを示す場合に、当該ブロックは上記第1基準を満たすとし、上記コントラスト量が上記コントラスト閾値よりもコントラストが強くないことを示す場合に、当該ブロックは上記第1基準を満たさないとすることを特徴とするデジタル画像のテキスト位置決定方法。 - 上記第1二峰性評価値決定ステップは、
当該ブロックに含まれる上記複数の画素の画素値を第1画素値クラスと第2画素値クラスとに分割する画素値閾値を求める画素値閾値決定ステップと、
当該ブロックに含まれる上記複数の画素の画素値の全分散を画素値全分散として求める画素値全分散決定ステップと、
上記第1画素値クラスと上記第2画素値クラスとのクラス間分散を画素値クラス間分散として求める画素値クラス間分散決定ステップと、
上記画素値クラス間分散と上記画素値全分散との比を求める分散比決定ステップとを含み、
求めた上記比を上記画素値二峰性評価値とすることを特徴とする請求項1または3に記載のデジタル画像のテキスト位置決定方法。 - 上記画素値閾値決定ステップにおいては、上記第1画素値クラスと上記第2画素値クラスとクラスの分離度が最大になるような上記画素値閾値を求めることを特徴とする請求項4に記載のデジタル画像のテキスト位置決定方法。
- 各ブロックについて、当該ブロックの上記画素値閾値以上の画素値を有する画素に対応する位置の値を第1の値とし、当該ブロックの上記画素値閾値未満の画素値を有する画素に対応する位置の値を第2の値とする二値画像を生成する二値画像生成ステップをさらに含むことを特徴とする請求項4に記載のデジタル画像のテキスト位置決定方法。
- 上記ブロックがテキストブロックとして分類された場合、当該ブロックのテキストタイプが標準テキストおよび反転テキストのいずれに該当するかを判定するテキストタイプ決定ステップをさらに含むことを特徴とする請求項1または3に記載のデジタル画像のテキスト位置決定方法。
- 各ブロックについて、当該ブロックに含まれる上記複数の画素の画素値を第1画素値クラスと第2画素値クラスとに分割する画素値閾値を求める画素値閾値決定ステップと、
各ブロックについて、当該ブロックに含まれる上記複数の画素のうち、該画素値が上記画素値閾値の上側になる画素の数の割合を求める割合決定ステップとをさらに含み、
上記テキストタイプ決定ステップにおいては、上記割合を使用して上記ブロックの上記テキストタイプを判定することを特徴とする請求項7に記載のデジタル画像のテキスト位置決定方法。 - 上記画素値閾値決定ステップにおいては、上記第1画素値クラスと上記第2画素値クラスとクラスの分離度が最大になるような上記画素値閾値を求めることを特徴とする請求項8に記載のデジタル画像のテキスト位置決定方法。
- デジタル画像を複数のブロックに分割するブロック分割部と、
各ブロックについて、当該ブロックに含まれる複数の画素の画素値に関するコントラスト量を求めるコントラスト量決定部と、
各ブロックについて、当該ブロックに含まれる複数の画素の画素値のヒストグラムに関する二峰性の評価値を画素値二峰性評価値として求める二峰性評価値決定部と、
複数のブロックに対して求められた複数の上記コントラスト量を用いてコントラスト閾値を求めるコントラスト閾値決定部と、
複数のブロックに対して求められた複数の上記画素値二峰性評価値を用いて二峰性閾値を求める二峰性閾値決定部と、
第1基準を満たす上記ブロックをテキストブロックとして分類し、上記第1基準を満たさない上記ブロックを非テキストブロックとして分類する分類部とを含み、
上記分類部は、上記ブロックについて、上記コントラスト量が上記コントラスト閾値よりもコントラストが強いことを示し、かつ、上記画素値二峰性評価値が上記二峰性閾値よりも二峰性が高いことを示す場合に、当該ブロックは上記第1基準を満たすとし、上記コントラスト量が上記コントラスト閾値よりもコントラストが強くないことを示す、または、上記画素値二峰性評価値が上記二峰性閾値よりも二峰性が高くないことを示す場合に、当該ブロックは上記第1基準を満たさないとすることを特徴とするデジタル画像のテキスト位置決定システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/238,375 | 2008-09-25 | ||
US12/238,375 US8189917B2 (en) | 2008-09-25 | 2008-09-25 | Methods and systems for locating text in a digital image |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010081604A true JP2010081604A (ja) | 2010-04-08 |
JP4745430B2 JP4745430B2 (ja) | 2011-08-10 |
Family
ID=42037737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009217821A Active JP4745430B2 (ja) | 2008-09-25 | 2009-09-18 | デジタル画像のテキストの位置決定を行う方法およびシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8189917B2 (ja) |
JP (1) | JP4745430B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9098768B2 (en) | 2010-12-29 | 2015-08-04 | Konica Minolta, Inc. | Character detection apparatus, character detection method, and computer-readable storage medium |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2189926B1 (en) * | 2008-11-21 | 2012-09-19 | beyo GmbH | Method for providing camera-based services using a portable communication device of a user and portable communication device of a user |
TWI423146B (zh) * | 2009-06-05 | 2014-01-11 | Univ Nat Taiwan Science Tech | 動態偵測與識別指示牌的方法與系統 |
US8989499B2 (en) | 2010-10-20 | 2015-03-24 | Comcast Cable Communications, Llc | Detection of transitions between text and non-text frames in a video stream |
US9223769B2 (en) | 2011-09-21 | 2015-12-29 | Roman Tsibulevskiy | Data processing systems, devices, and methods for content analysis |
US8611662B2 (en) | 2011-11-21 | 2013-12-17 | Nokia Corporation | Text detection using multi-layer connected components with histograms |
US10296933B2 (en) * | 2013-04-12 | 2019-05-21 | Facebook, Inc. | Identifying content in electronic images |
US9058539B2 (en) | 2013-04-16 | 2015-06-16 | Canon Kabushiki Kaisha | Systems and methods for quantifying graphics or text in an image |
FR3021782B1 (fr) * | 2014-05-28 | 2016-07-01 | Sagemcom Documents Sas | Procede et dispositif d'identification d'au moins une page utile dans un document |
US9842281B2 (en) | 2014-06-05 | 2017-12-12 | Xerox Corporation | System for automated text and halftone segmentation |
RU2697737C2 (ru) * | 2016-10-26 | 2019-08-19 | Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-воздушных сил "Военно-воздушная академия имени профессора Н.Е. Жуковского и Ю.А. Гагарина" (г. Воронеж) Министерства обороны Российской Федерации | Способ обнаружения и локализации текстовых форм на изображениях |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05176180A (ja) * | 1991-12-19 | 1993-07-13 | Kokusai Denshin Denwa Co Ltd <Kdd> | 2値画像混在静止自然画像の符号化方法 |
JPH07303188A (ja) * | 1994-05-09 | 1995-11-14 | Sharp Corp | 画像処理装置 |
JPH08139924A (ja) * | 1994-11-09 | 1996-05-31 | Seiko Epson Corp | 画像処理方法および画像処理装置 |
JPH0918702A (ja) * | 1995-06-27 | 1997-01-17 | Toshiba Corp | 画像処理装置及び方法 |
JP2002312775A (ja) * | 2001-04-13 | 2002-10-25 | Canon Inc | 画像処理装置、放射線画像処理システム及び画像処理方法 |
JP2005071088A (ja) * | 2003-08-25 | 2005-03-17 | Canon Inc | 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4642683A (en) * | 1985-05-06 | 1987-02-10 | Eastman Kodak Company | Digital image processing method for images with bimodal tone value distribution |
US5566255A (en) | 1991-03-05 | 1996-10-15 | Ricoh Company, Ltd. | Segmenting a page of a document into areas which are text and areas which are halftone |
CA2144793C (en) | 1994-04-07 | 1999-01-12 | Lawrence Patrick O'gorman | Method of thresholding document images |
US5649025A (en) | 1995-02-03 | 1997-07-15 | Xerox Corporation | Multithresholding for document image segmentation |
US5920655A (en) | 1995-02-10 | 1999-07-06 | Canon Kabushiki Kaisha | Binarization image processing for multi-level image data |
US6333788B1 (en) | 1996-02-28 | 2001-12-25 | Canon Kabushiki Kaisha | Image processing apparatus and method |
US5852678A (en) | 1996-05-30 | 1998-12-22 | Xerox Corporation | Detection and rendering of text in tinted areas |
US5956468A (en) | 1996-07-12 | 1999-09-21 | Seiko Epson Corporation | Document segmentation system |
US6295371B1 (en) | 1998-10-22 | 2001-09-25 | Xerox Corporation | Method and apparatus for image processing employing image segmentation using tokenization |
DE19958553A1 (de) | 1999-12-04 | 2001-06-07 | Luratech Ges Fuer Luft Und Rau | Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten |
US6853755B2 (en) | 2001-03-28 | 2005-02-08 | Sharp Laboratories Of America, Inc. | Method and apparatus for adaptive compression of scanned documents |
CN1213592C (zh) | 2001-07-31 | 2005-08-03 | 佳能株式会社 | 采用自适应二值化的图象处理方法和设备 |
US6973213B2 (en) | 2001-10-12 | 2005-12-06 | Xerox Corporation | Background-based image segmentation |
US7082219B2 (en) | 2002-02-04 | 2006-07-25 | The United States Of America As Represented By The Secretary Of The Air Force | Method and apparatus for separating text from images |
US6859204B2 (en) | 2002-07-01 | 2005-02-22 | Xerox Corporation | Dynamic threshold system for multiple raster content (MRC) representation of documents |
EP1392047B1 (en) * | 2002-08-22 | 2013-10-30 | Samsung Electronics Co., Ltd. | Digital document processing for image enhancement |
US6993185B2 (en) | 2002-08-30 | 2006-01-31 | Matsushita Electric Industrial Co., Ltd. | Method of texture-based color document segmentation |
US7079687B2 (en) | 2003-03-06 | 2006-07-18 | Seiko Epson Corporation | Method and apparatus for segmentation of compound documents |
US7298897B1 (en) | 2004-02-11 | 2007-11-20 | United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Optimal binarization of gray-scaled digital images via fuzzy reasoning |
US20050226503A1 (en) | 2004-04-07 | 2005-10-13 | Bailey James R | Scanned image content analysis |
US7729546B2 (en) | 2005-12-23 | 2010-06-01 | Lexmark International, Inc. | Document segmentation for mixed raster content representation |
-
2008
- 2008-09-25 US US12/238,375 patent/US8189917B2/en active Active
-
2009
- 2009-09-18 JP JP2009217821A patent/JP4745430B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05176180A (ja) * | 1991-12-19 | 1993-07-13 | Kokusai Denshin Denwa Co Ltd <Kdd> | 2値画像混在静止自然画像の符号化方法 |
JPH07303188A (ja) * | 1994-05-09 | 1995-11-14 | Sharp Corp | 画像処理装置 |
JPH08139924A (ja) * | 1994-11-09 | 1996-05-31 | Seiko Epson Corp | 画像処理方法および画像処理装置 |
JPH0918702A (ja) * | 1995-06-27 | 1997-01-17 | Toshiba Corp | 画像処理装置及び方法 |
JP2002312775A (ja) * | 2001-04-13 | 2002-10-25 | Canon Inc | 画像処理装置、放射線画像処理システム及び画像処理方法 |
JP2005071088A (ja) * | 2003-08-25 | 2005-03-17 | Canon Inc | 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9098768B2 (en) | 2010-12-29 | 2015-08-04 | Konica Minolta, Inc. | Character detection apparatus, character detection method, and computer-readable storage medium |
Also Published As
Publication number | Publication date |
---|---|
US20100074526A1 (en) | 2010-03-25 |
US8189917B2 (en) | 2012-05-29 |
JP4745430B2 (ja) | 2011-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4745430B2 (ja) | デジタル画像のテキストの位置決定を行う方法およびシステム | |
JP4340701B2 (ja) | デジタル画像のテキストを識別する方法およびシステム | |
US8285059B2 (en) | Method for automatic enhancement of images containing snow | |
JP4745296B2 (ja) | デジタル画像の領域分離方法および領域分離システム | |
JP4498422B2 (ja) | 画素の分類方法および画像処理装置 | |
US7171042B2 (en) | System and method for classification of images and videos | |
JP3686439B2 (ja) | デジタル・イメージのフォト領域検出システム、及び方法 | |
JP4745297B2 (ja) | デジタル画像における均一な色の領域を特定する方法およびシステム | |
JP4590471B2 (ja) | 背景色を推定する方法およびシステム | |
JP5958023B2 (ja) | 画像処理装置および画像処理プログラム | |
US8798371B2 (en) | Image processing method, image processing apparatus, and image forming apparatus | |
Haneda et al. | Text segmentation for MRC document compression | |
JP4324628B2 (ja) | 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及び記録媒体 | |
JP4098021B2 (ja) | シーン識別方法および装置ならびにプログラム | |
JP4266030B2 (ja) | デジタル画像の領域を検知する方法およびシステム | |
JP2018136927A (ja) | マルチバイナリゼーション画像処理 | |
CN106845312B (zh) | 一种二维码图像质量的预判断方法 | |
JP4527127B2 (ja) | デジタル画像の領域を検知するシステム | |
US20080310715A1 (en) | Applying a segmentation engine to different mappings of a digital image | |
JP2009027715A (ja) | 画像データの色補正方法及びシステム | |
JP4393556B2 (ja) | 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及びコンピュータでの読み取りが可能な記録媒体 | |
JP2004246618A (ja) | パターン認識における照合に用いられる画像の生成ならびに同画像を用いたパターン認識のための方法、装置、およびプログラム | |
CN108596874B (zh) | 图像清晰判定方法、装置,以及计算机设备、产品 | |
Boiangiu et al. | Bitonal image creation for automatic content conversion | |
RU2321058C1 (ru) | Способ распознавания сложного графического объекта |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110419 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110511 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4745430 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |