JP4498425B2 - デジタル画像の画素を分類する方法およびシステム - Google Patents
デジタル画像の画素を分類する方法およびシステム Download PDFInfo
- Publication number
- JP4498425B2 JP4498425B2 JP2008045119A JP2008045119A JP4498425B2 JP 4498425 B2 JP4498425 B2 JP 4498425B2 JP 2008045119 A JP2008045119 A JP 2008045119A JP 2008045119 A JP2008045119 A JP 2008045119A JP 4498425 B2 JP4498425 B2 JP 4498425B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- text
- color
- digital image
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
- Character Input (AREA)
Description
本実施形態に係る後処理システムの構成について図1を参照しながら説明する。本実施形態に係る後処理システムは、色評価部と、テキストマップ補正部とを備えている。
色評価部12の詳細な構成について、図2を参照しながら説明する。色評価部12は、テキスト色評価部20と、背景色評価部21と、破棄処理部23とを含む。
色評価部12の構成の変形例について図4を参照しながら説明する。色評価部12は、図2に示したテキスト色評価部20、背景色評価部21および破棄処理部23に加えて、背景色クリーンアップ処理部40およびテキスト色クリーンアップ処理部42とを含む。
上記のように色評価部12により背景色とテキストの色とが評価された後に、テキストマップ補正部15によるテキストマップの補正処理が実行される。以下に、図5から図12を参照しながら、テキストマップの補正処理の具体例のいくつかを説明する。
テキストマップ補正部15の第1の処理例について、図5を参照しながら説明する。
テキストマップに画素を追加する処理は、テキストの色の評価値の有効性に基づいて行われてもよい。この場合の処理例(第2の処理例)について、図6を参照して説明する。
また、テキストマップから画素を除去する処理においても、テキストの色の評価値の有効性に基づいて行われてもよい。この場合の処理例(第3の処理例)について、図7を参照して説明する。
また、テキストマップ補正部15は、テキストマップにおける各画素の現状のテキスト画素/非テキスト画素の状態を明確に確認することなく補正してもよい。テキストマップ補正部15は、テキストマップの画素の状態を、上述した第1−3の処理例の条件に従って決定し、現在のテキスト画素/非テキスト画素の状態と無関係に設定してもよい。この処理例を第4−6の処理例として以下に説明する。なお、第4−6の処理例は、第1−3の処理例に対応する。
まず、第4の処理例について図8を参照しながら説明する。
テキストマップに画素を追加する処理は、テキストの色の評価値の有効性に基づいて行われてもよい。この場合の処理例(第5の処理例)について、図9を参照して説明する。
まず、テキストマップ補正部15は、テキストマップにおける各画素において、色評価部12から出力される背景色の評価値13のうちの当該画素に対応する評価値と、画像データ10における当該画素の色との差分(DBG)を算出する(S50)。また、テキストマップ補正部15は、テキストマップにおける各画素において、色評価部12から出力されるテキストの色の評価値14のうちの当該画素に対応する評価値と、画像データ10における当該画素の色との(DTXT)を算出する(S55)。また、上述したように、色評価部12において決定された、テキストの色の評価値の有効性を示す情報を、テキストマップ補正部15が取得し、テキストマップ補正部は、テキストの色の有効性を判断する(S60)例えば、テキストマップ補正部15は、テキストマップ上の各画素について、テキストの色の評価値が無効である場合には無効テキスト画素を示す情報TEXTNULLを取得する。
また、テキストマップ補正部15の別の処理例(第7の処理例)について図11を参照しながら説明する。
既にテキスト画素として分類されている画素を非テキスト画素としてテキストマップから除去する場合には、背景色基準に基づいて除去された画素(つまり、背景色からの評価値からの距離DBGに基づいて除去された画素)に接続する全てのテキスト画素を非テキスト画素として除去するようにしてもよい。すなわち、除去する画素を広げる。言い換えると、画素に対する除去信号を広げる。このような手順を接続基準手順という。この接続基準手順による除去方法は、誤判別のテキスト画素の領域が、背景色基準を使用することにより除去される領域よりも大きい場合に有効である。
15 テキストマップ補正部(第1画素位置特定部、第1色差算出部、第1補正部、第2色差算出部、第2補正部)
20 テキスト色評価部(第1評価色算出部、第2評価色算出部)
21 背景色評価部(第1評価色算出部、第2評価色算出部)
23 破棄処理部
40 背景色クリーンアップ処理部
42 テキスト色クリーンアップ処理部
Claims (14)
- デジタル画像の画素の分類方法であって、
上記デジタル画像に対してテキスト区分アルゴリズムを適用して予め作成された、上記デジタル画像におけるテキストを示す画素、および非テキストを示す画素のいずれか一方を第1分類に属する画素として示すテキストマップを取得する第1ステップと、
上記デジタル画像上の第1画素位置に対応する、上記テキストマップ上の第1画素位置を特定する第2ステップと、
上記デジタル画像上の第1画素位置に対応する第1の評価色として、当該デジタル画像上の第1画素位置の近接領域に位置するとともに、上記第1分類に属する画素の色の代表値を算出する第3ステップと、
上記第1の評価色と上記デジタル画像上の上記第1画素位置の画素の色との第1色差を算出する第4ステップと、
上記第1色差が第1閾値よりも小さい場合、上記テキストマップ上の上記第1画素位置の画素が上記第1分類に属することを示すように、上記テキストマップを補正する第5ステップと、
を含むことを特徴とする画素の分類方法。 - 上記デジタル画像上の第1画素位置に対応する第2の評価色として、当該デジタル画像上の第1画素位置の近接領域に位置するとともに、上記第1分類に属さない画素の色の代表値を算出する第6ステップと、
上記第2の評価色と上記デジタル画像上の上記第1画素位置の画素の色との第2色差を算出する第7ステップと、
上記第2色差が第2閾値よりも小さい場合、上記テキストマップ上の第1画素位置の画素が上記第1分類に属さないことを示すように、上記テキストマップを補正する第8ステップと、
を含むことを特徴とする請求項1に記載の画素の分類方法。 - 上記テキストマップと上記デジタル画像とが同じ解像度であることを特徴とする請求項1または2に記載の画素の分類方法。
- 上記テキストマップと上記デジタル画像とが異なる解像度であることを特徴とする請求項1または2に記載の画素の分類方法。
- 上記第1分類に属する画素の色の代表値は、当該画素の色の平均値、当該画素の色の中央値、当該画素の色のトリム平均値、当該画素の色の重み平均値の何れかであることを特徴とする請求項1から4の何れか1項に記載の画素の分類方法。
- デジタル画像の画素を分類するシステムであって、
上記デジタル画像に対してテキスト区分アルゴリズムを適用して予め作成された、上記デジタル画像におけるテキストを示す画素、および非テキストを示す画素のいずれか一方を第1分類に属する画素として示すテキストマップを取得する第1分類マップ取得部と、
上記デジタル画像上の第1画素位置に対応する、上記テキストマップ上の第1画素位置を特定する第1画素位置特定部と、
上記デジタル画像上の第1画素位置に対応する第1の評価色として、当該デジタル画像上の第1画素位置の近接領域に位置するとともに、上記第1分類に属する画素の色の代表値を算出する第1評価色算出部と、
上記第1の評価色と上記デジタル画像上の上記第1画素位置の画素の色との第1色差を算出する第1色差算出部と、
上記第1色差が第1閾値よりも小さい場合、上記テキストマップ上の上記第1画素位置の画素が上記第1分類に属することを示すように、上記テキストマップを補正する第1補正部と、
を備えることを特徴とするシステム。 - 上記デジタル画像上の第1画素位置に対応する第2の評価色として、当該デジタル画像上の第1画素位置の近接領域に位置するとともに、上記第1分類に属さない画素の色の代表値を算出する第2評価色算出部と、
上記第2の評価色と上記デジタル画像上の上記第1画素位置の画素の色との第2色差を算出する第2色差算出部と、
上記第2色差が第2閾値よりも小さい場合、上記テキストマップ上の第1画素位置の画素が上記第1分類に属さないことを示すように、上記テキストマップを補正する第2補正部と、
を備えることを特徴とする請求項6に記載のシステム。 - 上記テキストマップと上記デジタル画像とが同じ解像度であることを特徴とする請求項6または7に記載のシステム。
- 上記テキストマップと上記デジタル画像とが異なる解像度であることを特徴とする請求項6または7に記載のシステム。
- 上記第1分類に属する画素の色の代表値は、当該画素の色の平均値、当該画素の色の中央値、当該画素の色のトリム平均値、当該画素の色の重み平均値の何れかであることを特徴とする請求項6から9の何れか1項に記載のシステム。
- デジタル画像の画素の分類方法であって、
上記デジタル画像に対してテキスト区分アルゴリズムを適用して予め作成された、上記デジタル画像におけるテキストを示す画素を示すテキストマップを取得する第1ステップと、
上記デジタル画像上の第1画素位置に対応する、上記テキストマップ上の第1画素位置を特定する第2ステップと、
上記デジタル画像上の第1画素位置に対応するテキスト評価色として、当該デジタル画像上の第1画素位置の近接領域に位置するとともに、上記テキストマップにおいてテキスト画素として分類されている画素の色の代表値を算出する第3ステップと、
上記テキスト評価色と上記デジタル画像上の上記第1画素位置の画素の色との差分であるテキスト色差を算出する第4ステップと、
上記デジタル画像上の第1画素位置に対応する背景評価色として、当該デジタル画像上の第1画素位置の近接領域に位置するとともに、上記テキストマップにおいてテキスト画素として分類されていない画素の色の代表値を算出する第5ステップと、
上記背景評価色と上記デジタル画像上の上記第1画素位置の画素の色との背景色差を算出する第6ステップと、
上記テキスト色差が第1閾値よりも小さく、かつ、上記テキストマップにおける第1画素位置の画素がテキスト画素として分類されていない場合、テキストマップにおいて、上記第1画素位置の画素をテキスト画素として補正する第7ステップと、
上記背景色差が第2閾値よりも小さく、かつ、上記テキストマップにおける第1画素位置の画素がテキスト画素として分類されている場合、テキストマップにおいて、上記第1画素位置の画素を非テキスト画素として補正する第8ステップと、
を含むことを特徴とする画素の分類方法。 - 上記テキストマップと上記デジタル画像とが同じ解像度であることを特徴とする請求項11に記載の画素の分類方法。
- 上記テキストマップと上記デジタル画像とが異なる解像度であることを特徴とする請求項11に記載の画素の分類方法。
- 上記背景評価色と上記テキスト評価色との差分である背景−テキスト色差を算出し、当該背景−テキスト色差が第3閾値よりも小さい場合に、上記第1画素位置の画素を非テキスト画素として補正する第9ステップをさらに含むことを特徴とする請求項11から13の何れか1項に記載の画素の分類方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/679,357 US8280157B2 (en) | 2007-02-27 | 2007-02-27 | Methods and systems for refining text detection in a digital image |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008211802A JP2008211802A (ja) | 2008-09-11 |
JP4498425B2 true JP4498425B2 (ja) | 2010-07-07 |
Family
ID=39715972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008045119A Expired - Fee Related JP4498425B2 (ja) | 2007-02-27 | 2008-02-26 | デジタル画像の画素を分類する方法およびシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8280157B2 (ja) |
JP (1) | JP4498425B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008310817A (ja) * | 2007-06-18 | 2008-12-25 | Sharp Corp | テキストマップの中からライン構造を検出する方法および画像処理装置 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8014596B2 (en) * | 2007-10-30 | 2011-09-06 | Sharp Laboratories Of America, Inc. | Methods and systems for background color extrapolation |
US9058522B2 (en) * | 2013-03-15 | 2015-06-16 | Arris Technology, Inc. | Logo presence detection based on blending characteristics |
US9165203B2 (en) * | 2013-03-15 | 2015-10-20 | Arris Technology, Inc. | Legibility enhancement for a logo, text or other region of interest in video |
US9805472B2 (en) * | 2015-02-18 | 2017-10-31 | Sony Corporation | System and method for smoke detection during anatomical surgery |
RU2697737C2 (ru) * | 2016-10-26 | 2019-08-19 | Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-воздушных сил "Военно-воздушная академия имени профессора Н.Е. Жуковского и Ю.А. Гагарина" (г. Воронеж) Министерства обороны Российской Федерации | Способ обнаружения и локализации текстовых форм на изображениях |
US11776129B2 (en) * | 2020-12-16 | 2023-10-03 | Qualcomm Incorporated | Semantic refinement of image regions |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000182053A (ja) * | 1998-12-15 | 2000-06-30 | Toshiba Corp | 映像処理方法及び装置並びに映像処理手順を記録した記録媒体 |
JP2004048814A (ja) * | 2003-11-04 | 2004-02-12 | Sharp Corp | 画像処理装置および画像処理方法 |
JP2004214908A (ja) * | 2002-12-27 | 2004-07-29 | Sharp Corp | 画像処理装置、及びそれを備えた画像形成装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69223850T2 (de) * | 1991-05-30 | 1998-05-14 | Canon Kk | Kompressionssteigerung bei graphischen Systemen |
US7609402B2 (en) * | 2001-01-19 | 2009-10-27 | Flexiworld, Inc. | Methods for universal data output |
US7043080B1 (en) * | 2000-11-21 | 2006-05-09 | Sharp Laboratories Of America, Inc. | Methods and systems for text detection in mixed-context documents using local geometric signatures |
US6778700B2 (en) * | 2001-03-14 | 2004-08-17 | Electronics For Imaging, Inc. | Method and apparatus for text detection |
US8103104B2 (en) * | 2002-01-11 | 2012-01-24 | Hewlett-Packard Development Company, L.P. | Text extraction and its application to compound document image compression |
EP1514236A2 (en) * | 2002-06-03 | 2005-03-16 | Koninklijke Philips Electronics N.V. | Adaptive scaling of video signals |
US7085420B2 (en) * | 2002-06-28 | 2006-08-01 | Microsoft Corporation | Text detection in continuous tone image segments |
US7280673B2 (en) * | 2003-10-10 | 2007-10-09 | Intellivid Corporation | System and method for searching for changes in surveillance video |
CN1310182C (zh) * | 2003-11-28 | 2007-04-11 | 佳能株式会社 | 用于增强文档图像和字符识别的方法和装置 |
US7362474B2 (en) * | 2004-06-07 | 2008-04-22 | Lite-On Technology Corp. | Printing quality enhancement via graphic/text detection method in compression (JPEG) image |
JP2006229817A (ja) * | 2005-02-21 | 2006-08-31 | Sharp Corp | 下地検出方法、プログラム、記録媒体、画像処理装置及び画像形成装置 |
-
2007
- 2007-02-27 US US11/679,357 patent/US8280157B2/en active Active
-
2008
- 2008-02-26 JP JP2008045119A patent/JP4498425B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000182053A (ja) * | 1998-12-15 | 2000-06-30 | Toshiba Corp | 映像処理方法及び装置並びに映像処理手順を記録した記録媒体 |
JP2004214908A (ja) * | 2002-12-27 | 2004-07-29 | Sharp Corp | 画像処理装置、及びそれを備えた画像形成装置 |
JP2004048814A (ja) * | 2003-11-04 | 2004-02-12 | Sharp Corp | 画像処理装置および画像処理方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008310817A (ja) * | 2007-06-18 | 2008-12-25 | Sharp Corp | テキストマップの中からライン構造を検出する方法および画像処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2008211802A (ja) | 2008-09-11 |
US20080205753A1 (en) | 2008-08-28 |
US8280157B2 (en) | 2012-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10455117B2 (en) | Image processing apparatus, method, and storage medium | |
JP4498422B2 (ja) | 画素の分類方法および画像処理装置 | |
JP4498425B2 (ja) | デジタル画像の画素を分類する方法およびシステム | |
JP4340701B2 (ja) | デジタル画像のテキストを識別する方法およびシステム | |
CN110008954B (zh) | 一种基于多阈值融合的复杂背景文本图像提取方法及系统 | |
US7379594B2 (en) | Methods and systems for automatic detection of continuous-tone regions in document images | |
US8244031B2 (en) | System and method for identifying and classifying color regions from a digital image | |
US6865290B2 (en) | Method and apparatus for recognizing document image by use of color information | |
JP4745296B2 (ja) | デジタル画像の領域分離方法および領域分離システム | |
US8121403B2 (en) | Methods and systems for glyph-pixel selection | |
EP1327955A2 (en) | Text extraction from a compound document | |
US10699110B2 (en) | Image processing apparatus, image processing method, and non-transitory recording medium storing program for causing computer to execute image processing method | |
US9171224B2 (en) | Method of improving contrast for text extraction and recognition applications | |
JP4522468B2 (ja) | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 | |
US9158987B2 (en) | Image processing device that separates image into plural regions | |
JP4764903B2 (ja) | テキストマップの中からライン構造を検出する方法および画像処理装置 | |
US9064179B2 (en) | Region extraction apparatus, region extraction method, and computer program product | |
US8223395B2 (en) | Methods and systems for refining text color in a digital image | |
US8472716B2 (en) | Block-based noise detection and reduction method with pixel level classification granularity | |
JP2007234007A (ja) | デジタル画像の領域を検知する方法およびシステム | |
EP1619605B1 (en) | Image processing device, image processing method, image processing program, and computer-readable recording medium containing the program for dealing with inverted characters | |
US8542931B2 (en) | Ruled line extraction technique based on comparision results and indentifying noise based on line thickness | |
US8830545B2 (en) | Document image processing system including pixel color substitution | |
JP6441772B2 (ja) | 画像処理装置、画像形成装置、及び、画像処理方法 | |
JP2009071736A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100316 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100413 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4498425 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |