JP6100744B2 - 自動修復を用いたカラー文書画像セグメンテーション及び二値化 - Google Patents
自動修復を用いたカラー文書画像セグメンテーション及び二値化 Download PDFInfo
- Publication number
- JP6100744B2 JP6100744B2 JP2014188924A JP2014188924A JP6100744B2 JP 6100744 B2 JP6100744 B2 JP 6100744B2 JP 2014188924 A JP2014188924 A JP 2014188924A JP 2014188924 A JP2014188924 A JP 2014188924A JP 6100744 B2 JP6100744 B2 JP 6100744B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- local
- foreground
- document image
- mask
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003709 image segmentation Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 4
- 230000008439 repair process Effects 0.000 description 12
- 238000000926 separation method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000010339 dilation Effects 0.000 description 3
- 230000003628 erosive effect Effects 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
Description
他の側面では、本発明は、データ処理装置に上記処理を実行させるプログラムが記憶された非一時的記憶媒体を提供する。
(ただし、IはN×N画像画素の局所ウィンドウである。)
より高度なコントラストは、パーセンタイルを用いたヒストグラムに基づいて計算することができる。
(ただし、pu及びplは上位及び下位のパーセンタイルである。)
例えば、pu=0.95、pl=0.05である。これにより、計算された局所コントラストはノイズ障害により強くなる。テクスチャは、様々な方法で計算しうる。広く用いられるのは、ガボールフィルタに基づく方法である(Grigorescu S、Petkov N及びKruizinga P著、「Comparison of texture features based on Gabor filters」、IEEE Transactions on Image Processing、第11巻、1160〜1167ページ、2002年参照)。
Claims (19)
- バックグラウンド内容及びフォアグラウンド内容を含む文書画像を処理するコンピューターにより実行される方法であって、
(a)局所特徴の高い値を有する前記文書画像の領域を示す二値マップである、前記フォアグラウンド内容に対応するフォアグラウンドマスクを生成する工程と、
(b)前記文書画像について、前記フォアグラウンドマスクにより示される領域に所定の色を割り当てることにより修復を行い、バックグラウンド画像を生成する工程と、
(c)前記文書画像と前記バックグラウンド画像との差分画像を計算する工程と、
(d)前記差分画像を二値化して二値フォアグラウンド画像を生成する工程と、
を有することを特徴とする方法。 - 前記工程(a)は、
(a1)前記文書画像の各画素について、局所ウィンドウ内の最大局所特徴を計算し、最大局所特徴マップを生成する工程と、
(a2)前記最大局所特徴マップを二値化して前記フォアグラウンドマスクを生成する工程と、
を有することを特徴とする請求項1に記載の方法。 - 前記文書画像はカラー画像であり、
前記文書画像の各画素は、一以上のデータチャンネルに対応する一以上の画素値を有し、
前記工程(a1)は、前記文書画像の各画素について、前記一以上のデータチャンネルの各々に対する前記局所ウィンドウ内の局所特徴を計算する工程を有し、
前記最大局所特徴は、前記一以上のデータチャンネルのすべての前記局所特徴のうち最大のものであることを特徴とする請求項2に記載の方法。 - 前記局所特徴は、局所分散、局所コントラスト、局所テクスチャ、局所勾配又は局所位相一致であることを特徴とする請求項3に記載の方法。
- 前記工程(a)は、前記工程(a2)の後に、前記フォアグラウンドマスクの穴を埋める工程を更に有することを特徴とする請求項2から4のいずれか一項に記載の方法。
- 前記工程(a)は、前記工程(a2)の後に、前記フォアグラウンドマスクから、ノイズ及び線を含む望ましくない成分を取り除く工程を更に有することを特徴とする請求項2から5のいずれか一項に記載の方法。
- 前記工程(a)の前に、前記文書画像を倍率で縮小する工程であって、縮小された前記文書画像を用いて前記工程(a)及び前記工程(b)を行う工程と、
前記工程(b)の後であって前記工程(c)の前に、前記バックグラウンド画像を前記倍率で拡大する工程であって、縮小前の前記文書画像及び拡大された前記バックグラウンド画像を用いて前記工程(c)を行う工程と、
を更に有することを特徴とする請求項1から6のいずれか一項に記載の方法。 - 前記工程(d)の後に、
(e)前記二値フォアグラウンド画像からノイズ及び線を含む望ましくない成分を取り除く工程を更に有することを特徴とする請求項1から7のいずれか一項に記載の方法。 - 前記工程(d)の後に、前記工程(d)で生成された前記二値フォアグラウンド画像を第2のマスクとして使用し、前記文書画像について、前記第2のマスクにより示される領域に所定の色を割り当てることにより修復することでバックグラウンド画像を生成する工程を更に有することを特徴とする請求項1から8のいずれか一項に記載の方法。
- データ処理装置に、バックグラウンド内容及びフォアグラウンド内容を含む文書画像の処理を実行させるプログラムであって、前記処理は、
(a)局所特徴の高い値を有する前記文書画像の領域を示す二値マップである、前記フォアグラウンド内容に対応するフォアグラウンドマスクを生成する工程と、
(b)前記文書画像について、前記フォアグラウンドマスクにより示される領域に所定の色を割り当てることにより修復を行い、バックグラウンド画像を生成する工程と、
(c)前記文書画像と前記バックグラウンド画像との差分画像を計算する工程と、
(d)前記差分画像を二値化して二値フォアグラウンド画像を生成する工程と、
を有することを特徴とするプログラム。 - 前記工程(a)は、
(a1)前記文書画像の各画素について、局所ウィンドウ内の最大局所特徴を計算し、最大局所特徴マップを生成する工程と、
(a2)前記最大局所特徴マップを二値化して前記フォアグラウンドマスクを生成する工程と、
を有することを特徴とする請求項10に記載のプログラム。 - 前記文書画像はカラー画像であり、
前記文書画像の各画素は、一以上のデータチャンネルに対応する一以上の画素値を有し、
前記工程(a1)は、前記文書画像の各画素について、前記一以上のデータチャンネルの各々に対する前記局所ウィンドウ内の局所特徴を計算する工程を有し、
前記最大局所特徴は、前記一以上のデータチャンネルのすべての前記局所特徴のうち最大のものであることを特徴とする請求項11に記載のプログラム。 - 前記局所特徴は、局所分散、局所コントラスト、局所テクスチャ、局所勾配又は局所位相一致であることを特徴とする請求項12に記載のプログラム。
- 前記工程(a)は、前記工程(a2)の後に、前記フォアグラウンドマスクの穴を埋める工程を更に有することを特徴とする請求項11から13のいずれか一項に記載のプログラム。
- 前記工程(a)は、前記工程(a2)の後に、前記フォアグラウンドマスクから、ノイズ及び線を含む望ましくない成分を取り除く工程を更に有することを特徴とする請求項11から14のいずれか一項に記載のプログラム。
- 前記処理は、
前記工程(a)の前に、前記文書画像を倍率で縮小する工程であって、縮小された前記文書画像を用いて前記工程(a)及び前記工程(b)を行う工程と、
前記工程(b)の後であって前記工程(c)の前に、前記バックグラウンド画像を前記倍率で拡大する工程であって、縮小前の前記文書画像及び拡大された前記バックグラウンド画像を用いて前記工程(c)を行う工程と、
を更に有することを特徴とする請求項10から15のいずれか一項に記載のプログラム。 - 前記処理は、前記工程(d)の後に、
(e)前記二値フォアグラウンド画像からノイズ及び線を含む望ましくない成分を取り除く工程を更に有することを特徴とする請求項10から16のいずれか一項に記載のプログラム。 - 前記処理は、前記工程(d)の後に、前記工程(d)で生成された前記二値フォアグラウンド画像を第2のマスクとして使用し、前記文書画像について、前記第2のマスクにより示される領域に所定の色を割り当てることにより修復することでバックグラウンド画像を生成する工程を更に有することを特徴とする請求項10から17のいずれか一項に記載のプログラム。
- 請求項10から18のいずれか一項に記載のプログラムが記憶されていることを特徴とする非一時的記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/035,855 | 2013-09-24 | ||
US14/035,855 US9042649B2 (en) | 2013-09-24 | 2013-09-24 | Color document image segmentation and binarization using automatic inpainting |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015065654A JP2015065654A (ja) | 2015-04-09 |
JP6100744B2 true JP6100744B2 (ja) | 2017-03-22 |
Family
ID=52690995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014188924A Active JP6100744B2 (ja) | 2013-09-24 | 2014-09-17 | 自動修復を用いたカラー文書画像セグメンテーション及び二値化 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9042649B2 (ja) |
JP (1) | JP6100744B2 (ja) |
CN (1) | CN104463161B (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9842281B2 (en) * | 2014-06-05 | 2017-12-12 | Xerox Corporation | System for automated text and halftone segmentation |
RU2015102523A (ru) * | 2015-01-27 | 2016-08-20 | Общество с ограниченной ответственностью "Аби Девелопмент" | "умный" ластик |
CN105528784B (zh) * | 2015-12-02 | 2019-01-25 | 沈阳东软医疗系统有限公司 | 一种前景背景分割的方法和装置 |
CN106530279B (zh) * | 2016-10-15 | 2019-04-16 | 扬州奥泰光电生物技术有限公司 | 一种图像处理方法及系统 |
US10922801B2 (en) | 2017-07-19 | 2021-02-16 | Lockheed Martin Corporation | Channel-based binarization of color |
CN108510475B (zh) * | 2018-03-09 | 2022-03-29 | 南京合迈美家智能科技有限公司 | 一种肌肉连续超声图像中肌肉肌腱结的测量方法及系统 |
AU2019323401B2 (en) * | 2018-08-21 | 2023-06-01 | Huawei Technologies Co., Ltd. | Binarization and normalization-based inpainting for removing text |
US11915350B2 (en) * | 2018-08-29 | 2024-02-27 | Intel Corporation | Training one-shot instance segmenters using synthesized images |
US10832085B2 (en) | 2018-09-06 | 2020-11-10 | International Business Machines Corporation | Image binarization using mean restrain |
US11023747B2 (en) * | 2019-03-05 | 2021-06-01 | Here Global B.V. | Method, apparatus, and system for detecting degraded ground paint in an image |
CN109816615B (zh) * | 2019-03-06 | 2022-12-16 | 腾讯科技(深圳)有限公司 | 图像修复方法、装置、设备以及存储介质 |
WO2020211021A1 (zh) * | 2019-04-17 | 2020-10-22 | 京东方科技集团股份有限公司 | 图像的处理方法及装置、数据传输方法及装置、存储介质 |
CN110703961A (zh) * | 2019-08-26 | 2020-01-17 | 北京达佳互联信息技术有限公司 | 蒙层显示方法、装置、电子设备和存储介质 |
CN110717523A (zh) * | 2019-09-20 | 2020-01-21 | 湖北工业大学 | 一种基于D-LinkNet的低质量文档图像二值化方法 |
US10764471B1 (en) * | 2019-09-27 | 2020-09-01 | Konica Minolta Business Solutions U.S.A., Inc. | Customized grayscale conversion in color form processing for text recognition in OCR |
CN113256490A (zh) * | 2020-02-13 | 2021-08-13 | 北京小米松果电子有限公司 | 文档图像的处理方法、装置及介质 |
KR102694888B1 (ko) * | 2021-06-07 | 2024-08-13 | 주식회사 엘지유플러스 | 제스처 분류기 학습방법 및 이를 이용한 제스처 추론 방법 |
US20230005107A1 (en) * | 2021-06-30 | 2023-01-05 | Palo Alto Research Center Incorporated | Multi-task text inpainting of digital images |
CN113538498B (zh) * | 2021-08-02 | 2022-06-28 | 重庆傲雄在线信息技术有限公司 | 一种基于局部二值化的印章图像分割方法、电子设备和可读存储介质 |
CN114972371B (zh) * | 2022-03-11 | 2024-08-06 | 湖北工业大学 | 用于对抗阴影区干涉行为的文档图像二值化系统及方法 |
US20230385992A1 (en) * | 2022-05-25 | 2023-11-30 | Adobe Inc. | Generating modified digital images via image inpainting using multi-guided patch match and intelligent curation |
CN114998149A (zh) * | 2022-06-16 | 2022-09-02 | 北京有竹居网络技术有限公司 | 图像修复模型的训练方法及图像修复方法、装置及设备 |
CN118135951B (zh) * | 2024-01-09 | 2024-09-06 | 天宜微电子(杭州)有限公司 | 显示驱动装置、显示装置及显示驱动方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0624014B2 (ja) * | 1986-08-01 | 1994-03-30 | 株式会社日立製作所 | 濃淡画像の処理方法 |
EP1388815A3 (en) * | 2002-04-25 | 2005-11-16 | Microsoft Corporation | Segmented layered image system |
US7146059B1 (en) | 2003-03-05 | 2006-12-05 | Massachusetts Institute Of Technology | Method of performing fast bilateral filtering and using the same for the display of high-dynamic-range images |
JP2006094008A (ja) * | 2004-09-22 | 2006-04-06 | Ricoh Co Ltd | 画像処理装置 |
DE602005026862D1 (de) * | 2004-12-21 | 2011-04-21 | Canon Kk | Segmentierung eines digitalen bildes und herstellung einer kompakten repräsentation |
WO2008136933A1 (en) * | 2007-05-07 | 2008-11-13 | Thomson Licensing | Method and apparatus for processing video sequences |
CN101236606B (zh) * | 2008-03-07 | 2010-12-08 | 北京中星微电子有限公司 | 视频监控中的阴影消除方法及系统 |
EP2316109B1 (en) * | 2008-07-28 | 2017-12-13 | Koninklijke Philips N.V. | Use of inpainting techniques for image correction |
CN101616310B (zh) * | 2009-07-17 | 2011-05-11 | 清华大学 | 可变视角及分辨率的双目视觉系统目标图像稳定化方法 |
JP4947136B2 (ja) * | 2009-12-25 | 2012-06-06 | カシオ計算機株式会社 | 画像処理装置、画像処理方法及びプログラム |
KR101669820B1 (ko) * | 2010-07-02 | 2016-10-27 | 삼성전자주식회사 | 볼륨 예측 기반 폐색 영역 양방향 복원 장치 및 방법 |
KR20120049636A (ko) * | 2010-11-09 | 2012-05-17 | 삼성전자주식회사 | 영상 처리 장치 및 방법 |
-
2013
- 2013-09-24 US US14/035,855 patent/US9042649B2/en active Active
-
2014
- 2014-09-17 JP JP2014188924A patent/JP6100744B2/ja active Active
- 2014-09-24 CN CN201410493986.0A patent/CN104463161B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN104463161A (zh) | 2015-03-25 |
CN104463161B (zh) | 2018-10-12 |
US9042649B2 (en) | 2015-05-26 |
US20150086112A1 (en) | 2015-03-26 |
JP2015065654A (ja) | 2015-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6100744B2 (ja) | 自動修復を用いたカラー文書画像セグメンテーション及び二値化 | |
US9251614B1 (en) | Background removal for document images | |
US20190266706A1 (en) | Removal of shadows from document images while preserving fidelity of image contents | |
US9438769B1 (en) | Preserving smooth-boundaried objects of an image | |
KR20130016213A (ko) | 광학 문자 인식되는 텍스트 영상의 텍스트 개선 | |
CN108830857B (zh) | 一种自适应的汉字碑帖图像二值化分割方法 | |
Rowley-Brooke et al. | A non-parametric framework for document bleed-through removal | |
CN107174232A (zh) | 一种心电图波形提取方法 | |
CN114283156A (zh) | 一种用于去除文档图像颜色及手写笔迹的方法及装置 | |
CN111192241A (zh) | 一种人脸图像的质量评估方法、装置及计算机存储介质 | |
Nair et al. | A two phase denoising approach to remove uneven illumination from ancient note book images | |
CN111445402B (zh) | 一种图像去噪方法及装置 | |
Boiangiu et al. | Methods of bitonal image conversion for modern and classic documents | |
US11069043B1 (en) | Background noise reduction using a variable range of color values dependent upon the initial background color distribution | |
CN109934215B (zh) | 一种身份证识别方法 | |
CN111369491B (zh) | 图像污点检测方法、装置、系统及存储介质 | |
RU2520407C1 (ru) | Способ и система улучшения текста при цифровом копировании печатных документов | |
Ndjiki-Nya et al. | Automatic structure-aware inpainting for complex image content | |
CN113496470A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
JP2021182328A (ja) | 文字認識装置及び文字認識方法 | |
JP7402931B2 (ja) | 方法、コンピュータ可読プログラムおよびシステム | |
Konya et al. | Adaptive methods for robust document image understanding | |
US11778122B2 (en) | Apparatus, method, and storage medium for removing shading dots | |
CN112785508B (zh) | 一种电子文档图片去噪的方法和装置 | |
Boussellaa et al. | PRAAD: preprocessing and analysis tool for Arabic ancient documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160923 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6100744 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |