JP2007174654A - 文書画像を示す走査データを処理するための方法 - Google Patents
文書画像を示す走査データを処理するための方法 Download PDFInfo
- Publication number
- JP2007174654A JP2007174654A JP2006339320A JP2006339320A JP2007174654A JP 2007174654 A JP2007174654 A JP 2007174654A JP 2006339320 A JP2006339320 A JP 2006339320A JP 2006339320 A JP2006339320 A JP 2006339320A JP 2007174654 A JP2007174654 A JP 2007174654A
- Authority
- JP
- Japan
- Prior art keywords
- text
- data
- image
- background
- objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】文書画像を示す走査データを処理するための方法において、走査データを背景及びフォアグラウンドの各レイヤにセグメント化し、フォアグラウンドレイヤ候補のデータを含む走査データを複数のウインドウに表示し、該複数のウインドウのそれぞれが背景レイヤデータに隣接するように識別され得る選択された領域を含み、テキスト、図形、及び画像のそれぞれのオブジェクトを含むオブジェクトを、これら複数のウインドウから抽出し、オブジェクトがオブジェクト周辺との間に所定のコントラスト・レベルを有することに基づいてオブジェクトを分類し、これにより改良された再生画像品質で高圧縮比を達成するためのデータをセグメント化する。
【選択図】図5
Description
Claims (4)
- 改良された再生画像品質で高圧縮比を達成するためにデータをセグメント化することを含む、文書画像を示す走査データを処理するための方法であって、
走査データを背景及びフォアグラウンドの各レイヤにセグメント化するステップと、
フォアグラウンドレイヤ候補のデータを含む走査データを複数のウインドウに表示することであって、該複数のウインドウのそれぞれが背景レイヤデータに隣接するように識別され得る選択された領域を含む、前記ウインドウに表示するステップと、
テキスト、図形、及び画像のそれぞれのオブジェクトを含むオブジェクトを、前記複数のウインドウから抽出するステップと、
オブジェクトがオブジェクト周辺との間に所定のコントラスト・レベルを有することに基づいてオブジェクトを分類するステップと、
を含む、文書画像を示す走査データを処理するための方法。 - 前記背景レイヤのセグメント化するステップが、画素強度を表す複数のヒストグラムを作成し、これらヒストグラムの1つがテキスト及び走査データの黒っぽい領域を示し、他のヒストグラムが走査データの非テキスト領域及びより明るい領域を示す、請求項1に記載の方法。
- 前記分類するステップは、背景レイヤデータに対するコントラスト識別性によってテキスト、図形、及び画像のそれぞれのオブジェクトを識別し、テキスト・オブジェクトが比較的最も低いレベルのコントラストで、図形オブジェクトが次のレベルのコントラストで、画像オブジェクトが比較的最も高いレベルのコントラストでそれぞれ表示され、個々のレベル・コントラストが予め選択されたしきい値によって定義される、請求項1に記載の方法。
- 前記オブジェクトを抽出するステップは、背景レイヤに対してテキスト・オブジェクトを識別するための第1のテキスト・セットと、背景レイヤに対して図形オブジェクトを識別するための第2の図形セットと、背景レイヤに対して画像オブジェクトを識別するための第3の画像セットと、を含む、抽出パラメータ・セットに基づく、請求項1に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/313980 | 2005-12-21 | ||
US11/313,980 US7379593B2 (en) | 2005-12-21 | 2005-12-21 | Method for image segmentation from proved detection of background and text image portions |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007174654A true JP2007174654A (ja) | 2007-07-05 |
JP4994017B2 JP4994017B2 (ja) | 2012-08-08 |
Family
ID=38173559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006339320A Expired - Fee Related JP4994017B2 (ja) | 2005-12-21 | 2006-12-18 | 文書画像を示す走査データを処理するための方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7379593B2 (ja) |
JP (1) | JP4994017B2 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8204306B2 (en) * | 2004-06-14 | 2012-06-19 | Xerox Corporation | Method for image segmentation based on block clustering for improved processing of touching characters |
JP4277218B2 (ja) * | 2005-02-07 | 2009-06-10 | ソニー株式会社 | 記録再生装置、その方法及びプログラム |
US7664329B2 (en) * | 2006-03-02 | 2010-02-16 | Honeywell International Inc. | Block-based Gaussian mixture model video motion detection |
US7763876B2 (en) * | 2007-04-06 | 2010-07-27 | Xerox Corporation | Gloss and differential gloss measuring system |
US8218887B2 (en) * | 2007-09-28 | 2012-07-10 | Abbyy Software, Ltd. | Enhanced method of multilayer compression of PDF (image) files using OCR systems |
US7764893B2 (en) * | 2008-01-31 | 2010-07-27 | Xerox Corporation | Use of customer documents for gloss measurements |
US8077358B2 (en) * | 2008-04-24 | 2011-12-13 | Xerox Corporation | Systems and methods for implementing use of customer documents in maintaining image quality (IQ)/image quality consistency (IQC) of printing devices |
US8150106B2 (en) | 2008-04-30 | 2012-04-03 | Xerox Corporation | Printer characterization, monitoring and diagnosis using dynamic test patterns generated by sensing and analyzing customer documents |
US8208183B2 (en) * | 2008-11-19 | 2012-06-26 | Xerox Corporation | Detecting image quality defects by measuring images printed on image bearing surfaces of printing devices |
JP2010205067A (ja) * | 2009-03-04 | 2010-09-16 | Fujifilm Corp | 領域抽出装置、領域抽出方法及び領域抽出プログラム |
KR101058726B1 (ko) * | 2009-11-11 | 2011-08-22 | 삼성전자주식회사 | 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법 |
US8340363B2 (en) | 2010-05-27 | 2012-12-25 | Palo Alto Research Center Incorporated | System and method for efficient interpretation of images in terms of objects and their parts |
CN102456219B (zh) * | 2010-10-14 | 2014-09-03 | 北大方正集团有限公司 | 光栅化方法和装置 |
US8306335B2 (en) * | 2011-03-30 | 2012-11-06 | Seiko Epson Corporation | Method of analyzing digital document images |
JP6205221B2 (ja) * | 2013-09-20 | 2017-09-27 | 理想科学工業株式会社 | 印刷制御装置、及び、プログラム |
US9740995B2 (en) * | 2013-10-28 | 2017-08-22 | Morningstar, Inc. | Coordinate-based document processing and data entry system and method |
CN105608459B (zh) | 2014-10-29 | 2018-09-14 | 阿里巴巴集团控股有限公司 | 商品图片的分割方法及其装置 |
CN108961316B (zh) * | 2017-05-23 | 2022-05-31 | 华为技术有限公司 | 图像处理方法、装置及服务器 |
US11995511B2 (en) | 2018-02-08 | 2024-05-28 | Digimarc Corporation | Methods and arrangements for localizing machine-readable indicia |
US10958807B1 (en) * | 2018-02-08 | 2021-03-23 | Digimarc Corporation | Methods and arrangements for configuring retail scanning systems |
US10880451B2 (en) | 2018-06-08 | 2020-12-29 | Digimarc Corporation | Aggregating detectability metrics to determine signal robustness |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11261833A (ja) * | 1998-03-11 | 1999-09-24 | Fuji Xerox Co Ltd | 画像処理装置、画像送信装置 |
JP2001223903A (ja) * | 1999-12-04 | 2001-08-17 | Luratech Ges Fuer Luft & Raumfahrttechnologie & Multimedia Mbh | 走査された色付きおよびグレースケールの文書を圧縮する方法 |
JP2004056790A (ja) * | 2002-07-01 | 2004-02-19 | Xerox Corp | 画像信号を一組の画像プレーンに分離するセグメント化方法及びシステム |
JP2005020227A (ja) * | 2003-06-25 | 2005-01-20 | Pfu Ltd | 画像圧縮装置 |
JP2005294877A (ja) * | 2003-07-01 | 2005-10-20 | Xerox Corp | ドキュメントのマルチラスタコンテンツ(mrc)表現についてのセグメント化方法及びシステム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5767978A (en) * | 1997-01-21 | 1998-06-16 | Xerox Corporation | Image segmentation system |
DE60109278T2 (de) * | 2001-06-26 | 2006-03-30 | Nokia Corp. | Verfahren und Gerät zur Lokalisierung von Schriftzeichen in Bildern aus einer Digitalkamera |
-
2005
- 2005-12-21 US US11/313,980 patent/US7379593B2/en not_active Expired - Fee Related
-
2006
- 2006-12-18 JP JP2006339320A patent/JP4994017B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11261833A (ja) * | 1998-03-11 | 1999-09-24 | Fuji Xerox Co Ltd | 画像処理装置、画像送信装置 |
JP2001223903A (ja) * | 1999-12-04 | 2001-08-17 | Luratech Ges Fuer Luft & Raumfahrttechnologie & Multimedia Mbh | 走査された色付きおよびグレースケールの文書を圧縮する方法 |
JP2004056790A (ja) * | 2002-07-01 | 2004-02-19 | Xerox Corp | 画像信号を一組の画像プレーンに分離するセグメント化方法及びシステム |
JP2005020227A (ja) * | 2003-06-25 | 2005-01-20 | Pfu Ltd | 画像圧縮装置 |
JP2005294877A (ja) * | 2003-07-01 | 2005-10-20 | Xerox Corp | ドキュメントのマルチラスタコンテンツ(mrc)表現についてのセグメント化方法及びシステム |
Also Published As
Publication number | Publication date |
---|---|
JP4994017B2 (ja) | 2012-08-08 |
US20070140571A1 (en) | 2007-06-21 |
US7379593B2 (en) | 2008-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4994017B2 (ja) | 文書画像を示す走査データを処理するための方法 | |
US6973213B2 (en) | Background-based image segmentation | |
JP4745296B2 (ja) | デジタル画像の領域分離方法および領域分離システム | |
JP4590470B2 (ja) | 背景色を推定する方法およびシステム | |
US20180020118A1 (en) | Image processing apparatus, method, and storage medium | |
JP4667062B2 (ja) | 画像解析装置、画像解析方法、及びブロブ識別装置 | |
JP4745297B2 (ja) | デジタル画像における均一な色の領域を特定する方法およびシステム | |
Gllavata et al. | A robust algorithm for text detection in images | |
US6101274A (en) | Method and apparatus for detecting and interpreting textual captions in digital video signals | |
US7379594B2 (en) | Methods and systems for automatic detection of continuous-tone regions in document images | |
US20080056573A1 (en) | Methods and Systems for Identifying Text in Digital Images | |
JP2008148298A (ja) | 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体 | |
US9158987B2 (en) | Image processing device that separates image into plural regions | |
CN115330795A (zh) | 布匹毛刺缺陷检测方法 | |
US10496894B2 (en) | System and method for text localization in images | |
JP2007306560A (ja) | 文書画像データのページ境界の処理方法 | |
JP4441300B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 | |
JP2010186246A (ja) | 画像処理装置、方法、及び、プログラム | |
US20060269132A1 (en) | Apparatus and method for detecting white areas within windows and selectively merging the detected white areas into the enclosing window | |
Vu et al. | Automatic extraction of text regions from document images by multilevel thresholding and k-means clustering | |
Felhi et al. | Multiscale stroke-based page segmentation approach | |
Chang et al. | Color-texture segmentation of medical images based on local contrast information | |
JP4409713B2 (ja) | 文書画像認識装置及び記録媒体 | |
WO2002017220A1 (fr) | Procede d'extraction de zones de caracteres dans une image | |
Carel et al. | Multiresolution approach based on adaptive superpixels for administrative documents segmentation into color layers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120410 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120508 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |