JP2004178562A - グラフによる画像分割 - Google Patents
グラフによる画像分割 Download PDFInfo
- Publication number
- JP2004178562A JP2004178562A JP2003364140A JP2003364140A JP2004178562A JP 2004178562 A JP2004178562 A JP 2004178562A JP 2003364140 A JP2003364140 A JP 2003364140A JP 2003364140 A JP2003364140 A JP 2003364140A JP 2004178562 A JP2004178562 A JP 2004178562A
- Authority
- JP
- Japan
- Prior art keywords
- image
- rectangle
- pixels
- graph
- largest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
【解決手段】ピクセルから成る画像を複数のフィールドに分割する方法について説明されている。グラフは画像を表すように構成されている。最初に、隣合うピクセルの長方形領域であり且つ画像のバックグラウンドを示すバックグラウンド特性を有する分離要素が構成される。その後、異なる分離方向、特に水平方向および垂直方向にほぼ向けられる前記分離要素の交差部に基づいてグラフの頂点が規定され、フィールドセパレータに対応する頂点間でグラフの辺が規定される。最後に、グラフの辺は、フィールドを分離するラインとして判断される。
【選択図】 図8
Description
隣り合うピクセルの長方形領域に対応し且つ画像のバックグラウンドを示すバックグラウンド特性を有する分離要素を構成するステップと、
所定の分離方向、特に水平方向および垂直方向にほぼ向けられる前記分離要素の交差部に基づいてグラフの頂点を規定するステップ、およびフィールドセパレータに対応する頂点間のグラフの辺を規定するステップによって、画像のレイアウト構造を示すグラフを構成するステップと、
前記グラフの辺に対応するフィールドセパレータを規定するステップとを含む、
方法を提供することによって達成される。
画像を入力するための入力ユニットと、
画像のレイアウト構造を示すグラフを構成する処理ユニットとを備え、該処理ユニットが、
隣り合うピクセルの長方形領域に対応し且つ画像のバックグラウンドを示すバックグラウンド特性を有する分離要素を構成し、
異なる分離方向、特に水平方向および垂直方向にほぼ向けられる前記分離要素の交差部に基づいてグラフの頂点を規定し、
前記分離要素に対応する頂点間のグラフの辺を規定することによって前記グラフを構成する、装置を提供することによって達成される。
(a)水平方向のオーバーラップ
12 CCオブジェクト
13 レイアウトオブジェクト
14 CCAモジュール
15 LAモジュール
16 AFモジュール
17 記事
21 垂直方向の読み方向
22 水平方向の読み方向
23 黒ライン
31 最初の解析ステップ
32 算定閾値
33 分類ステップ
34 補正された連結成分
35 統合ステップ
36 オブジェクト
37 テキスト統合ステップ
38 テキストブロック
40、41 画像のグラフ
42 フィールド検出ステップ
43 連結成分
44 ステップ
45 読む順番
46 ライン形成ステップ
47 テキストブロック
51 ホワイトラン
52 最大白長方形
53 フォアグラウンド領域
61 ホワイトラン
62、63、64、65、66 最大白長方形
80 デジタル画像
81 グラフの頂点
82 辺
88 長方形領域
89 交点
91 入力ユニット
92 記憶ユニット
93 ディスプレイユニット
94 処理ユニット
95 ユーザインタフェース
MWR1、MWR2 最大白長方形
IWR 情報提供白長方形
Claims (15)
- ピクセルから成る複合画像を、画像のレイアウト要素に対応する複数のフィールドに分割する方法であって、前記ピクセルが、画素の強度および/または色を示す値を有し、前記分割する方法が、
画像の隣り合うピクセルの長方形領域に対応し且つ画像のバックグラウンドを示すバックグラウンド特性を有する分離要素を構成するステップと、
所定の分離方向、特に水平方向および垂直方向にほぼ向けられる前記分離要素の交差部に基づいてグラフの頂点を規定するステップ、およびフィールドセパレータに対応する頂点間のグラフの辺を規定するステップによって、画像のレイアウト構造を示すグラフを構成するステップと、
前記グラフの辺に対応するフィールドセパレータを規定するステップとを含む、方法。 - 頂点を規定するステップが、
所定の分離方向にほぼ向けられる分離要素のサブセットを構成するステップと、
両方のサブセットから分離要素の対間の交差部を決定するステップとを含む、請求項1に記載の方法。 - 交差部を決定するステップが、両方のサブセットから分離要素のオーバーラップ領域を決定するステップと、該オーバーラップ領域の中心に頂点を位置付けるステップとを含む、請求項2に記載の方法。
- グラフを構成するステップが、頂点間のユークリッド距離を示す辺に対して加重を割り当てるステップを含む、請求項1に記載の方法。
- 分割する方法が、最大長方形のセットを構成するステップをさらに含み、最大長方形が、分離方向のうちの1つにおける画像の長方形部分であって、画像のバックグラウンドを示すバックグラウンド特性を有するピクセルだけを含む可能な最大の面積を有し、
分割する方法がさらに、
クリーニングステップにおいて前記分離要素を構成するステップを含み、前記クリーニングステップにおいて、前記最大長方形セット内にある少なくとも1対のオーバーラップする最大長方形が、情報提供長方形に取って代えられ、前記情報提供長方形が、前記オーバーラップする最大長方形の対の領域を組み合わせた領域の長方形部分であり、該長方形部分が当該分離方向で最大の可能な長さを有している、請求項1から4のいずれか一項に記載の方法。 - 前記クリーニングステップが、以下の少なくとも1つのステップ、すなわち、
所定の値を下回る長さを有する最大長方形を削除するステップと、
所定の値を下回る幅を有する最大長方形を削除するステップと、
所定の値を下回る、長い辺の長さを短い辺の長さで割ったものであるアスペクト比を有する最大長方形を削除するステップとをさらに含んでいる、請求項5に記載の方法。 - 最大長方形を構成する前記ステップの前に、以下の少なくとも1つのステップ、すなわち、
孤立して外れたピクセルの値を、隣り合うピクセルの平均値に適合させることによりノイズを除去するステップと、
ピクセルを白または黒のいずれかに変換することによりハーフトーン化するステップと、
ダウンサンプリングによりピクセルの数を減少させるステップとによって、画像が予め処理される、請求項5または6に記載の方法。 - 最大長方形を構成する前記ステップの前に、前記バックグラウンド特性から逸脱するピクセル値のパターンを有する画像のフォアグラウンド内のオブジェクトである、特に黒ラインまたは破線または点線といったフォアグラウンドセパレータ要素を検出するとともに、検出されたフォアグラウンドセパレータのピクセルを、バックグラウンド特性を有するピクセルに取って代えることにより、画像がフィルタリングされる、請求項5から7のいずれか一項に記載の方法。
- 最大長方形を構成するステップが、
最大ランのリストを決定するステップを含み、前記最大ランが、バックグラウンド特性を有するピクセルの真っ直ぐなラインであり、該ラインが、バックグラウンド特性を有するピクセルだけを含む可能な最大の長さを有し、
前記最大長方形を構成するステップがさらに、
前記リストから特定の最大ランを長方形として取得するステップと、
次の最大ランに関し、当該次の最大ランが前記長方形のピクセルと幅方向で隣り合うピクセルを含んでいるか否かについて決定することにより、延長の可能性があるか否かについて前記長方形を検査するステップと、
延長の可能性がある場合には、次の最大ランおよび前記長方形のピクセルを含む最大面積を有する新たな長方形を構成することにより、前記長方形を延長するステップと、
延長の可能性がない場合には、前記長方形を前記最大長方形のセットに加えるステップと、
前記新たな長方形内に完全に含まれる任意の最大ランを前記リストから削除するステップとを含む、請求項5から8のいずれか一項に記載の方法。 - 分離要素を構成する前記ステップが、2つの直交する分離方向で画像を処理するステップを含む、請求項1から9のいずれか一項に記載の方法。
- 分離要素を構成する前記ステップが、前記バックグラウンド特性から逸脱するピクセル値のパターンを有する画像のフォアグラウンド内のオブジェクトであるグラフィック要素を検出するステップを含み、分離要素が、グラフィック要素の周囲に構成される、請求項1から10のいずれか一項に記載の方法。
- 少なくとも1つのフィールドが、テキストフィールドとして分類され、該テキストフィールド内で読む順番が検出されるとともに、フォアグラウンド成分が、前記読む順番で、前記テキストフィールド内のテキストラインに加えられる、請求項1に記載の方法。
- ピクセルから成る画像を複数のフィールドに分割するためのコンピュータプログラム製品であって、請求項1から12のいずれか一項に記載の方法をプロセッサに実行させるようにそのプログラムが動作する、コンピュータプログラム製品。
- ピクセルから成る複合画像を、画像のレイアウト要素に対応する複数のフィールドに分割する装置であって、前記ピクセルが、画素の強度および/または色を示す値を有し、前記分割する装置が、
画像を入力するための入力ユニット(91)と、
画像のレイアウト構造を示すグラフを構成する処理ユニット(94)とを備え、該処理ユニット(94)が、
隣り合うピクセルの長方形領域に対応し且つ画像のバックグラウンドを示すバックグラウンド特性を有する分離要素を構成し、
異なる分離方向、特に水平方向および垂直方向にほぼ向けられる前記分離要素の交差部に基づいてグラフの頂点を規定し、
前記分離要素に対応する頂点間のグラフの辺を規定することによって前記グラフを構成する、装置。 - 分割後に画像のフィールドを表示するディスプレイユニット(93)を備えている、請求項14に記載の装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02079880 | 2002-11-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004178562A true JP2004178562A (ja) | 2004-06-24 |
JP4538214B2 JP4538214B2 (ja) | 2010-09-08 |
Family
ID=32695562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003364140A Expired - Fee Related JP4538214B2 (ja) | 2002-11-22 | 2003-10-24 | グラフによる画像分割 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7570811B2 (ja) |
EP (1) | EP1439486B1 (ja) |
JP (1) | JP4538214B2 (ja) |
AT (1) | ATE418117T1 (ja) |
DE (1) | DE60325322D1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9898157B2 (en) | 2014-05-08 | 2018-02-20 | International Business Machines Corporation | Generation of a filter that separates elements to be displayed from elements constituting data |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7995841B2 (en) * | 2007-09-24 | 2011-08-09 | Microsoft Corporation | Hybrid graph model for unsupervised object segmentation |
TWI413937B (zh) * | 2008-08-11 | 2013-11-01 | Asia Optical Co Inc | 影像辨識方法與裝置 |
AU2010257298B2 (en) * | 2010-12-17 | 2014-01-23 | Canon Kabushiki Kaisha | Finding text regions from coloured image independent of colours |
US8478032B2 (en) * | 2011-05-24 | 2013-07-02 | Hewlett-Packard Development Company, L.P. | Segmenting an image |
CN104346615B (zh) * | 2013-08-08 | 2019-02-19 | 北大方正集团有限公司 | 版式文档中复合图的提取装置和提取方法 |
US9852114B2 (en) | 2014-06-18 | 2017-12-26 | Vmware, Inc. | HTML5 graph overlays for application topology |
US9740792B2 (en) | 2014-06-18 | 2017-08-22 | Vmware, Inc. | Connection paths for application topology |
US9836284B2 (en) * | 2014-06-18 | 2017-12-05 | Vmware, Inc. | HTML5 graph layout for application topology |
US9436445B2 (en) | 2014-06-23 | 2016-09-06 | Vmware, Inc. | Drag-and-drop functionality for scalable vector graphics |
US10839573B2 (en) * | 2016-03-22 | 2020-11-17 | Adobe Inc. | Apparatus, systems, and methods for integrating digital media content into other digital media content |
CN118397078A (zh) * | 2024-02-21 | 2024-07-26 | 成都维海德科技有限公司 | 屏幕定位方法、装置、电子设备及计算机可读存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6470095B2 (en) * | 1998-10-13 | 2002-10-22 | Xerox Corporation | Automatic extraction of text regions and region borders for an electronic work surface |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4288852A (en) * | 1979-11-28 | 1981-09-08 | General Motors Corporation | Method and apparatus for automatically determining sheet metal strain |
JPS6180374A (ja) * | 1984-09-21 | 1986-04-23 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 可変走査領域による細線化処理の方法及び装置 |
EP0461817A3 (en) * | 1990-06-15 | 1993-11-18 | American Telephone & Telegraph | Image segmenting apparatus and methods |
EP0472313B1 (en) * | 1990-08-03 | 1998-11-11 | Canon Kabushiki Kaisha | Image processing method and apparatus therefor |
US5335298A (en) * | 1991-08-19 | 1994-08-02 | The United States Of America As Represented By The Secretary Of The Army | Automated extraction of airport runway patterns from radar imagery |
JP2579397B2 (ja) * | 1991-12-18 | 1997-02-05 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 文書画像のレイアウトモデルを作成する方法及び装置 |
US5335290A (en) * | 1992-04-06 | 1994-08-02 | Ricoh Corporation | Segmentation of text, picture and lines of a document image |
US5680479A (en) * | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
US5321768A (en) * | 1992-09-22 | 1994-06-14 | The Research Foundation, State University Of New York At Buffalo | System for recognizing handwritten character strings containing overlapping and/or broken characters |
US5416849A (en) * | 1992-10-21 | 1995-05-16 | International Business Machines Corporation | Data processing system and method for field extraction of scanned images of document forms |
ATE196205T1 (de) * | 1993-06-30 | 2000-09-15 | Ibm | Verfahren zum segmentieren von bildern und klassifizieren von bildelementen zur dokumentverarbeitung |
US5588072A (en) * | 1993-12-22 | 1996-12-24 | Canon Kabushiki Kaisha | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks |
JPH07220091A (ja) * | 1994-02-04 | 1995-08-18 | Canon Inc | 画像処理装置及び方法 |
US5574802A (en) * | 1994-09-30 | 1996-11-12 | Xerox Corporation | Method and apparatus for document element classification by analysis of major white region geometry |
EP0724229B1 (en) * | 1994-12-28 | 2001-10-10 | Canon Kabushiki Kaisha | Image processing apparatus and method |
US5745596A (en) * | 1995-05-01 | 1998-04-28 | Xerox Corporation | Method and apparatus for performing text/image segmentation |
US5778092A (en) * | 1996-12-20 | 1998-07-07 | Xerox Corporation | Method and apparatus for compressing color or gray scale documents |
US6226402B1 (en) * | 1996-12-20 | 2001-05-01 | Fujitsu Limited | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof |
US6167150A (en) * | 1998-07-24 | 2000-12-26 | Cognex Corporation | Method and apparatus for detecting extended defects in an object |
US6263113B1 (en) * | 1998-12-11 | 2001-07-17 | Philips Electronics North America Corp. | Method for detecting a face in a digital image |
US6577762B1 (en) * | 1999-10-26 | 2003-06-10 | Xerox Corporation | Background surface thresholding |
US6629292B1 (en) * | 2000-10-06 | 2003-09-30 | International Business Machines Corporation | Method for forming graphical images in semiconductor devices |
US6987588B2 (en) * | 2001-06-25 | 2006-01-17 | Xerox Corporation | Text and image quality enhancement |
JP4390523B2 (ja) * | 2002-11-22 | 2009-12-24 | オセ−テクノロジーズ・ベー・ヴエー | 最小領域による合成画像の分割 |
DK1688842T3 (da) * | 2005-01-26 | 2008-06-16 | Oce Tech Bv | Automatiseret ydelsesanalyse og fejludbedring |
-
2003
- 2003-10-24 JP JP2003364140A patent/JP4538214B2/ja not_active Expired - Fee Related
- 2003-11-10 AT AT03078521T patent/ATE418117T1/de not_active IP Right Cessation
- 2003-11-10 EP EP03078521A patent/EP1439486B1/en not_active Expired - Lifetime
- 2003-11-10 DE DE60325322T patent/DE60325322D1/de not_active Expired - Lifetime
- 2003-11-20 US US10/716,616 patent/US7570811B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6470095B2 (en) * | 1998-10-13 | 2002-10-22 | Xerox Corporation | Automatic extraction of text regions and region borders for an electronic work surface |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9898157B2 (en) | 2014-05-08 | 2018-02-20 | International Business Machines Corporation | Generation of a filter that separates elements to be displayed from elements constituting data |
Also Published As
Publication number | Publication date |
---|---|
US20040140992A1 (en) | 2004-07-22 |
DE60325322D1 (de) | 2009-01-29 |
EP1439486A1 (en) | 2004-07-21 |
US7570811B2 (en) | 2009-08-04 |
EP1439486B1 (en) | 2008-12-17 |
ATE418117T1 (de) | 2009-01-15 |
JP4538214B2 (ja) | 2010-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3950777B2 (ja) | 画像処理方法、画像処理装置および画像処理プログラム | |
US8532374B2 (en) | Colour document layout analysis with multi-level decomposition | |
Song et al. | A Hough transform based line recognition method utilizing both parameter space and image space | |
JP5854802B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
US9965695B1 (en) | Document image binarization method based on content type separation | |
JPH0652354A (ja) | スキュー補正方法並びにスキュー角検出方法並びにドキュメントセグメンテーションシステムおよびスキュー角検出装置 | |
CN111460355B (zh) | 一种页面解析方法和装置 | |
JP3204259B2 (ja) | 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置 | |
JP4538214B2 (ja) | グラフによる画像分割 | |
EP1017011A2 (en) | Block selection of table features | |
JP2004288158A (ja) | 最短サイクルによる画像分割 | |
US10586125B2 (en) | Line removal method, apparatus, and computer-readable medium | |
JP4390523B2 (ja) | 最小領域による合成画像の分割 | |
JP2004282701A5 (ja) | ||
CN111832390B (zh) | 一种手写古文字检测方法 | |
Lehal | A complete machine-printed Gurmukhi OCR system | |
US20050238235A1 (en) | Run length based connected components and contour following for enhancing the performance of circled region extraction algorithm | |
EP1439485B1 (en) | Segmenting a composite image via basic rectangles | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
EP1439484B1 (en) | Segmenting an image via shortest cycles | |
Kumar et al. | A Hybrid Approach for Complex Layout Detection of Newspapers in Gurumukhi Script Using Deep Learning | |
AU2007249098B2 (en) | Method of multi-level decomposition for colour document layout analysis | |
Lehal et al. | A complete OCR system for Gurmukhi script | |
JP2768249B2 (ja) | 文書画像レイアウト解析装置 | |
JP2003271973A (ja) | 画像処理方法および画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090918 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091020 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100119 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100601 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100621 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130625 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |