JP4764903B2 - テキストマップの中からライン構造を検出する方法および画像処理装置 - Google Patents
テキストマップの中からライン構造を検出する方法および画像処理装置 Download PDFInfo
- Publication number
- JP4764903B2 JP4764903B2 JP2008159585A JP2008159585A JP4764903B2 JP 4764903 B2 JP4764903 B2 JP 4764903B2 JP 2008159585 A JP2008159585 A JP 2008159585A JP 2008159585 A JP2008159585 A JP 2008159585A JP 4764903 B2 JP4764903 B2 JP 4764903B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- text
- color
- line
- target pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
1001 注目画素特定部
1002 対象画素色値取得部
1003 ライン画素特定部
1004 テキストマップ補正部
Claims (18)
- テキストであると推定されるテキスト画素のマップを示すテキストマップの中からライン構造を検出する方法であって、
a)上記テキストマップの中においてテキスト画素として示されている注目画素を特定する第1ステップと、
b)上記注目画素に対応する色値である対象画素色値を取得する第2ステップと、
c)上記対象画素色値が所定の色の制約条件を満たし、かつ、上記注目画素を含む第1領域におけるテキスト画素の特定方向の連続性が所定の連続条件を満たす場合に、上記注目画素をライン画素として特定する第3ステップとを含み、
上記色の制約条件は、上記注目画素に近接する画素を含む第2領域における、特定方向での色の連続性に関する方向制約条件であり、
上記方向制約条件は、上記特定方向に配列された画素間の色の類似度に関する制約条件であり、
上記第2領域は、上記注目画素に近接する複数の画素ペアを含み、各画素ペアは、上記特定方向に配列しており、
上記第3ステップは、上記画素ペアの各々の画素の色値の間の色差を画素ペア色差として算出するステップと、少なくとも一つの画素ペア色差が第2閾値以下である場合に上記方向制約条件を満たすと判断するステップとを含むことを特徴とする方法。 - 上記色の制約条件は、上記方向制約条件と、上記対象画素色値および上記注目画素の周囲の背景の色値である背景色値に基づいた背景色に関する制約条件との両方を含むことを特徴とする請求項1に記載の方法。
- 上記背景色に関する制約条件は、上記対象画素色値と上記背景色値との類似度に関する制約条件であることを特徴とする請求項2に記載の方法。
- 上記第3ステップは、
上記背景色値と上記対象画素色値との間の色の距離である第1距離を算出するステップと、
上記第1距離が第1閾値より大きい場合に、上記背景色に関する制約条件を満たすと判断するステップと、
を含むことを特徴とする請求項3に記載の方法。 - 上記第1距離は、L1ノルム、L2ノルム、ユークリッド距離、市街地距離、重み付けされた市街地距離、重み付けされたユークリッド距離の何れかであることを特徴とする請求項4に記載の方法。
- 上記画素ペア色差は、L1ノルム、L2ノルム、ユークリッド距離、市街地距離、重み付けされた市街地距離、重み付けされたユークリッド距離の何れかで表されることを特徴とする請求項1に記載の方法。
- 注目画素がライン画素として特定されると、テキストマップにおいて当該注目画素をテキストクラスに分類しないように変更するステップを含むことを特徴とする請求項1から6の何れか1項に記載の方法。
- 上記第3ステップにおいて、注目画素がライン画素として特定されると、上記注目画素に対応するラインマップ上の画素を第1の値に設定することを特徴とする請求項1に記載の方法。
- 上記第3ステップは、
上記第1領域から、テキスト画素が特定方向に連続している複数の画素である連続画素を抽出するステップと、
上記連続画素の画素数が第3閾値以上である場合に、上記所定の連続条件を満たすと判断するステップと、
を含むことを特徴とする請求項1に記載の方法。 - テキストであると推定されるテキスト画素のマップを示すテキストマップの中からライン構造を検出する画像処理装置であって、
a)上記テキストマップの中においてテキスト画素として示されている注目画素を特定する注目画素特定部と、
b)上記注目画素に対応する色値である対象画素色値を取得する対象画素色値取得部と、
c)上記対象画素色値が所定の色の制約条件を満たし、かつ、上記注目画素を含む第1領域におけるテキスト画素の特定方向の連続性が所定の連続条件を満たす場合に、上記注目画素をライン画素として特定するライン画素特定部とを備え、
上記色の制約条件は、上記注目画素に近接する画素を含む第2領域における、特定方向での色の連続性に関する方向制約条件であり、
上記方向制約条件は、上記特定方向に配列された画素間の色の類似度に関する制約条件であり、
上記第2領域は、上記注目画素に近接する複数の画素ペアを含み、各画素ペアは、上記特定方向に配列しており、
上記ライン画素特定部は、上記画素ペアの各々の画素の色値の間の色差を画素ペア色差として算出し、少なくとも一つの画素ペア色差が第2閾値以下である場合に、上記方向制約条件を満たすと判断することを特徴とする画像処理装置。 - 上記色の制約条件は、上記方向制約条件と、上記対象画素色値および上記注目画素の周囲の背景の色値である背景色値に基づいた背景色に関する制約条件との両方を含むことを特徴とする請求項10に記載の画像処理装置。
- 上記背景色に関する制約条件は、上記対象画素色値と上記背景色値との類似度に関する制約条件であることを特徴とする請求項11に記載の画像処理装置。
- 上記ライン画素特定部は、上記背景色値と上記対象画素色値との間の色の距離である第1距離を算出し、上記第1距離が第1閾値より大きい場合に、上記背景色の制約条件を満たすと判断することを特徴とする請求項12に記載の画像処理装置。
- 上記第1距離は、L1ノルム、L2ノルム、ユークリッド距離、市街地距離、重み付けされた市街地距離、重み付けされたユークリッド距離の何れかであることを特徴とする請求項13に記載の画像処理装置。
- 上記画素ペア色差は、L1ノルム、L2ノルム、ユークリッド距離、市街地距離、重み付けされた市街地距離、重み付けされたユークリッド距離の何れかで表されることを特徴とする請求項10に記載の画像処理装置。
- 注目画素がライン画素として特定されると、テキストマップにおいて当該注目画素をテキストクラスに分類しないように変更するテキストマップ補正部を備えることを特徴とする請求項10から15の何れか1項に記載の画像処理装置。
- 上記ライン画素特定部は、注目画素をライン画素として特定すると、上記注目画素に対応するラインマップ上の画素を第1の値に設定することを特徴とする請求項10に記載の画像処理装置。
- 上記ライン画素特定部は、上記第1領域から、テキスト画素が特定方向に連続している複数の画素である連続画素を抽出し、上記連続画素の画素数が第3閾値以上である場合に、上記所定の連続条件を満たすと判断することを特徴とする請求項10に記載の画像処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/764,733 | 2007-06-18 | ||
US11/764,733 US8000535B2 (en) | 2007-06-18 | 2007-06-18 | Methods and systems for refining text segmentation results |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008310817A JP2008310817A (ja) | 2008-12-25 |
JP4764903B2 true JP4764903B2 (ja) | 2011-09-07 |
Family
ID=40132365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008159585A Active JP4764903B2 (ja) | 2007-06-18 | 2008-06-18 | テキストマップの中からライン構造を検出する方法および画像処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8000535B2 (ja) |
JP (1) | JP4764903B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9129409B2 (en) * | 2009-07-29 | 2015-09-08 | Qualcomm Incorporated | System and method of compressing video content |
JP5036844B2 (ja) * | 2010-04-15 | 2012-09-26 | シャープ株式会社 | 画像圧縮装置、画像出力装置、画像読取装置、画像圧縮方法、コンピュータプログラム及び記録媒体 |
US9520102B2 (en) * | 2013-04-29 | 2016-12-13 | International Business Machines Corporation | Text extraction from graphical user interface content |
CN107292302B (zh) * | 2016-03-31 | 2021-05-14 | 阿里巴巴(中国)有限公司 | 检测图片中兴趣点的方法和系统 |
US10068132B2 (en) | 2016-05-25 | 2018-09-04 | Ebay Inc. | Document optical character recognition |
US9993385B2 (en) | 2016-09-21 | 2018-06-12 | International Business Machines Corporation | Visual health maintenance and improvement |
CN108470350B (zh) * | 2018-02-26 | 2021-08-24 | 阿博茨德(北京)科技有限公司 | 折线图中的折线分割方法及装置 |
CN116701637B (zh) * | 2023-06-29 | 2024-03-08 | 中南大学 | 一种基于clip的零样本文本分类方法、系统及介质 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4020462A (en) | 1975-12-08 | 1977-04-26 | International Business Machines Corporation | Method and apparatus for form removal from contour compressed image data |
JPS5534790A (en) | 1978-09-05 | 1980-03-11 | Fuji Photo Film Co Ltd | Ruled line generation method |
US4292622A (en) | 1980-02-21 | 1981-09-29 | Hendrix Electronics, Inc. | System and method for processing horizontal line characteristics in an image |
JPS57150075A (en) | 1981-03-12 | 1982-09-16 | Fuji Xerox Co Ltd | Square figure recognizing device |
JPS6115284A (ja) | 1984-06-29 | 1986-01-23 | Toshiba Corp | 光学的文字読取装置 |
JPS63155386A (ja) | 1986-12-19 | 1988-06-28 | Ricoh Co Ltd | 帳票デ−タ読取装置 |
US4949392A (en) | 1988-05-20 | 1990-08-14 | Eastman Kodak Company | Document recognition and automatic indexing for optical character recognition |
US4901365A (en) | 1988-12-19 | 1990-02-13 | Ncr Corporation | Method of searching binary images to find search regions in which straight lines may be found |
JP2940936B2 (ja) | 1989-06-06 | 1999-08-25 | 株式会社リコー | 表領域識別方法 |
JPH0316377A (ja) | 1989-06-14 | 1991-01-24 | Kokusai Denshin Denwa Co Ltd <Kdd> | 2値画像の縮小方法及び装置 |
US5048096A (en) | 1989-12-01 | 1991-09-10 | Eastman Kodak Company | Bi-tonal image non-text matter removal with run length and connected component analysis |
JPH03204245A (ja) * | 1989-12-29 | 1991-09-05 | Matsushita Electric Ind Co Ltd | 双方向音声連絡通信装置 |
US5191612A (en) | 1990-03-13 | 1993-03-02 | Fujitsu Limited | Character recognition system |
JPH0772861B2 (ja) | 1990-08-24 | 1995-08-02 | 富士ゼロックス株式会社 | プログラム作成装置 |
JP3427554B2 (ja) | 1995-03-01 | 2003-07-22 | オムロン株式会社 | 画像処理装置及び方法 |
JP3345224B2 (ja) | 1995-03-06 | 2002-11-18 | 富士通株式会社 | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 |
US6056480A (en) * | 1995-04-20 | 2000-05-02 | Kolk; Theodor | Support for underground mining and tunnel construction |
JPH0997309A (ja) | 1995-09-28 | 1997-04-08 | Glory Ltd | 文字抽出装置 |
US5898795A (en) | 1995-12-08 | 1999-04-27 | Ricoh Company, Ltd. | Character recognition method using a method for deleting ruled lines |
JP3830998B2 (ja) | 1995-12-28 | 2006-10-11 | 株式会社東芝 | 罫線除去方法及びこれを用いた文字認識装置 |
JP3615333B2 (ja) | 1996-12-05 | 2005-02-02 | 株式会社リコー | 罫線消去装置 |
JP3411472B2 (ja) | 1997-05-30 | 2003-06-03 | 富士通株式会社 | パターン抽出装置 |
JP3204245B2 (ja) | 1999-04-27 | 2001-09-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 罫線除去方法および装置 |
JP2001060247A (ja) * | 1999-06-14 | 2001-03-06 | Fuji Xerox Co Ltd | 画像処理装置および画像処理方法 |
JP4228515B2 (ja) | 2000-04-25 | 2009-02-25 | 沖電気工業株式会社 | 画像処理装置 |
NL1015943C2 (nl) * | 2000-08-16 | 2002-02-19 | Ocu Technologies B V | Interpretatie van gekleurde documenten. |
US6873436B1 (en) | 2000-09-05 | 2005-03-29 | Fuji Xerox Co., Ltd. | Image processing device and recording medium |
JP2002175532A (ja) | 2000-12-08 | 2002-06-21 | Fuji Xerox Co Ltd | 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体 |
JP2004145634A (ja) | 2002-10-24 | 2004-05-20 | Toshiba Tec Corp | 画像処理装置及び画像処理方法 |
JP4603807B2 (ja) * | 2004-03-10 | 2010-12-22 | 富士通株式会社 | 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体 |
US7856142B2 (en) * | 2007-01-26 | 2010-12-21 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting character content in a digital image |
US8280157B2 (en) * | 2007-02-27 | 2012-10-02 | Sharp Laboratories Of America, Inc. | Methods and systems for refining text detection in a digital image |
-
2007
- 2007-06-18 US US11/764,733 patent/US8000535B2/en not_active Expired - Fee Related
-
2008
- 2008-06-18 JP JP2008159585A patent/JP4764903B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008310817A (ja) | 2008-12-25 |
US8000535B2 (en) | 2011-08-16 |
US20080310685A1 (en) | 2008-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4764903B2 (ja) | テキストマップの中からライン構造を検出する方法および画像処理装置 | |
US10455117B2 (en) | Image processing apparatus, method, and storage medium | |
JP4568460B2 (ja) | 画像処理装置及び記録媒体 | |
JP4498422B2 (ja) | 画素の分類方法および画像処理装置 | |
JP4745296B2 (ja) | デジタル画像の領域分離方法および領域分離システム | |
JP4568459B2 (ja) | 画像処理装置及び記録媒体 | |
US7411699B2 (en) | Method and apparatus to enhance digital image quality | |
JP2009535899A (ja) | 走査されたカラー画像からの複調画像の生成 | |
US20130058569A1 (en) | Image processing apparatus, image processing method, and non-transitory computer readable medium | |
JP4522468B2 (ja) | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 | |
JP3576810B2 (ja) | 画像処理装置 | |
JP5337563B2 (ja) | 帳票認識方法および装置 | |
KR20080006112A (ko) | 경계 영역의 선명도를 개선하는 하프토닝 방법 및 장치 | |
JP5870745B2 (ja) | 画像処理装置、二値化閾値算出方法及びコンピュータプログラム | |
JP2008211802A (ja) | デジタル画像の画素を分類する方法およびシステム | |
JP4140519B2 (ja) | 画像処理装置、プログラムおよび記録媒体 | |
JP4649498B2 (ja) | 画像データの色補正方法及びシステム | |
KR100513784B1 (ko) | 영상 개선 방법 및 장치 | |
JP6370080B2 (ja) | 画像処理装置、画像処理方法及びプログラム。 | |
JP4771428B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP4132766B2 (ja) | 画像処理装置および方法 | |
JP4010440B2 (ja) | 影検出を伴う画像処理装置 | |
JP4545165B2 (ja) | 画像処理装置、画像形成装置、万線領域特定方法、原稿種別判別方法、コンピュータプログラム及び記録媒体 | |
JP3966448B2 (ja) | 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体 | |
JPH05284356A (ja) | 画像情報2値化方法および画像情報2値化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110517 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110613 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4764903 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |