JP2009032299A - 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 - Google Patents
文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 Download PDFInfo
- Publication number
- JP2009032299A JP2009032299A JP2008292520A JP2008292520A JP2009032299A JP 2009032299 A JP2009032299 A JP 2009032299A JP 2008292520 A JP2008292520 A JP 2008292520A JP 2008292520 A JP2008292520 A JP 2008292520A JP 2009032299 A JP2009032299 A JP 2009032299A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- image
- brightness
- lightness
- inversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
【解決手段】入力される多値の画像からグレー画像を作成し(ステップS301)、二値画像Aを作成し(ステップS302)、画像の傾きの検出や画像の方向の検出をおこない(ステップS303)、傾きや方向の検出の成功を判断する(ステップS304)。成功時には画像を角度補正する(ステップS305)。一方、失敗時には明度反転したグレー画像を作成し(ステップS306)、二値画像Bを作成し(ステップS307)、再度、角度や方向を検出し(ステップS308)、角度補正された画像を作成する(ステップS305)。これにより明度反転の有無にかかわらず画像の傾きや方向を正確に検出し補正できる。
【選択図】図3
Description
(S2/S3)<Th1
である場合に明度が反転されていると判定することを特徴とする。
図1は、本発明の文書画像処理方法が適用される文字認識装置の構成を示すブロック図である。文字認識装置100は、スキャナ101が読み取った画像データを文字認識してディスプレイ102、およびプリンタ等の印字装置103にテキスト等の文字データを出力する。
図2は、上記構成による文書処理手順を示すフローチャートである。この文書処理は、文字認識処理の前処理として実行されるものであり、文書の傾きや方向を検出して補正し、必要に応じて画像を反転させて再度文書の傾きや方向を検出して画像データを補正し、文字認識部(不図示)に渡すものである。
つぎに、図3は、他の文書処理手順を示すフローチャートである。図示の如く実施の形態1との対比では、入力されたカラーの画像データに対し、彩度を除いた、明度成分のみのグレースケールの画像データAを作成する点が異なる(ステップS301)。
つぎに、図4は、他の文書処理手順を示すフローチャートである。図示の如く、この処理手順では、画像の明度反転判定処理を実行する構成である。まず、入力されたカラーの多値の画像データが明度全面反転されているか判定処理を実行する(ステップS401)。この明度全面反転判定処理の内容は後述する。
つぎに、図5は、他の文書処理手順を示すフローチャートである。図示の如く、この処理手順では、グレー画像を作成し、また、画像の明度反転判定処理を実行する構成である。まず、入力されたカラーの多値の画像データを元にグレースケールの画像データAを作成する(ステップS501)。つぎに、この画像データAが明度全面反転されているか判定処理を実行する(ステップS502)。
実施の形態5は、各実施の形態1〜4で説明した文書画像処理方法で、多値画像の明度反転画像を作成するのに、カラーマップだけを作り変え、データ部分は書き換えない方法で明度反転画像を作成する方法である。
実施の形態6は、明度反転処理をおこなう実施の形態3〜5の文書画像処理方法において、明度反転判定の結果、反転されている、という判定結果の場合に、元画像データが明度反転されているという判定結果を次工程の処理に出力する構成である。
実施の形態7は、上記実施の形態1〜5において、全面反転した後の出力の二値画像データBを用いて画像の傾きや方向判別をおこなった結果が成功した場合に、出力される画像データが元画像データを明度反転させた画像データであるという結果を次工程(文字認識部)に出力する構成である。実施の形態6と比較して、結果出力は傾きや方向判別が成功した際に出力されるという点で出力のタイミングが異なり、文字認識処理前に入力される画像データが明度反転されたものであるか否かを判断できるようになる。
実施の形態8は、上記実施の形態1〜7の各文書画像処理方法において、明度反転をおこなって二値化した際に、画像の傾きまたは方向判別が失敗した場合の処理である。このような場合には、明度反転されていない、もしくは不明であるという結果を次工程に出力する構成である。これにより、文字認識部は、入力された結果に応じた文字認識処理を実行できるようになる。
実施の形態9における処理は、上記実施の形態1〜7の各文書画像処理方法において、明度反転をおこなって二値化した際に、画像の傾きまたは方向判別が失敗した場合、次工程(文字認識部)に対し、明度反転をした画像データを強制的に使用しない(出力しない)構成である。すなわち、明度反転しても失敗した画像データをそのまま次工程以降に用いることを禁止することにより、次工程以降での失敗の増加を防ぎ、元画像データで処理を継続させることにより、操作者の意図に沿った処理および処理結果を出力できるようになる。
実施の形態10は、上記実施の形態で説明した明度判定処理の具体的処理内容である。図6は、明度判定処理内容を示すフローチャートである。たとえば、図4のステップS401での判定処理に相当し、以下に説明する。
実施の形態11は、実施の形態10で説明した明度反転判定処理の一部を変更した構成である。グレーの画像データA,Bからそれぞれ二値の画像データA,Bを作成するまでの各処理(ステップS601〜S603)までは同様の処理である。この後、ステップS604,S605で二値の画像データA,Bをそれぞれ黒画素を計数する際に、上下左右の端から連続する黒画素は計数の対象外とする。
実施の形態12は、明度判定処理の他の具体的処理内容である。図7は、この実施形態の明度判定処理内容を示すフローチャートである。ステップS701〜S704までの元画像データに対する処理と、ステップS705〜S709までの元画像を反転処理した画像データに対する処理は並行して実行できる。
実施の形態13は、明度判定処理の他の具体的処理内容である。図8は、この実施形態の明度判定処理内容を示すフローチャートである。ステップS801〜S802の元画像データに対する処理と、ステップS803〜S805までの元画像を反転処理した画像データに対する処理は並行して実行できる。
実施の形態14は、上述した実施形態と異なり、明度反転したグレーの画像データB,二値の画像データBはすぐには作成しない。グレーの画像データAと、二値の画像データAを作成する。そして、この二値の画像データAについて、白画素の連結成分からなる外接矩形を抽出し、この外接矩形の面積と、二値画像データの全面の面積を特徴として、明度反転の条件を経験的に設定するものである。この明度判定では、基本的に、白地に黒文字で書かれていると想定される領域の面積が、全体に対して大きければ、明度が反転されていないと判断するものである。
を満たす場合には(ステップS1007:Yes)、明度の反転なしと判定する(ステップS1008)。上記を満たさない場合には(ステップS1007:No)、明度が反転されていると判定する(ステップS1009)。ここで、白画素矩形の面積S2が大きいほど、上記S2/S1の比は大きくなる。したがって、適当な値のしきい値Th1を用いるだけで簡単に明度反転の有無が判定できる。
実施の形態15は、上記明度反転判定処理の他の例である。この実施の形態15は、実施の形態14にて面積比を計算する際に(ステップS1007)、画像データ全面の面積S1を用いない。代わりに、白画素矩形全てを含む領域の面積S3を求めておき、S1の代わりにS3を使用し、白画素矩形の面積S2との比で白画素面積比を算出する。
実施の形態16は、実施の形態14,15で説明した明度反転の判定処理についての変形例の構成である。これら実施の形態14,15では白画素矩形の面積を用いて明度反転している。これは、白地に黒文字であった場合、背景色は当然白であり、背景色の方が文字の黒より多くなるのが通常であることに基づく。たとえば、実施の形態14では、このような、白が背景色となっている部分の面積S2を算出し、画像全体の面積S1に対する割合であるかを、明度反転判定に使用している。このため、白画素の面積比が少ない白矩形は誤認の原因になる可能性が高い。
実施の形態17は、明度判定処理の他の具体的処理内容である。図11は、この実施形態の明度判定処理内容を示すフローチャートである。縮小した二値の画像データを生成し、この縮小された画像データを用いて明度反転判定をおこなう構成である。
を満たす場合には(ステップS1110:Yes)、明度の反転なしと判定する(ステップS1111)。上記を満たさない場合には(ステップS1110:No)、明度反転されていると判定する(ステップS1112)。
(S2/S3)<Th1
である場合に明度が反転されていると判定することとしたので、ブック原稿をスキャンする際に生じる原稿周辺のベタノイズ等によるカウントをせず、このベタノイズの影響を排除して原稿のみの明度反転を正確に判定できるようになる。
101 スキャナ
102 ディスプレイ
103 印字装置
104 画像メモリ
105 CPU
107 RAM
108 二値化部
109 回転検出部
110 明度反転部
111 画像回転部
112 明度反転判定部
901,902 領域分割手段
903 領域分割結果評価手段
Claims (7)
- 入力された多値の画像データの画像の傾きや画像方向を検出する文書画像処理方法において、
明度反転判定手段によって、前記多値の画像データが明度反転されているか否かを判定し、
前記判定が明度反転の場合には、
明度反転手段によって、前記入力された多値の画像データの明度を反転させた画像データを作成し、
二値化手段によって、前記明度反転された画像データを二値化し、
回転検出手段によって、該明度反転後の二値画像データの画像の傾きおよび/または画像方向を検出する、各工程を備え、
前記明度反転の判定時には、
入力された多値の画像データを二値化し、
該二値化された画像データにおける白画素の連結成分からなる外接矩形を抽出し、
該抽出した外接矩形を合計した面積と画像の面積との比に基づき明度反転の有無を判定することを特徴とする文書画像処理方法。 - 前記明度反転の判定時には、
画像上における前記抽出した白画素の外接矩形全てを含む領域の面積S3を検出し、
前記抽出した白画素の外接矩形のうち面積が大きい上位所定数N個による外接矩形の面積S2を求め、
(S2/S3)<Th1
である場合に明度が反転されていると判定することを特徴とする請求項1に記載の文書画像処理方法。 - 前記明度反転の判定時には、
前記抽出した外接矩形の面積が大きい上位所定数N個以内の外接矩形で、外接矩形中の白画素の面積があらかじめ定めたしきい値Th2以下である場合、この外接矩形を除いた面積を用いることを特徴とする請求項1または2に記載の文書画像処理方法。 - 前記明度反転の判定時には、
入力された多値の画像データを二値化する際に、該画像データを所定の割合M1で縮小することを特徴とする請求項1〜3のいずれか一つに記載の文書画像処理方法。 - 入力された多値の画像データの画像の傾きや画像方向を検出する文書画像処理装置において、
前記多値の画像データが明度反転されているか否かを判定する明度反転判定手段と、
前記明度反転判定手段による判定が明度反転の場合に、前記入力された多値の画像データの明度を反転させた画像データを作成する明度反転手段と、
前記明度反転手段により前記明度反転された画像データを二値化する二値化手段と、
該明度反転後の二値画像データの画像の傾きおよび/または画像方向を検出する回転検出手段と、を備え、
前記明度反転判定手段は、
入力された多値の画像データを二値化し、
該二値化された画像データにおける白画素の連結成分からなる外接矩形を抽出し、
該抽出した外接矩形を合計した面積と画像の面積との比に基づき明度反転の有無を判定することを特徴とする文書画像処理装置。 - 入力された多値の画像データの画像の傾きや画像方向を検出する文書画像処理プログラムにおいて、
前記多値の画像データが明度反転されているか否かを判定する明度反転判定手段、
前記明度反転判定手段による判定が明度反転の場合に、前記入力された多値の画像データの明度を反転させた画像データを作成する明度反転手段、
前記明度反転手段により前記明度反転された画像データを二値化する二値化手段、
該明度反転後の二値画像データの画像の傾きおよび/または画像方向を検出する回転検出手段、としてコンピュータを動作させ、
前記明度反転判定手段は、
入力された多値の画像データを二値化し、
該二値化された画像データにおける白画素の連結成分からなる外接矩形を抽出し、
該抽出した外接矩形を合計した面積と画像の面積との比に基づき明度反転の有無を判定することを特徴とする文書画像処理プログラム。 - 請求項6に記載の文書画像処理プログラムを記憶したことを特徴とする前記コンピュータで読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008292520A JP4339925B2 (ja) | 2002-01-16 | 2008-11-14 | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002007933 | 2002-01-16 | ||
JP2008292520A JP4339925B2 (ja) | 2002-01-16 | 2008-11-14 | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003007567A Division JP4261922B2 (ja) | 2002-01-16 | 2003-01-15 | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009032299A true JP2009032299A (ja) | 2009-02-12 |
JP4339925B2 JP4339925B2 (ja) | 2009-10-07 |
Family
ID=28034758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008292520A Expired - Fee Related JP4339925B2 (ja) | 2002-01-16 | 2008-11-14 | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7151859B2 (ja) |
JP (1) | JP4339925B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4136701B2 (ja) * | 2002-03-12 | 2008-08-20 | 株式会社リコー | 画像形成装置、画像処理プログラム |
US7298920B2 (en) * | 2003-06-11 | 2007-11-20 | Hewlett-Packard Development Company, L.P. | Method and device for determining orientation of text |
TWI238645B (en) * | 2004-06-08 | 2005-08-21 | Benq Corp | Titled angle detection for document image deskew |
JP4869841B2 (ja) * | 2006-03-14 | 2012-02-08 | 株式会社リコー | 画像処理装置、画像方向判別方法、および画像方向判別プログラム |
JP5153593B2 (ja) * | 2008-12-02 | 2013-02-27 | 株式会社Pfu | 画像処理装置および画像処理方法 |
KR101820497B1 (ko) * | 2011-07-27 | 2018-01-22 | 삼성디스플레이 주식회사 | 표시 장치 및 그 구동 방법 |
US9715735B2 (en) * | 2014-01-30 | 2017-07-25 | Flipboard, Inc. | Identifying regions of free space within an image |
JP6482008B2 (ja) | 2014-04-29 | 2019-03-13 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. | バックグラウンドを有するスキャナ |
US11151373B2 (en) | 2018-07-20 | 2021-10-19 | Ricoh Company, Ltd. | Information processing apparatus and information processing method |
US11416674B2 (en) | 2018-07-20 | 2022-08-16 | Ricoh Company, Ltd. | Information processing apparatus, method of processing information and storage medium |
US11113559B2 (en) | 2018-07-20 | 2021-09-07 | Ricoh Company, Ltd. | Information processing apparatus for improving text data recognition, information processing method, and non-transitory recording medium |
CN110298282B (zh) * | 2019-06-21 | 2021-07-23 | 华南师范大学 | 文档图像处理方法、存储介质和计算设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5594815A (en) * | 1992-10-19 | 1997-01-14 | Fast; Bruce B. | OCR image preprocessing method for image enhancement of scanned documents |
JPH09191376A (ja) * | 1996-01-10 | 1997-07-22 | Minolta Co Ltd | 画像読み取り装置 |
DE69839449D1 (de) * | 1997-10-16 | 2008-06-19 | Citizen Holdings Co Ltd | Transflektive Flüssigkristallanzeige |
JP3695163B2 (ja) * | 1998-07-31 | 2005-09-14 | コニカミノルタビジネステクノロジーズ株式会社 | 画像形成装置 |
US6282326B1 (en) * | 1998-12-14 | 2001-08-28 | Eastman Kodak Company | Artifact removal technique for skew corrected images |
-
2003
- 2003-01-15 US US10/342,678 patent/US7151859B2/en active Active
-
2008
- 2008-11-14 JP JP2008292520A patent/JP4339925B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP4339925B2 (ja) | 2009-10-07 |
US7151859B2 (en) | 2006-12-19 |
US20030174904A1 (en) | 2003-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4339925B2 (ja) | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 | |
JP5501958B2 (ja) | 2値マスク画像を作成する方法、2値画像におけるシンボル決定方法、画像圧縮方法、画像圧縮プログラム、及び同プログラムの記録媒体 | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US6393150B1 (en) | Region-based image binarization system | |
US6798906B1 (en) | Image processing apparatus and method including line segment data extraction | |
EP1091320A2 (en) | Processing multiple digital images | |
JP4522468B2 (ja) | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 | |
JP2006350704A (ja) | 判別器の学習方法、顔判別方法および装置並びにプログラム | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
JP5049920B2 (ja) | 画像処理装置及び画像処理方法 | |
EP1081648A2 (en) | Method for processing a digital image | |
JP2008040693A (ja) | ラインノイズ除去装置、ラインノイズ除去方法、ラインノイズ除去プログラム | |
JP4098845B2 (ja) | テキストのバイナリー画像から抽出されたシンボルを比較する方法 | |
JP4392907B2 (ja) | 文字切出し方法 | |
JP4565396B2 (ja) | 画像処理装置および画像処理プログラム | |
JP4261922B2 (ja) | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 | |
JP4132766B2 (ja) | 画像処理装置および方法 | |
EP0870276B1 (en) | A method for transforming a gray-level image into a black-and-white image | |
JP2002342710A (ja) | 文字切出し装置及びそれに用いる文字切出し方法並びにそのプログラム | |
JP4471202B2 (ja) | 画像処理装置、画像処理方法及び同方法に用いるプログラム | |
Boiangiu et al. | Bitonal image creation for automatic content conversion | |
JPH05284356A (ja) | 画像情報2値化方法および画像情報2値化 | |
JPH08237404A (ja) | 光学文字認識モードの選択方法 | |
KR20040092564A (ko) | 경계선 분포를 이용한 스캔 영상의 상역 분리 방법 | |
JP2000040153A (ja) | 画像処理方法、画像処理プログラムを記録した媒体及び画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090630 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090702 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4339925 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120710 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120710 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130710 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |