JP2000163512A - 文書画像処理方法、装置および記録媒体 - Google Patents

文書画像処理方法、装置および記録媒体

Info

Publication number
JP2000163512A
JP2000163512A JP10336633A JP33663398A JP2000163512A JP 2000163512 A JP2000163512 A JP 2000163512A JP 10336633 A JP10336633 A JP 10336633A JP 33663398 A JP33663398 A JP 33663398A JP 2000163512 A JP2000163512 A JP 2000163512A
Authority
JP
Japan
Prior art keywords
white
image
document image
extracting
binarized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10336633A
Other languages
English (en)
Inventor
Katsushi Morimoto
勝士 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10336633A priority Critical patent/JP2000163512A/ja
Publication of JP2000163512A publication Critical patent/JP2000163512A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 画像中の白画素に着目し、黒画素抽出と同じ
アルゴリズムを用いて白抜き文字を抽出する。 【解決手段】 入力画像の色成分を分離し(102)、
色成分から輝度を算出する(103)。輝度画像を2値
化し(104)、白画素の連結成分を抽出する(10
5)。白抜き文字を構成する白画素連結成分を判定し
(106)、判定された白画素連結成分を文字画素とし
て抽出する(107)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像から白抜
き文字を抽出して認識処理する文書画像処理方法、装置
および記録媒体に関する。
【0002】
【従来の技術】OCR装置の前処理、あるいはデジタル
コピア(登録商標)、ファイリング装置、ファクシミリ
などの入出力処理などにおいては、文書画像を構成する
文字などを抽出した後、例えば文字認識処理などを行っ
ている。
【0003】このような従来の技術としては、例えば特
開平9−269970号公報に記載された文字認識方法
がある。この方法では、画像から白抜き文字部を検出
し、これを白黒反転した後に、文字認識を行っている。
【0004】
【発明が解決しようとする課題】上記した従来の方法で
は、白抜き文字部の検出は黒画素のスキャンによって検
出している。そのため、黒文字とは異なる基準で判別を
行う必要があり、また、文字認識を行う際に、白抜き文
字部を白黒反転する必要がある。
【0005】本発明の目的は、画像中の白画素に着目
し、黒画素抽出と同じアルゴリズムを用いて白抜き文字
を抽出し、抽出された文字を認識する際に、白抜き文字
を反転する必要がない文書画像処理方法、装置および記
録媒体を提供することにある。
【0006】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、文書画像を2値化し、該
2値化画像から白画素の連結成分を抽出し、該白画素連
結成分を用いて白抜き文字を抽出することを特徴として
いる。
【0007】請求項2記載の発明では、前記文書画像か
ら複数の2値化画像を作成し、該作成された各2値化画
像から白抜き文字を抽出することを特徴としている。
【0008】請求項3記載の発明では、カラーの文書画
像から、R成分、G成分、B成分の内、少なくとも1つ
以上の成分の2値化画像を作成することを特徴としてい
る。
【0009】請求項4記載の発明では、カラーの文書画
像から、R成分、G成分、B成分を重み付けした特徴値
を算出し、該特徴値の2値化画像を作成することを特徴
としている。
【0010】請求項5記載の発明では、文書画像を2値
化する手段と、該2値化画像から白画素の連結成分を抽
出する手段と、該白画素連結成分を用いて白抜き文字を
抽出する手段とを備えたことを特徴としている。
【0011】請求項6記載の発明では、カラーの文書画
像を入力する手段と、該カラーの文書画像を2値化する
手段と、該2値化画像から白画素の連結成分を抽出する
手段と、該白画素連結成分を用いて白抜き文字を抽出す
る手段とを備えたことを特徴としている。
【0012】請求項7記載の発明では、文書画像を2値
化する機能と、該2値化画像から白画素の連結成分を抽
出する機能と、該白画素連結成分を用いて白抜き文字を
抽出する機能をコンピュータに実現させるためのプログ
ラムを記録したコンピュータ読み取り可能な記録媒体で
あることを特徴としている。
【0013】請求項8記載の発明では、カラーの文書画
像を入力する機能と、該カラーの文書画像を2値化する
機能と、該2値化画像から白画素の連結成分を抽出する
機能と、該白画素連結成分を用いて白抜き文字を抽出す
る機能をコンピュータに実現させるためのプログラムを
記録したコンピュータ読み取り可能な記録媒体であるこ
とを特徴としている。
【0014】
【発明の実施の形態】以下、本発明の一実施例を図面を
用いて具体的に説明する。
【0015】(実施例1)図1は、本発明の実施例1の
構成を示す。図において、101は文書画像を入力する
画像入力手段、102は文書画像の各画素の色成分を分
離する色成分分離手段、103は色成分から輝度を計算
する輝度計算手段、104は輝度画像を2値化する2値
化手段、105は2値化された輝度画像から白画素の連
結成分を抽出する白画素連結成分抽出手段、106は抽
出された白画素連結成分が白抜き文字であるか否かを判
定する白抜き文字判定手段、107は白抜き文字と判定
された白画素連結成分を文字画素として抽出する文字画
素抽出手段、108は処理データなどを記憶するデータ
記憶部、109は各処理手段を制御する制御部、110
はデータ転送路および制御通信路である。
【0016】図2は、本発明の処理フローチャートを示
す。以下、図2を参照して本発明の処理動作を説明す
る。まず、画像入力手段101によって文書画像を得る
(ステップ201)。画像入力手段はスキャナなどであ
り、文書画像としては、このようなスキャナから取り込
まれた画像の他に、既に電子ファイリングされている画
像を利用してもよい。また、ここでは、入力画像がカラ
ーで与えられるものとして説明する。
【0017】次に、色成分分離手段102は、入力画像
の各画素のR成分、G成分、B成分を分離する(ステッ
プ202)。続いて、輝度計算手段103は、上記した
ように分離されたR,G,B成分を利用して入力画像上
の画素pの輝度を計算する(ステップ203)。その計
算は、画素pのR,G,B成分をそれぞれp(R),p
(G),p(B)と表すと、例えば以下のように行う。
【0018】 a×p(R)+b×p(G)+c×p(B) (a,b,cは適当な係数または関数) 上記した計算により、入力画像の輝度画像を作成するこ
とができる。
【0019】次いで、2値化手段104は、この輝度画
像を2値化する(ステップ204)。白画素連結成分抽
出手段105は、2値化された輝度画像中の白画素の連
結成分を抽出する(ステップ205)。白抜き文字判定
手段106では、白画素の連結成分(または連結成分中
の白画素)が白抜き文字を構成するか否かを調べる(ス
テップ206)。すなわち、例えば連結成分の外接矩形
の位置、大きさ、白画素密度などを用いて判定すればよ
い。
【0020】そして、文字画素抽出手段107では、白
抜き文字を構成すると判定された白画素の連結成分(ま
たは連結成分中の白画素)を文字画素として抽出する
(ステップ207)。ここで抽出した文字画素に対して
文字認識することにより、白抜き文字を認識することが
できる。
【0021】なお、上記した実施例では、R成分、G成
分、B成分を適当に重み付けした輝度画像を生成し、こ
れを2値化しているが、R成分、G成分、B成分の内、
少なくとも1つ以上の成分の2値化画像を作成し(例え
ば、R成分の2値化画像と、B成分の2値化画像を作
成)、それぞれの2値化画像から白抜き文字を抽出する
ようにしてもよい。
【0022】(実施例2)図3は、本発明をソフトウェ
アによって実現する実施例2の構成例を示す。CD−R
OMなどの記録媒体には本発明の文書画像処理機能また
は処理手順が記録されていて、これをシステムにインス
トールする。スキャナなどから取り込まれた文書画像か
ら白抜き文字を抽出して、認識処理し、その結果をディ
スプレイなどに表示出力する。
【0023】
【発明の効果】以上、説明したように、本発明によれ
ば、白画素に着目して白抜き文字を抽出しているので、
従来の黒文字抽出と同じアルゴリズムを適用することが
でき、新たなアルゴリズムを必要としない。また、抽出
された白抜き文字はすでに文字の形態となっているた
め、前掲した公報に記載のような反転処理も必要としな
い。さらに、本発明の方法をカラースキャンされたカラ
ー原稿画像に適用した場合には、白抜き文字ばかりでは
なく、黄色、水色などの薄い色で書かれた文字の抽出も
可能となる。
【図面の簡単な説明】
【図1】本発明の実施例1の構成を示す。
【図2】本発明の処理フローチャートである。
【図3】本発明の実施例2の構成を示す。
【符号の説明】
101 画像入力手段 102 色成分分離手段 103 輝度計算手段 104 2値化手段 105 白画素連結成分抽出手段 106 白抜き文字判定手段 107 文字画素抽出手段 108 データ記憶部 109 制御部 110 データ転送路および制御通信路

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 文書画像を2値化し、該2値化画像から
    白画素の連結成分を抽出し、該白画素連結成分を用いて
    白抜き文字を抽出することを特徴とする文書画像処理方
    法。
  2. 【請求項2】 前記文書画像から複数の2値化画像を作
    成し、該作成された各2値化画像から白抜き文字を抽出
    することを特徴とする請求項1記載の文書画像処理方
    法。
  3. 【請求項3】 カラーの文書画像から、R成分、G成
    分、B成分の内、少なくとも1つ以上の成分の2値化画
    像を作成することを特徴とする請求項1記載の文書画像
    処理方法。
  4. 【請求項4】 カラーの文書画像から、R成分、G成
    分、B成分を重み付けした特徴値を算出し、該特徴値の
    2値化画像を作成することを特徴とする請求項1記載の
    文書画像処理方法。
  5. 【請求項5】 文書画像を2値化する手段と、該2値化
    画像から白画素の連結成分を抽出する手段と、該白画素
    連結成分を用いて白抜き文字を抽出する手段とを備えた
    ことを特徴とする文書画像処理装置。
  6. 【請求項6】 カラーの文書画像を入力する手段と、該
    カラーの文書画像を2値化する手段と、該2値化画像か
    ら白画素の連結成分を抽出する手段と、該白画素連結成
    分を用いて白抜き文字を抽出する手段とを備えたことを
    特徴とする文書画像処理装置。
  7. 【請求項7】 文書画像を2値化する機能と、該2値化
    画像から白画素の連結成分を抽出する機能と、該白画素
    連結成分を用いて白抜き文字を抽出する機能をコンピュ
    ータに実現させるためのプログラムを記録したコンピュ
    ータ読み取り可能な記録媒体。
  8. 【請求項8】 カラーの文書画像を入力する機能と、該
    カラーの文書画像を2値化する機能と、該2値化画像か
    ら白画素の連結成分を抽出する機能と、該白画素連結成
    分を用いて白抜き文字を抽出する機能をコンピュータに
    実現させるためのプログラムを記録したコンピュータ読
    み取り可能な記録媒体。
JP10336633A 1998-11-27 1998-11-27 文書画像処理方法、装置および記録媒体 Pending JP2000163512A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10336633A JP2000163512A (ja) 1998-11-27 1998-11-27 文書画像処理方法、装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10336633A JP2000163512A (ja) 1998-11-27 1998-11-27 文書画像処理方法、装置および記録媒体

Publications (1)

Publication Number Publication Date
JP2000163512A true JP2000163512A (ja) 2000-06-16

Family

ID=18301189

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10336633A Pending JP2000163512A (ja) 1998-11-27 1998-11-27 文書画像処理方法、装置および記録媒体

Country Status (1)

Country Link
JP (1) JP2000163512A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004097721A1 (ja) * 2003-04-25 2004-11-11 Sharp Kabushiki Kaisha 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体
US7376267B2 (en) 2000-07-12 2008-05-20 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program and storage medium therefor
US9142155B2 (en) 2012-08-02 2015-09-22 Samsung Display Co., Ltd. Display device, signal converter for the display device, and method of operating the display device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7376267B2 (en) 2000-07-12 2008-05-20 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program and storage medium therefor
WO2004097721A1 (ja) * 2003-04-25 2004-11-11 Sharp Kabushiki Kaisha 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体
US9142155B2 (en) 2012-08-02 2015-09-22 Samsung Display Co., Ltd. Display device, signal converter for the display device, and method of operating the display device

Similar Documents

Publication Publication Date Title
JP4261005B2 (ja) 領域ベースのイメージ2値化システム
JP4189506B2 (ja) 画像処理のための装置、方法及び記録媒体
US20120057795A1 (en) Image processing apparatus, image forming apparatus, image reading apparatus, and image processing method
US7016081B2 (en) Image distortion correction apparatus, distortion correction method therefor, recording media, image scanner and image construction apparatus
JP2010146185A (ja) 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体
JPH0435167A (ja) 線画分離方法および装置
JP2006197037A (ja) 画像処理装置、画像形成装置、画像読取処理装置、画像処理方法、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体
JPH08235355A (ja) 画像処理装置
JP2000163512A (ja) 文書画像処理方法、装置および記録媒体
US6750986B1 (en) Color image processing method with thin-line detection and enhancement
JPH0721313A (ja) 画像処理装置
JPH0393355A (ja) 文字領域分離方法および装置
JPH10108012A (ja) 像域分離装置
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
JPH11341295A (ja) 画像処理方法
JP2000148908A (ja) 文書画像処理方法、装置および記録媒体
JP3255085B2 (ja) 画像領域判定方法およびその装置、画像処理装置
JPH05344330A (ja) 画像領域識別装置
JP2005020413A (ja) 画像処理装置、画像処理方法およびその方法をコンピュータに実行させるためのプログラム
JP2001291056A (ja) 文書画像認識装置及び記録媒体
US6778296B1 (en) Color imaging processing method with boundary detection and enhancement
JPH03213057A (ja) 画像領域識別装置
JP2002262074A (ja) 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体
JP2853141B2 (ja) 画像領域識別装置
JPH1023251A (ja) 画像処理装置