JP3753357B2 - 文字抽出方法および記録媒体 - Google Patents

文字抽出方法および記録媒体 Download PDF

Info

Publication number
JP3753357B2
JP3753357B2 JP01096999A JP1096999A JP3753357B2 JP 3753357 B2 JP3753357 B2 JP 3753357B2 JP 01096999 A JP01096999 A JP 01096999A JP 1096999 A JP1096999 A JP 1096999A JP 3753357 B2 JP3753357 B2 JP 3753357B2
Authority
JP
Japan
Prior art keywords
character
plane
circumscribed rectangle
rectangle
white
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP01096999A
Other languages
English (en)
Other versions
JP2000207489A (ja
Inventor
亨 水納
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP01096999A priority Critical patent/JP3753357B2/ja
Priority to CNB001011197A priority patent/CN1133951C/zh
Priority to US09/487,340 priority patent/US6701008B1/en
Publication of JP2000207489A publication Critical patent/JP2000207489A/ja
Application granted granted Critical
Publication of JP3753357B2 publication Critical patent/JP3753357B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、カラー文書画像から高速に濃淡文字を抽出する文字抽出方法および文字抽出処理プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
カラー文書画像から文字を抽出する従来の技術として、例えば以下の方法がある。すなわち、色空間上の位置情報に基づいて色空間における色分布を求め、さらに色分布を分割することにより、2値化するための閾値とし、色範囲内の画素を文字部分、それ以外の画素を背景とすることにより、文字画素を抽出する方法である(特開平8−123901号公報を参照)。
【0003】
【発明が解決しようとする課題】
上記した従来の方法は、デジタルカラー画像から文字を抽出する過程で、色空間上の位置情報に基づいて色空間における色分布を求めているが、この処理に大きな処理時間を要する。
【0004】
本発明の目的は、画像を複数プレーンに分割し、それぞれのプレーンを2値化し、各プレーンから文字矩形を求め、各プレーンの文字矩形内の画素を濃い文字プレーンと薄い文字プレーンの2つのプレーンに集めて統合することにより、処理時間を短縮した、デジタルカラー画像からの高速な文字抽出方法および記録媒体を提供することにある。
【0005】
【課題を解決するための手段】
前記目的を達成するために、請求項1記載の発明では、カラー文書画像を色成分毎に複数のプレーンに分割し、各プレーンを2値化し、2値化された各プレーンの黒連結成分と白連結成分を基に外接矩形を作成し、該外接矩形の大きさを基に文字矩形であるか否かを判定し、全てのプレーンについて、文字矩形内の画素と他のプレーンの同じ座標での画素との論理演算を行うことにより、薄い背景の濃い文字と濃い背景の薄い文字を同時に抽出する文字抽出方法において、前記プレーン内で黒連結成分による外接矩形と白連結成分による外接矩形が包含関係にあるとき、内側の外接矩形を削除することを特徴としている。
【0006】
請求項記載の発明では、外側の外接矩形の大きさと画素密度が所定の条件を満たすとき、前記内側の外接矩形を削除しないことを特徴としている。
【0007】
請求項記載の発明では、請求項1または2記載の文字抽出方法をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴としている。
【0008】
【発明の実施の形態】
以下、本発明の一実施例を図面を用いて具体的に説明する。
(実施例1)
図1は、本発明の実施例1の構成を示す。画像入力部1では、カラースキャナなどの入力機器により、カラー画像の入力を行う。プレーン分割部2では、画像入力部1で得た画像のRGB成分に重み付けをして、3つのプレーンに分割する。2値化部3では、判別分析法などの適応的2値化方式を用いて各プレーンの2値化を行う。
【0009】
外接矩形作成部4では、2値化部3で得られた2値化画像に対し、黒ラン、白ランを用いて外接矩形を作成する。文字矩形選択部5では、外接矩形の大きさや画素密度などを基に文字矩形と判定するか否かを制御する。プレーン統合部6では、各プレーンの文字矩形内の画素値と、同じ座標における他のプレーンの画素値との論理演算により、統合後のその座標の値を算出する。領域識別部7では、統合されたプレーンを、文字領域、表領域、図領域などの領域に分割する。文字認識部8では、文字領域での2値画像から文字認識を行い、文字コードに変換する。
【0010】
プレーン分割部2におけるプレーンへの分割は、RGB成分への重み付けを、1:0:0,0:1:0,0:0:1として、Rプレーン、Gプレーン、Bプレーンへ分割する。これは一例であり、他の重み付けによりプレーンを分割してもよい。
【0011】
2値化部3では、RGBプレーンそれぞれを、判別分析法などの適応的方法で2値化し、外接矩形作成部4では、黒ランの連結成分からなる外接矩形と、白ランの連続成分からなる外接矩形を求める。また、文字矩形選択部5は、作成された外接矩形の内、その大きさ(および/または画素密度)が所定の範囲内にあるとき、文字矩形と判定する。
【0012】
次に、プレーン統合部6について詳細に説明する。ここでは、一例としてRGBプレーンを、薄い背景で濃い文字を抽出する黒文字プレーンと、濃い背景で薄い文字を抽出する白文字プレーンの2プレーンに統合する方法について説明する。
【0013】
黒文字プレーンの基本的な生成は次のようにする。
Rプレーンの黒ランの連結成分からなる外接矩形中の黒画素をpixelR
Gプレーンの黒ランの連結成分からなる外接矩形中の黒画素をpixelG
Bプレーンの黒ランの連結成分からなる外接矩形中の黒画素をpixelB
とする。
【0014】
統合後の画素をpixelBlackとするとき、
pixelBlack=pixelR|pixelG|pixelB
とする。
【0015】
つまり、図2において、文字矩形内の画素(例えば、RED)と、他のプレーンの同じ座標での画素との論理和により、黒文字を抽出する。ここでは論理和により黒文字プレーンを求めているが、他の論理演算によって黒文字プレーンを求めてもよい。
【0016】
白文字プレーンの生成方法も黒文字プレーンと同様、次のように生成する。
Rプレーンの白ランの連結成分からなる外接矩形中の白画素をpixelR
Gプレーンの白ランの連結成分からなる外接矩形中の白画素をpixelG
Bプレーンの白ランの連結成分からなる外接矩形中の白画素をpixelB
とする。
【0017】
統合後の画素をpixelWhiteとするとき、
pixelWhite=pixelR|pixelG|pixelB
とする(図3)。黒文字の場合と同様に、文字矩形(白枠)内の画素(例えば、R)と、他のプレーンの同じ座標での画素との論理和により、白文字を抽出する。ここでは論理和により白文字プレーンを求めているが、他の論理演算によって白文字プレーンを求めてもよい。
【0018】
また、例えば、薄い背景の濃い文字と、濃い背景の薄い文字が混在している画像の場合、図2と図3の方法を組み合わせ、図4に示すように、濃い文字は黒文字プレーンに抽出し、薄い文字は白文字プレーンに抽出する。さらに、図5に示すように、図4の黒文字プレーンと白文字プレーンを統合し(白文字を黒文字に反転する)、一つの文字プレーンに文字抽出するようにしてもよい。
【0019】
また、上記したように黒文字プレーンと、白文字プレーンを同時に抽出する場合、下記の理由によりノイズが残る可能性がある。
(1)黒画素プレーンでは、薄い文字の中にできる黒ランの連結成分からなる外接矩形中の画素
(2)白画素プレーンでは、濃い文字の中にできる白ランの連続成分からなる外接矩形中の画素。
【0020】
従って、各プレーン(RGBプレーン)において、プレーンの統合をする直前に、
(3)黒ランの連結成分による外接矩形に包含される、白ランの連結成分による外接矩形
(4)白ランの連結成分による外接矩形に包含される、黒ランの連結成分による外接矩形
をそれぞれ削除する。図6は、包含関係にある内側の外接矩形(白ランによる外接矩形)の削除方法を示す。
【0021】
さらに、図7に示すように、特に白抜き文字で背景が黒ランによる外接矩形で囲まれている場合、白抜き文字を形成する白ランによる外接矩形が、包含関係にある矩形の削除によって削除されてしまい、文字抽出ができない場合がある。そこで、外側の外接矩形サイズと画素密度により、その外接矩形の内側の外接矩形を削除するか否かを制御する。例えば、400dpiで矩形サイズ縦横の長い方が80画素以上でかつ、画素密度が80%以上の場合、内側の外接矩形を削除しないなどとすればよい。
【0022】
(実施例2)
実施例2は、本発明をソフトウェアによって実現する場合の実施例である。図8は、実施例2のシステム構成例を示す。CD−ROMなどの記録媒体には、本発明の文字抽出処理機能または処理手順が記録されていて、これをシステムにインストールする。スキャナなどにセットされたカラー原稿を読み取り、メモリ上に展開されたカラー画像から濃い文字、薄い文字を抽出し、その結果をディスプレイなどに表示出力する。
【0023】
【発明の効果】
以上、説明したように、本発明によれば、プレーン間に簡単な論理演算を施すことにより、カラー文書から濃い文字を高速に抽出することができる。
【0024】
本発明によれば、プレーン間に簡単な論理演算を施すことにより、カラー文書から薄い文字を高速に抽出することができる。
【0025】
本発明によれば、カラー文書から高速に濃い文字と薄い文字を同時に抽出することができる。
【0026】
本発明によれば、外接矩形の包含関係および外接矩形の大きさなどを考慮することにより、カラー文書から精度よく文字を抽出することができる。
【図面の簡単な説明】
【図1】 本発明の実施例1の構成を示す。
【図2】 プレーン統合によって黒文字の抽出を説明する図である。
【図3】 プレーン統合によって白文字の抽出を説明する図である。
【図4】 黒白文字のある画像を黒文字プレーンと白文字プレーンに統合する図である。
【図5】 黒白文字のある画像を一つの文字プレーンに統合する図である。
【図6】 包含関係にある内側の矩形を削除する例を示す。
【図7】 白抜き文字が抽出できない例を示す。
【図8】 本発明の実施例2の構成を示す。
【符号の説明】
1 画像入力部
2 プレーン分割部
3 2値化部
4 外接矩形作成部
5 文字矩形選択部
6 プレーン統合部
7 領域識別部
8 文字認識部

Claims (3)

  1. カラー文書画像を色成分毎に複数のプレーンに分割し、各プレーンを2値化し、2値化された各プレーンの黒連結成分と白連結成分を基に外接矩形を作成し、該外接矩形の大きさを基に文字矩形であるか否かを判定し、全てのプレーンについて、文字矩形内の画素と他のプレーンの同じ座標での画素との論理演算を行うことにより、薄い背景の濃い文字と濃い背景の薄い文字を同時に抽出する文字抽出方法において、前記プレーン内で黒連結成分による外接矩形と白連結成分による外接矩形が包含関係にあるとき、内側の外接矩形を削除することを特徴とする文字抽出方法。
  2. 外側の外接矩形の大きさと画素密度が所定の条件を満たすとき、前記内側の外接矩形を削除しないことを特徴とする請求項記載の文字抽出方法。
  3. 請求項1または2記載の文字抽出方法をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP01096999A 1999-01-19 1999-01-19 文字抽出方法および記録媒体 Expired - Fee Related JP3753357B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP01096999A JP3753357B2 (ja) 1999-01-19 1999-01-19 文字抽出方法および記録媒体
CNB001011197A CN1133951C (zh) 1999-01-19 2000-01-18 从彩色图像数据中抽取文字的方法和装置
US09/487,340 US6701008B1 (en) 1999-01-19 2000-01-19 Method, computer readable medium and apparatus for extracting characters from color image data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01096999A JP3753357B2 (ja) 1999-01-19 1999-01-19 文字抽出方法および記録媒体

Publications (2)

Publication Number Publication Date
JP2000207489A JP2000207489A (ja) 2000-07-28
JP3753357B2 true JP3753357B2 (ja) 2006-03-08

Family

ID=11765003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01096999A Expired - Fee Related JP3753357B2 (ja) 1999-01-19 1999-01-19 文字抽出方法および記録媒体

Country Status (3)

Country Link
US (1) US6701008B1 (ja)
JP (1) JP3753357B2 (ja)
CN (1) CN1133951C (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4980520B2 (ja) * 2001-05-28 2012-07-18 谷電機工業株式会社 情報配信システム
JP4000844B2 (ja) * 2001-12-11 2007-10-31 日本電気株式会社 コンテンツ配信システム、コンテンツ配信システムの配信サーバ及び表示端末、コンテンツ配信プログラム
JP2004021765A (ja) * 2002-06-19 2004-01-22 Pfu Ltd 画像認識方法
JP2004056266A (ja) * 2002-07-17 2004-02-19 Ricoh Co Ltd 像域分離装置、画像処理装置、画像形成装置、プログラム及び記憶媒体
CN1306447C (zh) * 2004-02-27 2007-03-21 致伸科技股份有限公司 影像图文分离方法
CN100363941C (zh) * 2004-11-18 2008-01-23 致伸科技股份有限公司 图文分离方法
JP4618676B2 (ja) * 2005-04-28 2011-01-26 株式会社リコー 構造化文書符号の転送方法、画像処理システム、サーバ装置、プログラム及び情報記録媒体
US20070253040A1 (en) * 2006-04-28 2007-11-01 Eastman Kodak Company Color scanning to enhance bitonal image
CN101291384B (zh) * 2007-04-20 2010-05-26 致伸科技股份有限公司 图文分离及文字增强方法
US8068684B2 (en) 2007-05-04 2011-11-29 I.R.I.S. Compression of digital images of scanned documents
CN101354746B (zh) * 2007-07-23 2011-08-31 夏普株式会社 文字图像抽出装置及文字图像抽出方法
JP4732488B2 (ja) * 2008-06-24 2011-07-27 シャープ株式会社 画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体
CN101916327B (zh) * 2010-07-09 2011-11-09 北京商纳科技有限公司 一种生成错题本的方法及系统
JP5736846B2 (ja) * 2011-03-02 2015-06-17 東亜ディーケーケー株式会社 表面状態観測装置およびその方法
JP5915335B2 (ja) * 2012-03-30 2016-05-11 富士通株式会社 情報管理方法及び情報管理装置
JP5697649B2 (ja) * 2012-11-27 2015-04-08 京セラドキュメントソリューションズ株式会社 画像処理装置
TWI525606B (zh) * 2014-06-05 2016-03-11 和碩聯合科技股份有限公司 資訊提供方法、系統及字串提供系統

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05274472A (ja) * 1992-03-27 1993-10-22 Matsushita Electric Ind Co Ltd 画像認識装置
JP2933801B2 (ja) * 1993-06-11 1999-08-16 富士通株式会社 文字の切り出し方法及びその装置
US5555556A (en) * 1994-09-30 1996-09-10 Xerox Corporation Method and apparatus for document segmentation by background analysis
JPH08123901A (ja) 1994-10-26 1996-05-17 Nec Corp 文字抽出装置及び該装置を用いた文字認識装置
JP3018949B2 (ja) * 1995-08-10 2000-03-13 日本電気株式会社 文字読取装置およびその方法
US6188790B1 (en) * 1996-02-29 2001-02-13 Tottori Sanyo Electric Ltd. Method and apparatus for pre-recognition character processing
JP3837193B2 (ja) * 1996-05-13 2006-10-25 松下電器産業株式会社 文字行抽出方法および装置
JP4077919B2 (ja) * 1998-01-30 2008-04-23 キヤノン株式会社 画像処理方法及び装置及びその記憶媒体

Also Published As

Publication number Publication date
JP2000207489A (ja) 2000-07-28
CN1133951C (zh) 2004-01-07
CN1261190A (zh) 2000-07-26
US6701008B1 (en) 2004-03-02

Similar Documents

Publication Publication Date Title
JP3753357B2 (ja) 文字抽出方法および記録媒体
US7170647B2 (en) Document processing apparatus and method
US20060171587A1 (en) Image processing apparatus, control method thereof, and program
JP2008148298A (ja) 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体
JP4250483B2 (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP4558232B2 (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003152995A (ja) 画像処理装置
JP4077094B2 (ja) カラー文書画像認識装置
US5467410A (en) Identification of a blank page in an image processing system
JP4408495B2 (ja) 画像処理方法及び画像処理装置
JP4049560B2 (ja) 網点除去方法及びシステム
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
JP2001209808A (ja) 物体抽出システムと方法並びに物体抽出用プログラムを記憶した記憶媒体
JP2002342710A (ja) 文字切出し装置及びそれに用いる文字切出し方法並びにそのプログラム
JP4116377B2 (ja) 画像処理方法および画像処理装置
JP2001043312A (ja) 文書画像処理装置
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JP2993007B2 (ja) 画像領域識別装置
JP2002279345A (ja) 画像処理装置、画像処理方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体
JP2879800B2 (ja) 電子走査ピクチャの背景除去方法
JP4228905B2 (ja) 画像処理装置及びプログラム
JP4079411B2 (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体
JP3020293B2 (ja) 属性判別方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051209

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131222

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees