JP2001307019A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JP2001307019A
JP2001307019A JP2000124150A JP2000124150A JP2001307019A JP 2001307019 A JP2001307019 A JP 2001307019A JP 2000124150 A JP2000124150 A JP 2000124150A JP 2000124150 A JP2000124150 A JP 2000124150A JP 2001307019 A JP2001307019 A JP 2001307019A
Authority
JP
Japan
Prior art keywords
color
character
area
saturation
character entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000124150A
Other languages
English (en)
Other versions
JP4228515B2 (ja
Inventor
Koji Ito
晃治 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000124150A priority Critical patent/JP4228515B2/ja
Publication of JP2001307019A publication Critical patent/JP2001307019A/ja
Application granted granted Critical
Publication of JP4228515B2 publication Critical patent/JP4228515B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 文字記入枠や背景色に暗い色やくすんだ色が
使われている場合に、文字がかすれたり背景部にノイズ
が発生しない文字認識に適した画像を得る。 【解決手段】 カラー画像の赤成分、緑成分、青成分か
ら彩度を計算して複数の閾値により分類し、分類した彩
度の領域毎に処理方法を変えて文字部と背景部とに分離
する。有彩色と無彩色の中間に分類された領域について
は、着目画素にn×mの窓を設定し、着目画素の周囲の
情報により文字部と背景部とに分離する。同じく有彩色
と無彩色の中間に分類された領域について、予め設定さ
れた文字記入枠領域と文字記入領域で処理方法を変えて
文字部と背景部とに分離する。文字記入枠領域と文字記
入領域によりカラー情報変換部で得られた彩度の複数の
閾値を変えて、文字部と背景部とに分離する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、カラー画像を処理
可能な文字認識装置を実現するための画像処理装置であ
る。
【0002】
【従来の技術】従来のカラー画像を処理可能な文字認識
装置として特定色を抽出する文字認識装置、例えば特開
平09−6913号公報に開示されているものが有る。
この装置は、画像入力部からカラー画像信号(RGB毎
の信号)を得て、特定色(黒色)を得るためにRGBの
各値がすべて小さいときに黒色とし、それ以外の画素は
文字認識の対象のデータとして扱わない、つまり背景画
素(白色)としていた。
【0003】
【発明が解決しようとする課題】しかしながら、上記の
従来技術ではRGB信号からRGBの各値が、閾値より
すべて小さい画素を特定色(黒色)としているために、
文字記入枠(または背景色)に暗い色またはくすんだ色
が使われている場合に、文字記入枠(または背景色)の
一部が特定色(黒色)として検出される場合が有るため
それらがノイズとなる場合がある。図7は、茶色(ブラ
ウン)をカラースキャナで収集したイメージを水平方向
に走査した時のRGB信号を表したものである。図7か
らも分かるように、文字記入枠に茶色(ブラウン)を使
用した場合は最も濃度値の低いB(青成分)以下を閾値
(例えば閾値を25とする)とする事により文字記入枠
を検出することはなくなる。しかし、文字記入枠を検出
しない閾値では記入された文字にかすれが発生する。文
字のかすれを防ぐために閾値を上げると文字記入枠がノ
イズとして検出されるという問題があった。
【0004】よって、本発明は、文字記入枠や背景色に
暗い色やくすんだ色が使われている場合に、文字がかす
れたり背景部にノイズが発生しない文字認識に適した画
像を得ることを目的とし、また認識精度の良い装置を構
築することを可能にすることを目的とする。
【0005】
【課題を解決するための手段】カラー画像の赤成分、緑
成分、青成分から彩度を計算するカラー情報変換部を設
け、カラー情報変換部で得られた彩度を複数の閾値に分
類し、その分類した彩度の領域毎に処理方法を変える。
また、分類した彩度の領域において有彩色と無彩色の中
間に分類した領域の画素について、当該画素にn×mの
窓を設定し、当該画素の周囲の情報により文字部と背景
部とに分離し、さらに、同じく有彩色と無彩色の中間に
分類した領域の画素について、予め設定された文字記入
枠領域と文字記入領域を保存するフォーマット情報格納
部に格納されている文字記入枠領域と文字記入領域で処
理方法を変える。
【0006】カラー画像の赤成分、緑成分、青成分から
彩度を計算するカラー情報変換部を設け、予め設定され
ている文字記入枠領域と文字記入領域を保存するフォー
マット情報格納部と、フォーマット情報格納部に保存さ
れている文字記入枠領域と文字記入領域によりカラー情
報変換部で得られた彩度の複数の閾値を変える。
【0007】
【発明の実施の形態】以下に本発明の実施形態について
説明する。図1は、本発明の第1の実施形態の構成を概
略的に示すブロック図である。同図に示すように、この
実施例の画像処理装置は、帳票に文字が記載又は印刷さ
れた媒体を走査し、光電変換してカラーの電気信号のR
(赤成分)G(緑成分)B(青成分)に変換する光電変
換部101と、得られたカラーの信号をカラー情報(彩
度、明度)に変換するカラー情報変換部102と、得ら
れたカラー情報から文字部と背景部に分離する文字画像
抽出部103から構成されている。
【0008】以下に第1の実施形態における動作につい
て説明する。光電変換部101では、帳票に文字が記載
又は印刷された媒体を走査し、光電変換してカラーの電
気信号に変換してカラー情報変換部102に出力する。
その際にカラーの電気信号はR(赤成分)、G(緑成
分)、B(青成分)の3原色の多値データ(本実施例で
は、1画素あたり各色8ビット、合計24ビット)とす
る。カラー情報変換部102では、得られたカラー信号
から式1および式2により彩度(Saturation)と明度
(Value)を計算する。
【0009】 彩度=((r−g +(r−b +(g−b )/2 式1 明度=(r+g+b)/3 式2
【0010】式1および式2で、r、g、bはそれぞれ
光電変換部101で得られるR(赤成分)、G(緑成
分)、B(青成分)を表し、それぞれ0から1の範囲に
収まるように正規化している。これにより式1、式2に
より計算された彩度、明度も0から1の範囲内に収ま
る。ここで、彩度0は無彩色を表し、明度0は暗く、明
度1は明るいことを示している。文字画像抽出部103
の動作を図5を用いて説明する。図5では背景全体が暗
い色またはくすんだ色で印刷されていて、そこに黒い文
字「012」が記入されている場合を表している。
【0011】文字画像抽出部103では、まず、カラー
情報変換部102の出力データの彩度により図3のよう
に予め設定されている閾値1および閾値2により3つの
領域に分類する。図3の領域1は、明らかに無彩色であ
る領域であり、この場合は背景部(白色)または文字部
(黒色)がこの領域に含まれる。また、領域3は、明ら
かに有彩色である領域であり、この場合は文字記入枠が
この領域に含まれる。また、領域2は、無彩色と有彩色
の中間の領域であり、暗い色または文字部と背景部の境
界に位置する部分(文字の輪郭部分)がこの領域に含ま
れる。以下順にそれぞれの領域の画素について文字画像
抽出部103の処理内容を説明する。
【0012】領域1の処理:領域1に含まれる画素は明
らかに無彩色であり、この領域には背景部の画素(白
色)と文字部の画素(黒色)が含まれるため、明度によ
り背景部の画素(白色)と文字部の画素(黒色)を分離
する。例えば、本実施例では明度が予め設定されている
閾値3以上のとき背景部の画素(白色)、それ以外を文
字部の画素(黒色)とする。図5の例ではこの領域に含
まれる画素はない。
【0013】領域2の処理:領域2に含まれる画素は無
彩色と有彩色の中間領域であり、図5では暗い色で印刷
されている背景部分の画素と文字の輪郭部分の画素がこ
の領域になる。この領域は当該画素にn×mの窓を設定
し、当該画素とその周囲の画素の明度により背景部と文
字部を分離する。本実施例では、図4に示す3×3の窓
を用いて、当該画素(図4では中央の「5」に相当す
る)と、周囲の画素(図4の「5」以外の8画素)の明
度の差が予め設定されている閾値4より大きい画素を文
字部の画素(黒色)とし、それ以外は背景部の画素(白
色)とする。
【0014】領域3の処理:領域3に含まれる画素は、
明らかに有彩色である領域であり、この場合は文字記入
枠がこの領域に含まれるため背景部の画素(白色)と同
じ扱いとする。図5の例ではこの領域に含まれる画像は
ないが、図5で背景が例えば赤、青などの有彩色で印刷
されている場合は背景部分の画素(有彩色の部分)が領
域3になる。
【0015】以上のように文字画像抽出部103の出力
を他の文字認識装置などに送ることで文字部(黒色)と
それ以外を分離することが可能となり、文字認識に適し
た画像を得ることが可能となり認識精度の良い装置を構
築することが可能となる。
【0016】次に、本発明の第2の実施形態の構成を概
略的に示すブロック図である図2について説明する。図
2に示すように、この実施例の画像処理装置は、帳票に
文字が記載又は印刷された媒体を走査し、光電変換して
カラーの電気信号のR(赤成分)G(緑成分)B(青成
分)に変換する光電変換部201と、得られたカラーの
信号をカラー情報(彩度、明度)に変換するカラー情報
変換部202と、得られたカラー情報から文字部と背景
部に分離する文字画像抽出部203と、文字記入枠の位
置を保存するフォーマット情報格納部204から構成さ
れている。
【0017】以下に第2の実施形態における動作につい
て説明する。図2の光電変換部201とカラー情報変換
部202はそれぞれ第1の実施例の光電変換部101と
カラー情報変換部102と同じなので説明を省略する。
フォーマット情報格納部204には文字記入枠の位置と
して予め外側の2点の座標位置と内側の2点の座標位置
が文字記入枠の数分格納されている。図6にその様子を
示す。図6の実線で示した部分が文字記入枠であり、記
入枠の印刷時の位置ずれおよび用紙の伸縮を考慮した領
域であり、点線で示す領域を文字記入枠の位置としてフ
ォーマット情報格納部204に保存している。つまり、
外側の領域を表す点(a)、(b)と内側の領域を表す
点(c)、(d)を格納している。文字画像抽出部20
3では、第1の実施例と同様に、カラー情報変換部20
2の出力データの彩度により図3のように予め設定され
ている閾値1および閾値2により3つの領域に分類す
る。その領域1および領域3の処理は第1の実施例と同
じであるので、説明を省略する。
【0018】領域2の処理:領域2に含まれる画素は無
彩色と有彩色の中間領域である。文字が記入される文字
記入領域(図6の点(c)、(d)により表される領
域)と文字記入枠が含まれる文字記入枠領域(図6の点
(a)、(b)により表される領域の内、点(c)、
(d)の領域を除く)により処理を異ならせる。例えば
本実施例では、文字部が記入される部分は明度が予め設
定した閾値5以下を文字部の画素(黒色)とし、それ以
外を背景部の画素(白色)とし、文字記入枠が含まれる
部分は明度が予め設定した閾値6以下を文字部の画素
(黒色)とし、それ以外を背景部の画素(白色)とす
る。この閾値5は、文字がかすれないように閾値6より
小さい値を設定し、閾値6は、文字記入枠がノイズとな
らないように閾値5より大きな値を設定するようにして
いる。
【0019】以上のように文字画像抽出部203の出力
を他の文字認識装置などに送ることで文字部とそれ以外
を分離することが可能となり、認識精度の良い装置を構
築することが可能となる。
【0020】第1および第2の実施例で文字画像抽出部
の出力を文字/背景の2値に分離したが、グレー画像
(各画素を明度として表す)として出力しても良い。ま
た、その場合は図3の領域1に対応する画素は明度をそ
のまま採用しても良い。また、第1の実施例で領域2の
処理で3×3のマスク処理に明度を使用したが、彩度を
使用しても良い。
【0021】
【発明の効果】本発明の効果を以下に説明する。第1の
実施例によれば、彩度を複数の閾値により分類し、有彩
色の部分は背景部(白色)とし、無彩色の部分は明度に
より文字部(黒色)と背景部(白色)に分離し、有彩色
と無彩色の中間領域についてはn×mの窓を用い着目画
素とその周囲の画素の明度により背景部と文字部を分離
する構成となっているため、従来のように文字がかすれ
たり背景部にノイズが発生することの無い文字認識に適
した画像を得ることができる。
【0022】また、第2の実施例によれば、彩度を複数
の閾値により分類し、有彩色の部分は背景部とし、無彩
色の部分は明度により文字部と背景部に分離し、有彩色
と無彩色の中間領域については、文字が記入される文字
記入領域と文字記入枠が含まれる文字記入枠領域により
閾値を変更しているため、従来のように文字がかすれた
り背景部にノイズが発生することの無い文字認識に適し
た画像を得ることができる。本発明の装置の出力を他の
文字認識装置などに送ることで文字部(黒色)とそれ以
外を分離することが可能となり、文字認識に適した画像
を得ることが可能となり認識精度の良い装置を構築する
ことが可能となる。
【図面の簡単な説明】
【図1】第1の実施形態の構成を示すブロック図であ
る。
【図2】第2の実施形態の構成を示すブロック図であ
る。
【図3】彩度を分類した説明図である。
【図4】フィルタの窓を表す図である。
【図5】第1の実施形態の動作を説明する図である。
【図6】第2の実施形態を説明する図である。
【図7】従来技術を説明する図である。
【符号の説明】
101、201 … 光電変換部 102、202 … カラー情報変換部 103、203 … 文字画像抽出部 204 … フォーマット情報格納部
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B029 AA02 BB02 CC21 CC26 CC29 DD05 EE12 5B057 AA20 BA02 CA01 CA08 CA12 CA16 CB08 CB12 CB16 CE11 CE16 DA08 5C077 MP08 NP01 PP25 PP27 PP35 PP38 5C079 HB06 LA06

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 赤成分、緑成分、青成分から構成される
    カラー画像から文字部と背景部を分離する画像処理装置
    において、 前記カラー画像の赤成分、緑成分、青成分から彩度を計
    算するカラー情報変換部と、 前記カラー情報変換部で得られた彩度を複数の閾値によ
    り分類し、分類した彩度の領域毎に処理方法を変えるこ
    とを特徴とする画像処理装置。
  2. 【請求項2】 請求項1記載の画像処理装置において、
    彩度により分類した前記領域において有彩色と無彩色の
    中間に分類した領域の画素について、当該画素にn×m
    の窓を設定し、前記当該画素の周囲の情報により文字部
    と背景部を分離することを特徴とする画像処理装置。
  3. 【請求項3】 請求項1記載の画像処理装置において、
    彩度により分類した前記領域において有彩色と無彩色の
    中間に分類した領域の画素について、予め設定された文
    字記入枠領域と文字記入領域を保存するフォーマット情
    報格納部に格納されている文字記入枠領域と文字記入領
    域で処理方法を変えることを特徴とする画像処理装置。
  4. 【請求項4】 赤成分、緑成分、青成分から構成される
    カラー画像から文字部と背景部を分離する画像処理装置
    において、 前記カラー画像の赤成分、緑成分、青成分から彩度を計
    算するカラー情報変換部と、 予め設定されている文字記入枠領域と文字記入領域を保
    存するフォーマット情報格納部と、 前記フォーマット情報格納部に保存されている文字記入
    枠領域と文字記入領域により前記カラー情報変換部で得
    られた彩度の複数の閾値を変えることを特徴とする画像
    処理装置。
JP2000124150A 2000-04-25 2000-04-25 画像処理装置 Expired - Fee Related JP4228515B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000124150A JP4228515B2 (ja) 2000-04-25 2000-04-25 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000124150A JP4228515B2 (ja) 2000-04-25 2000-04-25 画像処理装置

Publications (2)

Publication Number Publication Date
JP2001307019A true JP2001307019A (ja) 2001-11-02
JP4228515B2 JP4228515B2 (ja) 2009-02-25

Family

ID=18634325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000124150A Expired - Fee Related JP4228515B2 (ja) 2000-04-25 2000-04-25 画像処理装置

Country Status (1)

Country Link
JP (1) JP4228515B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310817A (ja) * 2007-06-18 2008-12-25 Sharp Corp テキストマップの中からライン構造を検出する方法および画像処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310817A (ja) * 2007-06-18 2008-12-25 Sharp Corp テキストマップの中からライン構造を検出する方法および画像処理装置
US8000535B2 (en) 2007-06-18 2011-08-16 Sharp Laboratories Of America, Inc. Methods and systems for refining text segmentation results

Also Published As

Publication number Publication date
JP4228515B2 (ja) 2009-02-25

Similar Documents

Publication Publication Date Title
KR100477656B1 (ko) 디지털 화질 개선 방법 및 장치
KR100994644B1 (ko) 화상 처리 장치 및 그 방법
US8565531B2 (en) Edge detection for mixed raster content (MRC) images for improved compression and image quality
KR100524072B1 (ko) 화질 개선 방법
US6125200A (en) Removing non-text information from a color image
JPH0435167A (ja) 線画分離方法および装置
JPH11272864A (ja) 光学文字読取方法またはその装置
JP2001307019A (ja) 画像処理装置
JP3783815B2 (ja) 画像処理装置
JP3153221B2 (ja) カラー画像処理装置
KR100477657B1 (ko) 디지털 화질 개선 방법
EP1605684B1 (en) Method of processing a digital image in order to enhance the text portion of said image
JP2941853B2 (ja) 画像処理方法
JP2941852B2 (ja) 画像処理方法
JP2851060B2 (ja) 色識別装置
JP2641924B2 (ja) 画像データ抽出装置
JP2001351068A (ja) 文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体
JP4143035B2 (ja) テキストとグラフィックスの自動分別方法
JPH0363886A (ja) 画像処理装置
JP2021097288A (ja) 画像処理システムおよびプログラム
JP2618893B2 (ja) カラー画像処理装置
JPH09134438A (ja) 画像処理装置
JPH09130598A (ja) カラー画像形成装置
JPH06309455A (ja) 画像2値化処理装置
JPH1023251A (ja) 画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060228

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060923

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081124

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4228515

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131212

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees