JP2001307019A - 画像処理装置 - Google Patents
画像処理装置Info
- Publication number
- JP2001307019A JP2001307019A JP2000124150A JP2000124150A JP2001307019A JP 2001307019 A JP2001307019 A JP 2001307019A JP 2000124150 A JP2000124150 A JP 2000124150A JP 2000124150 A JP2000124150 A JP 2000124150A JP 2001307019 A JP2001307019 A JP 2001307019A
- Authority
- JP
- Japan
- Prior art keywords
- color
- character
- area
- saturation
- character entry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
Abstract
使われている場合に、文字がかすれたり背景部にノイズ
が発生しない文字認識に適した画像を得る。 【解決手段】 カラー画像の赤成分、緑成分、青成分か
ら彩度を計算して複数の閾値により分類し、分類した彩
度の領域毎に処理方法を変えて文字部と背景部とに分離
する。有彩色と無彩色の中間に分類された領域について
は、着目画素にn×mの窓を設定し、着目画素の周囲の
情報により文字部と背景部とに分離する。同じく有彩色
と無彩色の中間に分類された領域について、予め設定さ
れた文字記入枠領域と文字記入領域で処理方法を変えて
文字部と背景部とに分離する。文字記入枠領域と文字記
入領域によりカラー情報変換部で得られた彩度の複数の
閾値を変えて、文字部と背景部とに分離する。
Description
可能な文字認識装置を実現するための画像処理装置であ
る。
装置として特定色を抽出する文字認識装置、例えば特開
平09−6913号公報に開示されているものが有る。
この装置は、画像入力部からカラー画像信号(RGB毎
の信号)を得て、特定色(黒色)を得るためにRGBの
各値がすべて小さいときに黒色とし、それ以外の画素は
文字認識の対象のデータとして扱わない、つまり背景画
素(白色)としていた。
従来技術ではRGB信号からRGBの各値が、閾値より
すべて小さい画素を特定色(黒色)としているために、
文字記入枠(または背景色)に暗い色またはくすんだ色
が使われている場合に、文字記入枠(または背景色)の
一部が特定色(黒色)として検出される場合が有るため
それらがノイズとなる場合がある。図7は、茶色(ブラ
ウン)をカラースキャナで収集したイメージを水平方向
に走査した時のRGB信号を表したものである。図7か
らも分かるように、文字記入枠に茶色(ブラウン)を使
用した場合は最も濃度値の低いB(青成分)以下を閾値
(例えば閾値を25とする)とする事により文字記入枠
を検出することはなくなる。しかし、文字記入枠を検出
しない閾値では記入された文字にかすれが発生する。文
字のかすれを防ぐために閾値を上げると文字記入枠がノ
イズとして検出されるという問題があった。
暗い色やくすんだ色が使われている場合に、文字がかす
れたり背景部にノイズが発生しない文字認識に適した画
像を得ることを目的とし、また認識精度の良い装置を構
築することを可能にすることを目的とする。
成分、青成分から彩度を計算するカラー情報変換部を設
け、カラー情報変換部で得られた彩度を複数の閾値に分
類し、その分類した彩度の領域毎に処理方法を変える。
また、分類した彩度の領域において有彩色と無彩色の中
間に分類した領域の画素について、当該画素にn×mの
窓を設定し、当該画素の周囲の情報により文字部と背景
部とに分離し、さらに、同じく有彩色と無彩色の中間に
分類した領域の画素について、予め設定された文字記入
枠領域と文字記入領域を保存するフォーマット情報格納
部に格納されている文字記入枠領域と文字記入領域で処
理方法を変える。
彩度を計算するカラー情報変換部を設け、予め設定され
ている文字記入枠領域と文字記入領域を保存するフォー
マット情報格納部と、フォーマット情報格納部に保存さ
れている文字記入枠領域と文字記入領域によりカラー情
報変換部で得られた彩度の複数の閾値を変える。
説明する。図1は、本発明の第1の実施形態の構成を概
略的に示すブロック図である。同図に示すように、この
実施例の画像処理装置は、帳票に文字が記載又は印刷さ
れた媒体を走査し、光電変換してカラーの電気信号のR
(赤成分)G(緑成分)B(青成分)に変換する光電変
換部101と、得られたカラーの信号をカラー情報(彩
度、明度)に変換するカラー情報変換部102と、得ら
れたカラー情報から文字部と背景部に分離する文字画像
抽出部103から構成されている。
て説明する。光電変換部101では、帳票に文字が記載
又は印刷された媒体を走査し、光電変換してカラーの電
気信号に変換してカラー情報変換部102に出力する。
その際にカラーの電気信号はR(赤成分)、G(緑成
分)、B(青成分)の3原色の多値データ(本実施例で
は、1画素あたり各色8ビット、合計24ビット)とす
る。カラー情報変換部102では、得られたカラー信号
から式1および式2により彩度(Saturation)と明度
(Value)を計算する。
光電変換部101で得られるR(赤成分)、G(緑成
分)、B(青成分)を表し、それぞれ0から1の範囲に
収まるように正規化している。これにより式1、式2に
より計算された彩度、明度も0から1の範囲内に収ま
る。ここで、彩度0は無彩色を表し、明度0は暗く、明
度1は明るいことを示している。文字画像抽出部103
の動作を図5を用いて説明する。図5では背景全体が暗
い色またはくすんだ色で印刷されていて、そこに黒い文
字「012」が記入されている場合を表している。
情報変換部102の出力データの彩度により図3のよう
に予め設定されている閾値1および閾値2により3つの
領域に分類する。図3の領域1は、明らかに無彩色であ
る領域であり、この場合は背景部(白色)または文字部
(黒色)がこの領域に含まれる。また、領域3は、明ら
かに有彩色である領域であり、この場合は文字記入枠が
この領域に含まれる。また、領域2は、無彩色と有彩色
の中間の領域であり、暗い色または文字部と背景部の境
界に位置する部分(文字の輪郭部分)がこの領域に含ま
れる。以下順にそれぞれの領域の画素について文字画像
抽出部103の処理内容を説明する。
らかに無彩色であり、この領域には背景部の画素(白
色)と文字部の画素(黒色)が含まれるため、明度によ
り背景部の画素(白色)と文字部の画素(黒色)を分離
する。例えば、本実施例では明度が予め設定されている
閾値3以上のとき背景部の画素(白色)、それ以外を文
字部の画素(黒色)とする。図5の例ではこの領域に含
まれる画素はない。
彩色と有彩色の中間領域であり、図5では暗い色で印刷
されている背景部分の画素と文字の輪郭部分の画素がこ
の領域になる。この領域は当該画素にn×mの窓を設定
し、当該画素とその周囲の画素の明度により背景部と文
字部を分離する。本実施例では、図4に示す3×3の窓
を用いて、当該画素(図4では中央の「5」に相当す
る)と、周囲の画素(図4の「5」以外の8画素)の明
度の差が予め設定されている閾値4より大きい画素を文
字部の画素(黒色)とし、それ以外は背景部の画素(白
色)とする。
明らかに有彩色である領域であり、この場合は文字記入
枠がこの領域に含まれるため背景部の画素(白色)と同
じ扱いとする。図5の例ではこの領域に含まれる画像は
ないが、図5で背景が例えば赤、青などの有彩色で印刷
されている場合は背景部分の画素(有彩色の部分)が領
域3になる。
を他の文字認識装置などに送ることで文字部(黒色)と
それ以外を分離することが可能となり、文字認識に適し
た画像を得ることが可能となり認識精度の良い装置を構
築することが可能となる。
略的に示すブロック図である図2について説明する。図
2に示すように、この実施例の画像処理装置は、帳票に
文字が記載又は印刷された媒体を走査し、光電変換して
カラーの電気信号のR(赤成分)G(緑成分)B(青成
分)に変換する光電変換部201と、得られたカラーの
信号をカラー情報(彩度、明度)に変換するカラー情報
変換部202と、得られたカラー情報から文字部と背景
部に分離する文字画像抽出部203と、文字記入枠の位
置を保存するフォーマット情報格納部204から構成さ
れている。
て説明する。図2の光電変換部201とカラー情報変換
部202はそれぞれ第1の実施例の光電変換部101と
カラー情報変換部102と同じなので説明を省略する。
フォーマット情報格納部204には文字記入枠の位置と
して予め外側の2点の座標位置と内側の2点の座標位置
が文字記入枠の数分格納されている。図6にその様子を
示す。図6の実線で示した部分が文字記入枠であり、記
入枠の印刷時の位置ずれおよび用紙の伸縮を考慮した領
域であり、点線で示す領域を文字記入枠の位置としてフ
ォーマット情報格納部204に保存している。つまり、
外側の領域を表す点(a)、(b)と内側の領域を表す
点(c)、(d)を格納している。文字画像抽出部20
3では、第1の実施例と同様に、カラー情報変換部20
2の出力データの彩度により図3のように予め設定され
ている閾値1および閾値2により3つの領域に分類す
る。その領域1および領域3の処理は第1の実施例と同
じであるので、説明を省略する。
彩色と有彩色の中間領域である。文字が記入される文字
記入領域(図6の点(c)、(d)により表される領
域)と文字記入枠が含まれる文字記入枠領域(図6の点
(a)、(b)により表される領域の内、点(c)、
(d)の領域を除く)により処理を異ならせる。例えば
本実施例では、文字部が記入される部分は明度が予め設
定した閾値5以下を文字部の画素(黒色)とし、それ以
外を背景部の画素(白色)とし、文字記入枠が含まれる
部分は明度が予め設定した閾値6以下を文字部の画素
(黒色)とし、それ以外を背景部の画素(白色)とす
る。この閾値5は、文字がかすれないように閾値6より
小さい値を設定し、閾値6は、文字記入枠がノイズとな
らないように閾値5より大きな値を設定するようにして
いる。
を他の文字認識装置などに送ることで文字部とそれ以外
を分離することが可能となり、認識精度の良い装置を構
築することが可能となる。
の出力を文字/背景の2値に分離したが、グレー画像
(各画素を明度として表す)として出力しても良い。ま
た、その場合は図3の領域1に対応する画素は明度をそ
のまま採用しても良い。また、第1の実施例で領域2の
処理で3×3のマスク処理に明度を使用したが、彩度を
使用しても良い。
実施例によれば、彩度を複数の閾値により分類し、有彩
色の部分は背景部(白色)とし、無彩色の部分は明度に
より文字部(黒色)と背景部(白色)に分離し、有彩色
と無彩色の中間領域についてはn×mの窓を用い着目画
素とその周囲の画素の明度により背景部と文字部を分離
する構成となっているため、従来のように文字がかすれ
たり背景部にノイズが発生することの無い文字認識に適
した画像を得ることができる。
の閾値により分類し、有彩色の部分は背景部とし、無彩
色の部分は明度により文字部と背景部に分離し、有彩色
と無彩色の中間領域については、文字が記入される文字
記入領域と文字記入枠が含まれる文字記入枠領域により
閾値を変更しているため、従来のように文字がかすれた
り背景部にノイズが発生することの無い文字認識に適し
た画像を得ることができる。本発明の装置の出力を他の
文字認識装置などに送ることで文字部(黒色)とそれ以
外を分離することが可能となり、文字認識に適した画像
を得ることが可能となり認識精度の良い装置を構築する
ことが可能となる。
る。
る。
Claims (4)
- 【請求項1】 赤成分、緑成分、青成分から構成される
カラー画像から文字部と背景部を分離する画像処理装置
において、 前記カラー画像の赤成分、緑成分、青成分から彩度を計
算するカラー情報変換部と、 前記カラー情報変換部で得られた彩度を複数の閾値によ
り分類し、分類した彩度の領域毎に処理方法を変えるこ
とを特徴とする画像処理装置。 - 【請求項2】 請求項1記載の画像処理装置において、
彩度により分類した前記領域において有彩色と無彩色の
中間に分類した領域の画素について、当該画素にn×m
の窓を設定し、前記当該画素の周囲の情報により文字部
と背景部を分離することを特徴とする画像処理装置。 - 【請求項3】 請求項1記載の画像処理装置において、
彩度により分類した前記領域において有彩色と無彩色の
中間に分類した領域の画素について、予め設定された文
字記入枠領域と文字記入領域を保存するフォーマット情
報格納部に格納されている文字記入枠領域と文字記入領
域で処理方法を変えることを特徴とする画像処理装置。 - 【請求項4】 赤成分、緑成分、青成分から構成される
カラー画像から文字部と背景部を分離する画像処理装置
において、 前記カラー画像の赤成分、緑成分、青成分から彩度を計
算するカラー情報変換部と、 予め設定されている文字記入枠領域と文字記入領域を保
存するフォーマット情報格納部と、 前記フォーマット情報格納部に保存されている文字記入
枠領域と文字記入領域により前記カラー情報変換部で得
られた彩度の複数の閾値を変えることを特徴とする画像
処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000124150A JP4228515B2 (ja) | 2000-04-25 | 2000-04-25 | 画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000124150A JP4228515B2 (ja) | 2000-04-25 | 2000-04-25 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001307019A true JP2001307019A (ja) | 2001-11-02 |
JP4228515B2 JP4228515B2 (ja) | 2009-02-25 |
Family
ID=18634325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000124150A Expired - Fee Related JP4228515B2 (ja) | 2000-04-25 | 2000-04-25 | 画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4228515B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008310817A (ja) * | 2007-06-18 | 2008-12-25 | Sharp Corp | テキストマップの中からライン構造を検出する方法および画像処理装置 |
-
2000
- 2000-04-25 JP JP2000124150A patent/JP4228515B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008310817A (ja) * | 2007-06-18 | 2008-12-25 | Sharp Corp | テキストマップの中からライン構造を検出する方法および画像処理装置 |
US8000535B2 (en) | 2007-06-18 | 2011-08-16 | Sharp Laboratories Of America, Inc. | Methods and systems for refining text segmentation results |
Also Published As
Publication number | Publication date |
---|---|
JP4228515B2 (ja) | 2009-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100477656B1 (ko) | 디지털 화질 개선 방법 및 장치 | |
KR100994644B1 (ko) | 화상 처리 장치 및 그 방법 | |
US8565531B2 (en) | Edge detection for mixed raster content (MRC) images for improved compression and image quality | |
KR100524072B1 (ko) | 화질 개선 방법 | |
US6125200A (en) | Removing non-text information from a color image | |
JPH0435167A (ja) | 線画分離方法および装置 | |
JPH11272864A (ja) | 光学文字読取方法またはその装置 | |
JP2001307019A (ja) | 画像処理装置 | |
JP3783815B2 (ja) | 画像処理装置 | |
JP3153221B2 (ja) | カラー画像処理装置 | |
KR100477657B1 (ko) | 디지털 화질 개선 방법 | |
EP1605684B1 (en) | Method of processing a digital image in order to enhance the text portion of said image | |
JP2941853B2 (ja) | 画像処理方法 | |
JP2941852B2 (ja) | 画像処理方法 | |
JP2851060B2 (ja) | 色識別装置 | |
JP2641924B2 (ja) | 画像データ抽出装置 | |
JP2001351068A (ja) | 文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体 | |
JP4143035B2 (ja) | テキストとグラフィックスの自動分別方法 | |
JPH0363886A (ja) | 画像処理装置 | |
JP2021097288A (ja) | 画像処理システムおよびプログラム | |
JP2618893B2 (ja) | カラー画像処理装置 | |
JPH09134438A (ja) | 画像処理装置 | |
JPH09130598A (ja) | カラー画像形成装置 | |
JPH06309455A (ja) | 画像2値化処理装置 | |
JPH1023251A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060228 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060923 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060929 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081111 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081124 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4228515 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121212 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131212 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |