JP4228515B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP4228515B2 JP4228515B2 JP2000124150A JP2000124150A JP4228515B2 JP 4228515 B2 JP4228515 B2 JP 4228515B2 JP 2000124150 A JP2000124150 A JP 2000124150A JP 2000124150 A JP2000124150 A JP 2000124150A JP 4228515 B2 JP4228515 B2 JP 4228515B2
- Authority
- JP
- Japan
- Prior art keywords
- color
- character
- saturation
- area
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
Description
【発明の属する技術分野】
本発明は、カラー画像を処理可能な文字認識装置を実現するための画像処理装置である。
【0002】
【従来の技術】
従来のカラー画像を処理可能な文字認識装置として特定色を抽出する文字認識装置、例えば特開平09−6913号公報に開示されているものが有る。この装置は、画像入力部からカラー画像信号(RGB毎の信号)を得て、特定色(黒色)を得るためにRGBの各値がすべて小さいときに黒色とし、それ以外の画素は文字認識の対象のデータとして扱わない、つまり背景画素(白色)としていた。
【0003】
【発明が解決しようとする課題】
しかしながら、上記の従来技術ではRGB信号からRGBの各値が、閾値よりすべて小さい画素を特定色(黒色)としているために、文字記入枠(または背景色)に暗い色またはくすんだ色が使われている場合に、文字記入枠(または背景色)の一部が特定色(黒色)として検出される場合が有るためそれらがノイズとなる場合がある。図7は、茶色(ブラウン)をカラースキャナで収集したイメージを水平方向に走査した時のRGB信号を表したものである。図7からも分かるように、文字記入枠に茶色(ブラウン)を使用した場合は最も濃度値の低いB(青成分)以下を閾値(例えば閾値を25とする)とする事により文字記入枠を検出することはなくなる。しかし、文字記入枠を検出しない閾値では記入された文字にかすれが発生する。文字のかすれを防ぐために閾値を上げると文字記入枠がノイズとして検出されるという問題があった。
【0004】
よって、本発明は、文字記入枠や背景色に暗い色やくすんだ色が使われている場合に、文字がかすれたり背景部にノイズが発生しない文字認識に適した画像を得ることを目的とし、また認識精度の良い装置を構築することを可能にすることを目的とする。
【0005】
【課題を解決するための手段】
カラー画像の複数の色(赤、緑、青)成分から彩度を計算するカラー情報変換部を設け、カラー情報変換部で得られた彩度を複数の閾値に分類し、その分類した彩度の領域毎に処理方法を変える。また、分類した彩度の領域において有彩色と無彩色の中間に分類した領域の画素について、当該画素にn×mの窓を設定し、当該画素の周囲の情報により文字部と背景部とに分離し、さらに、同じく有彩色と無彩色の中間に分類した領域の画素について、予め設定された文字記入枠領域と文字記入領域を保存するフォーマット情報格納部に格納されている文字記入枠領域と文字記入領域で処理方法を変える。
【0006】
カラー画像の複数の色(赤、緑、青)成分から彩度を計算するカラー情報変換部を設け、予め設定されている文字記入枠領域と文字記入領域を保存するフォーマット情報格納部と、フォーマット情報格納部に保存されている文字記入枠領域と文字記入領域によりカラー情報変換部で得られた彩度の複数の閾値を変える。
【0007】
【発明の実施の形態】
以下に本発明の実施形態について説明する。
図1は、本発明の第1の実施形態の構成を概略的に示すブロック図である。
同図に示すように、この実施例の画像処理装置は、帳票に文字が記載又は印刷された媒体を走査し、光電変換してカラーの電気信号のR(赤成分)G(緑成分)B(青成分)に変換する光電変換部101と、得られたカラーの信号をカラー情報(彩度、明度)に変換するカラー情報変換部102と、得られたカラー情報から文字部と背景部に分離する文字画像抽出部103から構成されている。
【0008】
以下に第1の実施形態における動作について説明する。
光電変換部101では、帳票に文字が記載又は印刷された媒体を走査し、光電変換してカラーの電気信号に変換してカラー情報変換部102に出力する。その際にカラーの電気信号はR(赤成分)、G(緑成分)、B(青成分)の3原色の多値データ(本実施例では、1画素あたり各色8ビット、合計24ビット)とする。
カラー情報変換部102では、得られたカラー信号から式1および式2により彩度(Saturation)と明度(Value)を計算する。
【0009】
彩度=((r−g +(r−b +(g−b )/2 式1
明度=(r+g+b)/3 式2
【0010】
式1および式2で、r、g、bはそれぞれ光電変換部101で得られるR(赤成分)、G(緑成分)、B(青成分)を表し、それぞれ0から1の範囲に収まるように正規化している。これにより式1、式2により計算された彩度、明度も0から1の範囲内に収まる。ここで、彩度0は無彩色を表し、明度0は暗く、明度1は明るいことを示している。
文字画像抽出部103の動作を図5を用いて説明する。図5では背景全体が暗い色またはくすんだ色で印刷されていて、そこに黒い文字「012」が記入されている場合を表している。
【0011】
文字画像抽出部103では、まず、カラー情報変換部102の出力データの彩度により図3のように予め設定されている閾値1および閾値2により3つの領域に分類する。図3の領域1は、明らかに無彩色である領域であり、この場合は背景部(白色)または文字部(黒色)がこの領域に含まれる。また、領域3は、明らかに有彩色である領域であり、この場合は文字記入枠がこの領域に含まれる。また、領域2は、無彩色と有彩色の中間の領域であり、暗い色または文字部と背景部の境界に位置する部分(文字の輪郭部分)がこの領域に含まれる。以下順にそれぞれの領域の画素について文字画像抽出部103の処理内容を説明する。
【0012】
領域1の処理:
領域1に含まれる画素は明らかに無彩色であり、この領域には背景部の画素(白色)と文字部の画素(黒色)が含まれるため、明度により背景部の画素(白色)と文字部の画素(黒色)を分離する。例えば、本実施例では明度が予め設定されている閾値3以上のとき背景部の画素(白色)、それ以外を文字部の画素(黒色)とする。図5の例ではこの領域に含まれる画素はない。
【0013】
領域2の処理:
領域2に含まれる画素は無彩色と有彩色の中間領域であり、図5では暗い色で印刷されている背景部分の画素と文字の輪郭部分の画素がこの領域になる。
この領域は当該画素にn×mの窓を設定し、当該画素とその周囲の画素の明度により背景部と文字部を分離する。本実施例では、図4に示す3×3の窓を用いて、当該画素(図4では中央の「5」に相当する)と、周囲の画素(図4の「5」以外の8画素)の明度の差が予め設定されている閾値4より大きい画素を文字部の画素(黒色)とし、それ以外は背景部の画素(白色)とする。
【0014】
領域3の処理:
領域3に含まれる画素は、明らかに有彩色である領域であり、この場合は文字記入枠がこの領域に含まれるため背景部の画素(白色)と同じ扱いとする。図5の例ではこの領域に含まれる画像はないが、図5で背景が例えば赤、青などの有彩色で印刷されている場合は背景部分の画素(有彩色の部分)が領域3になる。
【0015】
以上のように文字画像抽出部103の出力を他の文字認識装置などに送ることで文字部(黒色)とそれ以外を分離することが可能となり、文字認識に適した画像を得ることが可能となり認識精度の良い装置を構築することが可能となる。
【0016】
次に、本発明の第2の実施形態の構成を概略的に示すブロック図である図2について説明する。
図2に示すように、この実施例の画像処理装置は、帳票に文字が記載又は印刷された媒体を走査し、光電変換してカラーの電気信号のR(赤成分)G(緑成分)B(青成分)に変換する光電変換部201と、得られたカラーの信号をカラー情報(彩度、明度)に変換するカラー情報変換部202と、得られたカラー情報から文字部と背景部に分離する文字画像抽出部203と、文字記入枠の位置を保存するフォーマット情報格納部204から構成されている。
【0017】
以下に第2の実施形態における動作について説明する。
図2の光電変換部201とカラー情報変換部202はそれぞれ第1の実施例の光電変換部101とカラー情報変換部102と同じなので説明を省略する。フォーマット情報格納部204には文字記入枠の位置として予め外側の2点の座標位置と内側の2点の座標位置が文字記入枠の数分格納されている。図6にその様子を示す。図6の実線で示した部分が文字記入枠であり、記入枠の印刷時の位置ずれおよび用紙の伸縮を考慮した領域であり、点線で示す領域を文字記入枠の位置としてフォーマット情報格納部204に保存している。つまり、外側の領域を表す点(a)、(b)と内側の領域を表す点(c)、(d)を格納している。文字画像抽出部203では、第1の実施例と同様に、カラー情報変換部202の出力データの彩度により図3のように予め設定されている閾値1および閾値2により3つの領域に分類する。その領域1および領域3の処理は第1の実施例と同じであるので、説明を省略する。
【0018】
領域2の処理:
領域2に含まれる画素は無彩色と有彩色の中間領域である。文字が記入される文字記入領域(図6の点(c)、(d)により表される領域)と文字記入枠が含まれる文字記入枠領域(図6の点(a)、(b)により表される領域の内、点(c)、(d)の領域を除く)により処理を異ならせる。例えば本実施例では、文字部が記入される部分は明度が予め設定した閾値5以下を文字部の画素(黒色)とし、それ以外を背景部の画素(白色)とし、文字記入枠が含まれる部分は明度が予め設定した閾値6以下を文字部の画素(黒色)とし、それ以外を背景部の画素(白色)とする。この閾値5は、文字がかすれないように閾値6より小さい値を設定し、閾値6は、文字記入枠がノイズとならないように閾値5より大きな値を設定するようにしている。
【0019】
以上のように文字画像抽出部203の出力を他の文字認識装置などに送ることで文字部とそれ以外を分離することが可能となり、認識精度の良い装置を構築することが可能となる。
【0020】
第1および第2の実施例で文字画像抽出部の出力を文字/背景の2値に分離したが、グレー画像(各画素を明度として表す)として出力しても良い。また、その場合は図3の領域1に対応する画素は明度をそのまま採用しても良い。
また、第1の実施例で領域2の処理で3×3のマスク処理に明度を使用したが、彩度を使用しても良い。
【0021】
【発明の効果】
本発明の効果を以下に説明する。
第1の実施例によれば、彩度を複数の閾値により分類し、有彩色の部分は背景部(白色)とし、無彩色の部分は明度により文字部(黒色)と背景部(白色)に分離し、有彩色と無彩色の中間領域についてはn×mの窓を用い着目画素とその周囲の画素の明度により背景部と文字部を分離する構成となっているため、従来のように文字がかすれたり背景部にノイズが発生することの無い文字認識に適した画像を得ることができる。
【0022】
また、第2の実施例によれば、彩度を複数の閾値により分類し、有彩色の部分は背景部とし、無彩色の部分は明度により文字部と背景部に分離し、有彩色と無彩色の中間領域については、文字が記入される文字記入領域と文字記入枠が含まれる文字記入枠領域により閾値を変更しているため、従来のように文字がかすれたり背景部にノイズが発生することの無い文字認識に適した画像を得ることができる。
本発明の装置の出力を他の文字認識装置などに送ることで文字部(黒色)とそれ以外を分離することが可能となり、文字認識に適した画像を得ることが可能となり認識精度の良い装置を構築することが可能となる。
【図面の簡単な説明】
【図1】第1の実施形態の構成を示すブロック図である。
【図2】第2の実施形態の構成を示すブロック図である。
【図3】彩度を分類した説明図である。
【図4】フィルタの窓を表す図である。
【図5】第1の実施形態の動作を説明する図である。
【図6】第2の実施形態を説明する図である。
【図7】従来技術を説明する図である。
【符号の説明】
101、201 … 光電変換部
102、202 … カラー情報変換部
103、203 … 文字画像抽出部
204 … フォーマット情報格納部
Claims (4)
- 複数の色成分から構成されるカラー画像から文字部と背景部を分離する画像処理装置において、前記カラー画像の色成分から彩度を計算するカラー情報変換部と、前記カラー情報変換部で得られた彩度を複数の閾値により分類し、彩度により分類した前記領域において有彩色と無彩色の中間に分類した領域の画素について、当該画素にn×mの窓を設定し、前記当該画素の周囲の情報により文字部と背景部を分離することを特徴とする画像処理装置。
- 複数の色成分から構成されるカラー画像から文字部と背景部を分離する画像処理装置において、前記カラー画像の色成分から彩度を計算するカラー情報変換部と、予め設定された文字記入枠領域と文字記入領域を保存するフォーマット情報格納部と、前記カラー情報変換部で得られた彩度を複数の閾値により分類し、彩度により分類した前記領域において有彩色と無彩色の中間に分類した領域の画素について、前記フォーマット情報格納部に格納されている文字記入枠領域と文字記入領域で処理方法を変えることを特徴とする画像処理装置。
- 複数の色成分から構成されるカラー画像から文字部と背景部を分離する画像処理装置において、前記カラー画像の複数の色成分から彩度を計算するカラー情報変換部と、予め設定されている文字記入枠領域と文字記入領域を保存するフォーマット情報格納部と、前記フォーマット情報格納部に保存されている文字記入枠領域と文字記入領域により前記カラー情報変換部で得られた彩度の複数の閾値を変えることを特徴とする画像処理装置。
- 前記複数の色成分は、赤成分、緑成分、青成分である、請求項1〜3のいずれかに記載の画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000124150A JP4228515B2 (ja) | 2000-04-25 | 2000-04-25 | 画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000124150A JP4228515B2 (ja) | 2000-04-25 | 2000-04-25 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001307019A JP2001307019A (ja) | 2001-11-02 |
JP4228515B2 true JP4228515B2 (ja) | 2009-02-25 |
Family
ID=18634325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000124150A Expired - Fee Related JP4228515B2 (ja) | 2000-04-25 | 2000-04-25 | 画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4228515B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8000535B2 (en) | 2007-06-18 | 2011-08-16 | Sharp Laboratories Of America, Inc. | Methods and systems for refining text segmentation results |
-
2000
- 2000-04-25 JP JP2000124150A patent/JP4228515B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001307019A (ja) | 2001-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100477656B1 (ko) | 디지털 화질 개선 방법 및 장치 | |
KR100994644B1 (ko) | 화상 처리 장치 및 그 방법 | |
US8565531B2 (en) | Edge detection for mixed raster content (MRC) images for improved compression and image quality | |
JPH0515105B2 (ja) | ||
JP3334042B2 (ja) | 画像処理装置およびこれを搭載した画像読取装置と画像形成装置、並びに画像処理方法、および画像処理手順を記憶したコンピュータ読み取り可能な記憶媒体 | |
KR0153394B1 (ko) | 마커 편집이 가능한 화상 처리 장치 | |
US6894807B1 (en) | Method and apparatus for printing a black-and-white image based on color image information | |
EP0662765B1 (en) | Image processing apparatus and method | |
US6972866B1 (en) | Detecting process neutral colors | |
JP3734703B2 (ja) | 画像処理方法、画像処理装置、および画像形成装置 | |
JP4228515B2 (ja) | 画像処理装置 | |
JP3738810B2 (ja) | 画像印刷方法および装置 | |
JPH01200964A (ja) | カラー画像処理装置 | |
JPH078007B2 (ja) | カラー画像処理方法 | |
JP3093217B2 (ja) | 画像処理装置及び画像処理方法 | |
JPH0630272A (ja) | 画像処理装置および画像処理方法 | |
JP3153221B2 (ja) | カラー画像処理装置 | |
EP1605684B1 (en) | Method of processing a digital image in order to enhance the text portion of said image | |
JP4440487B2 (ja) | カラー画像色分類方法およびカラー画像処理装置 | |
JPH09238256A (ja) | 画像処理方法及び画像処理装置 | |
JP4159917B2 (ja) | 画像読み取り装置 | |
JP2941852B2 (ja) | 画像処理方法 | |
JP2618893B2 (ja) | カラー画像処理装置 | |
JPH1051655A (ja) | 画像処理装置及び光学式文字読取装置 | |
JP3058173B2 (ja) | カラー画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060228 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060923 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060929 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081111 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081124 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4228515 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121212 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131212 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |