JPH11213090A - 文字図形と背景領域の識別方法およびその装置およびその方法を記録した記録媒体 - Google Patents

文字図形と背景領域の識別方法およびその装置およびその方法を記録した記録媒体

Info

Publication number
JPH11213090A
JPH11213090A JP10016549A JP1654998A JPH11213090A JP H11213090 A JPH11213090 A JP H11213090A JP 10016549 A JP10016549 A JP 10016549A JP 1654998 A JP1654998 A JP 1654998A JP H11213090 A JPH11213090 A JP H11213090A
Authority
JP
Japan
Prior art keywords
color
character
region
area
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10016549A
Other languages
English (en)
Inventor
Kimitomo Kobayashi
公知 小林
Akira Suzuki
章 鈴木
Osamu Nakamura
修 中村
Kenji Ogura
健司 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10016549A priority Critical patent/JPH11213090A/ja
Publication of JPH11213090A publication Critical patent/JPH11213090A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【課題】 カラー画像のRGB値を明度、色相、彩度等
の情報に変換せずに、粋なし文字、反転文字図形等を識
別し、特別な処理なしにエッジ強調文字図形等を識別で
きる高速な文字図形と背景領域の識別方法および装置を
提供する。 【解決手段】 カラー画像中のRGB値を直接比較する
ことで、類似した色領域を色領域検出部2で検出し、そ
の色領域が規定の大ささ、形状の場合はその画素を画素
分類部4がRGB値の差を用いて分類し、分類した画素
の数を計数する。文字抽出部5は、分類した画素で2番
目に多い画素の数が規定値の範囲の場合、1番多い画素
の領域を背景領域、2番目に多い画素の領域を文字図形
として識別して粋なし文字図形、反転文字図形等を識別
し、色領域の文字を2値化する。さらに1番多い画素と
2番目の画素のRGB値を比較し、明度の高い方を基準
に抽出して色領域の文字を2値化することで、エッジ強
調文字等の影響を除く。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、RGB値で表現さ
れたカラー画像中にある看板等の複数の文字や図形を抽
出して認識するときに、任意位置の文字図形領域(文字
図形と背景領域)を検出し、文字認識可能な2値化を行
うための文字図形と背景領域の識別方法および装置に関
するものである。
【0002】
【従来の技術】従来、RGB値で表現されたカラー画像
中の看板、名札等の文字図形領域(文字図形と背景領
域)を抽出する方法として、中間調画像の処理と同様に
RGB値を明度(または輝度)情報に変換してから判別
分析等の2値化処理が行われていた。また、明度情報の
他に色相や彩度情報を用いて文字図形領域を抽出する方
法もあった。さらに、文字図形の抽出においては、マッ
ハ現象のように文字図形と背景の境界部分にアンダーシ
ュートやオーバーシュートによって生じる明度変化また
は色変化に対応するため、フィルター等の処理が必要で
あった。
【0003】
【発明が解決しようとする課題】しかしながら、RGB
値を明度(または輝度)情報に変換してから判別分析等
の2値化処理して、カラー画像中の文字図形と背景領域
を抽出する上記従来の方法では、RGB値を明度(また
は輝度)情報に変換するために処理時間を要する問題が
ある。また、2値化する文字の部分が明るいと、文字と
背景領域の黒自反転処理が必要であり、さらに処理時間
を要する。また、明度情報の他に色相や彩度情報を用い
て文字図形領域を抽出する方法でも、RGB値の色相、
彩度情報への変換のために処理時間を要し、さらには複
雑な2値化処理を要する問題がある。また、従来の文字
図形の抽出においては、マッハ現象のように文字図形と
背景の境界部分にアンダーシュートやオーバーシュート
によって生じる明度変化または色変化に対応するため、
フィルターの処理等の特別な処理を要するとともに、デ
ザイン文字のように文字のエッジを強調してある場合も
何らかの特別な処理を要するという問題がある。
【0004】そこで本発明は、RGB値で表現されたカ
ラー画像中の文字図形と背景領域をRGB値を明度等の
情報に変換しなくても識別して白黒2値化することがで
きるとともに、RGB値を色相、彩度等の情報に変換し
なくても枠なし文字や文字図形の明度が高いような反転
文字図形にも対応でき、かつその識別時に問題となる文
字図形のエッジ付近に生じる色変化や、デザイン文字の
ように文字のエッジを強調したような部分に対し特別な
処理をせずに対応できる高速な文字図形と背景領域の識
別方法および装置を提供することを課題とする。
【0005】
【課題を解決するための手段】上記の課題を解決するた
めに、本発明による方法は、カラー画像中の任意の色領
域をRGB値の差を用いて検出し、前記検出した色領域
が規定の大ささ・形状であれば、該色領域に含まれる画
素をRGB値を用いて分類し、前記分類した画素で2番
目に多い画素の数が規定値の範囲であれば、1番多い画
素の色領域を背景領域、2番目に多い画素の色領域を文
字図形として識別する、ことを特徴とする。
【0006】また、前記色領域を背景領域と文字図形と
して識別する過程においては、前記背景領域と文字図形
を示す画素のRGB値を比較し、該背景領域の明度が高
い場合は前記色領域を背景領域と背景領域以外の領域
に、該文字図形の明度が高い場合は前記色領域を文字図
形の領域と文字図形以外の領域に分類することを特徴と
する。
【0007】同じく、本発明による装置は、カラー画像
中の任意の色領域をRGB値の差を用いて検出する手段
と、前記検出した色領域の大ささ・形状を検出する手段
と、前記色領域に含まれる画素をRGBの差を用いて分
類し、2番目に多い画素の数が規定値の範囲かどうかを
判定する手段と、前記判定が規定値の範囲であれば、前
記分類した画素で1番多い画素の色領域を背景領域、2
番目に多い画素の色領域を文字図形として識別する手段
と、を備えて構成することを特徴とする。
【0008】また、前記色領域を背景領域と文字図形と
して識別する手段として、前記背景領域と文字図形を示
す画素のRGB値を比較し、該背景領域の明度が高い場
合は前記色領域を背景領域と背景領域以外の領域に、該
文字図形の明度が高い場合は前記色領域を文字図形の領
域と文字図形以外の領域に分類する手段を備えて構成す
ることを特徴とする。
【0009】同じく、本発明による方法を記録した記録
媒体は、カラー画像中の任意の色領域をRGB値の差を
用いて検出する手順と、前記検出した色領域が規定の大
ささ・形状であれば、該色領域に含まれる画素をRGB
値を用いて分類する手順と、前記分類した画素で2番目
に多い画素の数が規定値の範囲であれば、1番多い画素
の色領域を背景領域、2番目に多い画素の色領域を文字
図形として識別する手順と、をコンピュータで実行する
プログラムとして該コンピュータが読み取り可能な記録
媒体に記録したことを特徴とする。
【0010】また、前記色領域を背景領域と文字図形と
して識別する手順においては、前記背景領域と文字図形
を示す画素のRGB値を比較し、該背景領域の明度が高
い場合は前記色領域を背景領域と背景領域以外の領域
に、該文字図形の明度が高い場合は前記色領域を文字図
形の領域と文字図形以外の領域に分類することを特徴と
する。
【0011】本発明では、カラー画像中のRGB値を直
接比較することで、類似した色領域を検出し、検出した
色領域に含まれる領域が規定の大ささおよび形状の場合
は、さらに色領域に含まれる画素をRGB値の差を用い
て分類し、分類した画素の数を計数する。そして、分類
した画素で2番目に多い画素の数が規定値の範囲の場
合、1番多い画素の領域を背景領域、2番目に多い画素
の領域を文字図形として識別することで、RGB値を明
度、色相、彩度等の情報に変換しなくても文字図形と背
景領域を識別し白黒2値化を可能とするとともに、粋な
し文字図形領域、反転文字図形の抽出を可能とする。さ
らには、1番多い画素と2番目の画素のRGB値を比較
し、明度の高い方を基準に抽出して色領域に含まれる文
字を2値化することにより、特別な処理をせずに文字図
形部周辺の色変化、影文字等のようにエッジに強調が有
る文字図形に対応可能とする。以上のとおり、RGB値
を明度、色相、彩度等の情報に変換する処理や特別な処
理を不要にすることで、高速な文字図形と背景領域の識
別を可能とする。
【0012】このようにRGB値を明度、色相、彩度等
の情報に変換しなくても文字図形と背景領域を識別する
とともに粋なし文字図形領域、反転文字図形を抽出して
白黒2値化を可能としている点、および文字図形部周辺
の色変化、影文字等のようにエッジに強調が有る文字図
形に対し特別な処理を必要とせずに文字認識可能な白黒
イメージを作成している点が従来技術と大きく異なる。
【0013】さらに詳しく本発明の作用を述べると、以
下のとおりである。
【0014】まず、RGB値のカラー画像の任意の1点
のRGB値を基準として、任意に選択した1点に隣接し
た周辺画素やブロックのRGB値を調べ、RGB値の差
分が規定値以下の場合は同一色として判定する。次に、
同一色と判定された各画素やブロックに隣接したRGB
値を調べ、基準のRGB値との差が規定値以下の場合は
ラベル付けなどを行うことで同一色の画素やブロックと
して検出する。このようにして、ラベル付け等で同一色
とされた画素やブロックの色領域に含まれる領域が規定
の大ささおよび形状であれば色領域に含まれる画素をR
GB値の差分で分類するとともに、分類した画素の画素
数を求める。そして、分類した画素の中で2番目に多い
画素数が規定値の範囲であれば、1番多い画素数の画素
を背景領域、2番目に多い画素数の画素を文字図形とす
る。このようにすることで、RGB値を明度情報等に変
換しなくても文字の2値化が可能となるとともに、黒白
反転処理をしなくても反転文字の2値化が可能となり、
かつ文字図形に枠がなくてもRGB値を色相、彩度情報
に変換せず、RGB値を直接用いることで文字図形と背
景領域の識別が可能となる。
【0015】さらに上記において、1番多い画素と2番
目の画素の明度をRGB値で比較し、明度の高い画素を
基準にして処理することで色領域に含まれる文字図形の
2値化処理を行う。このようにすることで、特別な処理
を必要とせずに、マッハ現象のような文字のエッジ付近
の濃度変化や色変化の効果の影響を受けず、かつ影付き
文字のように文字のエッジにある情報を除いた2値化が
可能となる。
【0016】本発明では、従来の文字図形と背景領域の
識別時に必要であった、RGB値の明度、色相、彩度の
情報への変換処理、黒白反転処理、フィルター等の処
理、文字のエッジ付近の情報の影響を除くための特別な
処理などが不要になるため、高速に文字領域と背景領域
を識別することができるようになる。
【0017】
【発明の実施の形態】以下、本発明の実施の形態につい
て図を用いて詳細に説明する。
【0018】図1は本発明の一実施形態例を示すブロッ
ク図であり、1はRGB値のカラー画像と領域を分類す
るラベルを格納するカラーイメージメモリ部、2は任意
の色領域を検出する色領域検出部、3は検出した色領域
の大きさと形状を判定する大ささ・形状判定部、4は色
領域に含まれる画素を分類して計数する画素分類部、5
は文字図形領域中の文字図形と背景領域を識別して2値
化を行う文字抽出部、6は認識用イメージメモリ部、7
は文字認識部である。
【0019】以下に、図1の動作により本発明の文字図
形と背景領域の識別方法の実施形態例を説明する。
【0020】まず、カラーイメージメモリ部1にRGB
値で表されたカラー画像が格納されると、色領域検出部
2は、カラーイメージメモリ部1のカラー画像を読み出
し、図2に示すように任意の画素のRGB値を基準に隣
接画素のRGB値の差分を求め、差分が規定値以下の場
合は同一の色領域としてカラーイメージメモリ部1の対
応する画素にラベル番号を書き込む。この手順で順次周
辺画素を調べ、RGB値の差が規定値以下の隣接画素の
ラベル付けを行う。このようにして1つの色領域のラベ
ル付けを終わると、色領域検出部2は大ささ・形状判定
部3へ1つの色領域のラベル番号を通知する。
【0021】1つの色領域のラベル番号の通知を受けた
大ささ・形状判定部3では、カラーイメージメモリ部1
を調べ、色領域に含まれる領域を色領域と同じラベル番
号を書き込み、統合する。そして、図3に示すように、
統合した色領域であるカラー看板画像の大ささ・形状
(本例では面積と外接矩形で判定)を調べる。そして、
大きさ・形状が規定値の範囲と判定された色領域(カラ
ー看板画像)のラベル番号は画素分類部4へ通知され
る。
【0022】画素分類部4ではカラーイメージメモリ部
1を調べ、図4に示すように色領域に対応するラベル番
号の画素を調べ、各画素をRGB値で分類するとともに
カラーイメージメモリ部1の対応する画素に分類したラ
ベル番号付与し、分類した画素の数を計数する。そし
て、付与したラベル番号のうち2番目に多い画素が規定
値の範囲内であれば、分類した画素のラベル番号と画素
数を文字抽出部5へ通知する。
【0023】分類した画素のラベル番号と画素数の通知
を受けた文字抽出部5は、最初に認識用イメージメモリ
部6全体に白画素を書き込む。そして、図5に示すよう
に、1番多いラベル番号を背景、2番目に多い画素を文
字とし、文字と背景の明度をRGB値で比較し、明度の
高い方を基準に処理を行うことで認識用イメージメモリ
部6に2値化した文字を書き込む。認識用イメージメモ
リ部6へ文字の書さ込みを終了した文字抽出部5は文字
認識部7に文字認識を通知する。
【0024】文字認識の通知を受けた文字認識部7は1
文字ごと切り出して文字認識を行う。そして、全文字を
認識したら、認識結果を出力するとともに、色領域検出
部2へ認識終了を通知する。以上により1つのカラー看
板画像を文字認識することがすることが出来る。
【0025】さらに、以上の手順を繰り返せば順次、別
のカラー看板画像の文字認識が出来る。ただし、大きさ
・形状判定部3で規定の形状および規定の大ささ・形状
でない場合や、画素分類部4で2番目に多い画素の数が
規定値の範囲外の場合は色領域検出部2へその旨を通知
し、色領域のラベル番号を処理済みのラベル番号に書き
換える。すると、色領域検出部2は再度任意の色領域を
検出し、大きさ・形状判定部3、画素分類部4、文字抽
出部5、認識用イメージメモリ部6を介して文字認識部
7で文字認識される。
【0026】なお、色領域検出部2はカラーイメージメ
モリ部1の処理済みのラベル番号を検査し、未処理の領
域が存在しなくなるか、規定の面積以下になった場合は
処理を終了する。
【0027】図2は色領域の検出方法の例を説明する図
であり、A0〜A35はRGB値を持つ画素である。
【0028】次に、図2により色領域の検出方法例の動
作を説明する。任意に選択された画素A8のRGB値
(R8,B8,G8)と8方向の周辺画素A1〜A3,
A7,A9,A13〜A15のRGB値(R1,G1,
B1〜R15,G15,B15)の差分を合計を以下の
ように求め、規定値と比較する。そして、規定値T以下
なら同一の色領域としてラベル付けを行う。
【0029】│R8−Rn|+|G8−Gn|+|B8
−Bn|≦T(nは1〜3,7,9,13〜15) そして、画素A9,A13,A14が規定値T以下で、
それ以外は規定値Tを越えたとすると、画素A9,A1
3,A14に同一ラベルが与えられる。次に、統合され
た画素A9から6方向(検査ずみであるため2方向は対
象外)の画素A2,A3,A4,A10,A15,A1
6のRGB値と画素A8のRGB値の差分の合計を求め
る。そして、規定値T以下が画素A10,A16とする
と、画素A10,A16にA8と同じラベル番号を与え
る。次は画素A13の6方向(検査済みであるため2方
向は対象外)、A14は4方向というように順次周辺画
素のRGB値と画素A8のRGB値を比較し、周辺画素
に規定値T以下の画素が存在しなくなった場合はラベル
番号の付与をやめる。このようにして同一のラベル番号
が与えられた領域が色領域として検出される。
【0030】なお、本処理は、1画素単位の処理とした
が、処理単位をブロックにし、ブロック内の平均RGB
を比較しても良い。また、隣接画素も1または2画素離
れた方向までに規定値以下の画素が存在すれば、そこま
での画素は同一色としてラベル付けする方法も可能であ
る。また、隣接画素が同一色かを調べる方法として、以
下のようにRGB値個別の差分が規定値T以下とする方
法もある。
【0031】|R8−Rn|≦T,|G8−Gn|≦
T,|B8−Bn|≦T 図3は色領域の大きさ・形状を判定する方法の例を説明
する図であり、10はカラー画像、11はカラー看板画
像、12はカラー看板画像の外接矩形、Wは外接矩形の
幅、Hは外接矩形の高さである。なお、カラー看板画像
11の網掛けの暗い方が明度が低いことを示している。
【0032】次に、図3を用いて大ささ・形状判定方法
の例を説明する。まず、カラーイメージメモリ部1に対
して、色領域であるカラー看板画像11を示すラベル番
号の画素数を調べ、画素数がA画素±β%の範囲であれ
ば、色領域の示すカラー看板画像11の外接矩形12を
調べ、高さHがh画素±α%、幅Wがw画素±α%の範
囲であり、かつ高さが横のN倍以上であれば処理対象で
あるとして以降の画素分類部4へ色領域のラベル番号を
通知する。
【0033】図4は色領域に含まれる画素をRGB値で
分類するこ方法の例を説明する図であり、P0〜P27
はRGB値を持つ画素である。
【0034】次に、図4を用いて色領域に含まれる画素
をRGB値を用いて分類する方法の例を説明する。
【0035】まず、色領域の左上端の画素P1のRGB
値をR1,B1,G1を基準値として以降の画素P1〜
P23のRGB値を次式で計算し、 |R1−Rn|+|G1−Gn|+|B1−Bn|≦S
(nは画素数) 規定値S以下の場合は同じ分類のラベル番号を付与し、
画素数を計数する。本例では、画素P1〜P5,P7,
P8,P11〜P16,P19〜P23が類似画素と検
出され、同一のラベル番号が付与される。次に、ラベル
付けされなかった画素のうち左上端P6のRGB値のR
6,B6,G6を基準として以降の画素P7〜P23ま
でを以下のように比較する。ただし、画素P9〜P23
までですでにラベル番号を付与された画素は除く。
【0036】|R6−Rn|+|G6−Gn|+|B6
−Bn|≦S(nは画素数) そして、規定値S以下の場合は画素P6と同じ分類のラ
ベル番号を付与し、画素数を計数する。画素P6の類似
画素はP9,P10である。次は画素P17のRGB値
を基準に同様の処理を行うと画素P18を類似画素と判
定しラベル付けを行う。
【0037】このようにして、色領域に含まれる領域の
全画素を分類、計数する。そして、1番多いラベル番号
と画素数、2番目に多いラベル番号と画素数を求める。
そして、2番目に多いラベルの画素数が規定値の範囲以
内であれば文字情報ありと判定し、文字抽出部5へ分類
したラベル番号と画素数を通知する。
【0038】なお、本例では、類似画素の判定方法とし
て、以下のようにRGB値個別の差分が規定値S以下か
どうかを個別に計算することも出来る。
【0039】|R1−Rn|≦S,|G1−Gn|≦
S,|B1−Bn|≦S 図5は色領域から文字を抽出して、白黒2値画像を作成
する方法の例を説明する図であり、20はマッハ効果に
より文字のエッジ付近に現れる色変化、21は黒ノイ
ズ、22は白黒で2値化されたカラー看板画像である。
【0040】次に、図5を用いて色領域から文字を抽出
して、白黒2値画像を作成する方法の例を説明する。
【0041】まず、文字認識用イメージメモリ部6に自
画素を書き込みクリヤする。次に、画素分類部で得られ
た1番多い画素のラベルを背景領域、2番目に多い画素
を文字とし、1番目に多い画素のRGB値の和と2番目
に多い画素のRGB値の和の大小を比較することで明度
を比較する。そして、明度の高い画素が1番多い画素な
らば、2番目に多い画素以外のラベル番号の位置を調
べ、認識用イメージメモリ部6の対応する位置に黒画素
で書き込む。明度が高い画素が2番目に多い画素なら
ば、2番目に多い画素のラベル番号の位置をしらべ、認
識用イメージメモリ部6の対応する位置に黒画素で書き
込む。このようにすることでカラー看板画像11の文字
のエッジ付近に現れる色変化20、黒ノイズ21を除い
た文字のみが認識用イメージメモリ部6に白黒で2値化
されたカラー看板画像22が書き込まれる。
【0042】なお本発明は、記録媒体を読み取るための
読取装置と、文字認識対象のカラー画像や記録媒体から
読み取ったプログラムを格納しそれを自由に読み出し可
能なメモリ装置と、色領域の検出、その大きさや形状の
検出、色領域に含まれる画素の分類と画素数の計数、2
番目に多い画素数の色領域が規定値かどうかの判定等の
処理を行う際に必要なデータを保持するためのバッファ
やそれに準ずる装置と、上記処理の過程で必要な情報を
表示したりカラー画像や文字認識結果等をモニタしたり
するためのディスプレイなどの出力装置と、必要な指示
を与えるためのキーボードやマウスなどの入力装置とを
備え、それらのメモリ装置、バッファ、出力装置及び入
力装置などを上記プログラムによって予め定められた手
順に基いて制御するコンピュータやそれに準ずる装置に
より、図1を用いて説明した本発明の方法の実施形態例
での処理の手順ないしアルゴリズムを適宜、実行するこ
とが可能であり、その手順ないしアルゴリズムをコンピ
ュータ等に実行させるためのプログラムを上記読取装置
が読み取り可能な記録媒体、例えばフロッピーディスク
やメモリカード、MO、CD、DVDなどに記録して配
布することが可能である。
【0043】
【発明の効果】以上説明したように、本発明によれば、
カラー画像中の複数の看板等の文字図形を、画素のRG
B値を用いて直接比較することで色領域を抽出可能と
し、色領域に含まれる画素をRGBで分類して1番多い
画素を背景領域、2番目に多い画素を文字図形として認
識するようにしたので、RGB値を明度に変換して2値
化する方法、および枠なし文字図形等に対して色相、彩
度情報に変換して色を識別することが必要ないため、処
理時間が少なくてすむ利点がある。さらに一連の処理で
反転文字図形に対応出来るため、黒白反転処理を必要と
せずに反転文字が認識可能な白黒イメージを作成出来る
利点がある。また、それとともに、文字図形と背景領域
の明度を比較し、明度の高い方を基準に2値化する方法
をも用いる場合には、特別な処理をせずに文字図形のエ
ッジ付近に生じる色変化やデザイン文字のようにエッジ
を強調した文字に対しても、これらを除去し、文字図形
認識に影響を与えない文字図形切り出しが出来る利点が
ある。
【図面の簡単な説明】
【図1】本発明の一実施形態例を示すブロック図であ
る。
【図2】上記実施形態例での、色領域の検出方法の例を
説明する図である。
【図3】上記実施形態例での、色領域を大きさ・形状を
判定する方法の例を説明する図である。
【図4】上記実施形態例での、色領域に含まれる画素を
RGB値で分類する方法の例を説明する図である。
【図5】上記実施形態例での、色領域から文字を抽出し
て白黒の2値画像を作成する方法の例を説明する図であ
る。
【符号の説明】
1…カラーイメージメモリ部 2…色領域検出部 3…大ささ・形状判定部 4…画素分類部 5…文字抽出部 6…認識用イメージメモリ部 7…文字認識部 A0〜A35…画素 10…カラー画像 11…カラー看板画像 12…カラー看板画像の外接矩形 W…カラー看板画像の幅 H…カラー看板画像の高さ P1〜P27…画素 20…文字の付近の色変化 21…黒ノイズ 22…白黒で2値化されたカラー看板画像
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小倉 健司 東京都新宿区西新宿3丁目19番2号 日本 電信電話株式会社内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 カラー画像中の任意の色領域をRGB値
    の差を用いて検出し、 前記検出した色領域が規定の大ささ・形状であれば、該
    色領域に含まれる画素をRGB値を用いて分類し、 前記分類した画素で2番目に多い画素の数が規定値の範
    囲であれば、1番多い画素の色領域を背景領域、2番目
    に多い画素の色領域を文字図形として識別する、 ことを特徴とするカラー画像中の文字図形と背景領域の
    識別方法。
  2. 【請求項2】 前記色領域を背景領域と文字図形として
    識別する過程においては、 前記背景領域と文字図形を示す画素のRGB値を比較
    し、該背景領域の明度が高い場合は前記色領域を背景領
    域と背景領域以外の領域に、該文字図形の明度が高い場
    合は前記色領域を文字図形の領域と文字図形以外の領域
    に分類する、 ことを特徴とする請求項1記載のカラー画像中の文字図
    形と背景領域の識別方法。
  3. 【請求項3】 カラー画像中の任意の色領域をRGB値
    の差を用いて検出する手段と、 前記検出した色領域の大ささ・形状を検出する手段と、 前記色領域に含まれる画素をRGBの差を用いて分類
    し、2番目に多い画素の数が規定値の範囲かどうかを判
    定する手段と、 前記判定が規定値の範囲であれば、前記分類した画素で
    1番多い画素の色領域を背景領域、2番目に多い画素の
    色領域を文字図形として識別する手段と、 を備えて構成することを特徴とするカラー画像中の文字
    図形と背景領域の識別装置。
  4. 【請求項4】 前記色領域を背景領域と文字図形として
    識別する手段として、 前記背景領域と文字図形を示す画素のRGB値を比較
    し、該背景領域の明度が高い場合は前記色領域を背景領
    域と背景領域以外の領域に、該文字図形の明度が高い場
    合は前記色領域を文字図形の領域と文字図形以外の領域
    に分類する手段を備えて構成する、 ことを特徴とする請求項3記載のカラー画像中の文字図
    形と背景領域の識別装置。
  5. 【請求項5】 カラー画像中の任意の色領域をRGB値
    の差を用いて検出する手順と、 前記検出した色領域が規定の大ささ・形状であれば、該
    色領域に含まれる画素をRGB値を用いて分類する手順
    と、 前記分類した画素で2番目に多い画素の数が規定値の範
    囲であれば、1番多い画素の色領域を背景領域、2番目
    に多い画素の色領域を文字図形として識別する手順と、 をコンピュータで実行するプログラムとして該コンピュ
    ータが読み取り可能な記録媒体に記録した、 ことを特徴とするカラー画像中の文字図形と背景領域の
    識別方法を記録した記録媒体。
  6. 【請求項6】 前記色領域を背景領域と文字図形として
    識別する手順においては、 前記背景領域と文字図形を示す画素のRGB値を比較
    し、該背景領域の明度が高い場合は前記色領域を背景領
    域と背景領域以外の領域に、該文字図形の明度が高い場
    合は前記色領域を文字図形の領域と文字図形以外の領域
    に分類する、 ことを特徴とする請求項5記載のカラー画像中の文字図
    形と背景領域の識別方法を記録した記録媒体。
JP10016549A 1998-01-29 1998-01-29 文字図形と背景領域の識別方法およびその装置およびその方法を記録した記録媒体 Pending JPH11213090A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10016549A JPH11213090A (ja) 1998-01-29 1998-01-29 文字図形と背景領域の識別方法およびその装置およびその方法を記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10016549A JPH11213090A (ja) 1998-01-29 1998-01-29 文字図形と背景領域の識別方法およびその装置およびその方法を記録した記録媒体

Publications (1)

Publication Number Publication Date
JPH11213090A true JPH11213090A (ja) 1999-08-06

Family

ID=11919365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10016549A Pending JPH11213090A (ja) 1998-01-29 1998-01-29 文字図形と背景領域の識別方法およびその装置およびその方法を記録した記録媒体

Country Status (1)

Country Link
JP (1) JPH11213090A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003003340A1 (en) * 2001-06-28 2003-01-09 Intel Corporation Method and apparatus for enabling power management of a flat-panel display
KR100651309B1 (ko) 2003-09-11 2006-11-29 마츠시타 덴끼 산교 가부시키가이샤 화질 보정 장치 및 화질 보정 방법
JP2007336563A (ja) * 2006-06-15 2007-12-27 Sharp Corp デジタル画像における均一な色の領域を特定する方法およびシステム
US7348957B2 (en) 2003-02-14 2008-03-25 Intel Corporation Real-time dynamic design of liquid crystal display (LCD) panel power management through brightness control
US7477228B2 (en) 2003-12-22 2009-01-13 Intel Corporation Method and apparatus for characterizing and/or predicting display backlight response latency
WO2010058735A1 (ja) * 2008-11-21 2010-05-27 独立行政法人科学技術振興機構 画像処理装置および方法
JP2010124346A (ja) * 2008-11-21 2010-06-03 Japan Science & Technology Agency 画像処理装置、方法およびプログラム
US8150166B2 (en) 2006-09-06 2012-04-03 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
US8358262B2 (en) 2004-06-30 2013-01-22 Intel Corporation Method and apparatus to synchronize backlight intensity changes with image luminance changes
US8368956B2 (en) 2006-06-15 2013-02-05 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
KR20190129531A (ko) * 2018-05-11 2019-11-20 (주)한틀시스템 투표지 인식 방법
CN114928731A (zh) * 2022-05-05 2022-08-19 中国电子科技集团公司第十四研究所 一种智能颜色交互显示方法和设备

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003003340A1 (en) * 2001-06-28 2003-01-09 Intel Corporation Method and apparatus for enabling power management of a flat-panel display
US7119786B2 (en) 2001-06-28 2006-10-10 Intel Corporation Method and apparatus for enabling power management of a flat panel display
US7348957B2 (en) 2003-02-14 2008-03-25 Intel Corporation Real-time dynamic design of liquid crystal display (LCD) panel power management through brightness control
KR100651309B1 (ko) 2003-09-11 2006-11-29 마츠시타 덴끼 산교 가부시키가이샤 화질 보정 장치 및 화질 보정 방법
US7477228B2 (en) 2003-12-22 2009-01-13 Intel Corporation Method and apparatus for characterizing and/or predicting display backlight response latency
US8358262B2 (en) 2004-06-30 2013-01-22 Intel Corporation Method and apparatus to synchronize backlight intensity changes with image luminance changes
JP2007336563A (ja) * 2006-06-15 2007-12-27 Sharp Corp デジタル画像における均一な色の領域を特定する方法およびシステム
US8368956B2 (en) 2006-06-15 2013-02-05 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
US8150166B2 (en) 2006-09-06 2012-04-03 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
JP4650958B2 (ja) * 2008-11-21 2011-03-16 独立行政法人科学技術振興機構 画像処理装置、方法およびプログラム
JP2010124346A (ja) * 2008-11-21 2010-06-03 Japan Science & Technology Agency 画像処理装置、方法およびプログラム
WO2010058735A1 (ja) * 2008-11-21 2010-05-27 独立行政法人科学技術振興機構 画像処理装置および方法
KR20190129531A (ko) * 2018-05-11 2019-11-20 (주)한틀시스템 투표지 인식 방법
CN114928731A (zh) * 2022-05-05 2022-08-19 中国电子科技集团公司第十四研究所 一种智能颜色交互显示方法和设备
CN114928731B (zh) * 2022-05-05 2023-11-28 中国电子科技集团公司第十四研究所 一种智能颜色交互显示方法和设备

Similar Documents

Publication Publication Date Title
US6731788B1 (en) Symbol Classification with shape features applied to neural network
US7379594B2 (en) Methods and systems for automatic detection of continuous-tone regions in document images
US9158986B2 (en) Character segmentation device and character segmentation method
US7840071B2 (en) Method and apparatus for identifying regions of different content in an image
KR100523898B1 (ko) 이미지 프로세싱 방법 및 장치 및 기록 매체
CN108805116B (zh) 图像文本检测方法及其系统
KR20010110416A (ko) 비디오 스트림 분류가능 심볼 고립 방법 및 시스템
CN110766017B (zh) 基于深度学习的移动终端文字识别方法及系统
JP2001169081A (ja) 文書を表わす画像データ内の走査時アーチファクトをマスキングするための処理及び装置並びに画像データ処理システム
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
CN101599125A (zh) 复杂背景下图像处理的二值化方法
JPH11213090A (ja) 文字図形と背景領域の識別方法およびその装置およびその方法を記録した記録媒体
US20190354791A1 (en) Character recognition method
JP4164489B2 (ja) 文書画像強調方法、装置及びそのための記憶媒体
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
JPS61141087A (ja) 画像処理方法及び装置
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
Suen et al. Segmentation of uniform-coloured text from colour graphics background
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2003087562A (ja) 画像処理装置および画像処理方法
CN113569859A (zh) 一种图像处理方法、装置、电子设备及存储介质
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JP4247993B2 (ja) 画像検査装置、画像検査方法、制御プログラムおよび可読記憶媒体
Kefali et al. Localization of scores and average in Algerian baccalaureate transcripts
Kumar et al. Analysis of OMR sheet using machine learning model