JP2001331803A - 画像中の文字領域抽出方法 - Google Patents

画像中の文字領域抽出方法

Info

Publication number
JP2001331803A
JP2001331803A JP2000148438A JP2000148438A JP2001331803A JP 2001331803 A JP2001331803 A JP 2001331803A JP 2000148438 A JP2000148438 A JP 2000148438A JP 2000148438 A JP2000148438 A JP 2000148438A JP 2001331803 A JP2001331803 A JP 2001331803A
Authority
JP
Japan
Prior art keywords
image
character
area
region
closed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000148438A
Other languages
English (en)
Inventor
Akira Kurematsu
明 榑松
Takayuki Nagai
隆行 長井
Masahide Kaneko
正秀 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2000148438A priority Critical patent/JP2001331803A/ja
Publication of JP2001331803A publication Critical patent/JP2001331803A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】対象となる情景画像への制約が少なく、しか
も、処理を自動的に行うことが可能な画像中の文字領域
抽出方法を提供する 【解決手段】まず、情景画像をRGBの電子情報として
取得し、HSV信号に変換する。このHSV信号を、そ
の明度(V)、色相(H)、彩度(S)に基づいて分解
して、2値化された複数の分解画像を得る。ついで、分
解画像に存在する閉領域を指定する。ついで、閉領域内
が平坦であるか否かに基づいて、分解画像から、複数の
候補画像を選別する。ついで、候補画像における閉領域
内の2値化レベルどうしが一致するように、複数の候補
画像のうち、一致しない候補画像の2値化レベルを調整
する。ついで、複数の候補画像どうしの論理積に基づい
てマスク画像を生成し、その後、マスク画像内において
2値化レベルが揃っている領域を選択して文字領域とす
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情景画像から文字
領域を抽出する方法に関するものである。
【0002】
【従来の技術】情景画像から文字を認識することができ
れば、例えば、外国旅行中に出会う看板から文字を認識
して自動的に翻訳し、対応する自分の母国語を表示する
などの利用が可能になる。
【0003】情景画像からの文字認識の方法としては、
下記文献1〜3に示すものがある。 文献1:松尾賢一,上田勝彦,梅田三千雄,“適応閾値
法を用いた情景画像からの看板文字列領域の抽出”,電
子情報通信学会論文誌D-II Vol.J80-D-II, No.6,pp.161
7-1627, 1997年6月 文献2:渡辺靖彦,岡田至弘,金淵培,武田哲也,“シ
ーン中のテキストの翻訳”,画像の認識・理解シンポジ
ウム(MIRU'98),I pp.99-104,平成10年7月 文献3:大谷淳,塩昭夫,“情景画像からの文字パター
ン抽出と認識”,電子情報通信学会論文誌D, Vol.J871-
D, No.6, pp.1037-1047, 1988年6月
【0004】しかしながら、これらの方法では、対象と
なる情景画像への制約があり、また、処理においてユー
ザの指定を要するなど、改善すべき点が残されている。
【0005】
【発明が解決しようとする課題】本発明は、前記の事情
に鑑みてなされたものである。本発明の目的は、対象と
なる情景画像への制約が少なく、しかも、処理を自動的
に行うことが可能な画像中の文字領域抽出方法を提供す
ることである。
【0006】
【課題を解決するための手段】請求項1記載の画像中の
文字領域抽出方法は、次のステップを含む構成となって
いる。 (1)情景画像をカラーの電子情報として取得するステ
ップ (2)前記電子情報を、この電子情報の明度、色相また
は彩度などの要素に基づいて分解して、2値化された複
数の分解画像を得るステップ (3)前記分解画像または前記情景画像中に存在する閉
領域を指定するステップ (4)前記閉領域内が平坦であるか否かに基づいて、前
記分解画像から、複数の候補画像を選別するステップ (5)前記候補画像における前記閉領域内の2値化レベ
ルどうしが一致するように、前記複数の候補画像のう
ち、一致しない候補画像の2値化レベルを調整するステ
ップ (6)前記複数の候補画像どうしの論理積に基づいてマ
スク画像を生成し、その後、前記マスク画像内において
2値化レベルが揃っている領域を選択して文字領域とす
るステップ 請求項2記載の画像中の文字領域抽出方法は、請求項1
のステップ(2)における前記要素を、互いに独立性の
高いものとした。請求項3記載の画像中の文字領域抽出
方法は、請求項1記載の文字領域抽出方法において、カ
ラーの電子情報を、HSV信号またはHSL信号とし
た。請求項4記載の画像中の文字領域抽出方法は、請求
項1〜3のいずれか1項記載の文字領域抽出方法におい
て、カラーの電子情報を、RGB信号として得られた情
景画像の信号を変換して得られたものとした。請求項5
記載の画像中の文字領域抽出方法は、請求項1〜4のい
ずれか1項記載の文字領域抽出方法において、分解画像
または情景画像中に存在する閉領域を、画像中央近傍に
おける部分的な領域とした。請求項6記載の画像中の文
字領域抽出方法は、請求項1〜4のいずれか1項記載の
文字領域抽出方法において、分解画像または情景画像中
に存在する閉領域を、下記式(a)〜(c)を満たすも
のとした。
【数2】 ここで、 a:前記閉領域での一方向での画素数 b:前記閉領域での一方向にほぼ直交する方向での画素
数 X_size:画像全体の前記一方向における画素数 Y_size:前記画像全体の前記一方向にほぼ直交する方向
での画素数 である。請求項7記載の画像中の文字領域抽出方法は、
請求項1〜6のいずれか1項に記載の文字領域抽出方法
において、閉領域内が平坦であることの判別は、2値化
された画素のうち、閉領域内において少ない方の画素数
が多い方の画素数の1/5以下をもって行うか、また
は、さらに好ましくは1/10以下であることをもって
行う構成となっている。請求項8記載の画像中の文字領
域抽出方法は、請求項1〜7のいずれか1項に記載の文
字領域抽出方法において、請求項1のステップ(6)に
おいて、前記2値化レベルが揃っている領域のうち、最
大の領域を選択して文字領域とする構成となっている。
請求項9記載の画像中の文字領域抽出方法は、請求項1
〜7のいずれか1項に記載の文字領域抽出方法におい
て、請求項1のステップ(6)において、前記2値化レ
ベルが揃っている領域のうち、領域の輪郭に凹凸が少な
いものを選択して文字領域とする構成となっている。請
求項10記載の文字抽出方法は、請求項1〜9のいずれ
か1項に記載の文字領域抽出方法により抽出した文字領
域から文字を抽出する構成となっている。請求項11記
載の文字認識方法は、請求項10記載の文字抽出方法に
より抽出した文字を認識する構成となっている。請求項
12記載の、コンピュータで読み取り可能な記録媒体、
または、このプログラムを実行するための信号は、請求
項1〜11のいずれか1項に記載の各ステップをコンピ
ュータで実行するプログラムを記録した、コンピュータ
で読み取り可能な記録媒体、または、このプログラムを
実行するための信号となっている。
【0007】
【発明の実施の形態】
【第1実施形態】本発明の第1実施形態に係る、画像中
の文字領域抽出方法を、図1〜図7を用いながら説明す
る。まず、本実施形態の基本的な手順と、各手順に対応
する機能ブロックを図1と図2に示す。
【0008】(ステップS1)図3に示すような情景画
像を、CCDカメラなどの任意の手段により、RGB信
号として取得する。この取得は、例えば、使用者が、文
字を含むと思われる看板(文字領域)にカメラを向けて
撮影することによって行うことができる。このとき、使
用者は、文字領域がなるべく画面の中央となるように撮
影をする。図3中(a)〜(d)は、命令、注意、説
明、名称をそれぞれ意味する看板を撮影して得た画像で
ある。ついで、情景画像としてのRGB信号をHSV信
号に変換する。変換式は公知であるが、念のため下記に
示す。式中、Vは明度、Hは色相、Sは彩度である。こ
れらV、H、Sという要素は、互いに独立性が高い。す
なわち、相関が少ない。
【数3】 本実施形態では、このようにして得られたHSV信号
が、カラーの電子情報として取得される。ただし、HS
V信号に限らず、HSL信号のように、要素間に独立性
が高い信号を用いることができる。また、専用のチップ
を用いれば、RGB信号を介さず、直接HSV信号を取
得することも可能である。要素間に独立性の低い信号を
用いることは可能であるが、得られる性能は劣化するお
それが強い。
【0009】(ステップS2)ついで、前記したカラー
の電子情報を、この電子情報の要素であるH、S、Vに
基づいて分解して、2値化された複数の分解画像を得
る。この動作をさらに詳細に説明する。図4に示すよう
に、色相Hと彩度Sとに基づいて、7つの領域を区分け
する。ここにおいて、横軸の色相値は、360度を60
度刻みで6つに区分されている。彩度値は、256段階
に量子化されており、30を境にして区分されている。
カラーの電子情報において、一つの領域にあてはまる画
素を例えば黒、当てはまらない画素を白とする。例え
ば、赤色領域の画素は黒、それ以外の画素は白とする。
こうすれば、2値化された1枚の分解画像を得ることが
できる。同様にして、黄色領域の画素を基準にして、2
値化されたもう一枚の分解画像を得ることができる。こ
のようにすれば、7つの領域に対応して、2値化された
7枚の分解画像を得ることができる。一方、明度Vを8
階調に区分(再量子化)する。再量子化と称したのは、
一般に、明度自体、256階調などの量子化情報とされ
ているからである。画素が各階調に属するか否かによ
り、前記と同様にして、2値化された8枚の分解画像を
得ることができる。以上により、7+8=15枚の2値
化分解画像を取得することができる。このようにして得
た分解画像を図5に示す。
【0010】(ステップS3)前記ステップに前後し
て、分解画像または情景画像中に存在する閉領域を指定
する。この指定は、この第1実施形態では、画像の中央
近傍における、比較的小さい領域(例えば20×20画
素)と予め設定されている。中央としたのは、看板を画
像の中央に写すことが容易であり、そのような場合が多
いと想定されるからである。
【0011】(ステップS4)閉領域が指定された後、
閉領域内が平坦であるか否かに基づいて、分解画像か
ら、複数の候補画像を選別する。平坦であることを判別
する手段の具体例としては、閉領域内において、2値化
された画素のうち少ない方の画素数が多い方の画素数1
/10以下であることをもって行うことができる。1/
10以下と言う数字は当然のことながら単に一例であ
り、例えば1/5以下とすることも可能である。これに
より、図5の例では、#1,#2,#3,#6,#7,
#8,#10,#11,#12,#13,#14の分解
画像が選択される。選択された画像を候補画像と称す
る。
【0012】(ステップS5)ついで、候補画像におけ
る前記閉領域内どうしの間での2値化レベルが一致する
ように、複数の候補画像のうち、一致しない候補画像の
2値化レベルを調整する。具体的には、各領域内の白
(例えば1とする)と黒(例えば0とする)の画素数を
比べる。0が少ない場合はそのままとし、1が少ない場
合は、その、該当する分解画像における画素全体の0と
1を反転させる。このようにすると、各分解画像におけ
る閉領域内(結局、文字領域の候補となる領域内)の2
値化レベルを、白(すなわち2値の一方)に一致させる
ことができる。
【0013】(ステップS6)ついで、複数の分解画像
どうしの論理積をとる。すると、文字領域の候補となる
領域(文字候補領域と称する。)では、白(1)に一致
されているので、白(1)となる。一方、背景となる領
域(文字候補領域以外)については、分解画像どうしの
間で白(1)に一致している確率が低いので、論理積を
とれば、多くの画素は黒(0)になる。したがって、背
景(黒)と文字候補領域(白)とに分けることができ
る。さらに、背景領域について公知の膨張・収縮を施す
と、背景をさらに黒レベルに統一することができる。こ
のようにしてマスク画像を生成できる。その後、文字候
補領域から、マスク画像内において2値化レベルが白に
揃っている領域を選択して文字領域とする。さらに、こ
の実施形態では、2値化レベルが白に揃っている領域が
複数ある場合、最大のものを選択する。これは、文字領
域が画面の最大領域となるように撮影することが容易で
あると考えられるからである。文字候補領域が一つであ
る場合は自動的に文字領域が決定されるが、この明細書
ではこれも選択と称する。同じく、文字候補領域の場所
(例えば中央にあること)に基づいて、選択される文字
候補領域が予め決められている場合も、自動的に文字領
域が決定されるが、これも選択と称する。
【0014】ついで、選択された文字領域にある文字を
抽出する。この実施形態によれば、文字領域内には余計
な背景部分がない。このため、画像を一方向に走査して
得られるヒストグラムは一般に双峰性となる。したがっ
て、公知の方法(例えば判別分析法)によって、文字を
抽出するための閾値を容易に決定できる。判別分析法
は、下記文献4などに記載されている。 文献4:尾崎弘,谷口慶治“画像処理−その基礎から応
用まで”共立出版株式会社,1983年 念のため、判別分析法における閾値の決め方を下記に示
す。
【数4】 としたとき、閾値は、次の分離度η(T)が最大になる
値となる。
【数5】 この閾値を基準として、文字を抽出することができる。
【0015】ついで、抽出された文字に対して、通常の
OCRソフトウエアに入力して文字認識を行う。
【0016】
【実験例1】100枚の情景画像(1152*864pixel, 24b
it/pixel)を利用して、第1実施形態の方法により実験
を行った。結果を下記の表1に示す。ここでは、実際に
処理するときには画像を0.3倍に縮小した。
【表1】 また、文字領域を抽出した例と文字を抽出した例とを図
6と図7とに示す。
【0017】
【第2実施形態】つぎに、本発明の第2実施形態に係る
文字抽出方法を図8〜図14を用いながら説明する。こ
の実施形態の説明においては、前記した第1実施形態と
相違する部分についてのみ説明をする。
【0018】(ステップS3)分解画像または情景画像
中に存在する閉領域を指定する方法として、この実施形
態では、各分解画像において下記式を満たす閉領域を探
索して選択し、候補領域とする。
【数6】 ここで、 a:前記閉領域での一方向での画素数 b:前記閉領域での一方向にほぼ直交する方向での画素
数 X_size:画像全体の一方向における画素数 Y_size:前記画像全体の一方向にほぼ直交する方向での
画素数 である。用いた記号の意味を図8に示した。これは、要
するに、ある程度以上の大きさでかつ正方形に近い閉領
域を選択したことになる。この処理だけであると、領域
内に文字を含まない可能性がある。そこで、文字を含む
領域を選択するため、以下の処理をさらに行う。すなわ
ち、各領域内の彩度Sと明度Vのヒストグラムを用い
る。閉領域が文字を含む場合、ヒストグラムは2つの山
を持つと考えられる。この特徴を用いて、閉領域を選別
する。図9に、文字を含む閉領域とそのヒストグラムの
例を示す。図10に、原画像と、その分解画像から生成
し、選択した閉領域の例を示す。このようにして得た閉
領域は、前記第1実施形態における閉領域として扱わ
れ、その後の処理がなされる。閉領域は複数存在しても
良い。
【0019】(ステップS6)ステップS6においても
基本的に第1実施形態と同様である。ただし、第2実施
形態では、図11に示されるような、複数の文字候補領
域が存在する場合に、次のように対処する。図11で
は、それぞれの領域を白で示した画像を、マスク画像1
〜3として示している。これらのうちには、誤った(つ
まり文字領域でない)領域が存在する可能性がある。そ
こで、次の方法で選別を行う。すなわち、各文字候補領
域の輪郭をとり、横(X軸)と縦(Y軸)に沿って画素
数をカウントする。これらをある閾値で判断し、凹凸が
少ない輪郭を有する領域を文字領域とする。図12の左
側は、各マスク画像1〜3における領域の輪郭を示し、
右側は、カウント数のグラフを示している。各欄におい
て上のグラフは、X軸に沿って画素数をカウントしたも
の、下のグラフはY軸に沿って画素数をカウントしたも
のを示している。閾値Kは下式により計算する。
【数7】 ここで、Countsはカウント数、maxは最大値、meanは平
均値を示している。カウント数グラフの縦軸をYとする
と、Y=Kの直線とカウント数グラフとの交点の数が、
2,4,6,8のように偶数である領域を文字領域とし
て選択する。これは、理想的な円の場合、カウント数の
グラフはひとつのピークを持つ山となるためその交点数
が2となり、長方形の場合はピークが2つで交点数が4
となるためである。ここで、ひとつのピークに対する交
点数は原則として2であることに留意されたい。但し、
実際には、領域の傾きや正確な長方形でないためにピー
クが3つ、もしくは4つ現れることがある。これを考慮
して、交点数を、2、4以外にも、6、8とある程度幅
を持たせている。また実験の結果、交点数が10以上の
場合や奇数となる場合は、文字領域でない場合がほとん
どであったため、こうした場合は除外することとした。
交点数が奇数になるのは、ほとんどの場合、領域が画像
の端にくるときである(図12の符号3で示す例を参
照)。ここではそういった場合を除外するために奇数は
選択しないこととした。この基準によれば、図12の例
では、符号2で示す領域が選択される。他の手順は第1
実施形態と同様なので説明を省略する。
【0020】
【実験例2】106枚の情景画像(1152*864pixel, 24b
it/pixel)を利用して、第1実施形態の方法により実験
を行った。結果を下記の表1に示す。ここでは、実際に
処理するときには画像を0.3倍に縮小した。
【表2】 この表の意味について説明する。「閉領域の探索」の後
にかっこで示した数字は、全画像中に含まれる文字数
(正確に算出したもの)である。1364文字のうち、
前記ステップS3で指定した全閉領域に含まれていた文
字数は800文字であった。閉領域に文字が含まれず、
誤って文字として認識された数が120(文字)であっ
た。その下の比率は、1364文字に対する、この時点
で認識された文字数の比率を示している。閉領域に文字
が1文字でも含まれていれば、その閉領域を基準とし
て、前記したステップにより、文字候補領域を選択でき
る。したがって、この文字候補領域に基づく文字抽出が
可能になる。マスク画像の生成とは、図10の右側に示
すような文字候補領域に基づいて、図11に示されるよ
うなマスク画像を生成することを意味する。その下の記
号の意味は次の通りである。 ○:マスク画像生成時に、完全に文字領域のみを抽出で
きた情景画像の数と、全情景画像数に対する比率 △:マスク画像生成時に、抽出した領域に文字領域を含
んでいるが、一部が欠けてしまっている、もしくは、文
字領域以外の領域を含んでいる情景画像の数と、全情景
画像数に対する比率 ×:マスク画像生成時に、抽出した領域が、文字領域を
全く含んでいない情景画像の数と、全情景画像数に対す
る比率 よいマスク画像の生成とは、前記したマスク画像の生成
を前提として、ステップS6において説明した領域の選
別(例えばマスク画像1〜3からの選別)を意味してい
る。記号の意味は、基本的に前記と同様に、次の通りで
ある。 ○:マスク画像選別後に、完全に文字領域のみを抽出で
きた情景画像の数と、全情景画像数に対する比率 △:マスク画像選別後に、抽出した領域に文字領域を含
んでいるが、一部が欠けてしまっている、もしくは、文
字領域以外の領域を含んでいる情景画像の数と、全情景
画像数に対する比率 ×:マスク画像選別後に、抽出した領域が、文字領域を
全く含んでいない情景画像の数と、全情景画像数に対す
る比率 また、具体的な抽出例を図13と図14とに示す。
【0021】前記した各実施形態の実行は、当業者には
コンピュータにより容易に実行可能である。そのための
プログラムは、コンピュータで読み取り可能な記録媒
体、例えばHD、FD、CD、MOなど、任意のものに
格納できる。また、このプログラムを実行するための信
号とは、例えば、ネットワークを用いて本発明を実施す
る場合に必要となる、電気、光、その他の伝送媒体にお
ける信号である。
【0022】なお、前記実施形態および実施例の記載は
単なる一例に過ぎず、本発明に必須の構成を示したもの
ではない。各部の構成は、本発明の趣旨を達成できるも
のであれば、上記に限らない。また、本実施形態を実現
するための各部(機能ブロックを含む)の具体的手段
は、ハードウエア、ソフトウエア、ネットワーク、これ
らの組み合わせ、その他の任意の手段を用いることがで
き、このこと自体は当業者において自明である。また、
機能ブロックどうしが複合して一つの機能ブロックに集
約されても良い。
【0023】
【発明の効果】本発明によれば、対象となる情景画像へ
の制約が少なく、しかも、処理を自動的に行うことが可
能な画像中の文字領域抽出方法を得ることが可能とな
る。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る文字領域抽出方法の
概要を示すフローチャートである。
【図2】本発明の一実施形態に係る文字領域抽出方法の
概要を示す機能ブロック図である。
【図3】情景画像の例を示す説明図である。
【図4】分解画像を作成するための方法を説明するため
の説明図である。
【図5】分解画像の例を示す説明図である。
【図6】文字領域の抽出例を示す説明図である。
【図7】文字の抽出例を示す説明図である。
【図8】文字候補領域を説明するための説明図である。
【図9】文字候補領域を説明するための説明図である。
【図10】文字候補領域の抽出例を説明するための説明
図である。
【図11】マスク画像の例を説明するための説明図であ
る。
【図12】マスク画像の輪郭とカウント数のグラフを説
明するための説明図である。
【図13】文字領域の抽出例を示す説明図である。
【図14】文字領域の抽出例を示す説明図である。
フロントページの続き Fターム(参考) 5B029 AA02 BB02 CC29 DD07 5B057 BA02 CA01 CB01 CC03 CE12 CE18 DA08 DB06 DC19 DC22 5L096 AA02 CA02 EA02 EA43 FA36 FA44 FA54 GA22 GA28 GA40 GA41

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 次のステップを含むことを特徴とする、
    画像中の文字領域抽出方法。 (1)情景画像をカラーの電子情報として取得するステ
    ップ (2)前記電子情報を、この電子情報の明度、色相また
    は彩度などの要素に基づいて分解して、2値化された複
    数の分解画像を得るステップ (3)前記分解画像または前記情景画像中に存在する閉
    領域を指定するステップ (4)前記閉領域内が平坦であるか否かに基づいて、前
    記分解画像から、複数の候補画像を選別するステップ (5)前記候補画像における前記閉領域内の2値化レベ
    ルどうしが一致するように、前記複数の候補画像のう
    ち、一致しない候補画像の2値化レベルを調整するステ
    ップ (6)前記複数の候補画像どうしの論理積に基づいてマ
    スク画像を生成し、その後、前記マスク画像内において
    2値化レベルが揃っている領域を選択して文字領域とす
    るステップ
  2. 【請求項2】 請求項1のステップ(2)における前記
    要素は、互いに独立性の高いものであることを特徴とす
    る請求項1記載の画像中の文字領域抽出方法。
  3. 【請求項3】 前記カラーの電子情報は、HSV信号ま
    たはHSL信号であることを特徴とする請求項1記載の
    画像中の文字領域抽出方法。
  4. 【請求項4】 前記カラーの電子情報は、RGB信号と
    して得られた情景画像の信号を変換して得られたもので
    あることを特徴とする請求項1〜3のいずれか1項記載
    の画像中の文字領域抽出方法。
  5. 【請求項5】 前記分解画像または前記情景画像中に存
    在する閉領域は、画像中央近傍における部分的な領域で
    あることを特徴とする請求項1〜4のいずれか1項記載
    の画像中の文字領域抽出方法。
  6. 【請求項6】 前記分解画像または前記情景画像中に存
    在する閉領域は、下記式(a)〜(c)を満たすことを
    特徴とする請求項1〜4のいずれか1項記載の画像中の
    文字領域抽出方法。 【数1】 ここで、 a:前記閉領域での一方向での画素数 b:前記閉領域での一方向にほぼ直交する方向での画素
    数 X_size:画像全体の前記一方向における画素数 Y_size:前記画像全体の前記一方向にほぼ直交する方向
    での画素数 である。
  7. 【請求項7】 前記閉領域内が平坦であることの判別
    は、2値化された画素のうち、閉領域内において少ない
    方の画素数が多い方の画素数の1/5以下をもって行う
    か、または、さらに好ましくは1/10以下であること
    をもって行うことを特徴とする請求項1〜6のいずれか
    1項に記載の画像中の文字領域抽出方法。
  8. 【請求項8】 請求項1のステップ(6)において、前
    記2値化レベルが揃っている領域のうち、最大の領域を
    選択して文字領域とすることを特徴とする請求項1〜7
    のいずれか1項に記載の画像中の文字領域抽出方法。
  9. 【請求項9】 請求項1のステップ(6)において、前
    記2値化レベルが揃っている領域のうち、領域の輪郭に
    凹凸が少ないものを選択して文字領域とすることを特徴
    とする請求項1〜7のいずれか1項に記載の画像中の文
    字領域抽出方法。
  10. 【請求項10】 請求項1〜9のいずれか1項に記載の
    文字領域抽出方法により抽出した文字領域から文字を抽
    出することを特徴とする文字抽出方法。
  11. 【請求項11】 請求項10記載の文字抽出方法により
    抽出した文字を認識することを特徴とする文字認識方
    法。
  12. 【請求項12】 請求項1〜11のいずれか1項に記載
    の各ステップをコンピュータで実行するプログラムを記
    録した、コンピュータで読み取り可能な記録媒体、また
    は、このプログラムを実行するための信号。
JP2000148438A 2000-05-19 2000-05-19 画像中の文字領域抽出方法 Withdrawn JP2001331803A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000148438A JP2001331803A (ja) 2000-05-19 2000-05-19 画像中の文字領域抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000148438A JP2001331803A (ja) 2000-05-19 2000-05-19 画像中の文字領域抽出方法

Publications (1)

Publication Number Publication Date
JP2001331803A true JP2001331803A (ja) 2001-11-30

Family

ID=18654461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000148438A Withdrawn JP2001331803A (ja) 2000-05-19 2000-05-19 画像中の文字領域抽出方法

Country Status (1)

Country Link
JP (1) JP2001331803A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015210802A (ja) * 2014-04-30 2015-11-24 日本電産コパル株式会社 光学式文字認識装置、光学式文字認識方法
US9679217B2 (en) 2014-08-26 2017-06-13 Kabushiki Kaisha Toshiba Information processing apparatus, information processing system, information processing method and storage medium
US9819860B2 (en) 2015-03-09 2017-11-14 Kabushiki Kaisha Toshiba Data processor, data processing method and storage medium
US20180089856A1 (en) * 2016-09-23 2018-03-29 Casio Computer Co., Ltd. Method of detecting skin color area of human
US10121086B2 (en) 2015-07-14 2018-11-06 Kabushiki Kaisha Toshiba Information processing apparatus and information processing method
JP2022040063A (ja) * 2020-08-26 2022-03-10 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 地理位置点の空間関係を抽出する方法及び装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015210802A (ja) * 2014-04-30 2015-11-24 日本電産コパル株式会社 光学式文字認識装置、光学式文字認識方法
US9679217B2 (en) 2014-08-26 2017-06-13 Kabushiki Kaisha Toshiba Information processing apparatus, information processing system, information processing method and storage medium
US9819860B2 (en) 2015-03-09 2017-11-14 Kabushiki Kaisha Toshiba Data processor, data processing method and storage medium
US10121086B2 (en) 2015-07-14 2018-11-06 Kabushiki Kaisha Toshiba Information processing apparatus and information processing method
US20180089856A1 (en) * 2016-09-23 2018-03-29 Casio Computer Co., Ltd. Method of detecting skin color area of human
US10621754B2 (en) * 2016-09-23 2020-04-14 Casio Computer Co., Ltd. Method of detecting skin color area of human
JP2022040063A (ja) * 2020-08-26 2022-03-10 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 地理位置点の空間関係を抽出する方法及び装置
US11615613B2 (en) 2020-08-26 2023-03-28 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and device for extracting spatial relationship of geographic location points
JP7298090B2 (ja) 2020-08-26 2023-06-27 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 地理位置点の空間関係を抽出する方法及び装置

Similar Documents

Publication Publication Date Title
EP1146478B1 (en) A method for extracting titles from digital images
Al-Tairi et al. Skin segmentation using YUV and RGB color spaces
US8401303B2 (en) Method and apparatus for identifying character areas in a document image
CN109766822B (zh) 基于神经网络的手势识别方法及系统
JP2007504719A (ja) 組み込みアプリケーションに適した、画像における赤目の検出と補正を行うシステム及び方法
US6289110B1 (en) Object extracting method using motion picture
Jamil et al. Edge-based features for localization of artificial Urdu text in video images
JPH1153525A (ja) 顔器官検出装置及び媒体
WO2021113400A1 (en) User-guided image segmentation methods and products
CN115578741A (zh) 一种基于Mask R-cnn算法和类型分割的扫描文件版面分析方法
JPH11213160A (ja) 画像処理方法及び装置及びその記憶媒体
Ikonomakis et al. Region-based color image segmentation scheme
JP2001331803A (ja) 画像中の文字領域抽出方法
WO2024139298A1 (zh) 图像标注方法、装置电子设备及存储介质
JP2004246424A (ja) 肌色領域の抽出方法
KR101571681B1 (ko) 동질 영역을 이용한 문서 구조의 분석 방법
JP2000348173A (ja) 唇抽出方法
Agrawal et al. Text extraction from images
US20090290797A1 (en) Image processing for storing objects separated from an image in a storage device
Alajel et al. Face detection based on skin color modeling and modified Hausdorff distance
CN113705571A (zh) 基于rgb阈值去红章的方法、装置、可读介质及电子设备
Zhang et al. Face anti-spoofing detection based on color texture structure analysis
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
Ojo et al. Illumination invariant face detection using hybrid skin segmentation method
KR102668050B1 (ko) 그림 이미지를 추출하는 방법, 장치 및 컴퓨터 프로그램

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070807