JP3476595B2 - 画像領域分割方法、および画像2値化方法 - Google Patents
画像領域分割方法、および画像2値化方法Info
- Publication number
- JP3476595B2 JP3476595B2 JP15954195A JP15954195A JP3476595B2 JP 3476595 B2 JP3476595 B2 JP 3476595B2 JP 15954195 A JP15954195 A JP 15954195A JP 15954195 A JP15954195 A JP 15954195A JP 3476595 B2 JP3476595 B2 JP 3476595B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- image
- character
- attribute
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Description
像認識装置に適用され、濃淡画像を文字領域及びその他
の領域等の属性に応じて分割する画像領域分割方法、お
よび画像2値化方法に関するものである。
の他の背景領域等の属性に応じて分割する際、画像濃度
の2値化によって分割することが知られており、例えば
2値化の方法としては、「Pタイル法」、「双峰性ヒス
トグラムの分散最大による二分割法」(長尾真著「画像
認識論」、コロナ社、38頁〜45頁)等がある。
すように、画像中の各ピクセル(画素)の濃度レベル差
の濃度差閾値θ以上(または以下)のピクセルの割合
が、予め定められた比率になるように上記濃度差閾値θ
の値を決定するものである。
る二分割法は、例えば図9(b)に示すように、濃度値
ヒストグラムを濃度差閾値θで二分するとき、2つのピ
クセルの濃度のクラス間分散が最大となるように上記濃
度差閾値θの値を決定するものである。
めに、上記Pタイル法では、以下の仮定が必要である。
数は一定範囲にある。
グラムの分散最大による二分割法では、以下の仮定が必
要である。
域、非文字領域を構成する濃度帯域はそれぞれ連続して
いる。
(a)に示すように、文字領域と非文字領域の濃度帯域
がそれぞれ連続していれば、画像と文字領域を認識する
ことができるが、図10(b)に示すように、文字領域
と非文字領域の濃度帯域のいずれかが不連続であれば、
画像と文字領域を認識することができない。
色の紙に、文字が別の単色で書かれた紙面を入力する際
には多くの場合有効であるが、入力画像の範囲をカラー
文書や種々の物体を含んだ画像にまで拡げると、一般に
成立しない。これは、カラー文書では、文字が種々の異
なる色で書かれている場合があり、このような場合文字
領域の濃度レベルが一定ではなくなり、また種々の物体
を含んだ一般画像では、文字が画像中にどれほど含まれ
るかは各画像によって大きく変化するためである。
るが、本来の処理対称と無関係なものを示している。例
えば、風景の中から、速度制限を示し文字列を取り出
し、認識するシステムを車両に搭載して走行する場合で
は、画像内の処理対称である上記速度制限を示し文字列
の他に存在する物、例えば他の車両、人物、看板、信号
機等が種々の物体となる。また、自動車のナンバープレ
ートの認識を行うため、走行中の車両を定点から撮影し
たシステムにおいても、画像内の処理対称である自動車
のナンバープレートの他に存在するものが種々の物体と
なる。
ラー文書等を含む画像において、自動的に、且つ正確な
2値化を行い、文字部分を抽出することは不可能であっ
た。
対して、文字部分を抽出するための方法が、例えば、 (A)特開平4−273788号公報 (B)特開平3−108078号公報 に開示されている。
像の濃度帯域を複数に分割し、それぞれに属するピクセ
ルについてラベリング等の処理を行うことで、カラー文
書等を含む種々の画像に対して、文字部分を抽出するよ
うになっている。
は、対象となる画像の特定の濃度レベルに着目して、そ
の濃度レベルおよび近い濃度レベルのピクセルを取り出
してラベリング等の処理を行い、カラー文書等を含む種
々の画像に対して、文字部分を抽出するようになってい
る。
(A)の方法では、画像の濃度帯域の切れ目の両側に属
するピクセルは別の領域に分離されてしまうので、本来
同一の領域に属すべき近い濃度レベルの2つの近接した
ピクセルが別々の領域に分離される虞がある。このた
め、例えば、画像中の濃度がなだらかに変化する領域
が、濃度帯域の切れ目で複数の領域に分割された場合、
濃度レベルの近い近接したピクセルを含む領域、即ち本
来同一の領域に属すべき領域の再統合が必要となり、文
字領域を抽出するための処理が複雑になるという問題が
生じる。
象となる画像の着目する濃度帯域の少なくとも中心濃度
帯域を知る必要がある。このため、例えば、異なる文字
が異なる色で印刷されているような紙面から文字部分を
取り出す場合等、処理が始まる時点で、文字領域の濃度
帯域が判っていない場合には、何度も着目濃度帯域を変
えて処理をやり直し、処理結果を比較、合成する等の複
雑な処理がさらに必要となり、文字領域を抽出するため
の処理が複雑になるという問題が生じる。
であって、その目的は、文字領域の抽出のために複雑な
処理を行うことなく、カラー文書を含む画像等の多様な
入力画像から文字領域を抽出し、画像の文字領域と非文
字領域といった属性に応じた領域を正確に分割し得る画
像領域分割方法、および画像2値化方法を提供すること
にある。
法は、濃淡画像中のピクセルを、互いに近接し、且つそ
の濃度レベルの差が閾値よりも小さいという関係に基づ
いてラベリングし、同一ラベルを有するピクセルからな
る領域に分割し、分割後の各領域の属性を判定すること
を特徴とする画像領域分割方法であって、前記分割され
た各領域の属性を、前記各領域の幾何学的特徴に基づい
て判定することを特徴としている。
構成において、前記分割された各領域の属性の判定に、
前記各領域の濃度分布を用いることを特徴としている。
構成において、前記分割された各領域の属性の判定に、
前記各領域の相互の包含関係を用いることを特徴として
いる。
構成において、前記分割された各領域の属性の判定は、
文字と非文字との属性を判定することを特徴としてい
る。
構成において、前記分割された各領域の属性の判定は、
対象領域の外接長方形の面積と比較して、前記対象領域
を構成するピクセル数が小さい場合には、文字属性を与
えることを特徴とする請求項4に記載の画像領域分割方
法。
構成において、前記分割された各領域の属性の判定は、
対象領域の外接長方形が一定以上の大きさを持つ領域に
は非文字属性を与えることを特徴としている。
構成において、前記分割された各領域の属性の判定は、
文字属性を持った他の領域を内部に持つ、一定以上の大
きさの領域には非文字属性を与えることを特徴としてい
る。
構成において、前記分割された各領域の属性の判定は、
外接長方形の面積が小さな対象領域について、濃度平均
値及び外接長方形の座標のいずれも近い文字領域が存在
する場合には、文字属性を与えることを特徴としてい
る。
ピクセルを、互いに近接し、且つその濃度レベルの差が
閾値よりも小さいという関係に基づいてラベリングし、
同一ラベルを有するピクセルからなる領域に分割し、分
割後の各領域について文字領 域、非文字領域の判定を行
い、その結果に基づいて、前記濃淡画像の2値化を行う
ことを特徴としている。
ル差が閾値以下のピクセルを同一領域として画像領域を
分割し、分割後の各領域に対して、例えば請求項2記載
のように各領域の幾何学的特徴、濃度分布、相互の包含
関係によりその属性(文字、非文字など)を決定してい
るので、画像中に濃度レベルが異なる文字領域がいくつ
あっても、それらと、近接した非文字領域との濃度レベ
ル差が十分であれば、正確に文字領域を構成するピクセ
ルを抽出することが可能である。
たピクセルは、近い濃度レベルを有する」という仮定以
外に、領域の濃度レベルや画像中の濃度分布について何
の仮定も行わずに画像領域を分割することができるの
で、従来のように、画像から文字領域を認識するため
に、「画像中で文字領域が占めるピクセル数は一定範囲
にある。」、「画像中で文字領域を構成する濃度帯域、
非文字領域を構成する濃度帯域はそれぞれ連続してい
る。」といった仮定をする必要がなくなる。
するか否かを判定する際、濃度レベルの小さな差を許容
し、しかもあらかじめ濃度帯域を分割して処理しないの
で、本来同一の領域に属すべき、近い濃度レベルを有す
る2つの近接したピクセルが別の領域に分割されること
がなくなる。
化する領域が、濃度帯域の切れ目で複数の領域に分割さ
れてしまうことがなくなり、濃度レベルの近い近接した
ピクセルを含む領域の再統合が不要となり、文字領域の
抽出処理を簡単に行うことができる。
ベルが異なる文字領域がいくつあっても、それらと、近
接した非文字領域との濃度差が十分であれば、正確に文
字領域を構成するピクセルを抽出することが可能とな
る。
一画像中にある場合など、処理したい領域の濃度レベル
があらあじめ不明でも、問題なく文字領域の抽出処理が
行える。
濃度レベルの異なる領域が複数存在するようなカラー文
書を含む多種多様な入力画像から文字領域を抽出するこ
とができ、この結果、画像を、文字領域と非文字領域等
の属性に応じて正確に分割することができる。
基づいて説明すれば、以下の通りである。尚、本実施例
では、本発明の画像領域分割方法を、光学式文字読取装
置を備えた文字認識システムに適用した場合について説
明する。
に示すように、スキャナ1、画像バッファ2、関係判定
部3、ラベルバッファ4、分割結果出力部5、分割結果
バッファ6、領域属性判定部7、属性判定ルールベース
8、領域属性バッファ9、二値画像生成部10、二値画
像バッファ11、文字切り出し部12、文字座標バッフ
ァ13、文字認識部14、認識結果バッファ15、言語
処理部16、言語辞書17、結果修正部18、ディスプ
レイ19、キーボード20、結果出力部21、プリンタ
22からなっている。
文字領域からなる画像を光学的に読み取るようになって
いる。画像バッファ2は、スキャナ1によって読み取ら
れた画像の画像情報として、例えば各画素(以下、ピク
セルと称する)毎の位置座標および濃度レベルを記憶す
るようになっている。
れた画像情報から、「位置座標が近接しており、濃度レ
ベルが近い」2つのピクセルに共通のラベルを付与する
ラベリング処理を行い、ラベルバッファ4の内容を書き
換えるようになっている。尚、関係判定部3における画
像分割処理、即ちラベルバッファ4の内容の書換えにつ
いては、後で詳細に述べる。
1対1に対応する整数を格納する配列であり、ラベルバ
ッファ要素L
すものとする。尚、上記ラベルバッファ4は、関係判定
部3による書換え前に、全ての要素Lに異なる数値が入
るように初期化される。例えば、L〔i〕=i(i=
0,1,・・・・・)となるように初期化される。
ベルバッファ4との内容を参照し、画像中のピクセル
を、対応するラベルバッファ4の要素の値が共通なもの
ごとに分け、後の処理に必要な情報を取り出して分割結
果バッファ6に格納するようになっている。ここで、対
応するラベルバッファ4の要素の値が共通なピクセル
は、同一の領域に属するものである。
報が格納される。
て、ここまでの処理において得られる上記I〜III まで
の情報以外の他のいかなる情報を格納しても良い。
クセルの水平方向、鉛直方向の最小、最大座標を算出す
ることで得られる。IIは、ラベルバッファ4の要素の値
が共通なピクセルを集めてその濃度平均値を計算するこ
とで得られる。III は、ラベルバッファの要素の値が共
通なピクセルの個数を計算することで得られる。
性を、各領域の幾何学的特徴、濃度分布、相互の包含関
係に基づいて判定するようになっている。即ち、領域属
性判定部7では、分割結果バッファ6の情報および属性
判定ルールベース8の内容を参照して、各領域の属性
(例えば、文字であるか非文字であるか)を判定し、そ
の判定結果を領域属性バッファ9に格納するようになっ
ている。
ルが用いられる。
領域を構成するピクセル数が小さいものには文字属性を
与える。
ものには非文字属性を与える。
つ、一定以上の大きさの領域には非文字属性を与える。
について、濃度平均値及び外接長方形の座標のいずれも
近い文字領域が存在する場合には文字属性を与える。
線から構成されるため、文字を構成するピクセル数は、
外接長方形の面積に比して小さいことを利用したもので
ある。は、大多数の文字のサイズが一定範囲に収まる
ことを利用したものである。は、文字が文字を含むこ
とが通常使用される文字ではあり得ないことを利用した
ものである。は、句読点はサイズが小さく、且つの
ルールの例外となり得るが、その近傍には大抵別の文字
が存在するということを利用したものである。尚、属性
判定ルールベース8では、上記以外の他の公知のルール
を使用しても良い。
ファ2、ラベルバッファ4、分割結果バッファ6および
領域属性バッファ9を参照して、文字に対応するピクセ
ルには1、それ以外のピクセルには0を濃度レベルとし
て与えた画像を作成し、その二値画像を二値画像バッフ
ァ11に格納するようになっている。
出したい場合には、いわゆる二値化処理は全く不要であ
り、画像バッファ2、分割結果バッファ6および領域属
性バッファ9の内容を適宜組み合わせて出力すれば十分
であるが、本実施例では、異なる色で書かれた文字につ
いても、従来の白黒画像に適用された同一の認識方法が
適用できるように、上記したように文字領域と非文字領
域とにそれぞれ別の一定の濃度レベルを与えた2値画像
を作成している。
ファ11の情報を参照して、画像中の文字位置を取り出
し、その文字座標を文字座標バッファ13に格納するよ
うになっている。このとき、二値画像バッファ11の情
報に加えて、分割結果バッファ6と領域属性バッファ9
とに含まれる情報を利用して非文字領域は処理対象から
除外する。
と文字座標バッファ13との情報を参照して文字認識を
行い、その結果を認識結果バッファ15に格納するよう
になっている。尚、認識結果バッファ15には、各文字
の認識結果からなる文字列が格納される。
に格納された文字列から単語を取り出し、言語辞書17
を参照して、文字列に含まれる単語で言語辞書17にな
いものがあれば、その単語の認識結果が疑わしいことを
示すマークを該単語に付与し、再び認識結果バッファ1
5に格納するようになっている。
の内容をディスプレイ19に出力するようになってい
る。このとき、結果修正部18は、言語処理部16によ
って付与された認識が疑わしいマークが付与された単語
を反転表示させ、これによって、使用者に対して誤認識
した単語についての変更を促すようになっており、使用
者がキーボード20を操作することで上記マークの付与
された単語を正しい単語に変更した後、再び認識結果バ
ッファ15に変更前の誤認識の単語を変更後の単語に書
き換えて格納するようになっている。
の内容をプリンタ22に出力するようになっている。
理について、図4ないし図8を参照しながら以下に説明
する。尚、各図中に示したピクセルの位置は、図中、上
から数えて何行目、左から数えて何列目(以下、本実施
例では何行何列目とする)と表現する。
された画像中の任意の2つのピクセルに対して、関係S
を以下の手順で定義しておく。尚、下記で「近接してい
る」とは、いわゆる4連結または8連結の意味で「隣接
している」という条件でもよく、また「互いの距離が小
さい」という条件でも良い。ただし、4連結の意味で隣
接しているとは、着目ピクセルの1つ上、1つ下、1つ
左、1つ右のいずれかに位置することを意味し、8連結
の意味で隣接しているとは、上記のいずれかまたは、1
つ右上、1つ右下、1つ左上、1つ左下のいずれかに位
置することを意味する。ここで、上記4連結および8連
結とは、例えば図8を用いて説明すると、格子状に配置
された9つのピクセルA〜IのうちピクセルEに着目し
た場合に、図中D、B、F、Hの4点をEの隣接点とみ
なしてピクセルの連結関係を考えるのが4連結、また、
図中A、B、C、D、F、G、H、Iを全てピクセルE
の隣接点とみなしてピクセルの連結関係を考えるのが8
連結である。
ついて、「2つのピクセルX0 ,X1 が近接しており、
その濃度レベルの差が濃度差閾値α以下である」とき、
「関係R(X0 ,X1 )が成り立つ」と定義する。但
し、上記αは、画像全体にわたって同じ値を定めておい
てもよいし、2つのピクセルの濃度レベルの関数αを予
め定めておき、その値をとっても良い。また、2つのピ
クセルの座標等を、αを定めるパラメータに入れても良
い。
について、図4を参照しながら以下に説明する。但し、
濃度差閾値αは画像全体に対して2とし、「近接してい
る」とは8連結の意味で隣接していることとする。ま
た、図中の小さな円はピクセルを、円中の数字は濃度レ
ベルを表す。
度レベル3のピクセルに着目し、このピクセルと直線で
結ばれているのが、同ピクセルとの間に関係Rが成り立
つピクセルである。例えば、3行3列目のピクセルをX
0 、3行2列目のピクセルをX1 とすれば、X0 の濃度
レベルは3、X1 の濃度レベルは4であり、濃度レベル
の差が1となる関係、即ち濃度差閾値α≦2の関係とな
る。したがって、3行3列目のピクセルX0 と3行2列
目のピクセルX1 は、関係R(X0 ,X1 )が成り立っ
ていることになる。
「ピクセル列{Xi}(i=0,1,・・,n−1;n
はある正の整数、X0 =a、Xn-1 =b)が存在して、
R(Xi ,Xi+1 )(但し、0≦i≦nー2)が全て成
り立つ」という関係が成立するとき、「関係S(a,
b)が成り立つ」と定める。
は、ピクセルaから出発して、現在いるピクセルとの間
で関係Rが成り立つような近接したピクセル(関係Rの
定義から、関係Rが成り立つような2つのピクセルは必
ず近接している)の1つに移動することを繰り返して、
ピクセルbに到達できることを示している。
いて、図5を参照しながら以下に説明する。但し、濃度
差閾値αは画像全体に対して2とし、「近接している」
とは8連結の意味で隣接していることとする。また、図
中の小さな円はピクセルを、円中の数字は濃度レベルを
表す。
のが、3行3列目のピクセルに着目すると、このピクセ
ルとの間に関係Sが成り立つピクセルである。つまり、
直線で結ばれているピクセルは、互いに関係Rが成り立
つものであり、この関係Rが成り立つピクセル同士をた
どって行くことで、3行3列目のピクセルと関係Sが成
り立つ全てのピクセルに到達できるようになっている。
いて、3行3列目のピクセルと隣接しているが関係Rの
成り立たないピクセル、例えば2行4列目のピクセル
(濃度レベル18)については、このピクセルと隣接し
た他のピクセル、例えば3行4列目のピクセルあるいは
1行4列目のピクセルとの間に関係Rが成立していたと
しても、関係Rを示す直線は省略している。
の2つのピクセル(以下、Xi,Xjとする)からなる
全ての組合せを取り出して、実際に関係S(Xi,X
j)が成り立つか否かを判定し、成り立つ場合には、X
i,Xjに対応するラベルバッファ4の2つの要素L
〔i〕,L〔j〕に同一のラベルの値を与えるラベリン
グ処理を行うことである。
(Xi,Xj)が成り立つか否かを判定するのではな
く、R(Xi,Xj)が成り立つか否かを判定し、成り
立つ場合には、2つの要素L〔i〕,L〔j〕、および
その時点での要素のいずれかと等しい値のラベルバッフ
ァ4に格納された要素全てに対して、共通の値(以下、
V0 とする)を代入するようにしても良い。この場合、
V0 は、その時点でのL〔i〕,L〔j〕のいずれかの
小さい値の方で良い。
た場合と同様の結果が得られるのは、関係Rを介して直
接的に、または他の1個あるいは複数のピクセルを介し
て間接的に繋がっている2つのピクセルに、同一のラベ
ルを与える処理であり、このことから、関係Sが成り立
つ2つのピクセルに同一のラベルを与える処理と同じこ
とになるためである。
度レベルがなだらかに変化する背景部分と、文字部分と
が同時に切り出される場合について、図6を用いて以下
に説明する。尚、画像の各領域の分離には、上記した関
係R、Sが使用され、このとき使用される濃度差閾値α
は画像全体に対して2とし、「近接している」とは8連
結の意味で隣接していることとする。また、図中の小さ
な円はピクセルを、円中の数字は濃度レベルを表す。
には、図6(a)に示すように、ピクセル毎に濃度レベ
ルが付与されており、この画像情報から文字部分に対応
したピクセル群、即ち互いに近接し、且つ濃度差閾値α
が2以下のピクセル群が切り出される。即ち、図6
(a)に示す画像情報が、図6(b)に示す背景部分
と、図6(c)に示す文字部分とが同時に切り出され
る。上記の文字部分は、図6(a)に示す5行9列目の
濃度レベル3のピクセルから関係Sによって1つに繋が
ったものである。
一画像において、ラベルバッファ4の要素L〔i〕,L
〔j〕における文字部分の抽出処理について、図7を参
照しながら以下に説明する。尚、図中、各グリッドがラ
ベルバッファ4の要素を示し、その中の数字がラベルバ
ッファの要素の値を示す。
ルバッファ4の内容が書き換えられる前のグリッドのラ
ベルバッファの数値を示し、図7(b)は、関係判定部
3によってラベルバッファ4の内容が書き換えられた後
のグリッドのラベルバッファの数値を示している。つま
り、図7(b)では、文字領域を構成するピクセルに対
応するラベルバッファの値は22、非文字領域を構成す
るピクセルに対応するラベルバッファの値は0に書き換
えられている。このことから、ラベルバッファの数値に
よって、対応するピクセルがどの領域に属するかを決定
していることが判る。但し、各ピクセルの関係は上記し
た図6に示す関係R、Sと同じとする。
の、ラベルバッファ4の要素内容の書き換えについて、
図2に示すフローチャートを参照しながら以下に説明す
る。
i,Xj(i≠j)を取り出す(S21)。
jが関係R(Xi,Xj)が成り立つか否かを判定する
(S22)。ここで、関係Rが成り立たなければ、S2
4に移行する。
セルXi,Xjに対応するラベルバッファ4の要素L
〔i〕,L〔j〕、およびそのいずれかと値が等しい全
てのラベルバッファ4の要素に共通の値を代入する(S
23)。
jの組合せについて処理を行ったか否かを判定する(S
24)。ここで、全てのピクセルXi,Xjの組合せに
ついて処理を行っていると判定すれば、関係判定部3に
おける処理を終了する。一方、全てのピクセルXi,X
jの組合せについて処理を行っていないと判定すれば、
再びS21に移行して処理を行う。
る画像領域分割方法について、図1に示すフローチャー
トを参照しながら以下に説明する。
ナ1によって光学的に走査し、画像バッファ2に画像情
報を入力する(S1)。このとき、ラベルバッファ4を
全て異なる値が入るように初期化する(S2)。例え
ば、L〔i〕=i(i=0,1,・・・)となるように
初期化する。
に格納された画像情報に基づいて、ラベルバッファ4の
内容を上記した図2に示すフローチャートに示す手順で
書き換えて、画像分割処理を行う(S3)。
ファ2の内容と書き換えられたラベルバッファ4の内容
とを参照して、画像中のピクセルを対応するラベルバッ
ファL〔i〕の要素の値が共通なものごとに分割して分
割結果バッファ6に格納する(S4)。
バッファ6の内容および属性判定ルールベース8を参照
して、各領域の属性(文字あるいは非文字)を判定し、
その属性を領域属性バッファ9に格納する(S5)。
ファ2、ラベルバッファ4、分割結果バッファ6および
領域属性バッファ9の内容を参照して、ピクセルの2値
化を行い、そのデータを二値画像バッファ11に格納す
る(S6)。
像バッファ11の内容を参照して、画像中の文字位置を
取り出し、文字座標バッファ13に可能する(S7)。
ッファ11と文字座標バッファ13の内容を参照して文
字認識を行い、その結果を認識結果バッファ15に格納
する(S8)。
ッファ15に格納された文字列から単語を取り出し、認
識の疑わしい単語には、疑わしいことを示すマークを付
与して、再び認識結果バッファ15に格納する(S
9)。
ファ15の内容をディスプレイ19に出力し、使用者が
誤認識の単語をキーボード20にて修正して、再び認識
結果バッファ15に格納する(S10)。
語を格納した認識結果バッファ15の内容をプリンタ2
2から出力する(S11)。
ば、近接し、且つ濃度レベル差が閾値以下のピクセルを
同一領域として画像領域を分割し、分割後の各領域に対
して、各領域の幾何学的特徴、濃度分布、相互の包含関
係に基づいて、その属性(文字、非文字など)を決定し
ているので、画像中に濃度レベルが異なる文字領域がい
くつあっても、それらと、近接した非文字領域との濃度
レベル差が十分であれば、正確に文字領域を構成するピ
クセルを抽出することが可能である。
たピクセルは、近い濃度レベルを有する」という仮定以
外に、領域の濃度レベルや画像中の濃度分布について何
の仮定も行わずに画像領域を分割することができるの
で、従来のように、画像から文字領域を認識するため
に、「画像中で文字領域が占めるピクセル数は一定範囲
にある。」、「画像中で文字領域を構成する濃度帯域、
非文字領域を構成する濃度帯域はそれぞれ連続してい
る。」といった仮定をする必要がなくなる。
な画像において、従来の2値化法では不可能であった2
値化の自動化を可能とし、正確に文字部分を抽出するこ
とが可能となる。
ピクセルが同一の領域に属するか否かを判定する際、濃
度レベルの小さな差を許容し、しかもあらかじめ濃度帯
域を分割して処理しないので、本来同一の領域に属すべ
き、近い濃度レベルを有する2つの近接したピクセルが
別の領域に分割されることがない。
化する領域が、濃度帯域の切れ目で複数の領域に分割さ
れてしまうことがなくなり、濃度レベルの近い近接した
ピクセルを含む領域の再統合が不要となり、文字領域の
抽出処理を簡単に、しかも正確に行うことができる。
たように、画像中に濃度レベルが異なる文字領域がいく
つあっても、それらと、近接した非文字領域の濃度差が
十分であれば、正確に文字領域を構成するピクセルを抽
出することが可能となる。
一画像中にある場合など、処理したい領域の濃度レベル
があらあじめ不明でも、問題なく処理が行える。
各ピクセル毎に、どの領域に属するかが分かるため、領
域の形状を正確に決定することができる。
がほぼ連結成分レベルで切り出されるため、文字、また
は文字の一部を構成するピクセルを常に塊として、画像
中から取り出し、これらを統合することで文字列抽出ま
たは文字認識を行う方法(本願出願人が先に出願した特
開平5−81474号公報に開示の方法)と組み合わせ
た場合、文字列抽出または文字認識処理の一部を省略す
ることができる。
スキャナ1を使用したが、カメラ等を使用しても良い。
ル差が閾値以下のピクセルを同一領域として画像領域を
分割し、分割後の各領域の文字あるいは非文字等の属性
を、請求項2記載のように各領域の幾何学的特徴、濃度
分布、相互の包含関係に基づいて決定しているので、画
像中に濃度レベルが異なる文字領域がいくつあっても、
それらと、近接した非文字領域の濃度レベル差が十分で
あれば、正確に文字領域を構成するピクセルを抽出する
ことが可能である。
濃度レベルの異なる領域が複数存在するようなカラー文
書を含む多種多様な入力画像から文字領域を抽出するこ
とができ、この結果、画像を、文字領域と非文字領域等
の属性に応じて正確に分割することができるという効果
を奏する。
すフローチャートである。
の一例を示すフローチャートである。
認識システムの概要を示すブロック図である。
における各ピクセルの関係を示す説明図である。
における各ピクセルの関係を示す説明図である。
割処理の説明図である。
割処理の他の説明図である。
る。
Claims (9)
- 【請求項1】濃淡画像中のピクセルを、互いに近接し、
且つその濃度レベルの差が閾値よりも小さいという関係
に基づいてラベリングし、同一ラベルを有するピクセル
からなる領域に分割し、分割後の各領域の属性を判定す
ることを特徴とする画像領域分割方法であって、 前記分割された各領域の属性を、前記各領域の幾何学的
特徴に基づいて判定することを特徴とする画像領域分割
方法 。 - 【請求項2】前記分割された各領域の属性の判定に、前
記各領域の濃度分布を用いることを特徴とする請求項1
に記載の画像領域分割方法。 - 【請求項3】前記分割された各領域の属性の判定に、前
記各領域の相互の包含関係を用いることを特徴とする請
求項1または2に記載の画像領域分割方法。 - 【請求項4】前記分割された各領域の属性の判定は、文
字と非文字との属性を判定することを特徴とする請求項
1乃至3のいずれか1項に記載の画像領域分割方法。 - 【請求項5】前記分割された各領域の属性の判定は、対
象領域の外接長方形の面積と比較して、前記対象領域を
構成するピクセル数が小さい場合には、文字属性を与え
ることを特徴とする請求項4に記載の画像領域分割方
法。 - 【請求項6】前記分割された各領域の属性の判定は、対
象領域の外接長方形が一定以上の大きさを持つ領域には
非文字属性を与えることを特徴とする請求項4に記載の
画像領域分割方法。 - 【請求項7】前記分割された各領域の属性の判定は、文
字属性を持った他の領域を内部に持 つ、一定以上の大き
さの領域には非文字属性を与えることを特徴とする請求
項4に記載の画像領域分割方法。 - 【請求項8】前記分割された各領域の属性の判定は、外
接長方形の面積が小さな対象領域について、濃度平均値
及び外接長方形の座標のいずれも近い文字領域が存在す
る場合には、文字属性を与えることを特徴とする請求項
4に記載の画像領域分割方法。 - 【請求項9】濃淡画像中のピクセルを、互いに近接し、
且つその濃度レベルの差が閾値よりも小さいという関係
に基づいてラベリングし、同一ラベルを有するピクセル
からなる領域に分割し、 分割後の各領域について文字領域、非文字領域の判定を
行い、その結果に基づいて、前記濃淡画像の2値化を行
うことを特徴とした、画像2値化方法 。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP15954195A JP3476595B2 (ja) | 1995-06-26 | 1995-06-26 | 画像領域分割方法、および画像2値化方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP15954195A JP3476595B2 (ja) | 1995-06-26 | 1995-06-26 | 画像領域分割方法、および画像2値化方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0916713A JPH0916713A (ja) | 1997-01-17 |
| JP3476595B2 true JP3476595B2 (ja) | 2003-12-10 |
Family
ID=15696018
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP15954195A Expired - Lifetime JP3476595B2 (ja) | 1995-06-26 | 1995-06-26 | 画像領域分割方法、および画像2値化方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3476595B2 (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000163044A (ja) | 1998-11-30 | 2000-06-16 | Sharp Corp | 画像表示装置 |
| WO2000062243A1 (en) * | 1999-04-14 | 2000-10-19 | Fujitsu Limited | Character string extracting device and method based on basic component in document image |
| JP2008146314A (ja) * | 2006-12-08 | 2008-06-26 | Hitachi Software Eng Co Ltd | 濃淡画像のラベリング方法、及びそれを実行するためのプログラム |
| CN102855478B (zh) * | 2011-06-30 | 2015-11-25 | 富士通株式会社 | 图像中文本区域定位方法和装置 |
| CN111191527B (zh) * | 2019-12-16 | 2024-03-12 | 北京迈格威科技有限公司 | 属性识别方法、装置、电子设备及可读存储介质 |
-
1995
- 1995-06-26 JP JP15954195A patent/JP3476595B2/ja not_active Expired - Lifetime
Non-Patent Citations (1)
| Title |
|---|
| 美濃導彦,岡崎洋,坂井利之,対象物の属性特徴による画像検索法,情報処理学会論文誌,日本,社団法人情報処理学会,1991年 4月15日,第32巻、第4号,513〜522 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0916713A (ja) | 1997-01-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| USRE47889E1 (en) | System and method for segmenting text lines in documents | |
| JP4323328B2 (ja) | 取り込み画像データから文字列を識別して抜出するシステムおよび方法 | |
| US8059868B2 (en) | License plate recognition apparatus, license plate recognition method, and computer-readable storage medium | |
| US6009196A (en) | Method for classifying non-running text in an image | |
| US8442319B2 (en) | System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking | |
| JP3748172B2 (ja) | 画像処理装置 | |
| JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
| JP5492205B2 (ja) | 印刷媒体ページの記事へのセグメント化 | |
| JP4443576B2 (ja) | パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法 | |
| CN113971792A (zh) | 交通标志牌的字符识别方法、装置、设备和存储介质 | |
| CN111126266A (zh) | 文本处理方法、文本处理系统、设备及介质 | |
| CN112241730A (zh) | 一种基于机器学习的表格提取方法和系统 | |
| JP2000285190A (ja) | 帳票識別方法および帳票識別装置および記憶媒体 | |
| CN115311666A (zh) | 图文识别方法、装置、计算机设备及存储介质 | |
| Ghai et al. | A comprehensive review on performance-based comparative analysis, categorization, classification and mapping of text extraction system techniques for images | |
| US7130085B2 (en) | Half-tone dot elimination method and system thereof | |
| JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
| JP7591915B2 (ja) | 書式定義装置、書式定義方法、及びプログラム | |
| JP3268552B2 (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
| CN102682308B (zh) | 图像处理方法和图像处理设备 | |
| JP2004094427A (ja) | 帳票画像処理装置及び該装置を実現するためのプログラム | |
| JPH02116987A (ja) | 文字認識装置 | |
| JP2917427B2 (ja) | 図面読取装置 | |
| JP3100825B2 (ja) | 線認識方法 | |
| JP7370574B2 (ja) | コマ抽出方法及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080926 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080926 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090926 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090926 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100926 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120926 Year of fee payment: 9 |