JPH0981743A

JPH0981743A - 文字・図形処理装置及び文字・図形処理方法

Info

Publication number: JPH0981743A
Application number: JP7237447A
Authority: JP
Inventors: Yoshiaki Kurosawa; 由明黒沢
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1995-09-14
Filing date: 1995-09-14
Publication date: 1997-03-28

Abstract

(57)【要約】【課題】低品質な入力画像に対しても安定した２値化、
文字・図形分離、色分離の処理を短時間に実行すること
を可能にする。【解決手段】入力画像としての濃淡画像またはカラー画
像から複数の小領域を抽出する小領域抽出部１２と、小
領域抽出部１によって抽出された各小領域について、周
囲に存在する小領域における濃度情報、色情報、幾何学
的な接続状態に関する情報、あらかじめ得られている図
形の形状や色に関する情報のうち少なくとも１つの情報
をもとに、他の小領域と統合してグループ化する小領域
統合部１４と、小領域統合部１４によってグループ化さ
れた統合結果に基づき、入力画像の２値化、文字・図形
分離、色分離のうち少なくとも１つを実行する分離部１
７とを具備する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文字認識装置、図
形認識装置、画像処理装置に好適な文字・図形処理装置
及び文字・図形処理方法に関する。

【０００２】

【従来の技術】一般に、ファクシミリ装置、光学的文字
読取装置（ＯＣＲ）、イメージスキャナなど、文字認識
装置、図形認識装置、画像処理装置等においては、濃淡
画像を２値画像に変換する２値化処理を行なっている。
従来、これら装置における２値化処理は、濃淡画像の各
画素の値と予め設定された閾値とを比較して各画素の値
（１または０）を生成する単純な閾値処理や、大域的な
濃度の分布を分析することにより各画素の値を生成する
処理がある。２値化処理では、元の濃淡画像に対して良
好な２値画像を生成するためには閾値の設定が重要であ
り、その一つの方法として局所的な濃度の変動を検知し
て閾値を変動させる方法もある。

【０００３】また、２値化処理は、カラー画像に対し
て、画像中の色分離を行なう場合や、画像中に濃度や色
の異なる文字や図形が重なって存在し、それぞれを分離
する場合にも適用することができる。

【０００４】こうした２値化処理によって、入力画像
（濃淡画像、カラー画像）に含まれる文字、あるいは図
形等のパターンが生成される。このパターンは、文字認
識処理、あるいは図形認識処理等に供される。

【０００５】従来の２値化処理では、入力画像が低品質
の場合には、安定した２値化や色分離、文字・図形分離
することができない。すなわち、大域的な方法では局所
変動に対応できないために精度の高い処理ができず、逆
に局所的な方法では精度の高い処理が可能ではあるもの
の画像中にノイズ等が存在する場合に、このノイズに敏
感に反応してしまい本来期待している結果が得られな
い。

【０００６】ところで、本出願人は、先に特願平５−７
４２５０号において、次のような技術を提案している。
まず、原画像を２値化し、得られた２値化画像の連結領
域を組み合わせることにより直線性などの図形としての
存在可能性を調べ、もし可能であれば欠落部分を補った
り、必要があれば補う部分の濃度を調べることにより、
もとの図形を復元するものである。

【０００７】この処理では、２値画像に欠落部分があっ
たとしても元の図形を復元することができるものの、処
理が複雑となり処理プログラムの複雑化や処理時間の増
大を招いてしまう。また、処理が複雑になってしまう
と、汎用性のある処理プログラムを作成することが困難
となってしまう。

【０００８】また、色分離を行なう方法として、原画像
中のある任意の画素から始めて徐々に同一と見なせる周
囲の画素をマージし、領域を拡大して行き、各領域の色
を決定することにより色分離を行なう方法もある。

【０００９】この方法であれば精度の高い分離が可能と
なるが、画素単位で処理を行なうために、前述と同様に
ノイズ等の影響を受けやすく、また多くの処理時間を必
要とする。

【００１０】

【発明が解決しようとする課題】このように従来の技術
では、ノイズを含むような低品質の入力画像に対して、
安定して２値化、文字・図形分離、色分離の処理を行な
うことが困難であり、また処理に多くの時間を要してい
た。このため、文字認識や図形認識を行なう場合には、
短時間に高精度な認識結果を得ることが困難となってい
た。

【００１１】本発明は前記のような事情を考慮してなさ
れたもので、低品質な入力画像に対しても安定した２値
化、文字・図形分離、色分離の処理を短時間に実行する
ことが可能な文字・図形処理装置及び文字・図形処理方
法を提供することを目的とする。

【００１２】

【課題を解決するための手段】本発明は、入力画像とし
ての濃淡画像またはカラー画像から複数の小領域を抽出
する小領域抽出手段と、前記小領域抽出手段によって抽
出された各小領域について、周囲に存在する小領域にお
ける濃度情報、色情報、幾何学的な接続状態に関する情
報、あらかじめ得られている図形の形状や色に関する情
報のうち少なくとも１つの情報をもとに、他の小領域と
統合してグループ化する小領域統合手段と、前記小領域
統合手段によってグループ化された統合結果に基づき、
入力画像の２値化、文字・図形分離、色分離のうち少な
くとも１つを実行する分離手段とを具備したことを特徴
とする。

【００１３】また本発明は、画像を入力する画像入力手
段と、前記画像入力手段によって入力された画像に対す
る、水平（垂直）方向の１スキャンまたは複数スキャン
についてその各スキャンまたは各複数スキャンを分割し
て小領域を生成するか、または生成した該小領域をさら
に垂直（水平）に統合することにより拡大された小領域
を抽出する小領域抽出手段とを具備し、前記小領域抽出
手段によって抽出された小領域をもとに文字・図形の処
理を行なうことを特徴とする。

【００１４】また本発明は、文字または図形のパターン
を含む入力画像から複数の小領域を抽出し、この抽出さ
れた小領域を、文字または図形のパターンを構成するス
トロークらしさに基づいて周囲の小領域と統合し、この
統合された小領域をもとに前記入力画像に含まれる本来
の文字または図形のパターンを分離することを特徴とす
る。

【００１５】このように、入力画像の画像データから濃
度や色情報が一定または一様と見なせる小領域を複数抽
出し、各小領域についてその小領域とその周囲に存在す
る小領域における濃度や色情報と幾何学的な接続状態や
画像内に存在しうる図形の形状や色の情報を調べること
により、該小領域を統合して複数の、より大きなエリア
にまとめ、各エリアを分類することにより２値化、文字
・図形分離、色分離が行なわれる。

【００１６】小領域については、入力画像から水平（垂
直）方向の１スキャンまたは複数スキャンについてその
各スキャンまたは各複数スキャンを分割して小領域を生
成するか、または該小領域を垂直（水平）に統合するこ
とにより拡大された小領域を抽出して小領域抽出が行な
われる。

【００１７】それぞれの小領域単位ではそれが何である
のかが分からないが、周囲の小領域との関係を調べなが
ら統合していくことによって、その小領域が表している
文字・図形の種類や色を確定していく。

【００１８】

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。図１は本実施形態に係わる
文字・図形処理装置の構成を示すブロック図である。図
１に示すように文字・図形処理装置は、画像入力部１
１、小領域抽出部１２、小領域統合部１４、統合情報記
憶部１５、分離部１７、及び認識処理部１８によって構
成されている。

【００１９】画像入力部１１は、入力画像（濃淡画像ま
たはカラー画像）の画像データを入力する。濃淡画像ま
たはカラー画像には、文字あるいは図形のパターンが含
まれているものとする。

【００２０】小領域抽出部１２は、画像入力部１１によ
って入力された画像データから、後段における処理単位
となる複数の小領域を抽出する。小領域抽出部１２は、
入力画像に対する水平（垂直）方向の１スキャンまたは
複数スキャンについて、その各スキャンまたは複数スキ
ャン毎に分割して小領域を生成するか、または、この小
領域を垂直（水平）方向に統合することにより拡大して
小領域とする。１スキャンの各スキャンを小領域とする
場合、その小領域はランとなる。

【００２１】小領域統合部１４は、小領域抽出部１２に
よって抽出された小領域を、統合情報記憶部１５に記憶
された情報に基づいて統合しグループ化するものであ
る。グループ化された小領域は、図形、あるいは文字の
ストロークの一部を構成するものである。

【００２２】統合情報記憶部１５は、小領域統合部１４
によって小領域を統合する際に参照される情報であり、
例えば小領域における濃度情報、色情報、幾何学的な接
続状態に関する情報（詳細については後述する）、あら
かじめ得られている図形の形状や色に関する情報等が含
まれる。これらの情報のうち少なくとも１つの情報が小
領域の統合を行なう際に、小領域統合部１４によって参
照される。

【００２３】分離部１７は、統合情報記憶部１５による
統合結果に基づいて、必要な分離処理、すなわち２値
化、文字・図形分離、色分離等の処理うち、少なくとも
何れか１つを実行する。

【００２４】認識処理部１８は、分離部１７における分
離処理によって得られた情報について、図形認識あるい
は文字認識を実行する。次に、本発明の第１実施形態の
動作について説明する。

【００２５】ここでは、説明を簡単にするために、入力
画像中に、図２に示すような本来の文字パターン（数字
の４の文字）が含まれており、この文字を認識する処理
を例にして説明する。

【００２６】まず画像入力部１１は、処理対象とする画
像を入力する。画像入力部１１が入力した入力画像は、
低品質であったために画像中の文字パターンが図３に示
すようになっているものとする。すなわち、文字パター
ンは、パターンの本体部分３１の他に、かすれた部分３
２、ノイズが乗った部分３３，３４が含まれている。ノ
イズが乗った部分３３は本体部分３１と重なった部分で
あり、ノイズがのった部分３４は本体部分３１と重なっ
ていない部分である。かすれた部分３２の濃度は、本体
部分３１の濃度より薄く、ノイズが乗った部分３３は本
体部分３１より濃い。また、ノイズが乗った部分３４
は、かすれた部分３２より濃いものとする。

【００２７】図３に示すようなかすれた部分３２、ノイ
ズが乗った部分３３，３４を含む文字パターンについて
閾値処理を実行すると、すなわち固定の閾値で２値化す
ると、図４に示すように、ノイズが乗った部分３４、か
すれた部分３２の影響を受けた２値化パターンが得られ
てしまう。本実施形態では、図３に示す文字パターン
を、図２に示す本来の文字パターンにして分離するため
の２値化方法を実行する。

【００２８】なお、以下の説明では画像中の黒い部分を
濃度が濃い、白い部分を濃度が薄いとして説明する。小
領域抽出部１２は、図３に示す文字パターン（画像デー
タ）から小領域を抽出する。ここでは、入力画像に対す
る水平方向の１スキャンで、１つの小領域（ラン）が抽
出されるものとする。すなわち、横方向のスキャンとし
て得られるエッジ（濃度変化の急なところ）に関して、
左側に上りエッジ（濃度が濃い方に変化する）があり、
右側に下りエッジ（濃度が薄い方に変化する）がある横
方向に隣あうエッジのペアの間のランを小領域として取
り出す。本発明では処理単位を画素ではなく、小領域抽
出部１２によって抽出される小領域とするため、画素単
位での処理と比較すると処理時間を短縮することができ
る。

【００２９】図５は、図３に示す文字パターンからエッ
ジを抽出したものである。図５の丸印が当該文字パター
ンを横方向でスキャンして得られるエッジである。な
お、図５は説明を簡単にするためにスキャンの間隔を大
きくとっているが、小領域抽出部１２は、どのような間
隔でスキャンしても良い。

【００３０】図６は、小領域抽出部１２によって抽出さ
れた小領域を示している。ここでは、小領域を黒Ｇラン
と呼び、図６中では実線で示している。一方、小領域抽
出部１２は、上りと上り、または下りと下りのエッジが
隣り合うエッジのペアの間のランを別に取り出す。これ
を中間Ｇランと呼び、図６中では破線で示している。な
お、図示していないが、左側が下りエッジで右側が上り
エッジのペアの間のランを背景Ｇランと呼ぶ。背景Ｇラ
ンでも濃度の濃いものは中間Ｇランと見なしても良い。

【００３１】次に、小領域統合部１４は、小領域抽出部
１２によって抽出された小領域を統合しグループ化す
る。すなわち、小領域統合部１４は、縦方向で隣あう複
数の黒Ｇランを比較して、文字パターンの線分の一部を
構成していると見なされるものをグルーピングする。

【００３２】具体的には、黒Ｇランの長さがほぼ同じ
で、隣あう黒Ｇランのずれの量が一定であるか、または
ずれの量が少ないことを検査し、この検査結果に応じて
該当する複数の黒Ｇランのグループを抽出する。なお、
検査の条件は、統合情報記憶部１５に幾何学的な接続状
態に関する情報として記憶されており、選択的に小領域
統合部１４によって参照される。幾何学的な接続状態に
関する情報には、例えば文字パターンの分離に係わる情
報であれば、文字ストロークらしさ、すなわち文字パタ
ーンを構成する文字ストロークとして見做した際に正当
であるか否かを判別することができる情報が含まれる。
図形等の他のパターンに係わる情報も同様に記憶され
る。

【００３３】図７に小領域統合部１４によって抽出され
た黒Ｇランのグループを示す。図７中では、実線で囲ま
れた複数の黒Ｇランが１グループである。ここで、黒Ｇ
ランを縦方向で接続してグルーピングしたものをＶラン
と呼ぶ。図７においては、複数のＶラン７１〜７６が抽
出されたことを示している。なお、図７において、破線
で囲まれた黒Ｇラン及び中間Ｇランは、小領域統合部１
４によるグルーピングで抽出されなかったＧラン群７
７，７８を示している。

【００３４】次に、小領域統合部１４は、Ｖランに隣接
する中間Ｇランを調べて、現在のＶランにさらに統合可
能な黒Ｇランまたは中間Ｇランを抽出する。すなわち、
小領域統合部１４は、中間Ｇランそのもの、または中間
Ｇランと他の黒Ｇランとを合成して得られる合成Ｇラン
が、Ｖランに接続できると見なせる時は、この合成Ｇラ
ンをＶランに組み入れる。なお、接続できると見なせる
時の条件は、統合情報記憶部１５に記憶されているもの
とする。

【００３５】図７に示す例では、Ｖラン７１に隣接する
中間ＧランＲ１と黒ＧランＲ２について調べられる。例
えば、２つのＧランＲ１，Ｒ２を合成して新しいＧラン
を作成し、この合成ＧランとＶラン７１とを比較する
と、Ｖラン７１中の一番下の（合成Ｇランと最も近い）
黒Ｇランとのずれが少なく、Ｖラン７１中の黒Ｇランの
平均の長さとほぼ一致していると判別される。小領域統
合部１４は、この判別結果から、２つのＧランＲ１，Ｒ
２から合成される合成ランをＶラン７１組み入れる。

【００３６】小領域統合部１４によってこの処理を繰り
返すことにより、Ｇラン群７７に含まれる全てのＧラン
がＶラン７１に組み入れられて、新たな統合されたＶラ
ンが生成される。

【００３７】また、小領域統合部１４は、Ｖラン７３に
ついてＧラン群７８を対象として同様の処理を行なう。
この場合、Ｇラン群７８では、まずＶラン７３に隣接す
る３つのラン、すなわち中間ＧランＲ３，Ｒ５、黒Ｇラ
ンＲ４が対象として調べられる。この場合、例えば中間
ＧランＲ３と黒ＧランＲ４とを合成して得られる合成Ｇ
ランが、前述のような処理によってＶラン７３と接続で
きると見なされる。従って、中間ＧランＲ３と黒Ｇラン
Ｒ４のみがＶラン７３に組み込まれ、中間ＧランＲ５が
残される。

【００３８】小領域統合部１４によってＧラン群７８に
対してこの処理を繰り返すことにより、Ｇラン群７８に
含まれる左側２／３のＧランがＶラン７３に組み入れら
れて、新たな統合されたＶランが生成される。

【００３９】以上の処理の結果、図７中に示すＶラン７
１，７３は、第５図の実線で囲まれた新たな統合された
Ｖラン８１，８２に変更される。次に、分離部１７は、
小領域統合部１４によって得られた図８に示す小領域統
合結果をもとに２値化処理を行なう。すなわち、図８に
示すＶランから、そのＶランに含まれるＧランの両端の
エッジ位置に基づいて、図２に示すような本来の正しい
文字パターンを表わす２値画像を作成する。

【００４０】次に、認識処理部１８は、分離部１７によ
って作成された文字パターンについて文字認識処理を実
行する。分離部１７によって作成された文字パターン
は、前述したように、図３中のかすれた部分３２、ノイ
ズが乗った部分３３，３４の影響が除去された高品質の
ものである。従って、文字認識処理では精度の高い文字
認識結果が得られる。

【００４１】なお、前述した小領域統合部１４における
処理の説明では、図７中に示すＶラン７１，７３に隣接
する合成Ｇランを、それぞれＶラン７１，７３に組み込
んで、図８に示すような小領域統合結果を生成するもの
と説明しているが、さらに図８に示す縦に隣接するＶラ
ン同士を接続して新しい合成Ｖランを作成するようにし
ても良い。

【００４２】図９はＶラン同士を接続して新しい合成Ｖ
ランを作成する処理を説明するための図である。図９
は、２つのＶラン９０，９１があり、その間に黒Ｇラン
９２が挟まれている状態を示す図である。このような場
合、小領域統合部１４は、上下のＶラン９０，９１がパ
ターンの線分を構成することができ、かつ黒Ｇラン９２
が、Ｖラン９０，９１一部分をなすことが確認されれ
ば、これらを全て統合して新しい合成Ｖランを作成す
る。

【００４３】こうしてＶラン同士を合成することで、よ
り本来の正しい文字パターンを表わす２値画像が作成さ
れるので、さらに効果的である。図１０は、３つのＶラ
ン１０１，１０２，１０３があり、Ｖラン１０１とＶラ
ン１０２，１０３との間に黒Ｇラン１０４が挟まれてい
る状態を示す図である。このような場合、小領域統合部
１４は、Ｖラン１０１とＶラン１０２，１０３がパター
ン分岐した線分の一部と見なされる場合、間にある黒Ｇ
ラン１９４をＶラン１０１に統合しても良い。

【００４４】なお、小領域統合部１４におけるＶランや
Ｇランの合成では、前述した方法の他、ＧランやＶラン
の濃度（Ｇランの場合にはペアのエッジ間の各画素の平
均濃度、Ｖランの場合はそのＶランに含まれるＧランの
濃度の平均）やエッジの強さ（濃度勾配）や位置、背景
の代表的な濃度値、黒部分の代表的な濃度値などを使用
して合成可能かどうかを調べる。

【００４５】具体的には、濃度値が同じ程度かどうか、
エッジの強度が同じ程度であるかどうか、エッジの位置
のずれの量が少ないかどうか、エッジの位置を縦方向に
見た時にスムースに並んでいるかどうかなどをチェック
する。

【００４６】次に、図３に示す形態とは異なる別の入力
画像についての処理の一例について説明する。図１１は
画像入力部１１によって入力された入力画像に含まれる
文字パターンの一例を示している。図１１に示す文字パ
ターンは、文字部分１１１と罫線部分１１２が交わって
いるものである。また図１１中、両者の重なった部分を
１１３とする。ここで、重なった部分１１３は、文字部
分１１１や罫線部分１１２よりも濃度が濃いものとす
る。しかしながら、文字部分１１１、罫線部分１１２、
重なった部分１１３の濃度は不定であり、単純な閾値処
理では罫線と文字の分離が不可能であるとする。ここで
は、一部が重なりあった文字部分１１１と罫線部分１１
２とを分離抽出する。

【００４７】図１２は、図１１に示すパターンから、小
領域抽出部１２によって黒Ｇランを抽出した様子を示し
ている。これらのＧランは、小領域統合部１４によって
縦方向でＶランに統合される。この結果、図１３に示す
ように、複数のＶラン１３０〜１３７によってパターン
が表現されている。

【００４８】ここで、事前の処理で罫線位置に関する情
報が得られているとすれば（統合情報記憶部１５に記憶
されている）、小領域統合部１４は、その情報を使うこ
ともできる。すなわち、小領域統合部１４は、罫線が存
在するとされているエリアを示す情報を用いて、そのエ
リア１３８に含まれているＶラン１３０，１３１を取り
除くことにより、文字パターンを形成するＶラン１３２
〜１３７を抽出するする。そして、小領域統合部１４
は、抽出したＶラン１３２〜１３７に基づいて文字パタ
ーンを再構成する。この様に、あらかじめ得られてい
る、文字あるいは図形の形状や色に関する情報を利用し
て、ＧランやＶランの統合を図ることによって、文字パ
ターンを表わす小領域の統合だけでなく、不要な部分の
削除等が可能となる。

【００４９】なお、前述した説明では、小領域抽出部１
２によって１ラインを分割することによって小領域とし
ての黒Ｇランを得ていたが、これを複数ラインに渡って
黒Ｇランを作成するようにしても良い。すなわち、水平
な複数ライン上において水平方向のある位置からある位
置までを１つのＧランとするものである。

【００５０】また、Ｖランや黒Ｇランの統合化の処理過
程の中で、黒ＧランやＶランを分割したり統合したりし
て新しい黒ＧランやＶランを生成することも有効であ
る。また、前述した例では、水平方向に黒Ｇランを抽出
し、垂直方向にＶランを抽出したが、垂直方向に黒Ｇラ
ンを抽出し、水平方向にＶランを抽出する様に構成して
も良い。

【００５１】また、Ｖランや黒Ｇランには、位置や長
さ、大きさの情報の他、濃度情報、そのランが有効であ
るかどうかの情報、エッジ強度、隣接する他のランへの
ポインタなどの属性が付与されていても良い。

【００５２】また、前述した処理方法において、Ｖラン
や黒Ｇランにラベルを付与し、このラベルを逐次更新し
て、最終ラベルの内容によって２値化、文字・図形分
離、色分離を行なっても良い。ラベルは、文字部か背景
部かの区別や図形の種類の区別、色の区別をするための
数値記号データからなるものであり、最終ラベルの内容
が同一のＶランまたは黒Ｇランを抽出することにより、
２値化、文字・図形分離、色分離を行なう。

【００５３】また、ラベル付きランに対してリラキゼー
ション法を用いても良い。各ランには複数または１個の
ラベルが付属し各ラベルに対してそのラベルが意味する
ものに、そのランが属する確からしさを数値化して表
し、その数値も対応するラベルと共に各ランに付属させ
る。この数値を各種情報に基づいて逐次更新して最終的
な各ラベルが持つ確からしさを求める。この確からしさ
に基づいて各ランを分類して２値化、文字・図形分離、
色分離を行なう。リラキゼーションは、パターン認識の
分野で良く知られた方式であるが、以下に説明する第２
実施形態において具体例を示す。

【００５４】次に、第２実施形態について説明する。な
お、第２実施形態における文字・図形処理装置は、基本
的には図１に示す第１実施形態と同様の構成を持つので
説明を省略する。ただし、主に小領域抽出部１２、小領
域統合部１４における処理内容が第１実施形態とは異な
っている。以下、第２実施形態の動作について説明す
る。

【００５５】ここでは、入力画像中に図１４に示すよう
な文字パターンが含まれているものとする。すなわち、
図１４の文字パターンは、漢字の「百」と数字の「９」
の文字が重なったものである。それぞれの文字の濃度は
異なっているものとする。

【００５６】小領域抽出部１２は、入力画像中の文字パ
ターンについて、濃度が一定であると見なせる局所小領
域を複数個抽出する。図１４に示す例では、入力画像を
縦横それぞれ一定のピッチで分割して小領域を抽出して
いる。以下、小領域抽出部１２によって抽出された小領
域を、図１５に示すように、便宜上１７個のエリアに分
けて説明する。

【００５７】ここで、エリア２０１，２０４，２０６，
２０８，２１５，２１７の小領域の濃度はＡ、エリア２
０２，２０５，２０７，２１０，２１２，２１４，２１
６の小領域の濃度はＢ、エリア２０３，２０９，２１
１，２１３の小領域の濃度はＣであるとする。すなわち
濃度Ａは、漢字「百」の文字パターンの濃度であり、濃
度Ｂは数字「９」の文字パターンの濃度であり、濃度Ｃ
は両者が重なりあった部分の濃度である。ただし、画像
の変動（ノイズ等）により、エリア２１６，２１７の小
領域では濃度のＡとＢが逆転しているものとする。

【００５８】第２実施形態において小領域統合部１４
は、ラベル（小領域）の変換、すなわち小領域の統合を
リラキゼーションの手法で行なう。小領域統合部１４
は、図１６に示すフローチャートに従って動作する。

【００５９】まず、小領域統合部１４は、小領域抽出部
１２によって抽出された小領域にラベルをつける（ステ
ップＳ１）。ここで、ラベルは、本来、漢字「百」の文
字パターンの部分に該当するラベルＸ（濃度Ａ）と、数
字「９」の文字パターンの部分に該当するラベルＹ（濃
度Ｂ）の２種類である。また、小領域統合部１４は、こ
のラベルＸ，Ｙについて，それぞれ確からしさの初期値
を設定する（ステップＳ２）。

【００６０】処理の最初の段階では、濃度Ａのエリアで
は、例えば確からしさをＸ＝０．７、Ｙ＝０．３と設定
し、濃度ＢのエリアではＸ＝０．３、Ｙ＝０．７、濃度
ＣのエリアではＸ＝０．５、Ｙ＝０．５と設定する。た
だし、確からしさを示す値は、０．０〜１．０の範囲の
値をとり、値が大きいほど確かであることを示す。

【００６１】小領域統合部１４は、ラベルＸ，Ｙを次に
述べる変換方式で変換を行ない（ステップＳ３）、ラベ
ル変換しても状態の変化が少なくなるまで繰り返して行
なう（ステップＳ４）。

【００６２】小領域統合部１４は、ある小領域を対象と
した時、その周囲の小領域の多くがラベルＹである確か
らしさが高ければ、この小領域のラベルＹの確からしさ
を上昇させる。この時、特にラベルＸである確からしさ
が少なければラベルＸの確からしさを減少させる。

【００６３】もし、周囲の小領域の多くがラベルＸであ
る確からしさが高ければ、この小領域のラベルＸの確か
らしさを上昇させる。この時、特にラベルＹである確か
らしさが少なければラベルＹの確からしさを減少させ
る。

【００６４】例えば、図１５中のエリア２０３は濃度Ｃ
タイプであるが、濃度Ａタイプのエリア２０４，２０６
と濃度Ｂタイプのエリア２０２，２０７に囲まれてお
り、前述したルールを繰り返し適用して行くことによ
り、徐々にエリア２０３が濃度Ｃタイプから濃度Ａ＆Ｂ
タイプ、すなわち、Ｘ＝１．０、Ｙ＝１．０の値の方向
に順次変換されていく。同様にエリア２０９，２１１，
２１３についても、同様に濃度Ａ＆Ｂタイプに転換され
ていく。

【００６５】一方、その他のエリアでは、各エリアの中
央付近ではラベルＸまたはＹの確からしさが上昇してい
く。しかしながら、周辺部では中央付近とは違った状況
が起こる。例えば、エリア２０８の周辺で、エリア２１
６と接していない周辺部分に存在する小領域について
は、その周囲が濃度ＡタイプのものはラベルＸの確から
しさが高くなり、濃度ＣタイプのものはラベルＸ，Ｙの
確からしさが高くなり濃度Ａ＆Ｂのエリアに転換されて
行く。その結果、エリア２０８の周辺部の中でエリア２
１６と接していない部分ではラベルＸの確からしさがよ
り優勢で支配的となるため、エリア２０８の周辺部分で
はラベルＸの確からしさが上昇する。この結果、エリア
２０８では全域的にラベルＸの確からしさが上昇する。

【００６６】他方、エリア２１６では周辺部はエリア２
０８と接しているため、最初の段階では、その付近にあ
る小領域の周囲の小領域のラベルＸの確からしさも、ラ
ベルＹの確からしさも中程度であるために変化が起きな
い。しかし、処理が進むにつれて、エリア２０８のラベ
ルＸの確からしさが優勢になるので、エリア２１６のラ
ベルＸの確からしさが周辺部で上昇して行くことにな
る。この傾向はラベル２１６の中心部にも拡大して行
き、結果的にエリア２１６はラベルＸの確からしさが上
昇し、全域的に濃度Ｂタイプから濃度Ａタイプに転換さ
れていく。

【００６７】同様に、エリア２１４のラベルＹの確から
しさが上昇するに従って、エリア２１７は濃度Ａタイプ
から濃度Ｂタイプに転換される。このようなラベル変換
の処理を繰り返し行なうことにより、結果的に各小領域
のラベルの確からしさ（濃度タイプ）が、図１７に示す
ように変更される。小領域統合部１４は、ラベルの確か
らしさの値に基づいて小領域を分類する（ステップＳ
５）。

【００６８】図１８は、ラベル変換後の小領域の中から
濃度タイプＡのものとＡ＆Ｂの（ラベルＸの確からしさ
の値が大きい）ラベルを抽出して得られる文字パター
ン、すなわち数字「９」の文字パターンを示している。
図１９は、濃度タイプＢのものとＡ＆Ｂの（ラベルＹの
確からしさの値が大きい）ラベルを抽出して得られる文
字パターン、すなわち漢字「百」の文字パターンを示し
ている。

【００６９】分離部１７は、同一ラベルのものを同一文
字（図形または色）として分離する（ステップＳ６）。
分離部１７は、図１４に示すように重なり合った文字パ
ターンを、図１８及び図１９に示すように、分離するこ
とができる。

【００７０】なお、前述した説明において、確からしさ
の数値を加減する際に、小領域統合部１４は、周囲小領
域と当該小領域との濃度差、隣接する小領域との接続の
滑らかさ、存在する図形の位置や形状、大きさがわかっ
ている時（統合情報記憶部１５に予め格納されている場
合）は、それらの情報を使用して加減する量を決定して
も良い。

【００７１】また、確からしさが大きいラベルが同一
で、かつ、連結している小領域のグループからなるエリ
アの面積が大きいほど、それらのラベルの確からしさが
強まるように加減をコントロールするように構成しても
良い。

【００７２】また、ラベル変更の手続き中に小領域を分
割したり、統合したりする処理を入れても良い。さら
に、これまでの説明では白黒グレー（濃淡）の１色の問
題を例にとって説明したが、カラーに対応するように構
成することも可能であり、これまでの説明と同じ考え方
で良い。

【００７３】また、前述した実施形態では、文字パター
ンの分離を例にして説明しているが、図形についても同
様の処理によって２値化、あるいは分離することができ
る。こうして２値化された画像や、分離された画像に対
する図形処理、画像処理、文字認識、図形認識、画像認
識は、高精度の結果を得ることができる。なお、本発明
は前述した実施形態に限定されるものでは無い。要する
本発明はその要旨を逸脱しない範囲で種々変形して用い
ることができる。

【００７４】

【発明の効果】以上詳述したように本発明によれば、低
品質な入力画像に対して、単純な閾値をもとにした閾値
処理では不可能であった安定した２値化や文字・図形分
離、色分離が短時間に実行されるので、この結果を用い
ることにより高品質な画像処理や画像理解、図形処理、
図形認識、文字認識が可能となる。

【図面の簡単な説明】

【図１】本発明の本実施形態に係わる文字・図形処理
装置の構成を示すブロック図。

【図２】第１実施形態を説明するための文字パターンの
一例を示す図。

【図３】図２の文字パターンに対応する入力画像から得
られる文字パターンの一例を示す図。

【図４】図３の文字パターンについて閾値処理した結果
得られる文字パターンの一例を示す図。

【図５】図３に示す文字パターンから抽出したエッジを
説明するための図。

【図６】図５に示すエッジをもとに小領域抽出部１２に
よって抽出された小領域を示す図。

【図７】図６に示す小領域をもとに小領域統合部１４に
よって抽出された黒Ｇランのグループを示す図。

【図８】小領域統合部１４によって得られた小領域統合
結果の一例を示す図。

【図９】Ｖラン同士を接続して新しい合成Ｖランを作成
する処理を説明するための図。

【図１０】Ｖラン同士を接続して新しい合成Ｖランを作
成する処理を説明するための図。

【図１１】画像入力部１１によって入力された入力画像
に含まれる文字パターンの一例を示す図。

【図１２】図１１に示すパターンから小領域抽出部１２
によって黒Ｇランを抽出した様子を示す図。

【図１３】図１２に示すＧランから得られる複数のＶラ
ン１３０〜１３７を示す図。

【図１４】第２実施形態を説明するための文字パターン
の一例を示す図。

【図１５】図１４に示す文字パターンから得られるエリ
アを説明するための図。

【図１６】第２実施形態の動作を説明するためのフロー
チャート。

【図１７】第２実施形態におけるラベル変換後の濃度タ
イプを表わす図。

【図１８】図１７に示す濃度タイプＡのものとＡ＆Ｂの
ラベルを抽出して得られる文字パターンを示す図。

【図１９】図１７に示す濃度タイプＢのものとＡ＆Ｂの
ラベルを抽出して得られる文字パターンを示す図。

【符号の説明】

１１…画像入力部１２…小領域抽出部１４…小領域統合部１５…統合情報記憶部１７…分離部１８…認識処理部

Claims

【特許請求の範囲】

【請求項１】入力画像としての濃淡画像またはカラー
画像から複数の小領域を抽出する小領域抽出手段と、前記小領域抽出手段によって抽出された各小領域につい
て、周囲に存在する小領域における濃度情報、色情報、
幾何学的な接続状態に関する情報、あらかじめ得られて
いる図形の形状や色に関する情報のうち少なくとも１つ
の情報をもとに、他の小領域と統合してグループ化する
小領域統合手段と、前記小領域統合手段によってグループ化された統合結果
に基づき、入力画像の２値化、文字・図形分離、色分離
のうち少なくとも１つを実行する分離手段とを具備した
ことを特徴とする文字・図形処理装置。
【請求項２】画像を入力する画像入力手段と、前記画像入力手段によって入力された画像に対する、水
平（垂直）方向の１スキャンまたは複数スキャンについ
てその各スキャンまたは各複数スキャンを分割して小領
域を生成するか、または生成した該小領域をさらに垂直
（水平）に統合することにより拡大された小領域を抽出
する小領域抽出手段とを具備し、前記小領域抽出手段によって抽出された小領域をもとに
文字・図形の処理を行なうことを特徴とする文字・図形
処理装置。
【請求項３】文字または図形のパターンを含む入力画
像から複数の小領域を抽出し、この抽出された小領域を、文字または図形のパターンを
構成するストロークらしさに基づいて周囲の小領域と統
合し、この統合された小領域をもとに前記入力画像に含まれる
本来の文字または図形のパターンを分離することを特徴
とする文字・図形処理方法。