JPH0981743A - 文字・図形処理装置及び文字・図形処理方法 - Google Patents

文字・図形処理装置及び文字・図形処理方法

Info

Publication number
JPH0981743A
JPH0981743A JP7237447A JP23744795A JPH0981743A JP H0981743 A JPH0981743 A JP H0981743A JP 7237447 A JP7237447 A JP 7237447A JP 23744795 A JP23744795 A JP 23744795A JP H0981743 A JPH0981743 A JP H0981743A
Authority
JP
Japan
Prior art keywords
small area
character
run
small
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7237447A
Other languages
English (en)
Inventor
Yoshiaki Kurosawa
由明 黒沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7237447A priority Critical patent/JPH0981743A/ja
Publication of JPH0981743A publication Critical patent/JPH0981743A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】低品質な入力画像に対しても安定した2値化、
文字・図形分離、色分離の処理を短時間に実行すること
を可能にする。 【解決手段】入力画像としての濃淡画像またはカラー画
像から複数の小領域を抽出する小領域抽出部12と、小
領域抽出部1によって抽出された各小領域について、周
囲に存在する小領域における濃度情報、色情報、幾何学
的な接続状態に関する情報、あらかじめ得られている図
形の形状や色に関する情報のうち少なくとも1つの情報
をもとに、他の小領域と統合してグループ化する小領域
統合部14と、小領域統合部14によってグループ化さ
れた統合結果に基づき、入力画像の2値化、文字・図形
分離、色分離のうち少なくとも1つを実行する分離部1
7とを具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置、図
形認識装置、画像処理装置に好適な文字・図形処理装置
及び文字・図形処理方法に関する。
【0002】
【従来の技術】一般に、ファクシミリ装置、光学的文字
読取装置(OCR)、イメージスキャナなど、文字認識
装置、図形認識装置、画像処理装置等においては、濃淡
画像を2値画像に変換する2値化処理を行なっている。
従来、これら装置における2値化処理は、濃淡画像の各
画素の値と予め設定された閾値とを比較して各画素の値
(1または0)を生成する単純な閾値処理や、大域的な
濃度の分布を分析することにより各画素の値を生成する
処理がある。2値化処理では、元の濃淡画像に対して良
好な2値画像を生成するためには閾値の設定が重要であ
り、その一つの方法として局所的な濃度の変動を検知し
て閾値を変動させる方法もある。
【0003】また、2値化処理は、カラー画像に対し
て、画像中の色分離を行なう場合や、画像中に濃度や色
の異なる文字や図形が重なって存在し、それぞれを分離
する場合にも適用することができる。
【0004】こうした2値化処理によって、入力画像
(濃淡画像、カラー画像)に含まれる文字、あるいは図
形等のパターンが生成される。このパターンは、文字認
識処理、あるいは図形認識処理等に供される。
【0005】従来の2値化処理では、入力画像が低品質
の場合には、安定した2値化や色分離、文字・図形分離
することができない。すなわち、大域的な方法では局所
変動に対応できないために精度の高い処理ができず、逆
に局所的な方法では精度の高い処理が可能ではあるもの
の画像中にノイズ等が存在する場合に、このノイズに敏
感に反応してしまい本来期待している結果が得られな
い。
【0006】ところで、本出願人は、先に特願平5−7
4250号において、次のような技術を提案している。
まず、原画像を2値化し、得られた2値化画像の連結領
域を組み合わせることにより直線性などの図形としての
存在可能性を調べ、もし可能であれば欠落部分を補った
り、必要があれば補う部分の濃度を調べることにより、
もとの図形を復元するものである。
【0007】この処理では、2値画像に欠落部分があっ
たとしても元の図形を復元することができるものの、処
理が複雑となり処理プログラムの複雑化や処理時間の増
大を招いてしまう。また、処理が複雑になってしまう
と、汎用性のある処理プログラムを作成することが困難
となってしまう。
【0008】また、色分離を行なう方法として、原画像
中のある任意の画素から始めて徐々に同一と見なせる周
囲の画素をマージし、領域を拡大して行き、各領域の色
を決定することにより色分離を行なう方法もある。
【0009】この方法であれば精度の高い分離が可能と
なるが、画素単位で処理を行なうために、前述と同様に
ノイズ等の影響を受けやすく、また多くの処理時間を必
要とする。
【0010】
【発明が解決しようとする課題】このように従来の技術
では、ノイズを含むような低品質の入力画像に対して、
安定して2値化、文字・図形分離、色分離の処理を行な
うことが困難であり、また処理に多くの時間を要してい
た。このため、文字認識や図形認識を行なう場合には、
短時間に高精度な認識結果を得ることが困難となってい
た。
【0011】本発明は前記のような事情を考慮してなさ
れたもので、低品質な入力画像に対しても安定した2値
化、文字・図形分離、色分離の処理を短時間に実行する
ことが可能な文字・図形処理装置及び文字・図形処理方
法を提供することを目的とする。
【0012】
【課題を解決するための手段】本発明は、入力画像とし
ての濃淡画像またはカラー画像から複数の小領域を抽出
する小領域抽出手段と、前記小領域抽出手段によって抽
出された各小領域について、周囲に存在する小領域にお
ける濃度情報、色情報、幾何学的な接続状態に関する情
報、あらかじめ得られている図形の形状や色に関する情
報のうち少なくとも1つの情報をもとに、他の小領域と
統合してグループ化する小領域統合手段と、前記小領域
統合手段によってグループ化された統合結果に基づき、
入力画像の2値化、文字・図形分離、色分離のうち少な
くとも1つを実行する分離手段とを具備したことを特徴
とする。
【0013】また本発明は、画像を入力する画像入力手
段と、前記画像入力手段によって入力された画像に対す
る、水平(垂直)方向の1スキャンまたは複数スキャン
についてその各スキャンまたは各複数スキャンを分割し
て小領域を生成するか、または生成した該小領域をさら
に垂直(水平)に統合することにより拡大された小領域
を抽出する小領域抽出手段とを具備し、前記小領域抽出
手段によって抽出された小領域をもとに文字・図形の処
理を行なうことを特徴とする。
【0014】また本発明は、文字または図形のパターン
を含む入力画像から複数の小領域を抽出し、この抽出さ
れた小領域を、文字または図形のパターンを構成するス
トロークらしさに基づいて周囲の小領域と統合し、この
統合された小領域をもとに前記入力画像に含まれる本来
の文字または図形のパターンを分離することを特徴とす
る。
【0015】このように、入力画像の画像データから濃
度や色情報が一定または一様と見なせる小領域を複数抽
出し、各小領域についてその小領域とその周囲に存在す
る小領域における濃度や色情報と幾何学的な接続状態や
画像内に存在しうる図形の形状や色の情報を調べること
により、該小領域を統合して複数の、より大きなエリア
にまとめ、各エリアを分類することにより2値化、文字
・図形分離、色分離が行なわれる。
【0016】小領域については、入力画像から水平(垂
直)方向の1スキャンまたは複数スキャンについてその
各スキャンまたは各複数スキャンを分割して小領域を生
成するか、または該小領域を垂直(水平)に統合するこ
とにより拡大された小領域を抽出して小領域抽出が行な
われる。
【0017】それぞれの小領域単位ではそれが何である
のかが分からないが、周囲の小領域との関係を調べなが
ら統合していくことによって、その小領域が表している
文字・図形の種類や色を確定していく。
【0018】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。図1は本実施形態に係わる
文字・図形処理装置の構成を示すブロック図である。図
1に示すように文字・図形処理装置は、画像入力部1
1、小領域抽出部12、小領域統合部14、統合情報記
憶部15、分離部17、及び認識処理部18によって構
成されている。
【0019】画像入力部11は、入力画像(濃淡画像ま
たはカラー画像)の画像データを入力する。濃淡画像ま
たはカラー画像には、文字あるいは図形のパターンが含
まれているものとする。
【0020】小領域抽出部12は、画像入力部11によ
って入力された画像データから、後段における処理単位
となる複数の小領域を抽出する。小領域抽出部12は、
入力画像に対する水平(垂直)方向の1スキャンまたは
複数スキャンについて、その各スキャンまたは複数スキ
ャン毎に分割して小領域を生成するか、または、この小
領域を垂直(水平)方向に統合することにより拡大して
小領域とする。1スキャンの各スキャンを小領域とする
場合、その小領域はランとなる。
【0021】小領域統合部14は、小領域抽出部12に
よって抽出された小領域を、統合情報記憶部15に記憶
された情報に基づいて統合しグループ化するものであ
る。グループ化された小領域は、図形、あるいは文字の
ストロークの一部を構成するものである。
【0022】統合情報記憶部15は、小領域統合部14
によって小領域を統合する際に参照される情報であり、
例えば小領域における濃度情報、色情報、幾何学的な接
続状態に関する情報(詳細については後述する)、あら
かじめ得られている図形の形状や色に関する情報等が含
まれる。これらの情報のうち少なくとも1つの情報が小
領域の統合を行なう際に、小領域統合部14によって参
照される。
【0023】分離部17は、統合情報記憶部15による
統合結果に基づいて、必要な分離処理、すなわち2値
化、文字・図形分離、色分離等の処理うち、少なくとも
何れか1つを実行する。
【0024】認識処理部18は、分離部17における分
離処理によって得られた情報について、図形認識あるい
は文字認識を実行する。次に、本発明の第1実施形態の
動作について説明する。
【0025】ここでは、説明を簡単にするために、入力
画像中に、図2に示すような本来の文字パターン(数字
の4の文字)が含まれており、この文字を認識する処理
を例にして説明する。
【0026】まず画像入力部11は、処理対象とする画
像を入力する。画像入力部11が入力した入力画像は、
低品質であったために画像中の文字パターンが図3に示
すようになっているものとする。すなわち、文字パター
ンは、パターンの本体部分31の他に、かすれた部分3
2、ノイズが乗った部分33,34が含まれている。ノ
イズが乗った部分33は本体部分31と重なった部分で
あり、ノイズがのった部分34は本体部分31と重なっ
ていない部分である。かすれた部分32の濃度は、本体
部分31の濃度より薄く、ノイズが乗った部分33は本
体部分31より濃い。また、ノイズが乗った部分34
は、かすれた部分32より濃いものとする。
【0027】図3に示すようなかすれた部分32、ノイ
ズが乗った部分33,34を含む文字パターンについて
閾値処理を実行すると、すなわち固定の閾値で2値化す
ると、図4に示すように、ノイズが乗った部分34、か
すれた部分32の影響を受けた2値化パターンが得られ
てしまう。本実施形態では、図3に示す文字パターン
を、図2に示す本来の文字パターンにして分離するため
の2値化方法を実行する。
【0028】なお、以下の説明では画像中の黒い部分を
濃度が濃い、白い部分を濃度が薄いとして説明する。小
領域抽出部12は、図3に示す文字パターン(画像デー
タ)から小領域を抽出する。ここでは、入力画像に対す
る水平方向の1スキャンで、1つの小領域(ラン)が抽
出されるものとする。すなわち、横方向のスキャンとし
て得られるエッジ(濃度変化の急なところ)に関して、
左側に上りエッジ(濃度が濃い方に変化する)があり、
右側に下りエッジ(濃度が薄い方に変化する)がある横
方向に隣あうエッジのペアの間のランを小領域として取
り出す。本発明では処理単位を画素ではなく、小領域抽
出部12によって抽出される小領域とするため、画素単
位での処理と比較すると処理時間を短縮することができ
る。
【0029】図5は、図3に示す文字パターンからエッ
ジを抽出したものである。図5の丸印が当該文字パター
ンを横方向でスキャンして得られるエッジである。な
お、図5は説明を簡単にするためにスキャンの間隔を大
きくとっているが、小領域抽出部12は、どのような間
隔でスキャンしても良い。
【0030】図6は、小領域抽出部12によって抽出さ
れた小領域を示している。ここでは、小領域を黒Gラン
と呼び、図6中では実線で示している。一方、小領域抽
出部12は、上りと上り、または下りと下りのエッジが
隣り合うエッジのペアの間のランを別に取り出す。これ
を中間Gランと呼び、図6中では破線で示している。な
お、図示していないが、左側が下りエッジで右側が上り
エッジのペアの間のランを背景Gランと呼ぶ。背景Gラ
ンでも濃度の濃いものは中間Gランと見なしても良い。
【0031】次に、小領域統合部14は、小領域抽出部
12によって抽出された小領域を統合しグループ化す
る。すなわち、小領域統合部14は、縦方向で隣あう複
数の黒Gランを比較して、文字パターンの線分の一部を
構成していると見なされるものをグルーピングする。
【0032】具体的には、黒Gランの長さがほぼ同じ
で、隣あう黒Gランのずれの量が一定であるか、または
ずれの量が少ないことを検査し、この検査結果に応じて
該当する複数の黒Gランのグループを抽出する。なお、
検査の条件は、統合情報記憶部15に幾何学的な接続状
態に関する情報として記憶されており、選択的に小領域
統合部14によって参照される。幾何学的な接続状態に
関する情報には、例えば文字パターンの分離に係わる情
報であれば、文字ストロークらしさ、すなわち文字パタ
ーンを構成する文字ストロークとして見做した際に正当
であるか否かを判別することができる情報が含まれる。
図形等の他のパターンに係わる情報も同様に記憶され
る。
【0033】図7に小領域統合部14によって抽出され
た黒Gランのグループを示す。図7中では、実線で囲ま
れた複数の黒Gランが1グループである。ここで、黒G
ランを縦方向で接続してグルーピングしたものをVラン
と呼ぶ。図7においては、複数のVラン71〜76が抽
出されたことを示している。なお、図7において、破線
で囲まれた黒Gラン及び中間Gランは、小領域統合部1
4によるグルーピングで抽出されなかったGラン群7
7,78を示している。
【0034】次に、小領域統合部14は、Vランに隣接
する中間Gランを調べて、現在のVランにさらに統合可
能な黒Gランまたは中間Gランを抽出する。すなわち、
小領域統合部14は、中間Gランそのもの、または中間
Gランと他の黒Gランとを合成して得られる合成Gラン
が、Vランに接続できると見なせる時は、この合成Gラ
ンをVランに組み入れる。なお、接続できると見なせる
時の条件は、統合情報記憶部15に記憶されているもの
とする。
【0035】図7に示す例では、Vラン71に隣接する
中間GランR1と黒GランR2について調べられる。例
えば、2つのGランR1,R2を合成して新しいGラン
を作成し、この合成GランとVラン71とを比較する
と、Vラン71中の一番下の(合成Gランと最も近い)
黒Gランとのずれが少なく、Vラン71中の黒Gランの
平均の長さとほぼ一致していると判別される。小領域統
合部14は、この判別結果から、2つのGランR1,R
2から合成される合成ランをVラン71組み入れる。
【0036】小領域統合部14によってこの処理を繰り
返すことにより、Gラン群77に含まれる全てのGラン
がVラン71に組み入れられて、新たな統合されたVラ
ンが生成される。
【0037】また、小領域統合部14は、Vラン73に
ついてGラン群78を対象として同様の処理を行なう。
この場合、Gラン群78では、まずVラン73に隣接す
る3つのラン、すなわち中間GランR3,R5、黒Gラ
ンR4が対象として調べられる。この場合、例えば中間
GランR3と黒GランR4とを合成して得られる合成G
ランが、前述のような処理によってVラン73と接続で
きると見なされる。従って、中間GランR3と黒Gラン
R4のみがVラン73に組み込まれ、中間GランR5が
残される。
【0038】小領域統合部14によってGラン群78に
対してこの処理を繰り返すことにより、Gラン群78に
含まれる左側2/3のGランがVラン73に組み入れら
れて、新たな統合されたVランが生成される。
【0039】以上の処理の結果、図7中に示すVラン7
1,73は、第5図の実線で囲まれた新たな統合された
Vラン81,82に変更される。次に、分離部17は、
小領域統合部14によって得られた図8に示す小領域統
合結果をもとに2値化処理を行なう。すなわち、図8に
示すVランから、そのVランに含まれるGランの両端の
エッジ位置に基づいて、図2に示すような本来の正しい
文字パターンを表わす2値画像を作成する。
【0040】次に、認識処理部18は、分離部17によ
って作成された文字パターンについて文字認識処理を実
行する。分離部17によって作成された文字パターン
は、前述したように、図3中のかすれた部分32、ノイ
ズが乗った部分33,34の影響が除去された高品質の
ものである。従って、文字認識処理では精度の高い文字
認識結果が得られる。
【0041】なお、前述した小領域統合部14における
処理の説明では、図7中に示すVラン71,73に隣接
する合成Gランを、それぞれVラン71,73に組み込
んで、図8に示すような小領域統合結果を生成するもの
と説明しているが、さらに図8に示す縦に隣接するVラ
ン同士を接続して新しい合成Vランを作成するようにし
ても良い。
【0042】図9はVラン同士を接続して新しい合成V
ランを作成する処理を説明するための図である。図9
は、2つのVラン90,91があり、その間に黒Gラン
92が挟まれている状態を示す図である。このような場
合、小領域統合部14は、上下のVラン90,91がパ
ターンの線分を構成することができ、かつ黒Gラン92
が、Vラン90,91一部分をなすことが確認されれ
ば、これらを全て統合して新しい合成Vランを作成す
る。
【0043】こうしてVラン同士を合成することで、よ
り本来の正しい文字パターンを表わす2値画像が作成さ
れるので、さらに効果的である。図10は、3つのVラ
ン101,102,103があり、Vラン101とVラ
ン102,103との間に黒Gラン104が挟まれてい
る状態を示す図である。このような場合、小領域統合部
14は、Vラン101とVラン102,103がパター
ン分岐した線分の一部と見なされる場合、間にある黒G
ラン194をVラン101に統合しても良い。
【0044】なお、小領域統合部14におけるVランや
Gランの合成では、前述した方法の他、GランやVラン
の濃度(Gランの場合にはペアのエッジ間の各画素の平
均濃度、Vランの場合はそのVランに含まれるGランの
濃度の平均)やエッジの強さ(濃度勾配)や位置、背景
の代表的な濃度値、黒部分の代表的な濃度値などを使用
して合成可能かどうかを調べる。
【0045】具体的には、濃度値が同じ程度かどうか、
エッジの強度が同じ程度であるかどうか、エッジの位置
のずれの量が少ないかどうか、エッジの位置を縦方向に
見た時にスムースに並んでいるかどうかなどをチェック
する。
【0046】次に、図3に示す形態とは異なる別の入力
画像についての処理の一例について説明する。図11は
画像入力部11によって入力された入力画像に含まれる
文字パターンの一例を示している。図11に示す文字パ
ターンは、文字部分111と罫線部分112が交わって
いるものである。また図11中、両者の重なった部分を
113とする。ここで、重なった部分113は、文字部
分111や罫線部分112よりも濃度が濃いものとす
る。しかしながら、文字部分111、罫線部分112、
重なった部分113の濃度は不定であり、単純な閾値処
理では罫線と文字の分離が不可能であるとする。ここで
は、一部が重なりあった文字部分111と罫線部分11
2とを分離抽出する。
【0047】図12は、図11に示すパターンから、小
領域抽出部12によって黒Gランを抽出した様子を示し
ている。これらのGランは、小領域統合部14によって
縦方向でVランに統合される。この結果、図13に示す
ように、複数のVラン130〜137によってパターン
が表現されている。
【0048】ここで、事前の処理で罫線位置に関する情
報が得られているとすれば(統合情報記憶部15に記憶
されている)、小領域統合部14は、その情報を使うこ
ともできる。すなわち、小領域統合部14は、罫線が存
在するとされているエリアを示す情報を用いて、そのエ
リア138に含まれているVラン130,131を取り
除くことにより、文字パターンを形成するVラン132
〜137を抽出するする。そして、小領域統合部14
は、抽出したVラン132〜137に基づいて文字パタ
ーンを再構成する。この様に、あらかじめ得られてい
る、文字あるいは図形の形状や色に関する情報を利用し
て、GランやVランの統合を図ることによって、文字パ
ターンを表わす小領域の統合だけでなく、不要な部分の
削除等が可能となる。
【0049】なお、前述した説明では、小領域抽出部1
2によって1ラインを分割することによって小領域とし
ての黒Gランを得ていたが、これを複数ラインに渡って
黒Gランを作成するようにしても良い。すなわち、水平
な複数ライン上において水平方向のある位置からある位
置までを1つのGランとするものである。
【0050】また、Vランや黒Gランの統合化の処理過
程の中で、黒GランやVランを分割したり統合したりし
て新しい黒GランやVランを生成することも有効であ
る。また、前述した例では、水平方向に黒Gランを抽出
し、垂直方向にVランを抽出したが、垂直方向に黒Gラ
ンを抽出し、水平方向にVランを抽出する様に構成して
も良い。
【0051】また、Vランや黒Gランには、位置や長
さ、大きさの情報の他、濃度情報、そのランが有効であ
るかどうかの情報、エッジ強度、隣接する他のランへの
ポインタなどの属性が付与されていても良い。
【0052】また、前述した処理方法において、Vラン
や黒Gランにラベルを付与し、このラベルを逐次更新し
て、最終ラベルの内容によって2値化、文字・図形分
離、色分離を行なっても良い。ラベルは、文字部か背景
部かの区別や図形の種類の区別、色の区別をするための
数値記号データからなるものであり、最終ラベルの内容
が同一のVランまたは黒Gランを抽出することにより、
2値化、文字・図形分離、色分離を行なう。
【0053】また、ラベル付きランに対してリラキゼー
ション法を用いても良い。各ランには複数または1個の
ラベルが付属し各ラベルに対してそのラベルが意味する
ものに、そのランが属する確からしさを数値化して表
し、その数値も対応するラベルと共に各ランに付属させ
る。この数値を各種情報に基づいて逐次更新して最終的
な各ラベルが持つ確からしさを求める。この確からしさ
に基づいて各ランを分類して2値化、文字・図形分離、
色分離を行なう。リラキゼーションは、パターン認識の
分野で良く知られた方式であるが、以下に説明する第2
実施形態において具体例を示す。
【0054】次に、第2実施形態について説明する。な
お、第2実施形態における文字・図形処理装置は、基本
的には図1に示す第1実施形態と同様の構成を持つので
説明を省略する。ただし、主に小領域抽出部12、小領
域統合部14における処理内容が第1実施形態とは異な
っている。以下、第2実施形態の動作について説明す
る。
【0055】ここでは、入力画像中に図14に示すよう
な文字パターンが含まれているものとする。すなわち、
図14の文字パターンは、漢字の「百」と数字の「9」
の文字が重なったものである。それぞれの文字の濃度は
異なっているものとする。
【0056】小領域抽出部12は、入力画像中の文字パ
ターンについて、濃度が一定であると見なせる局所小領
域を複数個抽出する。図14に示す例では、入力画像を
縦横それぞれ一定のピッチで分割して小領域を抽出して
いる。以下、小領域抽出部12によって抽出された小領
域を、図15に示すように、便宜上17個のエリアに分
けて説明する。
【0057】ここで、エリア201,204,206,
208,215,217の小領域の濃度はA、エリア2
02,205,207,210,212,214,21
6の小領域の濃度はB、エリア203,209,21
1,213の小領域の濃度はCであるとする。すなわち
濃度Aは、漢字「百」の文字パターンの濃度であり、濃
度Bは数字「9」の文字パターンの濃度であり、濃度C
は両者が重なりあった部分の濃度である。ただし、画像
の変動(ノイズ等)により、エリア216,217の小
領域では濃度のAとBが逆転しているものとする。
【0058】第2実施形態において小領域統合部14
は、ラベル(小領域)の変換、すなわち小領域の統合を
リラキゼーションの手法で行なう。小領域統合部14
は、図16に示すフローチャートに従って動作する。
【0059】まず、小領域統合部14は、小領域抽出部
12によって抽出された小領域にラベルをつける(ステ
ップS1)。ここで、ラベルは、本来、漢字「百」の文
字パターンの部分に該当するラベルX(濃度A)と、数
字「9」の文字パターンの部分に該当するラベルY(濃
度B)の2種類である。また、小領域統合部14は、こ
のラベルX,Yについて,それぞれ確からしさの初期値
を設定する(ステップS2)。
【0060】処理の最初の段階では、濃度Aのエリアで
は、例えば確からしさをX=0.7、Y=0.3と設定
し、濃度BのエリアではX=0.3、Y=0.7、濃度
CのエリアではX=0.5、Y=0.5と設定する。た
だし、確からしさを示す値は、0.0〜1.0の範囲の
値をとり、値が大きいほど確かであることを示す。
【0061】小領域統合部14は、ラベルX,Yを次に
述べる変換方式で変換を行ない(ステップS3)、ラベ
ル変換しても状態の変化が少なくなるまで繰り返して行
なう(ステップS4)。
【0062】小領域統合部14は、ある小領域を対象と
した時、その周囲の小領域の多くがラベルYである確か
らしさが高ければ、この小領域のラベルYの確からしさ
を上昇させる。この時、特にラベルXである確からしさ
が少なければラベルXの確からしさを減少させる。
【0063】もし、周囲の小領域の多くがラベルXであ
る確からしさが高ければ、この小領域のラベルXの確か
らしさを上昇させる。この時、特にラベルYである確か
らしさが少なければラベルYの確からしさを減少させ
る。
【0064】例えば、図15中のエリア203は濃度C
タイプであるが、濃度Aタイプのエリア204,206
と濃度Bタイプのエリア202,207に囲まれてお
り、前述したルールを繰り返し適用して行くことによ
り、徐々にエリア203が濃度Cタイプから濃度A&B
タイプ、すなわち、X=1.0、Y=1.0の値の方向
に順次変換されていく。同様にエリア209,211,
213についても、同様に濃度A&Bタイプに転換され
ていく。
【0065】一方、その他のエリアでは、各エリアの中
央付近ではラベルXまたはYの確からしさが上昇してい
く。しかしながら、周辺部では中央付近とは違った状況
が起こる。例えば、エリア208の周辺で、エリア21
6と接していない周辺部分に存在する小領域について
は、その周囲が濃度AタイプのものはラベルXの確から
しさが高くなり、濃度CタイプのものはラベルX,Yの
確からしさが高くなり濃度A&Bのエリアに転換されて
行く。その結果、エリア208の周辺部の中でエリア2
16と接していない部分ではラベルXの確からしさがよ
り優勢で支配的となるため、エリア208の周辺部分で
はラベルXの確からしさが上昇する。この結果、エリア
208では全域的にラベルXの確からしさが上昇する。
【0066】他方、エリア216では周辺部はエリア2
08と接しているため、最初の段階では、その付近にあ
る小領域の周囲の小領域のラベルXの確からしさも、ラ
ベルYの確からしさも中程度であるために変化が起きな
い。しかし、処理が進むにつれて、エリア208のラベ
ルXの確からしさが優勢になるので、エリア216のラ
ベルXの確からしさが周辺部で上昇して行くことにな
る。この傾向はラベル216の中心部にも拡大して行
き、結果的にエリア216はラベルXの確からしさが上
昇し、全域的に濃度Bタイプから濃度Aタイプに転換さ
れていく。
【0067】同様に、エリア214のラベルYの確から
しさが上昇するに従って、エリア217は濃度Aタイプ
から濃度Bタイプに転換される。このようなラベル変換
の処理を繰り返し行なうことにより、結果的に各小領域
のラベルの確からしさ(濃度タイプ)が、図17に示す
ように変更される。小領域統合部14は、ラベルの確か
らしさの値に基づいて小領域を分類する(ステップS
5)。
【0068】図18は、ラベル変換後の小領域の中から
濃度タイプAのものとA&Bの(ラベルXの確からしさ
の値が大きい)ラベルを抽出して得られる文字パター
ン、すなわち数字「9」の文字パターンを示している。
図19は、濃度タイプBのものとA&Bの(ラベルYの
確からしさの値が大きい)ラベルを抽出して得られる文
字パターン、すなわち漢字「百」の文字パターンを示し
ている。
【0069】分離部17は、同一ラベルのものを同一文
字(図形または色)として分離する(ステップS6)。
分離部17は、図14に示すように重なり合った文字パ
ターンを、図18及び図19に示すように、分離するこ
とができる。
【0070】なお、前述した説明において、確からしさ
の数値を加減する際に、小領域統合部14は、周囲小領
域と当該小領域との濃度差、隣接する小領域との接続の
滑らかさ、存在する図形の位置や形状、大きさがわかっ
ている時(統合情報記憶部15に予め格納されている場
合)は、それらの情報を使用して加減する量を決定して
も良い。
【0071】また、確からしさが大きいラベルが同一
で、かつ、連結している小領域のグループからなるエリ
アの面積が大きいほど、それらのラベルの確からしさが
強まるように加減をコントロールするように構成しても
良い。
【0072】また、ラベル変更の手続き中に小領域を分
割したり、統合したりする処理を入れても良い。さら
に、これまでの説明では白黒グレー(濃淡)の1色の問
題を例にとって説明したが、カラーに対応するように構
成することも可能であり、これまでの説明と同じ考え方
で良い。
【0073】また、前述した実施形態では、文字パター
ンの分離を例にして説明しているが、図形についても同
様の処理によって2値化、あるいは分離することができ
る。こうして2値化された画像や、分離された画像に対
する図形処理、画像処理、文字認識、図形認識、画像認
識は、高精度の結果を得ることができる。なお、本発明
は前述した実施形態に限定されるものでは無い。要する
本発明はその要旨を逸脱しない範囲で種々変形して用い
ることができる。
【0074】
【発明の効果】以上詳述したように本発明によれば、低
品質な入力画像に対して、単純な閾値をもとにした閾値
処理では不可能であった安定した2値化や文字・図形分
離、色分離が短時間に実行されるので、この結果を用い
ることにより高品質な画像処理や画像理解、図形処理、
図形認識、文字認識が可能となる。
【図面の簡単な説明】
【図1】本発明の 本実施形態に係わる文字・図形処理
装置の構成を示すブロック図。
【図2】第1実施形態を説明するための文字パターンの
一例を示す図。
【図3】図2の文字パターンに対応する入力画像から得
られる文字パターンの一例を示す図。
【図4】図3の文字パターンについて閾値処理した結果
得られる文字パターンの一例を示す図。
【図5】図3に示す文字パターンから抽出したエッジを
説明するための図。
【図6】図5に示すエッジをもとに小領域抽出部12に
よって抽出された小領域を示す図。
【図7】図6に示す小領域をもとに小領域統合部14に
よって抽出された黒Gランのグループを示す図。
【図8】小領域統合部14によって得られた小領域統合
結果の一例を示す図。
【図9】Vラン同士を接続して新しい合成Vランを作成
する処理を説明するための図。
【図10】Vラン同士を接続して新しい合成Vランを作
成する処理を説明するための図。
【図11】画像入力部11によって入力された入力画像
に含まれる文字パターンの一例を示す図。
【図12】図11に示すパターンから小領域抽出部12
によって黒Gランを抽出した様子を示す図。
【図13】図12に示すGランから得られる複数のVラ
ン130〜137を示す図。
【図14】第2実施形態を説明するための文字パターン
の一例を示す図。
【図15】図14に示す文字パターンから得られるエリ
アを説明するための図。
【図16】第2実施形態の動作を説明するためのフロー
チャート。
【図17】第2実施形態におけるラベル変換後の濃度タ
イプを表わす図。
【図18】図17に示す濃度タイプAのものとA&Bの
ラベルを抽出して得られる文字パターンを示す図。
【図19】図17に示す濃度タイプBのものとA&Bの
ラベルを抽出して得られる文字パターンを示す図。
【符号の説明】
11…画像入力部 12…小領域抽出部 14…小領域統合部 15…統合情報記憶部 17…分離部 18…認識処理部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力画像としての濃淡画像またはカラー
    画像から複数の小領域を抽出する小領域抽出手段と、 前記小領域抽出手段によって抽出された各小領域につい
    て、周囲に存在する小領域における濃度情報、色情報、
    幾何学的な接続状態に関する情報、あらかじめ得られて
    いる図形の形状や色に関する情報のうち少なくとも1つ
    の情報をもとに、他の小領域と統合してグループ化する
    小領域統合手段と、 前記小領域統合手段によってグループ化された統合結果
    に基づき、入力画像の2値化、文字・図形分離、色分離
    のうち少なくとも1つを実行する分離手段とを具備した
    ことを特徴とする文字・図形処理装置。
  2. 【請求項2】 画像を入力する画像入力手段と、 前記画像入力手段によって入力された画像に対する、水
    平(垂直)方向の1スキャンまたは複数スキャンについ
    てその各スキャンまたは各複数スキャンを分割して小領
    域を生成するか、または生成した該小領域をさらに垂直
    (水平)に統合することにより拡大された小領域を抽出
    する小領域抽出手段とを具備し、 前記小領域抽出手段によって抽出された小領域をもとに
    文字・図形の処理を行なうことを特徴とする文字・図形
    処理装置。
  3. 【請求項3】 文字または図形のパターンを含む入力画
    像から複数の小領域を抽出し、 この抽出された小領域を、文字または図形のパターンを
    構成するストロークらしさに基づいて周囲の小領域と統
    合し、 この統合された小領域をもとに前記入力画像に含まれる
    本来の文字または図形のパターンを分離することを特徴
    とする文字・図形処理方法。
JP7237447A 1995-09-14 1995-09-14 文字・図形処理装置及び文字・図形処理方法 Pending JPH0981743A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7237447A JPH0981743A (ja) 1995-09-14 1995-09-14 文字・図形処理装置及び文字・図形処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7237447A JPH0981743A (ja) 1995-09-14 1995-09-14 文字・図形処理装置及び文字・図形処理方法

Publications (1)

Publication Number Publication Date
JPH0981743A true JPH0981743A (ja) 1997-03-28

Family

ID=17015487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7237447A Pending JPH0981743A (ja) 1995-09-14 1995-09-14 文字・図形処理装置及び文字・図形処理方法

Country Status (1)

Country Link
JP (1) JPH0981743A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000062243A1 (fr) * 1999-04-14 2000-10-19 Fujitsu Limited Procede et dispositif d'extraction de chaines de caracteres utilisant un composant de base d'une image de document
US7024043B1 (en) 1998-12-11 2006-04-04 Fujitsu Limited Color document image recognizing apparatus
JP2008100680A (ja) * 2007-12-06 2008-05-01 Denso Corp 車載操作装置
WO2015189941A1 (ja) * 2014-06-11 2015-12-17 株式会社Pfu 情報処理装置、情報処理方法、および、プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7024043B1 (en) 1998-12-11 2006-04-04 Fujitsu Limited Color document image recognizing apparatus
WO2000062243A1 (fr) * 1999-04-14 2000-10-19 Fujitsu Limited Procede et dispositif d'extraction de chaines de caracteres utilisant un composant de base d'une image de document
JP2008100680A (ja) * 2007-12-06 2008-05-01 Denso Corp 車載操作装置
JP4591501B2 (ja) * 2007-12-06 2010-12-01 株式会社デンソー 車載操作装置
WO2015189941A1 (ja) * 2014-06-11 2015-12-17 株式会社Pfu 情報処理装置、情報処理方法、および、プログラム

Similar Documents

Publication Publication Date Title
JP4323328B2 (ja) 取り込み画像データから文字列を識別して抜出するシステムおよび方法
US8666185B2 (en) Compression of digital images of scanned documents
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
JP4764231B2 (ja) 画像処理装置、制御方法、コンピュータプログラム
US7376272B2 (en) Method for image segmentation to identify regions with constant foreground color
EP2569930B1 (en) Segmentation of a word bitmap into individual characters or glyphs during an ocr process
US7233697B2 (en) Character recognition device and a method therefor
Alberti et al. Labeling, cutting, grouping: an efficient text line segmentation method for medieval manuscripts
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US11915465B2 (en) Apparatus and methods for converting lineless tables into lined tables using generative adversarial networks
US20030012438A1 (en) Multiple size reductions for image segmentation
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05166002A (ja) ソース画像を分析する方法
CN114639106A (zh) 图文识别方法、装置、计算机设备及存储介质
KR101571681B1 (ko) 동질 영역을 이용한 문서 구조의 분석 방법
CN112200789A (zh) 一种图像识别的方法及装置、电子设备和存储介质
JPH0981743A (ja) 文字・図形処理装置及び文字・図形処理方法
CN115965987A (zh) 基于异构架构的表格文字结构化识别方法
JP2003115031A (ja) 画像処理装置および方法
CN112419208A (zh) 一种基于施工图审查矢量图纸编译方法及系统
JP2003196592A (ja) 画像処理プログラム及び画像処理装置
CN111723804B (zh) 图文分离装置、图文分离方法及计算机可读取记录介质
JPH0581474A (ja) 文字列抽出方法および文字領域検出方法
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JPH02166583A (ja) 文字認識装置