JPH09307752A - 画像分割方法、画像分割装置、文字認識装置 - Google Patents

画像分割方法、画像分割装置、文字認識装置

Info

Publication number
JPH09307752A
JPH09307752A JP8118675A JP11867596A JPH09307752A JP H09307752 A JPH09307752 A JP H09307752A JP 8118675 A JP8118675 A JP 8118675A JP 11867596 A JP11867596 A JP 11867596A JP H09307752 A JPH09307752 A JP H09307752A
Authority
JP
Japan
Prior art keywords
image
area
character
unit
grayscale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8118675A
Other languages
English (en)
Inventor
Masaru Sugioka
賢 杉岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8118675A priority Critical patent/JPH09307752A/ja
Publication of JPH09307752A publication Critical patent/JPH09307752A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 文字および濃淡画像を含む画像を文字につい
ては固定閾値によりまた濃淡画像については局所的濃淡
に応じた閾値によりそれぞれ2値化して生成された2値
画像イメージから、文字領域および濃淡画像領域を分割
するに当たり、精度良くかつ短時間で当該分割が出来る
方法を提供する。 【解決手段】 2値画像イメージ22をそのx方向およ
びy方向にそれぞれドット単位に走査すると共に、列単
位および行単位での白黒変化点数Hおよび黒点数Aを求
め、かつ、これら白黒変化点数Hおよび黒点数Aから列
および行単位に評価値(H×N)/Aを求める。該求め
た評価値の分布から閾値を越えた領域を濃淡画像領域と
する。ただし、Nは前記評価値を整数化するための定数
である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文字および濃淡
画像が混在している画像を2値化して得た2値画像イメ
ージから文字領域および濃淡画像領域を分割する方法
と、その実施に好適な装置と、該装置を含む文字認識装
置とに関するものである。
【0002】
【従来の技術】文字と濃淡画像(例えば写真等)とが混
在する文書等から濃淡画像領域および文字領域を自動的
に分割できれば、例えば、複数文書から所望の文および
濃淡画像を別々に抽出してこれらを合成して新たな文書
を作成したり、或は、1つの文書から文字領域のみを抽
出して精度良く文字認識が行なえる等、種々の利点が得
られる。この種の画像分割方法の従来例として、例え
ば、特開昭62-71379号公報に開示の方法がある。この方
法では、2値画像を主走査方向および副走査方向に走査
して、黒画素が所定量を越えるラインから、黒画素を含
まないライン(白ライン)数が閾値以上連続した場合の
その先頭白ラインまでを、1つの領域とする。そして、
当該領域における黒画素率情報およびランレングス情報
(白または黒の画素が連続して発生する数)を予め与え
た閾値と比較することにより、当該領域が文字領域なの
か濃淡画像領域なのかを判別している。
【0003】
【発明が解決しようとする課題】しかしながら、上述の
従来方法では、1つの領域の終端を決めるために各領域
間にはある程度の白ラインが必要である。また、公開公
報の第2図(ア)〜(ウ)を参照して説明されている文
からも明らかなように、この従来方法は基本的には切り
出した領域からさらに小さな領域を切り出してゆく直列
的な処理を必要とするため、処理時間が長くなると考え
られる。また黒画素率情報およびランレングス情報に基
づく領域判定は必ずしも精度が高い判定方法とは言えな
い。
【0004】新たな発想による新規な画像分割方法の出
現、さらにはその実施に好適な画像分割装置の出現、さ
らには、それを利用した文字認識装置の出現が望まれ
る。
【0005】
【課題を解決するための手段】そこで、この出願に係る
発明者は鋭意研究を進めた結果以下の点に着目した。 :文字および濃淡画像を含む画像を2値化する方法と
して、2値化対象画像のうちの文字については固定閾値
で、また写真等の濃淡画像については局所的濃淡に応じ
て閾値を変えて2値化する方法があるという点(例えば
文献I:平成元年度画像電子学会全国大会予稿22「文
字・写真・網点の混在する画像の2値化処理方法」)、
:局所的濃淡に応じて閾値を変えることにより2値化
した画像は、濃淡画像の中間調を擬似的に2階調で表現
するため、白画素、黒画素が交互に配列した市松状の画
像になることが多いという点、:一方、固定閾値によ
り2値化した画像は、濃度の濃い領域においては黒画素
が連続し、濃度の薄い領域においては白画素が連続する
という点、:そして、これら〜の性質を利用し2
値画像イメージにおける文字領域と濃淡画像領域とを判
別できるのではないかという点、である。
【0006】したがって、この出願の画像分割方法によ
れば、文字および濃淡画像を含む画像を文字については
固定閾値によりまた濃淡画像については局所的濃淡に応
じた閾値によりそれぞれ2値化して生成された2値画像
イメージから、文字領域および濃淡画像領域を分割する
に当たり、前記2値画像イメージをそのx方向およびy
方向にそれぞれドット単位に走査すると共に、列単位お
よび行単位での白黒変化点数Hおよび黒点数Aを求め、
かつ、これら白黒変化点数Hおよび黒点数Aから列およ
び行単位に評価値(H×N)/Aを求め、該求めた評価
値の分布から前記2値画像イメージを文字領域と濃淡画
像領域とに分割することを特徴とする。ただし、Nは前
記評価値を整数化するための定数である。
【0007】この画像分割方法の発明により得られる評
価値(H×N)/Aは、局所的濃淡に応じた閾値により
2値化されている領域では変化点数Hが多いために大き
くなり、固定閾値により2値化されている領域では変化
点数Hが少ないために小さくなる傾向を示すものとな
る。したがって、評価値が所定閾値より大きい領域を、
局所的濃淡に応じた閾値により2値化されている領域す
なわち濃淡画像領域と判定するようにし、そうでない領
域を文字領域と判定することにより、文字領域および濃
淡画像領域を精度良く判定出来ると考えられる。さら
に、この画像分割方法の発明では、2値画像イメージを
一度走査しそして画像列単位および行単位の評価値を求
める処理を一度実施しておくのみで、その後は、2値画
像イメージに対する走査処理は行なわないで済む。よっ
て、特開昭62-71379号公報に開示の方法に比べ走査処理
の回数が低減されるので、処理時間の短縮が期待出来
る。
【0008】また、この出願では次の様な画像分割方法
も主張する。すなわち、文字および濃淡画像を含む画像
を文字については固定閾値によりまた濃淡画像について
は局所的濃淡に応じた閾値によりそれぞれ2値化して生
成された2値画像イメージから、文字領域および濃淡画
像領域を分割するに当たり、各要素に所定の重み付けが
されたm×nマトリクスを走査単位として用いて前記2
値画像イメージをそのX方向およびY方向に走査し、該
2値画像イメージのドット単位の特徴値を求め、これら
求めた特徴値に基づいて列および行単位に評価値を求
め、該求めた評価値の分布から前記2値画像イメージを
文字領域と濃淡画像領域とに分割する画像分割方法であ
る。ただし、m,nは2以上の整数であり、互いは同じ
でも異なっても良い。
【0009】評価値の算出を特徴値に基づいて行なう上
記画像分割方法の場合は、注目画素の画素値が、その周
囲の複数個の画素をも考慮した特徴値に変換される。そ
のため、着目画素の画素値をそのまま用いる場合よりも
画像の状況が反映された情報に基づいて評価値が算出で
きると考えられるから、より精度の高い領域分割が期待
出来る。
【0010】
【発明の実施の形態】以下図面を参照してこの出願の各
発明の実施の形態について説明する。しかしながら説明
に用いる各図はこの発明を理解できる程度に概略的に示
してあるにすぎない。また、説明に用いる各図において
同様な構成成分については同一の番号を付して示し、そ
の重複する説明を省略することもある。なお、以下の実
施の形態では、画像分割方法、画像分割装置および文字
認識装置の実施の形態について併せて説明する。
【0011】1.第1の実施の形態 図1は第1の実施の形態の文字認識装置10の構成を概
略的に示すブロック図である。図1において、20は第
1の実施の形態の画像分割装置、20aは画像格納部、
20bは第1の実施の形態の領域分割部、30は文字認
識部をそれぞれ示す。さらに、40は画像記録媒体を示
す。以下これら構成成分20〜40の主に機能について
説明する。
【0012】先ず、画像記録媒体40は、文字および濃
淡画像を含む画像を文字については固定閾値によりまた
濃淡画像については局所的濃淡に応じた閾値によりそれ
ぞれ2値化して生成された2値画像イメージを記憶して
いる媒体である。なおここでいう局所的濃淡に応じた閾
値により2値化するとは、固定閾値による2値化以外の
2値化を意味するものとし、具体的には局所的2値化お
よび2値ディザ法の両方を含むものとする。またこのよ
うな2値画像イメージを得る具体的な方法は特に限定さ
れない。その一例としては、例えば上述の文献Iに記載
の2値化処理方法を挙げることが出来る。
【0013】また、画像格納部20aは、画像記録媒体
40から、上記2値画像イメージを読み込み、例えば、
文字画素および濃淡画像における文字画素と同値の画素
を「1」、文字の背景画素および濃淡画像における文字
の背景画素と同値の画素を「0」として格納するもので
ある。しかも、画像格納部20aは、メモリ上に、第2
図に示すようなX−Y座標を設定でき、かつ、この座標
系で表される画素データをメモリ上から読み出すことが
できるようになっている。この画像格納部20aの理解
を深めるために、図2に、画像格納部20aに格納され
る2値画像イメージ22の例を示す。図2中に斜線を付
した領域22aは、写真等の濃淡画像であるため局所的
濃淡に応じた閾値により2値化されており、無地の部分
は固定閾値により2値化されている。
【0014】また、領域分割部20bを、この第1の実
施の形態では、変化点検出部20ba、評価値算出部2
0bb、評価値分布格納部20bc、基準値格納部20
bdおよび領域判定部20beで構成する。
【0015】変化点検出部20baは、画像格納部20
aに格納されている2値画像イメージをx方向およびy
方向にそれぞれドット単位に走査すると共に、列単位お
よび行単位での白黒変化点数Hおよび黒点数Aをそれぞ
れ求めるものである。なお、白黒変化点数とは、画素値
が白(例えば「0」)から黒(「1」)に変化する点の
総数および黒から白に変化する点の総数である。なおこ
こでは、画素値が白から黒に変化する点の総数および黒
から白に変化する点の総数を白黒変化点数とする例を説
明した。しかし、画素値が白から黒に変化する点の総数
を白黒変化点数とする場合、または画素値が黒から白に
変化する点の総数を白黒変化点数とする場合があっても
良い(以下、同様)。
【0016】評価値算出部20bbは、変化点検出部2
0baにて求めた白黒変化点数Hおよび黒点数Aに基づ
いて列および行単位に評価値(H×N)/Aを求めるも
のである。
【0017】評価値分布格納部20bcは、評価値分布
を格納するものである。この実施の形態では、行単位の
評価値を列方向に沿う分布として表した行単位評価値の
分布と、列単位の評価値を行方向に沿う分布として表し
た列単位評価値の分布とを格納するものである。なお、
詳細は後述するが、これら評価値分布の理解を容易にす
るために、図3に、図2に示した2値画像イメージにつ
いての行単位評価値の分布aと列単位評価値の分布bと
を示した。
【0018】基準値格納部20bdは、固定閾値により
2値化された画像と局所的濃淡に応じた閾値により2値
化された画像とを区別するための閾値であってしかも上
記の行単位評価値の分布aに対応する閾値THLxと上
記の列単位評価値の分布bに対応する閾値THLyと
を、あらかじめ格納するためのものである。もちろん、
閾値THLxと閾値THLyとは、同じ場合もあり得
る。
【0019】領域判定部20beは、上記評価値分布か
ら前記2値画像イメージにおける文字領域と濃淡画像領
域とを判定するものである。この実施の形態の領域判定
部20beは、評価値分布格納部20bcから評価値分
布を、また基準値格納部20bdから閾値THLxとT
HLyとをそれぞれ受け取り、x方向の評価値がTHL
xを越えるようなy座標y1〜y2とy方向の評価値が
THLyを越えるようなx座標x1〜x2を求め、それ
ぞれの座標で囲まれた領域を、局所的濃淡に応じた閾値
により2値化された画像、すなわち濃淡画像領域である
と判定するものとしてある。なお、この領域判定部20
beは、2値画像イメージにおける少なくとも文字領域
と判定した領域の座標情報を文字認識部30に出力す
る。
【0020】また、文字認識部30は、領域判定部20
beによって文字領域であると判定された2値画像イメ
ージ部分について、文字認識処理をするものである。こ
の文字認識部30は、2値画像イメージから処理対象領
域を切り出す際の情報として上記の領域判定部20be
から出力される座標情報を用いることを除いては、従来
の種々の文字認識部で構成出来る。
【0021】次に、図1の文字認識装置10の動作説明
をすることにより、第1の実施の形態の画像分割方法の
発明の処理手順をも併せて説明する。
【0022】画像格納部20aは、画像記録媒体40か
ら、2値画像イメージを取り込む(図2参照)。2値画
像イメージの上記取り込みが終了すると、領域分割部2
0bにおける変化点検出部20baは、図2に示す座標
系で検出開始点および検出終了点を定める。この実施の
形態では、検出開始点を(0,0)、検出終了点を(x
e,ye)とする。
【0023】次に、変化点検出部20baでは、まず
(0,0)から(1,0),(2,0),・・・,(x
e,0)まで1ドット単位に走査し、該走査範囲すなわ
ちY=0の行における白黒変化点数Hおよび黒点数Aを
計数する。白黒変化点数Hとは白から黒および黒から白
に変化する点の総数である。なお黒点数Aと白黒変化点
数Hの初期値は0とする。次に変化点検出部20ba
は、白黒変化点数Hと黒点数Aを評価値算出部20bb
に送る。
【0024】評価値算出部20bbは、下記の(1)式
を用いて行ライン0の評価値Dを算出する。
【0025】 D=(H×N)/A (1) ここで、Nは評価値Dを整数化するための定数で、1以
上の任意の整数とする。
【0026】この評価値Dは、局所的濃淡に応じた閾値
により2値化されている領域では変化点数Hが多いため
に大きくなり、固定閾値により2値化されている領域で
は変化点数Hが少ないために小さくなるという傾向があ
る。
【0027】例えば、局所的濃淡に応じて閾値を変えて
2値化した2値画像として例えば図4(A)に示した自
動車の写真画像の例を考えた場合、ヘッドライト部分と
車体部分との境界付近Pの画像部分を拡大して示すと、
白点および黒点は図4(B)のように分布している。ま
た、この図4(B)に示した2値画像の場合は、その
(x3,y3)から(x4,y3)における白黒変化点
H=36、黒点数A=18となる。従ってN=16とし
た場合、評価値Dは32になる。一方、固定閾値により
2値化した2値画像として例えば図5に示した「012
34」という文字部分の画像の例を変えた場合は、その
(x5,y5)から(x6,y5)における白黒変化点
数H=18、黒点数A=17となる。従ってN=16と
した場合、評価値Dは16になる。評価値算出部20b
bは、この評価値Dを評価値分布格納部20bcに送
る。
【0028】同様の手法により(0,1)〜(xe,
1)から(0,ye)〜(xe,ye)までの範囲にお
いて各行単位で評価値をそれぞれ求め、かつ、これを評
価値分布格納部20bcに送る。これにより、当該2値
画像イメージの行単位の評価値を列方向(Y方向)に沿
って分布させた評価値分布(図3中の行単位評価値の分
布a)が求まる。
【0029】次に走査方向を変更し、y方向についても
x方向の場合と同様の評価値分布を求める。すなわち、
(0,0),(0,1),(0,2),・・・,(0,
ye)で表される列(X=0の列)の評価値、(X=1
の列)の評価値、・・・、(X=xe列)の評価値をそ
れぞれ求め、それらを評価値分布格納部20bcに格納
して、図3中の列単位評価値の分布bとする。
【0030】また、基準値格納部20bdには、固定閾
値により2値化された画像と局所的濃淡に応じた閾値に
より2値化された画像とを区別できる図3に示すような
閾値THLxとTHLyをあらかじめ格納しておく。例
えば、図4や図5の例の場合でN=16とした場合な
ら、THLxおよびTHLyは24程度に設定するのが
好ましい。
【0031】次に、領域判定部20beでは、評価値分
布格納部20bcから評価値分布を、また基準値格納部
20bdから閾値THLxとTHLyとを受け取り、x
方向の評価値がTHLxを越えるようなy座標y1〜y
2とy方向の評価値がTHLyを越えるようなx座標x
1〜x2とを求め、それぞれの座標で囲まれた領域22
a(図3参照)を局所的濃淡に応じた閾値により2値化
された画像すなわち濃淡画像領域であると判定し、また
それ以外の領域を固定閾値により2値化された領域すな
わち文字領域であると判定し、これらの座標情報を文字
認識部30に送る。
【0032】文字認識部30では、領域分割部20bの
領域判定部20beにおいて文字領域と判定した領域に
ついてのみ文字切り出しおよび文字認識を行う。なお、
文字認識動作は本願の特徴部分ではないのでその説明を
省略する。
【0033】2.第2の実施の形態 次に、第2の実施の形態の文字認識装置について図6お
よび図7を参照して説明する。この第2の実施の形態の
文字認識装置100の、第1の実施の形態のものとの相
違点は、画像分割装置200にある。より具体的には領
域分割部20xにある。以下、この相違点について主に
説明する。
【0034】この第2の実施の形態では画像分割装置2
00の領域分割部20xを、特徴値検出部20xa、評
価値算出部20xb、評価値分布格納部20xc、基準
値格納部20xdおよび領域判定部20xeで構成す
る。
【0035】ここで、特徴値検出部20xaは、各要素
に所定の重み付けがされたm×nマトリクスを走査単位
として用いて2値画像イメージをそのX方向およびY方
向に走査し、該2値画像イメージの全ドット単位若しく
は飛び飛びのドット単位(詳細は後述する)の特徴値を
求めるものである。この実施の形態では、図7(A)に
示したように3×3マトリクスであって、その要素a0
〜a8に対して第1の重み付け値(図7(B)の例では
1)とそれより小さな第2の重み付け値(図7(B)の
例では−1)とが市松状に割り当てられた3×3マトリ
クスを用いる例を示している。
【0036】また、評価値算出部20xbは、特徴値検
出部20xaで求めた特徴値に基づいて列および行単位
に評価値を求めるものである。この実施の形態では、後
に説明する(3)式および(4)式に基づく評価値算出
法により評価値を求めるものとしてある。
【0037】また、評価値分布格納部20xc、基準値
格納部20xdおよび領域判定部20xeそれぞれは、
基本的には、第1の実施の形態の各部20bc、20b
d、20beと同様な構成とできる。
【0038】次に、図6の文字認識装置100の動作説
明をすることにより、第2の実施の形態の画像分割方法
の発明の処理手順をも併せて説明する。この説明を図
6、図7に加えて、図2をも参照して行なう。
【0039】特徴値検出部20xaでは、図2に示す座
標系で検出開始点および検出終了点を定める。この実施
の形態では第1の実施の形態と同様に、検出開始点を
(0,0)、検出終了点を(xe,ye)とする。ま
た、この特徴値検出部20xaでは、図7(A)に示す
ように、用いるm×nマトリクスMとして、3×3マト
リクスであってその中心要素a0およびその周囲の要素
a1〜a8の各重み付けをa0=a1=a3=a5=a
7=1、a2=a4=a6=a8=−1のように、重み
の大きい画素と小さい画素が市松状になるように設定し
たマトリクスとする。そして、特徴値検出部20xa
は、画像格納部20aのメモリ上の2値画像イメージの
検出開始点(0,0)から検出終了点(xe,ye)ま
での各画素を、上記3×3マトリクスの中心要素a0で
覗くようにしながらラスタ走査する。このとき、中心要
素a0から見える画像格納部22のメモリ上の画素(注
目画素)が「1」のときだけ、この3×3のマトリクス
と該マトリクスから見える画像格納部22のメモリ上の
画素の比較を行う。例えば座標(x,y)にて、a1か
ら見える画像格納部22のメモリ上の画素が「1」のと
きはa1×1すなわち特徴値Cの値を1つ増やす。ま
た、a2から見える画像格納部22のメモリ上の画素が
「1」のときはa2×−1すなわち特徴値Cの値を1つ
減らす。このようにして注目画素について、a0〜a8
すべてについての特徴値Cを計数する。ただし、特徴値
Cの初期値は0とする。なお、この処理においてマトリ
クスから見える画素が画像格納部22のメモリの外側で
あった場合は、当該画素を「0」とする。このようにし
て当該座標における特徴値C(x,y)を求める。ま
た、座標(x,y)にて要素a0から見える画像格納部
22のメモリ上の画素が「1」のときは黒点数B(x,
y)を1とする。このような特徴値検出部20xaでの
特徴値の求め方の理解を深めるために特徴値の求め方を
具体的に表すと、次の(2)式のようになる。ただし、
k0〜k8は3×3マトリクスの要素a0〜a8それぞ
れの重みづけ値、p0〜p8は要素a0〜a8からそれ
ぞれ見える画素の画素値(すなわち0または1)であ
る。
【0040】 C(x,y)=k0・p0+k1・p1+・・・+k8・p8 (2) このようにして、検出開始点(xe,ye)まで特徴値
Cおよび黒点数Bを求めたら、特徴値検出部20xa
は、これら特徴値Cと黒点数Bとを評価値算出部20x
bに送る。
【0041】評価値算出部20xbでは、次の(3)式
および(4)式を用いてx方向成分およびy方向成分の
評価値Dx、Dyを算出する。
【0042】 Dx=(ΣCy×N1)/ΣBy (3) Dy=(ΣCx×N2)/ΣBx (4) ここで、N1およびN2は0より大きい任意の数とす
る。
【0043】また、ΣCyとは、C(0,y)からC
(xe,y)までを足したものである。同様に、ΣCx
とは、C(x,0)からC(x,ye)までを足したも
のである。
【0044】この評価値DxおよびDyは、局所的濃淡
に応じた閾値により2値化されている領域ではドットの
ばらつきが多い(市松状に配置されている)ために大き
くなり、固定閾値により2値化されている領域ではドッ
トのばらつきが少ないために小さくなるという傾向があ
る。
【0045】例えば、局所的濃淡に応じて閾値を変えて
2値化した2値画像として図4(B)に示した画像部分
の例を考えた場合、図4(B)における(x3,y3)
から(x4,y3)において、ΣCy=66、A=18
となる。従ってN1=16とした場合、評価値Dxは5
8になる。一方、固定閾値により2値化した2値画像と
して既に説明した図5の画像の例を考えた場合、その
(x5,y5)から(x6,y5)におけるΣCy=
2、A=17となる。したがって、N1=16とした場
合、評価値Dxは1になる(小数点以下は切り捨て)。
評価値算出部20xbは、行単位の評価値および列単位
の評価値をそれぞれ求め、それらを評価値分布格納部2
0xcに送る。
【0046】評価値格納部20xcは、評価値算出部2
0xbから送られてくる評価値を、第1の実施の形態の
場合と同様に、行単位の評価値を列方向の分布として表
した行単位評価値の分布αという形、列単位の評価値を
行方向の分布として表した列単位評価値の分布βという
形でそれぞれ格納する。行単位評価値の分布αと、列単
位評価値の分布βとを、図7(C)に、2値画像イメー
ジ22と共に示した。図7(C)と図3とを比較するこ
とで分かるように、この第2の実施の形態の方法の方
が、第1の実施の形態の場合に比べ、所定のm×nマト
リクスを用いた分、局所的濃淡に応じて閾値を変えた2
値画像と、固定閾値による2値画像との間で評価値に違
いが生じる。これは、特徴値に2値化処理の違いが顕著
に現れるので、この特徴値に基づき算出される評価値に
も2値化処理の違いが反映されるためである。
【0047】領域決定部20xeは、第1の実施の形態
の場合と同様な手順により、文字領域と濃淡画像領域と
を判定し、これら領域の座標情報を文字認識部40に出
力する。
【0048】上述においては、この出願の各発明の実施
の形態について説明したが、これら発明は上述の実施の
形態に限られない。
【0049】例えば上述の実施の形態では、変化点検出
あるいは特徴値検出の際の検出開始点および検出終了点
を、画像格納部20a内の先頭ドットおよび最終ドット
と設定しているが、本発明はこれに限定されるものでは
なく、あらかじめ定めた当該画像上の任意の位置を検出
開始点および検出終了点として設定可能である。
【0050】また、上述の実施の形態では、画像記録媒
体40を入力媒体として用いているが、本発明はこれに
限定されるものではなく、スキャナ、FAX等の画像読
取装置を入力媒体として用いても良い。
【0051】また、第2の実施の形態では、3×3重み
付けマトリクスを用いた例を説明しているが、本発明は
これに限定されるものではなく、重みの大きな値と小さ
な値が市松状に配置されたマトリクスであれば、その形
状は問わない。
【0052】また上述の実施の形態では指定領域内の画
像イメージの全ドットを走査しているが、画像イメージ
を数行おき或いは数列おきに走査しても良い。その方が
処理速度を速くできる。
【0053】
【発明の効果】上述した説明から明らかなように、この
発明の画像分割方法によれば、文字および濃淡画像を含
む画像を文字については固定閾値によりまた濃淡画像に
ついては局所的濃淡に応じた閾値によりそれぞれ2値化
して生成された2値画像イメージから、文字領域および
濃淡画像領域を分割するに当たり、前記2値画像イメー
ジを走査することで、列単位および行単位での白黒変化
点数Hおよび黒点数Aを求め、かつ、これら白黒変化点
数Hおよび黒点数Aから列および行単位に評価値(H×
N)/Aを求める。そして、該求めた評価値の分布から
前記2値画像イメージを文字領域と濃淡画像領域とに分
割する。上記評価値(H×N)/Aは、局所的濃淡に応
じた閾値により2値化されている領域では変化点数Hが
多いために大きくなり、固定閾値により2値化されてい
る領域では変化点数Hが少ないために小さくなる傾向を
示すものとなる。したがって、評価値が所定閾値より大
きい領域を、局所的濃淡に応じた閾値により2値化され
ている領域すなわち濃淡画像領域と判定するようにし、
そうでない領域を文字領域と判定することにより、文字
領域および濃淡画像領域を精度良く判定出来る。また、
この画像分割方法の発明では、2値画像イメージをドッ
ト単位に一度走査しそして画像列単位および行単位の評
価値を求める処理を一度実施しておくのみで、その後
は、2値画像イメージに対する走査処理は行なわないで
済む。したがって、特開昭62-71379号公報に開示の方法
に比べ、走査処理の回数が低減されるので、処理時間の
短縮が期待出来る。
【0054】また、画像分割方法の発明であって、各要
素に所定の重み付けがされたm×nマトリクスを走査単
位として用いて前記2値画像イメージをそのX方向およ
びY方向に走査し、該2値画像イメージのドット単位の
特徴値を求め、これら求めた特徴値に基づいて列および
行単位に評価値を求め、該求めた評価値の分布から前記
2値画像イメージを文字領域と濃淡画像領域とに分割す
る方法では、注目画素の画素値が、その周囲の複数個の
画素をも考慮した特徴値に変換される。そのため、着目
画素の画素値をそのまま用いる場合よりも画像の状況が
反映された情報に基づいて評価値が算出できると考えら
れるから、より精度の高い領域分割が期待出来る。
【0055】また、画像分割装置の発明では所定の領域
分割部を具えたので、上述の画像分割方法を容易に実施
することができる。
【0056】また、文字認識装置の発明では、上記画像
分割装置を含むので、文字および濃淡画像が混在する文
書から文字領域のみを自動的にしかも精度良く分割でき
る。そのため、文字および濃淡画像が混在する文書中の
文字認識を精度良く行なえる装置が実現される。
【図面の簡単な説明】
【図1】発明の第1の実施の形態の説明図であり、特に
第1の実施の形態の画像分割装置および文字認識装置の
構成を示したブロック図である。
【図2】2値画像イメージの説明図である。
【図3】第1の実施の形態における評価値分布の例の説
明図である。
【図4】(A)は局所的濃淡に応じて閾値を変えて2値
化した2値画像の一例を示した図、(B)は該2値画像
の一部を拡大して白点黒点の分布の様子を示した図であ
る。
【図5】固定閾値により2値化した2値画像の一例を示
した図である。
【図6】発明の第2の実施の形態の説明図であり、特に
第2の実施の形態の画像分割装置および文字認識装置の
構成を示したブロック図である。
【図7】第2の実施の形態の説明図であり、(A)およ
び(B)は特徴値検出部の説明図、(C)は第2の実施
の形態で生成される評価値分布の説明図である。
【符号の説明】
10:第1の実施の形態の文字認識装置 20:第1の実施の形態の画像分割装置 20a:画像格納部 20b:第1の実施の形態の領域分割部 20ba:変化点検出部 20bb:評価値算出部 20bc:評価値分布格納部 20bd:基準値格納部 20be:領域判定部 22:2値画像イメージ 22:濃淡画像領域 30:文字認識部 40:画像記録媒体 a,α:行単位評価値の分布 b,β:列単位評価値の分布 100:第2の実施の形態の文字認識装置 200:第2の実施の形態の画像分割装置 20x:第2の実施の形態の領域分割部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 文字および濃淡画像を含む画像を文字に
    ついては固定閾値によりまた濃淡画像については局所的
    濃淡に応じた閾値によりそれぞれ2値化して生成された
    2値画像イメージから、文字領域および濃淡画像領域を
    分割するに当たり、 前記2値画像イメージをそのx方向およびy方向にそれ
    ぞれドット単位に走査すると共に、列単位および行単位
    での白黒変化点数Hおよび黒点数Aを求め、かつ、これ
    ら白黒変化点数Hおよび黒点数Aから列および行単位に
    評価値(H×N)/Aを求め、 該求めた評価値の分布から前記2値画像イメージを文字
    領域と濃淡画像領域とに分割することを特徴とする画像
    分割方法(ただし、Nは前記評価値を整数化するための
    定数である。)。
  2. 【請求項2】 文字および濃淡画像を含む画像を文字に
    ついては固定閾値によりまた濃淡画像については局所的
    濃淡に応じた閾値によりそれぞれ2値化して生成された
    2値画像イメージから、文字領域および濃淡画像領域を
    分割するに当たり、 各要素に所定の重み付けがされたm×nマトリクスを走
    査単位として用いて前記2値画像イメージをそのX方向
    およびY方向に走査し、該2値画像イメージのドット単
    位の特徴値を求め、 これら求めた特徴値に基づいて列および行単位に評価値
    を求め、 該求めた評価値の分布から前記2値画像イメージを文字
    領域と濃淡画像領域とに分割することを特徴とする画像
    分割方法(ただし、m,nは2以上の整数であり、互い
    は同じでも異なっても良い。)。
  3. 【請求項3】 請求項2に記載の画像分割方法におい
    て、 前記m×nマトリクスとして、要素に対して第1の重み
    付け値とそれより小さな第2の重み付け値とが市松状に
    割り当てられたm×nマトリクスを用いることを特徴と
    する画像分割方法。
  4. 【請求項4】 請求項1または2に記載の画像分割方法
    において、 前記評価値の分布から各領域を分割する際は、 前記2値画像イメージ中の、前記列単位の評価値が閾値
    を越えるX座標および前記行単位の評価値が閾値を越え
    るY座標で囲まれる領域を、濃淡画像領域と判定するこ
    とを特徴とする画像分割方法。
  5. 【請求項5】 文字および濃淡画像を含む画像を文字に
    ついては固定閾値によりまた濃淡画像については局所的
    濃淡に応じた閾値によりそれぞれ2値化して生成された
    2値画像イメージから、文字領域および濃淡画像領域を
    分割するための画像分割装置において、 前記2値画像イメージを格納するための画像格納部と、 該2値画像イメージから、文字領域および濃淡画像領域
    を分割するための領域分割部であって、 前記画像格納部に格納されている2値画像イメージをx
    方向およびy方向にそれぞれドット単位に走査すると共
    に、列単位および行単位での白黒変化点数Hおよび黒点
    数Aを求める変化点検出部、 前記求めた白黒変化点Hおよび黒点数Aに基づいて列お
    よび行単位に評価値(H×N)/Aを求める評価値算出
    部および該求めた評価値の分布から前記2値画像イメー
    ジにおける文字領域と濃淡画像領域とを判定する領域判
    定部を含む領域分割部とを具えたことを特徴とする画像
    分割装置(ただし、Nは前記評価値を整数化するための
    定数である。)。
  6. 【請求項6】 文字および濃淡画像を含む画像を文字に
    ついては固定閾値によりまた濃淡画像については局所的
    濃淡に応じた閾値によりそれぞれ2値化して生成された
    2値画像イメージから、文字領域および濃淡画像領域を
    分割するための画像分割装置において、 前記2値画像イメージを格納するための画像格納部と、 該2値画像イメージから、文字領域および濃淡画像領域
    を分割するための領域分割部であって、 各要素に所定の重み付けがされたm×nマトリクスを走
    査単位として用いて前記2値画像イメージをそのX方向
    およびY方向に走査し、該2値画像イメージのドット単
    位の特徴値を求める特徴値検出部、 前記求めた特徴値に基づいて列および行単位に評価値を
    求める評価値算出部および該求めた評価値の分布から前
    記2値画像イメージにおける文字領域と濃淡画像領域と
    を判定する領域判定部を含む領域分割部とを具えたこと
    を特徴とする画像分割装置(ただし、m,nは2以上の
    整数であり、互いは同じでも異なっても良い。)。
  7. 【請求項7】 請求項6に記載の画像分割装置におい
    て、 前記特徴値検出部は、前記m×nマトリクスとして、要
    素に対して第1の重み付け値とそれより小さな第2の重
    み付け値とが市松状に割り当てられたm×nマトリクス
    を用いる特徴値検出部であることを特徴とする画像分割
    装置。
  8. 【請求項8】 請求項5または6に記載の画像分割装置
    において、 前記領域判定部は、前記2値画像イメージ中の、前記列
    単位の評価値が閾値を越えるX座標および前記行単位の
    評価値が閾値を越えるY座標で囲まれる領域を、濃淡画
    像領域と判定する領域判定部であることを特徴とする画
    像分割装置。
  9. 【請求項9】 請求項5〜8のいずれか1項に記載の画
    像分割装置と、2値画像イメージ中の前記画像分割装置
    により文字領域であると判定された領域について文字認
    識処理をする文字認識部とを具えたことを特徴とする文
    字認識装置。
JP8118675A 1996-05-14 1996-05-14 画像分割方法、画像分割装置、文字認識装置 Withdrawn JPH09307752A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8118675A JPH09307752A (ja) 1996-05-14 1996-05-14 画像分割方法、画像分割装置、文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8118675A JPH09307752A (ja) 1996-05-14 1996-05-14 画像分割方法、画像分割装置、文字認識装置

Publications (1)

Publication Number Publication Date
JPH09307752A true JPH09307752A (ja) 1997-11-28

Family

ID=14742430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8118675A Withdrawn JPH09307752A (ja) 1996-05-14 1996-05-14 画像分割方法、画像分割装置、文字認識装置

Country Status (1)

Country Link
JP (1) JPH09307752A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111417911A (zh) * 2017-11-28 2020-07-14 Thk株式会社 图像处理装置、移动机器人的控制系统、移动机器人的控制方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111417911A (zh) * 2017-11-28 2020-07-14 Thk株式会社 图像处理装置、移动机器人的控制系统、移动机器人的控制方法
CN111417911B (zh) * 2017-11-28 2023-09-22 Thk株式会社 图像处理装置、移动机器人的控制系统、移动机器人的控制方法

Similar Documents

Publication Publication Date Title
US6137918A (en) Memory efficient method and apparatus to enable tagging of thin antialiased lines
JP3686439B2 (ja) デジタル・イメージのフォト領域検出システム、及び方法
EP1152593A2 (en) Image processing of anti-aliased images
US7412108B2 (en) Image enhancement employing partial template matching
EP0548571A1 (en) System and method for bidirectional adaptive thresholding
US6044179A (en) Document image thresholding using foreground and background clustering
US7372992B2 (en) Image data processing machine
EP0891070B1 (en) Method and device for recognizing an image, and copying machine and printer using them
JPH07262374A (ja) 画像処理装置
US5995661A (en) Image boundary detection for a scanned image
US7151859B2 (en) Method and system for correcting direction or orientation of document image
JPH07322057A (ja) 2進入力画像の解像度の増大方法及びその増大装置、ならびに2進入力画像の外観の改良方法
US20010021034A1 (en) Image processing apparatus and method
JPH0725064A (ja) 電子写真プリンタの画像形成装置
EP0661664B1 (en) Print image enhancement device
US7508987B2 (en) Method, apparatus, system, and program for image processing capable of recognizing, reproducing, and enhancing an image, and a medium storing the program
JPH09307752A (ja) 画像分割方法、画像分割装置、文字認識装置
JP3262425B2 (ja) 画像処理装置
JP4127675B2 (ja) 画像処理装置
JPH0962763A (ja) バーコードの検出方法
US6650775B1 (en) Method and apparatus for implementing a streaming two-dimensional digital image segmentation
JP2654294B2 (ja) エッジ検出方法
US7079699B2 (en) Multi-valued image conversion device, multi-valued image conversion program, and multi-valued image conversion method
JP3358133B2 (ja) 画像処理装置
JPH05128306A (ja) 文章画像の属性判別方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030805