JP3165589B2 - 画像分類装置 - Google Patents

画像分類装置

Info

Publication number
JP3165589B2
JP3165589B2 JP12368194A JP12368194A JP3165589B2 JP 3165589 B2 JP3165589 B2 JP 3165589B2 JP 12368194 A JP12368194 A JP 12368194A JP 12368194 A JP12368194 A JP 12368194A JP 3165589 B2 JP3165589 B2 JP 3165589B2
Authority
JP
Japan
Prior art keywords
image
differential
input
projection histogram
density projection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP12368194A
Other languages
English (en)
Other versions
JPH07334616A (ja
Inventor
敦史 小野
督士 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP12368194A priority Critical patent/JP3165589B2/ja
Publication of JPH07334616A publication Critical patent/JPH07334616A/ja
Application granted granted Critical
Publication of JP3165589B2 publication Critical patent/JP3165589B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明はファクシミリなどの通
信機器や画像データベースの入力や、文字と写真の混在
した文書画像を領域分割した後の領域の属性判定に用い
られる画像分類装置に関し、特に画像入力手段を用いて
入力された画像をその特徴を計算することにより文書画
像と非文書画像とに分類する画像分類装置に関する。
【0002】
【従来の技術】この発明に興味のある画像分類装置がた
とえば、特開平4−316180号公報に開示されてい
る。同公報によれば、入力された画像を2値化し、白黒
反転回数や黒画素の割合により入力された画像中の特定
領域が文字か写真かといった属性が判定されている。
【0003】また、同様の装置が特開昭62−7137
9号公報に開示されている。同公報によれば、入力され
た画像を2値化し、ランレングス特徴により入力された
画像中の特定領域が文字か写真かといった属性が判定さ
れている。いずれも入力画像そのものが文書画像である
か否かを判定する方法は示されていない。
【0004】
【発明が解決しようとする課題】上記のような従来の方
法では、文書画像を対象にして画像内部で領域分割され
た個々の領域の属性を判定するのみであり、文書画像に
限らずさまざまな画像が入力されるマルチメディアデー
タベースにおいては、まず入力された画像が文書画像で
あるかどうかを予め判定してからそれらの方法を適応し
なければならない。
【0005】この発明は上記のような課題を解決するた
めになされたもので、入力された画像が文書画像である
かどうかを自動的に判定して分類、登録することがで
き、また傾いた画像に対しても精度よく判定できる画像
分類装置を提供することを目的とする。
【0006】
【課題を解決するための手段】請求項1に係る画像分類
装置は、画像を入力する画像入力手段と、入力された画
像を基に微分画像データを作成する微分画像データ作成
手段と、微分画像データから濃度投影ヒストグラムを作
成する濃度投影ヒストグラム作成手段と、濃度投影ヒス
トグラムの分散値を計算する分散値計算手段と、計算さ
れた分散値を基に入力された画像が文書画像であるか非
文書画像であるかを判別する判別手段とを含む。
【0007】請求項2に係る画像分類装置は、画像を入
力する画像入力手段と、入力された画像から微分画像デ
ータを作成する微分画像データ作成手段と、作成された
微分画像データから濃度投影ヒストグラムを作成する濃
度投影ヒストグラム作成手段と、作成された濃度投影ヒ
ストグラムの微分値を計算する濃度投影ヒストグラム微
分手段と、計算された微分値の分散値を計算する分散値
計算手段と、計算された分散値を基に入力された画像が
文書画像であるか非文書画像であるかを判別する判別手
段とを含む。
【0008】
【0009】請求項に係る画像分類装置は、画像を入
力する画像入力手段と、入力された画像を2値化する2
値画像作成手段と、作成された2値画像を基に同一属性
を有する領域を連結して最初の連結領域を作成する手段
と、最初の連結領域中の不要な領域を除去して有効な連
結領域だけを抽出する不要領域除去手段と、最初の連結
領域の数に対する有効な連結領域の数の割合を計算する
有効領域割合計算手段と、計算された有効領域割合を基
に入力された画像が文書画像であるか非文書画像である
かを判別する手段とを含む。
【0010】
【作用】請求項1に係る画像分類装置においては、入力
された画像の微分画像データを作成し、その濃度投影ヒ
ストグラムを作成し、その分散値を計算してそれに基づ
いて入力された画像が文書画像であるか非文書画像かを
判別している。
【0011】すなわち、入力画像を微分することによ
り、画像内のエッジ(濃度変化の大きい部分)が検出さ
れる。一般画像であればエッジが無秩序に存在するが、
文書画像の場合は文字が大部分を占めており、その文字
の輪郭部分にエッジが存在する。そのため、濃度投影ヒ
ストグラムを作成すると文字の存在する行部分は大きな
値(山)、文字のない行間部分は小さな値(谷)とな
り、明確な山と谷が表れる。この山と谷を定量化するた
めに分散値を計算している。すなわち、分散値は平均値
からのばらつきを表す量であるため、山と谷の差が大き
いほど分散値が大きくなる。以上のように請求項1に係
る発明によれば、入力画像に対し文字の並びを考慮して
文書画像の行間を反映させることができる。
【0012】請求項2に係る画像分類装置においては、
入力された画像の微分画像を作成し、その濃度投影ヒス
トグラムの微分値を計算し、濃度投影ヒストグラムの微
分値の分散値に基づいて入力された画像が文書画像か非
文書画像であるかを判別している。濃度投影ヒストグラ
ムを一旦微分して文字の並びに基づく山と谷の変化を強
調してからその分散値に基づいて画像の反転を行なって
いるため、文書画像の行間をよりよく反映することがで
きる。
【0013】
【0014】請求項に係る画像分類装置によれば、入
力された画像を2値化し、それを基に同一特性を有する
領域を連結してその中の有効な連結領域と有効でない領
域との割合を算出している。文書画像では文字が多く並
んでいるため、不要な領域が少なく、非文書画像では文
字が少ないため不要な領域が多い。したがってこの割合
を算出することによって文書画像が非文書画像かの判別
が可能になる。
【0015】
【実施例】以下この発明の実施例を図を参照して説明す
る。なお、以下の説明において、画像の座標系の原点は
左上であり、右向きをx軸の正方向、下向きをy軸の正
方向であるとする。また、濃淡画像は256階調である
ものとし、黒画素の輝度値を0とする。画像の大きさは
xSIZE×ySIZEであるとする。
【0016】(1)第1実施例 図1はこの発明の第1実施例における画像分類装置の機
能を説明する機能ブロック図である。図1を参照して、
第1実施例に係る画像分類装置はカメラやスキャナなど
の画像を入力するための画像入力手段11と、画像入力
手段11から入力された濃淡画像を記憶する多値画像メ
モリ12と、多値画像メモリ12から読出した濃淡画像
の微分画像を作成する微分画像作成器13と、微分画像
作成器13により作成された微分画像を記憶する微分画
像メモリ14と、微分画像メモリ14から読出した微分
画像の濃度投影ヒストグラムを作成する濃度投影ヒスト
グラム作成器15と、濃度投影ヒストグラム作成器15
で作成された濃度投影ヒストグラムを記憶するヒストグ
ラムメモリ16と、そのヒストグラムの分散値を計算す
る分散値計算器17と、分散値計算器17により計算さ
れた分散値を特徴量として画像入力手段11から入力さ
れた画像が文書画像か非文書画像であるかを分類する画
像分類器18とを含む。
【0017】図2は図1に示した画像分類装置の動作を
説明するフローチャートである。図2を参照して、この
発明の第1実施例に係る画像分類装置においては、まず
画像入力ステップS61で画像を入力し、微分画像作成
ステップS62では入力された画像に空間微分を施し微
分画像を作成する。次に微分画像作成ステップS62の
詳細について説明する。
【0018】図3は図2のS62で示した微分画像作成
ステップの詳細を示すフローチャートである。この実施
例においては、ソーベルオペレータを用いて微分画像を
作成するものとする。ソーベルオペレータは図4の
(a),(b)に示すような2種類の3×3の大きさの
オペレータであり、このオペレータを画像原点から操作
し、画像の輝度値に対して演算を行なう。なおここでf
(x,y)は画像入力ステップS61から入力された画
像の座標(x,y)での輝度値を表し、g(x,y)は
作成された微分画像の座標(x,y)での輝度値を表す
ものとする。
【0019】図3を参照して、まずソーベルオペレータ
の処理する座標を原点に設定する(S611)。そして
このオペレータを画像原点から操作し、画像の輝度値に
対して式(1)、式(2)に示す演算を行なう。ここに
A〜Iは図3(B)に示す輝度値である(S612)。
これにより微分画像の輝度値を演算する(S613)。
個々の演算結果を加算し、微分画像の輝度値とするが、
輝度値の最大値である255を越える場合はその輝度値
は255とする(S614,S615)。このオペレー
タは3×3の大きさのため、微分画像の周囲1画素の値
が演算不能となるが0に固定する(S617〜S61
9)。このようにして微分画像の作成を行なう。
【0020】次に図2へ戻って濃度投影ヒストグラム作
成ステップS63で微分画像作成ステップS62により
作成された微分画像をx,y軸に対して濃度を投影し、
濃度投影ヒストグラムを作成する。濃度投影ヒストグラ
ム作成ステップS63の詳細は図5のフローチャートを
参照して説明する。
【0021】図5を参照し、画像原点から操作を行ない
輝度値を読出す(S631)。次いで式(3),式
(4)に基づいて各軸への投影ヒストグラムを作成する
(S632)。ただし、x_hist,y_histは
それぞれx軸とy軸への濃度投影ヒストグラムを表し、
g(x,y)は微分画像作成ステップS62により作成
された微分画像を表すものとする。このようにして画像
の全域にわたって濃度投影ヒストグラムを作成する(S
631〜S636)。
【0022】なお、ここで投影ヒストグラムとしては、
たとえば円の投影ヒストグラムであれば、図6に示すよ
うな濃度投影ヒストグラムが作成される。
【0023】次に再び図2へ戻って、分散計算ステップ
S64で濃度投影ヒストグラム作成ステップS63によ
って作成されたx,yへの軸濃度投影ヒストグラムの分
散値を式(5)および式(6)に基づいて計算する。
【0024】上式により得られたそれぞれの分散値x_
var,y_varを特徴量とし、画像分類ステップS
65で所定のしきい値と比較することにより画像を分類
する。
【0025】
【数1】
【0026】次に文書画像と風景画像の濃度投影ヒスト
グラムの具体的な例について説明する。たとえば図7に
示すような文書画像と図8に示すような風景画像の濃度
投影ヒストグラムはたとえば図9および図10に示すよ
うに作成される。図から明らかなように、文書画像の場
行間や文字間が反映されることから、文字の存在
する位置に対してペアーとなる山のピークと谷のピーク
確に表れている。
【0027】次に実際の分類結果を図11に示す。図1
1のグラフのx軸は入力された画像のx軸に対する濃度
投影ヒストグラムの分散値(x_var)であり、グラ
フのy軸は画像のy軸に対する濃度投影ヒストグラムの
分散値(y_var)である。グラフを見てわかるとお
り、文書画像の分散値は大きく非文書画像の分散値は小
さくなっている。なお、この例において、先に述べた画
像分類ステップS65での所定のしきい値はx軸および
y軸に対してともに1.00に設定している。
【0028】以上のようにこの発明によれば、画像の分
類において、文書画像の特徴である「文字の並び」を考
慮したため精度の高い画像の分類装置が提供できる。し
たがってこのような画像分類装置は画像データベースや
ファックスの入力装置として用いることができる。たと
えば画像データベースの入力装置として用いた場合は、
文書と非文書を分類することにより、入力された画像に
対し「文書」または「非文書」というキーワードを人手
を介することなく自動的に付与することが可能になる。
さらに、文書画像と分類された場合には文字認識などに
より自動的にキーワードを抽出し付加することが可能と
なる。本発明の画像分類装置を画像データベースの入力
装置として用いることにより、ユーザは1つのシステム
に対し文書画像と非文書画像を意識することなく入力で
き、検索時には文書画像と非文書画像を個別に検索する
ことが可能となる。また、ファックスの入力装置として
用いた場合は、入力画像を分類することによりモードの
自動選択が可能になる。また、本発明に係る画像分類装
置は領域分割された文書と写真や図などの混合画像の各
領域の属性判定にも用いることが可能である。
【0029】(2)第2実施例 次にこの発明の第2実施例について説明する。図12は
この発明の第2実施例に係る画像分類装置の各ブロック
の機能を説明する機能ブロック図である。図12を参照
して、第2実施例に係る画像分類装置はカメラやスキャ
ナなどの画像を入力するための画像入力手段21と、画
像入力手段21により入力された濃淡画像を記憶する多
値画像メモリ22と、多値画像メモリ22から読出した
画像の微分画像を作成する微分画像作成器23と、微分
画像作成器23により作成された微分画像を記憶する微
分画像メモリ24と、微分画像メモリ24から読出した
微分画像の濃度投影ヒストグラムを作成する濃度投影ヒ
ストグラム作成器25と、濃度投影ヒストグラム作成器
25により作成された濃度投影ヒストグラムを記憶する
ヒストグラムメモリ26と、ヒストグラムメモリ26か
ら読出した濃度投影ヒストグラムの微分値を計算する濃
度投影ヒストグラム微分器27とを含む。微分した結果
はヒストグラムメモリ26に記憶される。画像分類装置
はさらに、ヒストグラムメモリ26から読出したヒスト
グラムの微分値の分散値を計算する分散値計算器28
と、分散値計算器28により計算された分散値を特徴量
として画像入力手段21から入力された画像が文書画像
か非文書画像かであるかを分類する画像分類器29とを
含む。
【0030】図13は第2実施例に係る画像分類装置の
動作を説明するフローチャートである。図13を参照
し、まず画像入力ステップS71で画像を入力し、微分
画像作成ステップS72では画像入力ステップS71か
ら入力された画像に空間微分を施し微分画像を作成す
る。微分画像作成ステップS72の詳細は第1実施例で
説明した微分画像作成ステップS62と同じであるので
ここでは省略する。濃度投影ヒストグラム作成ステップ
S73では微分画像作成ステップS72により作成され
た微分画像をx,y軸に対して濃度投影し、濃度投影ヒ
ストグラムを作成する。濃度投影ヒストグラム作成ステ
ップS73の詳細は第1実施例で説明したのと同じであ
るのでここでは省略する。濃度投影ヒストグラム微分計
算ステップS74では濃度投影ヒストグラム作成ステッ
プS73により作成されたx,y軸への濃度投影ヒスト
グラムに対しそれぞれ微分値を式(7)、式(8)によ
り計算する。
【0031】本実施例では微分に中心差分を用いたが、
前進差分や後退差分を用いてもよい。なおここで中心差
分、前進差分および後退差分とは離散値を微分(差分)
するための手法の種類で、f(x)の微分には次のよう
なものがある。
【0032】中心差分:f′(x)=(f(x+1)−
f(x−1))/2 前進差分:f′(x)=f(x+1)−f(x) 後退差分:f′(x)=f(x)−f(x−1) 次に分散値計算ステップS75では、濃度投影ヒストグ
ラム微分計算ステップS74により計算されたx,yへ
の軸濃度投影ヒストグラムの微分値x_hist′
[x],y_hist′[y]の分散値を式(9)およ
び式(10)により計算する。
【0033】上式により得られたそれぞれの分散値x_
var,y_varを特徴量とし画像分類ステップS7
6で所定のしきい値と比較することにより画像を分類す
る。
【0034】
【数2】
【0035】文書画像と風景画像の濃度投影ヒストグラ
ムの微分値の例を図14および図15に示す。どちらも
谷が表れているが、文書画像の方が行間や文字間が反映
されることから、山と谷のペアーの化の割合が大きい
ことが図をみれば明らかである。実際の分類結果を図1
6に示す。図16のグラフのx軸は入力された画像のx
軸に対する濃度投影ヒストグラムの微分値の分散値であ
り、グラフのy軸は画像のy軸に対する濃度投影ヒスト
グラムの微分値の分散値である。グラフを見てわかると
おり、文書画像の分散値は大きく非文書画像の分散値は
小さくなっている。また、分類の度合いは第1の実施例
に比べて大きくなっている。なお、図16においてx
軸,y軸に対する濃度投影の微分の分散のしきい値をと
もに30.0に設定することにより画像の分類が可能で
ある。
【0036】(3)第3実施例 図17は第3実施例における画像分類装置の各ブロック
の機能を説明する機能ブロック図である。図17を参照
して、第3実施例に係る画像分類装置は、カメラやスキ
ャナなどの画像を入力するための画像入力手段31と、
画像入力手段31により入力された濃淡画像を記憶する
多値画像メモリ32と、多値画像メモリ32から読出さ
れた画像の微分画像を作成する微分画像作成器33と、
微分画像作成器33により作成された微分画像を記憶す
る微分画像メモリ34と、微分画像メモリ34から読出
された微分画像の濃度投影ヒストグラムを作成する濃度
投影ヒストグラム作成器35と、濃度投影ヒストグラム
作成器35により作成された濃度投影ヒストグラムを記
憶するヒストグラムメモリ36と、ヒストグラムメモリ
36から読出された濃度投影ヒストグラムの最大値に対
する最小値の割合を計算する割合計算器37と、割合計
算器37で計算された値を特徴量として画像入力手段3
1から入力された画像が文書画像か非文書画像であるか
を分類する画像分類器38とを含む。
【0037】図18は第3実施例に係る画像分類装置の
動作を説明するフローチャートである。まず画像入力ス
テップS81で画像を入力し、微分画像作成ステップS
82では画像入力ステップS81から入力された画像に
空間微分を施し微分画像を作成する。微分画像作成ステ
ップS82の詳細は第1実施例で説明した微分画像作成
ステップS62と同様であるのでその説明は省略する。
濃度投影ヒストグラム作成ステップS83では微分画像
作成ステップS82により作成された微分画像をx,y
軸に対して濃度投影し、濃度投影ヒストグラムを作成す
る。濃度投影ヒストグラム作成ステップS83の詳細は
第1実施例で説明した濃度投影ヒストグラム作成ステッ
プS63と同様であるためその説明は省略する。割合計
算ステップS84では濃度投影ヒストグラム作成ステッ
プS63により作成されたx,y軸への濃度投影ヒスト
グラムの最大値に対する最小値の割合を式(11)およ
び式(12)により計算する。
【0038】ここでx_min,x_maxは濃度投影
ヒストグラム作成ステップS83により作成されたx軸
への濃度投影ヒストグラムの最小値と最大値である。y
_min,y_maxは濃度投影ヒストグラム作成ステ
ップS83により作成されたy軸への濃度投影ヒストグ
ラムの最小値と最大値である。上式により計算されたx
_ratio,y_ratioを特徴量とし画像分類ス
テップS85で所定のしきい値と比較することにより画
像を分類する。
【0039】
【数3】
【0040】この実施例における文書画像と風景画像の
濃度投影ヒストグラムの微分値の例を図14および図1
5に示す。文書画像には明確な谷が表れているため、最
大値に対する最小値の割合は文書画像の方が小さくなる
ことがわかる。実際の分類結果を図19に示す。図19
のグラフのx軸は入力された画像のx軸に対する濃度投
影ヒストグラムの最大値に対する最小値の割合であり、
グラフのy軸は画像のy軸に対する濃度投影ヒストグラ
ムの最大値に対する最小値の割合である。グラフを見て
わかるとおり、文書画像の割合は小さく、非文書画像の
割合は大きくなっている。
【0041】(4)第4実施例 図20は第4実施例に係る画像分類装置の各ブロックの
機能を説明する機能ブロック図である。図20を参照し
て、第4実施例に係る画像分類装置は、カメラやスキャ
ナ等の画像を入力するための画像入力手段41と、画像
入力手段41により入力された濃淡画像を記憶する多値
画像メモリ413と、多値画像メモリ413から読出さ
れた画像の2値画像を作成する2値画像作成器42と、
2値画像作成器42により作成された2値画像を記憶す
る2値画像メモリ414と、2値画像メモリ414に記
憶されている2値画像の背景画素値を判定する背景画素
値判定器43と、背景画素値判定器43により背景色が
白と判定された場合に2値画像メモリ414に記憶され
ている画像の反転画像を作成して2値画像メモリに記憶
させる反転画像作成器44と、2値画像メモリに記憶さ
れている2値画像の連結領域をラベリングするラベリン
グ器45と、ラベリング器45により作成されたラベル
画像を記憶するラベル画像メモリ415とを含む。
【0042】画像分類装置はさらに、画像メモリ415
から読出されたラベル画像を用いて2値画像メモリに記
憶されている2値画像の連結領域のフィレ座標と面積を
計算するフィレ座標計算器46と、フィレ座標計算器4
6により計算されたフィレ座標と面積を記憶するフィレ
座標メモリ416と、フィレ座標メモリ416から読出
した連結領域の面積とフィレ座標の値を用いて不要な領
域を除去する不要領域除去器47と、不要領域除去器4
7により不要領域を除去する前と除去した後の領域の割
合を計算し有効領域の割合を計算する有効領域割合計算
器48と、フィレ座標メモリ416から読出された連結
領域のフィレ座標から重心点を計算する重心点計算器4
9と、重心点計算器49により計算された重心点の座標
を記憶する重心メモリ417と、重心メモリ417から
読出した重心点を用いて各重心点から最も近い重心点を
探索し、その方向を計算する最近重心点探索器410
と、最近重心点探索器410により計算された方向を適
当な数に量子化し方向頻度ヒストグラムを作成し、最も
頻度の高い方向の割合を計算する特徴量計算器411
と、特徴量計算器411により計算された特徴量と有効
領域割合計算器48により計算された特徴量を用いて画
像入力手段31から入力された画像が文書画像か非文書
画像であるかを分類する画像分類器412とを含む。
【0043】次に第4実施例における画像分類装置の動
作を図21に示すフローチャートを参照して説明する。
図21を参照して、まず画像入力ステップS91で画像
を入力し、2値画像作成ステップS92では画像入力ス
テップS91から入力された画像を2値化し、2値画像
を作成する。2値画像作成ステップS92の詳細を図2
2を用いて説明する。
【0044】まず画像原点から走査し、輝度値を読取り
所定のしきい値と比較ししきい値未満であれば0、しき
い値以上であれば1として2値画像を作成する(ステッ
プS921,S922)。ただしこの実施例では所定の
しきい値を判別分析法により求め固定しきい値により2
値化を行なっているが、p−タイル法、モード法などの
他の方法によりしきい値を算出してもよいし、動的しき
い値法によりしきい値を場所によって変化させて2値化
を行なってもよい。なおここで、判別分析法とはしきい
値thにより2つに分割されたクラスタのクラスタ間分
散が最大になるthを求める方法であり、p−タイル法
はパーセンテージpを与え、一方のクラスタの割合がp
%となるようにしきい値を求める方法であり、モード法
とは、双峰性のあるヒストグラムから谷を検出し、その
谷の位置をしきい値とする方法であり、動的しきい値法
とはしきい値を部分領域ごとに変化させる方法である。
【0045】なお、ここで2値画像の連結領域とは、白
画素を対象にし、ある白画素に注目した場合にその白画
素に接する白画素を次々に連結していき、最終的に連結
されたそれぞれの領域を言う。また、フィレ座標とは、
連結領域を内部に含む最小の矩形の始点と終点の座標を
言う。始点座標とはx,y座標のうちの小さい方、終点
座標とはx,y座標の大きい方を言う。
【0046】次に図21に戻り、背景画素値判定ステッ
プS93では2値画像作成ステップS92により作成さ
れた2値画像の白画素の割合を全画素数に対して求め、
所定のしきい値以上であれば背景画素値は白、しきい値
未満であれば背景画素値を黒と見なす。反転画像作成ス
テップS94では、背景画素判定ステップS93によ
り背景画素値が白であると判定された場合に2値画像作
成ステップS92により作成された2値画像の輝度値を
反転させる。ラベリングステップS95では上記の処理
により背景画素値を黒とした2値画像(以下対象2値画
像と呼ぶ)に対してラベリングを行なう。ラベリングス
テップS95の詳細は図23を用いて説明する。図中
(A)はラベリングステップS95のフローチャートで
あり、(B)はフローチャート中のPiの位置を表わ
す。
【0047】図23を参照して、画像(フローチャート
中ではf(x,y)と表す)の原点から走査していき、
非0画素に対して以下の処理を行なう。非0画素と同位
置のラベル画像(フローチャートではg(x,y)と表
す)の8近傍のうち、すでに走査済の位置(フローチャ
ート中ではpiと表す)のラベルを検査する(ステップ
S9501〜ステップS9506)。すでにラベルの付
けられた画素がない場合はその位置に新たなラベルを付
加し、テーブルとラベル番号を更新する(ステップS9
514〜ステップS9515)。すでにラベルの付けら
れた画素が複数存在する場合は、同じラベルであればそ
のラベルを付加し、違うラベルであればそれらのラベル
のうち最小のラベルを付加し、テーブル中のその他のラ
ベル番号を最小のラベル番号に置換える(ステップS9
507〜ステップ9511)。ただし、フローチャート
中のmin(),max()は最小値、最大値を求める
関数であるとする。これらの処理をすべての画素に対し
て行なう。以上の処理が終了すると、テーブルのラベル
番号の隙間が生じているのでその隙間を埋め(ステップ
S9520)、このテーブルを用いてラベルの付け直し
を行なう(ステップS9521)。なお、本実施例では
8近傍でラベリングを行なったが、4近傍で行なっても
よい。
【0048】再び図21に戻り、フィレ座標計算ステッ
プS96ではラベリングステップS95によりラベリン
グ処理された対象2値画像の連結領域のフィレ座標と面
積を求める。フィレ座標計算ステップS96の詳細は図
24を用いて説明する。
【0049】ここでフィレ座標とは、画像中の1つの連
結成分に外接する最小の矩形の左上と右下の座標であ
り、左上と右下の座標を図25に示すようにとる。ラベ
ル画像(フローチャート中ではg(x,y)と表す)の
原点から走査し、非0画素が見つかると式(13)〜式
(16)によりフィレ座標を計算する(ステップS96
01〜ステップS9607)。
【0050】また、面積は式(17)により計算する。
この処理をすべての画素に対して行なう。
【0051】再び図21に戻って、不要領域除去ステッ
プS97ではフィレ座標計算ステップS96により求め
られた連結領域の面積とフィレ座標を用いて文字の領域
らしくない、微小領域、巨大領域、細長い領域を除去す
る。微小領域は求めた面積が所定のしきい値より小さい
場合に、巨大領域はフィレ座標により生成される外接矩
形の各辺が所定のしきい値より大きい場合に、また細長
い領域は前記の外接矩形が縦横比または横縦比が所定の
しきい値より大きい場合に除去する。有効領域割合計算
ステップS98では対象2値画像の領域数に対する不要
領域除去ステップS97で除去されずに残った領域数
(以下有効領域数と呼ぶ)の割合を特徴量の1つとして
計算する。重心点計算ステップS99ではフィレ座標計
算ステップS96によって計算されたフィレ座標の中点
を式(18)により計算し重心位置とする。
【0052】最近重心点探索ステップS910では、重
心点計算ステップS99により計算された各重心から最
も近い重心を探索し、その方向を求める。さらに求めら
れた方向を適当な数に量子化し、頻度ヒストグラムを作
成する。本実施例では方向をtan−1 (−π/2≦
tan−1≦π/2)により求め、4方向に量子化し頻
度ヒストグラムを求めている。この詳細を以下に説明す
る。
【0053】図26は最近重心点探索ステップS910
のフローチャートであり、フローチャート中のnumは
有効領域数であるとする。ある重心点(grav
[i])に注目し、その重心点から最も近い重心点(g
rav[j])を以下の手順により探索する。まずsi
ze=1とし、ws=size×size+1を計算す
る(ステップS91001〜S91003)。注目した
重心点を中心とする1辺の長さがwsの矩形を考え、そ
の矩形上に他の重心点があるか否かを判定する(ステッ
プS91004)。このとき辺上に複数個の重心点が存
在する場合は、すべての重心点を考慮に入れる(S91
005)。存在した場合はgrav[i]からgrav
[j]への方向を式(19)により計算する。
【0054】ただし、grav[i]からgrav
[j]への方向ベクトルを(dx,dy)とする。
【0055】
【数4】
【0056】探索の様子は図27に示す。本実施例では
求めた方向を図28のような4つの領域に分割し、それ
ぞれの領域について頻度ヒストグラムを作成する。ま
た、grav[j]が存在しない場合はsizeをイン
クリメントして新しい矩形を考える(ステップS910
05,S910010,S910011)。sizeが
所定のしきい値MAX_SIZE以上になると近傍重心
点はなしとし新しい重心点に移る(ステップS9101
1からS91008へ)。以上の処理をすべての重心点
に対して行ない、頻度ヒストグラムを作成する。
【0057】再び図21へ戻って、特徴量計算ステップ
S911では最近重心点探索ステップS910より求め
られた頻度ヒストグラムの最頻値を検出し有効領域数に
対する割合を計算し、これらの値を特徴量とし画像分類
ステップS912で所定のしきい値と比較することによ
り画像を分類する。
【0058】入力された画像を2値化し、背景画素値を
判定し背景画素値を黒画素に反転することにより文書画
像の場合は文字領域が白画素となる。この白画素の連結
領域中で文字の領域らしくない領域を除去することによ
り文字領域だけが残される。非文書画像の場合はここま
での処理によりほとんどの領域が文字らしくないと判断
されて除去される。また文字と写真などが混在している
場合は写真領域が除去され、文字領域だけが残される。
この残った領域の重心の整列の仕方を求めると文書画像
の場合は一定方向に領域が整列し、非文書画像の場合に
は規則性のある並び方にはならない。実際の分類結果を
図29に示す。
【0059】図29を参照してx軸は有効領域割合であ
り、y軸は方向頻度ヒストグラムの最頻度割合である。
グラフを見てわかるとおり、文書画像では有効領域割合
が大きく方向の割合も大きくなっており、非文書画像で
は有効領域割合が小さく方向の割合も小さくなってい
【0060】(5)第5実施例 図30はこの発明の第5実施例に係る画像分類装置の各
ブロックの機能を説明する機能ブロック図である。図3
0を参照して、第5実施例に係る画像分類装置は、カメ
ラやスキャナなどの画像を入力するための画像入力手段
51と、上記した第1実施例から第4実施例において用
いた特徴量の中の任意の複数個の特徴量を計算する特徴
量計算器52と、特徴量計算器52により計算された特
徴量を用いて画像入力手段51から入力された画像が文
書画像か非文書画像であるかを分類する画像分類器53
とを含む。
【0061】図31は第5実施例における画像分類装置
の動作を示すフローチャートである。図31を参照し、
画像入力ステップS101で画像を入力し特徴量計算ス
テップS102では上記した第1実施例から第4実施例
において用いる特徴量のうちの任意の複数個を計算す
る。画像分類ステップS103では特徴量計算ステップ
S102により計算された特徴量を用いて画像入力ステ
ップS101から入力された画像を分類する。
【0062】
【発明の効果】以上のようにこの発明の請求項1に係る
画像分類装置においては、入力された画像の微分画像を
作成し、その投影ヒストグラムの分散値を計算し、それ
に基づいて入力された画像が文書画像か非文書画像かを
判別したため、文書画像の行間を反映させることができ
る。その結果、判定精度の高い画像分類装置が提供でき
る。
【0063】請求項2に係る画像分類装置においては、
入力された画像の微分画像を作成し、その濃度投影ヒス
トグラムを作成しその微分値の分散値に基づいて文書の
判別を行なっているため、ヒストグラムを一旦微分して
山と谷の変化を強調してから分散を調べているため、よ
り文書画像の特徴をとらえることができる。その結果、
より判定精度の高い画像分類装置が提供できる。
【0064】
【0065】請求項に係る画像分類装置においては、
入力画像の2値画像を作成し、それを基に同一特性を有
する領域を連結してその中の有効な連結領域と有効でな
い領域との割合を算出している。文書画像においては文
字が多く並んでいるため不要な領域が少なく、非文書画
像では不要な領域が多い。したがって、この割合を算出
することによって文書画像か非文書画像かの判定ができ
る。その結果、精度よく画像の分類ができる画像分類装
置が提供できる。
【図面の簡単な説明】
【図1】第1実施例に係る画像分類装置の機能ブロック
図である。
【図2】第1実施例における画像分類装置のフローチャ
ートである。
【図3】微分画像作成ステップのサブルーチンを示すフ
ローチャートである。
【図4】ソーベルオペレータを示す図である。
【図5】濃度投影ヒストグラム作成ステップを示すフロ
ーチャートである。
【図6】濃度投影ヒストグラムを示す図である。
【図7】文書画像の一例を示す図である。
【図8】風景画像の一例を示す図である。
【図9】文書画像の濃度投影ヒストグラムの例を示す図
である。
【図10】風景画像の濃度投影ヒストグラムを示す図で
ある。
【図11】第1の実施例における実際の分類結果を示す
図である。
【図12】第2の実施例に係る画像分類装置のブロック
図である。
【図13】第2の実施例に係る画像分類装置のフローチ
ャートである。
【図14】第2の実施例における文書画像の濃度投影ヒ
ストグラム微分値の例を示す図である。
【図15】第2の実施例における風景画像の濃度投影ヒ
ストグラムの微分値の例を示す図である。
【図16】第2の実施例における実際の分類結果を示す
図である。
【図17】第3実施例に係る画像分類装置の機能ブロッ
ク図である。
【図18】第3実施例における画像分類装置の動作を示
すフローチャートである。
【図19】第3の実施例における実際の分類結果を示す
図である。
【図20】第4実施例に係る画像分類装置の機能ブロッ
ク図である。
【図21】第4実施例における画像分類装置の動作を示
すフローチャートである。
【図22】2値画像作成ステップの詳細を示すフローチ
ャートである。
【図23】ラベリングステップの詳細を示すフローチャ
ートである。
【図24】フィレ座標計算ステップの詳細を示すフロー
チャートである。
【図25】フィレ座標の内容を示す図である。
【図26】最近重心点方向計算ステップの内容を示すフ
ローチャートである。
【図27】第4実施例における探索の様子を示す図であ
る。
【図28】第4実施例における探索方向を示す図であ
る。
【図29】第4実施例の実際の分類結果を示す図であ
る。
【図30】第5実施例に係る画像分類装置の機能ブロッ
ク図である。
【図31】第5実施例における画像分類装置の動作を示
すフローチャートである。
【符号の説明】
11 画像入力手段 12 多値画像メモリ 13 微分画像作成器 14 微分画像メモリ 15 濃度投影ヒストグラム作成器 16 ヒストグラムメモリ 17 分散値計算器 18 画像分類器
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 H04N 1/40

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 画像を入力する画像入力手段と、 前記入力された画像を基に微分画像データを作成する微
    分画像データ作成手段と、 前記作成された微分画像データを基に濃度投影ヒストグ
    ラムを作成する濃度投影ヒストグラム作成手段と、 前記作成された濃度投影ヒストグラムの分散値を計算す
    る分散値計算手段と、 前記計算された分散値を基に前記入力された画像が文書
    画像であるか非文書画像であるかを判別する判別手段と
    を含む、画像分類装置。
  2. 【請求項2】 画像を入力する画像入力手段と、 前記入力された画像から微分画像データを作成する微分
    画像データ作成手段と、 前記作成された微分画像データを基に濃度投影ヒストグ
    ラムを作成する濃度投影ヒストグラム作成手段と、 前記作成された濃度投影ヒストグラムの微分値を計算す
    る濃度投影ヒストグラム微分手段と、 前記計算された微分値の分散値を計算する分散値計算手
    段と、 前記計算された分散値を基に前記入力された画像が文書
    画像であるか非文書画像であるかを判別する判別手段と
    を含む、画像分類装置。
  3. 【請求項3】 画像を入力する画像入力手段と、 前記入力された画像を2値化する2値画像作成手段と、 前記作成された2値画像を基に同一属性を有する領域を
    連結して最初の連結領域を作成する手段と、 前記最初の連結領域中の不要な領域を除去して有効な連
    結領域だけを抽出する不要領域除去手段と、 前記最初の連結領域の数に対する有効な連結領域の数の
    割合を計算する有効領域割合計算手段と、 前記計算された有効領域割合を基に前記入力された画像
    が文書画像であるか非文書画像であるかを判別する手段
    とを含む、画像分類装置。
JP12368194A 1994-06-06 1994-06-06 画像分類装置 Expired - Fee Related JP3165589B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12368194A JP3165589B2 (ja) 1994-06-06 1994-06-06 画像分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12368194A JP3165589B2 (ja) 1994-06-06 1994-06-06 画像分類装置

Publications (2)

Publication Number Publication Date
JPH07334616A JPH07334616A (ja) 1995-12-22
JP3165589B2 true JP3165589B2 (ja) 2001-05-14

Family

ID=14866684

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12368194A Expired - Fee Related JP3165589B2 (ja) 1994-06-06 1994-06-06 画像分類装置

Country Status (1)

Country Link
JP (1) JP3165589B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3624045B2 (ja) * 1996-02-28 2005-02-23 キヤノン株式会社 画像処理方法及び装置
JP4240107B2 (ja) 2006-10-27 2009-03-18 コニカミノルタビジネステクノロジーズ株式会社 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム
JP5151708B2 (ja) * 2008-06-10 2013-02-27 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
JP4980486B1 (ja) 2011-06-14 2012-07-18 株式会社ナナオ 動き画像領域判定装置またはその方法
JP6766662B2 (ja) 2017-01-25 2020-10-14 株式会社リコー 画像処理装置、画像投影装置、および画像処理方法

Also Published As

Publication number Publication date
JPH07334616A (ja) 1995-12-22

Similar Documents

Publication Publication Date Title
Parker et al. An approach to license plate recognition
Lee et al. Extraction and recognition of license plates of motorcycles and vehicles on highways
Trier et al. Evaluation of binarization methods for document images
JP4690339B2 (ja) 画像処理
US5452374A (en) Skew detection and correction of a document image representation
Antani et al. Robust extraction of text in video
US8385643B2 (en) Determination of inputted image to be document or non-document
CN109738450B (zh) 笔记本键盘的检测方法和装置
US7370059B2 (en) Model of documents and method for automatically classifying a document
CN111461131B (zh) 身份证号码信息识别方法、装置、设备及存储介质
JPH05225378A (ja) 文書画像の領域分割システム
JPH11213160A (ja) 画像処理方法及び装置及びその記憶媒体
JP3165589B2 (ja) 画像分類装置
CN112818983B (zh) 一种利用图片相识度判断字符倒置的方法
US7231086B2 (en) Knowledge-based hierarchical method for detecting regions of interest
CN112215784B (zh) 图像去污方法、装置、可读存储介质及计算机设备
Ghosh et al. A vehicle number plate recognition system using region-of-interest based filtering method
Chou Classifying image pixels into shaped, smooth, and textured points
JP3150762B2 (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式
JP3113785B2 (ja) 画像分類装置
JP3488678B2 (ja) 画像分類装置
Tam et al. Quadrilateral Signboard Detection and Text Extraction.
JP2001291056A (ja) 文書画像認識装置及び記録媒体
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPH04309191A (ja) 領域属性識別装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000912

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010206

LAPS Cancellation because of no payment of annual fees