JPH08185477A - 画像分類装置 - Google Patents
画像分類装置Info
- Publication number
- JPH08185477A JPH08185477A JP6325282A JP32528294A JPH08185477A JP H08185477 A JPH08185477 A JP H08185477A JP 6325282 A JP6325282 A JP 6325282A JP 32528294 A JP32528294 A JP 32528294A JP H08185477 A JPH08185477 A JP H08185477A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image data
- connected component
- data
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
また特に名刺画像であるかどうかを判定する画像分類装
置を提供する。 【構成】 画像入力装置11より入力された多値画像デ
ータは、多値画像データと2値化された2値画像データ
としてメモリ1231,1232に記録される。2値画
像データの中の対象物を示すデータの集合(連結成分)
の中で文字らしさを持つ集合(有効な連結成分)が抽出
される。一方多値画像データは微分された後、2値化さ
れることによってエッジ部分が検出される。有効な連結
成分の面積と、有効な連結成分とエッジ部分との重なり
部分の面積との比が計算され、比がしきい値以上のもの
は文書画像と判定され、文書というキーワードとともに
画像データベース装置13に記録される。
Description
特に画像データベース入力時に入力画像の属性を判定
し、自動的に分類、登録する画像分類装置に関する。
像に対して、その画像の内部を自動的に領域分割して各
領域の属性判定を行なう方法が特開平4−316180
および特開昭62−71379において開示されてい
る。
し、各々の領域の白黒反転回数や黒画素の割合により写
真領域か文字領域かなどの属性を判定するものであり、
後者は同じく2値化された入力画像を領域分割し、各々
の領域のランレングス特徴や黒画素率により、写真領域
か文字領域かなどの属性を判定するものである。
術は文書画像を対象として、画像内部で領域分割された
各々の領域の属性を判定するのみであり、入力画像その
ものが文書画像であるか否かを判定する方法や装置はこ
れまで開示されていなかった。
データが入力されるマルチメディアデータベースに画像
が登録される際には、人間がその入力画像の内容を分
類、判断して適当なキーワードを付加する必要があっ
た。
スに特開平4−316180および特開昭62−713
79の技法を適用するときには、まず入力された画像が
文書画像であるかどうかを人間が予め判定してからそれ
らの技法を適用しなければならない。
する装置も従来技術としてなかったため、名刺画像から
たとえば文字認識を利用して住所録作成などの処理を行
なう場合、さまざまな画像中から人間が名刺画像を選び
出し、それぞれの画像に対して文字認識処理を行なうと
いう手間をかけなければならなかった。
めになされたもので、入力された画像そのものが文書画
像であるかどうか、また特に名刺画像であるかどうかを
自動的に判定して人間の手間をかけずに分類(キーワー
ド付加)して画像データベースに登録することができ、
また画像の内容に応じた処理、たとえば文字認識を用い
た住所録作成などを自動的に行なうことのできる画像分
類装置を提供することを目的とする。
類装置は、入力された画像データの中から対象物を表わ
す隣接した複数の画素よりなる連結成分を識別する識別
手段と、入力された画像データの中の連結成分の形状か
ら文字らしさを表わす特徴量を抽出する抽出手段と、抽
出された特徴量に基づいて、入力された画像データが文
書画像か否かを判別する判別手段とを備えたものであ
る。
1に記載の画像分類装置であって、入力された画像デー
タは濃淡画像データよりなり、抽出手段は、入力された
濃淡画像データからエッジの強いデータ領域を検出する
エッジ検出手段を含み、連結成分の面積と、連結成分と
データ領域との重なり領域の面積とから特徴量を抽出す
るものである。
1に記載の画像分類装置であって、抽出手段は、連結成
分の各々に対する外接矩形の面積を算出する算出手段を
含み、連結成分の面積と外接矩形の面積とから特徴量を
抽出するものである。
れた画像データの中から対象物を表わす隣接した複数の
画素よりなる連結成分を識別する識別手段と、連結成分
の数を特徴量として計測する計測手段と、計測された特
徴量に基づいて、入力された画像データが名刺画像か否
かを判別する判別手段とを備えたものである。
れた画像データの中から対象物を表わす隣接した複数の
画素よりなる連結成分を識別する識別手段と、識別され
た連結成分を最隣接する2つの連結成分ごとに分け、分
けられた2つの連結成分ごとの並び方向を抽出する方向
抽出手段と、抽出された並び方向の特定の範囲の方向へ
の集中度を特徴量として計測する計測手段と、計測され
た特徴量に基づいて、入力された画像データが名刺画像
か否かを判別する判別手段とを備えたものである。
れた画像データから微分画像データを作成する微分画像
データ作成手段と、微分画像データに基づいて、濃度投
影ヒストグラムを作成する濃度投影ヒストグラム作成手
段と、作成された濃度投影ヒストグラムから特徴量を計
算する計算手段と、計算された特徴量に基づいて、入力
された画像データが名刺画像か否かを判別する判別手段
とを備えたものである。
4に記載の画像分類装置であって、識別された連結成分
を最隣接する2つの連結成分ごとに分け、分けられた2
つの連結成分ごとの並び方向を抽出する方向抽出手段
と、抽出された並び方向の特定の範囲の方向への集中度
を特徴量として計測する計測手段とをさらに備え、特徴
量は特定の範囲の方向への集中度を含むものである。
4または7に記載の画像分類装置であって、入力された
画像データから微分画像データを作成する微分画像デー
タ作成手段と、微分画像データに基づいて、濃度投影ヒ
ストグラムを作成する濃度投影ヒストグラム作成手段
と、作成された濃度投影ヒストグラムの微分値に基づく
データを計算する計算手段とをさらに備え、特徴量は濃
度投影ヒストグラムの微分値に基づくデータを含むもの
である。
1から5ならびに7および8のいずれかに記載の画像分
類装置であって、識別手段は、入力された画像データの
中から対象物を表わす隣接した複数の画像のうち所定の
条件を満たす画素を連結成分として識別するものであ
る。
画像データの中から対象物を表わす隣接した複数の画素
よりなる連結成分を識別し、入力された画像データの中
の連結成分の形状から文字らしさを表わす特徴量を抽出
し、抽出された特徴量に基づいて入力された画像データ
が文書画像か否かを判別する。
1に記載の画像分類装置の作用に加え、濃淡画像データ
を入力し、入力された濃淡画像データからエッジの強い
データ領域を検出し、連結成分の面積と、連結成分とデ
ータ領域との重なり領域の面積とから特徴量を抽出す
る。
1に記載の画像分類装置の作用に加えて、連結成分の各
々に対する外接矩形の面積を算出し、連結成分の面積と
外接矩形の面積とから特徴量を抽出する。
れた画像データの中から対象物を表わす隣接した複数の
画素よりなる連結成分を識別し、連結成分の数を特徴量
として計測し、計測された特徴量に基づいて入力された
画像データが名刺画像か否か判別する。
れた画像データの中から対象物を表わす隣接した複数の
画素よりなる連結成分を識別し、識別された連結成分を
最隣接する2つの連結成分ごとに分け、分けられた2つ
の連結成分ごとの並び方向を抽出し、抽出された並び方
向の特定の範囲の方向への集中度を特徴量として計測
し、特徴量に基づいて入力された画像データが名刺画像
か否か判別する。
れた画像データから微分画像データを作成し、微分画像
データに基づいて濃度投影ヒストグラムを作成し、作成
された濃度投影ヒストグラムから特徴量を計算し、特徴
量に基づいて入力された画像データが名刺画像か否か判
別する。
4に記載の画像分類装置の作用に加え、識別された連結
成分を最隣接する2つの連結成分ごとに分け、分けられ
た2つの連結成分ごとの並び方向を抽出し、抽出された
並び方向の特定の範囲の方向への集中度を特徴量として
計測する。
4または7に記載の画像分類装置の作用に加え、入力さ
れた画像データから微分画像データを作成し、微分画像
データに基づいて濃度投影ヒストグラムを作成し、作成
された濃度投影ヒストグラムの微分値に基づくデータを
特徴量とする。
1から5ならびに7および8のいずれかに記載の画像分
類装置の作用に加え、入力された画像データの中から対
象物を表わす隣接した複数の画素のうち所定の条件を満
たす画素を連結成分として識別する。
画像分類装置のシステム構成を示すブロック図である。
メラやスキャナなどを含む画像入力のための画像入力装
置11と、入力された画像を処理することにより画像を
文書画像、非文書画像に分類(キーワード付け)する画
像処理装置12と、画像処理装置12により分類された
画像を記憶する画像データベース装置13とから構成さ
れる。
る。画像処理装置12は、入力された画像を処理、分類
し、かつシステム全体の動作を制御するためのCPUな
どで構成された制御装置121と、各種プログラムや定
数などを記憶するROM122と、画像や処理データな
どを記憶するRAM123とを含む。
用いられる画像入力処理部1221と、画像を2値化す
るために用いられる画像2値化処理部1222と、2値
化された画像データの中の領域を識別する領域抽出処理
部1223と、2値化された画像データの中のデータの
連結成分にラベリング(ラベル番号を付す処理)を行な
うラベリング処理部1224と、2値化された画像デー
タの中の文字らしさの特徴を抽出する文字らしさの特徴
抽出処理部1225と、画像の分類を行なう画像分類処
理部1226と、画像データベース装置13に画像デー
タを分類して登録する画像登録処理部1227とを含
む。
256階調の画像データとして記憶する多値画像メモリ
1231と、“0”および“1”の2値で表わされる画
像データを記憶する2値画像メモリ1232と、データ
の連結成分の各々のラベル番号を記憶するラベル画像メ
モリ1233と、各々の連結成分のフィレ座標および面
積を記憶するフィレ座標メモリ1234と、多値画像メ
モリ1231の画像データの微分画像を記憶する微分画
像メモリ1235と、微分画像メモリ1235の画像デ
ータをしきい値により2値化した画像データを記憶する
微分2値画像メモリ1236と、2値画像メモリ123
2の画像データおよび微分2値画像メモリ1236の画
像データの論理積画像(AND画像)を記憶するAND
画像メモリ1237とを含む。
1から入力されたさまざまな画像は、画像処理装置12
において画像の持つ特徴量が調べられることにより、自
動的に文書画像か非文書画像かに分類されて画像データ
ベース装置13に記録されることになる。
を多く含む画像であり、非文書画像とは図5に示される
風景画像などである。
処理ルーチンを示すフローチャートである。
の部分で連結しており一連の処理を示す。
1は画像入力装置11により画像データを入力し、それ
を多値画像メモリ1231に記憶する。多値画像メモリ
1231に記憶される画像データは、図6を参照してX
方向に512画素、Y方向に432画素からなるデータ
であり、1画素は“0”(黒画素)から“255”まで
の256階調(8ビット)の輝度値を持つ。画像データ
の図に対して最も左上の画素を原点(0,0)とし、X
方向に0〜511の座標を、Y方向に0〜431の座標
を付設する。
構成をしている。すなわち多値画像メモリ1231はX
座標、Y座標で示される各々の画素に対して256階調
の輝度値を記憶する8ビットのメモリを保有している。
メモリには原点(0,0)の画素の輝度値を先頭とし
て、X座標の増加順に画素の輝度値のデータが順次記憶
され、次にY座標を1増加した後に同様にX座標0から
X座標の増加順に輝度値のデータが記憶され、座標(5
11,431)までのすべての画素の輝度値のデータが
記憶される。
1は多値画像メモリ1231に記憶された256階調の
輝度値を持つ画像データ(多値画像データ)の全体を2
値化する。2値化された画像データ(2値画像データ)
は2値画像メモリ1232に記憶される。
リ1231の多値画像データ全体を走査し、2値化のた
めの輝度のしきい値を設定した後に、しきい値以上の輝
度を持つ画素を白画素(“1”のデータ)、しきい値未
満の輝度を持つ画素を黒画素(“0”のデータ)とする
ことにより行なわれる。ここにしきい値の設定方法とし
て、たとえば田村秀行監修、日本工業技術センター編、
「コンピュータ画像処理入門」,総研出版,1988
年,p.66〜p.69に述べられている方法(判別分
析法、p−タイル法、モード法など)を用いることがで
きる。この実施例においてはその中の判別分析法が用い
られる。
合をしきい値(th)により2つのクラス(th以上と
th未満)に分割したと仮定したとき、各々のクラス間
の分散が最大になるようにしきい値(th)を設定する
方法である。
像メモリ1231に記憶されている多値画像データを原
点から走査し、各画素の輝度値を読取り、設定されたし
きい値と比較する。その結果当該輝度値がしきい値未満
であればその画素の輝度値は“0”(黒画素)として、
また当該輝度値がしきい値以上であればその画素の輝度
値は“1”(白画素)として2値画像メモリ1232に
記憶される。
図7の多値画像メモリ1231と同じであるが、輝度値
として“0”か“1”かの1ビットのデータが記録され
る点で異なる。
1は2値画像メモリ1232の2値画像データの中で白
画素の数が画素の総数の1/3より多いか判定する。Y
ESであればステップS204において、2値画像メモ
リ1232の2値画像データの“0”のデータと“1”
のデータとが反転される。
ステップS204の処理は行なわれない。
なうのは以下の理由による。画像データは通常は黒画素
が背景、白画素が対象物として処理されるので、たとえ
ば図4に示される白画素の背景に黒画素の対象物からな
る画像データが入力されたときには、画像データの白黒
を反転する必要がある。そこで画素全体の中で白画素が
1/3以上のときは、背景が白画素で対象物が黒画素で
あると判定し、白画素と黒画素とを反転させることにし
ている。
リ1232の2値画像データの中の白画素の連結成分が
抽出されそれぞれにラベリングが行なわれる。
(“1”のデータ)が縦、横、斜めに連続している一群
を示す。たとえば画像データが図8に示されるデータで
あったとすると縦横斜めに“1”のデータが連続してい
るグループとして連結成分20a〜20dの4つの連結
成分が抽出され、それぞれの連結成分を識別するための
ラベル番号が図9のように設定される。図9ではラベル
番号として図8の連結成分20aに“1”のデータ、連
結成分20bに“2”のデータ、連結成分20cに
“3”のデータ、連結成分20dに“4”のデータが各
々設定されている。ラベル番号のない黒画素に対しては
ラベル番号の代わりに、“0”のデータが設定される。
記録される。ラベル画像メモリ1233は図10に示さ
れるアドレス構成をしている。すなわちアドレス構成は
2値画像メモリ1232と同じである。各アドレスはそ
のアドレスに対応する画像に付されたラベル番号を記憶
する16ビットのメモリを備えている。各々のメモリの
ビット数はラベル番号の最大値を記憶することができる
だけ用意する必要があるが、本実施例では16ビットで
あれば十分であると考えられている。
脇純一郎著「画像理解のためのデジタル画像処理(I
I)」昭晃堂、1988年、p.45〜p.46に述べ
られている方法を用いることができる。
1はラベル番号の付された各々の連結成分のフィレ座標
および面積を抽出する。フィレ座標とは画像中の1つの
連結成分に外接する最小の矩形の左上と右下の座標であ
り、図11に示されるような連結成分があったときに
は、左上のフィレ座標は(x_sp,y_sp)であ
り、右下のフィレ座標は(x_ep,y_ep)であ
る。
素のX座標,Y座標のうち最大のX座標および最大のY
座標の組が右下のフィレ座標となり、最小のX座標およ
び最小のY座標の組が左上のフィレ座標となる。
付されている画素数すなわち各々の連結成分の画素数で
表わされる。
黒、背景を白で示している。各々の連結成分のフイレ座
標および面積はフィレ座標メモリ1234に記憶され
る。フィレ座標メモリ1234は、図12に示される構
成をしている。すなわちラベル番号順に左上のフィレ座
標のX座標,Y座標,右下のフィレ座標のX座標,Y座
標,および当該連結成分の面積が記録される。座標、面
積の各々を記憶するメモリは16ビットである。したが
って1つのラベルにつき80ビットのメモリ領域を持
つ。
が除去される。不要な連結成分とは以下に述べる連結成
分である。
成分 (2) 連結成分に外接する矩形のX方向の幅が画像デー
タの全体のX方向の幅(512画素)の8分の1より大
きい、あるいは連結成分に外接する矩形のY方向の幅が
画像データ全体のY方向の幅(432画素)の8分の1
より大きい巨大成分 (3) 連結成分に外接する矩形のX方向とY方向のいず
れかの一方の幅が他方の幅の4倍より大きい細長成分 以上に述べた3つの連結成分は文字情報ではないと考え
られるため、2値画像メモリ1232から削除される。
3に示されるラベル1からラベル6の6種類の連結成分
が存在しており、それに対応してフィレ座標メモリ12
34に図14に示されるデータが記録されているとす
る。このとき、ラベル2の連結成分はY方向の幅が大き
すぎるため、前述した巨大成分として除去される。
であるため微小成分として除去される。
方向の幅の4倍以上であるため細長成分として除去され
る。
果、図15に示されるように2値画像メモリ1232に
は、ラベル1,3,5の連結成分が残されることにな
る。
1は多値画像メモリ1231の多値画像データに空間微
分処理を施す。微分処理を施された画像(微分画像)は
微分画像メモリ1235に記録される。
い部分を検出するために行なわれるものである。
値の変化が大きいところ)は対象物の境界(エッジ部
分)であると認識される。
なわれる。図16を参照して多値画像メモリ1231の
中の微分対象の画像の座標を(i,j)とすると、座標
(i,j)の画素と、座標(i,j)の画素に対して、
縦横斜めに接する合計縦3×横3の画素とが微分に用い
られる画素となる。この縦3×横3の画素の各々の輝度
値に図17に示される係数が掛けられる。係数が掛けら
れた後の縦3×横3のすべての輝度値をすべて足し合わ
せた形をδx F(i,j)とする。
に、図18に示される係数を掛け、係数を掛けた後の縦
3×横3のすべての輝度値をすべて足し合わせた値をδ
y F(i,j)とする。
(i,j)|+|δy F(i,j)|により求められる
値を用いることができる。
レータと呼ばれ、田村秀行監修、日本工業技術センター
編「コンピュータ画像処理入門」、総研出版、1988
年、p.118〜p.125において開示されている。
微分値を求める方法として他の方法を用いてもよい。
により、多値画像メモリ1231の中の画素が走査さ
れ、各々の画素の微分値が微分画像メモリ1235に記
録される。
データの端に当たる部分(X座標が0または511もし
くはY座標が0または431の部分)はソーベルオペレ
ータを適用することができないので、たとえば“0”の
データが記録される。
リ1235に記録された微分画像がしきい値により2値
化され、微分2値画像メモリ1236に記録される。2
値化の処理はステップS202で説明した方法と同様で
あるのでここでの説明を省略する。
236には入力画像の中で輝度値の変化が大きいところ
が白画素(“1”のデータ)として記録されることにな
る。
リ1232の画像データと微分2値画像メモリ1236
の画像データのAND演算が行なわれ、その結果がAN
D画像メモリ1237に記録される。AND演算とは2
つの2値画像の同じ座標位置のデータがともに“1”
(白画素)である画素だけに“1”のデータを与え、そ
れ以外の画素には“0”のデータを与える演算である。
この処理により有効な連結成分の2値画像データと輝度
値の変化が大きい部分の2値画像データとの重なり領域
が“1”のデータとしてAND画像メモリ1237に記
録されることになる。
成分が2値画像メモリ1232に記録されている状態を
示す図である。
(“0”のデータの部分)、黒画素を対象物(“1”の
データの部分)としているが、実際は白画素は対象物、
黒画素は背景として(つまり図19とは白黒反転して)
メモリに記録されている(以下図24まで同じ)。
同じ連結成分が微分2値画像メモリ1234に記録され
ている状態を示す図である。図を参照して輝度値の変化
の大きい対象物と背景の境界部が“1”のデータとして
記録されている。
された状態での図19と同じ連結成分を説明するための
図である。AND画像メモリ1237には図19の画像
と図20の画像のAND演算を行なった結果が記録され
ることになる。
1つの連結成分が各々のメモリに記録された状態を示す
図であって、図19から図21に対応した図である。
傾向がある。文書画像では2値画像メモリ1232に記
録される連結成分の面積に対するAND画像メモリ12
37に記憶される当該連結成分の面積の比は比較的大き
く、風景画像では2値画像メモリ1232に記憶される
連結成分の面積に対するAND画像メモリ1237に記
憶される当該連結成分の面積の比は比較的小さい。これ
は文字の連結成分はエッジ情報が多いことに基づくもの
であり、この差により入力画像が文書画像かそれ以外か
を判定することができる。
1はステップS207で求められた有効な連結成分の面
積全体に対するステップS210で求められたAND画
像メモリ1237の面積全体の割合edge ratioを計算す
る。edge ratioは(1)式により計算される。
1237に記録されている各領域の面積であり、binary
area は2値画像メモリ1232に含まれている各領域
の面積である。Σはメモリ中のすべての面積を合計する
ことを示している。
後にedge ratio全体の平均を取るなどしてもよい。
1はステップS211で求められたedge ratioを設定さ
れているしきい値と比較し、edge ratioがしきい値以上
か判定する。
ップS213において当該画像データは文書画像である
と判断される。
プS215において当該画像データは非文書であると判
定される。
用いられるが、ユーザの判断により変更させることもで
きる。
れた文書または非文書というキーワード(属性)ととも
に画像データベース装置13に記憶される。
ための図である。横軸はedge ratioを、縦軸はedge rat
ioの所定の範囲に分類されるサンプル画像の数を示す。
edge ratioは5%の範囲で区切られており、その範囲に
分類される文書、非文書のサンプル画像の数がヒストグ
ラムとして示されている。
が60%より大きく、非文書画像はedge ratioが60%
より小さいという傾向がある。これにより第3のステッ
プS212でのしきい値として60%という値を用いる
ことで、文書画像と非文書画像の分類を行なうことが可
能であることがわかる。
ッジ情報が多いという特徴を利用して、有効な連結画像
中の微分2値画像(エッジ情報を表わす)の面積の割合
を調べることで、文字領域を多く含む文書画像と非文書
画像とを精度よく分類することができる。
データベースやファクシミリ装置の入力装置として用い
ることができる。たとえば画像データベースの入力装置
として用いた場合は、文書と非文書を自動分類すること
により、入力された画像に対し「文書」または「非文
書」というキーワードを人手を介することなく自動的に
付与することが可能になる。
文字認識を適用することなどにより画像中の文書から自
動的にキーワードを抽出し、付与することが可能とな
る。
ベースの入力時に用いることにより、ユーザは1つのシ
ステムに対し文書画像と非文書画像を意識することなく
入力でき、検索時には文書画像と非文書画像を個別に検
索することが可能となる。
本発明を用いることによって、入力された画像を文書、
非文書に分類することが可能となり、たとえば印刷のモ
ードを自動選択することが可能となる。
と写真や図などが混合している画像を領域分割した後で
それぞれの領域に対して適用することにより、各領域の
属性判定に用いることが可能である。
実施例における画像分類装置の装置構成を示すブロック
図である。
ック図から微分2値画像メモリ1236とAND画像メ
モリ1237とを除いたものである。
第1の実施例と同じであるが、文書画像データと非文書
画像データとを分類する基準として、連結成分の外接矩
形の面積とその内部の有効な連結成分の面積との比を用
いることを特徴としている。
理は以下のように行なわれる。まず図2のステップS2
01からS207までの処理が行なわれる。この処理は
第1の実施例で説明した処理と実質的に同一であるので
ここでの説明を繰返さない。
図27に示されるフローチャートの処理が行なわれる。
1は有効な連結成分の面積とその外接矩形の面積との割
合を計算する。有効な連結成分の面積はフィレ座標メモ
リ1234から読出され、外接矩形の面積はフィレ座標
メモリ1234のフィレ座標から求められる。
area)に対する有効な連結成分の面積(binary area )
の割合(bin ratio )は、(2)式により求められる。
す。
合計と有効な連結成分の外接矩形の面積の合計との割合
をbin ratio として用いることとしたが、各々の有効な
連結成分ごとにその外接矩形の面積に対する有効な連結
成分の面積の割合を求めた後、全体の平均値を取るなど
の方法を用いてもよい。
1によりステップS401において求められたbin rati
o が予め記憶されている所定のしきい値未満であるか判
定される。所定のしきい値としてたとえば後述するよう
に55%という値が用いられるが、しきい値はユーザの
判断により任意に設定できるようにしてもよい。そのと
きユーザによりしきい値を設定する処理ルーチンは、R
OM122に記録される。
ップS403において入力画像は文書画像であると判断
される。
プS404において入力画像は非文書画像であると判断
される。
文書/非文書というキーワード(属性)とともに画像デ
ータベース装置13に記録される。
の例、図29は風景画像(非文書画像)における2値画
像データの例である。
矩形を示す。また説明の便宜上、図では対象物を黒、背
景を白で示している。
も外接矩形の面積に対する有効な連結成分の面積の割合
が小さくなっている。これにより文書画像、非文書画像
を分類することができる。
ratio を説明するための図である。横軸はbin ratio を
5%刻みの範囲で区切ったものであり、縦軸は5%刻み
で区切られた各々のbin ratio の中に分類されるサンプ
ル画像の数を示す。
%未満であり、非文書画像はbin ratio が55%以上で
ある。したがって図27のステップS402でのしきい
値を55%とし、しきい値未満を文書画像、しきい値以
上を非文書画像と判定することにより、文書画像と非文
書画像とを分類できることがわかる。
るためその外接矩形中の連結成分の割合が小さいという
文字領域の特徴を利用し、外接矩形の面積に対する有効
な連結成分の面積の割合を用いることで文字領域が多く
並んでいるという文書画像の特徴をうまく抽出し、精度
よく分類することができる。
ratioやbin ratio を含めた複数の文字らしさを示す特
徴量を組合せて判定することによりさらに精度よく画像
データを分類することが可能である。
edge ratioによる文書画像らしさと、bin ratio による
文書画像らしさの各々により得点を付け、その合計得点
により画像データの分類を行なう方法や、一方の特徴量
において、しきい値の近くに判定された画像データにつ
いては他方の特徴量を用いて分類するなどの方法で実現
することが可能である。
実施例における画像分類装置の処理を説明するための図
である。
第1の実施例と同じであるので説明を省略する。
なわれる処理は以下のとおりである。
理が実行された後、図31の処理が行なわれる。
な連結成分の文字らしさを示す特徴量が抽出される。特
徴量は画像中の有効な連結成分全体あるいは各々の有効
な連結成分について抽出される。また特徴量は画像全体
で1つの値を持つデータである。文字らしさを表わす特
徴量は、多値画像メモリ1231、2値画像メモリ12
32、ラベル画像メモリ1233、フィレ座標メモリ1
234の内容により求められる。
出された特徴量と所定のしきい値とを比較する。所定の
しきい値はROMに記録するようにしてもよいし、外部
からユーザが指定できるようにしてもよい。また異なる
2以上の方法で求めた2以上の特徴量を比較に用いるよ
うにしてもよい。
徴量と所定のしきい値とから特徴量が文字らしさを示す
条件を満たしているかが判定され、YESであればステ
ップS504において、入力画像は文書と判断される。
ステップS506において入力画像は非文書と判断され
る。
像データベースに記録されるがそのとき文書画像である
と判断された画像には、「文書画像」というキーワード
(属性)が、非文書であると判断された画像には「非文
書画像」というキーワードが併わせて記録される。
タを検索するときにはキーワードを利用し、効率のよい
検索を行なうことができる。
実施例における画像分類装置のシステム構成を示すブロ
ック図である。
メラはスキャナなどを含む画像入力のための画像入力装
置51と、入力された画像を処理することにより画像を
名刺画像、それ以外の画像に分類(キーワード付け)す
る画像処理装置52と、画像処理装置52により分類さ
れた画像を記憶する画像データベース装置53とから構
成される。各々の装置はバス15により接続されてい
る。画像処理装置52は、入力された画像を処理、分類
し、かつシステム全体の動作を制御するためのCPUな
どで構成された制御装置521と、各種プログラマブル
や定数などを記憶するROM522と、画像や処理デー
タなどを記憶するRAM523とを含む。
用いられる画像処理部5221と、画像を2値化するた
めに用いられる画像2値化処理部5222と、2値化さ
れた画像データの中の領域を識別するために用いられる
領域抽出処理部5223と、2値化された画像データの
中のデータの連結成分にラベリング(ラベル番号を付す
処理)を行なうラベリング処理部5224と、画像デー
タの領域の並び方の特徴を抽出する領域の並び方の特徴
抽出処理部5225と、画像の分類を行なう画像分類処
理部5226と、画像データベース装置53に画像デー
タの登録を行なう画像登録処理部5227とを含む。
256階調の画像データとして記憶する多値画像メモリ
5231と、“0”および“1”の2値で表わされる画
像データを記憶する2値画像メモリ5232と、データ
の連結成分の各々のラベル番号を記憶するラベル画像メ
モリ5233と、各々の連結成分のフィレ座標および面
積を記憶するフィレ座標メモリ5234と、有効な連結
成分の重心点の座標を記憶する重心メモリ5235と、
重心点と他の重心点との方向頻度を記憶する方向頻度ヒ
ストグラムメモリ5236と、多値画像メモリ1231
の画像データの微分画像を記憶する微分画像メモリ52
37と、微分画像の濃度をX,Y方向に投影した濃度の
ヒストグラムを記憶する濃度投影ヒストグラムメモリ5
238と、有効な連結成分数を記憶する有効な連結成分
数メモリ5239と、ヒストグラムの微分値を記憶する
ヒストグラム微分値メモリ5240とを含む。
1から入力されたさまざまな画像は画像処理装置52に
おいて画像の持つ特徴量が調べられることにより自動的
に名刺画像か否かに分類されて、画像データベース装置
53に記憶されることになる。
名刺画像は文字の数が少なく行間が広く開いているとい
う特徴が利用される。
装置521の処理を示すフローチャートである。
連結し一連の処理を示す。ステップS601からS60
7での処理は図2のステップS201からS207での
処理と実質的に同一であるのでここでの説明は繰返さな
い。
1は2値画像メモリ5232中に含まれている有効な連
結成分の数を計測し、その数を有効な連結成分メモリ5
239に記録する。名刺画像は文字数が少ないため、有
効な連結成分が少ないという特徴を有する。そのため名
刺画像を判定する視標の1つとして、有効な連結成分の
数を計測するのである。
分それぞれの重心点が判定され、重心メモリ5235に
記録される。
録されている各々の有効な連結成分についてのフイレ座
標について求められる。
を(x_sp[i],y_sp[i])、右下のフィレ
座標を(x_ep[i],y_ep[i])とすると、
重心座標grav[i]は(3)式により求められる。
な連結成分のラベル番号順にそのラベルの重心点のX座
標,Y座標が記録される。
成分に対する重心点は記録されないため、ラベル番号は
必ずしも連続でない。
は、各々16ビットのメモリ容量を持つため、1つのラ
ベルに対して32ビットのメモリ領域が確保されている
ことになる。
は、各々の重心点に最も近い他の重心点を調べ、その方
向を方向頻度ヒストグラムメモリ5236に記録する。
われる重心点の処理の具体的ルーチンを示したフローチ
ャートである。
きさ(画素単位)を表わす変数“size”の値が1と
して設定される。
幅を表わす変数“ws”の値がws=size×2の式
により設定される。
重心点を中心とする1辺wsの矩形の辺上に他の重心点
があるか否か判定される。
O)と判定されたのであれば、ステップ809におい
て、変数“size”が1インクリメントされる。
値が最大しきい値であるMAX_SIZEより小さいか
判定される。MAX_SIZEはたとえば100という
値が設定される。
ップS802からの処理が繰返される。
ップS805において中心の重心点から辺上の重心点へ
の方向が計算される。このとき矩形上に複数の重心点が
存在する場合は、すべての重心点に対して方向が計算さ
れる。方向θは、中心から矩形上の重心点への方向ベク
トルが(dx,dy)であるとすると、(4)式により
求められる。
る重心点の右下に他の重心点が見つかった状態を示した
図である。図中の斜線部は1辺6の矩形を示している。
ベクトルはそれぞれの重心点の座標の差で表され、この
例では(dx,dy)=(3,2)であり、θ=tan
-1(dx/dy)≒0.98[rad]となる。
向が量子化され、方向頻度ヒストグラムメモリ5236
に記録される。
であり、水平方向(X軸方向)を基準として、θが−π
/2からπ/2(rad)の間は、π/4ずつの角度を
もつ領域0から領域3までの4つの領域に分けられてい
る。求められた方向はこれらの領域の中のいずれかに分
類され記録される。たとえば図38の方向ベクトルθ≒
0.98であるので、領域3に分類されることになる。
れない場合(θ>π/2,θ<−π/2)は、ベクトル
の方向を逆転させたものをカウントする。
メモリ5236は領域0から領域3のそれぞれの方向頻
度をカウントするための4つのメモリ領域を持つ。各々
のメモリ領域は16ビット用意されている。
心点へ移る。ステップS808において、すべての重心
点について最近の重心点の方向を調べたか判定され、Y
ESであれば本ルーチンを終了する。
プS801からの処理を繰返す。ステップS810でN
Oであれば、処理はステップS807へ移る。
モリ5236にすべての重心点についての最近重心点の
方向の累積頻度が記録される。
装置521は入力画像の文字らしい領域の間隔や数の特
徴をエッジ部分の並び方の情報から抽出するために、多
値画像メモリ5231に記憶された多値画像データに空
間微分処理を施し、1画素8ビットの微分画像を作成す
る。作成された微分画像は微分画像メモリ5237に記
憶される。微分画像の作成方法は、ソーベルオペレータ
を用いる第1の実施例と同じであるためここでの説明は
繰返さない。
1は微分画像メモリ5237に記憶された微分画像に基
づいて、X,Y軸に対して投影された濃度データである
濃度投影ヒストグラムを作成する。濃度投影ヒストグラ
ムは濃度投影ヒストグラムメモリ5238に記憶され
る。
の軸に垂直な方向の直線に沿った画素の濃度を逐次足し
合わせ、その合計を求める操作を、直線の位置を平行移
動させて繰返すことであり、これにより1次元の濃度の
並び(波形)が得られる。たとえば図40に示されるよ
うな濃度がすべての部分で一定の円を想定すると、X
軸、Y軸への各々の濃度投影ヒストグラムは図示される
ように半楕円形のヒストグラムとなる。
影ヒストグラムメモリ5238は、X軸,Y軸各座標の
順番に並んだアドレス構成を取り、各座標に対する濃度
投影値16ビットを1単位としてX座標とY座標の数の
和(この場合は512+432=944)だけのメモリ
領域を持つ。
ち空白部分が多ければ)、文字列の方向への濃度投影ヒ
ストグラムは変化が少なく、値が小さくなる。
1は濃度投影ヒストグラムを微分し、ヒストグラム微分
値メモリ5240に記録する。
強調してわかりやすくするために行なわれる。この処理
の具体的な内容を以下に述べる。
メモリ5238に記録されたX,Y軸への濃度投影ヒス
トグラムに対し、それぞれの微分値x_hist′
[x]およびy_hist′[y]を式(5)、式
(6)により計算しヒストグラム微分値メモリ5240
に記録する。
は、それぞれ座標iにおける濃度投影ヒストグラムメモ
リ5238のデータ(濃度投影値)である。
説明する。図41(b)に示されるようにヒストグラム
微分値メモリ5238は、X座標/Y座標各座標の順番
に並んだアドレスを取り、各座標に対する濃度投影値の
微分値16ビットを1単位としてX座標とY座標の数の
和(この場合は512+432=944)だけのメモリ
領域を持つ。図41に示されるように、制御装置541
はたとえば濃度投影ヒストグラムメモリ5238のX=
0とX=2の内容から式(5),式(6)を用いて微分
値を計算し、ヒストグラム微分値メモリ5240のX=
1のアドレスに記録する。この計算はX軸、Y軸すべて
の値について行なわれる。なお微分値計算には注目画素
の前後に座標が存在する必要があるので、最初と最後の
座標(ここでは座標0と511または431)について
は微分値は計算されない。すなわち図41(b)に示さ
れるように、ヒストグラム微分値メモリ5240のX=
0,X=511,Y=0,Y=431の各々のアドレス
にはデータが記録されない。
は1方向にきれいに整列しており、行間のスペースが大
きいという特徴がある。したがって名刺画像は他の画像
よりも有効な連結成分数が少なく、有効な連結成分の特
定方向への並び方の集中度(重心の並び方向の特定方向
への頻度の集中度)が高く、微分濃度投影ヒストグラム
の平均値は小さいという傾向が生じる。これらの傾向に
より入力画像が名刺画像であるか否かが判定される。
08で記憶された有効な連結成分の数がしきい値以下で
あるか判定される。しきい値はたとえば200という値
が設定され、これはROM522に記憶されている。
ップS615において、重心点からその重心点に最も近
い重心点への方向の頻度がしきい値以上であるか判定さ
れる。しきい値はたとえば有効な連結成分の数に対する
方向ベクトルの最頻値の割合が50%として設定され
る。
ップS616においてヒストグラム微分値メモリ524
0に記録されているヒストグラムのX軸方向の平均値、
Y軸方向の平均値の値の大きいほうと小さいほうとがと
もにしきい値以下であるか判定される。所定のしきい値
はたとえば大きいほうの平均値に対して4.5×1
0 3 、小さいほうの平均値に対して1.5×103 とい
う値が設定されROM522に記憶される。
されることとしたが、ユーザの判断によりしきい値を自
由に設定できるようにしてもよい。その場合設定処理ル
ーチンはROM522に記憶するようにすればよい。
ップS617において入力画像は名刺画像であると判断
される。
いずれかでNOの場合は、ステップS619において入
力画像は名刺画像でないと判断される。
刺画像であるか否かのキーワード(属性)とともに、画
像データベース装置53に記録される。
えられた名刺という属性が利用できる。また名刺と判断
された画像に対しては、文字認識を適用することによ
り、住所録作成を行うなどの応用が可能である。
の微分値の具体的な例について説明する。
ラムの微分値の例を示すグラフであり、図45は名刺以
外の文書画像の微分濃度投影ヒストグラムの微分値の例
を示すグラフである。
する濃度投影ヒストグラムの各平均値のうち大きいほう
が2.26×103 、小さいほうが0.86×103 で
あり、名刺以外の文書画像はX軸,Y軸に対する濃度投
影ヒストグラムの各平均値のうち大きいほうが4.3×
103 、小さいほうが2.5×103 である。
トグラムの微分値の平均値が他の文書画像よりも小さな
値になっていることがわかる。
2のグラフのX軸は入力された画像の有効な連結成分数
であり、Y軸は入力された画像の有効な連結成分の最近
重心方向の頻度割合である。
連結成分数が小さく、最近重心方向の頻度割合が大きい
という傾向を持つ。
囲まれた領域(有効な連結成分数200個以下であり、
かつ最近重心方向の頻度割合50%以上)に含まれるサ
ンプル画像についてのみをグラフ化したものである。グ
ラフのX軸は入力された画像のX軸およびY軸に対する
微分濃度投影ヒストグラムの微分値の平均値のうち小さ
いほうの値であり、グラフのY軸は同じく大きいほうの
値である。この例において図43のX軸に対して1.5
×103 、Y軸に対して4.5×103 という値をしき
い値とすることにより名刺画像の分類が可能であること
がわかる。
像の特徴を利用し、有効な連結成分画像および微分画像
の濃度投影ヒストグラムから名刺画像を精度よく分類す
ることができる。また名刺画像と判断された場合には、
住所録作成など他の用途、処理に自動的に進むなどの応
用が可能である。
連結成分の数、有効な連結成分から近接する他の有効な
連結成分の方向、微分濃度投影ヒストグラムの微分値の
平均という3つのデータを用いたが、この中の1あるい
は2のデータにより判別するようにしても精度は落ちる
が判別は可能である。
実施例における画像分類装置の制御装置の処理を示すフ
ローチャートである。
れている第4の実施例における画像分類装置の装置構成
に同じであるのでここでの説明を繰返さない。
なわれる処理は以下のとおりである。
理が行なわれた後、図46に示されるルーチンが実行さ
れる。
は、画像中の有効な連結成分を文字らしい領域と見な
し、名刺画像を分類するための特徴量の1つとして2値
画像メモリ5232内の有効な連結成分の数を計算し、
有効な連結成分数メモリ5239に記憶する。さらにス
テップS609において、制御装置521は2値画像メ
モリ5232内の有効な連結成分の並び方の特徴量を抽
出する。有効な連結成分の並び方の特徴量としては、た
とえばこの発明の第4の実施例で述べられているような
有効な連結成分の特定方向への並び方の集中度や入力画
像の微分画像の濃度投影ヒストグラムの微分値の平均値
など名刺画像の性質がよく現れる特徴量が用いられる。
刺画像かどうかを判断するために、制御装置521はま
ず有効な連結成分数がしきい値以下であるかどうかを調
べる。名刺画像では文字数が少ないため、有効な連結成
分数も少なくなる。ここで有効な連結成分数がしきい値
以下でない場合は(ステップS610でNO)、ステッ
プS614において入力画像は名刺画像でないと判断さ
れる。
(ステップS610でYES)は、ステップS611で
続いて有効な連結成分の並び方の特徴量を所定のしきい
値と比較する。所定のしきい値はROM522に記憶し
ておいてもよいし、外部からユーザが指定できるように
してもよい。また比較する特徴量は単独でも複数の特徴
量の組合せでもよい。比較する特徴量に対応して所定の
しきい値も単独または複数のしきい値の組合せが用いら
れ、文書画像が満たすべきしきい値条件が設定される。
それらの処理手順はROM522に記憶される。
1は特徴量と所定のしきい値との比較の結果、その入力
画像が名刺画像であるための条件を満たしているかどう
かを判断する。条件を満たしている場合(S612でY
ES)はその入力画像は名刺画像であると判断され、そ
うでない場合(ステップS612でNO)にはその入力
画像は名刺画像でないと判断される。
置521は入力画像を画像データベース装置53に登録
するが、その際に名刺画像であると判断された画像には
「名刺画像」というキーワード(属性)が付与され、入
力画像データとともに画像データベース装置53に登録
される。これにより各画像の検索時の処理時には与えら
れた名刺という属性が利用できる。
い領域の数とその並び方を調べて画像全体で名刺画像が
満たすべき条件に合っているかどうかを判断することに
より、文字の数が少なく行間が広く開いているという名
刺画像の特徴をうまく抽出し精度よく分類することがで
きる。
文字認識を適用することなどにより自動的に住所録を作
成するなどの応用が可能になる。
像データは多値画像データとしたが2値画像データを入
力するようにしてもよい。
を文書画像とそれ以外に分類することができる。
1の効果に加え、判定精度の高い画像分類を行なうこと
ができる。
1の効果に加え、判定精度の高い画像分類を行なうこと
ができる。
名刺画像とそれ以外に分類することができる。
4の効果に加え、さらに判定精度の高い画像分類を行な
うことができる。
5の効果に加え、さらに判定精度の高い画像分類を行な
うことができる。
6の効果に加え、さらに判定精度の高い画像分類を行な
うことができる。
4または7の効果に加え、さらに判定精度の高い画像分
類を行なうことができる。
1から5ならびに7および8のいずれかの効果に加え、
対象物を表わす隣接した複数の画素のうち所定の条件を
満たす画素を連結成分として識別するので、判定精度を
さらに高めることができる。
システム構成を示すブロック図である。
ローチャートである。
ある。
る。
タの座標系について説明するための図である。
するための図である。
ついて説明するための図である。
示す図である。
ある。
の図である。
示す図である。
されている状態を示す図である。
連結成分を示す図である。
処理を施すためのデータについて説明するための図であ
る。
るための第1の図である。
るための第2の図である。
画像メモリ1232に記録されている状態を示す図であ
る。
分が微分2値画像メモリ1234に記録されている状態
を示す図である。
での図19と同じ連結成分を説明するための図である。
画像メモリ1232に記録されている状態を示す図であ
る。
分が微分2値画像メモリ1234に記録されている状態
を示す図である。
での図23と同じ連結成分を説明するための図である。
るための図である。
の装置構成を示すブロック図である。
置が行なう処理について示すフローチャートである。
す図である。
ータの一例を示す図である。
明するための図である。
の処理を説明するための図である。
のシステム構成を示すブロック図である。
の制御装置521が行なう処理を示すフローチャートで
ある。
である。
点の処理の具体的ルーチンを示すフローチャートであ
る。
態で注目している重心点の右下に他の重心点が見つかっ
た状態を示す図である。
いて説明するための図である。
例について説明するための図である。
ヒストグラム微分値メモリ5240について説明するた
めの図である。
説明するための図である。
分濃度投影ヒストグラムの微分値の平均値について説明
するための図である。
濃度投影ヒストグラムについて説明するための図であ
る。
軸方向の濃度投影ヒストグラムについて説明するための
図である。
理を示すフローチャートである。
Claims (9)
- 【請求項1】 入力された画像データの中から対象物を
表わす隣接した複数の画素よりなる連結成分を識別する
識別手段と、 前記入力された画像データの中の前記連結成分の形状か
ら文字らしさを表わす特徴量を抽出する抽出手段と、 前記抽出された特徴量に基づいて、前記入力された画像
データが文書画像か否かを判別する判別手段とを備え
た、画像分類装置。 - 【請求項2】 前記入力された画像データは濃淡画像デ
ータよりなり、 前記抽出手段は、前記入力された濃淡画像データからエ
ッジの強いデータ領域を検出するエッジ検出手段を含
み、 前記連結成分の面積と、前記連結成分と前記データ領域
との重なり領域の面積とから前記特徴量を抽出する、請
求項1に記載の画像分類装置。 - 【請求項3】 前記抽出手段は、前記連結成分の各々に
対する外接矩形の面積を算出する算出手段を含み、 前記連結成分の面積と前記外接矩形の面積とから前記特
徴量を抽出する、請求項1に記載の画像分類装置。 - 【請求項4】 入力された画像データの中から対象物を
表わす隣接した複数の画素よりなる連結成分を識別する
識別手段と、 前記連結成分の数を特徴量として計測する計測手段と、 前記計測された特徴量に基づいて、前記入力された画像
データが名刺画像か否かを判別する判別手段とを備え
た、画像分類装置。 - 【請求項5】 入力された画像データの中から対象物を
表わす隣接した複数の画素よりなる連結成分を識別する
識別手段と、 前記識別された連結成分を最隣接する2つの連結成分ご
とに分け、前記分けられた2つの連結成分ごとの並び方
向を抽出する方向抽出手段と、 前記抽出された並び方向の特定の範囲の方向への集中度
を特徴量として計測する計測手段と、 前記計測された特徴量に基づいて、前記入力された画像
データが名刺画像か否かを判別する判別手段とを備え
た、画像分類装置。 - 【請求項6】 入力された画像データから微分画像デー
タを作成する微分画像データ作成手段と、 前記微分画像データに基づいて、濃度投影ヒストグラム
を作成する濃度投影ヒストグラム作成手段と、 前記作成された濃度投影ヒストグラムから特徴量を計算
する計算手段と、 前記計算された特徴量に基づいて、前記入力された画像
データが名刺画像か否かを判別する判別手段とを備え
た、画像分類装置。 - 【請求項7】 前記識別された連結成分を最隣接する2
つの連結成分ごとに分け、前記分けられた2つの連結成
分ごとの並び方向を抽出する方向抽出手段と、 前記抽出された並び方向の特定の範囲の方向への集中度
を特徴量として計測する計測手段とをさらに備え、 前記特徴量は前記特定の範囲の方向への集中度を含む、
請求項4に記載の画像分類装置。 - 【請求項8】 前記入力された画像データから微分画像
データを作成する微分画像データ作成手段と、 前記微分画像データに基づいて、濃度投影ヒストグラム
を作成する濃度投影ヒストグラム作成手段と、 前記作成された濃度投影ヒストグラムの微分値に基づく
データを計算する計算手段とをさらに備え、 前記特徴量は前記濃度投影ヒストグラムの微分値に基づ
くデータを含む、請求項4または7に記載の画像分類装
置。 - 【請求項9】 前記識別手段は、前記入力された画像デ
ータの中から対象物を表わす隣接した複数の画像のうち
所定の条件を満たす画素を前記連結成分として識別す
る、請求項1から5ならびに7および8のいずれかに記
載の画像分類装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06325282A JP3113785B2 (ja) | 1994-12-27 | 1994-12-27 | 画像分類装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06325282A JP3113785B2 (ja) | 1994-12-27 | 1994-12-27 | 画像分類装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000242126A Division JP3488678B2 (ja) | 2000-08-10 | 2000-08-10 | 画像分類装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08185477A true JPH08185477A (ja) | 1996-07-16 |
JP3113785B2 JP3113785B2 (ja) | 2000-12-04 |
Family
ID=18175079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06325282A Expired - Lifetime JP3113785B2 (ja) | 1994-12-27 | 1994-12-27 | 画像分類装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3113785B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001147990A (ja) * | 1999-11-24 | 2001-05-29 | Sharp Corp | 画像データ処理装置及び方法並びにこれに利用される記憶媒体 |
JP2005309772A (ja) * | 2004-04-21 | 2005-11-04 | Omron Corp | 文字成分抽出装置 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8602722B2 (en) | 2010-02-26 | 2013-12-10 | General Electric Company | System and method for inspection of stator vanes |
US8587660B2 (en) | 2010-07-30 | 2013-11-19 | General Electric Company | Image recording assemblies and coupling mechanisms for stator vane inspection |
-
1994
- 1994-12-27 JP JP06325282A patent/JP3113785B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001147990A (ja) * | 1999-11-24 | 2001-05-29 | Sharp Corp | 画像データ処理装置及び方法並びにこれに利用される記憶媒体 |
JP2005309772A (ja) * | 2004-04-21 | 2005-11-04 | Omron Corp | 文字成分抽出装置 |
Also Published As
Publication number | Publication date |
---|---|
JP3113785B2 (ja) | 2000-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6839466B2 (en) | Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding | |
USRE47889E1 (en) | System and method for segmenting text lines in documents | |
JP3748164B2 (ja) | パターン抽出装置 | |
US5452374A (en) | Skew detection and correction of a document image representation | |
JP3264932B2 (ja) | テキストを含む画像における背景から前景を分離する方法及び装置 | |
Parker et al. | An approach to license plate recognition | |
US5335290A (en) | Segmentation of text, picture and lines of a document image | |
US6704456B1 (en) | Automatic image segmentation in the presence of severe background bleeding | |
KR20010110416A (ko) | 비디오 스트림 분류가능 심볼 고립 방법 및 시스템 | |
JPH05225378A (ja) | 文書画像の領域分割システム | |
CN111259893A (zh) | 一种基于深度学习的智能工具管理方法 | |
JP3606500B2 (ja) | 矩形分類方法 | |
CN114495141A (zh) | 文档段落位置提取方法、电子设备及存储介质 | |
JP3488678B2 (ja) | 画像分類装置 | |
JP3113785B2 (ja) | 画像分類装置 | |
JP3544324B2 (ja) | 文字列情報抽出装置及び方法及びその方法を記録した記録媒体 | |
JP3165589B2 (ja) | 画像分類装置 | |
EP0702320A1 (en) | Skew detection | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
JP4409713B2 (ja) | 文書画像認識装置及び記録媒体 | |
JP2861860B2 (ja) | 宛名行抽出装置 | |
JP2003216958A (ja) | 多角形検出装置、多角形検出方法及び多角形検出プログラム | |
JP2001043312A (ja) | 文書画像処理装置 | |
JP3220226B2 (ja) | 文字列方向判別方法 | |
JP3100825B2 (ja) | 線認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000912 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080922 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080922 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090922 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090922 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100922 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110922 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120922 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130922 Year of fee payment: 13 |
|
EXPY | Cancellation because of completion of term |