JP3460516B2 - 画像内オブジェクト抽出方法及び画像内オブジェクト抽出プログラムを格納した記憶媒体 - Google Patents
画像内オブジェクト抽出方法及び画像内オブジェクト抽出プログラムを格納した記憶媒体Info
- Publication number
- JP3460516B2 JP3460516B2 JP18405197A JP18405197A JP3460516B2 JP 3460516 B2 JP3460516 B2 JP 3460516B2 JP 18405197 A JP18405197 A JP 18405197A JP 18405197 A JP18405197 A JP 18405197A JP 3460516 B2 JP3460516 B2 JP 3460516B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- label
- area
- areas
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Image Analysis (AREA)
Description
ト抽出方法及び画像内オブジェクト抽出プログラムを格
納した記憶媒体に係り、特に、画像認識や画像に対する
検索を行うマルチメディアシステムにおいて、画像内オ
ブジェクトを抽出するための画像内オブジェクト抽出方
法及び画像内オブジェクト抽出プログラムを格納した記
憶媒体に関する。
セグメンテーションによる方法が行われており、以下の
ような手法がある。 画素結合法:注目している小領域とそれに隣接する
小領域の類似度が、ある閾値kより小さい場合、領域を
統合する。これを繰り返し、画像全体の領域分割を行
う。
つの長方形に分け、各長方形内の画素の複雑度が、ある
閾値k以下になった場合、領域の分割を停止する。 ヒストグラム法:画素の色等について、出現回数等
のヒストグラムを作成し、ヒストグラムの形状により画
素を分類する。固定2分割の場合には、判別分析法等に
よる閾値決定が有効で、白黒図面内の線の抽出等に用い
られる。
特徴量で表現し、そのクラスタリングを行う。 モデルマッチング法:予め認識対象に関する辞書を
作成しておき、その辞書に従って画像内のオブジェクト
を推定する。
の画素結合法は、閾値の決定が困難であるという問題が
ある。また、の4分木法は、閾値の決定が困難である
ことと、領域形状が長方形であるため、領域形状に柔軟
性がない。
ー画像の場合の閾値決定が困難であり、さらに、ヒスト
グラム上での分類結果を元画像に還元したときに、領域
とならない場合がある。また、のクラスタリング法
は、特徴を何にすればよいかが分からないと共に、線形
分離不能な場合の精度が悪いという問題がある。さら
に、領域とならない場合がある。
品等、形状が幾何学的で、辞書が作りやすいものに限定
されるため、汎用的な手法とは言えない。上記のよう
に、従来のからの方法は、あくまでセグメンテーシ
ョンであり、オブジェクト候補の領域上で重複を許さな
いため、閾値のほんの少しのズレがオブジェクト抽出精
度を大きく左右し、一般の写真に対する適用が困難であ
る。
(2値画像、線画、地図、機械部品)からのオブジェク
ト抽出については従来の技術で可能になってきたが、任
意の写真に対する技術(例えば、町中の中の人混みの写
真の中から、人の顔や商品をオブジェクトとして抜き出
す技術)は存在しない。本発明は、上記の点に鑑みなさ
れたもので、一般の写真から高精度(再現率と適合率が
高い)の画像内オブジェクトを抽出することが可能な画
像内オブジェクト抽出方法及び画像内オブジェクト抽出
プログラムを格納した記憶媒体を提供することを目的と
する。
説明するための図である。本発明は、画像認識や画像に
対する検索を行うマルチメディアにおいて、画像内オブ
ジェクトを抽出する画像内オブジェクト抽出方法におい
て、階調エッジ画像(画素値は0〜MAX_EDG)の
入力に対し、階調エッジ画像の0の値の画素に対してラ
ベル付けを行い(ステップ1)、ラベル画像を作成し
(ステップ2)、画素値e=1〜MAX_EDGに対し
て、画像上で値eをとる各連続領域Eeに対して、階調
エッジ画像上の連続領域Eeに対応するラベル画像上の
領域Leを求め(ステップ3)、ラベル画像上で領域L
eに隣接する領域の個数Cを求め(ステップ4)、個数
Cによって、C=0の場合、新たなラベル番号Lmax
を生成し、ラベル画像上の領域Leのラベル番号をLm
axとし、個数C=1の場合、領域Leの近接領域のラ
ベル番号をL1としたとき、ラベル画像上の領域Leと
ラベル番号L1の領域を統合し、個数C≧2の場合、領
域Leの近接領域のラベル番号をL1〜Lcとしたと
き、各ラベル領域をL1〜Lcのそれぞれをオブジェク
トとして出力し、ラベル画像上の領域Leとラベル番号
L1〜Lcの領域を統合する(ステップ5)。
際に、既に出力した各オブジェクトに比較して、オブジ
ェクトの外接矩形が同一の場合、オブジェクトの外接矩
形の2つの頂点が同一でかつ、オブジェクトの外接矩形
の面積の増加率が定数k%以下の場合の少なくともいず
れか1つに該当する場合に、既に出力済のオブジェクト
を削除する。
行うマルチメディアにおいて、画像内オブジェクトを抽
出する画像内オブジェクト抽出プログラムを格納した記
憶媒体であって、階調エッジ画像(画素値は0〜MAX
_EDG)の入力に対し、階調エッジ画像の0の値の画
素に対してラベル付けを行い、ラベル画像を作成するラ
ベル画像作成プロセスと、画素値e=1〜MAX_ED
Gに対して、画像上で値eを取る各連続領域Eeに対し
て、階調エッジ画像上の連続領域Eeに対応するラベル
画像上のLeを求め、ラベル画像上でLeに隣接する領
域の個数Cを求め、個数Cによって、C=0の場合、新
たなラベル番号Lmaxを生成し、ラベル画像上の領域
Leのラベル番号をLmaxとするラベル番号付与プロ
セスと、個数C=1の場合、領域Leの近接領域のラベ
ル番号をL1としたとき、ラベル画像上の領域Leとラ
ベル番号L1の領域を統合する第1の統合プロセスと、
個数C≧2の場合、領域Leの近接領域のラベル番号を
L1〜Lcとしたとき、各ラベル領域をL1〜Lcのそ
れぞれをオブジェクトとして出力し、ラベル画像上の領
域Leとラベル番号L1〜Lcの領域を統合する第2の
統合プロセスとを有する。
いて、オブジェクトを出力する際に、既に出力した各オ
ブジェクトに比較して、オブジェクトの外接矩形が同一
の場合、オブジェクトの外接矩形の2つの頂点が同一で
かつ、オブジェクトの外接矩形の面積の増加率が定数k
%以下の場合の少なくともいずれか1つに該当する場合
に、既に出力済のオブジェクトを削除する削除プロセス
を含む。
ジ画像から上記に示した手順により画像内からオブジェ
クトを抽出するものである。本発明では、再現率(モレ
の少なさ)を高めるために、複数の認識候補を許し、さ
らに、閾値に依存しないオブジェクト抽出方法を与える
ことを基本としている。また、上記の後処理として、出
力されたオブジェクトに比較して、オブジェクトの外接
矩形が同一、または、オブジェクトの外接矩形の2つの
頂点が同一であり、オブジェクトの外接矩形の面積の増
加率が定数k%以下の場合に、既に出力されているオブ
ジェクトを削除することにより、適合率(ノイズの少な
さ)を高める。
ためのフローチャートである。 ステップ101) 階調エッジ画像(画素値は0〜MA
X_EDG)を入力する。 ステップ102) 階調エッジ画像の0の値の画素に対
してラベリングを行い、ラベル画像(1〜MAX_LB
L)を作成する。
X_EDGについて以下を繰り返し、ステップ104以
降の繰り返しが終了したら処理を終了する。 ステップ104) エッジ画像上で値eの各連続領域E
eについて以下を繰り返し、繰り返しが終了したらステ
ップ103に移行する。 ステップ105) エッジ画像上のEe領域に対応する
ラベル画像上の領域Leを求める。
域の個数Cを求め、その値で処理分岐する。処理分岐は
以下の通りである。 ステップ107) C=0の場合には、新たなラベル番
号Lmaxを生成し、ステップ108に移行する。 ステップ108) ラベル上の領域Leをラベル番号L
maxとし、ステップ104に移行する ステップ109) C=1の場合には、その隣接領域の
ラベル番号をL1とし、ステップ110に移行する。
eとラベル番号L1の領域の統合を行い、ステップ10
4に移行する。 ステップ111) C≧2の場合には、その隣接領域の
ラベル番号をL1〜Lcとし、ステップ112に移行す
る。 ステップ112) 各ラベル領域L1〜Lcをオブジェ
クトとして出力し、ステップ113に移行する。
eとラベル番号L1〜Lnの領域を統合し、ステップ1
04に移行する。
る。 [第1の実施例]図3は、本発明の第1の実施例の適用
例を示す。想定する濃淡エッジ画像を5段階の階調(0
〜4)を持つものとする。
ない領域を画素数が0の領域(A,B,C,D)と考
え、各領域にラベル(A=1,B=2,C=3,D=
4)を付与する。 ステップ202) 階調“1”の領域(E,F,G)を
求め、各々に隣接するラベル番号を求め、その個数によ
ってそれぞれの処理を行う。領域Eに隣接するラベル
は、1,2なので、それに対応する領域A,Bをオブジ
ェクトとして出力し、A,B,Eの領域を統合する。こ
こでは、その統合後の領域のラベルをそれらの最小値の
1とする。領域Fに隣接するラベルはないので、新たな
ラベル番号“5”をその領域のラベル番号とする。領域
Gに隣接するラベルは、“4”のみなので、Gの領域の
ラベル番号も“4”とする。
(H,I,J,K)を求め、各々に隣接するラベル番号
を求め、その個数によってそれぞれの処理を行う。領域
H,I,Jに隣接するラベルは、“3”、“4”、
“5”なので、それに対応する領域C,D+G,Fをオ
ブジェクトとして出力し、C,D+G,F,Kの領域を
統合する。ここでは、その統合後の領域のラベルをそれ
らの最小値の“3”とする。
(L)を求め、各々に隣接するラベル番号を求め、その
個数によってそれぞれの処理を行う。領域Lに隣接する
ラベルは、“1”、“3”なので、それに対応する領域
A+B+E+H+I+J,C+D+F+G+Kをオブジ
ェクトとして出力し、3つの領域を統合する。ここで
は、その統合後の領域ラベルをそれらの最小値の1とす
る。
+B+E+H+I+J,C+D+F+G+Kの出力が得
られた。 [第2の実施例]上記の第1の実施例に示した出力のよ
うな場合において、個々の領域の外接矩形が同一の場
合、または、外接矩形の2つの頂点が同一で面積の増加
率が定数k%以下の場合に、先に出力したオブジェクト
を無効にすると、類似オブジェクトの出力が抑止でき、
精度が向上する。
Uが存在する場合、領域S,T,Uの順に統合された場
合には、出力は、S+T+Uの領域のみとなる。一方、
領域がS,U,Tの順に統合された場合には出力は、
S,U,S+T+Uとなる。ここで、Sの領域をオブジ
ェクトの候補から除外するために、S+T+Uを出力し
たとき、すでに出力した領域と外接矩形の比較を行い、
それが一致する場合、または、外接矩形の2頂点が一致
し、その面積の増加が定数k%以下の場合には、既に出
力したその領域をオブジェクト候補から除外する。
際の写真に適用した例を説明する。図5(A)は、カラ
ーの元画像(但し、出願の規定により実際の図面は白黒
(別途提出の資料参照))であり、(B)は、上記から
HSI色形のエッジを取得し、合成した256階調のエ
ッジ画像を入力として処理した場合に、図5(C)の0
と0以外の画素で2値化を行っているが、所定の閾値k
未満、k以上のように特定の値で2値化を行っても全く
同様である。この画像の0(エッジ以外)の領域に対し
てラベリングを行い、各連続領域毎に異なる番号(1〜
MAX_LBL)を付与した結果がラベル画像となる。
ラベル画像上でラベルでない領域は0の値とする。
ラベル領域にならない処理が行われている。図5(D)
は、ラベル画像の異なる番号に異なる色を与え、視覚化
した例である。これに対して対象エッジを1〜256ま
で変化させながら、ラベルの統合を行いつつ、統合直前
のオブジェクトの出力を行っていった結果が図5(E)
である。同図の左上から順に右下に向かってオブジェク
トが生成された。中央の3つのモモのエッジは、図5
(B)で見ると明確ではなく、従来の方法でそのエッジ
の閾値を決定することは難しかったが、図5(E)の1
(第1段目左から1番目)、2(第1段目左から2番
目)、4(第1段目左から4番目)のように個々のモモ
が抽出できている。
たが、全般に有効な結果が得られた。 [第4の実施例]図6は、本発明の第4の実施例を説明
するための図(その1)である。同図に示す例の画像は
難易度が高く、左側の男性の頭部を背景から完全に切り
離せてはいない。
ための図(その2)である。同図は、より大きな画像に
対して適用した結果である。なお、上記の各実施例の動
作をプログラムとして構築し、類似画像検索システムに
用いるコンピュータに接続されるディスク装置等に蓄積
し、画像内からオブジェクトを抽出する処理に適応する
ことが可能である。
ディスクやCD−ROM等の記憶媒体に格納し、画像内
からオブジェクトを抽出する端末にインストールして利
用することも可能である。なお、本発明は、上記の実施
例に限定されることなく、特許請求の範囲内で種々変更
・応用が可能である。
写真から高精度(再現率と適合率が高い)の画像内オブ
ジェクトを抽出することが可能である。その抽出過程に
おいて、特定の辞書や特定の閾値に依存することがな
く、安定した抽出が可能である。これにより、例えば、
図8に示すようなオブジェクト抽出に基づいた画像検索
システムの構築が可能となる。図8に示す類似画像検索
システムは、登録データ画像を「登録データ画像の入力
部」から、「画像からの図形抽出部」に登録しておき、
「キー画像の入力部」からキー画像が入力されると、当
該「画像からの図形の抽出部」において、抽出された図
形を「図形情報のヒストグラム作成部」に出力すること
ができる。これにより、キー図形が入力されると、ヒス
トグラム間の類似度算出部において、類似度を求め、類
似図形を含む画像を検索して類似図形を出力することが
可能となる。
である。
る。
の1)である。
の2)である。
ある。
Claims (4)
- 【請求項1】 画像認識や画像に対する検索を行うマル
チメディアにおいて、画像内オブジェクトを抽出する画
像内オブジェクト抽出方法において、 階調エッジ画像(画素値は0〜MAX_EDG)の入力
に対し、 階調エッジ画像の0の値の画素に対してラベル付けを行
い、 ラベル画像を作成し、 画素値e=1〜MAX_EDGに対して、 画像上で値eを取る各連続領域Eeに対して、 階調エッジ画像上の連続領域Eeに対応するラベル画像
上のLeを求め、 前記ラベル画像上で前記Leに隣接する領域の個数Cを
求め、 前記個数Cによって、C=0の場合、 新たなラベル番号Lmaxを生成し、 前記ラベル画像上の領域Leのラベル番号をLmaxと
し、 前記個数C=1の場合、 前記領域Leの近接領域のラベル番号をL1としたと
き、 前記ラベル画像上の領域Leとラベル番号L1の領域を
統合し、 前記個数C≧2の場合、 前記領域Leの近接領域のラベル番号をL1〜Lcとし
たとき、 各ラベル領域をL1〜Lcのそれぞれをオブジェクトと
して出力し、 前記ラベル画像上の領域Leとラベル番号L1〜Lcの
領域を統合することを特徴とする画像内オブジェクト抽
出方法。 - 【請求項2】 前記オブジェクトを出力する際に、 既に出力した各オブジェクトに比較して、 オブジェクトの外接矩形が同一の場合、オブジェクトの
外接矩形の2つの頂点が同一でかつ、オブジェクトの外
接矩形の面積の増加率が定数k%以下の場合の少なくと
もいずれか1つに該当する場合に、既に出力済のオブジ
ェクトを削除する請求項1記載の画像内オブジェクト抽
出方法。 - 【請求項3】 画像認識や画像に対する検索を行うマル
チメディアにおいて、画像内オブジェクトを抽出する画
像内オブジェクト抽出プログラムを格納した記憶媒体で
あって、 階調エッジ画像(画素値は0〜MAX_EDG)の入力
に対し、階調エッジ画像の0の値の画素に対してラベル
付けを行い、ラベル画像を作成するラベル画像作成プロ
セスと、 画素値e=1〜MAX_EDGに対して、 画像上で値eを取る各連続領域Eeに対して、 階調エッジ画像上の連続領域Eeに対応するラベル画像
上のLeを求め、 前記ラベル画像上で前記Leに隣接する領域の個数Cを
求め、 前記個数Cによって、C=0の場合、 新たなラベル番号Lmaxを生成し、 前記ラベル画像上の領域Leのラベル番号をLmaxと
するラベル番号付与プロセスと、 前記個数C=1の場合、 前記領域Leの近接領域のラベル番号をL1としたと
き、 前記ラベル画像上の領域Leとラベル番号L1の領域を
統合する第1の統合プロセスと、 前記個数C≧2の場合、 前記領域Leの近接領域のラベル番号をL1〜Lcとし
たとき、 各ラベル領域をL1〜Lcのそれぞれをオブジェクトと
して出力し、 前記ラベル画像上の領域Leとラベル番号L1〜Lcの
領域を統合する第2の統合プロセスとを有することを特
徴とする画像内オブジェクト抽出プログラムを格納した
記憶媒体。 - 【請求項4】 前記第2の統合プロセスにおいて、オブ
ジェクトを出力する際に、 既に出力した各オブジェクトに比較して、 オブジェクトの外接矩形が同一の場合、オブジェクトの
外接矩形の2つの頂点が同一でかつ、オブジェクトの外
接矩形の面積の増加率が定数k%以下の場合の少なくと
もいずれか1つに該当する場合に、既に出力済のオブジ
ェクトを削除する削除プロセスを含む請求項3記載の画
像内オブジェクト抽出プログラムを格納した記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18405197A JP3460516B2 (ja) | 1997-07-09 | 1997-07-09 | 画像内オブジェクト抽出方法及び画像内オブジェクト抽出プログラムを格納した記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18405197A JP3460516B2 (ja) | 1997-07-09 | 1997-07-09 | 画像内オブジェクト抽出方法及び画像内オブジェクト抽出プログラムを格納した記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1125271A JPH1125271A (ja) | 1999-01-29 |
JP3460516B2 true JP3460516B2 (ja) | 2003-10-27 |
Family
ID=16146524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP18405197A Expired - Lifetime JP3460516B2 (ja) | 1997-07-09 | 1997-07-09 | 画像内オブジェクト抽出方法及び画像内オブジェクト抽出プログラムを格納した記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3460516B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6922485B2 (en) * | 2001-12-06 | 2005-07-26 | Nec Corporation | Method of image segmentation for object-based image retrieval |
-
1997
- 1997-07-09 JP JP18405197A patent/JP3460516B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH1125271A (ja) | 1999-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6263113B1 (en) | Method for detecting a face in a digital image | |
US20120163708A1 (en) | Apparatus for and method of generating classifier for detecting specific object in image | |
US20190019052A1 (en) | Text Region Detection in Digital Images using Image Tag Filtering | |
CN110659644B (zh) | 书法单字的笔画自动提取方法 | |
JPH03260787A (ja) | テキスト又は線図形を識別する方法及びデジタル処理システム | |
TWI637325B (zh) | 使用多顏色通道無記號偵測之便箋辨識與管理 | |
JPH05225378A (ja) | 文書画像の領域分割システム | |
JP2000207489A (ja) | 文字抽出方法、装置および記録媒体 | |
Sravani et al. | Robust detection of video text using an efficient hybrid method via key frame extraction and text localization | |
JPH05166002A (ja) | ソース画像を分析する方法 | |
Chan et al. | Image matching using run-length feature | |
JP3460516B2 (ja) | 画像内オブジェクト抽出方法及び画像内オブジェクト抽出プログラムを格納した記憶媒体 | |
US7336825B2 (en) | Segmenting a composite image via minimum areas | |
Rampurkar et al. | An approach towards text detection from complex images using morphological techniques | |
JP6151908B2 (ja) | 学習装置、識別装置、およびそのプログラム | |
Vu et al. | Automatic extraction of text regions from document images by multilevel thresholding and k-means clustering | |
JP3113785B2 (ja) | 画像分類装置 | |
CN117037049B (zh) | 基于YOLOv5深度学习的图像内容检测方法及系统 | |
Ablameyko et al. | Automatic map digitising: problems and solution | |
Tian et al. | Interactive foreground segmentation method using mean shift and graph cuts | |
JP2001043312A (ja) | 文書画像処理装置 | |
EP1439485B1 (en) | Segmenting a composite image via basic rectangles | |
Vu et al. | Extraction of text regions from complex background in document images by multilevel clustering | |
Kumar et al. | Layout Analysis of Punjabi Newspapers Using Contour Detection and Deep Learning-Based Model | |
Kataria et al. | Review on text detection and recognition in images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080815 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080815 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090815 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090815 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100815 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100815 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110815 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120815 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130815 Year of fee payment: 10 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |