JPH07121710A - 画像セグメンテーション方法及び装置 - Google Patents

画像セグメンテーション方法及び装置

Info

Publication number
JPH07121710A
JPH07121710A JP5291285A JP29128593A JPH07121710A JP H07121710 A JPH07121710 A JP H07121710A JP 5291285 A JP5291285 A JP 5291285A JP 29128593 A JP29128593 A JP 29128593A JP H07121710 A JPH07121710 A JP H07121710A
Authority
JP
Japan
Prior art keywords
contour
pixel
designated
image segmentation
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5291285A
Other languages
English (en)
Inventor
Makoto Kato
誠 加藤
Shinichiro Miyaoka
伸一郎 宮岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5291285A priority Critical patent/JPH07121710A/ja
Publication of JPH07121710A publication Critical patent/JPH07121710A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】切り出したい対象や背景が一様な色や濃度でな
い場合、あるいは検出したエッジの候補が多数表れたり
とぎれたりする場合でも、対象とする物の輪郭を正確に
抽出できる画像セグメンテーション方法および装置を提
供することを目的とする。 【構成】ディジタル的に表現された画像データ中の対象
物の輪郭上の一画素を始めに外部から指定し、その画素
またはそれまでに決定された輪郭上の最後の画素から対
象物の輪郭の探索を行なう方向を外部から指定し、始め
に指定された画素またはそれまでに決定された輪郭上の
最後の画素から、前記指定された方向に、対象物の輪郭
を探索し決定するようにして、対象物の切り出しを行
う。 【効果】エッジ成分の複雑な画像中から、物体領域の輪
郭を外部からの入力従い、効率的に切り出すことができ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、デザインシミュレーシ
ョン等に必要な、画像情報中から特定の部位を切り出
す、画像セグメンテーション方法及びその装置に関す
る。
【0002】
【従来の技術】近年、店頭におけるプレゼンテーション
システム等、画像の豊かな表現力を用いたシステムの研
究、開発が盛んである。また、家電製品等のデザインシ
ミュレーションにおいては、画像情報を更に有効に利用
するため、背景合成、物体色変更等のイメージシミュレ
ーションが広く用いられている。
【0003】これらイメージシミュレーションを行うた
めには、画像中から特定の対象物を切り出す必要があ
る。このような画像中から対象物を切り出す技術を、画
像セグメンテーション技術という。例えば、街で撮影し
た車の画像から車の部分だけ分離することが、画像セグ
メンテーション技術である。切り出した車の画像を郊外
の風景に埋め込むのがイメージシミュレーションであ
る。
【0004】画像セグメンテーションを行う方法は、大
きく二つに分けられる。
【0005】第一の方法は、色情報を用いるものであ
る。これは、例えば、「O plusE」1989年1
月号第131頁から第142頁の「フルカラーイメージ
プロセッサSHAIPとその応用」(以下、公知例1と
呼ぶ)に記載されている。
【0006】この方法は、例えば赤い車を背景から分離
する際には、画像中の各画素の色が、ある範囲の赤い色
に入るかどうかの判定を行い、その結果で切り出す対象
であるかどうかの識別を行うものである。具体的には、
i行j列画素のRGB各成分の値をr(i,j),g(i,j),b(i,
j)とし、それぞれの成分における最小最大のしきい値を
それぞれΣrmin、Σrmax、Σgmin、Σgmax、Σbmin、Σ
bmaxとしたとき、次の範囲を切り出すという方法であ
る。
【0007】Σrmin<r(i,j)<Σrmax かつ Σgmin<g(i,j)<Σgmax かつ Σbmin<b(i,j)<Σbmax
【0008】この方法は、最も簡単な色情報を用いた画
像セグメンテーション方法であり、上記公知例1に記載
されているSHAIP(シャープ株式会社の商品名)な
ど各社で採用されている。この技術の特殊なものとし
て、クロマキー技術がある。クロマキー技術では、人物
等の切り出したい対象を、決まった色(緑など)の背景
板の前に配置させて画像を撮影する点に特徴がある。こ
の画像から、上述の決まった色以外の部分を切り出し対
象として上述の方法を適用すると、切り出したい対象物
の切り出しが行える。
【0009】第2の方法は、画像のエッジの情報、すな
わち、画像中の画素の値(色、明度など)の変化する部
分の情報を用いるものである。この方法は、画像中のシ
ーンの理解や認識のため研究されてきたものであり、例
えば、D. H. Ballard, C. B.Brown 著 Computer Visio
n, Prentice-Hall, Inc. 刊(1982)第4章 Bounda
ry Detection (以下、公知例2と呼ぶ)に述べられて
いる。
【0010】この方法は、基本的には、画像中の隣接す
る画素間の色や画像濃度の差の大きい所をエッジとして
求め、これをつなぐことにより輪郭を求める方法であ
る。ここで、「エッジ」とは画像中に存在するなんらか
の意味での線分を表し、「輪郭」とは画像中に存在する
物理的に意味のある物体の外形を表すものとする。物体
の全体が画像中に隠れず見えている場合には、輪郭は閉
曲線になるものである。エッジは、輪郭上にも、それ以
外にも数多く存在する。また逆に、後に述べるエッジ検
出オペレータのような通常の画像処理の技法では、輪郭
上の全てがエッジと認定されるわけではない。
【0011】エッジを求めるために用いられるエッジ検
出オペレータは、例えば次のような演算である。
【0012】白黒濃淡画像の場合、i,j画素の値(色
や明度等)をa(i,j) で表す。i方向が横方向に、j方
向が縦方向に対応する。
【0013】(1)一次微分 横方向 : a(i+1,j)-a(i,j), 縦方向 : a(i,j+1)-a(i,j), 絶対値 : (a(i+1,j)-a(i,j))の平方と(a(i,j+1)-a(i,j)) の平方の和の平方根 など。
【0014】(2)2次微分 横方向 : a(i+1,j)-2a(i,j)+a(i-1,j), 縦方向 : a(i,j+1)-2a(i,j)+a(i,j-1), 両方向 : a(i+1,j)+a(i-1,j)+a(i,j+1)+a(i,j-1)-4a(i,
j) など。ここで、最後の両方向のものを、特に、ラプラシ
アンということがある。
【0015】このような演算を画像中の全画素a(i,j)
について計算し、その計算結果が所定値より大きい画素
をエッジとして検出するのである。
【0016】ここでいう一次微分や二次微分は注目画素
の周辺の積和演算であり、数学的にはある配列をカーネ
ルとするコンボリューション演算を行っていることに相
当する。ただし、上に挙げたうち、1次微分の絶対値は
コンボリューション演算の結果に対して絶対値をとった
ものであり、コンボリューション演算そのままではな
い。ラプラシアンの場合を例にとると、このコンボリュ
ーション演算のカーネルは、次のような3行3列のもの
である。 0 1 0 1 −4 1 0 1 0
【0017】下に示すのは、注目する画素a(i,j)とその
周辺の画素とを、3行3列に並べたものである。上記の
コンボリューション演算のカーネルと下記の画素の行列
とを積和したものが、コンボリューション演算であるこ
とはいうまでもない。 a(i-1,j-1) a(i,j-1) a(i+1,j-1) a(i-1,j) a(i,j) a(i+1,j) a(i-1,j+1) a(i,j+1) a(i+1,j+1)
【0018】すなわち、上記ラプラシアンは下記の積和
演算を行ったものである。 0 ×a(i-1,j-1) + 1×a(i,j-1) + 0×a(i+1,j-1) + 1 ×a(i-1,j) + (-4) ×a(i,j) + 1 ×a(i+1,j) + 0 ×a(i-1,j+1) + 1×a(i,j+1) + 0×a(i+1,j+1)
【0019】この種のコンボリューション演算は、上述
の3行3列のものに限らず、自然数n、mに対して、n
行m列のものが存在し、エッジ抽出に適用可能であるこ
とが知られている。
【0020】以上のようにして、エッジ検出オペレータ
を用いたコンボリューション演算により、エッジを求め
ることができる。次に、これらのエッジをつないで、画
像中に存在する物理的に意味のある物体の外形である輪
郭を求める。
【0021】エッジをつなぐ方法としては、エッジ追跡
法が一般的である。この方法は、上記公知例2の第13
1ページから第137ページに示されている。エッジを
つなぐ方法は種々考案されているが、基本的に、画像中
の対象物体の輪郭上の1点を指定し、そこから周辺にエ
ッジのある方向を自動的に探索して、これを次々繋いで
いくことにより輪郭を求めるものである。
【0022】
【発明が解決しようとする課題】上記従来技術のうち、
公知例1の色情報を用いた方法は、単調な背景の中に色
が異なる物がある場合などでは、うまく切り出しが行え
る。しかし、切り出したい対象や背景が一様な色でない
場合には、適用が難しい。極端な例では、虹色に滑らか
に変化するグラデーションを背景とする物体を切り出す
ことができない。
【0023】また、上記従来技術のうち、公知例2のエ
ッジをつなぐ方法では、エッジを探索して次々につなぐ
処理を始めから終りまでコンピュータによる自動処理で
行っているため、つなぎ方がうまくいかないことが多
い。例えば、エッジの候補が多数表れたり、とぎれたり
する場合は、つなぎ方がうまくいかないことが多い。
【0024】本発明は、上述の従来例における問題点に
鑑み、切り出したい対象や背景が一様な色や濃度でない
場合、あるいは検出したエッジの候補が多数表れたりと
ぎれたりする場合でも、対象とする物の輪郭を正確に抽
出できる画像セグメンテーション方法及び装置を提供す
ることを目的とする。
【0025】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、ディジタル的に表現された画像データ中
から特定の対象物を切り出す画像セグメンテーション方
法であって、前記対象物の輪郭上の一画素を指定する第
1のステップと、前記指定された画素から前記対象物の
輪郭の探索を行なう方向を指定する第2のステップと、
前記第1のステップで指定された画素から前記第2のス
テップで指定された方向に、前記対象物の輪郭を探索し
決定する第3のステップとを備えたことを特徴とする。
【0026】また、ディジタル的に表現された画像デー
タ中から特定の対象物を切り出す画像セグメンテーショ
ン方法であって、前記対象物の輪郭上の一画素を外部か
ら指定する第1のステップと、前記第1のステップで指
定された画素またはそれまでに決定された輪郭上の最後
の画素から前記対象物の輪郭の探索を行なう方向を、外
部から、指定する第2のステップと、前記第1のステッ
プで指定された画素またはそれまでに決定された輪郭上
の最後の画素から、前記第2のステップで指定された方
向に、前記対象物の輪郭を探索し決定する第3のステッ
プとを備え、前記第2のステップおよび第3のステップ
を繰り返し実行することにより前記対象物を切り出すこ
とを特徴とする。
【0027】輪郭を探索する方向の決定は、第1のステ
ップで指定された画素またはそれまでに決定された輪郭
上の最後の画素の位置と、外部から指定された画素の位
置との関係をもって定めればよい。例えば、第1のステ
ップで指定された画素またはそれまでに決定された輪郭
上の最後の画素から、外部から指定された画素に向かう
方向をもって、輪郭を探索する方向とすればよい。
【0028】対象物の輪郭を探索し決定する前記第3の
ステップは、前記第2のステップで指定された方向に応
じて、その方向のエッジ成分を選択的に抽出するエッジ
検出オペレータを選択するステップと、前記第2のステ
ップで指定された方向に応じて、前記第1のステップで
指定された画素またはそれまでに逐次的に決定された輪
郭上の最後の画素から、次に決定される輪郭上の画素を
探索する方向を決定するとともに、該方向にある所定数
の画素を次に決定される輪郭上の画素の候補として挙げ
るステップと、前記候補の画素に対し、前記エッジ検出
オペレータを作用させるステップと、前記エッジ検出オ
ペレータを作用させた結果に基づいて、前記候補の画素
から、対象物の輪郭上の次の画素を決定するステップと
を備えるようにするとよい。
【0029】さらに、エッジを誤ってつないだときに
は、外部からの入力に応じて、逐次的に決定された前記
対象物の輪郭を未決定の状態に戻すステップを備えると
よい。また、本発明は、ディジタル的に表現された画像
データ中から特定の対象物を切り出す画像セグメンテー
ション装置であって、前記対象物の輪郭上の一画素を指
定するための第1の指定手段と、前記指定された画素か
ら前記対象物の輪郭の探索を行なう方向を指定するため
の第2の指定手段と、前記第1の指定手段で指定された
画素から前記第2の指定手段で指定された方向に、前記
対象物の輪郭を探索し決定する輪郭決定手段とを備えた
ことを特徴とする。
【0030】さらに、ディジタル的に表現された画像デ
ータ中から特定の対象物を切り出す画像セグメンテーシ
ョン装置であって、前記対象物の輪郭上の一画素を外部
から指定するための第1の指定手段と、前記第1の指定
手段で指定された画素またはそれまでに決定された輪郭
上の最後の画素から前記対象物の輪郭の探索を行なう方
向を、外部から、指定するための第2の指定手段と、前
記第1の指定手段で指定された画素またはそれまでに決
定された輪郭上の最後の画素から、前記第2の指定手段
で指定された方向に、前記対象物の輪郭を探索し決定す
る輪郭決定手段とを備えたことを特徴とする。
【0031】
【作用】上記構成によれば、それまでに逐次的に決定さ
れた最後の輪郭画素から次に決定される輪郭画素の探索
を行なう方向を外部から入力指定することにより、次に
探索すべきエッジの方向に関する情報をその都度指定す
ることが可能になる。したがって、輪郭を探索して決定
する処理に際して、その方向のエッジをより検出しやす
いエッジ検出オペレータを選択して用いることが可能に
なり、結果的に有効なエッジ探索が行われることにな
る。また、その方向指示を輪郭抽出の進行に従って細か
く指示できるから、複雑な輪郭形状に対応できる。ま
た、やりなおしの指示に対応して、一旦決定した輪郭を
元に戻すことができ、再び探索方向を指示することによ
り正しい輪郭抽出が可能になる。
【0032】
【実施例】以下、本発明の1実施例である画像セグメン
テーションシステムにつき、図1から図11を用いて説
明する。
【0033】最初に、本実施例の概要および目的を簡単
に説明しておく。本実施例のシステムは、図6のように
画面上に表示された画像中の対象物(この場合は車)の
輪郭を対話的に抽出するものである。本実施例では、粗
いおおざっぱな外部からの入力(人手を想定)による点
(P(k)等)に基づき、計算機処理により対象物に忠
実な輪郭(太線部)を抽出していく。なお、図6に図示
した画像は白黒が明確なもので濃淡がないが、これに限
らず、本発明は写真のような濃淡のある画像に適用して
好適である。
【0034】まず、本実施例のシステムのハードウェア
構成を説明する。図4は、本実施例のハ−ドウェア構成
図であって、通常のカラー画像表示が可能なワークステ
ーションやパーソナルコンピュータの構成を示したもの
である。
【0035】図4では、シングルバスアーキテクチャの
ものが示してあるがこれに限られるものではない。ま
た、本発明はネットワークにより互いに接続されている
コンピュータシステムで計算機資源を分散して実施する
ことも可能であり、本図面に示してあるスタンドアロン
コンピュータに限られるものではない。
【0036】この図中、主プロセッサ401は、主に主
記憶402を利用して演算などを実行する。画像や文字
などは、ディスプレイ405に表示される。その表示
は、ディスプレイコントローラ404が、フレームバッ
ファ403上に形成されたビットマップパターンを制御
することにより行う。
【0037】画像やプログラムなどの情報は、ハードデ
ィスク407に蓄えられているが、画像はイメージスキ
ャナ等の画像入力装置408から入力することもでき
る。ハードディスク407や画像入力装置は、入出力プ
ロセッサ406により制御される。また、外部からの命
令および指示は、キーボード409やマウス410から
入力される。また、これらの各部は、システムバス41
1で結合され、これを介してデータを交換する。
【0038】ここで、マウス410の機能について説明
する。
【0039】ディスプレイ405上には、マウス410
の位置に応じて小さな矢印等が表示される。そして、マ
ウス410を動かすことにより、操作者は、この矢印を
ディスプレイ405の画面上で自由に動かすことができ
る。また、マウス410上には、区別して用いることが
できる右ボタンと左ボタンの二つが設けられている。こ
れらのボタンを押すことにより、ディスプレイ405上
の画面中の矢印等の先の位置情報が得られ、本ハードウ
ェア上での応用ソフトウェアで用いることができる。以
下、この操作を「ピックする」と呼ぶことにする。
【0040】また、マウス410では、ボタンが押され
ているか押されていないかを区別することができるもの
とし、それぞれ、マウスON、マウスOFFの状態と呼
ぶ。なお、マウスには制御方法およびボタンの数など各
種のものがあり、上述のマウスに限定されるものではな
い。
【0041】ディスプレイ405上に表示される画像の
質については、縦横1000×1000画素程度、すな
わち1画面100万画素程度で、赤青緑それぞれ256
階調で合計1670万色程度のものが一般的であるの
で、本実施例でもこの程度の画質のものを用いる。しか
し、本発明は、これに限定されるものではない。画像入
力装置408もこれに対応できるものを用いる。
【0042】図5は、主に図4の主記憶402上に形作
られるところの、メモリの論理的構成図である。大きく
分けて、プログラムメモリ501とデータメモリ502
からなるが、計算機システムのオペレーションシステム
等の部分は除外してあり、本発明に関連する部分のみ示
してある。
【0043】プログラムメモリ501は、全体の処理の
流れを制御する全体制御部503、輪郭自動推定部50
4、および輪郭画像補間部505よりなる。輪郭自動推
定部504については、図3を参照して後に詳しく説明
する。輪郭画像補間部505については、図2を参照し
て後に詳しく説明する。
【0044】データメモリ502は、画像データ50
6、抽出される輪郭データ507、エッジ検出に用いら
れるエッジ検出オペレータのコンボリューションのカー
ネルパタンであるところのエッジオペレータのカーネル
データ508、および作業用の領域509よりなる。
【0045】図1は、本実施例のシステムの処理の流れ
図である。このうち、ステップ108では輪郭の自動推
定を行うが、その詳細は図2で説明する。また、ステッ
プ109は輪郭をマウスの画面上での移動軌跡そのもの
とする処理であり(ステップ108を「自動切り出し」
と呼ぶのに対して、このステップ109は「手動切り出
し」といえる)、その詳細は図3で説明する。
【0046】まず、ステップ101では処理対象の画像
を入力する。画像は、図5の画像データ506としてデ
ータメモリ502に格納される。その内容は、図4のデ
ィスプレイ405に表示される。
【0047】ステップ102では、探索の開始点となる
画素P(1)をマウスピック操作により指定する。すな
わち、マウス操作でカーソルを輪郭画素の上にもってい
き、左ボタンを押す操作をする。なお、本実施例では、
点の指定は左ボタン、動作の制御(ステップ113な
ど)は右ボタンを用いる。
【0048】ステップ103では、処理の制御パラメー
タの初期化を行う。ここで、使用される記号について、
まとめて説明する。kは外部からマウスにより入力され
る画素P(k)の番号、r(k)は第1番目の画素P
(1)から第k番目の画素P(k)までに抽出された輪
郭画素の総数である。
【0049】また、後のステップで用いるが、P(k)
を指定した際に新たに抽出された画素の個数をs(k)
とする。すなわち、s(1)+s(2)+・・・+s
(k)=r(k)である。ただし、s(1)=1とす
る。更に、Q(r(k))は、抽出された輪郭画素であ
る。操作者が指定した画素P(k)はとびとびである
が、Q(r(k))は連結している。また、P(k)お
よびQ(r(k))は、具体的には縦座標と横座標から
なり、それぞれ、(Pi(k),Pj(k)),(Qi
(r(k)),Qj(r(k)))を示す。P(k),
Q(r(k))は、図5の輪郭データ507として格納
される。その構造を、図7に示す。
【0050】ステップ103では、この他、ステップ1
07での判定のためのモードを自動モードに設定する。
モードとしては、自動モードと手動モードがある。自動
モードとは、操作者がマウスによりとびとびに画素を指
定したとき、それらの画素間の輪郭を自動的に探索して
決定するモードである。手動モードとは、操作者が指定
した画素を結ぶ直線を輪郭として決定するモードであ
る。
【0051】モードの設定は、具体的には、図5の作業
領域509にモード指定の変数をとっておき、例えば、
自動モードのときには1、手動モードのときには0と定
義しておき、これを書き替えることによって行う。この
モードは、ステップ115で変更されうる。
【0052】ステップ104では、新たに入力されるマ
ウス入力が右ボタンか左ボタンかを判定し、それに応じ
て分岐する。左ボタンが押された場合には、ステップ1
05からの輪郭画素の抽出処理に進む。右ボタンが押さ
れた場合には、ステップ112からのUNDO(やりな
おし)、モード変更などの動作制御に進む。なお、本ス
テップ104では、マウス入力が行われるまでは待機状
態にある。
【0053】まず、左ボタンが押された場合について説
明する。ステップ105では、指定画素の数kを1増加
する。ステップ106では、マウスの左ボタンを押した
時点のマウスカーソルの位置を取得し、図7の指定画素
P(k)に格納する。ステップ107では、その時点で
のモードが自動モードか手動モードかによって分岐す
る。
【0054】自動モードのときは、ステップ108で、
第k−1番目の指定画素P(k−1)と第k番目の指定
画素P(k)との間の輪郭画素s(k)個を自動抽出す
る。この処理の詳細は、図2を参照して後に詳しく説明
する。自動切り出しの後、ステップ110に進む。
【0055】ステップ107でモードが手動モードであ
ったときは、ステップ109に進むで手動切り出しを行
う。これは、第k−1番目の指定画素P(k−1)と第
k番目の指定画素P(k)をほぼ線分で結んだことに相
当する輪郭画素s(k)個を抽出する処理である。これ
については、図3を参照して後に詳しく説明する。手動
切り出しの後、ステップ110に進む。
【0056】ステップ110では、ステップ108また
はステップ109で新たに輪郭画素がs(k)個抽出さ
れたことにより、輪郭画素の総数r(k)にこれを加算
する。
【0057】ステップ111では、これまでに抽出され
た輪郭画素Q(1)からQ(r(k))までを表示す
る。この表示は、元の画像データの該当画素だけ色を変
える(黒にするなど)ことにより行う。例えば、図6の
画像であれば、×印で図示してある操作者が指定した画
素P(1),P(2),…,P(k),P(k+1)に
応じて抽出された輪郭画素が太線で表示されている。ス
テップ111の後、ステップ104に戻る。
【0058】ステップ104で右ボタンが押されたとき
には、ステップ112に進み、画面上に操作メニュー1
101が表示される。図11は、画面の右上に表示され
た操作メニュー1101を示す。操作メニュー1101
は、UNDOボタン1102、完了ボタン1103、モ
ードボタン1104、およびキャンセルボタン1105
の4個のボタンよりなる。これらの4個のボタンは、マ
ウスの右ボタンで指定される。
【0059】ステップ113では、操作メニュー110
1のどのボタンが押されたかを判別し、それに応じて分
岐する。
【0060】まず、UNDOボタンが指定されたとき
は、ステップ114に進み、指定画素の番号kを1減ら
す。すなわち、直前のP(k)の指定をなかったことに
する。そこからステップ111に進み、輪郭画素を表示
し、ステップ104に戻る。ステップ111の表示を行
う直前では、それまでに抽出された輪郭画素Q(1)か
らQ(r(k))までが表示されているが、ステップ1
11で輪郭画素Q(1)からQ(r(k−1))まで表
示することにより、Q(r(k−1))からQ(r
(k))までの輪郭画素は消去されるので、輪郭画素の
表示は前回表示より短くなることになる。
【0061】ステップ113で完了ボタン1103が指
定されたときには、ステップ116以降の処理で、輪郭
抽出の最後の仕上げを行う。すなわち、それまでに次々
と抽出されてきた輪郭を閉曲線にする。
【0062】まず、ステップ116では、kを1増加さ
せる。しかし、新たにマウスピックにより点が指定され
た訳ではなく、ステップ117では、ステップ102で
指定した第1番目の画素P(1)を次の指定画素P
(k)とみなす。ステップ118で行われる自動切り出
しは、ステップ108と同じであり、図2で詳細に説明
する。ステップ119もステップ110と同じである。
【0063】しかしながら、ステップ118の自動切り
出しでは、うまく閉曲線にならないこともある。すなわ
ち、指定画素P(k−1)からP(k)=P(1)まで
つながらないこともある。ステップ120ではその判定
を行い、分岐処理をする。うまくつながった場合には、
輪郭画素Q(r(k))がQ(1)=P(1)と同じ画
素になるはずである。ステップ120で一致しなかった
ときには、ステップ118の自動切り出しの結果をキャ
ンセルし、ステップ121で手動切り出しを行う。これ
についても図3で詳細に説明する。ステップ122で
は、閉曲線になった輪郭を表示する。ステップ123で
は輪郭データを保存格納し、終了する。
【0064】ステップ113でモードボタン1104が
指定されたときには、ステップ115でモードを変更
し、ステップ104に戻る。モードの変更は、現モード
が自動モードのときは手動モードに、現モードが手動モ
ードのときは自動モードに、それぞれ変更することにな
る。
【0065】ステップ113でキャンセルボタン110
5が指定された場合には、ステップ104での右ボタン
指定をなかったことにして、操作メニュー1101の表
示を消去し、ステップ104に戻る。
【0066】このような図1の手順により、本実施例の
システムでは、自動抽出、手動抽出、およびUNDOを
組合せて使うことができ、効率のよい物体切り出しを行
うことができる。従来あるような自動切り出しのみのツ
ールでは、全ての輪郭の部位に対して切り出しが成功す
るとは限らないので、処理を終了し、手動抽出に相当す
る別ツールでこれを補う等の手間が必要になることが多
い。また、全体の輪郭を手切りのみのツールで行うのは
多大な労力が必要である。しかし、上記の図1の手順に
よれば、自動抽出、手動抽出、およびUNDOを組合せ
て使うことができるので、効率よく対象物を切り出すこ
とができる。
【0067】図2は、ステップ108およびステップ1
18の自動切り出し処理の詳細な手順を示す。
【0068】まず、ステップ201で、抽出された輪郭
画素の個数を示すパラメータs(k)を初期化する。
【0069】ステップ202ではエッジ検出オペレータ
を選択する。エッジ検出オペレータのカーネルは、図5
のエッジ検出オペレータのデータ508に蓄えられてい
る。エッジ検出オペレータの選択は、図1のステップ1
06で指定された指定画素P(k)と、最後に抽出され
た輪郭画素Q(r(k−1))との関係(kの定義によ
り、P(k+1)とQ(r(k))との関係と考えても
同じである)に応じて行われる。すなわち、最後に抽出
された輪郭画素Q(r(k−1))からいま指定された
指定画素P(k)に向かう方向に応じて、その方向のエ
ッジを検出するのに好適なエッジ検出オペレータを選択
する。
【0070】図10は、図5のカーネルデータ508に
蓄えられている8つのエッジ検出オペレータのカーネル
パタンの模式図である。この8つの中から1つを選択す
る。図中の角度θは、最後に抽出された輪郭画素Q(r
(k−1))から指定画素P(k)に向かう有向線分が
水平右方向となす角度を0°から360°で表わしたも
のである。この角度θに従いカーネルパタンを選択する
と、Q(r(k−1))からP(k)に向かう方向のエ
ッジ成分を最もよく検出する。例えば、図10の左の列
の一番上のカーネルパタンは、0<θ<22.5, 337.5<
θ<360 のときに選択されるものであるが、このカーネ
ルパタンによりほぼ水平方向のエッジをうまく検出する
ことができる。他のカーネルパタンも、角度θの方向の
エッジをうまく検出することができるようになってい
る。
【0071】ここで、図10に示した各カーネルパタン
の5行×5列のマトリクスは通常の空間フィルタのマス
クを表わしており、従来の技術で述べたコンボリューシ
ョン(従来の技術の欄では3行3列のもので説明した)
のカーネルパタンである。黒丸が1、白丸が−1、それ
以外が0を、それぞれ表わしている。なお、このカーネ
ルパタンに限らず、他のパタンを用いてもよい。また、
候補の数も8つに限らない。もっと細分化してもよい
し、粗くしてもよい。
【0072】以上のようにステップ202でエッジオペ
レータを決定した後、ステップ203では、探索処理の
方向を選択する。探索処理の方向の選択とは、それまで
に決定した輪郭画素のうち最後の画素から次に探索する
画素がどの方向にあるかを決定するものである。
【0073】図9のように、本実施例では、縦方向、横
方向、および45度方向に沿った探索方法を採用する。
図中、開始点901がQ(r(k−1))に対応し、探
索目標902が指定画素P(k)に対応する。向きも考
えると、探索方向の候補は8方向あることになる。そこ
で、エッジ検出オペレータの選択と同様にして、最後に
抽出された輪郭画素Q(r(k−1))から指定画素P
(k)へ向かう線分の方向に基づいて、8通りの方向の
うちの1つを選択する。
【0074】簡単にいえば、22.5°,67.5°,
112.5°,157.5°,202.5°,247.
5°,292.5°,337.5°,を境界とし、線分
が横方向に近いときはエッジ探索を縦の数画素について
行ない、線分が縦方向に近い時は、エッジ探索を横の方
向で行ない、また、45°方向(135°、225°、
315°)に近いときには斜めの探索を行うようにす
る。
【0075】図9(a)では、開始点901から探索目
標902に向かう方向、すなわち輪郭画素Q(r(k−
1))から指定画素P(k)へ向かう方向がほぼ横(水
平)方向であるから、探索方向は横方向になり、それま
でに決定された最後の輪郭画素の右側の5つの?が探索
範囲(次の輪郭画素の候補)となっている。図9(b)
では、開始点901から探索目標902に向かう方向、
すなわち輪郭画素Q(r(k−1))から指定画素P
(k)へ向かう方向がほぼ縦(垂直)方向であるから、
探索方向は縦方向になり、それまでに決定された最後の
輪郭画素の下側の5つの?が探索範囲(次の輪郭画素の
候補)となっている。図9(c)では、開始点901か
ら探索目標902に向かう方向、すなわち輪郭画素Q
(r(k−1))から指定画素P(k)へ向かう方向が
ほぼ45度方向であるから、探索方向は45度方向にな
り、それまでに決定された最後の輪郭画素の右上側の5
つの?が探索範囲(次の輪郭画素の候補)となってい
る。
【0076】なお、探索方向は8つの中から選択するよ
うになっているが、8つに限らず、もっと少なくしても
よいし、多くしてもよい。また、上記のエッジ検出オペ
レータの選択とは独立であり、例えばエッジ検出オペレ
ータは図10のような8つの方向に応じて選択し、図9
の探索方向は縦横に沿う4方向から選ぶようにしてもよ
い。
【0077】ステップ203で探索方向を決定したら、
ステップ204では、図9の探索範囲の各画素(?で図
示してある)に対し、ステップ202で選択されたエッ
ジ検出オペレータを作用させる。具体的には、?で図示
してある画素を中心として、上下合計5画素および水平
方向に5画素をとり、それらの画素とエッジ検出オペレ
ータのカーネルパタンとの積和を計算する。
【0078】ステップ205では、ステップ204でエ
ッジ検出オペレータを作用させた結果が最大の画素をも
って輪郭画素と決定する。ここで、探索範囲は図9に示
したように5画素としているので、5つの?の画素のう
ち端の画素が輪郭と決定されたときには注意が必要であ
る。すなわち、輪郭画素が桂馬の関係で間が飛ぶことに
なるので、直前までに決定された最後の輪郭画素と今輪
郭画素と決定した?の画素との間の?の画素も一緒に抽
出し、一度に2画素抽出する。
【0079】ステップ206では、ステップ205で新
たに輪郭画素が1画素抽出されたか、上述したように2
画素抽出されたかによる分岐である。輪郭画素として抽
出されたのが1画素であるときは、ステップ207で、
輪郭画素の個数s(k)を1増加させる。輪郭画素とし
て抽出されたのが2画素であるときは、ステップ208
で、輪郭画素の個数s(k)を2増加させる。
【0080】次に、ステップ209では、ステップ20
5で抽出された輪郭画素が、図9の探索終了線903に
達したかどうかを判定し、分岐を行う。探索終了線に達
していないときにはステップ204にもどり、次の探索
を行う。終了線に達していたときには図1に戻る。な
お、探索終了線としては、探索目標902を通り探索方
向に垂直な方向の直線を取るものとする。この探索終了
線に沿った画素まで、輪郭画素が至ったとき、処理終了
になる。
【0081】図3は、図1のステップ109とステップ
121の手動切り出し処理の詳細な手順を示す。
【0082】ここでは、輪郭画素Q(r(k−1))か
ら指定画素P(k)までディジタル的に直線を引いて輪
郭とする。図8は、直線を引いた例を示す。このような
直線を引くアルゴリズムは、各種知られており、どれを
採用してもよい。ここでは、最も単純なDDA(dig
ital differential analyze
r)アルゴリズムに従う。このアルゴリズムについて
は、例えば、J.D.Foley他3名著、Compu
ter Graphics 2nd Edition
−principles and practice−
,Addison−Wesley, 1990刊第7
3ページから第74ページに記載されている。
【0083】まず、ステップ301では、輪郭画素Q
(r(k−1))から指定画素P(k)への有向線分の
向きが縦か横かの判定を行う。これは、DDAアルゴリ
ズムが縦と横の場合に用いる座標が逆であるためであ
る。
【0084】次に、ステップ302では、輪郭画素の個
数s(k)を決定する。横方向の場合はPi(k)−Q
i(r(k−1))の絶対値、縦方向の場合にはPj
(k)−Qj(r(k−1))の絶対値がs(k)にな
る。
【0085】ステップ303では、DDAアルゴリズム
で輪郭画素を決める。これは、横方向の例で説明する
と、Q(r(k−1))からP(k)への平均の傾きを
実数値で求めておき、1画素横に進むごとにこれを加算
していき、四捨五入することにより縦の座標Qj(k
1)を求めるというものである。
【0086】
【発明の効果】以上説明したように、本発明によれば、
対象物の輪郭の探索を行う方向を指定し、その方向に輪
郭を探索し決定していくので、切り出したい対象や背景
が一様な色や濃度でない場合、あるいは検出したエッジ
の候補が多数表れたりとぎれたりする場合でも、対象と
する物の輪郭を正確に抽出できる。
【図面の簡単な説明】
【図1】本発明の1実施例に係る画像セグメンテーショ
ンシステムの処理の流れ図
【図2】実施例のシステムの自動切り出し処理の流れ図
【図3】実施例のシステムの手動切り出し処理の流れ図
【図4】実施例のシステムのハードウェア構成図
【図5】実施例のシステムのメモリー構成図
【図6】輪郭探索方法の説明図
【図7】輪郭点データの構成図
【図8】手動輪郭点抽出の説明図
【図9】自動輪郭探索方法の説明図
【図10】エッジ検出カーネルパタンの図
【図11】操作メニューの説明図
【符号の説明】
401…主プロセッサ、402…主記憶、403…フレ
ームバッファ、404…ディスプレイコントローラ、4
05…ディスプレイ、406…入出力プロセッサ、40
7…ハードディスク、408…画像入力装置、409…
キーボード、410…マウス、411…システムバス。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】ディジタル的に表現された画像データ中か
    ら特定の対象物を切り出す画像セグメンテーション方法
    であって、 前記対象物の輪郭上の一画素を指定する第1のステップ
    と、 前記指定された画素から前記対象物の輪郭の探索を行な
    う方向を指定する第2のステップと、 前記第1のステップで指定された画素から前記第2のス
    テップで指定された方向に、前記対象物の輪郭を探索し
    決定する第3のステップとを備えたことを特徴とする画
    像セグメンテーション方法。
  2. 【請求項2】ディジタル的に表現された画像データ中か
    ら特定の対象物を切り出す画像セグメンテーション方法
    であって、 前記対象物の輪郭上の一画素を外部から指定する第1の
    ステップと、 前記第1のステップで指定された画素またはそれまでに
    決定された輪郭上の最後の画素から前記対象物の輪郭の
    探索を行なう方向を、外部から、指定する第2のステッ
    プと、 前記第1のステップで指定された画素またはそれまでに
    決定された輪郭上の最後の画素から、前記第2のステッ
    プで指定された方向に、前記対象物の輪郭を探索し決定
    する第3のステップとを備え、前記第2のステップおよ
    び第3のステップを繰り返し実行することにより前記対
    象物を切り出すことを特徴とする画像セグメンテーショ
    ン方法。
  3. 【請求項3】請求項1または2に記載の画像セグメンテ
    ーション方法において、前記第2のステップは、前記第
    1のステップで指定された画素またはそれまでに決定さ
    れた輪郭上の最後の画素の位置と、外部から指定された
    画素の位置との関係をもって、輪郭を探索する方向を定
    めることを特徴とする画像セグメンテーション方法。
  4. 【請求項4】請求項3に記載の画像セグメンテーション
    方法において、前記第2のステップは、前記第1のステ
    ップで指定された画素またはそれまでに決定された輪郭
    上の最後の画素から、外部から指定された画素に向かう
    方向をもって、輪郭を探索する方向とすることを特徴と
    する画像セグメンテーション方法。
  5. 【請求項5】請求項1または2に記載の画像セグメンテ
    ーション方法において、 前記第3のステップは、 前記第2のステップで指定された方向に応じて、その方
    向のエッジ成分を選択的に抽出するエッジ検出オペレー
    タを選択するステップと、 前記第2のステップで指定された方向に応じて、前記第
    1のステップで指定された画素またはそれまでに逐次的
    に決定された輪郭上の最後の画素から、次に決定される
    輪郭上の画素を探索する方向を決定するとともに、該方
    向にある所定数の画素を次に決定される輪郭上の画素の
    候補として挙げるステップと、 前記候補の画素に対し、前記エッジ検出オペレータを作
    用させるステップと、 前記エッジ検出オペレータを作用させた結果に基づい
    て、前記候補の画素から、対象物の輪郭上の次の画素を
    決定するステップとを備えたことを特徴とする画像セグ
    メンテーション方法。
  6. 【請求項6】請求項1または2に記載の画像セグメンテ
    ーション方法において、さらに、外部からの入力に応じ
    て、逐次的に決定された前記対象物の輪郭を未決定の状
    態に戻すステップを備えたことを特徴とする画像セグメ
    ンテーション方法。
  7. 【請求項7】ディジタル的に表現された画像データ中か
    ら特定の対象物を切り出す画像セグメンテーション装置
    であって、 前記対象物の輪郭上の一画素を指定するための第1の指
    定手段と、 前記指定された画素から前記対象物の輪郭の探索を行な
    う方向を指定するための第2の指定手段と、 前記第1の指定手段で指定された画素から前記第2の指
    定手段で指定された方向に、前記対象物の輪郭を探索し
    決定する輪郭決定手段とを備えたことを特徴とする画像
    セグメンテーション装置。
  8. 【請求項8】ディジタル的に表現された画像データ中か
    ら特定の対象物を切り出す画像セグメンテーション装置
    であって、 前記対象物の輪郭上の一画素を外部から指定するための
    第1の指定手段と、 前記第1の指定手段で指定された画素またはそれまでに
    決定された輪郭上の最後の画素から前記対象物の輪郭の
    探索を行なう方向を、外部から、指定するための第2の
    指定手段と、 前記第1の指定手段で指定された画素またはそれまでに
    決定された輪郭上の最後の画素から、前記第2の指定手
    段で指定された方向に、前記対象物の輪郭を探索し決定
    する輪郭決定手段とを備えたことを特徴とする画像セグ
    メンテーション装置。
  9. 【請求項9】請求項7または8に記載の画像セグメンテ
    ーション装置において、 前記輪郭決定手段は、 前記第2の指定手段で指定された方向に応じて、その方
    向のエッジ成分を選択的に抽出するエッジ検出オペレー
    タを選択する手段と、 前記第2の指定手段で指定された方向に応じて、前記第
    1の指定手段で指定された画素またはそれまでに逐次的
    に決定された輪郭上の最後の画素から、次に決定される
    輪郭上の画素を探索する方向を決定するとともに、該方
    向にある所定数の画素を次に決定される輪郭上の画素の
    候補として挙げる手段と、 前記候補の画素に対し、前記エッジ検出オペレータを作
    用させる手段と、 前記エッジ検出オペレータを作用させた結果に基づい
    て、前記候補の画素から、対象物の輪郭上の次の画素を
    決定する手段とを備えたことを特徴とする画像セグメン
    テーション装置。
  10. 【請求項10】請求項7または8に記載の画像セグメン
    テーション装置において、さらに、外部からの入力に応
    じて、逐次的に決定された前記対象物の輪郭を未決定の
    状態に戻す手段を備えたことを特徴とする画像セグメン
    テーション装置。
JP5291285A 1993-10-27 1993-10-27 画像セグメンテーション方法及び装置 Pending JPH07121710A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5291285A JPH07121710A (ja) 1993-10-27 1993-10-27 画像セグメンテーション方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5291285A JPH07121710A (ja) 1993-10-27 1993-10-27 画像セグメンテーション方法及び装置

Publications (1)

Publication Number Publication Date
JPH07121710A true JPH07121710A (ja) 1995-05-12

Family

ID=17766904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5291285A Pending JPH07121710A (ja) 1993-10-27 1993-10-27 画像セグメンテーション方法及び装置

Country Status (1)

Country Link
JP (1) JPH07121710A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001307105A (ja) * 2000-04-25 2001-11-02 Canon Inc 画像処理装置およびその方法
JP2002259987A (ja) * 2001-03-06 2002-09-13 Sony Corp 画像処理装置及び方法、記憶媒体、コンピュータ・プログラム
WO2008151270A1 (en) * 2007-06-05 2008-12-11 Microsoft Corporation Learning object cutout from a single example
WO2018105530A1 (ja) * 2016-12-08 2018-06-14 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および情報処理方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001307105A (ja) * 2000-04-25 2001-11-02 Canon Inc 画像処理装置およびその方法
JP4612760B2 (ja) * 2000-04-25 2011-01-12 キヤノン株式会社 画像処理装置およびその方法
JP2002259987A (ja) * 2001-03-06 2002-09-13 Sony Corp 画像処理装置及び方法、記憶媒体、コンピュータ・プログラム
WO2008151270A1 (en) * 2007-06-05 2008-12-11 Microsoft Corporation Learning object cutout from a single example
WO2018105530A1 (ja) * 2016-12-08 2018-06-14 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および情報処理方法
CN110036258A (zh) * 2016-12-08 2019-07-19 索尼互动娱乐股份有限公司 信息处理装置和信息处理方法
US11282224B2 (en) 2016-12-08 2022-03-22 Sony Interactive Entertainment Inc. Information processing apparatus and information processing method

Similar Documents

Publication Publication Date Title
CN108416377B (zh) 柱状图中的信息提取方法及装置
JP3189870B2 (ja) 画像処理装置
US6674905B1 (en) Image processing method, image processing apparatus, and storage medium
US5475507A (en) Color image processing method and apparatus for same, which automatically detects a contour of an object in an image
JP4482778B2 (ja) 画像処理装置および画像処理方法、並びに記録媒体
US11386589B2 (en) Method and device for image generation and colorization
JPH03218581A (ja) 画像セグメンテーション方法
WO2001026050A2 (en) Improved image segmentation processing by user-guided image processing techniques
JP2007148677A (ja) 画像処理装置、画像処理方法
US20220301239A1 (en) Automatic coloring of line drawing
CN111145135A (zh) 一种图像去扰处理方法、装置、设备及存储介质
US6728407B1 (en) Method for automatically determining trackers along contour and storage medium storing program for implementing the same
CN112861854A (zh) 指甲语义分割中训练样本的生成方法、装置、设备及介质
JP7282551B2 (ja) 情報処理装置、情報処理方法及びプログラム
JPH07121710A (ja) 画像セグメンテーション方法及び装置
CN114723601B (zh) 一种虚拟场景下的模型结构化建模及快速渲染方法
JP4908867B2 (ja) 地理画像処理システム
JP4320064B2 (ja) 画像処理装置及び記録媒体
CN115116083A (zh) 监控画面电力图元自动标识及修正方法、系统及存储介质
CN114860072A (zh) 一种基于单目摄像头的手势识别交互设备
JP2000149026A (ja) 画像トリミング装置
JP2000020734A (ja) 画像セグメンテーション方法
JP3138430B2 (ja) ユーザインタフェース画面作成支援装置
JP4482779B2 (ja) 画像処理装置および画像処理方法、並びに記録媒体
JPH10150657A (ja) 移動物体の表示方法、それを用いた表示システムおよびそのためのプログラム記録媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees