JPH08153198A - 画像切り出し認識装置 - Google Patents
画像切り出し認識装置Info
- Publication number
- JPH08153198A JPH08153198A JP6294641A JP29464194A JPH08153198A JP H08153198 A JPH08153198 A JP H08153198A JP 6294641 A JP6294641 A JP 6294641A JP 29464194 A JP29464194 A JP 29464194A JP H08153198 A JPH08153198 A JP H08153198A
- Authority
- JP
- Japan
- Prior art keywords
- image
- size
- manifold
- image data
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
Abstract
く、任意の方向と大きさを持った物体を様々な物体を含
む画像中から抽出し、同時にその方向をも検出する。 【構成】 物体学習装置1の画像入力手段3から得られ
た画像データから物体の領域を画像前処理手段4で抽出
し、その領域の画像データ値を正規化するとともに画像
処理データのサイズを画像サイズ変換手段5で様々に変
換し、このサイズ変換された学習画像データ集合から固
有ベクトル計算手段6で求めた固有ベクトルと前記学習
画像データ集合とから多様体の形状を多様体計算手段7
で計算し、一方物体認識装置2の画像入力手段8で得ら
れた画像データから物体の領域を注目領域走査抽出手段
10で抽出し、その画像データ値を正規化し、このデー
タと前記固有ベクトルと前記多様体の形状とをもとに距
離測定手段11で距離値を計算し、該物体の位置と方向
と大きさとを出力する。
Description
次元物体の位置(領域)を複数の物体を含む2次元画像
中から検出し、その向きを計測する画像切り出し認識装
置に関し、更に詳しくは、産業用ロボットが自動的に対
象となる物体を見つけ出し、それをつかみ上げたり、自
動監視装置が特定の物体の位置を検出したり、一般背景
中から人間などの物体の領域を抽出したりするのに応用
可能な画像切り出し認識装置に関する。
する装置には大きく分けて2種類の方法が提案されてい
る。第1の方法は、物体の幾何学的な部分的特徴、例え
ばコーナーや稜線を抽出し、その位置関係から物体の位
置を抽出する方法である。第2の方法は、2次元のテン
プレートを用意し、それと入力画像の部分画像との相関
を取り、その相関値の大きい領域をその物体の領域とす
る手法である。
うち、第1の方法では雑音の多い一般の画像中からコー
ナーや稜線などの幾何学的特徴を精度よく抽出すること
が困難であるという問題がある。
る方向やカメラから物体までの距離により見かけの画像
が大きく変化するため、物体の向きや大きさの変化に対
して全ての場合をテンプレートとして記憶し、それと入
力画像の部分画像と照合することは記憶容量、照合時間
の観点から現実的ではないという問題がある。
その目的とするところは、実現が困難な幾何学的特徴を
抽出することなく、任意の方向と大きさを持った物体を
様々な物体を含む画像中から抽出し、同時にその方向を
も検出することができる画像切り出し認識装置を提供す
ることにある。
め、本発明の画像切り出し認識装置は、物体の様々な方
向から撮像した2次元画像を取り込む第1の画像入力手
段、該第1の画像入力手段で得られた画像データから物
体の領域を抽出し、該抽出した物体の領域の画像データ
値を正規化する画像前処理手段、該画像前処理手段で得
られた画像処理データのサイズを様々に変換する画像サ
イズ変換手段、該画像サイズ変換手段で得られた学習画
像データ集合から固有ベクトルを求める固有ベクトル計
算手段、および該固有ベクトル計算手段で得られた固有
ベクトルと前記画像サイズ変換手段で得られた学習画像
データ集合とから多様体の形状を計算する多様体計算手
段を有する物体学習装置と、複数の物体が含まれる2次
元画像を取り込む第2の画像入力手段、該第2の画像入
力手段で得られた画像データから物体の領域を抽出し、
該抽出した物体の領域の画像データ値を正規化する注目
領域走査抽出手段、および該注目領域走査抽出手段によ
り得られたデータと前記固有ベクトル計算手段により得
られた固有ベクトルと前記多様体計算手段で得られた多
様体の形状とをもとに距離値を計算し、該物体の位置と
方向と大きさとを出力する距離測定手段を有する物体認
識装置とを具備することを要旨とする。
前記物体認識装置の前記第2の画像入力手段と前記注目
領域走査抽出手段との間に設けられ、前記第2の画像入
力手段によって取り込まれた入力画像を様々の倍率に変
換する入力画像サイズ変換手段を有することを要旨とす
る。
装置の第1の画像入力手段から得られた画像データから
物体の領域を抽出し、その領域の画像データ値を正規化
するとともに画像処理データのサイズを様々に変換し、
このサイズ変換された学習画像データ集合から求められ
た固有ベクトルと前記学習画像データ集合とから多様体
の形状を計算し、一方物体認識装置の第2の画像入力手
段で得られた画像データから物体の領域を抽出し、その
画像データ値を正規化し、このデータと前記固有ベクト
ルと前記多様体の形状とをもとに距離値を計算し、該物
体の位置と方向と大きさとを出力する。
は、前記第2の画像入力手段によって取り込まれた入力
画像を入力画像サイズ変換手段によって様々の倍率に変
換している。
る。
出し認識装置の構成を示すブロック図である。同図に示
す画像切り出し認識装置は、物体学習装置1と物体認識
装置2から構成される。
た2次元画像から認識に必要となる辞書データを作成す
る装置であり、画像入力手段3、画像前処理手段4、画
像サイズ変換手段5、固有ベクトル計算手段6および多
様体計算手段7で構成される。
ンバータから構成されるものであり、物体の様々な方向
から捕らえた2次元画像を学習データとして取り込み、
これを画像前処理手段4に送出する。様々な方向から画
像を得るためには例えばターンテーブル上に物体を載せ
て回転させ、それを固定したカメラで画像を捕らえた
り、カメラをロボットアームのようなものに持たせて、
固定した物体の回りをカメラが動き回って画像を捕らえ
ることにより実現できる。
画像から物体の特徴を示すのに重要な領域を抽出する段
階と、抽出したデータの値の大きさを正規化する装置か
ら構成される。物体の窓関数としては、円形状で円の中
心部分だけを取り出すもの、物体の形状に合わせた形で
その内側だけを取り出すもの、更に領域で取り出した各
画素値に場所によって重み付けをするようなものなどの
窓関数が上げられる。
を示す。その窓関数の出力の各画素を要素とするベクト
ルを構成し、それをx′とする。ここでベクトルx′の
要素数はその領域の画素数に対応する。次に、このベク
トルの値の大きさを1(または適当な定数)となるよう
にx=x/‖x′‖により正規化する。画像入力手段3
から送られた様々な方向からの画像は順次この処理を適
用し、画像サイズ変換手段5に送出する。
4から入力された画像の大きさを変換する装置である。
物体の様々な方向からの画像はサイズを様々に変換し
(例えば、1.1倍、1.2倍、…,1.4倍などの5
段階程度)、ここで生成されたデータは固有ベクトル計
算手段6および多様体計算手段7に送出される。このデ
ータを学習データ集合と呼ぶことにする。その画像の一
例を図3に示す。
換手段5から送出された学習データ集合から共分散行列
を計算し、その固有ベクトルを計算する装置である。数
学的には、画像前処理手段4から送出されてきた様々な
方向から入力された画像xi(i=,…M、ここでMは
画像数)からその平均値
解し、k個の大きい固有値(λ1 ≧…≧λk ≧…≧
λN )に対応する固有ベクトル(e1 …ek )を求め
る。計算された固有ベクトルは多様体計算手段7に送出
される。
た固有ベクトルの計算は一般的にはかなりの計算時間が
必要となる。そのためこれを高速に計算するためにいく
つかの手法が提案されている。その例としては、特開平
4−105179号公報あるいは特開平5−15904
4号公報に開示された高速固有ベクトル計算装置などが
ある。特開平4−105179号公報に開示された高速
固有ベクトル計算装置は画像等のデータを予めランレン
グス符号化によって圧縮することにより固有ベクトルを
高速に少ない作業用記憶領域で計算可能にするものであ
り、また特開平5−159044号公報に開示された高
速固有ベクトル計算装置は入力データを適応符号化によ
り符号化し、圧縮されたデータの間で内積を計算するこ
とにより、画像等の高次元ベクトルの自己相関行列の固
有ベクトルを高速に計算できるようにしたものである。
段6から送出されてきた固有ベクトルと、画像サイズ変
換手段5から送出されてきた学習画像データ集合から多
様体を計算し、数値の形で出力する。k個の固有ベクト
ル{e1 …ek }によって作られるk次元の直交空間を
ここで固有空間と呼ぶことにする。例えば、方向i、大
きさjの学習データをxijで表すとする。この学習デー
タを固有空間{e1 …ek }へ投影すると固有空間上の
点gij=[e1 …ek ]T xijが得られる。
jを少し変化させた場合には、一般的に画像の見かけは
あまり変化しないため、もとの画像と変化させた画像と
の相関は高い。画像間の相関の大きさとそれに対応する
固有空間上の2点間の距離の大きさは逆比例の関係にあ
るため、両者に対応する固有空間上の点もあまり変化し
ない。つまりこの関係より、iを少し変化させることに
より固有空間上の点は連続的に変化するため、パラメー
タiによる曲線が構成され、更にjを少し変化させるこ
とにより固有空間上にiとjの2パラメータによる曲面
が構成される。このgijをここでパラメータiとjによ
り構成される多面体と呼ぶ。その例を図4に示す。固有
空間上に多様体を作成して学習は終了する。認識段階で
は、固有ベクトル、および多様体の形状を数値の形で記
憶しておき辞書として使用する。
をもとに入力画像中から任意の方向と大きさを持つ物体
を対象に、その物体の位置、方向、および大きさを検出
する装置であり、画像入力手段8、入力画像サイズ変換
手段9、注目領域走査抽出手段10および距離測定手段
11で構成される。
な入力画像を入力する装置である。これは学習段階で使
用された画像入力手段3と同等のものである。入力画像
は入力画像サイズ変換手段9に送出される。
様々の倍率の大きさに変換する。例えば、α-1倍、α-2
倍、α-3倍などの大きさに変換する。ここでαは例えば
1.5倍程度の数値である。ここで様々な倍率の画像を
作成する意味は、物体の大きさの大きな変化を入力画像
の拡大縮小で対処するためである。また、物体の大きさ
の小さな変化については多様体のパラメータで対処す
る。その関係を図5に示す。なお、入力画像サイズ変換
手段9は取り除いても、本発明である画像切り出し認識
装置は実現可能である。サイズを様々に変換された画像
は注目領域走査抽出手段10に送出される。
の部分画像を抽出し、これを距離測定手段11に送出す
る。この特定の領域の形状は、画像前処理手段4で使用
されたものと同じ窓関数を使用する。更に、この出力は
画像前処理手段4で適用されたものと同様の画素値の大
きさの正規化を行う。この特定の領域の位置は例えばラ
スタースキャン状に入力画像中を順次走査し、その全て
を距離測定手段11に送出する。
段10から送出されたデータと、物体学習装置1で作成
された固有のベクトル{e1 …ek }と多様体の数値デ
ータをもとに距離値を計算する。距離値とは注目領域
(例えばyとする)を固有空間上の点hにh=[e1 …
ek ]T yにより投影し、この点hと多様体gijとの間
の距離のことである。すなわち、距離測定手段11は、
点hと多様体との距離
いる領域は学習した物体であるとしてその位置を出力す
る。同時に最小となるiは物体の方向に対応しているた
めにiの値を物体の方向の検出結果として出力する。ま
た、その際のjの値と入力画像サイズ変換手段9から出
力された入力画像の倍率の値の組み合わせによりその物
体の大きさを判定できるため、物体の大きさの検出結果
も出力する。すなわち、入力画像中から学習で用いた物
体の位置、向き、その大きさを検出することができる。
このようにして検出した物体の領域の位置を抽出した結
果の一例が図6に示されているものである。
様々の方向から見た物体の画像を固有空間などの次元の
低い直交空間上の多様体で記憶し、これと入力画像とを
照合することにより、複数の物体を含む画像中から特定
の物体の位置、向き、大きさを検出することが可能であ
る。
の構成を示すブロック図である。
例を示す図であり、その形状は物体の形状に応じて任意
の形状を選択することができる。
させた画像の例を示す図である。
に対応する説明図である。
である。
Claims (2)
- 【請求項1】 物体の様々な方向から撮像した2次元画
像を取り込む第1の画像入力手段、該第1の画像入力手
段で得られた画像データから物体の領域を抽出し、該抽
出した物体の領域の画像データ値を正規化する画像前処
理手段、該画像前処理手段で得られた画像処理データの
サイズを様々に変換する画像サイズ変換手段、該画像サ
イズ変換手段で得られた学習画像データ集合から固有ベ
クトルを求める固有ベクトル計算手段、および該固有ベ
クトル計算手段で得られた固有ベクトルと前記画像サイ
ズ変換手段で得られた学習画像データ集合とから多様体
の形状を計算する多様体計算手段を有する物体学習装置
と、 複数の物体が含まれる2次元画像を取り込む第2の画像
入力手段、該第2の画像入力手段で得られた画像データ
から物体の領域を抽出し、該抽出した物体の領域の画像
データ値を正規化する注目領域走査抽出手段、および該
注目領域走査抽出手段により得られたデータと前記固有
ベクトル計算手段により得られた固有ベクトルと前記多
様体計算手段で得られた多様体の形状とをもとに距離値
を計算し、該物体の位置と方向と大きさとを出力する距
離測定手段を有する物体認識装置とを具備することを特
徴とする画像切り出し認識装置。 - 【請求項2】 前記物体認識装置の前記第2の画像入力
手段と前記注目領域走査抽出手段との間に設けられ、前
記第2の画像入力手段によって取り込まれた入力画像を
様々の倍率に変換する入力画像サイズ変換手段を有する
ことを特徴とする請求項1記載の画像切り出し認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29464194A JP3252941B2 (ja) | 1994-11-29 | 1994-11-29 | 画像切り出し認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29464194A JP3252941B2 (ja) | 1994-11-29 | 1994-11-29 | 画像切り出し認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08153198A true JPH08153198A (ja) | 1996-06-11 |
JP3252941B2 JP3252941B2 (ja) | 2002-02-04 |
Family
ID=17810401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP29464194A Expired - Fee Related JP3252941B2 (ja) | 1994-11-29 | 1994-11-29 | 画像切り出し認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3252941B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003141551A (ja) * | 2001-10-31 | 2003-05-16 | Toshiba Corp | 顔向き計算方法及びその装置 |
JP2004072655A (ja) * | 2002-08-09 | 2004-03-04 | Ricoh Co Ltd | Roi領域設定装置、電子カメラ装置、roi領域設定方法、プログラム、記録媒体 |
EP1521204A2 (en) * | 2003-09-30 | 2005-04-06 | Fanuc Ltd | Image processor for object recognition |
US7054850B2 (en) | 2000-06-16 | 2006-05-30 | Canon Kabushiki Kaisha | Apparatus and method for detecting or recognizing pattern by employing a plurality of feature detecting elements |
KR100693262B1 (ko) * | 2003-05-12 | 2007-03-13 | 화낙 가부시끼가이샤 | 화상 처리 장치 |
JP2009112617A (ja) * | 2007-11-08 | 2009-05-28 | Kowa Co | パノラマ眼底画像合成装置及び方法 |
JP2011022992A (ja) * | 2009-05-08 | 2011-02-03 | Honda Research Inst Europe Gmbh | 視覚に基づく3次元形状認識を備えたロボット |
US9053546B2 (en) | 2010-07-12 | 2015-06-09 | Canon Kabushiki Kaisha | Information processing apparatus, control method therefor, and computer-readable storage medium |
CN117351197A (zh) * | 2023-12-04 | 2024-01-05 | 北京联影智能影像技术研究院 | 图像分割方法、装置、计算机设备和存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005250863A (ja) * | 2004-03-04 | 2005-09-15 | Univ Waseda | 領域検出方法およびそのシステム |
JP4309439B2 (ja) | 2007-03-30 | 2009-08-05 | ファナック株式会社 | 対象物取出装置 |
-
1994
- 1994-11-29 JP JP29464194A patent/JP3252941B2/ja not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7054850B2 (en) | 2000-06-16 | 2006-05-30 | Canon Kabushiki Kaisha | Apparatus and method for detecting or recognizing pattern by employing a plurality of feature detecting elements |
JP2003141551A (ja) * | 2001-10-31 | 2003-05-16 | Toshiba Corp | 顔向き計算方法及びその装置 |
JP2004072655A (ja) * | 2002-08-09 | 2004-03-04 | Ricoh Co Ltd | Roi領域設定装置、電子カメラ装置、roi領域設定方法、プログラム、記録媒体 |
US7283661B2 (en) | 2003-05-12 | 2007-10-16 | Fanuc Ltd | Image processing apparatus |
CN100379530C (zh) * | 2003-05-12 | 2008-04-09 | 发那科株式会社 | 图像处理装置 |
KR100693262B1 (ko) * | 2003-05-12 | 2007-03-13 | 화낙 가부시끼가이샤 | 화상 처리 장치 |
EP1521204A3 (en) * | 2003-09-30 | 2005-10-12 | Fanuc Ltd | Image processor for object recognition |
US7315650B2 (en) | 2003-09-30 | 2008-01-01 | Fanuc Ltd | Image processor |
EP1521204A2 (en) * | 2003-09-30 | 2005-04-06 | Fanuc Ltd | Image processor for object recognition |
JP2009112617A (ja) * | 2007-11-08 | 2009-05-28 | Kowa Co | パノラマ眼底画像合成装置及び方法 |
JP2011022992A (ja) * | 2009-05-08 | 2011-02-03 | Honda Research Inst Europe Gmbh | 視覚に基づく3次元形状認識を備えたロボット |
US9053546B2 (en) | 2010-07-12 | 2015-06-09 | Canon Kabushiki Kaisha | Information processing apparatus, control method therefor, and computer-readable storage medium |
CN117351197A (zh) * | 2023-12-04 | 2024-01-05 | 北京联影智能影像技术研究院 | 图像分割方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP3252941B2 (ja) | 2002-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9053388B2 (en) | Image processing apparatus and method, and computer-readable storage medium | |
Murase et al. | Visual learning and recognition of 3-D objects from appearance | |
JP4284288B2 (ja) | パターン認識装置及びその方法 | |
EP1835446B1 (en) | Feature point detecting device, feature point detecting method, and feature point detecting program | |
JP4317465B2 (ja) | 顔識別装置、顔識別方法及び顔識別プログラム | |
JP5406705B2 (ja) | データ補正装置及び方法 | |
US8027522B2 (en) | Image recognition system and recognition method thereof and program | |
JP5121506B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
Brown et al. | Comparative study of coarse head pose estimation | |
JP7094702B2 (ja) | 画像処理装置及びその方法、プログラム | |
US6961466B2 (en) | Method and apparatus for object recognition | |
Murase et al. | Learning object models from appearance | |
JP6912215B2 (ja) | 対象物の姿勢等を検出する検出方法、検出プログラム | |
JPH08153198A (ja) | 画像切り出し認識装置 | |
JP4483042B2 (ja) | 影成分除去装置および影成分除去方法 | |
JP4729188B2 (ja) | 視線検出装置 | |
JP2008009728A (ja) | 表情認識方法及び表情認識装置 | |
JP4570764B2 (ja) | 運動情報認識システム | |
JP5791373B2 (ja) | 特徴点位置決定装置、特徴点位置決定方法及びプログラム | |
Murase et al. | Parametric eigenspace representation for visual learning and recognition | |
Verlekar et al. | View-invariant gait recognition exploiting spatio-temporal information and a dissimilarity metric | |
JPH08329247A (ja) | 動画像認識装置 | |
CN210442821U (zh) | 一种人脸识别装置 | |
JP3859347B2 (ja) | 物体認識装置及びその方法 | |
Ouamane et al. | Multimodal 3D and 2D face authentication approach using extended LBP and statistic local features proposed |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071122 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081122 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091122 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111122 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111122 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121122 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121122 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131122 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |