JPH10162136A - 画像自動分類方法 - Google Patents

画像自動分類方法

Info

Publication number
JPH10162136A
JPH10162136A JP8323833A JP32383396A JPH10162136A JP H10162136 A JPH10162136 A JP H10162136A JP 8323833 A JP8323833 A JP 8323833A JP 32383396 A JP32383396 A JP 32383396A JP H10162136 A JPH10162136 A JP H10162136A
Authority
JP
Japan
Prior art keywords
dimensional
image
images
dimensional image
classification method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8323833A
Other languages
English (en)
Inventor
Koichi Kimura
宏一 木村
Eiji Ohira
栄二 大平
Hiromichi Fujisawa
浩道 藤澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GIJUTSU KENKYU KUMIAI SHINJOHO
GIJUTSU KENKYU KUMIAI SHINJOHO SHIYORI KAIHATSU KIKO
Hitachi Ltd
Original Assignee
GIJUTSU KENKYU KUMIAI SHINJOHO
GIJUTSU KENKYU KUMIAI SHINJOHO SHIYORI KAIHATSU KIKO
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GIJUTSU KENKYU KUMIAI SHINJOHO, GIJUTSU KENKYU KUMIAI SHINJOHO SHIYORI KAIHATSU KIKO, Hitachi Ltd filed Critical GIJUTSU KENKYU KUMIAI SHINJOHO
Priority to JP8323833A priority Critical patent/JPH10162136A/ja
Publication of JPH10162136A publication Critical patent/JPH10162136A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 不特定の対象を不特定の位置から撮影した多
数の静止画像をその見かけ上の類似性に合致するように
自動的にかつ効率良く分類することができない。 【解決手段】 実世界の3次元対象を撮影した複数の2
次元画像を、それぞれ同じ実世界の3次元対象を撮影し
たものどうしに分類する画像自動分類方法であって、種
々組合せた2次元画像のペアから、それぞれの2次元画
像が同じ実世界の3次元対象を撮影したペアを判別して
抽出し、抽出した各ペアで同じ2次元画像を含むペアを
連鎖させ、この連鎖を辿ることにより、それぞれ同じ実
世界の3次元対象を撮影した2次元画像どうしに分類す
ることを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、静止画像等の2次
元画像間の類似性の自動判別を、それぞれに含まれる3
次元物体の画像を用いて行う技術に係り、特に、ビデオ
カメラ等で実世界を撮影して得られた動画像の各フレー
ム(2次元画像)などを、それぞれ同じ実世界を写した
ものどうしに分類するのに好適な画像自動分類方法に関
するものである。
【0002】
【従来の技術】二つの2次元画像の内容が類似するもの
であるか否かを機械的に判別する場合、航空写真のよう
に元々2次元的なものを写した2次元画像であれば、そ
れぞれの画像の重なりを比較することにより容易に判別
することができる。しかし、実世界の3次元物体を写し
た2次元画像の場合、たとえ同じ3次元物体を写した2
次元画像どうしであっても、それぞれの撮影位置が異な
っている場合には、人が見た目で判断するように容易に
は自動判別できない。このような場合には、まず、その
3次元物体を認識することが考えられる。
【0003】このように、静止画像等の2次元画像か
ら、そこに写されている3次元物体を機械的に認識する
ための従来技術の多くは、例えば、白井良明編「知識工
学講座9 パターン理解」(1987年、株式会社オー
ム社発行)に記載のように、2次元の入力画像特徴から
3次元構造を復元しながら3次元モデルとの照合を行う
ものである。この3次元構造を復元する手掛かりとし
て、ステレオ視、陰影、動き(オプティカルフロー)な
どが用いられる。
【0004】しかし、このような2次元画像から3次元
構造を復元する技術には、論理的には不十分な情報に基
づく種々の判断が必要になるという「逆問題」としての
難しさがある。そこで、より直接的に、見かけの2次元
画像を用いて3次元物体を自動的に認識する様々な技術
が、従来から試みられてきている。しかし、この技術で
問題となることは、たとえ同じ3次元物体を映しても、
カメラ位置の違いにより、その見かけの2次元画像は大
きく変化するため、カメラ位置の違いを補正するための
何らかの正規化(画像変換)を行うことが必要になるとい
うことである。
【0005】このような正規化処理を避けるための技術
が幾つか知られている。例えば、不変特徴量を用いる技
術(杉本晃宏、「CVCV特別報告−ビジョンにおける
不変量とその応用」、『情報処理学会 コンピュータビ
ジョン研究会資料』、CV93-03、pp.19-34、1995年)
は、物体における不変量を用いるものであり、正規化が
必要とならない優れた技術である。しかし、不変量が見
つかる対象は、空間内の数本の直線からなるものなど、
幾何学的に単純な対象に限られる。従って、実世界の不
特定の対象に対してそのような不変量を求めることは困
難である。
【0006】また、3次元物体を映した2次元画像で
は、その大域的な特徴量に比較してその局所的な特徴量
は、カメラ位置の違いによって受ける変化が少ない。従
って、局所的な特徴量だけを用いることにより、正規化
処理が不要になる。このような特性を利用した技術とし
ては、特徴的な局所的配色パターンを追跡する技術(例
えば、上田博唯、宮武孝文、炭野重雄、長坂晃明「動画
像解析に基づくビデオ構造の視覚化とその応用」、『電
子情報通信学会論文誌D-II』、vol.J76-D-II、no.8、p
p.1572-1580、1993年)や、局所的な高次自己相関係数
を利用する技術(例えば、大津展之「パターン認識にお
ける特徴抽出に関する数理的研究」、『電総研研究報
告』、第818号、昭56年)等がある。しかし、このよう
な技術の改良によって、大域的な特徴量を捉えようとす
ると、適切な正規化処理と巨視化処理が必要になる。
【0007】さらに、正規化処理をする代わりに、MB
R(Memory-Based Reasoning、記憶に基づく推論)と似
た考え方で、あらゆる視点から対象を見た画像を予め記
憶しておこうというアプローチもある。例えば、画素値
を要素とするベクトルの主成分分析による方法(村瀬洋
・シュリーナイヤー「2次元照合による3次元物体認識
−パラメトリック固有空間法」『、電子情報通信学会
論文誌D-II』、vol.J77-D-II、no.11、pp.2179-2187、
1993年)では、3次元物体を平面内の4度刻みで360
度方向から見た90通りの画像を記憶している。ここ
で、記憶容量の効率性の観点から、各画像は符号化した
上で記憶される。この技術は、特定の対象であれば、そ
れがどのように複雑な形状をしていても対応できるとい
う意味で優れている。しかし、不特定多数の対象を扱う
ためは、それらをあらゆる角度から見た2次元画像を予
め用意する必要があり、非効率的とならざるを得ない。
【0008】
【発明が解決しようとする課題】解決しようとする問題
点は、従来の技術では、二つの2次元画像が、同じ実世
界をそれぞれ異なる位置から撮影したものであるか否か
を、そこに含まれる3次元物体の画像から自動的にかつ
効率良く判別することができない点である。本発明の目
的は、これら従来技術の課題を解決し、動画像のフレー
ムを構成する各静止画像等の2次元画像を、それぞれ同
じ実世界を写したものどうしに自動的、かつ効率良く分
類することを可能とする画像自動分類方法に関するもの
である。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、本発明の画像自動分類方法は、(1)種々組合せた
2次元画像のペアから、それぞれの2次元画像が同じ実
世界の3次元対象を撮影したペアを判別して抽出し、抽
出した各ペアで同じ2次元画像を含むペアを連鎖させ、
この連鎖を辿ることにより、それぞれ同じ実世界の3次
元対象を撮影した2次元画像どうしに分類することを特
徴とする。また、(2)上記(1)に記載の画像自動分
類方法において、ペアの判別は、ペアを構成する第1の
2次元画像における3次元対象の像に、同ペアを構成す
る第2の2次元画像における3次元対象の像が重なるよ
う、第2の2次元画像を変換する第1のステップと、こ
の第1のステップで変換した第2の2次元画像と第1の
2次元画像との類似度を、変換した第2の2次元画像の
歪みの大きさを少なくとも含む評価値を用いて求める第
2のステップとを少なくとも含み、第2のステップで求
めた類似度が所定値に達していれば、第2の2次元画像
を第1の2次元画像に類するものと判別することを特徴
とする。また、(3)上記(2)に記載の画像自動分類
方法において、第2のステップで求める類似度を、変換
した第2の2次元画像の歪みの大きさと、変換した第2
の2次元画像と第1の2次元画像のそれぞれ同じ位置の
画素のRGB値の差の大きさと、変換した第2の2次元
画像と第1の2次元画像のそれぞれ重なり合う部分の大
きさとを少なくとも含む評価値に基づき求めることを特
徴とする。また、(4)上記(2)もしくは(3)のい
ずれかに記載の画像自動分類方法において、第2のステ
ップで求める類似度が最も高くなる、第2の2次元画像
の変換に用いるパラメータを、確率的組合せ探索により
定めることを特徴とする。また、(5)上記(2)から
(4)のいずれかに記載の画像自動分類方法において、
第2の2次元画像の変換に用いたパラメータで特定され
る辺の両端に、第1の2次元画像と第2の2次元画像を
位置付けて、ペアをグラフ表現し、ペア間の各辺から一
つの辺を選択して、この選択した辺で各2次元画像を連
鎖させることを特徴とする。また、(6)上記(5)に
記載の画像自動分類方法において、ペア間の各辺からの
一つの辺の選択は、貪欲法によりペア間の最小コスト極
大部分木を順次きりだして行うことを特徴とする。ま
た、(7)上記(1)から(6)のいずれかに記載の画
像自動分類方法において、ペアは、予め画素値に基づく
比較でそれぞれ近似すると判定された2次元画像を組合
せてなることを特徴とする。また、(8)上記(1)か
ら(7)のいずれかに記載の画像自動分類方法におい
て、ペアを構成する2次元画像は、動画像データから切
り出された静止画像からなることを特徴とする。
【0010】
【発明の実施の形態】本発明においては、まず、比較対
象となる二つの2次元画像の一方に、2次元射影変換
(正規化)を行い、視点の違いにより得られる画像の変
化を近似的に作り出す。そして、それぞれの2次元画像
を比較し、その変換を評価する。このような「画像の変
換」と「その変換の評価」を繰り返すことにより、「変
換の評価結果」が最適となる「変換」を探索する。この
ことにより、3次元的な広がりをもつ同じ場所を異なる
カメラ位置から撮影した二つの2次元画像データに対し
て、カメラ位置の違いを補正するための正規化変換が、
近似的に「変換のパラメータ」として効率よく求められ
る。
【0011】さらに、本発明においては、種々に組み合
わせた2つの2次元画像に対して、上述の「画像の変
換」と「その変換の評価」を繰り返す。そして、各比較
結果を、2次元射影空間内に重み付きグラフとして表現
する。この「重み」は、最適な「画像の変換」で得られ
る「変換パラメータ」に基づき生成され、この「変換パ
ラメータ」はカメラ位置に関する情報を含んでおり、グ
ラフ内で重み付き辺の連鎖を辿ることにより、直接比較
されなかった画像どうしが同じ類に含まれるか否かを判
定することができる。このように、2つの2次元画像を
比較する度に得られたそれらの変換(正規化)パラメー
タに基づきグラフ表現された重み付き辺の連鎖を辿るこ
とにより、2次元画像の全データを相互に関係付けて分
類することができる。
【0012】以下、人の身体に装着された小型カメラで
撮影・収集した多数の静止画像データの分類を例に、本
発明の実施例を図面により詳細に説明する。図1は、本
発明の画像自動分類方法の本発明に係る処理手順の一実
施例を示すフローチャートであり、図2は、本発明の画
像自動分類方法を適用する機器構成例を示すブロック図
である。図2に示すように、本実施例では、小型カメラ
を頭部に装着してオフィス内で活動しながら撮影した映
像から、一連の静止画を切り出して分類する。この分類
結果を参照することにより、その人が、後で、過去の出
来事を思い出そうとするとき、その手掛かりが得られ
る。
【0013】図2において、作業者の頭に取付けられた
カメラ201から収録されたビデオ映像は、制御部(図
中、CONTと記載)202、バス203を経由してメ
モリ204に動画像データとしてロードされる。この動
画像データは、ビデオ映像を30フレーム/秒、横64
0×縦480画素/フレームで標本化して得られる。メ
モリ204には、本発明に係る画像の自動分類処理のプ
ログラムが格納されており、CPU205は、メモリ2
04からそのプログラムとデータを読み出して実行す
る。
【0014】このCPU205のプログラムの実行によ
り、メモリ204にある動画像データから代表的な静止
画像データが選び出されて分類され、その結果は磁気デ
ィスク装置206に格納される。また、この分類結果
は、CPU205により磁気ディスク装置206よりメ
モリ204に読み出され、インタフェース部(図中、I
Fと記載)207を介してディスプレイ装置(図中、C
RTと記載)208に表示される。利用者は、キーボー
ド(図中、KEYと記載)209とマウス210を用い
て、表示された分類結果の検索を行う。
【0015】図3は、図2における機器を用いた映像に
よる行動来歴作成システムの構成例を示すブロック図で
ある。本図3に示すシステム構成は、本発明者らによる
既出願の特許(特願平7−34986号)に基づくもの
であり、カメラ201で収録されたビデオ映像は、静止
・移動区間検出部302で静止区間と移動区間に分割さ
れる。要約処理部303は類似静止画検出部304と移
動区間処理部305とからなり、類似静止画検出部30
4では、本発明による静止画自動分類法に基づき静止区
間を分類し、移動区間処理部305では、カメラの移動
方向を求める。事象境界検出部307および場所テンプ
レート309を参照する場所同定部308は、要約処理
部303からの結果をさらに要約して要約結果306を
与える。
【0016】以下、図1を用いて、図2におけるメモリ
204に格納された静止画像の自動分類処理プログラム
に基づく本発明に係る処理手順を説明する。まず、静止
画像データ系列の入力処理(ステップ101)では、動
画像データから静止区間を切り出して、静止画像の時系
列データとして入力する。そのためには、動画像データ
内の隣接するフレーム間で画素値の差分の大きさの平均
値を計算し、それが一定の閾値以下であり続ける時間区
間を求め、それを静止区間とする。次に、サイズの縮小
・画素値の量子化処理(ステップ102)では、入力さ
れた各静止画像を横80×縦60のサイズに縮小し、R
GB(Red,Green,Blue)各256階調の各画素値を、そ
れぞれ12値、8値、8値の色相、彩度、明度に変換す
る。
【0017】各静止画像の1次特徴ベクトルの計算処理
(ステップ103)では、各フレーム毎に色相、彩度、
明度の度数分布を調べ、12×8×8=768次元のベ
クトルとする。また、主成分方向への射影処理(ステッ
プ104)では、各画像ごとに求めた768次元の一次
特徴ベクトルを並べた行列を作り、その特異値分解を行
う。その特異値を大きさの順にソートして、その上位2
0位内に対応する主成分方向を求め、各画像の1次特徴
ベクトルの主成分方向への射影(20次元のベクトル)
を求める。
【0018】近接する画像ペアの選出処理(ステップ1
05)では、各画像に対して上述のようにして得られた
20次元の1次特徴ベクトルどうしの距離を計算して、
互いに近い画像のペアを求める。そして、画像のマッチ
ングによる2次特徴量とその信頼度の計算処理(ステッ
プ106)では、互いに近いと判断された画像のペアに
対して本発明に係るマッチングを試みる。このマッチン
グに際しては、2つの画像を撮った際のカメラの視点位
置の違いを吸収するために、一方の画像を2次元射影変
換して射影歪みを補正した上で他方の画像と比較する。
以下、その詳細を説明する。
【0019】フレームの横・縦方向のピクセル数をそれ
ぞれ、xmax=80、ymax=60として、(x、
y)の位置にあるピクセルの2次元射影変換後の位置を
(u、v)とすると、この変換(u、v)=T(x、
y)は、
【数1】 のように8個のパラメータ「a、b、c、d、h、k、
p、q」を用いて表現される。
【0020】これらの値は、変換した後の2つの画像が
最もよくマッチするように定める。そのマッチングの程
度は、次のコスト関数Cにより評価する。
【数2】
【0021】ここで、「α1、α2、β1、β2」は定
数、「Σ」は「x=1、2、...、xmax」と「y
=1、2、...、ymax」に関する総和、「R0
(x、y)、G0(x、y)、B0(x、y)」は一方
の静止画F0内の位置(x、y)にある画素のRGB
値、「R1(x、y)、G1(x、y)、B1(x、
y)」は、もう一方の静止画F1の位置(x、y)にあ
る画素のRGB値、「^」は冪乗、「#」は集合に含ま
れる要素数、「‖...‖」は2次元ベクトルのユーク
リッドノルム、「det」は2次の行列式を表わす。
【0022】コスト関数Cの各成分は、次のように、こ
のマッチングを評価している。「C0」は、変換後の2
枚の画像の同位置にあるピクセルのRGB値の差の大き
さの平均値を評価している。「C1」はその変換によっ
て2枚の画像が重なり合う部分の大きさを評価してい
る。「C2」はその変換の歪みの大きさを評価してい
る。変換のパラメータ「a、b、c、d、h、k、p、
q」は、このコスト関数Cが最小になるように定める。
【0023】そのためには、シミュレーテッド・アニー
リング法(S.Kirkpatric、C.D.Gellat、Jr.,M.P.Vecci「O
ptimization by Simulated Annealing」、『SCIENCE』、v
ol.220、no.4598、13 May,1983)を用いて確率的組み
合わせ探索を行う。その結果、コスト関数Cの値が或る
閾値以下であれば、それらの画像F0とF1はマッチし
たと考えられる。このとき、パラメータ「a、b、c、
d、h、k、p、q」は、この2つの画像間の関係を簡
潔に表現している。そこで、パラメータ「a、b、c、
d、h、k、p、q」をこの画像間の2次特徴量、「−
C」をその信頼度と呼ぶ。
【0024】また、各静止画像を頂点とするグラフの生
成処理(ステップ107)では、1次特徴ベクトルの主
成分の距離に関して近接している各画像ペアF0,F1
に対して、2次特徴量「a、b、c、d、h、k、p、
q」とその信頼度「−C」を求め、コスト関数Cが或る
閾値以下であれば、各画像ペアF0,F1を頂点として
その間を辺で結び、コスト関数Cを辺のコストとする。
これを繰り返すことにより、グラフが生成される。
【0025】最小コスト森の生成による画像の分類処理
(ステップ108)では、グラフの中から、貪欲(gr
eedy)法により、最小コスト極大部分木を順次切り
出していく。これにより静止画像の分類が行われる。す
なわち、各部分木内の頂点に対応する静止画像の集まり
が一つの類となる。各部分木の任意の2頂点間には、そ
れらを結ぶパスが唯一通り存在する。パス内の各辺に対
しては2次特徴量「a、b、c、d、h、k、p、q」
が計算されている。これらは2次射影変換の係数であっ
て、両端の頂点に対応する静止画像のカメラの視点位置
の違いを表現している。
【0026】いま、画像F0と画像F1が、2次特徴量
「a、b、c、d、h、k、p、q」を持つ辺で結ば
れ、さらに、画像F1と画像F2が、2次特徴量
「a’、b’、c’、d’、h’、k’、p’、q’」
をもつ辺で結ばれているとする。このとき、これらの2
次特徴量に対応する射影変換を合成したものは、次の数
3の式で示す3次正方行列の乗算により計算される。
【数3】 ここで、括弧内は3次の正方行列を表わし、セミコロン
はその行の区切りを表わしている。
【0027】これらを正規化した「a”/r”、b”/
r”、h”/r”、c”/r”、d”/r”、k”/
r”、p”/r”、q”/r”」は、画像F0と画像F
1の関係を表現する2次特徴量を与えていると考えられ
る。そこで、パスに沿ってこの射影変換を順次合成して
行くことにより、この木を2次元射影変換群PGL
(3、R)がなす実8次元空間の中に埋め込んで表現で
きる。これをさらに2次元に投影して可視化したものを
図4に示す。
【0028】図4は、図1における処理手順による静止
画像の分類結果の計算機内部表現を可視化した例を示す
説明図である。図3におけるステップ108の「最小コ
スト森の生成による画像の分類処理」での投影では、
「a、b、c、d、h、k、p、q」に平面上の点
「(a/2+b/2+h)/(p/2+q/2+1)、
(c/2+d/2+k)/(p/2+q/2+1)」を
対応させた。
【0029】これにより、本図4の左右上下方向は、ほ
ぼカメラの視点の動きの左右上下方向に対応する。図4
の401、402が、静止画像を分類する8次元空間を
2次元平面へ投影する第1,第2の座標軸であり、カメ
ラの視点の動きの方向を示す。さらに、図4の403
は、一つの静止画像に対応する点であり、404はその
両端点に対応する2枚の静止画像間で相対的に信頼性の
高いマッチングが行われたことを示す辺であり、405
は最小コスト森を構成する一つの最小コスト極大部分木
である。
【0030】以上、図1〜図4を用いて説明したよう
に、本実施例の画像自動分類方法では、まず、特徴ベク
トルを各画像ごとに計算するのではなく、類似している
と思われる画像のペアごとに計算するため、より詳細な
分類に対応する情報を少数のパラメータで抽出できる。
そして、実際にマッチングを行ってその類似の程度をコ
スト関数として計算することにより、それらのパラメー
タの信頼性を相対的に評価できる。また、画像のペアの
特徴ベクトルは画像間の変換を表わしているため、直接
マッチングを行わなかった画像間の特徴ベクトルも、変
換の合成を計算することによって求めることができる。
【0031】このように、画像の変換とマッチングを基
礎として画像を分類しているので、視点の変化を考慮し
つつ見た目に忠実な画像の分類を行うことができ、二つ
の静止画像のそれぞれが、同じ場所を異なる撮影位置で
撮影したものであることを機械的に特定できる。このこ
とにより、人の身体に装着された小型カメラで、不特定
の対象を不特定の位置から繰り返し撮影して収集した多
数の静止画像データを、その撮影時刻に拘わらずその撮
影場所に概ね対応し得るような精度で自動的に分類で
き、オフィスで働く人の映像による行動来歴の作成を支
援するシステムを実現できる。尚、本発明は、図1〜図
4を用いて説明した実施例に限定されるものではなく、
その要旨を逸脱しない範囲において種々変更可能であ
る。
【0032】
【発明の効果】本発明によれば、二つの2次元画像が、
同じ実世界をそれぞれ異なる位置から撮影したものであ
るか否かを、そこに含まれる3次元物体の画像から自動
的にかつ効率良く判別することができ、動画像の各フレ
ームを、それぞれ同じ実世界を写したものどうしに自動
的かつ効率良く分類することが可能である。
【図面の簡単な説明】
【図1】本発明の画像自動分類方法の本発明に係る処理
手順の一実施例を示すフローチャートである。
【図2】本発明の画像自動分類方法を適用する機器構成
例を示すブロック図である。
【図3】図2における機器を用いた映像による行動来歴
作成システムの構成例を示すブロック図である。
【図4】図1における処理手順による静止画像の分類結
果の計算機内部表現を可視化した例を示す説明図であ
る。
【符号の説明】
201:小型ビデオカメラ、202:制御部、203:
バス、204:メモリ、205:CPU、206:磁気
ディスク、207:インタフェィス部、208:ディス
プレイ、209:キーボード、210:マウス、30
2:静止・移動区間検出部、303:要約処理部、30
4:類似静止画検出部、305:移動区間処理部、30
6:要約結果、307:事象境界検出部、308:場所
同定部、309:場所テンプレート、401:静止画像
を分類する8次元空間を2次元平面へ投影する第一の座
標軸、402:静止画像を分類する8次元空間を2次元
平面へ投影する第二の座標軸、403:一つの静止画像
に対応する点、404:静止画像間で信頼性の高いマッ
チングが行われたことを示す辺、405:最小コスト部
分木。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 大平 栄二 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 藤澤 浩道 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 実世界の3次元対象を撮影した複数の2
    次元画像を、それぞれ同じ実世界の3次元対象を撮影し
    たものどうしに分類する画像自動分類方法であって、種
    々組合せた上記2次元画像のペアから、それぞれの2次
    元画像が同じ実世界の3次元対象を撮影したペアを判別
    して抽出し、該抽出した各ペアで同じ2次元画像を含む
    ペアを連鎖させ、該連鎖を辿ることにより、それぞれ同
    じ実世界の3次元対象を撮影した2次元画像どうしに分
    類することを特徴とする画像自動分類方法。
  2. 【請求項2】 請求項1に記載の画像自動分類方法にお
    いて、上記ペアの判別は、上記ペアを構成する第1の2
    次元画像における上記3次元対象の像に、同ペアを構成
    する第2の2次元画像における上記3次元対象の像が重
    なるよう、上記第2の2次元画像を変換する第1のステ
    ップと、該第1のステップで変換した第2の2次元画像
    と上記第1の2次元画像との類似度を、上記変換した第
    2の2次元画像の歪みの大きさを少なくとも含む評価値
    を用いて求める第2のステップとを少なくとも含み、上
    記第2のステップで求めた類似度が所定値に達していれ
    ば、上記第2の2次元画像を上記第1の2次元画像に類
    するものと判別することを特徴とする画像自動分類方
    法。
  3. 【請求項3】 請求項2に記載の画像自動分類方法にお
    いて、上記第2のステップで求める類似度を、上記変換
    した第2の2次元画像の歪みの大きさと、上記変換した
    第2の2次元画像と上記第1の2次元画像のそれぞれ同
    じ位置の画素のRGB値の差の大きさと、上記変換した
    第2の2次元画像と上記第1の2次元画像のそれぞれ重
    なり合う部分の大きさとを少なくとも含む評価値に基づ
    き求めることを特徴とする画像自動分類方法。
  4. 【請求項4】 請求項2、もしくは、請求項3のいずれ
    かに記載の画像自動分類方法において、上記第2のステ
    ップで求める類似度が最も高くなる、上記第2の2次元
    画像の変換に用いるパラメータを、確率的組合せ探索に
    より定めることを特徴とする画像自動分類方法。
  5. 【請求項5】 請求項2から請求項4のいずれかに記載
    の画像自動分類方法において、上記第2の2次元画像の
    変換に用いたパラメータで特定される辺の両端に、上記
    第1の2次元画像と上記第2の2次元画像を位置付け
    て、上記ペアをグラフ表現し、上記ペア間の各辺から一
    つの辺を選択して、該選択した辺で各2次元画像を連鎖
    させることを特徴とする画像自動分類方法。
  6. 【請求項6】 請求項5に記載の画像自動分類方法にお
    いて、上記ペア間の各辺からの一つの辺の選択は、貪欲
    法により上記ペア間の最小コスト極大部分木を順次きり
    だして行うことを特徴とする画像自動分類方法。
  7. 【請求項7】 請求項1から請求項6のいずれかに記載
    の画像自動分類方法において、上記ペアは、予め画素値
    に基づく比較でそれぞれ近似すると判定された2次元画
    像を組合せてなることを特徴とする画像自動分類方法。
  8. 【請求項8】 請求項1から請求項7のいずれかに記載
    の画像自動分類方法において、上記ペアを構成する2次
    元画像は、動画像データから切り出された静止画像から
    なることを特徴とする画像自動分類方法。
JP8323833A 1996-12-04 1996-12-04 画像自動分類方法 Pending JPH10162136A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8323833A JPH10162136A (ja) 1996-12-04 1996-12-04 画像自動分類方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8323833A JPH10162136A (ja) 1996-12-04 1996-12-04 画像自動分類方法

Publications (1)

Publication Number Publication Date
JPH10162136A true JPH10162136A (ja) 1998-06-19

Family

ID=18159112

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8323833A Pending JPH10162136A (ja) 1996-12-04 1996-12-04 画像自動分類方法

Country Status (1)

Country Link
JP (1) JPH10162136A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001155169A (ja) * 1999-11-24 2001-06-08 Nec Corp ビデオ画像の分割、分類、および要約のための方法およびシステム
JP2006136718A (ja) * 2004-11-10 2006-06-01 Agfa Gevaert Nv ブレンドされる画像の表示用デイスプレーデバイス
JP2006136724A (ja) * 2004-11-10 2006-06-01 Agfa Gevaert Nv デジタル画像上での測定の実施法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001155169A (ja) * 1999-11-24 2001-06-08 Nec Corp ビデオ画像の分割、分類、および要約のための方法およびシステム
JP2006136718A (ja) * 2004-11-10 2006-06-01 Agfa Gevaert Nv ブレンドされる画像の表示用デイスプレーデバイス
JP2006136724A (ja) * 2004-11-10 2006-06-01 Agfa Gevaert Nv デジタル画像上での測定の実施法
JP2011224388A (ja) * 2004-11-10 2011-11-10 Agfa Healthcare Nv デジタル画像上での測定の実施法

Similar Documents

Publication Publication Date Title
JP6798183B2 (ja) 画像解析装置、画像解析方法およびプログラム
JP4161659B2 (ja) 画像認識システム及びその認識方法並びにプログラム
US8861800B2 (en) Rapid 3D face reconstruction from a 2D image and methods using such rapid 3D face reconstruction
US7369687B2 (en) Method for extracting face position, program for causing computer to execute the method for extracting face position and apparatus for extracting face position
CN110675487B (zh) 基于多角度二维人脸的三维人脸建模、识别方法及装置
JP4597391B2 (ja) 顔領域検出装置およびその方法並びにコンピュータ読み取り可能な記録媒体
KR101781358B1 (ko) 디지털 영상 내의 얼굴 인식을 통한 개인 식별 시스템 및 방법
JP5574033B2 (ja) 画像認識システム及びその認識方法並びにプログラム
Jun et al. Robust real-time face detection using face certainty map
CN109190456B (zh) 基于聚合通道特征和灰度共生矩阵的多特征融合俯视行人检测方法
CN109902576B (zh) 一种头肩图像分类器的训练方法及应用
CN112528902B (zh) 一种基于3d人脸模型的视频监控动态人脸识别方法及装置
Zhu et al. A two-stage detector for hand detection in ego-centric videos
JP2002024811A (ja) 影成分除去装置
CN114926747A (zh) 一种基于多特征聚合与交互的遥感图像定向目标检测方法
CN109919128B (zh) 控制指令的获取方法、装置及电子设备
JP2018120283A (ja) 情報処理装置、情報処理方法及びプログラム
CN112801038B (zh) 一种多视点的人脸活体检测方法及系统
US11544926B2 (en) Image processing apparatus, method of processing image, and storage medium
KR20120020711A (ko) 물체 인식 시스템 및 그 물체 인식 방법
JP2002342758A (ja) 視覚認識システム
JPH10162136A (ja) 画像自動分類方法
JP2003168113A (ja) 画像認識システム、画像認識方法および画像認識プログラム
CN112016495A (zh) 人脸识别的方法、装置和电子设备
Atrevi et al. 3d human poses estimation from a single 2d silhouette