JP2919115B2 - 動き検出器 - Google Patents

動き検出器

Info

Publication number
JP2919115B2
JP2919115B2 JP12542991A JP12542991A JP2919115B2 JP 2919115 B2 JP2919115 B2 JP 2919115B2 JP 12542991 A JP12542991 A JP 12542991A JP 12542991 A JP12542991 A JP 12542991A JP 2919115 B2 JP2919115 B2 JP 2919115B2
Authority
JP
Japan
Prior art keywords
image
signal
motion
subject image
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP12542991A
Other languages
English (en)
Other versions
JPH0567213A (ja
Inventor
隆浩 福原
篤道 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP12542991A priority Critical patent/JP2919115B2/ja
Publication of JPH0567213A publication Critical patent/JPH0567213A/ja
Application granted granted Critical
Publication of JP2919115B2 publication Critical patent/JP2919115B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、動画像信号から3次
元構造を有する被写体画像の動き情報を高精度に検出す
る動き検出器に関するものである。
【0002】
【従来の技術】図7は例えば、「特開平2−55486
号」に掲載された従来の動きベクトル検出装置を示すも
のである。51は1フィールドの画像を記憶する画像記
憶手段であり、60は画像信号の入力、71は矩形ブロ
ックの出力、61及び62は71に出力する矩形ブロッ
クの基準座標のX成分及びY成分である。52は51と
同様の画像記憶手段であり、72は矩形ブロックの出
力、59及び70は72に出力する矩形ブロックの基準
座標のX成分及びY成分である。53は誤差演算手段で
あり、画像記憶手段51及び52から出力される矩形ブ
ロック間の誤差を求め、この値を73に出力する。55
は制御手段であり、66及び67から相対ベクトルのX
成分及びY成分をそれぞれ出力する。56及び57は相
対ベクトルのX成分及びY成分をラッチするレジスタで
ある。58及び59は加算器であり、画像記憶手段51
に入力する基準座標61、62から相対ベクトル66、
67を引き、69、70に出力する。63及び64は動
きベクトルのX成分及びY成分出力、65はフィールド
メモリ、68はレジスタ56及び57に相対ベクトルを
ラッチするためのストローブ信号である。以上のように
構成された動きベクトル検出装置について、以下その動
作について説明する。まず、連続する2つのフレームF
1、F2間で動きベクトルの検出を行うには、それぞれ
のフレームの同じフィールド、例えばF1の第1フィー
ルドと、F2の第1フィールドを用いる。これらの関係
を図8に示す。画像記憶手段51、フィールドメモリ6
5、画像記憶手段52はそれぞれ1フィールド分の信号
を記憶する。今、画像記憶手段52にF1の第1フィー
ルドが記憶されている時、フィールドメモリ65にはF
1の第2フィールドが、画像記憶手段51にはF2の第
1フィールドがそれぞれ記憶されている。F1、F2間
の動きベクトルを検出するためには、画像記憶手段51
に記憶されたF2の第1フィールドに矩形ブロックB2
を設定し、このブロックB2との誤差が最も小さい矩形
ブロックB1を画像記憶手段52に記憶されたF1の第
1フィールドから捜すことである。フィール内における
ブロックの位置は、図9のようにブロック左下の画素の
座標(基準座標)で表す。ブロックB2の基準座標とブ
ロックB1の基準座標の差を相対ベクトルV0とすれ
ば、ブロックB1とブロックB2の誤差が最小になる相
対ベクトルV0が、2つのブロック間の動きベクトルと
なる。
【0003】従来の、動き検出のための動きベクトル検
出装置は以上のように構成され、被写体画像の輝度情報
を用いたブロック単位の最適動きベクトル検出に止まっ
ていたため、被写体が3次元的な構造を有するに関わら
ず、2次元的な動きの検出にのみ有効である。
【0004】
【発明が解決しようとする課題】上記のように、従来の
動き検出器では、被写体画像、例えば人物がうなずいた
り、首を横に振った場合には、首の回転運動の動きを3
次元的に高精度に検出することができないという問題点
があった。
【0005】この発明は、かかる問題点を解決するため
になされたものであり、被写体画像に3次元的な複雑な
動きが連続して発生した場合でも、常に高精度に被写体
画像の動きを検出することを目的としている。
【0006】
【課題を解決するための手段】この第1の発明に係る動
き検出器は、デジタル信号化された現フレームの画像信
号と1フレーム前の画像信号をそれぞれ振り分けるスイ
ッチと、振り分けられた1フレーム前の画像信号より被
写体画像中の複数個の特徴点座標を抽出する第1の特
徴点抽出部と、上記現フレームの画像信号より前記1フ
レーム前の画像信号による被写体画像中における複数個
の特徴点と同様の被写体画像中の複数個の特徴点座標
を抽出する第2の特徴点抽出部と、抽出された各特徴点
座標より特徴点の動きベクトルを検出する動きベクト
ル検出部と、上記検出された動きベクトルを入力信号と
して入力する入力層、被写体画像の動き情報を学習し、
この学習に従って上記動きベクトルより被写体画像の3
次元運動情報を導き出す中間層、該3次元運転情報を出
力する出力層からなる3次元動き情報検出部とを設けた
ものである。
【0007】また、この第2の発明に係る動き検出器
は、現フレームの画像信号および1フレーム前の画像信
号による被写体画像の特徴点の個数を増やすことによ
り、被写体画像の動きに伴い、被写体画像の有する3次
元構造情報を抽出するものである
【0008】また、この第3の発明に係る動き検出器
は、3次元動き情報検出部を入力、中間、出力の各層か
ら構成し、上記3次元動き情報検出部における動き情報
の学習課程において、上記各層の入力、中間、出力の各
層のユニット数を変化させて行き、教師信号と出力信号
との誤差が許容範囲内にある中で、ユニット間の信号線
数の総和が最小となるように各層におけるユニット数を
定めるものである
【0009】
【作用】この第1の発明に係る動き検出器は、現フレー
ムの画像借号、1フレーム以上前の面像信号をそれぞれ
第1の特徴点抽出部、第2の特徴点抽出部に入力し、こ
れら特徴点抽出部にて各画像信号における被写体画像の
複数個の特徴点座標を抽して動きベクトル検出部に
クトルを算出し、この検出した動きベクトルを入力とし
て、動き情報について学習済みの3次元動き情報検出部
において被写体画像の3次元運動情報を検出するもので
ある。また、この他の発明によれば、各特徴点抽出部に
おいて抽出する特徴点の個数を増加することでより詳細
な動きベクトルを検出することになる。更に、他の発明
によれば、入力、中間、出力の各層におけるユニット数
を変化させ、教師信号と出力信号との誤差が許容範囲内
にあるものの中で、ユニット間の信号線数の総和が最小
となるものを各層のユニットとなる。
【0010】
【実施例】
実施例1. 図1はこの第1の発明の一実施例を示すブロック図であ
る。1は画像入力部、2はスイッチ(SW)、3は特徴
点抽出部、4は動きベクトル検出部、5は3次元情報動
き検出部、6はフレームメモリ(F.M.)である。ま
た、100はカメラ等からの画像入力、101はデジタ
ル化された画像信号、102は初期フレームの画像信
号、103はフレームメモリに蓄えておいた初期フレー
ムの画像信号、105は現フレームの抽出された特徴点
の座標情報、107は初期フレームの抽出された特徴点
の座標情報、106は検出された特徴点の動きベクトル
情報、108は検出された被写体画像の3次元的運動情
報である。
【0011】前記のように構成された動き検出器におけ
る詳細な説明を以下、図1を用いて説明してゆく。ま
ず、カメラ等からの入カ画像100を画像入力部1にお
いてデジタル信号化して、デジタル入力画像信号101
を得る。次に、面像入力の現フレーム番号をnで表す
と、n=0の時、即ち初期フレームの場合、スイッチ2
がONとなり、画像信号101がそのまま、画像信号1
02となりフレームメモリ6の入力となる。実際の動き
検出は、n>1の場台について求めるため、フレームメ
モリ6からの出力103は、1フレーム以上前の面像信
号となるが、信号の内容は常に初期フレームの画像信号
のままである。また、n>0の場合にはスイッチ2は常
にOFFのままで、画像信号102は無信号となる。
【0012】一方、現フレームの画像信号101は、被
写体画像が例えば人物の顔画像であった場合、特徴点抽
出部3において図2の点A、点B、点C、点D、点Eの
5点の位置座標が抽出され、特徴点座標情報105とな
って出力される。同様にして、n=0、即ち初期フレー
ムの画像信号103中の特徴点座標情報107が出力さ
れ、これら特徴点座標情報105(現フレーム、n>
0)及び107(n=0)が動きベクトル検出部4の両
入力となる。ここで特徴点の抽出法としては、従来、画
像処理の分野で行われている、エッジオペレータによる
手法、Laplacian of Gaussianと
ゼロ交差法等の手法があり、これらにより、抽出がある
程度自動に行える。図2はまた、異る2フレーム間の各
特徴点の移動する様子を図示したものであり、初期フレ
ームにおける被写体画像10が、nフレームにおいて被
写体画像11に移動したことを表している。今、点Aの
nフレーム目におけるx、y座標をXn(A)、Yn
(A)とすれば、動きベクトルdxn(A)、dyn
(A)は dxn(A)=Xn(A)−Xo(A) dyn(A)=Yn(A)−Yo(A) で表される。他の4点に関しても全く同様にして動きベ
クトルを求めることができる。以上の処理が、動きベク
トル検出部で行われ、5個の特徴点の動きベクトル情報
106が出力される。
【0013】次に、上記動きベクトル情報106は、3
次元動き情報検出部5の入力となる。3次元動き情報検
出部5では、例えば図3に示した通り、入力層、中間
層、出力層の3層構造からなる回路が組まれており(こ
の場合は中間層が1層)、上記の手法により検出した各
点の動きベクトル情報が入力されると、出力として3次
元運動情報、即ち、XYZ各軸回りの回転各θx、θ
y、θz及び平行移動距離Tx、Ty、Tzが得られ
る。
【0014】ここで、3次元動き情報検出部5に於ける
回路で、入力層のi番目のユニットから中間層のj番目
のユニットに至る重み係数をwij(0≦i≦10、0≦
j≦3)、中間層のj番目のユニットから出力層のk番
目のユニットに至る重み係数をWjk(0≦j≦3、0≦
k≦6)とする。これらの係数は、学習を行う際、出力
信号と教師信号との平均2乗誤差関数が最小となるよう
に、その値が変えられてゆく。これを一般には、ニュー
ラルネットワークモデルにおける誤差逆伝播理論(バッ
クプロパゲーション)という。
【0015】今回の、被写体画像の3次元的な動きを検
出するための学習は、以下の通りにして行う。まず、図
4に示すような、コンピュータグラフィックス技術によ
って正確に作成された人物頭部の3次元構造モデルを、
ある点を中心にしてXYZ各軸回りに指定した角度だけ
回転させ、さらに指定した距離だけ平行移動させる。次
に、変換後の該3次元構造モデル画像の5個の特徴点の
座標を抽出し、初期フレームからの動きベクトルを求め
る。以上の操作を、複数通りの回転角、平行移動距離に
対して行い、逐次動きベクトルを求める。これにより複
数フレーム分の回転角、平行移動距離及び動きベクトル
が得られることになる。具体的には、上記3次元構造モ
デル画像のXYZ各軸回りの回転角及び平行移動距離
は、例えば図5のように、角度が0度から30度まで3
度刻み、距離が1から30まで1ドット刻み、という具
合に与えることができる。他方、検出した5個の特徴点
の座標は、例えば図6のように、各点のXY座標がシー
ケンシャルに整列した構造となる。(図6の場合は0〜
28、29フレームのシーケンスである。)
【0016】上記の手法により求められた5個の特徴点
の動きベクトルを入力信号に、XYZ各軸回りの回転
角、平行移動距離を教師信号にして、バックプロパゲー
ション法により学習を行う。学習後の3次元動き情報検
出部5の内部のユニット間の重み係数値は、以後、動き
ベクトルが入力されると、積和計算が行われ、被写体画
像のXYZ各軸回りの回転角、及び平行移動距離の3次
元運動情報が出力されることになる。
【0017】 実施例2. 上記実施例1では、初期フレームの特徴点座標と、現フ
レームの特徴点座標とから動きベクトルを求めていた
が、初期フレームの代わりに、現フレーム(nフレー
ム)の1フレーム以上前のフレーム(n―1フレーム)
を用いることもできる。その場合、動きベクトル検出部
4における動きベクトル算出法は、例えば点Aの場合
は、 dxn(A)=Xn(A)―Xn―l(A) dyn(A)=Yn(A)―Yn―l(A) となる。さらには3次元動き情報検出部5の学習課程
も、実施例1の場合とは異なる入力信号に対して行われ
ることになる。
【0018】実施例3.また上記実施例1では、特徴点
は、被写体が人物の場合には比較的抽出が容易な位置に
ある、点A、B、C、D、E、Fを用いたが、被写体に
よっては別の特徴点であってもよい。
【0019】実施例4.また上記実施例1では、3次元
動き情報検出部5の3層構造は、10−3−6とした
が、実験の結果、入力を3特徴点のXY座標にし、6−
3−6の構造としても十分であることが明かとなった。
この場合、特徴点抽出部での作業は5点から3点で済む
ために高速化が実現できる。さらに、一般性を持たせる
ために、3次元動き情報検出部5における動き情報の学
習課程において、入力、中間、出力の各層のユニット数
を変化させ、教師信号と出力信号との誤差が許容範囲内
にある中で、ユニット間の信号線数の総和が最小になる
ように、入力、中間、出力の各層におけるユニット数を
決定すればよい。すなわち、入力、中間、出力の各層に
おけるユニット数をそれぞれI、JKとすれば、ユニッ
ト間の信号線数の総和Lは、L=I×J+J×Kとな
る。このLの値が最小になる各ユニットをもって最終的
な構造とすればよい。
【0020】実施例5.また上記実施例1では、コンピ
ュータ・グラフィックスを用いた3次元構造モデルの回
転、平行移動変換により、回転角、平行移動変換によ
り、回転角、平行移動距離を教師信号として得ていた
が、実際の人物の頭部運動を行い、高精度に抽出した3
次元運動情報を教師信号として用いて、学習を実行させ
てもよい。
【0021】実施例6.また上記実施例1では、3次元
動き情報検出部の教師信号として、XYZ各軸回りの回
転角は0度から30度まで3度刻みに、、平行移動距離
は1から30まで1度刻みに、それぞれ独立に値を変え
て与えていたが、被写体画像が動くと考えられるすべて
の範囲を予め教師信号のデータとして与え、学習を行う
場合には、教師信号のデータ数が大きくなるが、さらに
高精度な動き検出が実現できる。
【0022】実施例7.入力画像中の複数の被写体画像
の動きの範囲と動きのパターンを予め3次元動き情報検
出部において学習させ、学習後、各々の被写体画像の動
きを別個に検出する適応化器を備えてもよい。
【0023】実施例8.3次元動き情報検出部を、ニュ
ーロ・チップを用いた高速化回路で構成することも可能
である。
【0024】
【発明の効果】上記のようにこの発明による動き検出器
によれば、2フレーム分の画像信号を用いて被写体画像
の動きベクトルを検出するために、非常に安定した動き
ベクトル検出が行えるとともに初期フレームと現フレー
ムの2フレームの被写体画像中の特徴点の座標値から、
動きベクトルを検出しているので、入力画像が、駒落と
しされたフレーム間隔の長い場合においても、高精度な
動き検出が可能となる。
【0025】また、上記により検出した動きベクトルを
入力として、動き情報について学習済みの、動き検出部
において被写体画像の3次元運動情報を検出するため
に、非常に高精度な検出が行える。
【0026】また、この他の発明によれば、入力画像中
の被写体画像の特徴点の個数を増やすことにより、被写
体画像の動きに伴い、被写体画像の有する3次元構造情
報を抽出することで、より微妙な3次元構造情報を抽出
することができる。
【0027】更に、またこの他の発明によれば、3次元
動き情報検出部を入力、中間、出力の各層から構成し、
上記3次元動き情報検出部における動き情報の学習課程
において、上記各層の入力、中間、出力の各層のユニッ
ト数を変化させ、教師信号と出力信号との誤差が許容範
囲内にあるものの中で、ユニット間の信号線数の総和が
最小となるものを各層のユニットとして定めることで、
特徴点抽出部での抽出特徴点を削減をすることができ各
処理の高速化が計れる。
【図面の簡単な説明】
【図1】この発明の実施例1を示す動き検出器のブロッ
ク図である。
【図2】被写体画像(人物の肩上画像)の5個の特徴点
及び2フレーム間の動きを表す図である。
【図3】3次元動き情報検出部の構造を表す図である。
【図4】コンピュータグラフィックス技術を用いて作成
した3次元構造モデルの合成画像である。
【図5】3次元構造モデル画像のXYZ各軸回りの回転
角、及び平行移動距離で、3次元動き情報検出部の教師
信号である。
【図6】検出された、5特徴点の座標情報である。(複
数フレーム分)
【図7】従来の動きベクトル検出装置のブロック図であ
る。
【図8】動きベクトルを検出するフィールドとブロック
の関係を示す説明図である。
【図9】フィールド内におけるブロックの基準座標を示
す説明図である。
【符号の説明】
1 画像入力部 2 スイッチ 3 特徴点抽出部 4 動きベクトル検出部 5 3次元動き情報検出部 6 フレームメモリ 101 デジタル化された画像入力(現フレーム) 102 デジタル化された画像入力(初期フレーム) 103 デジタル化された画像入力(初期フレーム)
を1フレーム分遅延させたもの 105 現フレームの被写体画像の特徴点座標 106 現フレームの検出された動きベクトル 107 初期フレームの被写体画像の特徴点座標 108 3次元運動情報

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 デジタル信号化された現フレームの画像
    信号と1フレーム前の画像信号をそれぞれ振り分けるス
    イッチと、振り分けられた1フレーム前の画像信号より
    被写体画像中の複数個の特徴点座標を抽出する第1の
    特徴点抽出部と、上記現フレームの画像信号より前記1
    フレーム前の画像信号による被写体画像中における複数
    個の特徴点と同様の被写体画像中の複数個の特徴点
    標を抽出する第2の特徴点抽出部と、抽出された各特徴
    座標より特徴点の動きベクトルを検出する動きベク
    トル検出部と、上記検出された動きベクトルを入力信号
    として入力する入力層、被写体画像の動き情報を学習
    し、この学習に従って上記動きベクトルより被写体画像
    の3次元運動情報を導き出す中間層、該3次元運転情報
    を出力する出力層からなる3次元動き情報検出部とを備
    えたことを特徴とする動き検出器。
  2. 【請求項2】 現フレームの画像信号および1フレーム
    前の画像信号による被写体画像の特徴点の個数を増やす
    ことにより、被写体画像の動きに伴い、被写体画像の有
    する3次元構造情報を抽出することを特徴とする請求項
    1記載の動き検出器。
  3. 【請求項3】 3次元動き情報検出部を入力、中間、出
    力の各層から構成し、上記3次元動き情報検出部におけ
    る動き情報の学習課程において、上記各層の入力、中
    間、出力の各層のユニット数を変化させて行き、教師信
    号と出力信号との誤差が許容範囲内にある中で、ユニッ
    ト間の信号線数の総和が最小となるように各層における
    ユニット数を定めることを特徴とする請求項1記載の動
    き検出器。
JP12542991A 1991-04-26 1991-04-26 動き検出器 Expired - Fee Related JP2919115B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12542991A JP2919115B2 (ja) 1991-04-26 1991-04-26 動き検出器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12542991A JP2919115B2 (ja) 1991-04-26 1991-04-26 動き検出器

Publications (2)

Publication Number Publication Date
JPH0567213A JPH0567213A (ja) 1993-03-19
JP2919115B2 true JP2919115B2 (ja) 1999-07-12

Family

ID=14909881

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12542991A Expired - Fee Related JP2919115B2 (ja) 1991-04-26 1991-04-26 動き検出器

Country Status (1)

Country Link
JP (1) JP2919115B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0181031B1 (ko) * 1995-03-20 1999-05-01 배순훈 움직임 보상된 인터폴레이션에서의 엣지 보상 장치
KR0178229B1 (ko) * 1995-08-08 1999-05-01 배순훈 특징점에 근거한 화소단위 움직임 추정을 이용한 영상 처리 장치
KR0178230B1 (ko) * 1995-08-08 1999-05-01 배순훈 특징점에 의한 움직임 추정을 이용한 영상 처리 장치

Also Published As

Publication number Publication date
JPH0567213A (ja) 1993-03-19

Similar Documents

Publication Publication Date Title
Byravan et al. Se3-nets: Learning rigid body motion using deep neural networks
Gao et al. Dual-hand detection for human–robot interaction by a parallel network based on hand detection and body pose estimation
US6554431B1 (en) Method and apparatus for image projection, and apparatus controlling image projection
JP3768174B2 (ja) ワーク取出し装置
Dudek et al. Vision-based robot localization without explicit object models
CN113221647B (zh) 一种融合点云局部特征的6d位姿估计方法
CN109086663B (zh) 基于卷积神经网络的尺度自适应的自然场景文本检测方法
CN109934183B (zh) 图像处理方法及装置、检测设备及存储介质
CN111667535A (zh) 一种针对遮挡场景下的六自由度位姿估计方法
CN112085789A (zh) 位姿估计方法、装置、设备及介质
CN111199207A (zh) 基于深度残差神经网络的二维多人体姿态估计方法
CN114724185A (zh) 一种轻量型的多人姿态跟踪方法
EP0604687B1 (en) Method for deriving character features in a character recognition system
CN115451964A (zh) 基于多模态混合特征的船舶场景同时建图与定位方法
CN116385660A (zh) 室内单视图场景语义重建方法及系统
JP2919115B2 (ja) 動き検出器
KR20230150867A (ko) 얼굴 표정, 신체 자세 형상 및 의류 퍼포먼스 캡처를 위해 암시적 구별가능 렌더러를 사용하는 멀티뷰 신경 사람 예측
Herpers et al. Detection and tracking of faces in real environments
CN114119753A (zh) 面向机械臂抓取的透明物体6d姿态估计方法
JP7051751B2 (ja) 学習装置、学習方法、学習モデル、検出装置及び把持システム
CN114201985A (zh) 一种人体关键点的检测方法及装置
Gadhiya et al. Analysis of deep learning based pose estimation techniques for locating landmarks on human body parts
CN116485953A (zh) 数据处理方法、装置、设备和可读存储介质
CN115496859A (zh) 基于散乱点云交叉注意学习的三维场景运动趋势估计方法
CN115205750A (zh) 基于深度学习模型的运动实时计数方法和系统

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080423

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090423

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100423

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees