JP3083379B2

JP3083379B2 - ニューラルネットワークを用いた動画像処理装置

Info

Publication number: JP3083379B2
Application number: JP03328949A
Authority: JP
Inventors: 敏英渡辺; 祥尚磯部
Original assignee: Japan Broadcasting Corp
Current assignee: Japan Broadcasting Corp
Priority date: 1991-12-12
Filing date: 1991-12-12
Publication date: 2000-09-04
Anticipated expiration: 2015-09-04
Also published as: JPH06162197A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、動画像中の動き情報を
正確に抽出することのできるニューラルネットワークを
用いた動画像処理装置に関する。

【０００２】［発明の概要］本発明は、動画像中の移動
物体の速度ベクトルの算出及び移動物体領域の自動抽出
をニューラルネットワークを用いて行う技術に関するも
ので、画像をブロック分割し、ブロック毎の速度ベクト
ルの候補にニューロンを割り当てたニューラルネットで
各ブロックの速度ベクトルを並列に演算するニューラル
ネットワークを用いることにより、速度ベクトルを正確
に求めるとともに、速度ベクトルに基づいて画像中の移
動物体領域を正確に抽出できるようにしたものである。

【０００３】

【従来の技術】従来、この種の画像中の動きベクトルや
動物体領域等の動き情報を抽出する方法としては、例え
ば、B.K.P.Horn and B.G.Schunk,“Determing optical
flow”,Artificial Intelligence,Vol.17,pp185-203(19
81) やJ.Hutchinson他“Computing Motion Using Analo
g and Binary Resistive Networks ”,IEEE Computer V
ol.21,No3,pp52-63,(1988)等に示されるように、各画素
毎に速度ベクトルを求めるものが知られている。

【０００４】

【発明が解決しようとする課題】しかしながら、上記従
来の方法では、動画像中の速度場を求める場合、各画素
毎に速度ベクトルを計算するため計算量が膨大になる。

【０００５】また、動画像中の移動物体により生じる移
動物体背影の隠蔽領域、出現領域を考慮していないた
め、速度場の不連続部分での速度見積りに大きな誤差を
生じるとともに、速度ベクトルに基づいた動画像中から
の移動物体の抽出精度が悪くなるという問題点があっ
た。

【０００６】一方、上記従来技術で提案される方法をホ
ップフィールドタイプやボルツマンマシンタイプ等のニ
ューラルネットワークを使用して実現することも知られ
ている。

【０００７】しかしながら、このニューラルネットワー
クを用いる従来方法では、速度ベクトルを水平方向、垂
直方向の各成分に分けて計算するために、ニューラルネ
ットワーク構成が複雑になるとともに、正確な移動物体
の抽出が困難になる等の欠点があった。

【０００８】本発明は、上記事情に鑑みてなされたもの
であり、その目的は、動画像中の速度場を正確に求め、
その速度場により移動物体領域を抽出することのできる
ニューラルネットワークを用いた動画像処理装置を提供
することにある。

【０００９】

【課題を解決するための手段】上記目的を達成するため
に本発明は、動画像中の移動物体の速度ベクトルの演算
及び移動物体の抽出をする動画像処理装置において、前
記動画像における現フレーム画像及び次フレーム画像を
それぞれ複数のブロックに分割する手段と、ブロック分
割された各ブロック画像を入力し、ブロックマッチング
によってニューラルネットワークに供給されるバイアス
入力を演算する手段と、ブロック分割された画像のそれ
ぞれの２次元的速度ベクトルを表現する複数個のニュー
ロンブロックを備えるとともに、互いに隣接し合うニュ
ーロンブロックを相互に結合して構成され、前記バイア
ス入力に基づいて並列に速度ベクトルを演算するニュー
ラルネットワークと、求められた速度ベクトルに基づい
てフレーム画像中の移動物体を自動抽出する手段とを具
備することを特徴としている。

【００１０】また、前記バイアス入力演算手段は、マッ
チング誤差が所定値以上の画素に対してはマッチングに
寄与しない処理をすることを特徴としている。

【００１１】

【作用】上記の構成によれば、現フレーム画像と次フレ
ーム画像をそれぞれ複数のブロックに分割し、各ブロッ
ク画像のブロックマッチング処理を行う。その結果をニ
ューラルネットワークに導き速度ベクトルを並列演算す
る。そして、演算された速度ベクトルに基づいてフレー
ム画像中の移動物体が自動抽出される。

【００１２】また、ブロックマッチングの誤差が所定以
上の画素は、マッチングに寄与されないことにより背景
画像が隠蔽される領域を考慮した処理がされるので、速
度ベクトル見積り精度および動画像抽出精度が向上す
る。

【００１３】

【実施例】図１は本発明に係るニューラルネットワーク
を用いた動画像処理装置の一実施例構成を示すブロック
図、図２はニューロンブロックの構成例を示すブロック
図、図３はニューラルネットワークの構成例を示すブロ
ック図である。

【００１４】初めに本発明の原理を説明する。ニューラ
ルネットワークは、ある最適化問題において、あるエネ
ルギー評価関数を最小化する過程で解を求めることがで
きることが知られている（例えば、高木他監修「画像解
析ハンドブック」、東京大学出版会（１９９１）、ｐｐ
１９０−１９６参照）。

【００１５】今、画像を図４に示すように、適当なブロ
ックに分割する。ここで、画素単位の座標を（ｉ，
ｊ）、ブロック単位の座標を（ｘ，ｙ）で表わす。

【００１６】次に、図５に示すように、ブロック（ｘ，
ｙ）にブロックの速度ベクトルを表わすｋ個の速度ベク
トル（ＵＣ_m，ＶＣ_m）（ｍ＝１，２，…，ｋ）用ニュ
ーロンＮＥＵ_xymを割り当てる。即ち、ある速度ベクト
ル用ニューロンＮＥＵ_xynのみの出力が“１”であり、
他は全て“０”の場合、そのブロックの速度ベクトルは
（ＵＣ_n，ＶＣ_n）であるとする。このように、各ニュ
ーロンＮＥＵ_xymの出力Ｏ_xymは“０”か“１”の２値
をとるものとする。なお、図５は、１ブロックが５×５
＝２５画素の速度ベクトルを表現できる例を示し、点Ｐ
は水平１画素、垂直２画素／フレームの２次元速度ベク
トルに対応している。

【００１７】このとき、ブロック（ｘ，ｙ）に対するニ
ューロンブロックを示したのが図２である。この図２
は、ブロック（ｘ，ｙ）に対してニューロン２個、即ち
速度ベクトル２個を表現できるニューロンブロックの例
であり、２個の出力線、１個のノイズ入力線、４組（各
組２本）の隣接ブロックのニューロン出力からの入力
線、２個のバイアス入力線、４組（各組４個）の乗算器
係数（ウエイト）入力線及び２個のニューロンから成っ
ている。

【００１８】このニューロンブロックは、図３に示すよ
うなニューラルネットワークを構成し、互いに隣接した
上下左右の４個のニューロンブロックに接続される。な
お、図３では、図面の簡単化のため、図２で示される各
ニューロンブロックの出力線及び隣接ニューロンブロッ
クからの入力線のみを示している。

【００１９】このように構成されたニューラルネットワ
ークは、次の（１）式で示すエネルギー評価関数Ｅを最
小にするように定常状態に収束することが知られてい
る。

【００２０】 ΔＶ_mm' ²＝ｍｉｎ｛（ｕｃ_m−ｕｃ_m'）²＋（ｖｃ_m−ｖｃ_m'）²，Ｖｔ² ｝ ……（３）ここで、Ｖｔは速度最小値のしきい値、ｆ（・），ｇ
（・）はそれぞれ現フレーム、次フレームの各画素の輝
度信号とする。

【００２１】（１）式中、第１項はマッチング誤差の小
さいニューロンが発火しやすくなるように働き、第２
項、第３項は、各々水平方向、垂直方向の速度ベクトル
を平滑化するように働く。ここで、αは、平滑化を行う
程度を示すパラメータである。図２中、係数Ｗ
_xymx'y'm'入力線は、（ｘ，ｙ）ブロックのニューロン
ＮＥＵ_x'y'm'の入力とを結ぶ結合重みＷ_xymx'y'm'を入
力するものである。バイアスには、 θ_xym＝（−１）×ＭＥ_xym ……（４）が入力される。また、ノイズ入力線を介して、Ｔ_mp×noise ……（５）がノイズとして入力される。ここで、Ｔ_mpはアニーリン
グ温度、noise は平均０、分散１のガウシアンノイズで
あり、Ｔ_mpは時間とともに指数関数的に減少させてゆく
ものである。

【００２２】図３中のニューロンＮＥＵ_xymへの入力
は、次式で与えられることがわかる。また出力は、

【数１】図３に示したニューラルネットワークは、定常状態に達
すると、それぞれのニューロンブロックからの出力Ｏ
_xymが各ブロックの速度ベクトルを表わしており、その
値を読み取ることにより動画像中の各ブロックの速度場
が求められることになる。

【００２３】以上の例で示したニューラルネットワーク
を用いた動画像処理装置を図１を参照して説明する。

【００２４】現フレーム画像メモリ１に蓄積された現フ
レームの動画像は、帯域フィルタ２を通してフィルタリ
ングされた後、ブロック分割部３によりブロック分割さ
れる。同様に、次フレーム画像メモリ４に蓄積された次
フレーム画像も、帯域フィルタ５を通してフィルタリン
グされた後、ブロック分割部６によりブロック分割され
る。

【００２５】こうして、ブロック分割された現フレーム
および次フレームは、ブロックマッチング部７に供給さ
れ、このブロックマッチング部７により、各ブロック毎
に（２）式に基づいてＭＥ_xymが計算される。

【００２６】ＭＥ_xym＝Σ｛｜ｇ（ｉ＋ｕｃ_m，ｊ＋ｖｃ_m）−ｆ（ｉ，ｊ）｜｝…（２）こうして計算された各ＭＥ_xymは、ニューラルネットワ
ーク８にバイアス入力としてバイアス入力線を介して供
給される。

【００２７】一方、速度誤差演算部９では、各ニューロ
ンブロック間の速度差ΔＶ_mm' ²が（３）式によりブロ
ック毎に計算される。

【００２８】 ΔＶ_mm' ²＝ｍｉｎ｛（ｕｃ_m−ｕｃ_m'）²＋（ｖｃ_m−ｖｃ_m'）²，Ｖｔ² ｝ ……（３）こうして計算されたΔＶ_mm' ²は、ニューラルネットワ
ーク８の係数Ｗ_xymx'y _'m'からの入力線を介して入力さ
れる。

【００２９】また、ノイズ発生部１０からは、ニューラ
ルネットワーク８に対して、時間的に指数関数的に減少
するノイズが供給されている。

【００３０】この状態において、ニューラルネットワー
ク８は、一定時間後に定常状態になり、各ニューロンブ
ロックからの出力Ｏ_xymは一定値に収束するが、それぞ
れの値を各ブロックの速度ベクトルとして速度分布メモ
リ１１に蓄える。この速度分布メモリ１１に蓄えられた
情報が、動画像の速度分布になる。次に、速度差しきい
値処理部１２では、ある一定値以上の速度分布を持った
ブロックのみを表示することにより動画像中から移動物
体のみが自動抽出される。

【００３１】このように、本実施例によれば、動画像の
速度分布を正確に求めることができ、また、速度分布か
ら精度の高い移動物体の自動切り出しが可能となる。

【００３２】以上の作用効果をさらに具体的に説明する
と、今、図６に示すようなテレビジョン画像から移動物
体の速度分布を求めた後、移動物体領域を自動抽出する
例を説明する。図６（Ａ）は現フレーム画像を示し、図
６（Ｂ）は次フレーム画像を示しており、模型の汽車が
左から右に約１３画素／フレームで移動しているものと
する。図６の各画像をブロック分割した例を図７に示
す。これら画像を入力とし、本発明のニューラルネット
ワークで処理し、速度ベクトル分布を示したものが図８
である。ほぼ模型の汽車の部分が左から右へ１３画素／
フレームの速度ベクトルを示している。更に、この速度
分布をある一定値以上の速度分布のみのブロックを表示
するためのしきい値処理をした結果を図９に示す。以上
の結果より本実施例によれば、動画像中の移動物体の速
度分布を正確に求めることができ、また速度分布より移
動物体領域の自動抽出が可能であることが確認された。

【００３３】次に本発明の他の実施例について説明す
る。

【００３４】移動物体によっては背景が隠蔽される領域
が存在するが、現フレーム画像と次フレーム画像のブロ
ックマッチングを行って、前記実施例のように（２）式
のＭＥ_xymを計算すると、隠蔽された部分では、ＭＥ
_xymに非常に大きな誤差を生じる。このため、マッチン
グ誤差がｍ＋以上の画素はマッチングに寄与しないよう
な処理を行うことにより、更に速度見積り、移動物体抽
出の精度を向上させることができる。これは、図１のブ
ロックマッチング部において、ＭＥ_xymを計算する代わ
りに、を計算した後、これをニューラルネットワークに入力す
るように構成すれば良い。

【００３５】

【発明の効果】以上説明したように本発明によれば、簡
単なニューラルネットワーク構成により動画像中の速度
場を正確に求めることができ、その速度場から移動物体
領域を精度良く自動抽出することが可能となる。

【図面の簡単な説明】

【図１】本発明に係るニューラルネットワークを用いた
動画像処理装置の一実施例構成を示すブロック図であ
る。

【図２】ニューロンブロックの構成例を示すブロック図
である。

【図３】ニューラルネットワークの構成例を示すブロッ
ク図である。

【図４】画像のブロック分割例を示す説明図である。

【図５】ブロックの動きベクトルを表現する動きベクト
ル候補点の例を示す説明図である。

【図６】本発明の効果を確認するためのテレビジョン画
像を示す写真である。

【図７】図６に示すテレビジョン画像をブロック分割し
た場合を示す写真である。

【図８】図６に示すテレビジョン画像の速度分布を示す
説明図である。

【図９】図８に示す速度分布から移動物体領域を自動抽
出した例を示す写真である。

【符号の説明】

１，４フレーム画像メモリ２，５帯域フィルタ３，６ブロック分割部７ブロックマッチング部８ニューラルネットワーク９ブロック速度誤差演算部１０ノイズ発生部１１速度分布メモリ１２速度しきい値処理部

フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06T 7/00 G06T 7/20 G06F 15/18 560 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】動画像中の移動物体の速度ベクトルの演
算及び移動物体の抽出をする動画像処理装置において、前記動画像における現フレーム画像及び次フレーム画像
をそれぞれ複数のブロックに分割する手段と、ブロック分割された各ブロック画像を入力し、ブロック
マッチングによってニューラルネットワークに供給され
るバイアス入力を演算する手段と、ブロック分割された画像のそれぞれの２次元的速度ベク
トルを表現する複数個のニューロンブロックを備えると
ともに、互いに隣接し合うニューロンブロックを相互に
結合して構成され、前記バイアス入力に基づいて並列に
速度ベクトルを演算するニューラルネットワークと、求められた速度ベクトルに基づいてフレーム画像中の移
動物体を自動抽出する手段と、を具備することを特徴とするニューラルネットワークを
用いた動画像処理装置。
【請求項２】前記バイアス入力演算手段は、マッチン
グ誤差が所定値以上の画素に対してはマッチングに寄与
しない処理をすることを特徴とする請求項１記載のニュ
ーラルネットワークを用いた動画像処理装置。