JP2008102589A

JP2008102589A - 動画像処理装置および動画像処理方法ならびに動画像処理プログラム

Info

Publication number: JP2008102589A
Application number: JP2006282496A
Authority: JP
Inventors: Nobuyuki Matsui; 伸之松井; Naotake Kamiura; 尚武上浦; Teijiro Isogawa; 悌次郎礒川; Yuzo Ogawa; 雄三小川; Akitsugu Otsuka; 晃嗣大塚; Kenji Iwatani; 憲司岩谷
Original assignee: Toa Corp
Current assignee: Toa Corp
Priority date: 2006-10-17
Filing date: 2006-10-17
Publication date: 2008-05-01
Also published as: WO2008047774A1

Abstract

【課題】自己組織化マップを用いて動画像中の移動物体を検知する、新規な動画像処理装置を提供する。
【解決手段】カメラ２０から出力されたコンポジットビデオ信号は、入力変換部５０によって、カラー画像データに変換される。そして、このカラー画像データは、画像分割部５２および枠設定部５６を介して、特徴抽出部５８に入力される。特徴抽出部５８は、入力されたカラー画像データのｎ次元の特徴を抽出し、抽出された特徴データは、制御部６０に入力される。制御部６０は、マップ６２と共に、ブロック単位学習型の自己組織化マップを構成し、当該マップ６２に特徴データを印加することで、それぞれの画素が移動物体領域および背景領域のいずれを形成するのかを識別する。そして、この識別結果に基づいて、移動物体領域のみがモニタ４０に表示されるように、出力変換部７０を制御する。
【選択図】図３

Description

本発明は、動画像処理装置および動画像処理方法ならびに動画像処理プログラムに関し、特に自己組織化マップ（Self-Organizing Maps；以下、ＳＯＭと言う。）を用いて動画像中の移動物体を検知する動画像処理装置および動画像処理方法ならびに動画像処理プログラムに関する。

ＳＯＭは、多次元のデータを、その位相関係を維持しつつ、２次元状のマップに写像するものであり、例えば、未知のデータを分類するのに用いられる。そして、このＳＯＭを発展させた技術として、従来、例えば、特許文献１に開示されたものがある。この特許文献１に開示された従来技術によれば、マップを構成する複数のセルが、その集合体であるブロック単位で扱われ、つまり、当該ブロック単位で学習が行なわれると共に、当該ブロックのベクトルデータに基づいて未知データが分類される。これにより、セル単体で学習が行なわれると共に、当該セル単体のベクトルデータに基づいて未知データが分類される、という言わば一般のＳＯＭに比べて、より正確な学習および未知データの分類が実現される、とされている。

さらに、特許文献２には、主たるマップである未学習マップの他に擬似マップが設けられており、この擬似マップにより学習が逐一行なわれ、全ての学習データに基づく学習が行なわれた後、一括して、当該擬似マップによる学習結果が未学習マップに反映される技術が、開示されている。そして、この特許文献２に開示された従来技術によれば、擬似マップによる学習が行なわれている最中に、未学習マップを構成する各セルのベクトルデータが変化することはないので、当該各セルのベクトルデータに基づく未知データの分類が常に正確に行なわれる、とされている。なお、この特許文献２に開示された従来技術は、特許文献１に開示された従来技術と同様、マップを構成する各セルがブロック単位で扱われる場合にも適用可能である、とされている。

特開２００６−５３８４２号公報特開２００６−７９３２６号公報

ところで、一般のＳＯＭにおいては、学習に先立って、各種パラメータの設定が必要であり、しかも、最重要とされる学習係数および近傍の広さというパラメータは、学習が進行するに連れて単調に減少する。従って、学習中に学習データが変化する場合や、新たな学習データが追加される場合に、当該学習係数および近傍の広さが適切に対応することができず、つまり正確な学習が行われない、という不都合が生じる。

これに対して、各特許文献１および２に開示された従来技術では、各セルがブロック単位で扱われることによって、上述の学習係数や近傍の広さのような単調減少性のパラメータが排除される。従って、学習中に学習データが変化する場合や、新たな学習データが追加される場合にも、十分に対応することができる。これは、即ち、時々刻々と変化する動画像のデータを学習データとして採用しつつ、当該動画像を構成する各画素が移動物体領域および非移動物体領域のいずれを形成しているのかを識別すること、言い換えれば移動物体を検知すること、への応用が期待されることを、意味する。

そこで、本発明は、ＳＯＭを用いて動画像中の移動物体を適確に検知することができる新規な動画像処理装置および動画像処理方法ならびに動画像処理プログラムを提供することを、目的とする。

この目的を達成するために、第１の発明の動画像処理装置は、移動物体領域を形成する画素と非移動物体領域を形成する画素とを含む画像データが入力され、この画像データのｎ（ｎ；複数）個の特徴を当該画素ごとに抽出してｎ次元の第１ベクトルデータを生成する抽出手段と、２次元状に配置されておりそれぞれｎ次元の第２ベクトルデータを有すると共に移動物体領域および非移動物体領域のいずれか一方のクラスに属する複数のニューロンを含むマップと、を具備する。さらに、互いに隣り合う一部のニューロンから成る複数のブロックのうち、それぞれを構成する当該ニューロンの第２ベクトルデータの統計である第３ベクトルデータが第１ベクトルデータに対応する勝者ブロックを、画素ごとに探索する探索手段と、勝者ブロックを構成するニューロンの属するクラスに基づいてそれぞれの画素が移動物体領域および非移動物体領域のいずれを形成するのかを識別する識別手段と、この識別手段による識別結果およびそれぞれの画素の第１ベクトルデータに基づいて当該画素に対応する勝者ブロックを構成するニューロンの第２ベクトルデータおよびクラスを更新する更新手段と、をも具備する。そして、更新手段によって全ての画素に基づく更新が行なわれた後、動画像を構成する新たな画像データが抽出手段に入力される、というものである。

即ち、この第１の発明では、画像データを構成するそれぞれの画素ごとに、ｎ個の特徴が、抽出手段によって抽出される。そして、抽出手段は、抽出したｎ個の特徴を表すｎ次元の第１ベクトルデータを、それぞれの画素ごとに生成する。その一方で、マップを構成する各ニューロンは、それぞれｎ次元の第２ベクトルデータを有すると共に、移動物体領域および非移動物体領域のいずれかのクラスに属している。そして、探索手段によって、互いに隣り合う一部のニューロンの集合体である複数のブロックが組み立てられると共に、これら複数のブロックの中からそれぞれの画素に対応する勝者ブロックが当該画素ごとに探索される。具体的には、それぞれの画素ごとに、その第１ベクトルデータに最も対応する第３ベクトルデータを有するブロック、より具体的には、当該第１ベクトルデータとの間のユークリッド距離が最も短い第３ベクトルデータを有するブロック、が勝者ブロックとされる。なお、第３ベクトルデータとは、それぞれのブロックを構成するニューロンの第２ベクトルデータの統計であり、例えば平均値である。そして、勝者ブロックを構成する各ニューロンの属するクラスに基づいて、それぞれの画素が移動物体領域および非移動物体領域のいずれを形成するのかが、識別手段によって識別される。さらに、この識別手段による識別結果およびそれぞれの画素の第１ベクトルデータに基づいて、それぞれの画素に対応する勝者ブロックを構成するニューロンの第２ベクトルデータおよびクラスが、更新手段によって更新され、言わば学習される。そして、この更新手段によって全ての画素に基づく学習が行われた後、動画像を構成する新たな画像データが抽出手段に入力される。つまり、画像データを構成する各画素の識別、および当該識別後の各画素に基づく学習が、継続して行われる。

なお、この第１の発明においては、識別手段によって移動物体領域を形成すると識別された画素のみを表示させる表示手段を、さらに備えてもよい。このようにすれば、動画像のうち移動物体のみを取り出して、表示させることができる。

また、探索手段は、互いに同サイズの複数のブロックのうち第３ベクトルデータが第１ベクトルデータに対応する勝者候補ブロックをそれぞれの画素ごとに探索する勝者候補探索手段と、この勝者候補探索手段によって探索された勝者候補ブロック内においてよりサイズの小さい別の勝者候補ブロックを順次探索するように当該勝者候補探索手段による探索を当該画素ごとに繰り返し実行させる繰り返し実行手段と、勝者候補探索手段による探索が繰り返し実行されることによって探索された複数の勝者候補ブロックのうち第３ベクトルデータが最も第１ベクトルに対応するものを勝者ブロックとして当該画素ごとに決定する決定手段と、を含むものであってもよい。つまり、この構成によれば、いわゆる決定木方式により、互いにサイズの異なる複数の勝者候補ブロックが順次探索される。そして、これら複数の勝者候補ブロックの中から、真の勝者ブロックが決定される。このように、勝者ブロックの探索に決定木方式を採用することによって、当該勝者ブロックの探索に要する演算量が低減され、探索手段の負担が軽減される。このことは、探索手段を含む動画像処理装置全体の処理速度を向上させるのに、極めて有効である。

さらに、更新手段は、識別手段によって全ての画素に基づく識別が行なわれた後に、一括して、言わばバッチ的に、当該全ての画素に基づく更新を行うものとしてもよい。このようにすれば、更新手段による更新に要する演算量が低減され、当該更新手段の負担が軽減される。このこともまた、更新手段を含む動画像処理装置全体の処理速度を向上させるのに、極めて有効である。

そして、この第１の発明における画像データは、色情報を含むものであってもよい。この場合、抽出手段は、当該色情報を画像データの特徴として抽出するのが、望ましい。なお、ここで言う色情報とは、一般に知られているＲＧＢフォーマットに従う色空間情報であってもよいし、ＹＵＶフォーマットに従う色空間情報であってもよい。また、印刷用のＣＭＹＫフォーマットに従う色空間情報であってもよい。

さらに、それぞれの画素についての特徴は、当該画素の近傍にある近傍画素、例えば周辺画素、の当該特徴をも含むものであってもよい。

また、抽出手段は、互いに隣り合う複数の画素を１画素として取り扱うものであってもよい。このようにすれば、抽出手段を含む動画像処理装置全体の処理の負担が軽減され、当該動画像処理装置全体の処理速度を向上させるのに、極めて有効である。

そして、移動物体領域と一部の非移動物体領域とを含む枠を設定する枠設定手段を、さらに備えると共に、抽出手段は、当該枠内にある画素のみを取り扱うものとしてもよい。このようにすることによっても、抽出手段を含む動画像処理装置全体の処理の負担が軽減され、当該動画像処理装置全体の処理速度を向上させるのに、極めて有効である。また、非移動物体領域（特に枠外の非移動物体領域）を形成する画素が移動物体領域を形成するものであると誤って識別される可能性が減り、換言すればそのような画素がノイズとなって影響するのが抑制される。

続いて、第２の発明は、第１の発明に対応する動画像処理方法に関する発明であり、具体的には、移動物体領域を形成する画素と非移動物体領域を形成する画素とを含む画像データのｎ（ｎ；複数）個の特徴を当該画素ごとに抽出してｎ次元の第１ベクトルデータを生成する抽出過程と、それぞれｎ次元の第２ベクトルデータを有すると共に移動物体領域および非移動物体領域のいずれか一方のクラスに属する複数のニューロンが２次元状に配置されたマップを形成するマップ形成過程と、を具備する。さらに、互いに隣り合う一部のニューロンから成る複数のブロックのうち、それぞれを構成する当該ニューロンの第２ベクトルデータの統計である第３ベクトルデータが第１ベクトルデータに対応する勝者ブロックを、画素ごとに探索する探索過程と、勝者ブロックを構成するニューロンの属するクラスに基づいてそれぞれの画素が移動物体領域および非移動物体領域のいずれを形成するのかを識別する識別過程と、この識別過程における識別結果およびそれぞれの画素の第１ベクトルデータに基づいて当該画素に対応する勝者ブロックを構成するニューロンの第２ベクトルデータおよびクラスを更新する更新過程と、をも具備する。そして、更新過程において全ての画素に基づく更新が行なわれた後、動画像を構成する新たな画像データが抽出過程における処理の対象とされる、というものである。

即ち、この第２の発明を実施することで、第１の発明と同様の作用を奏することができる。

第３の発明は、第１の発明に対応する動画像処理プログラムに関する発明であり、具体的には、移動物体領域を形成する画素と非移動物体領域を形成する画素とを含む画像データのｎ（ｎ；複数）個の特徴を当該画素ごとに抽出してｎ次元の第１ベクトルデータを生成する抽出手順と、それぞれｎ次元の第２ベクトルデータを有すると共に移動物体領域および非移動物体領域のいずれか一方のクラスに属する複数のニューロンが２次元状に配置されたマップを形成するマップ形成手順と、を具備する。さらに、互いに隣り合う一部のニューロンから成る複数のブロックのうち、それぞれを構成する当該ニューロンの第２ベクトルデータの統計である第３ベクトルデータが第１ベクトルデータに対応する勝者ブロックを、画素ごとに探索する探索手順と、勝者ブロックを構成するニューロンの属するクラスに基づいてそれぞれの画素が移動物体領域および非移動物体領域のいずれを形成するのかを識別する識別手順と、この識別手順による識別結果およびそれぞれの画素の第１ベクトルデータに基づいて当該画素に対応する勝者ブロックを構成するニューロンの第２ベクトルデータおよびクラスを更新する更新手順と、を具備する。そして、これら抽出手順、マップ形成手順、探索手順、識別手順および更新手順を、コンピュータに実行させると共に、当該更新手順によって全ての画素に基づく更新が行なわれた後、動画像を構成する新たな画像データが抽出手順による処理の対象とされる、というものである。

即ち、この第３の発明を実施することによっても、第１の発明と同様の作用を奏することができる。

上述したように、本発明によれば、画像データを構成するそれぞれの画素が移動物体領域および非移動物体領域のいずれを形成するものであるのかの識別、および当該識別後の各画素に基づく学習が、継続して行われる。これにより、動画像に含まれる移動物体を継続して検知することができる。また、移動物体がどのような態様であろうとも、学習によってその態様に応じた特徴を正確に捉えることができるので、様々な移動物体（状況）に柔軟かつ適確に対応することができる。

本発明の一実施形態について、図１〜図１４を参照して説明する。

図１に示すように、本実施形態に係る動画像処理システム１０は、カラービデオカメラ（以下、単にカメラと言う。）２０と、動画像処理装置３０と、モニタ４０と、を備えている。

このうち、カメラ２０は、いわゆる固定式のものであり、図示しない固定具によって適当な場所に固定される。そして、カメラ２０は、レンズ２２を介して入射される被写界の光学像をアナログ電気信号であるコンポジットビデオ信号に変換し、出力する。このカメラ２０から出力されたコンポジットビデオ信号は、動画像処理装置３０に入力され、動画像処理装置３０は、入力されたコンポジットビデオ信号に対して次のような処理を施す。

即ち、当該コンポジットビデオ信号に従う入力画像が、例えば図２（ａ）に示すように、移動物体領域１００と、非移動物体領域、言わば背景領域１０２と、を含む場合、動画像処理装置３０は、このうちの移動物体領域１００のみを取り出す。そして、この移動物体領域１００のみを取り出した画像を表示させるための処理後ビデオ信号を生成し、出力する。この処理後ビデオ信号は、モニタ４０に入力され、これにより、当該モニタ４０の表示画面に、図２（ｂ）に示すような移動物体領域１００のみを取り出した画像が映し出される。

つまり、動画像処理装置３０は、カメラ２０から与えられる動画像中の移動物体領域１１０を自動的に検知して、これをモニタ４０に表示させる、という機能を奏する。そして、この機能を実現するために、動画像処理装置３０は、図３に示すような構成とされている。

即ち、動画像処理装置３０は、カメラ２０からのコンポジットビデオ信号が入力される入力変換回路５０を、有している。この入力変換回路５０は、入力されたコンポジットビデオ信号を、ＹＵＶフォーマットに従うディジタル映像信号、言わばカラー画像データ、に変換して、出力する。

入力変換回路５０から出力されたカラー画像データは、画像分割部５２に入力される。画像分割部５２は、入力されたカラー画像データに従う１フレームごとの画像を、複数画素ずつ、例えばａ×ａ（ａ；２以上の整数）画素ずつ、分割する。具体的には、図４（ａ）に示すように、入力画像の水平方向の画素数がＨであり、垂直方向の画素数がＶであるとき、画像分割部５２は、図４（ｂ）に示すように、当該入力画像を水平方向にＨ’（＝Ｈ／ａ）個、垂直方向にＶ’（＝Ｖ／ａ）個、の計Ｈ’×Ｖ’個の小区画１１０，１１０，…に分割する。なお、本実施形態においては、Ｈ×Ｖが６４０×４８０であり、ａ×ａが４×４であり、よって、Ｈ’×Ｖ’は１６０×１２０であり、言い換えれば計１９２００（＝１６０×１２０）個の小区画１１０，１１０，…に入力画像が分割される。

この画像分割部５２による分割後のカラー画像データは、初期検知部５４および枠設定部５６のそれぞれに入力される。このうち、初期検知部５４は、動画像中に移動物体領域１００が現れたときに最初にこれを検知するためのものであり、一般に知られているフレーム差分法等の画像処理法によって当該移動物体領域１００を検知する。そして、この初期検知部５４によって移動物体領域１００が検知されると、当該移動物体領域１００を表す画素、厳密には上述の小区画１１０，１１０，…、の位置（座標）データが、枠設定部５６に入力される。

枠設定部５６は、初期検知部５４から上述の位置データが入力されると、これに基づいて、図５に示すように、移動物体領域１００を囲む矩形枠１２０を設定する。そして、この矩形枠１２０によって囲まれた小区画１１０，１１０，…のカラー画像データのみが、特徴抽出部５８に入力される。

特徴抽出部５８は、入力されたカラー画像データの特徴を抽出するためのものであり、具体的には、それぞれの小区画１１０ごとに、当該小区画１１０に含まれる画素（１６個の画素）のＹＵＶそれぞれの色情報を抽出して、その平均値および分散値を求める。さらに、それぞれの小区画１１０と、これを取り囲む８個の周辺小区画１１０，１１０，…と、の計９個の小区画１１０，１１０，…のＹＵＶそれぞれの色情報の平均値および分散値を求め、これをも中心の小区画（言わば注目小区画）１１０の特徴として付加する。つまり、それぞれの小区画１１０ごとに、合計１２種類、言わば１２次元、の第１ベクトルデータとしての特徴データＸ［ｔ，ｇ］＝｛ｘ_１［ｔ，ｇ］，ｘ_２［ｔ，ｇ］，…，ｘ_ｉ［ｔ，ｇ］，…，ｘ_ｎ［ｔ，ｇ］｝（ｔは、フレーム番号（離散時間）を表すインデックスであり、ｇは、小区画１１０の番号を表すインデックスであり、ｉは、特徴の番号（次元）を表すインデックスであり、当該ｉの最大値ｎは、ｎ＝１２である。）が抽出される。そして、抽出された特徴データＸ［ｔ，ｇ］は、制御部６０に入力される。

制御部６０は、マップ６２と共に、言わばブロック単位学習型のＳＯＭを実現するためのものであり、特徴抽出部５８から入力されたそれぞれの小区画１１０についての特徴データＸ［ｔ，ｇ］をマップ６２に印加することで、当該小区画１１０が移動物体領域１００および背景領域１０２のいずれを形成するのかを識別すると共に、この識別後の特徴データを学習データとしてマップ６２の学習を行い、詳しくは後述する参照ベクトルｗ_ｉ ^ｊを更新すると共に、クラス分けを行う。なお、上述した初期検知部５４によって移動物体領域１００が検知された当初の第１フレームについては、マップ６２は言わば未学習の状態にあるので、当該初期検知部５４から得られる移動物体領域１１０の位置データに基づいて、それぞれの小区画１１０が移動物体領域１００および背景領域１０２のいずれを形成するのかが識別される。

より具体的に説明すると、まず、マップ６２は、図６に示すように、２次元状に配置されたｍ×ｍ個のニューロン６４，６４，…を、有する。なお、この実施形態においては、ｍ＝６とされており、つまり全３６（＝６×６）個のニューロン６４，６４，…が設けられている。そして、各ニューロン６４，６４，…には、それぞれ第２ベクトルデータとしての参照ベクトルｗ_ｉ ^ｊ（ｊは、後述するブロック６６内におけるそれぞれのニューロン６４の番号を表すインデックスである。）が、個別に付与されている。

一方、制御部６０は、マップ６２上において、２×２個以上のニューロン６４，６４，…から成る正方形のブロック６６を種々形成する。そして、これらのブロック６６，６６，…のうち、それぞれが持つ第３ベクトルデータとしてのブロック参照ベクトルＢ＝｛ｂ_１，ｂ_２，…，ｂ_ｉ，…，ｂ_ｎ｝が、上述の特徴データＸ［ｔ，ｇ］に最も対応するもの、詳しくはこれら両者間のユークリッド距離Ｄ＝｜Ｘ［ｔ，ｇ］−Ｂ｜が最も短いもの、を探索して、これを勝者ブロックとする。なお、ここで言うブロック参照ベクトルＢは、それぞれのブロック６６を構成する各ニューロン６４，６４，…の参照ベクトルｗ_ｉ ^ｊの統計であり、例えば平均値である。詳しくは、当該ブロック参照ベクトルＢの任意（ｉ次）の要素ｂ_ｉは、次の数１で表される。

ここで、αは、ブロック６６を構成するニューロン６４の総数であり、言い換えれば当該ブロック６６内におけるニューロン６４の番号ｊの最大値である。

ただし、マップ６２上で考えられるブロック６６の総数Ｔは、次の数２で表されるように膨大であり、当該マップ６２のサイズｍ×ｍが大きくなるほど指数的に増大する。従って、この膨大な数のブロック６６，６６，…の全てについてユークリッド距離Ｄを求め、ひいては勝者ブロックを求めるのは、制御部６０にとってかなりの負担になる。

そこで、本実施形態における制御部６０は、図７に示すような決定木方式に基づいて、勝者ブロックを探索する。即ち、まず、同図（ａ）に示すマップ６２上の全領域ｍ×ｍのうち、同図（ｂ）に示すように、これよりもサイズが１つ小さい［ｍ−１］×［ｍ−１］サイズの全ての（４つの）ブロック６６，６６，…を選択する。そして、選択された４つのブロック６６，６６，…のうち、それぞれのブロック参照ベクトルＢ＝｛ｂ_１，ｂ_２，…，ｂ_ｉ，…，ｂ_ｎ｝と特徴データＸ［ｔ，ｇ］との間のユークリッド距離Ｄ＝｜Ｘ［ｔ，ｇ］−Ｂ｜が最も短いものを探索して、これを勝者候補ブロックとする。なお、同図（ｂ）において、右から２番目の斜線模様６８で示されるブロック６６が、勝者候補ブロックを表す。

このようにして［ｍ−１］×［ｍ−１］サイズの勝者候補ブロック６８が決まると、制御部６０は、図７（ｃ）に示すように、当該勝者候補ブロック６８内において、これよりもさらにサイズが１つ小さい［ｍ−２］×［ｍ−２］サイズの全てのブロック６６，６６，…を選択する。そして、上述と同じ要領で、これらのブロック６６，６６，…の中から［ｍ−２］×［ｍ−２］サイズの勝者候補ブロック６８を探索する。そして、これと同様に、同図（ｄ）に示すように、［ｍ−２］×［ｍ−２］サイズの勝者候補ブロック６８内において、これよりもサイズが１つ小さい［ｍ−３］×［ｍ−３］サイズの勝者候補ブロック６８を探索する。この勝者候補ブロック６８の探索は、同図（ｅ）に示すように、２×２（本実施形態では［ｍ−４］×［ｍ−４］）サイズの勝者候補ブロック６８が探索されるまで、続けられる。

このようにして［ｍ−１］×［ｍ−１］サイズ〜２×２サイズまでの各サイズの勝者候補ブロック６８，６８，…が決まると、制御部６０は、これらの勝者候補ブロック６８，６８，…の中から最も上述したユークリッド距離Ｄ＝｜Ｘ［ｔ，ｇ］−Ｂ｜の小さいものを選出する。そして、選出した勝者候補ブロック６８を、言わば真の勝者ブロックとして決定する。

このような決定木方式に基づいて勝者ブロックを探索することで、ユークリッド距離Ｄを求める対象となるブロック６６の総数Ｔは、上述の数２で表される値よりも激減し、詳しくは次の数３で表される値となる。

これにより、勝者ブロックを探索する際の制御部６０の負担が大きく軽減され、当該制御部６０を含む動画像処理装置３０の処理速度の向上が図られる。

制御部６０は、それぞれの小区画１１０について、この勝者ブロックの探索を行う。そして、それぞれの小区画１１０について勝者ブロックが決まるごとに、次の数４に基づいて、当該勝者ブロックを構成するそれぞれのニューロン６４の参照ベクトルｗ_ｉ ^ｊと当該小区画１１０の特徴データＸ［ｔ，ｇ］との偏差の累積量ｗｄ_ｉ ^ｊ［ｔ，ｇ］を、算出する。

併せて、制御部６０は、次の数５に基づいて、偏差累積率ｗｒ_ｉ ^ｊ［ｔ，ｇ］を算出する。

そして、全ての小区画１１０，１１０，…について勝者ブロックを決定すると共に、偏差累積量ｗｄ_ｉ ^ｊ［ｔ，ｇ］および偏差累積率ｗｒ_ｉ ^ｊ［ｔ，ｇ］を算出すると、制御部６０は、次の数６に基づいて、それぞれのニューロン６４の参照ベクトルｗ_ｉ ^ｊを更新する。

なお、上述の如く、全ての小区画１１０，１１０，…について勝者ブロックを決定すると共に、偏差累積量ｗｄ_ｉ ^ｊ［ｔ，ｇ］および偏差累積率ｗｒ_ｉ ^ｊ［ｔ，ｇ］を算出する、という制御部６０による一連の処理を、本実施形態では、エポックと言う。つまり、それぞれのニューロン６４の参照ベクトルｗ_ｉ ^ｊは、１回のエポックが終了するごとに、一括して、言わばバッチ的に、更新される。制御部６０は、このエポックを、１フレームにつき複数回、例えば３０回、繰り返す。そして、この３０回にわたるエポックの実行後、次のフレームについて、当該３０回にわたるエポックを繰り返す。

さて、制御部６０は、上述したように、第１フレームについては、初期検知部５４から与えられる移動物体領域１１０の位置データに基づいて、それぞれの小区画１１０が移動物体領域１００および背景領域１０２のいずれを形成するのかを識別するが、第２フレーム以降は、マップ６２を用いて当該識別を行う。このため、制御部６０は、第１フレームについての識別後、その識別結果に基づいて、マップ６２上の各ニューロン６４，６４，…のクラス分けを行う。

このクラス分けについては、上述した特許文献１および２にも開示されているが、簡単に説明すると、まず、制御部６０は、それぞれの小区画１１０…に対応する勝者ブロックの各ニューロン６４，６４，…に、当該小区画１１０の識別結果、つまり当該小区画１１０が移動物体領域１００および背景領域１０２のいずれを形成するものであるのか、を表す所定の指標値を、付与する。そして、全ての小区画１１０，１１０，…の識別結果に基づいて各ニューロン６４，６４，…に指標値を付与した後、それぞれのニューロン６４ごとに付与された指標値の統計、例えば平均値、を求める。そして、この平均値が、移動物体領域１００および背景領域１０２のいずれの指標値に近いのかを判別し、この判別結果に基づいて、それぞれのニューロン６４が移動物体領域１００および背景領域１０２のいずれのクラスに属するのかを決定する。この結果、マップ６２上の各ニューロン６４，６４，…は、図８に示すように、移動物体領域１００に属するもの（格子模様）と、背景領域１０２に属するもの（斜線模様）とに、クラス分けされる。

このクラス分けされたマップ６２を用いて、制御部６０は、第２フレーム以降のそれぞれの小区画１１０が移動物体領域１００および背景領域１０２のいずれを形成するのかを識別する。具体的には、勝者ブロックを構成する各ニューロン６４，６４，…のうち移動物体領域１００に属するものが多い小区画１１０については、当該移動物体領域１００を形成するものと識別する。これとは反対に、勝者ブロックを構成する各ニューロン６４，６４，…のうち背景領域１０２に属するものが多い小区画１１０については、当該背景領域１０２を形成するものと識別する。なお、勝者ブロックを構成する各ニューロン６４，６４，…のうち移動物体領域１００に属するものと背景領域１０２に属するものとが同数である小区画１１０については、予め定めたいずれか一方の領域、例えば移動物体領域１００、を形成するものと識別する。

この制御部６０による識別結果は、出力変換部７０に与えられる。出力変換部７０には、上述した入力変換部５０からカラー画像データが入力されており、当該出力変換部７０は、入力されたカラー画像データのうち、制御部６０によって移動物体領域１００を形成すると識別された小区画１１０を構成する画素のみを表示させるための上述した処理後ビデオ信号を生成する。そして、この処理後ビデオ信号がモニタ４０に入力されることで、当該モニタ４０の表示画面に、図９に示すような移動物体領域１００のみの画像が映し出される。

さらに、制御部６０は、第２フレーム以降のそれぞれの小区画１１０についてマップ６２を用いて識別した結果に基づいて、改めて当該マップ６２上の各ニューロン６４，６４，…のクラス分けを行う。つまり、各ニューロン６４，６４，…の参照ベクトルｗ_ｉ ^ｊのみならず、当該各ニューロン６４，６４，…のクラスについても、新たなフレームが入力されるたびに更新される。要するに、前回のフレームによって学習されたマップ６２により今回のフレームについての識別が行われ、この識別が行われた後の今回のフレームによって次回のフレームのために改めてマップ６２が学習される。そして、この識別と学習とが、継続して行われる。

なお、移動物体領域１００を形成する小区画１１０がなくなると、つまり動画像から当該移動物体領域１００がなくなると、制御部６０は、識別および学習を停止する。併せて、初期検知部５４をリセットする。これによって、動画像処理装置３０は、移動物体領域１００が現れる前の初期状態に戻る。

図１０に、本実施形態の動画像処理装置３０の実際の入力画像と出力画像との一例を示す。なお、同図において、左側に示される画像が入力画像であり、右側に示される画像が出力画像である。また、同図（ａ），（ｂ）および（ｃ）は、それぞれ第１フレーム，第２０フレームおよび第４０フレームの画像である。この図１０から、カメラ２０の被写界（視野）を横切ろうとしている人間のみが、移動物体として検知されていることが、分かる。つまり、本実施形態の動画像処理装置３０によって、当該移動物体を適確に検知できることが、確認された。

このようなマップ６２を用いての移動物体検知を実現するべく、制御部６０は、図１１および図１２のフローチャートで示される物体検知タスクを実行する。

即ち、初期検知部５４によって移動物体領域１００が検知されると、具体的には当該初期検知部５４から言わば初期識別データとしての上述の位置データが入力されると、制御部６０は、図１１のステップＳ１に進み、当該初期識別データとしての位置データを記憶する。そして、ステップＳ３に進み、移動物体領域１００が検知されたことを表すフラグＦに“１”を設定した後、ステップＳ５に進む。

ステップＳ５において、制御部６０は、マップ６２を初期化し、詳しくは当該マップ６２上の各ニューロン６４，６４，…の参照ベクトルｗ_ｉ ^ｊに乱数を設定する。そして、ステップＳ７に進み、特徴抽出部５８から特徴データＸ［ｔ，ｇ］を取得する。この特徴データＸ［ｔ，ｇ］もまた、制御部６０によって記憶される。さらに、制御部６０は、ステップＳ９において、上述したエポックの実行回数を表すインデックスｅにその初期値である“１”を設定した後、ステップＳ１１において、上述した矩形枠１２０内の小区画１１０の番号を表すインデックスｇにその初期値である“１”を設定し、ステップＳ１３の勝者ブロック探索処理を実行する。

このステップＳ１３の勝者ブロック探索処理においては、制御部６０は、上述した決定木方式に基づいて勝者ブロックを探索する。そして、今現在の処理の対象である小区画１１０について勝者ブロックが決定すると、制御部６０は、ステップＳ１５に進み、上述したフラグＦが“０”であるか否かを判定する。

このステップＳ１５において、フラグＦが“０”でない場合、つまり移動物体領域１００が検知された直後である場合、制御部６０は、ステップＳ１７に進み、上述のステップＳ１で記憶した初期識別データに基づいて、当該移動物体領域１００のみを表示させるよう出力変換部７０を制御する。そして、制御部６０は、ステップＳ１９において、フラグＦに“０”を設定した後、ステップＳ２１の更新準備処理に進む。

一方、ステップＳ１５において、フラグＦが“０”である場合、つまり移動物体領域１００が検知されてから上述のステップＳ１７を実行した経験がある場合、制御部６０は、ステップＳ２３に進む。そして、このステップＳ２３において、今現在のエポックの実行回数ｅが“１”回目であるか否かを判定し、“１”回目である場合は、ステップＳ２５の識別処理に進む。

このステップＳ２５の識別処理において、制御部６０は、今現在の処理の対象である小区画１１０の特徴データＸ［ｔ，ｇ］をマップ６２に印加して、当該小区画１１０が移動物体領域１００および背景領域１０２のいずれを形成するものであるのかを識別する。そして、この識別結果に基づいて、ステップＳ２７において出力変換部７０を制御する。つまり、今現在の処理の対象である小区画１１０が移動物体領域１００を形成する場合にはこれを表示させ、そうでない場合には表示させないように、出力変換部７０を制御する。そして、このステップＳ２７の実行後、ステップＳ２１の更新準備処理に進む。

ステップＳ２１の更新準備処理において、制御部６０は、上述した数４に基づいて、勝者ブロックを構成するそれぞれのニューロン６４についての偏差累積量ｗｄ_ｉ ^ｊ［ｔ，ｇ］を算出すると共に、数５に基づいて、偏差累積率ｗｒ_ｉ ^ｊ［ｔ，ｇ］を算出する。そして、これらの算出後、ステップＳ２９に進む。

ステップＳ２９において、制御部６０は、今現在の処理の対象である小区画１１０の番号ｇがその最大値Ｇに達したか否か、つまり全ての小区画１１０，１１０，…についてステップＳ１３〜ステップＳ２７を一通り実行したか否か、を判定する。そして、未だ当該ステップＳ１３〜ステップＳ２７を実行していない小区画１１０が存在する場合には、それを実行するべく、ステップＳ３１に進み、小区画１１０の番号ｇの値を“１”つインクリメントした後、ステップＳ１３に戻る。一方、全ての小区画１１０，１１０，…についてステップＳ１３〜ステップＳ２７を一通り実行した場合には、ステップＳ３３に進む。

ステップＳ３３において、制御部６０は、上述した数６に基づいて、それぞれのニューロン６４の参照ベクトルｗ_ｉ ^ｊを更新する。そして、この更新後、図１２のステップＳ３５に進み、エポックの実行回数ｅがその最大値Ｅに達したか否かを、判定する。なお、上述したように、本実施形態におけるエポックの最大実行回数Ｅは、３０回である。

このステップＳ３５において、エポックの実行回数ｅが最大値Ｅ（＝３０）に達していない場合は、改めて当該エポックを繰り返すべく、制御部６０は、ステップＳ３７に進み、エポックの実行回数ｅの値を“１”つインクリメントした後、図１１のステップＳ１１に戻る。一方、エポックの実行回数ｅが最大値Ｅに達した場合には、ステップＳ３５からステップＳ３９に進む。

ステップＳ３９において、制御部６０は、動画像上に移動物体領域１００が未だ存在するか否かを判定する。そして、当該移動物体領域１００が存在する場合には、ステップＳ４１のクラス分け処理に進む。

ステップＳ４１のクラス分け処理においては、制御部６０は、上述した要領で、マップ６２上の各ニューロン６４，６４，…のクラス分けを行う。そして、このクラス分けの完了後、新たなフレームの特徴データＸ［ｔ＋１，ｇ］を取得するべく、ステップＳ４３において、フレーム番号ｔの値を“１”つインクリメントした後、図１１のステップＳ７に戻る。

なお、上述のステップＳ３９において、移動物体領域１００の存在が確認されない場合には、制御部６０は、ステップＳ４５に進む。そして、このステップＳ４５において、初期検知部５４をリセットして、一連の物体検知タスクを終了する。

ここで、この物体検知タスクにおけるステップＳ１３の勝者ブロック探索処理について、図１３を参照して、さらに詳しく説明する。

即ち、勝者ブロック探索処理においては、制御部６０は、まず、ステップＳ１０１に進み、マップ６２全体を仮の勝者候補ブロック６８として設定する。そして、ステップＳ１０３に進み、これから探索しようとする勝者候補ブロック６８のサイズｐを設定し、詳しくはｐ＝ｍ−１というサイズを設定する。

そして、制御部６０は、ステップＳ１０５に進み、勝者候補ブロック６８内にあるｐ×ｐというサイズの全てのブロック６６，６６，…のうち、それぞれのブロック参照ベクトルＢと特徴データＸ［ｔ，ｇ］との間のユークリッド距離Ｄが最も短いものを探索する。そして、このステップＳ１０５で探索されたブロック６６を、次のステップＳ１０７において勝者候補ブロック６８として記憶し、併せて当該勝者候補ブロック６８のユークリッド距離Ｄを記憶する。

さらに、制御部６０は、ステップＳ１０９に進み、今現在のブロックサイズｐがその最小値である“２”に達したか否かを判定する。そして、達していない場合には、ステップＳ１１１に進み、ブロックサイズｐを“１”つ小さくした後、ステップＳ１０５に戻る。一方、ブロックサイズｐが最小値である“２”に達した場合には、ステップＳ１１３に進む。

ステップＳ１１３において、制御部６０は、上述のステップＳ１０５〜ステップＳ１０７を繰り返すことで探索された複数の勝者候補ブロック６８，６８，…のうち、最もユークリッド距離Ｄが短いものを探索する。そして、探索された勝者候補ブロック６８を真の勝者ブロックとして決定して、この図１３のフローチャートで示される勝者ブロック探索処理を終了する。

さらに、図１４を参照して、上述した物体検知タスクにおけるステップＳ２１の更新準備処理について、詳しく説明する。

即ち、更新準備処理においては、制御部６０は、まず、ステップＳ２０１に進み、今現在の勝者ブロック内におけるニューロン６４の番号を表すインデックスｊに、その初期値である“１”を設定する。そして、ステップＳ２０３に進み特徴（次元）の番号を表すインデックスｉに、その初期値である“１”を設定した後、ステップＳ２０５に進む。

ステップＳ２０５において、制御部６０は、上述した数４に基づいて、偏差累積量ｗｄ_ｉ ^ｊ［ｔ，ｇ］を算出する。そして、その算出結果ｗｄ_ｉ ^ｊ［ｔ，ｇ］を、次のステップＳ２０７で記憶する。

さらに、制御部６０は、ステップＳ２０９に進み、上述した数５に基づいて、偏差累積率ｗｒ_ｉ ^ｊ［ｔ，ｇ］を算出する。そして、その算出結果ｗｒ_ｉ ^ｊ［ｔ，ｇ］を、次のステップＳ２１１で記憶した後、ステップＳ２１３に進む。

ステップＳ２１３において、制御部６０は、特徴の番号を表すインデックスｉの値がその最大値ｎ（＝１２）に達したか否か、つまり全ての特徴についてステップＳ２０５〜ステップＳ２１１を一通り実行したか否か、を判定する。そして、未だステップＳ２０５〜ステップＳ２１１を実行していない特徴が存在する場合には、これを実行するべく、ステップＳ２１５に進み、当該インデックスｉの値を“１”つインクリメントした後、ステップＳ２０５に戻る。一方、全ての特徴についてステップＳ２０５〜ステップＳ２１１を実行した場合には、ステップＳ２１７に進む。

ステップＳ２１７において、制御部６０は、ニューロン６４の番号を表すインデックスｊの値がその最大値αに達したか否か、つまり今現在の勝者ブロック内における全てのニューロン６４についてステップＳ２０３〜ステップＳ２１５を実行したか否か、を判定する。そして、未だステップＳ２０３〜ステップＳ２１５を実行していないニューロン６４が存在する場合には、これを実行するべく、ステップＳ２１９に進み、当該インデックスｊの値を“１”つインクリメントした後、ステップＳ２０３に戻る。一方、全てのニューロン６４についてステップＳ２０３〜ステップＳ２１５を実行した場合には、これをもって、図１４のフローチャートで示される更新準備処理を終了する。

以上のように、本実施形態によれば、マップ６２を構成する各ニューロン６４，６４，…をブロック単位で扱うというブロック単位学習型のＳＯＭを利用して、動画像中の移動物体領域１００を検知するための動画像処理装置３０を実現することができる。また、移動物体領域１００がどのような態様であろうとも（例えば黒っぽいとか赤っぽいとかであっても）、学習によってその態様に応じた特徴を正確に捉えることができるので、様々な移動物体領域１００の態様（状況）に柔軟かつ適確に対応することができる。

なお、本実施形態においては、図３に示した画像分割部５２によって、図４に示したように入力画像をａ×ａ画素ずつ分割することとしたが、これに限らない。例えば、ａ×ｂ（ｂ；ａとは異なる整数）画素ずつ分割してもよいし、極端には分割しなくてもよく、つまり図３の構成から画像分割部５２を排除してもよい。ただし、このような画像分割部５２を設けることによって、これよりも後段、特に制御部６０、の負担が軽減される。このことは、当該制御部６０を含む動画像処理装置３０全体の処理速度を向上させるのに、極めて有効である。

また、図３に示した枠設定部５６によって、図５に示したように矩形枠１２０を設定すると共に、この矩形枠１２０によって囲まれた小区画１１０，１１０，…のカラー画像データのみが特徴抽出部５８に入力されるようにしたが、これに限らない。即ち、図３の構成からこの枠設定部５６を排除して、全ての小区画１１０，１１０，…（または画素）のカラー画像データが特徴抽出部５８に入力されるようにしてもよい。ただし、このような枠設定部５６を設けることによって、これよりも後段、特に特徴抽出部５８および制御部６０、の負担が軽減される。このこともまた、動画像処理装置３０全体の処理速度を向上させるのに、極めて有効である。また、特に、矩形枠１２０以外の背景領域１０２に移動物体領域１００と同様の特徴を有する小区画１１０が存在する場合に、これが移動物体領域１００を構成するものと誤って識別される可能性が減り、言い換えればそのような小区画１１０が一種のノイズとなって影響するのが抑制される。

さらに、図３に示した特徴抽出部５８によって、それぞれの小区画１１０ごとに、周辺小区画１１０，１１０，…の色情報をも含む１２種類（次元）の特徴を抽出することとしたが、これに限らない。例えば、当該周辺小区画１１０，１１０，…の色情報を排除して、それぞれの小区画（注目小区画）１１０自体の色情報の平均値および分散値から成る６種類の特徴を抽出してもよいし、当該平均値および分散値の一方のみを抽出してもよい。また、ＹＵＶではなく、ＲＧＢの色情報を抽出してもよいし、輝度情報を抽出してもよい。さらに、それぞれの画素の位置（座標）情報を、併せて抽出してもよい。つまりは、状況に応じて適宜の特徴を抽出すればよい。

そして、図３に示した制御部６０によって、図７に示したように決定木方式に基づいて勝者ブロックを探索することとしたが、これに限らない。即ち、マップ６２上で考えられる全てのブロック６６，６６，…についてそれぞれのユークリッド距離Ｄを求め、その結果を基に勝者ブロックを探索してもよい。ただし、この場合は、上述したように制御部６０にかなりの負担が掛かるので、好ましくは、本実施形態のように決定木方式に基づいて勝者ブロックを探索することを推奨する。

また、制御部６０によって、１回のエポックが終了するごとに、バッチ的に、それぞれのニューロン６４の参照ベクトルｗ_ｉ ^ｊを更新することとしたが、これに限らない。例えば、それぞれの小区画１１０について勝者ブロックが決定されるごとに、当該参照ベクトルｗ_ｉ ^ｊを更新してもよい。なお、この場合の更新式は、次の数７で表される。

ただし、勝者ブロックが決定されるごとにこの数７に基づいて参照ベクトルｗ_ｉ ^ｊを更新する場合は、言うまでもなく、バッチ的に更新する場合に比べて、制御部６０の負担が大きい。従って、好ましくは、本実施形態のようにバッチ的に更新することを推奨する。

そしてさらに、制御部６０によって、１フレームにつきエポックを３０回繰り返すこととしたが、これに限らない。例えば、前回のエポックと今回のエポックとのそれぞれにおける偏差累積量ｗｄ_ｉ ^ｊ［ｔ，ｇ］の差、言わば量子化誤差、を求め、この量子化誤差が所定の閾値以下となったときに、次のフレームに進んでもよい。

また、それぞれのブロック６６のサイズをｐ×ｐとし、言い換えれば当該ブロック６６の形状を正方形としたが、長方形としてもよい。ただし、特に勝者ブロックを決定する際を含め、制御部６０による処理を簡素化する上では、当該ブロック６６の正方形とするのが、望ましい。マップ６２についても、同様に、ｍ×ｍの正方形である必要はなく、長方形でもよいが、正方形の方が好都合である。

また、本実施形態では、図１に示したカメラ２０として、固定式のものを採用したが、雲台を備えた可動式のものを採用してもよい。特に、動画像処理装置３０（制御部６０）によって検出された移動物体領域１００の画像上での位置（座標）情報に基づいて、当該移動物体領域１００を当該画像上の中心位置に移動させるための変位量を求め、この変位量に基づいて雲台を制御（パンおよびチルト）するようにすれば、常に移動物体をカメラの中心で捉えるという、いわゆる自動追尾機能を実現することができる。この自動追尾機能を実現する場合であっても、上述したマップ６２のブロック単位での識別および学習手順については、本実施形態で説明した固定式カメラ２０の場合と同様である。また、この識別および学習を行うに当たっては、言うまでもなく各画素の位置（座標）情報は必須要素である。従って、ここで言う変位量を求めるのに特段な問題はなく、ゆえに、自動追尾機能を実現するのにも本発明は極めて有用である。

なお、本実施形態における動画像処理装置３０は、パーソナルコンピュータ等の汎用のコンピュータによって実現することができる。また、このように汎用コンピュータを動画像処理装置３０として機能させるためのプログラムのみを、提供することもできる。

この発明の一実施形態の概略構成を示す図である。同実施形態における入力画像と出力画像との関係を示す図解図である。図１における動画像処理装置の詳細な構成を示すブロック図である。図３における画像分割部による処理の内容を説明するための図解図である。図３における枠設定部部による処理の内容を説明するための図解図である。図３におけるマップの構成を概念的に示す図解図である。図３における制御部による処理の内容を説明するための図解図である。図３におけるマップがクラス分けされた状態を概念的に示す図解図である。図５に対する出力画像を示す図解図である。同実施形態における実際の入力画像と出力画像とを示す図解図である。図３における制御部が実行する物体検知タスクの概略を示すフローチャートである。図１１に続くフローチャートである。図１１における勝者ブロック探索処理の詳細を示すフローチャートである。図１０における更新準備処理の詳細を示すフローチャートである。

符号の説明

１０動画像処理システム
２０カメラ
３０動画像処理装置
４０モニタ
５０入力変換部
５２画像分割部
５６枠設定部
５８特徴抽出部
６０制御部
６２マップ
７０出力変換部

Claims

移動物体領域を形成する画素と非移動物体領域を形成する画素とを含む画像データが入力され該画像データのｎ（ｎ；複数）個の特徴を該画素ごとに抽出してｎ次元の第１ベクトルデータを生成する抽出手段と、
２次元状に配置されておりそれぞれｎ次元の第２ベクトルデータを有すると共に上記移動物体領域および上記非移動物体領域のいずれか一方のクラスに属する複数のニューロンを含むマップと、
互いに隣り合う一部の上記ニューロンから成る複数のブロックのうちそれぞれを構成する該ニューロンの上記第２ベクトルデータの統計である第３ベクトルデータが上記第１ベクトルデータに対応する勝者ブロックを上記画素ごとに探索する探索手段と、
上記勝者ブロックを構成する上記ニューロンの属する上記クラスに基づいてそれぞれの上記画素が上記移動物体領域および上記非移動物体領域のいずれを形成するのかを識別する識別手段と、
上記識別手段による識別結果およびそれぞれの上記画素の上記第１ベクトルデータに基づいて該画素に対応する上記勝者ブロックを構成する上記ニューロンの上記第２ベクトルデータおよび上記クラスを更新する更新手段と、
を具備し、
上記更新手段によって全ての上記画素に基づく更新が行なわれた後、動画像を構成する新たな上記画像データが上記抽出手段に入力される、
動画像処理装置。
上記識別手段によって上記移動物体領域を形成すると識別された上記画素のみを表示させる表示手段をさらに備える、請求項１に記載の動画像処理装置。
上記探索手段は、互いに同サイズの複数の上記ブロックのうち上記第３ベクトルデータが上記第１ベクトルデータに対応する勝者候補ブロックを上記画素ごとに探索する勝者候補探索手段と、該勝者候補探索手段によって探索された該勝者候補ブロック内においてよりサイズの小さい別の勝者候補ブロックを順次探索するように該勝者候補探索手段による探索を該画素ごとに繰り返し実行させる繰り返し実行手段と、該勝者候補探索手段による探索が繰り返し実行されることによって探索された複数の該勝者候補ブロックのうち該第３ベクトルデータが最も該第１ベクトルデータに対応するものを上記勝者ブロックとして該画素ごとに決定する決定手段と、を含む、請求項１または２に記載の動画像処理装置。
上記更新手段は上記識別手段によって全ての上記画素に基づく識別が行なわれた後に一括して該全ての画素に基づく更新を行なう、請求項１ないし３のいずれかに記載の動画像処理装置。
上記画像データは色情報を含み、
上記特徴は上記色情報を含む、
請求項１ないし４のいずれかに記載の動画像処理装置。
それぞれの上記画素についての上記特徴は該画素の近傍にある近傍画素の特徴をも含む、請求項１ないし５のいずれかに記載の動画像処理装置。
上記抽出手段は互いに隣り合う複数の上記画素を１画素として取り扱う、請求項１ないし６のいずれかに記載の動画像処理装置。
上記移動物体領域と一部の上記非移動物体領域とを含む枠を設定する枠設定手段をさらに備え、
上記抽出手段は上記枠内にある上記画素のみを取り扱う、
請求項１ないし７のいずれかに記載の動画像処理装置。
移動物体領域を形成する画素と非移動物体領域を形成する画素とを含む画像データのｎ（ｎ；複数）個の特徴を該画素ごとに抽出してｎ次元の第１ベクトルデータを生成する抽出過程と、
それぞれｎ次元の第２ベクトルデータを有すると共に上記移動物体領域および上記非移動物体領域のいずれか一方のクラスに属する複数のニューロンが２次元状に配置されたマップを形成するマップ形成過程と、
互いに隣り合う一部の上記ニューロンから成る複数のブロックのうちそれぞれを構成する該ニューロンの上記第２ベクトルデータの統計である第３ベクトルデータが上記第１ベクトルデータに対応する勝者ブロックを上記画素ごとに探索する探索過程と、
上記勝者ブロックを構成する上記ニューロンの属する上記クラスに基づいてそれぞれの上記画素が上記移動物体領域および上記非移動物体領域のいずれを形成するのかを識別する識別過程と、
上記識別過程における識別結果およびそれぞれの上記画素の上記第１ベクトルデータに基づいて該画素に対応する上記勝者ブロックを構成する上記ニューロンの上記第２ベクトルデータおよび上記クラスを更新する更新過程と、
を具備し、
上記更新過程において全ての上記画素に基づく更新が行なわれた後、動画像を構成する新たな上記画像データが上記抽出過程における処理の対象とされる、
動画像処理方法。
移動物体領域を形成する画素と非移動物体領域を形成する画素とを含む画像データのｎ（ｎ；複数）個の特徴を該画素ごとに抽出してｎ次元の第１ベクトルデータを生成する抽出手順と、
それぞれｎ次元の第２ベクトルデータを有すると共に上記移動物体領域および上記非移動物体領域のいずれか一方のクラスに属する複数のニューロンが２次元状に配置されたマップを形成するマップ形成手順と、
互いに隣り合う一部の上記ニューロンから成る複数のブロックのうちそれぞれを構成する該ニューロンの上記第２ベクトルデータの統計である第３ベクトルデータが上記第１ベクトルデータに対応する勝者ブロックを上記画素ごとに探索する探索手順と、
上記勝者ブロックを構成する上記ニューロンの属する上記クラスに基づいてそれぞれの上記画素が上記移動物体領域および上記非移動物体領域のいずれを形成するのかを識別する識別手順と、
上記識別手順による識別結果およびそれぞれの上記画素の上記第１ベクトルデータに基づいて該画素に対応する上記勝者ブロックを構成する上記ニューロンの上記第２ベクトルデータおよび上記クラスを更新する更新手順と、
をコンピュータに実行させるための動画像処理プログラムであって、
上記更新手順によって全ての上記画素に基づく更新が行なわれた後、動画像を構成する新たな上記画像データが上記抽出手順による処理の対象とされる、
動画像処理プログラム。