JP4112819B2

JP4112819B2 - 物体領域情報生成装置及び物体領域情報記述プログラム

Info

Publication number: JP4112819B2
Application number: JP2001142257A
Authority: JP
Inventors: 修堀; 敏充金子; 雄志三田; 晃司山本; 孝一増倉
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2000-05-11
Filing date: 2001-05-11
Publication date: 2008-07-02
Anticipated expiration: 2021-05-11
Also published as: JP2002056392A

Description

【０００１】
【発明の属する技術分野】
本発明は、映像中の物体の領域に関する情報を生成するための物体領域情報生成装置、及び物体情報記述プログラムに関する。
【０００２】
【従来の技術】
ハイパーメディアは、映像、音声、テキストなどのメディアの間にハイパーリンクと呼ばれる関連情報を付与し、相互に参照できるようにしたものである。映像を中心にした場合、例えば映像中の登場物体に関連情報が付与されており、この物体が指示されると関連情報の表示を行うというものがハイパーメディアの代表例である。このとき、映像中の物体は映像のフレーム番号もしくはタイムスタンプと映像中の領域を特定する情報とで表現され、映像データの中にもしくは別データとして記録されている。
【０００３】
映像中の領域を特定する方法としては、マスク画像がよく利用されてきた。これは指定領域内の場合と指定領域外の場合で異なる画素値を与えて構成する画像である。例えば、領域内の場合は１、領域外の場合は０という画素値を与えるのが最も簡単な方法である。また、ＣＧなどに使われるα値を利用することもある。通常、α値は２５６階調の値を表現できるので、そのうちの一部を使い、例えば指定領域内の場合は２５５、指定領域外の場合は０と表現する。このようなマスク画像により画像中の領域が表現されている場合、あるフレームにおける画素が、指定領域内であるかどうかを判定するには、そのフレームに該当するマスク画像の該当画素の値を読み取り、０であるか１であるかにより簡単に判定することができる。マスク画像はどのような形の領域でも、また不連続な領域でも表現できるという自由度を持っているが、画像サイズと同じサイズの画素を持つ必要がある。
【０００４】
マスク画像のデータ量を削減するために、マスク画像の圧縮がよく利用される。０、１の２値のマスク画像の場合には、２値画像としての処理ができるため、ファクシミリ等で用いられている圧縮方法が利用されることが多い。また、ＩＳＯ／ＩＥＣ動画圧縮標準化グループＭＰＥＧ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ）が標準化しているＭＰＥＧ−４では、０，１の２値のマスク画像の他、α値を利用したマスク画像までを圧縮対象とした任意形状符号化を採用することになっている。これは、動き補償を用いた圧縮手法であり、圧縮効率が向上するが、その分、圧縮・復号過程は複雑になる。
【０００５】
【発明が解決しようとする課題】
以上のように映像中のある領域を表現するにはマスク画像かあるいはマスク画像を圧縮したものを利用することが多かったが、領域を特定するためのデータとしては、より簡単にかつ高速に取り出すことが可能でデータ量も小さく、そして容易に扱うことができる形態のものが望まれている。すなわち、映像中の所望の物体の領域を表現する方法として、マスク画像ではデータ量が多くなるという問題があり、また、マスク画像を圧縮して用いると符号化・復号化が複雑になり、しかも直接データを編集することができないためハンドリングが難しいという問題があった。
【０００６】
また、物体領域の位置情報のみを表現して、奥行きの情報が欠如していた。物体が物陰に一時隠れてしまう状態を表現することができなかった。カメラが物体を追いながら撮影されている場合には、その物体の真の動きを表現していない問題があった。よって、検索において、奥行きの情報や、物体が他の物の陰に隠れてしまうオクル−ジョンや、カメラの動きを考慮した検索などの処理が困難であった。このため、検索において、全く関係ない物体に対してもすべて処理する必要があった。
【０００７】
本発明は、上記事情を考慮してなされたもので、映像中の所望の物体の領域を少ないデータ量で記述でき且つその作成やそのデータの扱いも容易にする物体領域情報生成装置、及び物体領域情報記述プログラムを提供することを目的とする。
【０００８】
また、本発明は、映像中の物体に対する効率的、効果的な検索を可能にする物体領域情報生成装置、及び物体領域情報記述プログラムを提供することを目的とする。
【０００９】
【課題を解決するための手段】
上記した課題を解決し目的を達成するために、本発明は以下に示す手段を用いている。
【００１０】
（１）本発明の一態様による物体領域情報生成装置は、映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報生成装置であって、フレーム毎に前記任意の物体の領域を図形で近似し、フレーム毎に該図形を表す複数の代表点を抽出し、前記複数の代表点のうちの少なくとも一点を基準代表点とし、該基準代表点の位置データと、前記基準代表点に対する残りの代表点の相対位置データとを、フレームの進行に沿って並べることにより得られる軌跡を関数で近似し、該関数を用いて該物体の領域に関する情報を生成するものである。
【００１１】
（２）本発明の他の態様による物体領域情報生成装置は、映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報生成装置であって、フレーム毎に前記任意の物体の領域を図形で近似し、フレーム毎に該図形を表す複数の代表点を抽出し、基準フレームにおける近似図形の前記複数の代表点の位置データと、他のフレームにおける前記基準フレームの複数の代表点に対応する代表点の相対位置データとを、フレームの進行に沿って並べることにより得られる軌跡を関数で近似し、該関数を用いて該物体の領域に関する情報を生成するものである。
【００１２】
（３）本発明の別の態様による物体領域情報生成装置は、映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報生成装置であって、フレーム毎に前記任意の物体の領域を図形で近似し、フレーム毎に該図形を表す複数の代表点を抽出し、前記複数の代表点の位置を特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を関数で近似し、該関数、および前記図形の奥行きを示すデータを用いて該物体の領域に関する情報を生成するものである。
【００１３】
（４）本発明のさらに他の態様による物体領域情報生成装置は、映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報生成装置であって、フレーム毎に前記任意の物体の領域を図形で近似し、フレーム毎に該図形を表す複数の代表点を抽出し、前記複数の代表点の位置を特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を関数で近似し、該関数、および前記図形または各々の前記代表点が見えている状態にあるフレーム区間、あるいは見えていない状態にあるフレーム区間を特定するフラグ情報を用いて該物体の領域に関する情報を生成するものである。
【００１４】
（５）本発明のさらに別の態様による物体領域情報生成装置は、映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報生成装置であって、フレーム毎に前記任意の物体の領域を図形で近似し、フレーム毎に該図形を表す複数の代表点を抽出し、前記複数の代表点の位置を特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を関数で近似し、該関数、および前記図形が前記複数フレームにおいて存在した範囲を示す存在範囲情報を用いて該物体の領域に関する情報を生成するものである。
【００１５】
（６）本発明のさらに他の態様による物体領域情報生成装置は、複数フレームをその重複部分を重ねるようにして生成されるパノラマ画像中を推移する任意の物体の領域に関する情報を記述するための物体領域情報生成装置であって、前記パノラマ画像中の前記任意の物体の領域を図形で近似し、前記パノラマ画像中を推移する前記図形を表す複数の代表点を抽出し、前記複数の代表点の該パノラマ画像中における位置を特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を関数で近似し、該関数を用いて該物体の領域に関する情報を生成するものである。
【００１７】
また、装置に係る本発明は、コンピュータに当該発明に相当する手順を実行させるための（あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための）プログラムを記録したコンピュータ読取り可能な記録媒体としても成立する。
【００１８】
本発明によれば、複数フレームに渡る映像中の物体の領域を、該物体の領域に対する近似図形の代表点の位置データまたはそれを特定可能なデータ（例えば、代表点間差分ベクトル値）をフレームの進行に沿って並べたときの軌跡を近似した関数のパラメータとして記述することにより、複数フレームに渡る映像中の物体の領域を少量の関数パラメータのみによって記述することができるため、物体の領域を特定するためのデータの量を効果的に削減することができ、またハンドリングを容易にすることができる。特に物体が剛体の場合は、相対位置は絶対位置よりも変動が少なく、その軌跡を関数近似したときに、コンパクトな情報量で記述することができる。また、近似図形からの代表点の抽出や、近似曲線（直線の場合も含む）のパラメータの生成も容易に行うことができる。また、近似曲線のパラメータから近似図形を生成することも容易に行うことができる。また、映像中の物体の通過位置、ある地点での滞留時間、あるいは軌跡などに基づいて、映像中の物体の検索を容易に行うことができる。また、操作性の良いハイパーメディア・アプリケーションを実現できる。
【００１９】
また、本発明によれば、平面情報である２次元的位置情報以外に、奥行きに関する情報を付与することにより、奥行き方向を考慮した検索、例えばカメラからの距離情報で物体を検索が可能となる。
また、物体が他の物の陰に隠れてしまうオクル−ジョンの状態は、物体領域の軌跡情報の他にオクル−ジョンかどうか（つまり見えているかどうか）を示すフラグを付帯させることにより表現することにより、オクル−ジョンを考慮した効率的な検索が可能になる。
また、検索の効率を上げるために、物体領域を関数で表現するだけでなく、物体が時空間的に存在する位置を囲む図形を付帯させることにより、全く別の場所に存在する物体を検索の候補から除外することが可能となる。
また、例えばカメラが物体領域を追いかけながら撮影している場合には、連続するフレームを画像変換を施してつながるように貼り合わせるモザイキングによるパノラマ画像を作成し、その作成された画像上での物体の領域情報を記述することにより、カメラが移動していてもモザイキング画像のある点を基点とした座標系で物体の領域情報を一意に記述することができる。
【００２０】
【発明の実施の形態】
以下図面を参照して本発明による物体領域情報生成装置、及び物体領域情報記述プログラムの実施例を説明する。
【００２１】
第１実施例
図１に、本発明の一実施例に係る物体領域情報生成装置（あるいは物体領域データ変換装置とも呼称する）の構成例を示す。
【００２２】
物体領域情報生成装置は、映像データ記憶部１００、物体領域抽出部１０１、物体領域の図形近似部１０２、近似図形の代表点抽出部１０３、代表点軌跡の関数近似部１０４、物体領域データ記憶部１０６を備えている。また、物体領域に関連する関連情報記憶部１０５を更に備えてもよい。
【００２３】
図２は、物体領域情報生成装置の処理の流れの一例を表したフローチャートである。
【００２４】
映像データ記憶部１００は、映像データが記憶されているもので、例えばハードディスクや光ディスク、半導体メモリなどで構成される。
【００２５】
物体領域抽出部１０１は、映像データにおける一部の領域を抽出する（ステップＳ１）。この一部の領域とは、典型的には、映像中の特定の人や動植物や車や建物などの「物体の領域」であるが、映像中において物体（オブジェクト）として扱うことのできるものであれば、映像中のどのようなものでもあってもよい。また、独立したものであってもよいし、物の一部（例えば人の頭、車のボンネット、建物の玄関）であってもよいし、物の集合（例えば鳥や魚の群）であってもよい。映像では、連続するフレームには同じ物体が写っていることが多いが、物体自身の動きおよびまたは撮影時のカメラの動きが主な原因になって同一物体に対応する領域がフレーム間で変化することが多い。
【００２６】
物体領域抽出部１０１は、このような注目している物体の動きや変形に対応して各フレームにおける物体（オブジェクト）の領域を抽出するためのものである。具体的な抽出手法としては、全フレームに渡って人手で領域指定する方法や、Ｍ．Ｋａｓｓ他，「Ｓｎａｋｅｓ：Ａｃｔｉｖｅｃｏｕｎｔｏｕｒｍｏｄｅｌｓ」（ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＶｉｓｉｏｎ，ｖｏｌ．１，Ｎｏ．４，ｐｐ．３２１−３３１．Ｊｕｌｙ，１９８８）に記されているようなＳｎａｋｅｓと呼ばれる動的輪郭モデルにより物体の輪郭抽出を連続して行う方法、金子他「ロバスト推定を用いたハイパーメディアコンテンツ作成のための高速移動物体追跡法」（情報処理学会技術報告ＣＶＩＭ１１３−１，１９９８）に記されているようなブロックマッチングにより求めた物体中の部分領域の移動先から物体全体の変形・移動を推定していく方法、画像解析ハンドブック（第ＩＩ部第２章，東京大学出版会，１９９１）に記されているような領域成長・分割により似た色を持つ領域を特定する方法などを用いることができる。
【００２７】
図形近似部１０２は、物体領域抽出部１０１で抽出された映像中の物体の領域を所定の図形により近似する（ステップＳ２）。
【００２８】
図形の種類としては、矩形、円、楕円、多角形など種々のものが使用可能である。近似に用いる図形の種類は、予め固定的に定めておくようにしていてもよいし、例えば近似する対象物体毎などの所定の単位で図形の種類をユーザが指定できるようにしてもよいし、近似する対象物体毎にその物体の形状等に応じて図形の種類を自動的に選択するようにしてもよい。
【００２９】
また、領域の近似方法も、物体領域の外接矩形で近似する方法、この方法で求めた矩形の外接楕円または内接楕円で近似する方法、物体領域の外接楕円で近似する方法、物体領域に対する初期近似多角形を生成した後に物体領域の面積と該近似多角形との誤差が基準以内に収まるように該近似多角形の頂点数を削減していく方法、予め定められた頂点数の多角形で近似する方法など種々の方法がある。また、傾きを持つ図形でより良く近似する方法もある。また、さらに他の幾何学的な量をも加味する方法もあり、例えば、物体領域の重心と近似図形の重心とを一致させるようにする方法、近似図形の面積を物体領域の面積に一定数を乗じた値にする方法など種々の方法がある。
【００３０】
図形近似部１０２は、物体領域抽出部１０１での抽出結果が入力されるたびに、フレーム毎に行う。もしくは、前後数フレームの領域抽出結果を使って図形近似を行っても良い。数フレームの領域抽出結果を利用する場合には、近似図形の大きさや位置などの変化を数フレームの間で平滑化することにより、近似図形の動きや変形をなめらかにしたり、領域抽出の抽出誤差を目立たなくすることができる。なお、近似図形の大きさは、フレーム毎に異なって構わない。
【００３１】
代表点抽出部１０３は、領域図形近似部１０２の出力である近似図形を表現する代表点を抽出する（ステップＳ３）。どのような点を代表点とするかは、どのような近似図形を用いるかにより異なる。例えば、近似図形が矩形の場合には４つもしくは３つの頂点を代表点とすることができ、近似図形が円の場合には中心と円周上の一点としたり直径の両端点としたりすることができる。また、楕円の場合には楕円の外接矩形の頂点を代表点としたり（この場合も４頂点のうち３つで十分である）、２つの焦点と楕円上の１点（例えば短軸上の１点）を代表点としたりすればよい。任意の閉多角形を近似図形とする場合には、各頂点を図形の代表点とすればよい。
【００３２】
代表点の抽出は、図形近似部１０２から１フレーム分の近似図形の情報が出力されるたびに、フレーム単位で行われる。また、各代表点は、水平方向の座標軸Ｘと、垂直方向の座標軸Ｙと、により表される。
【００３３】
代表点軌跡関数近似部１０４は、図形代表点抽出部１０３で抽出された代表点の位置（またはこれを特定可能とする量）の時系列軌跡を時間ｔ（例えば映像に付与されているタイムスタンプ）もしくはフレーム番号ｆの関数（近似関数）により近似表現する（ステップＳ４）。この関数は、各代表点毎別々に、かつ、Ｘ座標とＹ座標で別々に表現される。
【００３４】
代表点（またはこれを特定可能とする量）がｎ個である場合、それぞれについてＸ、Ｙ座標の近似関数が必要になるので、合計２ｎの近似関数が生成される。
【００３５】
代表点軌跡を表す関数としては、直線、スプライン曲線などを用いることができる。
【００３６】
以上の一連の処理は、対象となる物体についての出現フレームから消失フレームの間にわたって行われる。
【００３７】
求められた近似曲線（直線の場合も含む）は、所定のフォーマットに従って物体領域データとして領域データ記憶部１０６に記録される。
【００３８】
必要に応じて設けられる関連情報記憶部１０５には、映像データ記憶部１００に記憶されている映像データに登場する物体に関する情報（関連情報）や、そのような情報を外部記憶装置あるいはネットワークを介したサーバなどから取得するためのポインタ情報（例えば、関連情報の記録されているアドレス、ファイル名、ＵＲＬなど）を記憶するためのものである。関連情報は、文字、音声、静止画、動画、あるいはそれらを適宜組み合わせたものであってもよい。また、関連情報は、プログラムもしくは計算機の動作を記述したデータであってもよい（この場合には、当該物体がユーザにより指定されると、計算機が所望の動作を行うことになる）。関連情報記憶部１０５は映像データ記憶部１００と同様に例えばハードディスクや光ディスク、半導体メモリなどで構成される。
【００３９】
領域データ記憶部１０６は、代表点軌跡関数近似部１０４の出力である代表点の位置（またはこれを特定可能とする量）の時系列的な軌跡を近似した曲線式を表現するデータを含む物体領域データが記憶される記憶媒体である。関連情報記憶部１０５を備える構成では、関数で表現された領域に対応する物体に関する関連情報が関連情報記憶部１０５に記憶されている場合には、物体領域データには関連情報そのものや関連情報の記録されているアドレスを併せて記録することができる。関連情報記憶部１０５に関連情報が記録されているアドレスの情報が記憶されている場合には、当該アドレス情報を併せて記録することができる。領域データ記憶部１０６も映像データ記憶部１００等と同様に例えばハードディスクや光ディスク、半導体メモリなどで構成される。
【００４０】
なお、映像データ記憶部１００、関連情報記憶部１０５、領域データ記憶部１０６は、別々の記憶装置によって構成されていてもよいし、それらの全部または一部が同一の記憶装置によって構成されていてもよい。
【００４１】
このような物体領域情報生成装置は、計算機上でソフトウェアを実行する形で実現することもできる。
【００４２】
なお、この物体領域情報生成装置での処理、特に、物体領域抽出部１０１や図形近似部１０２の処理においてユーザの操作を介入させる形態を取る場合には、映像データを例えばフレーム単位で表示させ、ユーザの指示入力等を受け付けるＧＵＩが用いられる。ただし、図１では省略している。
【００４３】
次に、より具体的な例を用いながらこの物体領域情報生成装置の動作について説明する。
【００４４】
ここでは、物体領域を多角形により近似し、近似多角形の頂点を代表点とし、近似関数として２次の多項式スプライン関数を用いる場合を例にとって説明する。なお、以下の説明で、近似図形に多角形を用いる例において、多角形の頂点という場合における「頂点」は一般的には代表点のことを意味することになる。
【００４５】
図３の（ａ）〜（ｃ）は、物体領域抽出部１０１による物体の領域を抽出する処理から、領域図形近似部１０２による領域を図形で近似する処理、図形代表点抽出部１０３による図形の代表点を抽出する処理、代表点軌跡関数近似部１０４による代表点軌跡を関数で近似する処理までの一連の処理の概要をより具体的に説明するための図である。
【００４６】
図３の（ａ）において、２００は処理対象となっている映像中の１フレームを示している。
【００４７】
２０１は抽出対象となっている物体の領域を示している。この物体の領域２０１を抽出する処理は物体領域抽出部１０１において行われる。
【００４８】
２０２は物体の領域を多角形で近似したもの（近似多角形）である。物体の領域２０１からその近似多角形２０２を求める処理は、領域図形近似部１０２において行われる。
【００４９】
図３の（ｂ）は、複数のフレームにわたる近似図形の代表点、すなわちこの例における近似多角形２０２の頂点の推移（軌跡）およびその推移の近似曲線を表現したものである。
【００５０】
本実施例では、近似図形の複数の代表点のうちから選択された特定の代表点（全フレームにわたって同一のものとする）を、基準代表点と呼び、これをＶ₀と表記する。この例の場合、近似多角形２０２の複数の頂点のうちの任意の１つの頂点を基準代表点Ｖ₀とする。
【００５１】
選択の方法は、最大または最小のＸ座標値またはＹ座標値を持つ点を選択する方法、フレーム中で最も右上または右下または左下または左上にある点を選択する方法など、種々の方法がある。
【００５２】
２番目以降のフレームでは、１つ前のフレームに対応する基準代表点Ｖ₀に対応するものが、当該フレームにおける複数の代表点のうちのいずれであるかを判定することによって、基準代表点Ｖ₀の選択が行われる。
【００５３】
どの代表点が１つ前のフレームにおける基準代表点Ｖ₀の移動先であるかを判定する方法は、例えば、１つ前のフレームにおける基準代表点Ｖ₀に最も近い当該フレームにおける点を代表点とする方法、１つ前のフレームにおける近似図形の重心と当該フレームにおける近似図形の重心とを一致させた場合に１つ前のフレームにおける基準代表点Ｖ₀に最も近い当該フレームにおける点を代表点とする方法、１つ前のフレームにおける近似図形の複数の代表点と当該フレームにおける近似図形の複数の代表点を照らし合わせることによって、当該フレームにおける基準代表点Ｖ₀を求める方法、１つ前のフレームにおける対象の物体の領域の映像データと、当該フレームにおける映像データを照らし合わせることによって、当該フレームにおける基準代表点Ｖ₀を求める方法など、種々の方法がある。
【００５４】
なお、隣接フレームにおける基準代表点Ｖ₀以外の代表点の対応は、上記と同様の方法による方法と、基準代表点Ｖ₀を起点として予め定めた順番で他の代表点を対応させてしまう方法、などがある。
【００５５】
これらの処理は図形代表点抽出部１０３において行われる。
【００５６】
代表点軌跡関数近似部１０４では、逐次入力されてくる各フレームにおける基準代表点Ｖ₀の座標値から、軌跡２０３を近似する曲線（関数）を求める。各フレームにおける基準代表点Ｖ₀の移動先を結んだ軌跡が図３の（ｂ）の２０３である。
【００５７】
基準代表点Ｖ₀の座標値はＸ座標とＹ座標とを含む。それぞれの座標値は別々に時間ｔまたはフレーム番号ｆの関数として近似される。
【００５８】
図３の（ｃ）の２０４は、基準代表点Ｖ₀について求められた関数の例である（ここでは基準代表点Ｖ₀の１つの座標軸についてのみ示している）。この例は、近似区間がｔ＝０〜５とｔ＝５〜１６の２つに分割された場合を示している。
【００５９】
図４は、基準代表点Ｖ₀のＸ座標の値を近似する関数を求めている例である。図中の３０１は物体の存在している時間区間を表しており、黒い点３０２が基準代表点Ｖ₀のＸ座標の値である。３０３がその近似関数である。Ｙ座標に対しても、同様にして近似関数が求められる。近似関数として多項式スプライン関数を用いているので、２０４では節点と呼ばれる点により分割された時間区間毎に多項式が定義されている。ここでは、ｔ＝０，５，１６がそれぞれ節点時刻となる。
【００６０】
ところで、近似図形の基準代表点Ｖ₀以外の代表点についても上記と同様にして近似関数を求め、記録することが可能である。
【００６１】
また、基準代表点Ｖ₀以外の代表点については、当該代表点を当該代表点とは別の代表点（基準代表点でもよい）からの相対的関係、例えば差分ベクトルによって表し、そのベクトルの軌跡により記述する方法もある。
【００６２】
以下では、基準代表点Ｖ₀以外の代表点については隣接する代表点からの差分ベクトルの軌跡により記述する場合を例にとって説明する。
【００６３】
図５は、近似多角形において、基準代表点Ｖ₀である１つの頂点と、その他の頂点を表すための差分ベクトルの各々を説明している図である。
【００６４】
まず、基準代表点Ｖ₀以外の各頂点を、基準代表点Ｖ₀から予め定めた順番、例えば時計回りに、Ｖ₁，Ｖ₂，…，Ｖ_M-1と書くことにする。ここで、Ｍは頂点数であるが、図５では５角形であるので、Ｍ＝５となる。また、頂点Ｖ₀からＶ₁へのベクトルをＶ_0,1と記述し、同様にベクトルＶ_1,2，Ｖ_2,3，…，Ｖ_M-2,M-1を定める。それぞれのベクトルは各ベクトルの始点から見たＸ成分及びＹ成分の値を持っている（相対位置データ）。
【００６５】
図６の黒い点列５０２は、時間５０１中の各時刻におけるベクトルＶ_0,1のＸ成分の値を表している。
【００６６】
なお、これらベクトルを求める処理は図形代表点抽出部１０３において行われる。
【００６７】
代表点軌跡関数近似部１０４では、各々のベクトルのＸ成分の値とＹ成分の値の各々を表現する近似関数５０３を算出する。
【００６８】
物体の形状がほとんど変わらず、物体の移動が平行移動に近い場合には、ベクトルＶ_0,1，Ｖ_1,2，…，Ｖ_M-2,M-1の値はあまり変化しないため、近似関数と実際の値との誤差が小さくなり、物体領域の記述効率が向上することが期待できる。もしも物体の形状が変化せず、完全な平行移動である場合には、ベクトルＶ_0,1，Ｖ_1,2，…，Ｖ_M-2,M-1 の値はまったく変化しないため、近似関数はすべて直線となり、しかも近似誤差はゼロになる。
【００６９】
図７は、代表点軌跡関数近似部１０４に逐次入力される代表点（この例では物体領域の近似多角形の頂点）の座標値または上記の差分ベクトルの成分値から、それら代表点の座標値またはその差分ベクトルの成分値の近似関数を求める処理の一例をフローチャートにしたものである。
【００７０】
ここでは、Ｉ番目のフレームに対応する時刻をｔ_i（ｉ＝０，１，…）とする。また、ν⁽⁰⁾ _tを時刻ｔにおけるＶ₀のＸ座標値、ν^(j) _t（ｊ＝１，２，…，Ｍ−１）を時刻ｔにおけるＶ_j-1,jのＸ成分値としている。また、すでに決定しているスプライン関数の節点に対応する時刻ｔのうち、最大のものをｔ_ｋとする。
【００７１】
まず、ステップＳ６０１においてｔ_kおよびｉの初期設定を行う。
【００７２】
ステップＳ６０２では、ある節点ｔ_kから節点ｔ_iまでの区間でν^(j) _tの近似関数（本実施例では２次の多項式）を求める。近似関数を求める手法は、最小二乗法を用いるのがもっとも一般的である。ただし、この際、近似関数は節点を通過するという条件を付加する必要がある。そのため、ｔ_aからｔ_bの区間について求められたν^(j) _tの近似関数をＦ^(j) _ta _， _tb（ｔ）（ｊ＝０，１，…，Ｍ−１）と記述すると、区間の開始点ν^(j) _k＝Ｆ^(j) _tk _， _ti（ｔ_k）、区間の終了点ν^(j) _i＝Ｆ^(j) _tk _， _ti（ｔ_i）となる。この条件がないと、節点において多項式スプライン関数が不連続になってしまうためである。
【００７３】
次に、ステップＳ６０３では近似関数の近似誤差ｅ^(j)（ｊ＝０，１，…，Ｍ−１）を算出する。この近似誤差は、次式により算出される。
ｅ^(j)＝ｍａｘ｜ν^(j) _th−Ｆ^(j) _tk _， _ti（ｔ_h）｜
ただし、対象とするｈの範囲は、ｋ≦ｈ≦ｉとする。
【００７４】
ステップＳ６０４では、各頂点での近似誤差が許容範囲内であるかどうかの判定を行う。許容誤差の範囲はすべての頂点で同じに設定しても良いし、別々の範囲に設定しておいても良い。ひとつでも許容誤差範囲外であればステップＳ６０５へ、すべてが許容範囲内であればステップＳ６０６へ進む。
【００７５】
ステップＳ６０５では、１つ前の範囲であるｔ_kからｔ_i-1の区間の近似関数をＦ^(j) _tk _， _ti-1（ｔ）（ｊ＝０，１，…，Ｍ−１）と決定し、ｋ＝ｉ−１とする。
【００７６】
ステップＳ６０６では、ｉの値を更新（ｉ←ｉ＋１）する。このように、近似関数は近似誤差が許容範囲以内の区間では同じ関数を用いるが、許容誤差が大きくなると、再び最小二乗法を実行して関数を近似し直す。
【００７７】
ステップＳ６０７は、終了判定処理で、新たな代表点についての座標値（またはその差分ベクトルの成分値）の入力がなければ処理を終了し、まだ代表点の座標値（または成分値）が入力されるならば再びステップＳ６０２からの処理を行う。
【００７８】
ステップＳ６０７で終了判定がなされると、ステップＳ６０８で、最後の区間ｔ_kからｔ_i-1の近似関数をＦ^(j) _tk _， _ti-1（ｔ）（ｊ＝０，１，…，Ｍ−１）と決定する。
【００７９】
なお、図７ではＸ座標のみについて説明を行ったが、Ｙ座標についても同様の処理を行う。また、ステップＳ６０４の誤差の判定においては、各頂点のＸ座標およびＹ座標すべてについての誤差を同時に評価するようにしても良い。
【００８０】
なお、代表点軌跡関数近似部１０４による処理は、当該物体の領域に関する各フレームの代表点の座標値（成分値）が得られる毎に行う方法（例えば各フレームの代表点の座標値（成分値）が得られる毎に近似を行うとともに近似誤差を求め、近似誤差が一定の範囲に収まるように節点を設けて近似区間を適宜分割する方法）や、当該物体の領域に関する全てのフレームの代表点の座標値（成分値）が得られた後に行う方法などがある。
【００８１】
また、物体領域の代表点軌跡データを作成する際に、全代表点の全座標の全てについて節点を同一にするようにしてもよい。例えば、代表点の座標値（または成分値）を近似する際に、いずれかの代表点についての近似処理において誤差が基準値を超えて節点が設けられることになった場合には、他のすべての代表点についての近似処理においても強制的に同一の節点を設けるようにする。
【００８２】
このようにして得られたスプライン関数などの近似関数は予め定めておいたデータ形式に従って領域データ記憶部１０６に記録される。
【００８３】
以下では、領域データ記憶部１０６に格納される物体領域データのデータ形式について説明する。なお、ここでは、代表点をスプライン関数により近似する場合を例にとりながら説明するが、代表点を他の関数により近似する場合も同様に可能である。
【００８４】
図８に、物体領域データのデータ形式の一例を示す。
【００８５】
図形種ＩＤ７００は、物体領域の近似に用いた図形の種類を特定する。例えば、物体の重心のみ（ＣＥＮＴＲＯＩＤ）、矩形（ＲＥＣＴＡＮＧＬＥ）、楕円（ＥＬＬＩＰＳＥ）や多角形（ＰＯＬＹＧＯＮ）などが指定できる。
【００８６】
代表点数７０３は、図形の種類によって定まる代表点の数を表す（ここではＭ点とする）。
【００８７】
代表点軌跡７０４は、代表点の軌跡を記述しており、代表点の数（Ｍ個）だけ並んでいる。基準代表点Ｖ₀以外の代表点については隣接する代表点からのベクトルの軌跡により記述する場合、１番目の代表点軌跡には、基準代表点Ｖ₀の軌跡が記述されており、２番目の代表点軌跡にはＶ_0,1が、３番目の代表点軌跡にはＶ_1,2が、そしてＭ番目の代表点軌跡にはＶ_M-2,M-1の軌跡がそれぞれ記述されている。
【００８８】
なお、近似図形の基準代表点Ｖ₀以外の代表点も基準代表点と同様にして近似関数を求め、記録する場合には、１番目の代表点軌跡には、Ｖ₀の軌跡が記述され、２番目の代表点軌跡にはＶ₁が、３番目の代表点軌跡にはＶ₂が、そしてＭ番目の代表点軌跡にはＶ_M-1の軌跡がそれぞれ記述される。
【００８９】
物体出現時間７０１は、所望の物体が出現した時刻、物体存在期間７０２は物体の存在していた時間の長さである。物体存在期間７０２は、物体消失時間で代用することも可能である。また、物体出現時間、物体存在期間とも時間ではなくフレーム番号、フレーム数で記述しておいても良い。なお、７０１および７０２の情報は代表点軌跡７０４内の節点時刻からも得ることができるため、必ずしも記述しなくても良い。
【００９０】
なお、物体出現時間／物体出現フレーム、物体存在期間／物体存在フレーム、物体消失時間／物体消失フレームは、現実に映像中で物体が登場したフレームや消えたフレームにより決めてもよいし、その代わりに、例えば、映像中で物体が登場したときより後の任意のフレーム番号を先頭フレーム番号としてもよいし、また先頭フレーム番号以降でかつ映像中で物体が消えたときより前の任意のフレーム番号を最終フレーム番号としてもよい。
【００９１】
なお、物体領域データには、物体毎に付与される識別番号であるＩＤ番号を付加してもよい。
【００９２】
また、１つの物体を複数の近似図形数で近似しても良い。この場合には、物体領域データには、例えば、近似に用いる図形の個数分だけ、図形種ＩＤと代表点数と代表点軌跡が含まれる。
【００９３】
図９は、図８の代表点軌跡のデータフォーマットの具体例である。
【００９４】
節点数Ｎ８００は、代表点軌跡を表すスプライン関数の節点の数を表す。各節点に対応するフレームは、時間として表され、節点時刻８０１に格納される。節点時刻は、節点数だけあるため、配列８０２として記述しておく。同様に、各節点のｘ座標についての座標値（またはその差分ベクトルのｘ成分値等の座標値を特定可能とする量）、ｙ座標についての座標値（またはその差分ベクトルのｙ成分値等の座標値を特定可能とする量）もそれぞれ節点Ｘ８０３および節点Ｙ８０５の配列８０４，８０６として記述される。
【００９５】
一次関数フラグ８０７は、節点間のスプライン関数として一次関数だけが用いられているかどうかを表す。一部分でも２次の多項式を用いる場合には、このフラグはオフにしておく。このフラグを用いることにより、近似関数として一次関数のみに使われる場合に以下で説明する関数特定情報８０８、８１２を一つも記述しなくて済むため、データ量を削減できるというメリットがある。なお、必ずしもこのフラグは必要ではない。
【００９６】
関数特定情報に含まれる関数ＩＤ８０９、８１２，関数パラメータ８１０、８１４はそれぞれ多項式スプライン関数の次数と、その係数を特定するための情報を表す。これは、例えば１次多項式を使うならば１、２次多項式を使うならば２というように設定する。もちろん、多項式の最高次数を３次以上とすることも可能である。１次多項式を用いるときは節点のみの情報で十分なので、関数パラメータは記述されないが、２次多項式の場合には係数を特定するための値一つ（例えば、２次の係数、あるいは二次曲線上の節点以外の１点の座標値（差分ベクトルを用いている場合には成分値））が関数パラメータに記述される。関数特定情報は、節点数より１つ少ない数だけ存在し、これらは配列８１１、８１２となって記述される。Ｙ座標に関しても同様に関数特定情報配列８１２が記述される。
【００９７】
これまで説明した方法では、近似図形の基準代表点Ｖ₀以外の代表点を記述するのに、隣接した代表点からのベクトルを求め、このベクトルを近似関数に変換していた。このような方法以外にも、他の代表点、例えば基準代表点Ｖ₀からのベクトルを使う方法について説明する。
【００９８】
例えば、図１０で説明されるように、基準代表点Ｖ₀以外の代表点（この場合近似多角形の頂点）Ｖ_iについては、Ｖ₀からＶ_iへのベクトルＶ_0,iを算出しておく。そして、図７で説明された処理において、ν^(j) _t（ｊ＝１，２，…，Ｍ−１）を時刻ｔにおけるＶ_0,iの成分値と置き換えて処理を行う。
【００９９】
この方法によれば、どの基準代表点Ｖ₀以外の代表点も、基準代表点Ｖ₀と１つのベクトルにより記述できるため、記述データから得られる値の誤差が累積されないという利点がある。
【０１００】
また、その他にも、図１１の（ａ）のように、基準代表点Ｖ₀から右回りでベクトルを半分求め、左回りで残りのベクトルを求める方法や、図１１の（ｂ）のように、基準代表点Ｖ₀からのベクトルで表す代表点を複数設け、それらからは隣接代表点間でベクトルを求める方法など、様々なバリエーションが可能である。
【０１０１】
また、近似図形の代表点がａ（≧３）個ある場合に、２以上ａ−１以下の複数の代表点をそれぞれ基準代表点とし、残りの１以上の代表点を差分ベクトルで表すことも可能である。
【０１０２】
なお、これらの場合においても、図８の物体領域データの代表点軌跡７０４は、代表点の数（Ｍ個）だけ存在することになる。
【０１０３】
次に、これまでは、各々のフレームにおいて、基準代表点Ｖ₀をおおもとの基点として様々な方法でそれ以外の代表点を表す方法について説明したが、以下では、連続するフレームにおいて代表点の移動量をベクトルで表現し、これらベクトルの軌跡を近似関数に変換することにより物体領域を記述する方法について説明する。
【０１０４】
図１２において、１１００は初期フレームにおける物体近似図形（多角形）、１１０２は時刻ｔのフレームにおける物体近似図形、そして１１０１は１１０２の手前のフレームにおける物体近似図形である。１１０３は時刻ｔにおける物体領域の代表点のひとつである。１１０４は手前のフレームにおける１１０３の対応点である。１１０５は１１０４から１１０３への移動ベクトルであり、時刻ｔのフレームにおける代表点の移動量を表している。移動ベクトルは、各フレームに対応した時刻毎に得られるため、これまでと同様に時間ｔの関数により近似することが可能である。
【０１０５】
このような方法で物体領域を記述するための処理としては、図７で説明されるフローチャートにおいて、ν^(j) _t（ｊ＝０，１，…，Ｍ−１）を時刻ｔにおけるＶ’_iの成分値と置きかえればよい。ここで、Ｖ’_iは時刻ｔにおけるＶ_iの移動ベクトルとしている。この方法ではＶ₀も他の代表点と同様の方法で移動ベクトルが算出され、近似関数への変換が行われる。
【０１０６】
なお、このような移動ベクトルを用いた方法では、物体が出現したフレームにおける近似図形の全代表点の座標を記述しておく必要がある。従って、この方法の場合に記述される（図８の例に対応する）データフォーマットは図１３のようになる。図８との違いは、代表点初期位置１２００が付与されている点である。代表点初期位置１２００には、初期フレームにおけるＭ個の代表点の座標値が記述されている。このときの座標値の記述方法としては、全ての代表点の座標値をそのまま記述すれば良い。また、ひとつの代表点の座標値のみをそのまま記述し、他の代表点の座標は、例えば、図５で表されるように隣接した代表点からの差分のベクトルを記述する方法、あるるいは図１０で説明されるようにひとつの代表点Ｖ₀からの差分のベクトルで記述する方法などを用いても良い。
【０１０７】
また、他の物体領域情報記述方法として、初期代表点位置から時刻ｔの代表点の位置への移動ベクトルを直接求め、これを近似関数に変換して記述することも可能である。
【０１０８】
次に、上記のように物体領域データに記述された物体の領域に関する情報から、任意の時刻Ｔにおける物体の領域を取り出す方法について説明する。この処理は、例えば映像データおよびその物体領域データを扱う情報処理装置において実行される。もちろん、このような情報処理装置は、計算機上でソフトウェアを実行する形で実現することもできる。
【０１０９】
図１４は、この場合の処理の一例を示すフローチャートである。
【０１１０】
ここでは、基準代表点Ｖ₀以外の代表点については隣接する代表点からのベクトルの軌跡により記述する場合の例について説明する。
【０１１１】
ステップＳ９０１では、与えられた時刻Ｔに物体が存在するかどうかを判断する。これは、物体出現時間７０１および物体存在期間７０２を参照することで容易に判断できる。もしも時刻Ｔに物体が存在していない場合には、物体領域がないため、直ちに処理を終了する。
【０１１２】
ステップＳ９０２では、時刻Ｔにおける近似関数Ｆ^(j) _ta _， _tb（ｔ）（ｊ＝０，１，…，Ｍ−１）を再構成する。ここで、時刻Ｔを含む区間の両端の節点の時刻をｔ_a およびｔ_b とする。近似関数は、図９の節点Ｘ８０３、または節点Ｙ８０５に記述されているｔ_a およびｔ_b における座標値（またはその差分ベクトルの成分値）と、関数ＩＤ８０９、関数パラメータ８１０により再構成できる。すなわち、近似関数に１次多項式を用いている場合には、近似関数は二つの節点を通過する直線として求められる。また、２次多項式を用いており、関数パラメータに２次の係数が記述されている場合には、２次の係数は関数パラメータの値により決定し、２次未満の係数は近似関数が節点を通過するように決定すればよい。
【０１１３】
ステップＳ９０３では、近似関数にｔ＝Ｔを代入し、時刻ＴにおけるＶ₀の座標値およびＶ_1,2，Ｖ_2,3，…，Ｖ_M-2,M-1の成分値を求める。
【０１１４】
最後にステップＳ９０４では、Ｖ₀およびＶ_1,2，Ｖ_2,3，…，Ｖ_M-2,M-1を逐次的に足しこむことにより、Ｖ₀，Ｖ₁，…，Ｖ_M-1の座標値を算出する。
【０１１５】
このようにして求められた代表点をもとにして、情報処理装置では、物体の領域を近似する図形を生成すること、物体の映像データのうち近似図形の範囲を特定の表示形態で表示して対処物体をユーザに呈示すること、ユーザが画面上に表示中の映像上をマウスなどのポインティングデバイス等で指示した場合に例えばその時刻（フィールド）に物体領域の近似図形が存在し且つ指示位置が近似図形の内部であればその対象物体が指示されたと判断することなど、対象物体に関する種々の処理を行うことができる。
【０１１６】
例えば、図８に例示した物体領域データに関連情報が付加されている場合、あるいは物体領域データとは別に各物体に対する関連情報を含むデータベースが存在するなどの場合に、ハイパーメディアや物体検索に用いることができる。
【０１１７】
ハイパーメディアでは、ユーザが当該物体をマウス等で指定することにより、指定された時刻・場所が物体領域の内部であるか外部であるかを判定し、内部であると判定されれば、その物体に関する関連情報を検索させたり、表示させたりすることが、容易にできる。また、関連情報がプログラムや計算機の動作を記述したデータまたはそのポインタである場合には、ユーザが当該物体を指定することにより、計算機に所定の動作を行わせることができる。
【０１１８】
なお、本実施例において、映像や物体はどのようなものであってもよい。例えば、映像が映画などのコンテンツ、物体が俳優等の登場人物もしくは他の登場物体、関連情報がその俳優もしくはその役柄等に関する説明であれば、映画を視聴している視聴者は、所望の俳優に関する説明をその俳優の画像をクリックするだけで閲覧することができる。同様に、電子百科事典、電子カタログ等のあらゆる電子コンテンツに適用可能である。
【０１１９】
また、例えば、物体検索では、物体の通過位置、非通過位置、ある位置における大きさ、ある位置における滞在時間などを検索キーとして条件に合う物体を検索することができる。いずれの検索キーに対しても、物体の存在する時間区間に対して逐次代表点座標を取り出し、任意の点が代表点で構成される図形の内部か外部かを判定したり、面積を計算することにより条件を満たすかどうかが判断できる。
【０１２０】
また、例えば、関連情報にキーワードを記述しておけば、物体をキーワード検索することができる。さらに、関連情報にその物体から抽出した、シェープ、テクスチャ、アクティビティ、カラーなどの特徴量を記述しておけば、そのような特徴量をもとにオブジェクト検索することができる。
【０１２１】
また、例えば、物体領域データを解析することにより得られる、物体のシェープ、テクスチャ、アクティビティ、カラーなどの特徴量に基づいて、不審な人物等の監視を行う、監視システムを実現することができる。
【０１２２】
次に、映像データや物体領域データの提供方法について説明する。
【０１２３】
本実施例の処理により作成された物体領域データがユーザの用に供される場合には、作成者側からユーザ側に何らかの方法で物体領域データを提供する必要がある。この提供の方法としても以下に例示するように種々の形態が考えられる。
（１）映像データとその物体領域データとその関連情報とを１つ（または複数の）記録媒体に記録して同時に提供する形態
（２）映像データとその物体領域データとを１つ（または複数の）記録媒体に記録して同時に提供するが、関連情報は別途提供するかもしくは提供しない（後者は例えば提供しなくてもユーザがネットワーク経由等で別途取得できる場合）形態
（３）映像データを単独で提供し、別途、物体領域データと関連情報とを１つ（または複数の）記録媒体に記録して同時に提供する形態
（４）映像データ、物体領域データ、関連情報を別々に提供する形態
上記は主に記録媒体により提供する場合であるが、その他にも、一部または全部を通信媒体で提供する形態も考えられる。
【０１２４】
本実施例によれば、複数フレームに渡る映像中の物体の領域を、該物体の領域に対する近似図形の代表点の位置データまたはそれを特定可能なデータ（例えば、代表点間差分ベクトル値）をフレームの進行に沿って並べることにより得られる軌跡を近似した関数のパラメータとして記述することにより、複数フレームに渡る映像中の物体の領域を少量の関数パラメータのみによって記述することができるため、物体の領域を特定するためのデータの量を効果的に削減することができ、またハンドリングを容易にすることができる。特に物体が剛体の場合は、相対位置は絶対位置よりも変動が少なく、その軌跡を関数近似したときに、コンパクトな情報量で記述することができる。また、近似図形からの代表点の抽出や、近似曲線（直線の場合も含む）のパラメータの生成も容易に行うことができる。また、このデータを通信する場合の通信量を減らすことができる。近似曲線のパラメータから近似図形を生成することも容易に行うことができる。この近似図形として基本的な図形（例えば多角形）により代表させれば、ユーザにより指定された任意の座標が物体の領域（近似図形）内か否か（物体の領域を指示しているか否か）を簡単な判定式により判定することができる。さらに、これによって、ユーザによる映像中の動く物体の指示をより容易にすることができ、映像中の物体の通過位置、ある地点での滞留時間、あるいは軌跡などに基づいて、映像中の物体の検索を容易に行うことができる。また、操作性の良いハイパーメディア・アプリケーションを実現できる。
【０１２５】
次に本発明の他の実施例を説明する。以下の実施例で第１実施例と対応する部分は同一参照数字を付して詳細な説明は省略する。
【０１２６】
第２実施例
第２実施例では、第１実施例において、さらに、映像中の物体について、画面上の２次元情報（代表点のＸ座標値、Ｙ座標値）以外に奥行きの方向に関する情報をも物体領域情報に含める場合について説明する。なお、第２実施例では、第１実施例と相違する点を中心に説明する。
【０１２７】
なお、本実施例では、第１実施例の物体領域情報生成装置に更に奥行きの方向に関する情報（以下、奥行き情報と呼ぶ）を得るための処理部１０８が必要になる。この処理部１０８は図１５に示すように、映像データ記憶部１００と代表点軌跡の関数近似部１０４との間に接続される。
【０１２８】
まず、奥行き情報としては、これを連続値（Ｚ座標値）で与える方法と、離散的なレベル値（より好ましくは一定の範囲内の整数値）で与える方法がある。また、各値は、映像データが撮影されたものである場合には、被写体を実測したデータに基づく方法と、ユーザなどが指定する方法がある。映像データが人工的なもの（例えばＣＧあるいはアニメーションなど）の場合には、奥行きに関する値が与えられているならばこれに基づく方法と、ユーザなどが指定する方法がある。
【０１２９】
また、上記のそれぞれの場合において、奥行き情報は、対象物体毎に与える方法と、対象物体の近似図形の代表点毎に与える方法がある。
【０１３０】
また、上記の各方法の組み合わせにおいて、奥行き情報を、その物体の出現フレームから消失フレームまでの全フレームに対してそれぞれ与える方法と、その物体の出現フレームから消失フレームのまでの全ての所定の区間（例えば、隣接節点区間）に対してそれぞれ与える方法などがある。
【０１３１】
奥行き情報として、連続値を用いる方法で、且つ代表点毎に与える方法で、且つ、その物体の出現フレームから消失フレームまでの全フレームに対してそれぞれ与える方法を採用する場合には、第１実施例の対象物体の近似図形の代表点のＸ座標およびＹ座標についての処理と同様の処理を各代表点のＺ座標についても行えばよい（代表点軌跡関数近似部１０４で行えばよい）。
【０１３２】
この場合に、物体領域データ（例えば図８やそのバリエーションなど）の代表点軌跡のデータ形式の一例は、例えば図１６のようになる。図９との違いは、Ｘ座標およびＹ座標に加えて奥行き情報であるＺ座標に関する節点Ｚ配列８３２、関数特定情報配列Ｚ８３６が付加されている点である。
【０１３３】
また、奥行き情報として、連続値を用いる方法で、且つ対象物体毎に与える方法で、且つ、その物体の出現フレームから消失フレームまでの全フレームに対してそれぞれ与える方法を採用する場合には、第１実施例の対象物体の近似図形の代表点のＸ座標およびＹ座標についての処理と同様の処理を代表点軌跡関数近似部１０４により当該対象物体のＺ座標の値についても行えばよい。
この場合には、例えば図１７に示すように、物体領域データ（例えば図８やそのバリエーションなど）に対して奥行き情報７０５、すなわち当該対象物体のＺ座標についての値の軌跡を付加すればよい。もちろん、さらに関連情報等が付加されている構成もある）。図１７の物体領域データ中の代表点軌跡は図９に示すものであり、奥行き情報のデータ形式の一例は、例えば図１８のようになる。図１８と図９との違いは、図１８はＺ座標についての値のみ記述されている点である。
【０１３４】
なお、上記の２つ手法において奥行き情報として連続値ではなく、レベル値を用いる場合には、同じレベル値が複数フレームにわたって連続することが想定されるので、例えば、レベル値が変化する毎に、変化後のレベル値とそのレベル値が変化したフレームの番号等を記述するようにしてもよい。
【０１３５】
また、奥行き情報を隣接節点区間に対して与える場合には、その物体の出現フレームから消失フレームまでの全フレームに比べて隣接節点区間の区間数はそれほど多くないことが想定されるので、全ての値と隣接節点区間との対応を記述してもよい。
【０１３６】
次に、奥行き情報を得るための処理部が奥行きを実測する場合の構成例について説明する。
【０１３７】
奥行き情報には、カメラからの距離あるいは３次元空間に設定した座標系における座標のような絶対的な位置情報と、最初の物体位置からの移動距離もしくは移動距離の大きさを表す数値のような相対的な位置情報がある。
【０１３８】
一般に、単一のカメラで撮影された映像から絶対的な位置情報を求めるのは難しいため、文献「三次元画像計測：井口，佐藤（昭晃堂）、ｐ．２０〜５２」に記載されているような特殊なレンジセンサを用いて計測を行うか、複数台のカメラを用いステレオ法に基づいて計測を行って、位置情報を取得する。ただし、ある一定の撮影条件を仮定することができる場合には、単一のカメラで撮影した画像からでも位置情報を求めることができる。この場合の一例を以下に示す。
【０１３９】
例えば、道路監視を行う場合、図１９に示すように、カメラ１３００で車１３０１を撮影する。カメラは固定することが多いので、あらかじめカメラ１３００を校正しておくことができる。また、車が走る道路面を平面とみなし、３次元空間中での平面の方程式をあらかじめ計算しておくことが可能である。これらの前提条件の下で、車のタイヤ部分が地面１３０３と接している点１３０６の位置を求める。撮像面１３０２上では、点１３０６が点１３０５の位置で検出されたとすると、点１３０５を通るカメラの視線１３０４と平面１３０３との交点を求めることによって、点１３０６の位置が得られる。
【０１４０】
なお、カメラの視線１３０４は校正することによって得られるカメラパラメータから計算できる。道路面を既知としたが、車のバンパー位置の高さを既知と仮定してもよい。
【０１４１】
例えば映像データおよびその物体領域データを扱う情報処理装置において、これらの３次元情報を用いて、指定された位置に近い物体を検索することができる。
図２０に、そのような検索の処理の一例を表すフローチャートを示す。
まず、ステップＳ２７００において、指示された検索対象とする位置情報（３次元情報）を入力する。
ステップＳ２７０１で、その位置と全物体領域データに係る物体の持つ３次元的な位置との間の距離を計算する。
全てについて３次元的な距離を求めた後、ステップＳ２７０２でしきい値より小さい距離を持つ物体を求め、出力する。なお、しきい値を定めずに距離が最小となる物体を検索結果として出力してもよい。
【０１４２】
また、一般的な映像だけからは映像中の物体の絶対的な位置情報は求めるのは困難であるが、図２１の（ａ）から（ｂ）のように手前に向かってくる車を、静止したカメラから撮影した映像では、車の画像面上での大きさの変化を観測することによって、例えば初期位置よりもカメラに近づいたか遠ざかったかというような相対的な奥行き情報を求めることが可能である。この場合の一例を以下に示す。
【０１４３】
通常のカメラ光学系は、図２２のようにピンホールカメラに基づいた透視変換モデルによって記述することができる。１６００はカメラのレンズ主点であり、１６０１は撮像面である。物体１６０２がカメラに近づく方向に移動しているとする。これを真上から見下ろした図が図２３である。図２３のように、物体がＺ軸に平行な姿勢を保ったままカメラに近づく方向に移動したとすると、移動前１７０２と移動後１７０３では物体前面の撮影像は１７０４から１７０５へと幅が大きくなる。物体とカメラレンズ主点１７００との距離が小さいほど、撮影像は大きくなるため、撮影像の大きさを用いて、相対的な位置の変化を表現することができる。例えば、物体の初期位置での撮影像の幅を１とし、その後の撮影像の幅との比を求めていく。撮影像の幅は、レンズ主点１７００からの距離の逆数に比例すると見なしてよいので、その比の値の逆数を求め、奥行き情報として保持しておけばよい。この場合、カメラに近いほど値は小さくなり、遠いほど値が大きくなる。なお、幅でなく、撮影像の面積や物体表面の特徴的なテクスチャの面積を用いてもよい。
【０１４４】
例えば映像データおよびその物体領域データを扱う情報処理装置において、これらの相対的な位置の変化を示す情報を用いて、１つの移動物体について、指定した距離に存在する時刻を求めることが可能である。
【０１４５】
図２４および図２５に、この場合の処理の手順の一例を表すフローチャートを示す。
【０１４６】
図２４は実際に検索を行うための前処理のフローチャートである。図２４では、１つの移動物体の保持している奥行き値を正規化する。ステップＳ２８００において、奥行き値の最小値を１とし、ステップＳ２８０１において奥行き値を最小値で割って正規化する。ステップＳ２８０２において全ての奥行き値の正規化処理が終わったことを判定する。
【０１４７】
次に、図２５のステップＳ２９００において、検索すべき奥行き値（正規化値）を入力する。ステップＳ２９０１で、その入力値と各奥行き値の差を計算し、全ての奥行き値と比較を終えたら（ステップＳ２９０２）、その差が最小となる時刻を出力する（ステップＳ２９０３）。
【０１４８】
このように第２実施例によれば、平面情報である２次元的位置情報以外に、奥行きに関する情報を付与することにより、奥行き方向を考慮した検索、例えばカメラからの距離情報で物体を検索が可能となる。
第３実施例
第３実施例では、第１実施例または第２実施例において、さらに、映像中の物体について、画面上でその物体（またはその一部）が見えている状態にあるか、他の物体の陰に隠れているなどして見えていない状態にあるかを示す表示フラグに関する表示フラグ情報をも物体情報データに含める場合について説明する。なお、第３実施例でも、第１実施例または第２実施例と相違する点を中心に説明する。
【０１４９】
なお、本実施例では、表示フラグに関する処理は、例えば代表点軌跡関数近似部１０４で行えばよい。
【０１５０】
例えば図２６の（ａ）〜（ｃ）のように、映像中に複数の物体が存在している場合、ある物体２１０１が別の物体２１０２によって隠れたり、現れたりするということがよくある。この状態を記述するため、物体領域データに表示フラグ情報を追加する。
【０１５１】
表示フラグは、対象物体毎に与える方法と、対象物体の近似図形の代表点毎に与える方法がある。
【０１５２】
表示フラグを対象物体毎に与える場合、表示フラグが立っているときは、その物体が他の物体により隠れていないことを示し、再生時には、その物体を表示する。表示フラグが立っていないときは、その物体が他の物体により隠れていることを示し、再生時には、その物体を表示しない。
【０１５３】
表示フラグを対象物体の近似図形の代表点毎に与える場合、１つの対象物体の近似図形における全ての代表点の表示フラグが同一の状態ならば上記と同様であるが、表示フラグが立っている代表点と、表示フラグが立っていない代表点が混在するならば、その状況を考慮して当該物体の表示を行う（例えば当該物体の該当する一部分のみ表示する）。
【０１５４】
表示フラグは、物体の隠れ／現われの状況が変わるキーポイント間毎に設定され、物体領域の代表点軌跡データを作成するときに同時に決定される。なお、キーポイントは、近似関数の節点と無関係に設けられてもよいが、キーポイントは必ず節点になるようにしてもよい。例えば、キーポイントが発生した場合には、強制的にその時点を節点とする方法がある。
【０１５５】
表示フラグを対象物体毎に与える場合、キーポイントは、物体が現れている状態から隠れている状態に移るときと、隠れている状態から現れている状態に移るときに設定される。図２７の例において、物体２２０１は、フレームｉまでは現れていて、フレームｉからｊは隠れ、フレームｊ以降はまた現れるとき、フレームｉとｊにキーポイントを置き、フレームｉからｊまでの表示フラグには隠れ状態を、それ以外のフレームの表示フラグには現れ状態を設定する。表示フラグを対象物体の近似図形の代表点毎に与える場合も同様である。
【０１５６】
代表点軌跡データ作成時は、全フレームに渡って物体が現れているものとして作成し、物体が隠れているため代表点の情報がわからない場合は、分かっている前後の代表点の情報より補完することによって、代表点軌跡データを作成する。そして、代表点軌跡データを作成した後、物体が現れているか隠れているかに応じて表示フラグを設定する。このため、一つの物体に関しては物体が隠れたり現れたりしても一連の代表点軌跡データで表現することが可能となる。
【０１５７】
以下、表示フラグ情報のバリエーションについて説明する。
【０１５８】
通常、表示フラグは各キーポイント間毎に設定されるが、表示フラグ自体に開始タイムスタンプと終了タイムスタンプを付加してもよい。この場合は、表示される範囲や隠れる範囲がキーポイントと独立に設定できるというメリットがある。
【０１５９】
表示フラグは、１つの物体内で１つの表示フラグを持っていてもよいし、各代表点軌跡データ毎に独立して持っていてもよい。例えば、物体が多角形で表現されていて、その各頂点を代表点として軌跡データで表現した場合には、代表点軌跡データ毎に独立して表示フラグを持つことによって、物体の一部のみの隠れなどを表現することが可能となる。
【０１６０】
また、表示フラグは、現れているか隠れているかだけではなく、優先度として整数の値をとるようにしてもよい。物体同士が重なったときは、優先度の低い物体が優先度の高い物体に隠れていることを示し、優先度の高い物体のみを表示する。また、優先度が０の時は他の物体に関係なく物体は隠れているものとする。
表示フラグを上記のように整数値でとることによって、映像中に他の物体を合成したときなどにも、物体同士の隠れの問題を解決できるという利点がある。表示フラグを整数値でとった場合も、１つの物体内で１つの表示フラグを持っていてもよいし、各代表点軌跡データ毎に独立して持っていてもよい。
【０１６１】
図２８、図２９は、表示フラグを含む物体領域データのデータ構造の例である。
【０１６２】
図２８は、対象物体に対して表示フラグを付加する場合における、物体領域データ（例えば図８やそのバリエーションなど）に対して表示フラグ情報７０６を付加した例である。もちろん、さらに関連情報等が付加されている構成もある。
【０１６３】
図２９は、図２８の表示フラグ情報７０５の構造例である。
【０１６４】
この例は、各表示フラグ２３０４毎に、開始タイムスタンプ２３０２と終了タイムスタンプ２３０３を持っている。表示フラグ数２３０１は表示フラグの総数であり、開始タイムスタンプ２３０２と終了タイムスタンプ２３０３を利用しない場合は、（キーポイント数−１）個の表示フラグを持つため、表示フラグ数２３０１を省略してもよい。表示フラグ２３０４は現れているか隠れているかを０か１かで記録するが、優先度として整数値をとってもよい。
【０１６５】
また、物体の近似図形の各代表点に対して表示フラグをそれぞれ付加する場合には、例えば、物体領域データ（例えば図８やそのバリエーションなど）の各代表点軌跡毎に表示フラグ情報を付加する。
【０１６６】
図３０は、この場合の代表点軌跡のデータ構造の例である。図３０の表示フラグ９００の構造例は図２９と同様である。
【０１６７】
図３１に、例えば映像データおよびその物体領域データを扱う情報処理装置で行われる検索時の処理の一例を表すフローチャートを示す。
【０１６８】
まず、ステップＳ２５１においてユーザが検索キーを入力し、ステップＳ２５３において検索している物体領域のキー情報と検索キーの距離を計算する。
【０１６９】
検索キーに対応する物体領域の表示フラグが現れている状態かをステップＳ２５４で判定し、表示フラグが隠れている状態の時はマッチングしていないものとする。
【０１７０】
ステップＳ２５５で表示フラグが現れている状態で距離が閾値より小さい場合はマッチングしたものとして記録する。
【０１７１】
これをすべての物体に対し繰り返し、ステップＳ２５２ですべての物体領域について計算終了したと判断されたときは、ステップＳ２５６において記録結果を出力して終了する。
【０１７２】
以上のように、物体領域の軌跡情報の他にオクル−ジョンかどうか（つまり見えているかどうか）を示す表示フラグを付け加えることにより、再生時に物体が隠れているかどうかを他の物体との関係から計算することなく判定することが可能となり、表示されている物体を検索する場合などにもオクルージョンを考慮した効率的な検索が可能となる。
【０１７３】
第４実施例
第４実施例では、第１実施例または第２実施例または第３実施例において、さらに、映像中の物体が画面上に出現してから消失するまでに通過した画面上での範囲を示す情報（以下、物体範囲情報と呼ぶ）をも物体情報データに含める場合について説明する。なお、第４実施例では、第１実施例または第２実施例または第３実施例と相違する点を中心に説明する。
【０１７４】
なお、本実施例では、物体通過範囲情報を生成するための処理部をさらに設ける（物体領域抽出部１０１と物体領域の図形近似部１０２との間に接続する）。
【０１７５】
物体を物体領域の代表点軌跡データで表すとき、通常は１つの物体に対し複数の軌跡データを利用して表現することになる。そのため、指定した点を通過した物体を検索する場合は、複数の軌跡データから物体領域を先ず計算して、領域が指定点を含むか否かを判断する必要がある。しかし、複数の軌跡データから物体領域を先ず計算することなく、物体通過範囲を表現できれば便利である。
【０１７６】
そこで、本実施例では、物体の軌跡全体を囲むような最小の長方形または多角形の物体通過範囲に関する情報を生成し、これを物体領域データに付帯させるようにする。
【０１７７】
長方形を利用する場合、傾きを持つ長方形を利用してもよいし、傾きを持たない長方形を利用してもよい。傾きを持つ長方形を利用する場合には、物体領域の軌跡を誤差が少なく近似できる利点がある。傾きを持たない長方形を利用する場合には、長方形のパラメータ計算が簡単であるという利点がある。
【０１７８】
図３２の（ａ）において、２４０２は物体２４０１の軌跡領域を傾きのない長方形で近似したものの例を示す。
【０１７９】
図３２の（ｂ）において、２４０３は物体２４０１の軌跡領域を傾きのある長方形で近似したものの例を示す。
【０１８０】
図３２の（ｃ）において、２４０４は物体２４０１の軌跡領域を多角形で近似したものの例を示す。
【０１８１】
物体の軌跡全体を囲むような最小の長方形または多角形を計算するときは、各フレームにおける物体領域を求めた後、全フレームに渡って領域の論理和を計算し、得られた論理和の領域を最小の長方形または多角形で近似する。
【０１８２】
また、物体の軌跡全体を囲むような最小の長方形または多角形を計算する際に、既に計算されているフレームに関する当該物体領域の軌跡全体を囲む最小の長方形または多角形と、新しく追加すべきフレームにおける当該物体領域との論理和の領域を最小の長方形または多角形で近似するようにしてもよい。
【０１８３】
また、物体の軌跡全体を囲むような最小の長方形または多角形を計算する際に、各代表点の軌跡を囲むような最小の長方形または多角形を計算し、全軌跡に渡って得られた長方形または多角形の領域の論理和について、それを囲むような最小の長方形または多角形を計算するようにしてもよい。
【０１８４】
図３３に、物体領域情報に付帯する物体通過範囲情報の記述例を示す。外接図形タイプ３４０１は、外接図形のタイプを示す。例えば、０は図３２の（ａ）に示す傾きのない長方形、１は図３２の（ｂ）に示す傾きのある長方形、２は図３２の（ｃ）に示す多角形を示す。外接図形タイプが０の場合は頂点数Nが２、１の場合は頂点数Nが３、２の場合は頂点数Nが任意の数となる。物体が奥行き情報を持っている場合は、同様に奥行きの軌跡情報を加えて３次元の外接図形を考えることができる。その場合、図３４に示すように、奥行き情報のZに関する情報が追加される。
【０１８５】
図３５に、例えば映像データおよびその物体領域データを扱う情報処理装置において、ユーザがある座標値（２次元について説明するが、３次元でも同様）を指定したとき、その座標を通過するような物体を選び出す場合の処理の一例を表すフローチャートを示す。
【０１８６】
ステップＳ２６１において、ユーザが検索すべき座標値を入力し、ステップＳ２６２において、各物体軌跡について軌跡全体を囲むような最小の長方形または多角形と入力された座標値を比較し、座標が軌跡全体を囲むような最小の長方形または多角形の中に入っているような物体のみを抽出する。物体の個数は０の場合も、１つの場合も、複数の場合もあり得る。抽出された物体について、ステップＳ２６３で代表点軌跡から入力された座標が物体領域（例えば近似図形の内部）の中に入っているかどうかを判定する。
【０１８７】
一般に代表点軌跡からの物体の内外判定より、軌跡全体を囲むような最小の長方形または多角形の物体の内外判定の方が計算量が少ないため、特に検索対象の物体数が多い場合は、はじめに軌跡全体を囲むような最小の長方形または多角形の内外判定をしたほうが効率よく検索ができる。
【０１８８】
このように物体の軌跡全体を囲むような最小の長方形または多角形の情報を付帯することによって、物体の通過範囲を効率よく表現でき、ある座標を物体が通過するかどうか判定することなどが簡単に行えるようになる。
【０１８９】
また、検索の効率を上げるために、物体領域を関数で表現するだけでなく、物体が時空間的に存在する位置を囲む図形を付帯させることにより、全く別の場所に存在する物体を検索の候補から除外することが可能となる。
第５実施例
第５実施例では、本発明をモザイキングに適用した場合について説明する。
【０１９０】
モザイキングとは、撮影範囲が一部重なるように撮影された複数の画像を貼り合わせ、１枚の広範囲を撮影した画像を合成する手法である。このようにして合成された画像はパノラマ画像などとも呼ばれる。複数の画像からモザイキングによりパノラマ画像を作成する手法は複数の提案がされている（Ｍ．Ｉｒａｎｉ，Ｐ．Ａｎａｎｄａｎ， “ＶｉｄｅｏＩｎｄｅｘｉｎｇＢａｓｅｄｏｎＭｏｓａｉｃＲｅｐｒｅｓｅｎｔａｔｉｏｎｓ”，ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥ，Ｖｏｌ．８６，Ｎｏ．５，ｐｐ．
９０５−９２１，Ｍａｙ１９９８．など）。
【０１９１】
本実施例の構成は基本的にはこれまでの各実施例と同様であるが、本実施例では、これまでのように各フレームにおける物体領域の近似図形の代表点の位置データ（各フレーム毎の座標）をもとに近似を行うのではなく、パノラマ画像における各物体領域の近似図形の代表点の位置データ（パノラマ画像全体の座標）をもとに近似を行う点が相違する。
【０１９２】
以下では、これまでの実施例と相違する点を中心に説明する。
【０１９３】
図３６は、モザイキングを用いた物体領域情報記述方法の処理手順の一例を表すフローチャートである。図３７の（ａ）、図３７の（ｂ）に、この方法を説明するための図を示す。
【０１９４】
なお、パノラマ画像はそれ自体で１つの画像であり、合成前の各々の静止画像の各画素は、パノラマ画像におけるある基準点（例えば、フレーム中で左下の点）を原点として、座標が変換されることになる。したがって、各静止画像における物体領域の近似図形の各代表点は、パノラマ画像の座標系におけるＸ座標やＹ座標についての系列となる。本実施例では、各静止画像における物体領域の近似図形の各代表点のＸ座標やＹ座標についての系列を、これまでの実施例のようにして、関数近似するものである。その際に、これまでの実施例と同様に、例えば、１つの静止画像内で差分ベクトルをとり、あるいは静止画像間で差分ベクトルをとって、この差分ベクトルの系列を関数近似する。
【０１９５】
ステップＳ１９００では、入力された複数の静止画像からパノラマ画像を作成する。これらの入力画像群は、図３７の（ａ）では２０００〜２００５に相当し、移動する物体をカメラを移動させながら撮影した画像である。２００６は画像内の物体で、２０００〜２００５内には同じ物体が撮影されている。これらの画像群は動画中の連続するフレームや、撮影範囲を重なるようにカメラを移動しながら撮影した静止画であることが多いが、パノラマ画像を作成できるような入力画像であれば何でもよい。
【０１９６】
これらの入力画像群より合成されたパノラマ画像が図３７の（ｂ）の２００７である。
【０１９７】
ステップＳ１９０１では、合成されたパノラマ画像内に存在する個々の物体領域を図形により近似する。なお、ステップＳ１９００のパノラマ画像作成とステップＳ１９０１の物体領域の図形近似は逆の順序で行ってもよい。ただし、パノラマ画像を合成する際の変換によっては、物体領域の近似図形種の変更を必要とする場合がある。例えば、物体領域を矩形で近似する場合、アフィン変換によりパノラマ画像の合成を行うと合成後の物体領域は必ずしも矩形とはならない。その場合はパノラマ画像の作成を先に行うか、パノラマ画像合成の変換後に修正を行う。
【０１９８】
ステップＳ１９０２では、ステップＳ１９０１で求めた物体領域の近似図形の代表点や特徴点の軌跡を関数により近似する。物体領域の軌跡は基準となる物体領域を定め、そこからの各物体領域の変化量により求める。例えば、図３７の（ｂ）において、第１入力画像の物体領域２００８を基準とし、それに続く物体領域の変化を軌跡２００９とする。この例では、物体領域の重心を代表点としているが、矩形や楕円など他の近似図形の代表点を用いる場合やその他の特徴点を代表点として用いる場合であっても同様である。
【０１９９】
基準点からの変化量の求め方は、基準点に対する差分を用いる場合と直前の物体領域からの差分を用いる場合があるが、これらの変化量は同様に関数近似を行うことができる。また、基準点からの変化を代表点や特徴点の移動ではなく、平行・回転移動やアフィン変換などの動きモデルで近似し、その変換係数の軌跡として物体の移動を記述することができる。この場合も変換係数の軌跡を関数近似することによって適用することができる。
【０２００】
ステップＳ１９０３では、ステップＳ１９０２で求めた軌跡を近似する関数のパラメータを前述のデータ構造体のフォーマットに従って記述を行う。
【０２０１】
また、入力画像群の個々の画像をパノラマ画像として合成する際の諸パラメータも入力画像全体を物体領域とみなすことにより、同様に記述することができる。
【０２０２】
図３８に、物体領域情報に付帯する諸パラメータの記述例を示す。諸パラメータは作成されたパノラマ画像の座標系を、作成に用いた映像フレームの座標とその映像フレームからパノラマ画像への変換パラメータによって記述するものである。ここで、どこを原点としても良いが、映像フレームの座標が左下に原点があるとする。そして、モザイキングに利用されたフレームの縦横の長さが同一で既知であるとする。統合座標フラグ３６０１は、このようなパノラマ画像の座標系を用いた物体の記述かどうかのフラグであり、フラグが０の時は通常の座標系（つまり、すべての映像フレームで左下原点）で、１の時はフレームがパノラマに統合された座標系を示す。モデルタイプＭ３６０２は、各フレームをパノラマ画像に変換したときの変換モデルのタイプを示すものである。例えば、モデルタイプＭが０の時は変換なし、２の時は平行移動で、４の時は回転・拡大縮小で、６の時はアフィンで、８の時は透視変換で、１２の時は２次射影変換を表す。各モデルにおいて、モデルタイプＭの値と同数のパラメータがある。
【０２０３】
平行移動：v_x(x, y) = a₁
v_y(x, y) = a₂
回転・拡大縮小：
v_x(x, y) = a₁ + a₃x + a₄y
v_y(x, y) = a₂ - a₄x + a₃y
アフィン変換：
v_x(x, y) = a₁ + a₃x + a₄y
v_y(x, y) = a₂ + a₅x + a₆y
透視変換：
v_x(x, y) = (a₁ + a₃x +a₄y) / (1 + a₇x +a₈y)
v_y(x, y) = (a₂ + a₅x +a₆y) / (1 + a₇x +a₈y)
２次射影変換：
v_x(x, y) = a₁ + a₃x + a₄y + a₇ xy + a₉ x² + a₁₀ y²
v_y(x, y) = a₂ + a₅x + a₆y + a₈ xy + a₁₁ x² + a₁₂ y²
ここで、変換を行うための原点をＸ原点３６０３、Ｙ原点３６０４で与える。この原点は元映像フレームの座標系を用いて示す。このように変換のための原点を与えるのは、変換時に生じる誤差を少なくするためである。変換パラメータ数Ｎ３６０５は、パノラマに用いるフレーム数Ｎと同じである。フレーム毎に変換パラメータが必要となる。フレーム間時間３６０６は、初期フレームからのフレーム間時間で、パラメータセット３６０７は、変換のモデルタイプに応じてＭ個のパラメータを記述する。各フレーム中のオブジェクトの軌跡もこのパラメータセットを用いて変換され記述される。
【０２０４】
本実施例によれば、カメラが物体領域を追いかけながら撮影している場合には、連続するフレームに対して画像変換を施して貼り合わせるモザイキングによるパノラマ画像を作成し、その作成された画像上での物体の領域情報を記述することにより、カメラが移動していてもモザイキング画像のある点を基点とした座標系で物体の領域情報を一意に記述することができる。
【０２０５】
上記した第２実施例〜第５実施例は第１実施例のデータ構造を有する物体領域情報に奥行き情報、表示フラグ、物体範囲情報、パノラマ変換のためのパラメータも記述する実施例として説明したが、これらの実施例は第１実施例の物体領域情報に限定されず、他のデータ構造を有する物体領域情報に対しても付帯可能である。以下、物体領域情報のデータ構造の変形に関する他の実施例を説明する。
【０２０６】
第６実施例
第１実施例は物体領域を近似する図形の代表点の座標そのものではなく、ベクトルで代表点の軌跡を記述したが、代表点の座標そのものの軌跡を記述する場合に、奥行き情報も付帯する第６実施例を説明する。
【０２０７】
第６実施例の構成は図１に示した第１実施例の構成と同じである。第１実施例では多角形により物体領域を近似していたが、第６実施例では図３９の（ａ）から（ｄ）に示すように物体領域を楕円で近似する方法を示す。図３９の（ａ）から（ｄ）は第１実施例の図３の（ａ）から（ｃ）に相当する。楕円の２つの焦点ｖ１、ｖ２と楕円上の１点ｖ３を代表点として抽出する方法を用い、代表点の軌跡をスプライン関数により近似する。
【０２０８】
図４０に、物体の領域が平行四辺形で表される場合に、近似楕円を求める方法の一例を示す。図４０における点Ａ，Ｂ，Ｃ，Ｄが物体の領域である平行四辺形の各頂点である。この場合、まず、辺ＡＢと辺ＢＣのどちらが長いかを計算する。そして、長い方の辺およびその対辺を辺の一部とする最小の長方形を求める。図４０の例の場合は点Ａ，Ｂ’，Ｃ，Ｄ’を４頂点とする長方形となる。近似楕円は、例えば、この長方形に内接する楕円と相似で、かつ、点Ａ，Ｂ’，Ｃ，Ｄ’を通る外接楕円とする。
【０２０９】
次に、図３９の（ｂ）において、ｖ１、ｖ２、ｖ３は楕円を表現する図形代表点であり、具体的には２つの焦点ｖ１、ｖ２および１つの楕円上の点ｖ３（図３９の（ｂ）の例では短軸上の１点）である。楕円の焦点は２つの軸上の点や楕円の外接矩形から簡単に求めることができる。以下、一例として、図４１における長軸上の２点Ｐ０，Ｐ１および短軸上の１点Ｈから焦点ＦとＧを求める方法を説明する。
【０２１０】
まず、長軸と短軸のパラメータであるａ，ｂと、楕円の中心Ｃと、扁平率ｅとを、
Ｅ（Ｐ０，Ｐ１）＝２×ａ、
Ｃ＝（Ｐ０＋Ｐ１）／２、
Ｅ（Ｃ、Ｈ）＝ｂ、
ｅ＝（１／ａ）×（ａ×ａ−ｂ×ｂ）^1/2
により求める。
ここで、Ｅ（Ｐ、Ｑ）は点Ｐと点Ｑのユークリッド距離である。
【０２１１】
このようにして求めたパラメータから、焦点ＦとＧは、
Ｆ＝Ｃ＋ｅ×（Ｐ０−Ｃ）、
Ｇ＝Ｃ−ｅ×（Ｐ０−Ｃ）
により求めることができる。
【０２１２】
このようにして、楕円の代表点Ｆ、ＧおよびＨは決定されるが、これらの点を別のフレームにおいて取り出された楕円の代表点と結びつける際にはあいまいさが生じる。すなわち、抽出された２つの焦点と１つ前のフレームにおける２つの焦点とを結びつける組み合わせは２通り存在する。また、短軸と楕円との交点は２つあるため、１つ前のフレームにおいて抽出された楕円上の一点と対応する交点がどちらなのかがわからない。そこで、これらを決定する方法について説明する。
【０２１３】
１フレーム前に抽出された２つの焦点をＦ_ｐ、Ｇ_ｐとする。Ｆ_ｐに対応するのがＦであるのかＧであるのかを判断するために、
Ｅ（（Ｇ_ｐ−Ｆ_ｐ）／２，（Ｇ−Ｆ）／２）と
Ｅ（（Ｇ_ｐ−Ｆ_ｐ）／２，（Ｆ−Ｇ）／２）とを比較する。
前者の方が小さい場合には、Ｆ_ｐはＦに対応させ、Ｇ_ｐはＧに対応させる。一方、後者の方が小さい場合には、その逆に、Ｆ_ｐはＧに対応させ、Ｇ_ｐはＦに対応させる。
【０２１４】
また、１つ前のフレームにおける短軸と楕円との交点をＨ_ｐとし、現フレームの短軸と楕円との２つの交点をＨ、Ｈ’とする。Ｈ_ｐと対応付ける点としてＨとＨ’のどちらを選択するかは２つの距離、
Ｅ（Ｈ_ｐ−（Ｇ_ｐ＋Ｆ_ｐ）／２，Ｈ−（Ｆ＋Ｇ）／２）と
Ｅ（Ｈ_ｐ−（Ｇ_ｐ＋Ｆ_ｐ）／２，Ｈ’−（Ｆ＋Ｇ）／２）とを算出することにより決定する。
前者が小さい場合にはＨを選択し、そうでない場合にはＨ’を選択する。なお、はじめのフレームにおける短軸と楕円との交点Ｈは２つのうちのどちらを選択してもよい。
【０２１５】
以上の処理によって取り出された代表点は、映像中の注目物体の移動や撮影カメラの移動により、連続するフレームにおいて位置が異なるのが普通である。そこで、対応する楕円の代表点を時系列に並べ、Ｘ座標、Ｙ座標毎にスプライン関数により近似を行う。本実施例では、楕円の代表点であるＦ、Ｇ、Ｈの３点（図４１参照）それぞれについてＸ、Ｙ座標のスプライン関数が必要になるので、合計６つのスプライン関数が生成される。
【０２１６】
図３９の（ｃ）の２０３は近似されたスプライン関数を３次元的に表現したものである。図３９Ｄの２０４は代表点関数近似部１０４の出力であるスプライン関数の一例である（１つの代表点の１つの座標軸についてのみ示している）。この例は、近似区間がｔ＝０〜５とｔ＝５〜１６の２つに分割された場合（節点が３つとなった場合）を示している。
【０２１７】
このようにして得られたスプライン関数は予め定めておいたデータ形式に従って領域データ記憶部１０６に記録される。
【０２１８】
以上のように本実施例では、映像中の物体の領域を、その近似図形の代表点の時系列的な軌跡（フレーム番号あるいはタイムスタンプを変数とする代表点の座標の軌跡）を近似した曲線のパラメータとして記述することができる。
【０２１９】
本実施例によれば、映像中の物体の領域を関数のパラメータのみによって表現できるため、データ量が少なく、ハンドリングの容易な物体領域データを生成することができる。また、近似図形からの代表点の抽出や、近似曲線のパラメータの生成も容易に行うことができる。また、近似曲線のパラメータから近似図形を生成することも容易に行うことができる。
【０２２０】
また、この近似図形として基本的な図形、例えば一つまたは複数の楕円を用い、例えば楕円を二つの焦点と他の１点により代表させれば、ユーザにより指定された任意の座標が物体の領域（近似図形）内か否か（物体の領域を指示しているか否か）を簡単な判定式により判定することができる。さらに、これによって、ユーザによる映像中の動く物体の指示をより容易にすることができる。
【０２２１】
以下では、領域データ記憶部１０６に格納される物体領域データのデータ形式について説明する。なお、ここでは、代表点をスプライン関数により近似する場合を例にとって説明するが、もちろん、代表点を他の関数により近似する場合も同様である。
【０２２２】
図４２に、映像中の物体の領域を表すスプライン関数と、物体に関連付けられた関連情報とを記録するための物体領域データのデータ形式の一例を示す。
【０２２３】
ＩＤ番号４００Ｂは、物体毎に付与される識別番号である。なお、このデータは省略されてもよい。
【０２２４】
先頭フレーム番号４０１Ｂと最終フレーム番号４０２Ｂは、当該ＩＤ番号の物体の存在を定義する最初と最後のフレーム番号であり、具体的には、映像中で物体が登場し消えるまでのフレーム番号である。ただし、現実に映像中で物体が登場し消えるまでのフレーム番号ではなく、例えば映像中で物体が登場したときより後の任意のフレーム番号を先頭フレーム番号としてもよいし、また先頭フレーム番号以降でかつ映像中で物体が消えたときより前の任意のフレーム番号を最終フレーム番号としてもよい。なお、先頭／最終フレーム番号は先頭／最終タイムスタンプで代用することもできる。また、最終フレーム番号４０２Ｂは、物体存在フレーム数または物体存在時間に置き換えてもよい。
【０２２５】
関連情報へのポインタ（以下、関連情報ポインタとも言う）４０３Ｂは、当該ＩＤ番号の物体に関連付けられた関連情報データの記録してあるデータ領域のアドレスなどである。関連情報へのポインタ４０３Ｂを使うことにより、物体に関する関連情報を検索したり表示したりすることが容易にできる。また、関連情報へのポインタ４０３Ｂはプログラムや計算機の動作を記述したデータへのポインタであってもよい。この場合には、当該物体がユーザにより指定されると、計算機が所望の動作を行うことになる。
【０２２６】
なお、関連情報へのポインタ４０３Ｂは、例えば、物体により異なる動作をさせる必要のない場合には、省略することができる。
【０２２７】
なお、以下の説明では、物体領域データ内に関連情報へのポインタを記述する場合について説明するが、物体領域データ内に関連情報そのものを記述するようにしてもよい。また、物体領域データ内に関連情報へのポインタと関連情報そのものを任意に記述可能としてもよい。この場合には、物体領域データ内に記述されているのが関連情報へのポインタか関連情報そのものかを示すフラグを付加すればよい。
【０２２８】
近似図形数４０４Ｂは、物体の領域を近似している図形の数である。図３９の例においては、一つの楕円で物体領域を近似しているので、図形の数は１となる。
【０２２９】
近似図形データ４０５Ｂは、近似図形を表現するための図形代表点の軌跡データ（例えばスプライン関数のパラメータ等）である。
なお、近似図形データ４０５Ｂは、近似図形数４０４Ｂに相当する数だけ存在する。近似図形数４０４Ｂが２以上の場合については後述する。
また、物体領域データにおいて、近似図形数４０４Ｂは常に１つとし（従って近似図形データ４０５Ｂも常に１つとなる）、近似図形数４０４Ｂのフィールドを省くようにしてもよい。
【０２３０】
次に、図４３に、図４２の近似図形データ４０５Ｂのデータ構造の一例を示す。
【０２３１】
図形種ＩＤ１３００Ｂは、近似図形としてどのような図形を用いているかを示すためのデータであり、円、楕円、矩形、多角形などを特定する。
【０２３２】
代表点数１３０１Ｂは、図形種ＩＤで特定される図形を代表する点の数を幾つ必要とするかを表す。
【０２３３】
１組の代表点軌跡データ１３０２Ｂ，１３０３Ｂ，１３０４Ｂは、図形の代表点の軌跡を表現するスプライン関数に関するデータ領域である。一つの図形代表点につき、Ｘ座標、Ｙ座標、Ｚ座標のスプライン関数データが必要になる。従って、スプライン関数を特定する代表点軌跡データは、代表点数（Ｍ）×３だけ存在する。
【０２３４】
代表点のＺ座標は第２実施例で説明した図１９〜図２３の方法により求めても良いし、他の手法を用いて求めても良い。
【０２３５】
なお、使用する近似図形の種類を予め１種類、例えば楕円、に限定することも可能である。この場合には、図４２の図形種ＩＤのフィールドを省くことも可能である。
【０２３６】
また、図形種ＩＤによって代表点数が一意に特定される場合には、代表点数を省くことも可能である。
【０２３７】
次に、図４４に、代表点軌跡データ１３０２Ｂ，１３０３Ｂ，または１３０４Ｂのデータ構造の一例を示す。
【０２３８】
接点フレーム番号１４００Ｂは、スプライン関数の節点を表しており、この節点まで多項式のデータ１４０３Ｂが有効であることを示している。多項式の係数データの数は、スプライン関数の最高次数により変化する（最高次数をＫとすると、係数データの数はＫ＋１となる）。そのため、多項式次数１４０１Ｂを参照する。多項式次数１４０１Ｂの後には、（多項式次数＋１）個に相当する数の多項式係数１４０２Ｂが続く。
【０２３９】
また、スプライン関数は節点間で別の多項式で表現されるため、接点の数に対応した数の多項式が必要になる。従って、節点フレーム番号、多項式の係数などを含むデータ１４０３Ｂは、複数繰り返し記述される。節点フレーム番号が最終フレームと等しくなった場合には、それが最後の多項式係数データであることを意味しているので、代表点軌跡データが終わることがわかる。
【０２４０】
上記説明は代表点毎に奥行き情報（ここでは代表点軌跡データＺ）を記述したが、第２実施例の図１７のように対象物体毎に１つ奥行き情報を記述することも可能である。この場合のデータ構造を図４５に示す。
【０２４１】
図形種ＩＤ１３００Ｂ、代表点数１３０１Ｂ、代表点軌跡データ組１３０２Ｂ，１３０３Ｂに加えて奥行き情報１３０６Ｂを記述する。この奥行き情報１３０６Ｂは図１８に示すものである。
【０２４２】
次に、近似図形として楕円以外の図形を用いた場合について説明する。
【０２４３】
図４６は、近似図形として平行四辺形を用いた場合の代表点を説明するための図である。点Ａ，Ｂ，Ｃ，Ｄが平行四辺形の頂点である。これらのうち３点が決まれば残りの１点も一意に決まるため、代表点としては４頂点のうちの３頂点とすれば十分である。この例では、Ａ，Ｂ，Ｃの３点を代表点としている。
【０２４４】
さて、これまでは一つの物体に対して一つの図形を割り当てて、物体の領域を大まかに表す例を中心に説明をしてきたが、一つの物体の領域を複数の図形により近似し、近似精度を向上させることも可能である。図４７は、一つの物体を数の図形で近似した例である。この例では画像中の人の領域を６００Ｂから６０５Ｂまでの６つの楕円により表している。
【０２４５】
一つの物体を図４７のように複数の図形で表す場合には、物体を複数の領域に分割する処理が必要となる。この処理にはどのような方法が用いられていても良いが、例えば人手で直接入力する方法がある。この場合、例えば、マウス等のポインティングデバイスを用いて、画像上で領域を矩形や楕円で囲む、あるいはポインティングデバイスの軌跡により領域を指定する、などの操作で実現することができる。また、人手ではなく自動で行う場合には、例えば、物体の動きのクラスタリングで実現する方法がある。これは、連続するフレーム間で物体中の各領域がどのような動きをしたかを相関法（例えば画像解析ハンドブック、第ＩＩ部第３章、東京大学出版会、１９９１を参照）や勾配法（例えば、Ｄｅｔｅｒｍｉｎｉｎｇｏｐｔｉｃａｌｆｌｏｗ，Ｂ．Ｋ．Ｐ．ＨｏｒｎａｎｄＢ．Ｇ．Ｓｃｈｕｎｃｋ，ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ，Ｖｏｌ．１７，ｐｐ．１８５−２０３，１９８１を参照）などにより求め、これらの動きの似ているものだけをまとめて領域を形成する方法である。
【０２４６】
このようにして分割された各領域に対しては、それぞれについて上述した処理を施すことにより、近似図形データを生成することが可能である。この場合、一つの物体の物体領域データに記述すべきスプライン関数が近似図形の増加に応じて増えることになるため、図４８で表されるように近似図形データ４０５Ｂを、近似図形数４０４Ｂに相当する数（この場合、Ｌ個）だけ含むデータ構造となる。
【０２４７】
なお、前述したように物体領域データにおいて近似図形数を常に１つとし（従って近似図形データも常に１つとなる）、近似図形数のフィールドを省くようにする場合において、一つの物体を複数の図形で表すためには、一つの物体を近似する各図形毎に、物体領域データを生成すればよい（それらは同じＩＤ番号を有することになる）。
【０２４８】
なお、本実施例では、一つの物体を複数の図形で表す場合に、同一の図形を用いるものとしているが、複数種類の図形を混在して使用可能としてもよい。
【０２４９】
さらに、図形近似の変形例として矩形による近似方法について説明する。
【０２５０】
図４９の（ａ）から（ｃ）は、図３９の（ａ）から（ｃ）と同じ形式の図であるが、ここでは、領域図形近似部としては矩形による領域の近似方法を用い、図形代表抽出部としては矩形の４つの頂点を抽出する方法を用い、代表点関数近似部としてはスプライン関数による近似方法を用いた場合を例としている。
【０２５１】
図４９の（ａ）において、２８００Ｂは処理対象となっている映像中の１フレームを示している。２８０１Ｂは抽出対象となっている物体の領域を示している。２８０２Ｂは物体の領域を矩形で近似したものである。
【０２５２】
ここで、例えば図４９の（ａ）において矩形２８０２Ｂを求める場合の処理手順の一例を図５０に示す。すなわち、フレーム２８００Ｂのマスク画像を例えばラスタースキャンし（ステップＳ６０Ｂ）、対象画素が物体領域内であるときに（ステップＳ６１Ｂ）、Ｘ座標とＹ座標のそれぞれについて、それまで保存されている最小値より小さい場合には最小値を更新し、それまで保存されている最大値より大きい場合には最大値を更新する（ステップＳ６２Ｂ）ことを、全ての画素について繰り返しチェックすることによって、Ｘ座標とＹ座標のそれぞれについて物体領域を示す画素位置の最小値および最大値を求めれば、矩形２８０２Ｂの４つの頂点座標を得ることができる。
【０２５３】
ところで、矩形より楕円で物体領域を表現する方が適当な場合もある。図５１に、物体の領域が矩形で表される場合に、その矩形から近似楕円を求める方法の一例を示す。図５２に、この場合の処理手順の一例を示す。
【０２５４】
図５１において、対象物体領域３３００Ｂと外接矩形３３０１Ｂが得られているものとする。
【０２５５】
まず、近似矩形の内接楕円および外接楕円を求める（ステップＳ８０Ｂ）。
【０２５６】
図５１において、楕円３３０２Ｂは矩形３３０１Ｂの内接楕円であり、楕円３３０３Ｂは矩形３３０１Ｂの外接楕円である。
【０２５７】
次に、内接楕円３３０２Ｂの大きさを少しずつ外接楕円３３０３Ｂに近づけていき（ステップＳ８１Ｂ）、物体領域を全て包含する楕円３３０４Ｂを求め（ステップＳ８２Ｂ）、近似楕円とする。なお、繰り返し処理において、一回に内接楕円３３０２Ｂの大きさを拡大する単位は、予め定めておいてもよいし、内接楕円３３０２Ｂの大きさと外接楕円３３０３Ｂの大きさの差分に応じて決定してもよい。
【０２５８】
また、上記とは逆に、外接楕円３３０３Ｂの大きさを内接楕円３３０２Ｂに近づけていってもよい。この場合には、外接楕円３３０３Ｂは最初から物体領域を全て包含しているので、例えば、繰り返し処理において、始めて物体領域に包含されない部分を生じた楕円の、一回前における楕円を、近似楕円とすればよい。
【０２５９】
次に、図４３、図４４で例示した近似図形データ構造と代表点軌跡データとは別のデータ構造を説明する。
【０２６０】
図５３、図５４は、近似図形データおよび代表点軌跡データの記述フォーマットの他の例である。なお、図５３、図５４では、代表点軌跡データの部分については、１つの代表点についてのみ示してある。実際には、代表点の個数に対応して記述される。
【０２６１】
ここでは、多項式の最高次数を２次として説明する。
【０２６２】
前述した例（図４２、図４３、図４４）では、多項式スプライン関数の全ての係数を記述していたのに対して、ここでの記述方法では、スプライン関数の節点の座標と、スプライン関数の２次の係数に関連する値との組み合わせにより記述する。この記述方法の利点は、節点が容易に取り出せるため、大まかな物体の軌跡が簡単にわかるという点である。
【０２６３】
以下、この記述方法について詳細に説明する。
【０２６４】
図５３、図５４中、図形種ＩＤ３９００Ｂは、物体の形の近似に用いた図形の種類を特定する。例えば、物体の重心のみ（ＣＥＮＴＲＯＩＤ）、矩形（ＲＥＣＴＡＮＧＬＥ）、楕円（ＥＬＬＩＰＳＥ）や、それらの組み合わせを指定できる。代表点数３９０１Ｂは、図形の種類によって定まる代表点軌跡の数を表す。
【０２６５】
節点数Ｎ３９０２Ｂは、代表点軌跡を表すスプライン関数の節点の数を表す。各節点に対応するフレームは、時間として表され、節点時刻３９０３Ｂに格納される。節点時刻３９０３Ｂは、設定数だけあるため、配列３９０４Ｂとして記述しておく。
【０２６６】
同様に、各節点のｘ座標、ｙ座標、ｚ座標もそれぞれ節点Ｘ３９０５Ｂ、節点Ｙ３９０７Ｂ、節点Ｚ３９０９Ｂの配列３９０６Ｂ，３９０８Ｂ、３９１０Ｂとして記述される。
【０２６７】
一次関数フラグ３９１１Ｂは、節点間のスプライン関数として一次関数だけが用いられているかどうかを表す。一部分でも２以上の多項式を用いる場合には、このフラグはオフにしておく。このフラグを用いることにより、近似関数として一次関数のみに使われる場合に以下で説明する関数特定情報３９１２Ｂ、３９１６Ｂ、３９２０Ｂを１つも記述しなくて済むため、データ量を削減できるというメリットがある。なお、必ずしもこのフラグは必要ではない。
【０２６８】
関数特定情報３９１２Ｂ、３９１６Ｂ、３９２０Ｂに含まれる関数ＩＤ３９１３Ｂ、３９１７Ｂ、３９２１Ｂ、関数パラメータ３９１４Ｂ、３９１８Ｂ、３９２２Ｂはそれぞれ多項式スプライン関数の次数と、その係数を特定するための情報を表す。
【０２６９】
関数特定情報は、Ｘ，Ｙ，Ｚ座標のそれぞれについて、（節点数−１）に相当する個数のものが存在し、これらは配列となって記述される。
【０２７０】
なお、上記では、多項式の最高次数を２次として説明したが、もちろん、多項式の最高次数を３次以上とすることも可能である。
【０２７１】
図５３、図５４は代表点毎に奥行き情報を記述したが、第２実施例の図１７のように対象物体毎に１つ奥行き情報を記述することも可能である。この場合のデータ構造を図５５、図５６に示す。
【０２７２】
図５５に示す物体領域データは図８と同様に、図形種ＩＤ７００Ｂ、物体出現時間７０１Ｂ、物体存在期間７０２Ｂ、代表点数Ｍ７０３Ｂ、代表点軌跡７０４Ｂ、奥行き情報７０５Ｂを含む。代表点軌跡７０４Ｂは図５６に示すように、図５３、図５４に示す近似図形データから図形種ＩＤ３９００Ｂ、代表点数３９０１Ｂ、節点Ｚ配列３９１０Ｂ、関数特定情報配列３９２３Ｂを省略したものである。
【０２７３】
第６実施例は物体領域を近似する図形の代表点の座標そのものの軌跡を記述する場合に、第２実施例の奥行き情報も付帯する例を説明したが、第３実施例（表示フラグ）、第４実施例（物体範囲情報）、第５実施例（パノラマ変換のためのパラメータ）は物体領域を近似する図形の代表点の座標そのものの軌跡を記述する場合にも同様に適用できることが理解される。
【０２７４】
第７実施例
第７実施例として任意のフレームにおける物体領域を参照フレームにおける参照物体領域と、該参照物体領域から任意のフレームにおける物体領域への変換パラメータとにより表現する場合に、第２実施例の奥行き情報も付帯する例を説明する。
【０２７５】
図５６は第７実施例に係る物体領域情報生成装置の構成例を示す。この物体領域情報生成装置は、映像データ記憶部２Ｃ、物体領域処理部４Ｃ、変換パラメータ算出部６Ｃ、関数近似部８Ｃ、物体領域データ記憶部１０Ｃを備えている。
【０２７６】
映像データ記憶部２Ｃは、映像データが記憶されているもので、例えばハードディスクや光ディスク、半導体メモリなどで構成される。なお、映像データ記憶部は他の処理部と同一サイトにある必要はなく、インターネット等を介して遠隔地に配置されていてもよい。
【０２７７】
物体領域処理部４Ｃは、基準となるフレームの物体領域（参照物体領域）や対象となるフレームの物体領域（対象物体領域）を得るための処理を行う。
【０２７８】
変換パラメータ算出部６Ｃは、参照物体領域をもとにして、対象物体領域の変換パラメータを算出する処理を行う。
【０２７９】
関数近似部８Ｃは、物体領域の変換パラメータの各々について、その時系列的な軌跡を時間関数に近似する処理を行う。なお、後述するように、変換パラメータ自体を記述する場合には、この関数近似部８は不要となる。
【０２８０】
物体領域データ記憶部１０Ｃは、変換パラメータの各々について、その時系列的な軌跡を近似した関数式を表現するデータを含む物体領域データを記憶する。
【０２８１】
なお、本実施例では、参照物体領域の更新処理を行うことが好ましいが、その部分は図５７では省略している。
【０２８２】
映像データ記憶部２Ｃおよび物体領域データ記憶部１０Ｃは、別々の記憶装置・記憶媒体によって構成されていてもよいが、それらの全部または一部が同一の記憶装置・記憶媒体によって構成されていてもよい。
【０２８３】
また、本物体領域情報生成装置は、計算機上でソフトウェアを実行する形で実現することもできる。
【０２８４】
図５８に、本実施例の物体領域情報生成装置の処理手順の一例を示す。
【０２８５】
まず、ステップＳ１０１Ｃでは、映像中の全てのフレームの物体領域（これは既知であるとする）を入力する処理を行う。例えば、ＧＵＩを介して入力する場合は、処理対象となる映像中の物体の輪郭をマウスやタッチパネル等のポインティングデバイスにより指定する。手動で入力された物体の輪郭内部を物体領域としてもよいし、また、入力された輪郭をＳｎａｋｅｓとよばれる動的輪郭モデル（例えばＭ．Ｋａｓｓ，Ａ．ＷｉｔｋｉｎａｎｄＤ．Ｔｅｒｚｏｐｏｕｌｓ著、「Ｓｎａｋｅｓ：Ａｃｔｉｖｅｃｏｎｔｏｕｒｍｏｄｅｌｓ」、Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１^ｓｔＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ，ｐｐ．２５９−２６８，１９８７年を参照）を用いた手法により画像中の物体の輪郭線にフィッティングさせ、フィッティング後の輪郭の内部を物体領域としても良い。なお、手動で入力する代わりに画像処理により自動的に求めてもよいまた、物体領域に関するデータが既に存在している場合は、そのデータを読込んでもよい。
【０２８６】
この物体領域のうち、少なくとも一つを、参照物体領域として登録しておく。登録方法としては、物体の領域内には１を、領域外には０をそれぞれ対応させた２値のビットマップを作成し、記憶しておく方法がある。
【０２８７】
また、参照物体領域の含まれるフレームを、参照フレームとして登録しておく。
【０２８８】
次に、ステップＳ１０２Ｃでは、参照物体領域から処理対象となっている１つのフレームにおける物体領域（以下、対象物体領域と呼ぶ）への変換パラメータを算出する処理を行う。
【０２８９】
この処理は、例えば、対象物体領域内のオプティカルフロー算出処理とオプティカルフローからの変換パラメータ算出処理との２つの処理の組み合わせにより実現することができる。対象物体領域内のオプティカルフロー算出処理は、参照フレームから現フレームにかけての物体領域内の各画素（もしくは数画素からなるブロック）の動き（オプティカルフロー）を算出する処理である。
【０２９０】
図５９に、各フレームにおいて物体領域内のオプティカルフローを求める処理例の概要を示す。
【０２９１】
図５９において、２０１Ｃは参照フレーム、２０２Ｃは参照フレームの次のフレーム、そして２０３Ｃはフレーム２０２Ｃの次のフレームを表している。２０４Ｃ，２０５Ｃ，２０６Ｃはそれぞれのフレームにおける物体の領域である。２０７Ｃはフレーム２０１Ｃからフレーム２０２Ｃへの物体領域のオプティカルフローである。また、２０８Ｃはフレーム２０１Ｃからフレーム２０３Ｃへの物体領域のオプティカルフローである。
【０２９２】
このようにオプティカルフローを求める方法は、参照物体領域と任意のフレームにおける物体領域を直接関係させることができるため、任意フレームの物体領域を算出したり、指定された座標が物体の内部か外部かを判定したりする処理が容易である。
【０２９３】
図５９の例では参照フレームから現フレームにかけての物体領域内の各画素（もしくは数画素からなるブロック）のオプティカルフローを求めたが、その代わりに、一つ前のフレームから現フレームにかけての物体領域内の各画素（もしくは数画素からなるブロック）のオプティカルフローを求めるようにしても良い。図６０に、この場合の処理例の概要を示す。
【０２９４】
図６０において、３０１Ｃは参照フレーム、３０２Ｃは参照フレームの次のフレーム、そして３０３Ｃはフレーム３０２Ｃの次のフレームを表している。３０４Ｃ，３０５Ｃ，３０６Ｃはそれぞれのフレームにおける物体の領域である。３０７Ｃはフレーム３０１Ｃからフレーム３０２Ｃへの物体領域のオプティカルフローである。また、３０８Ｃはフレーム３０２Ｃからフレーム３０３Ｃへの物体領域のオプティカルフローである。
【０２９５】
このようなオプティカルフローの算出方法は、図５９の方法に比べてパラメータの変動が少なくなるが、任意フレームの物体領域の算出が面倒になる。図５９と図６０のどちらの方法を用いても構わないが、本実施例では、図５９の方法でオプティカルフローを算出するものとして説明を続ける。
【０２９６】
なお、オプティカルフローを求める具体的な方法は多数提案されており（例えば、Ｊ．Ｌ．Ｂａｒｒｏｎ，Ｄ．Ｊ．ＦｌｅｅｔａｎｄＳ．Ｓ．Ｂｅａｕｃｈｅｍｉｎ著、「ＰｅｒｆｏｒｍａｎｃｅｏｆＯｐｔｉｃａｌＦｌｏｗＴｅｃｈｎｉｑｕｅｓ」、ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＶｉｓｉｏｎ，ｖｏｌ．１２，ｎｏ．１，ｐｐ．４３−７７，１９９４年を参照）、どのような方法でも用いることが可能である。
【０２９７】
また、参照物体領域内の特徴点を複数選択し、これら特徴点を中心とするブロックをテンプレートとするテンプレートマッチングにより求めた移動ベクトルをオプティカルフローの代わりに用いても良い。
【０２９８】
次に、オプティカルフローから変換パラメータを算出する処理を行うが、求める変換パラメータは前提とする変換モデルにより異なる。
【０２９９】
本実施例では、
パラメータ数が１のモデルとして、「拡大縮小モデル」、「回転モデル」、
パラメータ数が２のモデルとして、「平行移動モデル」、
パラメータ数が４のモデルとして、「拡大縮小／回転／平行移動モデルの複合モデル」（ここでは４−ｐａｒａｍｅｔｅｒ変換モデルと呼ぶ）、
パラメータ数が６のモデルとして、「ａｆｆｉｎｅ変換モデル」、
パラメータ数が８のモデルとして、「射影変換モデル」、
パラメータ数が１２のモデルとして、「ｐａｒａｂｏｌｉｃ変換モデル」が選択できるものとする。
【０３００】
これらのモデルを数式で表したのが数式（１）から数式（７）である。
【０３０１】
ｘ´＝ａ_０ｘ，
ｙ´＝ａ_０ｙ（１）
ｘ´＝ｘｃｏｓａ_０−ｙｓｉｎａ_０，
ｙ´＝ｘｃｏｓａ_０＋ｙｓｉｎａ_０（２）
ｘ´＝ｘ＋ａ_０，
ｙ´＝ｙ＋ａ_１（３）
ｘ´＝ａ_０ｘ＋ａ_１ｙ＋ａ_２，
ｙ´＝ａ_１ｘ−ａ_０ｙ＋ａ_３（４）
ｘ´＝ａ_０ｘ＋ａ_１ｙ＋ａ_２，
ｙ´＝ａ_３ｘ＋ａ_４ｙ＋ａ_５（５）
ｘ´＝（ａ_０ｘ＋ａ_１ｙ＋ａ_２）／（ａ_３ｘ＋ａ_４ｙ＋１），
ｙ´＝（ａ_５ｘ＋ａ_６ｙ＋ａ_７）／（ａ_３ｘ＋ａ_４ｙ＋１）（６）
ｘ´＝ａ_０ｘ^２＋ａ_１ｘｙ＋ａ_２ｙ^２＋ａ_３ｘ＋ａ_４ｙ＋ａ_５，
ｙ´＝ａ_６ｘ^２＋ａ_７ｘｙ＋ａ_８ｙ^２＋ａ_９ｘ＋ａ_１０ｙ＋ａ_１１（７）
数式（１）は拡大縮小モデル、数式（２）は回転モデル、数式（３）は平行移動モデル、数式（４）は４−ｐａｒａｍｅｔｅｒ変換モデル、数式（５）はａｆｆｉｎｅ変換モデル、数式（６）は射影変換モデル、数式（７）はｐａｒａｂｏｌｉｃ変換モデルに相当する。数式中、参照物体領域中の座標を（ｘ，ｙ）、対象物体領域における物体の対応点の座標を（ｘ’，ｙ’）としている。各変換モデルでは、両フレームにおける対応点の関係が、それぞれの数式のようにａ₀〜ａ₁₁のパラメータを用いて表現できることを仮定している。もちろん、上述したモデル以外のパラメトリックなモデルを用意しても構わない。
【０３０２】
変換パラメータの算出には、最小二乗法を用いることができる。これは、オプティカルフローにより求められた（ｘ，ｙ）と（ｘ’，ｙ’）との組み合わせを変換モデルの数式に代入した際に生じる誤差の２乗和を最小とするように変換パラメータを決定する方法である。これは古典的な方法で、行列演算で容易に実行することができる。
【０３０３】
次に、ステップＳ１０３Ｃでは、算出した物体領域の変換パラメータを時間関数へ変換（近似）する処理を行う。
【０３０４】
すなわち、ある時間区間におけるｎ個の変換パラメータａ_i（０≦ｉ≦ｎ−１）（例えば、ｎ＝１２）を、
ａ_i＝ｆ_i（ｔ）（ｆ_i（ｔ）は時間ｔの関数）
と表現する。
この時間区間とは、同一の参照物体領域を用いてオプティカルフローを算出したフレームが含まれる時間区間である。また、ｆ_i（ｔ）は多項式、スプライン関数、定数などとすることができる。
【０３０５】
図６１に、オプティカルフローから算出された（ある１つの）ａ_iを関数により表現した様子を示す。図６１において、４０１Ｃは関数表現の対象となっている時間区間、４０２Ｃはオプティカルフローから算出されたａ_iの値、４０３Ｃはａ_iを表現する関数ａ_i＝ｆ_i（ｔ）を表している。
【０３０６】
このように関数により表現するメリットは、物体領域を記述するデータを少なくできることである。例えば、関数として２次以下の多項式を用いるとすると、この関数は３つの実数により表現することができるため、ある時間区間全てのパラメータの値を記述するのに３つの実数で十分になる。
【０３０７】
パラメータを表現する関数を多項式やスプライン関数とする場合には、変換対象となっている時間区間におけるａ_iの値とｆ_i（ｔ）により算出される値との誤差が小さくなるように決定する。例えば、最小二乗法を利用すれば容易に計算ができる。
【０３０８】
なお、この近似関数を求める処理は、例えば、当該物体領域に関する各フレームにおけるパラメータ値が得られる毎に行う（例えば各フレームのパラメータ値が得られる毎に近似を行うとともに近似誤差を求め、近似誤差が一定の範囲に収まるように近似区間を適宜分割する方法）ようにしてもよいし、参照物体領域が更新されて参照物体一定区間が定まった後に一括して行うようにしてもよい。
【０３０９】
このステップＳ１０３Ｃの処理手順については後でより詳細に説明する。
【０３１０】
次に、ステップＳ１０４Ｃでは、参照物体領域の更新の必要性の判定処理を行う。
【０３１１】
本実施例は、任意のフレームにおける物体の領域を、参照フレームにおける参照物体領域と、参照物体領域の変換パラメータとにより表現するものである。しかし、表現したい物体領域と参照物体領域とがあまりに異なった形状である場合には、変換パラメータにより参照物体領域を移動／変形しても、表現したい物体領域に似ている形状が得られない。このような場合には、参照物体領域を別のフレームにおける物体領域に変更（参照領域の更新）するのが効果的である。そこで、本実施例では、ステップＳ１０４Ｃにて、そのような変更が必要であるか否かを判定するようにしている。
【０３１２】
この判定には、例えば、あるフレームの実際の物体領域と予測物体領域との誤差があらかじめ定められているしきい値を上回るかどうかにより判断する方法を用いることができる。予測物体領域とは、変換パラメータを用いて参照物体領域から算出したあるフレームの物体領域のことである。変換に用いる変換パラメータは、時間関数ａ_i＝ｆ_i（ｔ）から算出した値を用いる。さらに、実際の物体領域と予測物体領域との誤差としては、例えば、両領域の共通部分の面積と共通しない部分の面積との比を用いることができる。
【０３１３】
次に、ステップＳ１０５Ｃでは、先のステップＳ１０４Ｃの判定処理において参照物体領域の更新が決定された場合に、参照物体領域更新処理を行う。この処理は、基本的にはステップＳ１０１Ｃの処理と同様である。すなわち、現在ステップＳ１０２Ｃの変換パラメータを算出する処理の対象となっているフレームを参照フレームとして登録し、参照物体領域を表現する２値のビットマップを作成する処理である。また、参照フレームにおける物体領域を参照物体領域として登録しておく。
【０３１４】
次に、ステップＳ１０６Ｃでは、映像中の物体領域の記述処理が終了かどうかを判定する。この判定基準としては、例えば、ビデオの終端かどうか、物体領域存在区間の終端かどうか、ユーザにより終了が指示されたかどうか、などがある。ステップＳ１０２ＣからステップＳ１０４ＣまたはステップＳ１０５Ｃまでの処理が、ステップＳ１０６Ｃで終了と判定されるまでフレーム毎に繰り返し実行される。
【０３１５】
そして、ステップＳ１０７Ｃにおいて、これまでの処理により計算された物体領域の記述情報（変換パラメータを近似する関数のパラメータ）を、予め定められた記述フォーマットに従って記録する処理を行う。記録先は、例えば、計算機の内部もしくは外部の半導体メモリ、磁気テープ、磁気ディスク、光ディスクなどの物体領域データ記憶部１０Ｃである。
【０３１６】
図６２に、本実施例における１つの物体領域に対する物体領域データの記述フォーマットの一例を示す。
【０３１７】
図６２において、５０１Ｃは、物体ＩＤで、物体に付与された物体固有の識別情報（例えば、番号または記号）である。
５０２Ｃは、参照物体領域一定区間数で、同一の参照物体領域を有するフレーム区間の数である（図６２ではＮとしている）。これは参照フレームの数とも等しい。
【０３１８】
５０３Ｃおよび５０４Ｃは、それぞれ、物体領域存在区間の先頭時刻および末尾時刻である。これらは時刻もしくはフレーム番号により記述される。末尾時刻の代わりに物体領域存在区間の長さ（時間もしくはフレーム番号の差分値）を用いることもできる。
５０５Ｃは、物体領域記述情報である。物体領域記述情報５０５Ｃは、参照物体領域区間毎に記述され、すなわち参照物体領域区間数（図６２の例ではＮ個）だけ記述される。
【０３１９】
５１２Ｃは当該物体領域の奥行き情報であり、その詳細は図１８に示したものである。
【０３２０】
各々の物体領域記述情報５０５Ｃの具体的内容は、図６２中の５０６Ｃ〜５１０Ｃに示される。
５０６Ｃおよび５０７Ｃは、それぞれ、参照物体領域区間の先頭時刻および末尾時刻である。これらは時刻もしくはフレーム番号により記述される。末尾時刻は参照物体領域区間の区間長で置き換えることができる。
５０８Ｃは、変換モデルＩＤである。これは、拡大縮小モデル、ａｆｆｉｎｅ変換モデル、ｐａｒａｂｏｌｉｃ変換モデルなどのうちどのモデルを用いて物体領域を記述したかを特定するためのＩＤである。
５１１Ｃは、原点座標で、変換モデルの原点座標を画像のどこにとるかを決定するものである。原点座標データは、参照物体領域の重心位置を常に原点とするなどのルールを決めておく場合には省略することができる。
５０９Ｃは、参照物体領域情報であり、参照物体領域を特定するための情報である。具体的には、参照フレームの時刻（またはフレーム番号）、参照物体領域を表すビットマップデータ（もしくはビットマップデータへのポインタ）である。なお、ビットマップデータは、そのままではデータサイズが大きいため、圧縮して保存するのが好ましい。
５１０Ｃは、変換パラメータ情報である。変換パラメータ情報は、変換モデル（変換モデルＩＤ）により定まるパラメータ数（図６２の例ではＭ個）だけ記述される。変換パラメータは、具体的には、各フレームでのパラメータの値を示す配列や、パラメータを近似する関数を特定する情報（係数値など）などである。変換パラメータ情報の詳細については後で詳細に説明する。
【０３２１】
以上の処理により、映像中の時空間的に変化する物体領域を簡単な記述データとして記録しておくことができる。
【０３２２】
上述の説明では、ビットマップで物体領域を表し、参照物体領域から処理対象となっているフレームの物体領域（対象物体領域）への変換パラメータを算出したが、物体領域を近似図形で近似し、参照物体領域の近似図形の各代表点から処理対象となっているフレームの物体領域（対象物体領域）の近似図形の対応する各代表点への変換パラメータを算出してもよい。以下、この例を説明する。
【０３２３】
図６３に物体領域情報生成装置の構成例を示す。この物体領域情報生成装置は、映像データ記憶部２Ｃ、物体領域処理部４Ｃ、図形近似部５Ｃ、変換パラメータ処理部６Ｃ、関数近似部８Ｃ、物体領域データ記憶部１０Ｃを備えている。図５７の構成に対して図形近似部５Ｃが追加されたものである。図形近似部５Ｃは物体領域を近似図形で近似し、その近似図形の各代表点を求める処理を行うものである。変換パラメータ算出部６Ｃは、基準となる参照フレームの参照物体領域の近似図形の代表点をもとにして、対象となるフレームの対象物体領域の近似図形の代表点への変換パラメータを算出する。関数近似部８Ｃは、物体領域の近似図形の代表点の変換パラメータの各々について、その時系列的な軌跡を時間関数に近似する。もちろん、本物体領域情報生成装置も、計算機上でソフトウェアを実行する形で実現することもできる。
【０３２４】
図６４にこの物体領域情報生成装置の処理手順の一例を示す。
【０３２５】
ステップＳ３０１Ｃは、図５８におけるステップＳ１０１Ｃと同様の処理である。
【０３２６】
ステップＳ３０２Ｃは、物体領域存在区間全体にわたり、物体領域をあらかじめ決められた図形により近似する処理である。
【０３２７】
物体領域を図形近似する処理では、例えば、物体領域を囲むなるべく小さな近似図形を見つける。近似に用いる図形としては、傾きのないあるいは傾きのある矩形（正方形、長方形）、平行四辺形、傾きのないあるいは傾きのある楕円（円を含む）、多角形など、種々の図形を用いることができる。また、領域の近似方法も、領域に外接する図形に近似する方法、領域に内接する図形とする方法、領域の重心を近似図形の重心とする方法、領域と近似図形の面積を等しくする方法、領域と近似図形とが重ならない部分の面積を最小とする方法など、種々の方法がある。
【０３２８】
なお、物体の領域を予め定められた図形により近似するのではなく、対象物体（オブジェクト）毎に図形の種類をユーザが指定できるようにしてもよいし、対象物体毎にその物体の形状等に応じて図形の種類を自動的に選択するようにしてもよい。
【０３２９】
また、物体領域を近似する図形近似を求める処理は、フレーム毎に行っても良いし、もしくは対象フレームの前後数フレームの物体領域を使って行っても良い。後者の場合には、近似図形の大きさや位置などの変化を数フレームの間で平滑化することにより、近似図形の動きや変形をなめらかにしたり、物体領域の抽出誤差を目立たなくすることができる。なお、近似図形の大きさは、フレーム毎に異なって構わない。
【０３３０】
物体領域の近似図形が求められたならば、この近似図形を表現する代表点を抽出する処理が行われる。どのような点を代表点とするかは、どのような近似図形を用いるかにより異なる。例えば、近似図形が矩形の場合には４つもしくは３つの頂点を代表点とすることができ、近似図形が円の場合には中心と円周上の一点としたり直径の両端点としたりすることができる。また、楕円の場合には楕円の外接矩形の頂点としたり２つの焦点と楕円上の１点（例えば短軸上の１点）としたりすればよい。任意の閉多角形を近似図形とする場合には、各頂点を図形の代表点とする必要がある。
【０３３１】
代表点の抽出は、１フレーム分の近似図形が得られるたびに、フレーム単位で行う。また、各代表点は、水平方向の座標ｘと、垂直方向の座標ｙと、により表される。
【０３３２】
物体の領域が平行四辺形で表される場合に、近似楕円を求める方法の一例は図４０に示したものと同じである。
【０３３３】
楕円を表現する図形代表点として２つの焦点および１つの楕円上の点を求める方法の一例は図４１に示したものと同じである。
【０３３４】
この他、近似図形として平行四辺形や任意形状の多角形を用いることもできる。
【０３３５】
さらに、このステップＳ３０２Ｃでは、参照物体領域と参照フレームを設定する。参照物体領域は、物体領域存在区間の先頭のフレーム（参照フレーム）における物体領域近似図形である。また、参照物体領域近似図形の代表点の位置を併せて記憶しておく。
【０３３６】
次に、ステップＳ３０３Ｃでは、処理対象としているフレームの物体領域近似図形の代表点と、参照物体領域近似図形の代表点とを対応させる。
【０３３７】
図６５に、代表点の対応づけ方法の一例を示す。図６５において、１０００Ｃは近似矩形（複数）の重心である。図６５では、参照物体領域近似図形１００１Ｃと対象物体領域近似図形１００２Ｃが得られている。
【０３３８】
まず、近似図形１００１Ｃと近似図形１００２Ｃのいずれかを平行移動させ、重心位置を一致させる（重心位置を一致させた状態が図６５である）。
次に、それぞれの矩形の頂点同士の距離ｄ１〜ｄ４を計算し、全ての頂点の組み合わせで距離の和を求める。
そして、距離の和が最小となる組み合わせを求め、対応づけする。
なお、この方法では対応付けが難しい場合がある。例えば、近似矩形が正方形に近い形状であり且つ４５度回転移動している場合には、対応付けが難しい（２通りの組み合わせにおいて距離の和が同じような値になる）。そこで、そのような場合には、近似図形内の物体領域同士の排他的論理和を取り、その面積が最小となる組み合わせを採用する方法、あるいは物体領域のテクスチャの絶対差分を求め、差分値が最小となる組み合わせを求める方法などを用いれば良い。
【０３３９】
ステップＳ３０４Ｃでは、物体領域近似図形の代表点の移動ベクトルから変換パラメータを算出する。
【０３４０】
この処理では、代表点の動きをオプティカルフローの代わりに用いて、図５８のステップＳ１０２Ｃと同等の処理により変換パラメータを算出する。ただし、代表点の数は少ないため、必ずしも変換パラメータが求まるとは限らない。例えば、矩形、楕円、平行四辺形は３つの代表点を持つが、この３つの移動ベクトルから射影変換モデルのパラメータ８個を求めることはできない。図６６に、近似に用いる図形の種類と、変換パラメータを求めることができる変換モデルとの関係を示す。図６６中の○はパラメータが算出できる組み合わせ、×は算出できない組み合わせである。
【０３４１】
ステップＳ３０５Ｃは、ステップＳ３０４Ｃで求めた変換パラメータを時間関数により近似する処理であり、図５８のステップＳ１０３Ｃと同じ処理である。
【０３４２】
ステップＳ３０６Ｃは、参照物体領域を更新する必要があるか否かを判定する処理である。この処理では、まず、変換パラメータにより参照物体領域を変換し、現フレームの予測物体領域を算出する。もちろん、参照物体領域の代表点のみを変換パラメータにより変換し、変換後の代表点により特定される図形を構成しても同じ予測物体領域が算出できる。次に、予測物体領域と現フレームの対象物体領域近似図形との誤差を計算し、しきい値処理により参照物体領域更新を行うか否かを判定する。
【０３４３】
ステップＳ３０７Ｃは、ステップＳ３０６Ｃにおいて参照物体領域の更新が必要と判定された場合に、実際に更新を行う処理である。処理対象のフレームを参照フレームとし、当該フレームの物体領域近似図形を新たな参照物体領域として記憶し、参照物体領域の代表点の座標値も併せて保持しておく。
【０３４４】
ステップＳ３０８Ｃは、図５８のステップＳ１０６Ｃと同様に映像中の物体領域の記述が終了かどうかを判定する。
【０３４５】
ステップＳ３０９Ｃは、図５８のステップＳ１０７Ｃと同様に算出した物体領域の情報（変換パラメータを近似する関数のパラメータ）を予め定められた記述フォーマットで記録する処理である。
【０３４６】
図６７に、物体領域データの記述フォーマットの一例を示す。この記述フォーマットは、図形情報１１０９Ｃ以外は、図６２に例示した記述フォーマットと同じである。図６２の参照物体領域情報５０９Ｃの代わりの図形情報１１０９Ｃは、図形の種類を特定するＩＤと、参照物体領域の近似図形の代表点の座標とからなる。図６７中のＭはＩＤにより特定される図形に必要な代表点の数を表す。
【０３４７】
以上では、ある１つの物体領域に関して全てのフレームを対象として変換パラメータを求めたが、変換パラメータを求めるフレームをサンプリングするようにしてもよい。例えば、３フレームに１フレームだけサンプリングし、フレーム１から参照物体領域、フレーム４，７，…からそれぞれ対象物体領域を用いるなどである。
【０３４８】
なお、変換パラメータを時間関数で表現し、その関数を特定する情報を物体領域データに記述する場合には、そのサンプリングされたパラメータ値によってこれまでと同様に関数近似を行えばよい。また、物体領域データにサンプリングに関する情報を含める必要はない。
【０３４９】
一方、変換パラメータの値を物体領域データに直接記述する場合には、例えば、（１）そのサンプリングされなかったフレームのパラメータ値を適宜補間し（例えば、直前にサンプリングされたフレームと同じ値を記述する）、物体領域データは図６２と同様とするか、あるいは、（２）図６８のように、物体領域データにサンプリング情報５２０Ｃを持たせ、サンプリングした場合にはそのサンプリングしたフレームのパラメータ値のみを記述し、サンプリング情報５２０Ｃにサンプリング方法を特定可能な情報（例えば、ｎフレームに１回サンプリングしたことを示す情報として数値ｎ（ただし、例えばｎ＝１の場合には全てのフレームからサンプリングされたことを示すものとする））を記述すればよい。なお、（２）の方法においては、この物体領域情報を使用する際において、サンプリング情報５２０を参照することにより、サンプリングされなかったフレームのパラメータ値を必要に応じて補間することができる。
【０３５０】
次に、１つの物体（オブジェクト）を複数の領域に分けて物体領域データを作成する方法について説明する。これまでは、１つの物体に対して１つの変換パラメータを求めていた。しかし、見かけの形状が大きく変化するような物体の場合、物体をいくつかの領域に分割し、それぞれの領域に対して変換パラメータを用いる方が良い場合がある。例えば、歩行している人間では、頭や胴体の部分は動きが少ないが、手足は激しく動作する。人間を１つの物体として扱うよりも、頭／胴体／手／足と別の領域に分割する方が、各部の変換パラメータを安定して求めることができる。
【０３５１】
１つの物体を複数の図形で表す場合には、物体を複数の領域に分割する処理が必要となる。この処理にはどのような方法を用いてもよいが、例えば人手で直接入力する方法がある。この場合、例えば、マウス等のポインティングデバイスを用いて、画像上で領域を矩形や楕円で囲む、あるいはポインティングデバイスの軌跡により領域を指定する、などの操作で実現することができる。また、人手ではなく自動で行う場合には、例えば、物体の動きのクラスタリングで実現する方法がある。これは、連続するフレーム間で物体中の各領域がどのような動きをしたかを相関法（例えば、画像解析ハンドブック、第ＩＩ部、第３章、東京大学出版会、１９９１を参照）や勾配法（例えば、Ｄｅｔｅｒｍｉｎｉｎｇｏｐｔｉｃａｌｆｌｏｗ，Ｂ．Ｋ．Ｐ．ＨｏｒｎａｎｄＢ．Ｇ．Ｓｃｈｕｎｃｋ，ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ，Ｖｏｌ．１７，ｐｐ．１８５−２０３，１９８１を参照）などにより求め、これらの動きの似ているものだけをまとめて領域を形成する方法である。
【０３５２】
図６９に、オプティカルフローの似ているものをまとめて領域分割を行う様子を示す。
【０３５３】
また、図７０に、物体を複数の領域で記述するためのデータ構造の一例を示す。これは物体を単一の領域で記述するデータ構造（図６７）を拡張したものであり、２９０６Ｃ以下のデータは図６７と共通である。２９０２Ｃに分割した領域の数を保持し、２９０５Ｃ以降に各領域のデータを保持する。
【０３５４】
第７実施例は任意のフレームにおける物体領域を参照フレームにおける参照物体領域と、該参照物体領域から任意のフレームにおける物体領域への変換パラメータとにより表現する場合に、第２実施例の奥行き情報も付帯する例を説明したが、第３実施例（表示フラグ）、第４実施例（物体範囲情報）、第５実施例（パノラマ変換のためのパラメータ）もこのような情報として記述された物体領域データにも同様に付帯できることが理解される。
【０３５５】
本発明は上述した実施例に限定されず、種々変形して実施可能である。例えば、これまでの各実施例においては、物体の領域を近似する図形の代表点として、近似図形を特定するための情報を用いたが、その代わりに、映像中の物体領域から取り出した複数の特徴的な点を、図形の代表点として用いてもよい。特徴点としては、種々のものが考えられるが、例えば、物体の角（例えば、Ｇｒａｙ−ｌｅｖｅｌｃｏｒｎｅｒｄｅｔｅｃｔｉｏｎ，Ｌ．ＫｉｔｃｈｅｎａｎｄＡ．Ｒｏｓｅｎｆｅｌｄ，ＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎＬｅｔｔｅｒｓ，Ｎｏ．１，ｐｐ．９５−１０２，１９８２による方法など）、物体の重心などが考えられる。なお、物体の重心を特徴点とする場合は、重心であろう点の周囲を指定してから自動抽出することが好ましい。なお、この方法の場合には、近似図形を特定するには情報が不足するので、物体領域データから近似図形自体を特定することはできないが、上層処理装置側での処理は簡易になる。この場合の物体領域データの記述スタイル（フォーマット）は上述の例と同様であり、単に「近似図形データ」が「特徴点データ」となり、「代表点数」が「特徴点数」となり、「代表点軌跡データ」が「特徴点軌跡データ」となり、近似図形数と図形種ＩＤのフィールドは不要となる。
【０３５６】
また、本発明は、コンピュータに所定の手段を実行させるための（あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるための）プログラムを記録したコンピュータ読取り可能な記録媒体としても実施することもできる。
【０３５７】
なお、本願発明は上記各実施形態に限定されるものではなく、実施段階ではその趣旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合組合わせた効果が得られる。さらに、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【０３５８】
また、上述の説明は個々の実施例それぞれについて行ったが、複数の実施例を適宜組み合わせてもよい。
【０３５９】
【発明の効果】
本発明によれば、映像中における対象となる物体の領域を該物体の領域に対する近似図形の代表点の位置データまたはそれを特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を近似した関数のパラメータとして記述することにより、映像中の所望の物体の領域を少ないデータ量で記述でき且つその作成やそのデータの扱いも容易にすることができる。
また、本発明によれば、映像中の物体に対する効率的、効果的な検索を行うことが可能になる。
【図面の簡単な説明】
【図１】本発明の第１実施例に係る物体領域情報生成装置の構成例を示す図。
【図２】第１実施例の物体領域情報生成装置の処理の流れの一例を示すフローチャート。
【図３】映像中の物体の領域を物体領域データで記述するための処理の概要を説明するための図。
【図４】基準代表点のＸ座標の値を近似する関数を求める例を説明するための図。
【図５】基準代表点以外の代表点を表すための差分ベクトルの一例を説明するための図。
【図６】基準代表点以外の代表点を表すための差分ベクトルのＸ成分の値を近似する関数を求める例を説明するための図。
【図７】代表点の座標または差分ベクトルから近似関数を求める処理の一例を示すフローチャート。
【図８】物体領域データのデータ構造の一例を示す図。
【図９】物体領域データ中の代表点軌跡データのデータ構造の一例を示す図。
【図１０】基準代表点以外の代表点を表すための差分ベクトルの他の例を説明するための図。
【図１１】基準代表点以外の代表点を表すための差分ベクトルのさらに他の例を説明するための図。
【図１２】フレーム間での差分ベクトルの一例を説明するための図。
【図１３】物体領域データのデータ構造の他の例を示す図。
【図１４】物体領域データから任意の時刻における物体の領域を取り出す処理の一例を示すフローチャート。
【図１５】本発明の第２実施例に係る物体領域情報生成装置の構成例を示す図。
【図１６】第２実施例に係る物体領域データ中の代表点軌跡データのデータ構造の他の例を示す図。
【図１７】物体領域データのデータ構造のさらに他の例を示す図。
【図１８】奥行き情報のデータ構造の一例を示す図。
【図１９】奥行き方向の位置情報の測定について説明するための図。
【図２０】指定した位置に近い物体を検索する処理の一例を示すフローチャート。
【図２１】奥行き方向の位置情報の測定について説明するための図。
【図２２】奥行き方向の位置情報の測定について説明するための図。
【図２３】奥行き方向の位置情報の測定について説明するための図。
【図２４】移動物体が指定した距離に存在する時刻を求めるための前処理の手順の一例を示すフローチャート。
【図２５】移動物体が指定した距離に存在する時刻を求める処理の手順の一例を示すフローチャート。
【図２６】第３実施例に係る表示フラグについて説明するための図。
【図２７】代表点軌跡データ作成について説明するための図。
【図２８】物体領域データのデータ構造のさらに他の例を示す図。
【図２９】表示フラグ情報のデータ構造の一例を示す図。
【図３０】物体領域データ中の代表点軌跡データのデータ構造のさらに他の例を示す図。
【図３１】検索時の処理の一例を示すフローチャート。
【図３２】第４実施例に係る物体通過範囲情報について説明するための図。
【図３３】物体通過範囲情報のデータ構造の一例を示す図。
【図３４】物体通過範囲情報のデータ構造の他の例を示す図。
【図３５】指定された座標を通過する物体を選び出す処理の一例を示すフローチャート。
【図３６】第５実施例に係るモザイキングを用いた物体領域情報記述方法の処理手順の一例を示すフローチャート。
【図３７】モザイキングを用いた物体領域情報記述方法について説明するための図。
【図３８】パノラマ画像への変換パラメータのデータ構造を示す図。
【図３９】第６実施例に係る物体の領域を物体領域データで記述するための処理の概要を説明するための図。
【図４０】物体の領域を楕円で近似する例について説明するための図。
【図４１】物体の領域を近似する楕円の代表点を求める例について説明するための図。
【図４２】物体領域データのデータ構造の一例を示す図。
【図４３】物体領域データ中の近似図形データのデータ構造の一例を示す図。
【図４４】近似図形データ中の代表点軌跡データのデータ構造の一例を示す図。
【図４５】物体領域データ中の近似図形データのデータ構造の他の例を示す図。
【図４６】近似図形を平行四辺形とした場合の代表点の例について説明するための図。
【図４７】映像中の物体の領域を複数の楕円で表現した例を示す図。
【図４８】複数の近似図形データを含む物体領域データのデータ構造の一例を示す図。
【図４９】映像中の物体の領域を物体領域データで記述するための他の処理の概要を説明するための図。
【図５０】近似矩形を求める処理手順の一例を示すフローチャート。
【図５１】近似矩形から近似楕円を求める方法について説明するための図。
【図５２】近似矩形から近似楕円を求める処理手順の一例を示すフローチャート。
【図５３】物体領域データのデータ構造の他の例を示す図。
【図５４】物体領域データのデータ構造のさらに他の例を示す図。
【図５５】物体領域データのデータ構造のさらに他の例を示す図。
【図５６】物体領域データのデータ構造のさらに他の例を示す図。
【図５７】第７実施例に係る物体領域情報生成装置の構成例を示す図。
【図５８】第７実施例の処理手順の一例を示すフローチャート。
【図５９】物体領域のオプティカルフロー算出方法の一例を説明するための図。
【図６０】物体領域のオプティカルフロー算出方法の他の例を説明するための図。
【図６１】１つの変換パラメータを時間関数で近似表現する例を説明するための図。
【図６２】参照物体領域がビットマップ表現されている場合の物体領域データの記述フォーマットの一例を示す図。
【図６３】第７実施例の物体領域情報生成装置の他の構成例を示す図。
【図６４】図６３の装置の処理手順の例を示すフローチャート。
【図６５】物体領域の近似図形の代表点同士を対応付ける方法について説明するための図。
【図６６】近似に用いる図形の種類と変換パラメータを求めることができる変換モデルとの関係を示す図。
【図６７】参照物体領域が図形近似されている場合の物体領域データの記述フォーマットの一例を示す図。
【図６８】サンプリング情報を含む物体領域データの記述フォーマットの一例を示す図。
【図６９】オプティカルフローを用いて１つの物体を動きが似ている領域に分割する様子を説明するための図。
【図７０】１つの物体を複数の領域で記述するための物体領域データの記述フォーマットの一例を示す図。
【符号の説明】
１００…映像データ記憶部
１０１…領域抽出部
１０２…領域の図形近似部
１０３…図形代表点抽出部
１０４…代表点列の関数変換部
１０５…関連情報記憶部
１０６…領域データ記憶部

Claims

映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報を生成する装置であって、
フレーム毎に前記任意の物体の領域を図形で近似する手段と、
フレーム毎に該図形を表す複数の代表点を抽出する手段と、
前記複数の代表点のうちの少なくとも一点を基準代表点とし、該基準代表点の位置データと、前記基準代表点に対する残りの代表点の相対位置データとを、フレームの進行に沿って並べることにより得られる軌跡を関数で近似する手段と、
該関数を用いて該物体の領域に関する情報を生成する手段と、
を具備する物体領域情報生成装置。
前記相対位置データは、前記基準代表点と前記残りの代表点との差分ベクトルの成分であることを特徴とする請求項１に記載の物体領域情報生成装置。
映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報を生成する装置であって、
フレーム毎に前記任意の物体の領域を図形で近似する手段と、
フレーム毎に該図形を表す複数の代表点を抽出する手段と、
基準フレームにおける近似図形の前記複数の代表点の位置データと、他のフレームにおける前記基準フレームの複数の代表点に対応する代表点の相対位置データとを、フレームの進行に沿って並べることにより得られる軌跡を関数で近似する手段と、
該関数を用いて該物体の領域に関する情報を生成する手段と、
を具備する物体領域情報生成装置。
前記相対位置データは前記基準フレームにおける前記複数の点と、前記他のフレームの前記基準フレームの複数の点に対応する点との差分ベクトルの成分であることを特徴とする請求項３に記載の物体領域情報生成装置。
映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報を生成する装置であって、
フレーム毎に前記任意の物体の領域を図形で近似する手段と、
フレーム毎に該図形を表す複数の代表点を抽出する手段と、
前記複数の代表点の位置を特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を関数で近似する手段と、
該関数、および前記図形または各々の前記代表点が見えている状態にあるフレーム区間、あるいは見えていない状態にあるフレーム区間を特定するフラグ情報を用いて該物体の領域に関する情報を生成する手段と、
を具備する物体領域情報生成装置。
映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報を生成する装置であって、
フレーム毎に前記任意の物体の領域を図形で近似する手段と、
フレーム毎に該図形を表す複数の代表点を抽出する手段と、
前記複数の代表点の位置を特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を関数で近似する手段と、
該関数、および前記図形が前記複数フレームにおいて存在した範囲を示す存在範囲情報を用いて該物体の領域に関する情報を生成する手段と、
を具備する物体領域情報生成装置。
前記関数近似手段は、複数の代表点の位置データ、またはこれを特定可能な位置の次元を持つデータをフレームの進行に沿って並べたときの軌跡を所定の関数で近似し、
前記情報生成手段は、該近似図形が前記複数フレームにおいて存在した範囲を示す存在範囲近似図形を生成し、該関数、および該存在範囲近似図形を用いて該物体の領域に関する情報を生成することを特徴とする請求項６に記載の物体領域情報生成装置。
複数フレームをその重複部分を重ねるようにして生成されるパノラマ画像中を推移する任意の物体の領域に関する情報を記述するための物体領域情報を生成する装置であって、
前記パノラマ画像中の前記任意の物体の領域を図形で近似する手段と、
前記パノラマ画像中を推移する前記図形を表す複数の代表点を抽出する手段と、
前記複数の代表点の該パノラマ画像中における位置を特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を関数で近似する手段と、
該関数を用いて該物体の領域に関する情報を生成する手段と、
を具備する物体領域情報生成装置。
前記物体の領域に関する情報は、対象となる前記複数フレームのうちの先頭のフレーム及び最終のフレームを特定可能な情報と、該物体の領域を近似する図形を識別する情報とを含むことを特徴とする請求項１乃至請求項８のいずれか一項に記載の物体領域情報生成装置。
前記物体の領域に関する情報は、該物体に関連付けられている関連情報、または該関連情報のアドレスを示す情報を含むことを特徴とする請求項１乃至請求項９のいずれか一項に記載の物体領域情報生成装置。
前記物体の領域に関する情報は前記関数のパラメータを用いて記述されることを特徴とする請求項１乃至請求項１０のいずれか一項に記載の物体領域情報生成装置。
映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報記述プログラムであって、コンピュータに、
フレーム毎に前記任意の物体の領域を図形で近似する手順と、
フレーム毎に該図形を表す複数の代表点を抽出する手順と、
前記複数の代表点のうちの少なくとも一点を基準代表点とし、該基準代表点の位置データと、前記基準代表点に対する残りの代表点の相対位置データとを、フレームの進行に沿って並べることにより得られる軌跡を関数で近似する手順と、
該関数を用いて該物体の領域に関する情報を記述するする手順と、
を実行させるための物体領域情報記述プログラム。
前記相対位置データは、前記基準代表点と前記残りの代表点との差分ベクトルの成分であることを特徴とする請求項１２に記載の物体領域情報記述プログラム。
映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報記述プログラムであって、コンピュータに、
フレーム毎に前記任意の物体の領域を図形で近似する手順と、
フレーム毎に該図形を表す複数の代表点を抽出する手順と、
基準フレームにおける近似図形の前記複数の代表点の位置データと、他のフレームにおける前記基準フレームの複数の代表点に対応する代表点の相対位置データとを、フレームの進行に沿って並べることにより得られる軌跡を関数で近似する手順と、
該関数を用いて該物体の領域に関する情報を記述するする手順と、
を実行させるための物体領域情報記述プログラム。
前記相対位置データは前記基準フレームにおける前記複数の点と、前記他のフレームの前記基準フレームの複数の点に対応する点との差分ベクトルの成分であることを特徴とする請求項１４に記載の物体領域情報記述プログラム。
映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報記述プログラムであって、コンピュータに、
フレーム毎に前記任意の物体の領域を図形で近似する手順と、
フレーム毎に該図形を表す複数の代表点を抽出する手順と、
前記複数の代表点の位置を特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を関数で近似する手順と、
該関数、および前記図形または各々の前記代表点が見えている状態にあるフレーム区間、あるいは見えていない状態にあるフレーム区間を特定するフラグ情報を用いて該物体の領域に関する情報を記述するする手順と、
を実行させるための物体領域情報記述プログラム。
映像中における任意の物体の領域に関する情報を複数フレームに渡って記述するための物体領域情報記述プログラムであって、コンピュータに、
フレーム毎に前記任意の物体の領域を図形で近似する手順と、
フレーム毎に該図形を表す複数の代表点を抽出する手順と、
前記複数の代表点の位置を特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を関数で近似する手順と、
該関数、および前記図形が前記複数フレームにおいて存在した範囲を示す存在範囲情報を用いて該物体の領域に関する情報を記述するする手順と、
を実行させるための物体領域情報記述プログラム。
前記関数近似手順は、複数の代表点の位置データ、またはこれを特定可能な位置の次元を持つデータをフレームの進行に沿って並べたときの軌跡を所定の関数で近似し、
前記記述手段は、該近似図形が前記複数フレームにおいて存在した範囲を示す存在範囲近似図形を生成し、該関数、および該存在範囲近似図形を用いて該物体の領域に関する情報を記述することを特徴とする請求項１７に記載の物体領域情報記述プログラム。
複数フレームをその重複部分を重ねるようにして生成されるパノラマ画像中を推移する任意の物体の領域に関する情報を記述するための物体領域情報記述プログラムであって、コンピュータに、
前記パノラマ画像中の前記任意の物体の領域を図形で近似する手順と、
前記パノラマ画像中を推移する前記図形を表す複数の代表点を抽出する手順と、
前記複数の代表点の該パノラマ画像中における位置を特定可能なデータをフレームの進行に沿って並べることにより得られる軌跡を関数で近似する手順と、
該関数を用いて該物体の領域に関する情報を記述するする手順と、を実行させるための物体領域情報記述プログラム。
前記物体の領域に関する情報は、対象となる前記複数フレームのうちの先頭のフレーム及び最終のフレームを特定可能な情報と、該物体の領域を近似する図形を識別する情報とを含むことを特徴とする請求項１２乃至請求項１９のいずれか一項に記載の物体領域情報記述プログラム。
前記物体の領域に関する情報に、該物体に関連付けられている関連情報、または該関連情報のアドレスを示す情報を併せて記述することを特徴とする請求項１２乃至請求項２０のいずれか一項に記載の物体領域情報記述プログラム。
前記物体の領域に関する情報は前記関数のパラメータを用いて記述されることを特徴とする請求項１２乃至請求項２１のいずれか一項に記載の物体領域情報記述プログラム。