JP2000512410A - 参照モデルを用いて画像情報を索引付けをする方法 - Google Patents

参照モデルを用いて画像情報を索引付けをする方法

Info

Publication number
JP2000512410A
JP2000512410A JP10501891A JP50189198A JP2000512410A JP 2000512410 A JP2000512410 A JP 2000512410A JP 10501891 A JP10501891 A JP 10501891A JP 50189198 A JP50189198 A JP 50189198A JP 2000512410 A JP2000512410 A JP 2000512410A
Authority
JP
Japan
Prior art keywords
reference model
image
image frame
frame
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP10501891A
Other languages
English (en)
Inventor
イラニ,マイケル
ペレグ,サムエル
アナンダン,パドマナバン
Original Assignee
サーノフ コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サーノフ コーポレイション filed Critical サーノフ コーポレイション
Publication of JP2000512410A publication Critical patent/JP2000512410A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/786Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using motion, e.g. object motion or camera motion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Television Signal Processing For Recording (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 参照モデルに基づいてビデオシーケンスを索引付けする方法である。この方法を実現するシステムは、参照モデル(206)を生成するか或いは参照モデルを備えた画像プレプロセッサ(200)(任意)を含んでいる。そして、プレプロセッサ(200)には、特定のシーンからなる一連のフレームを含むビデオシーケンス等の入力画像データ(208)が提供される。プレプロセッサは、ビデオシーケンス内の画像を参照モデル(210)に整列させるための変換を実行する。そして、プレプロセッサは、変換結果、参照モデル、及び、画像データをハードディスクドライブ(212)等の大容量記憶装置に記憶する。その後に、システムは、ユーザインタフェースを介して、大容量記憶装置に記憶された情報にアクセスするのを可能にする。ユーザは、参照モデルを読み出してコンピュータ画面上に配置し、参照モデル(216)内の特定の点を選択し、参照モデル(220)内のその特定の点を含んだ全ての画像データを取り出すようにシステムに要求することができる。

Description

【発明の詳細な説明】 参照モデルを用いて画像情報を索引付けをする方法 本発明は、画像処理システムに関し、より詳細には、記憶媒体に存在する画像 情報を索引付け(indexing)する方法に関する。発明の背景 一般に、ビデオシーケンス等の画像情報は、ビデオシーケンスのユーザによる その後の再現(recall)及び利用のために、ディスクドライブ等の大容量記憶装 置内に記憶される。大容量記憶装置内のそのようなビデオシーケンスを索引付け するために、ヘッダが一般に使用され、個々のヘッダに関してビデオシーケンス の内容が識別される。従って、ユーザは、ヘッダ情報の全体にわたって文字列検 索を行い、関心ある情報を含んだ特定のビデオシーケンスを探し出す。その後、 再現されたビデオシーケンスに対してフレームごとの探索がなされ、そのビデオ シーケンス内の関心ある特定の情報をユーザが探し出すことが可能となる。従っ て、このような検索処理及び索引付けシステムは、時間と経費がかかるものであ る。 このように、この分野において、ビデオシーケンスに含まれるような画像情報 を索引付けする方法が必要とされており、その方法は、画像情報を効率的に再現 及び操作するように機能するものである。発明の概要 これまでの従来技術に関する問題は、参照モデルに基づいてビデオシーケンス を索引付けする本発明による方法によって解決される。より詳細には、この方法 が実現されたシステムは、与えられたビデオシーケンスの各フレームを参照モデ ルに関連づける。参照モデルは、例えば、ビデオシーケンスにおいて描写される シーンに対応した地図、シーン全体の画像、一連のビデオ画像からなるフレーム を整列してそれらの画像をそのシーンのパノラマ写真に組み合わせることによっ て構成されるモザイク、シーンの概略図、上述したもののいくつかを或いは全部 を集成したもの、等の2次元のフレームワークであってもよい。更に、参照モデ ルは、特定のシーンの計算機援用設計モデル等の3次元モデルであってもよい。 索引付けされるべきビデオシーケンスは、フレーム自体と参照モデルとの間の 座標変換に関する情報を全てのフレームが含むように前処理されなければならな い。フレーム自体と参照モデルにおける位置との間のそのような変換は、ビデオ フレーム又はグループからなるフレームにおいて見ることができるようなもので ある。「整列」としてもよく知られているこの前処理は、本発明によるシステム の一部として実現されてもよく、或いは、別の手段によって実行されてもよい。 情報が記憶されると、システムによって、ユーザインタフェースを介して、大 容量記憶装置に記憶された情報へのアクセスが可能になる。ユーザは、参照モデ ルを読み出してコンピュータ画面上に配置し、参照モデル内の特定の点を選択し 、参照モデル内のその特定の点を含んだ全てのビデオフレームを取り出すように システムに要求することができる。或いは、ユーザは、1つのビデオフレーム内 の特定の場所の点又は領域を選択してもよく、システムは、ビデオシーケンス内 にその位置を含んだ参照モデルの一部を提供する。続いて、ユーザは、参照モデ ル内のその特定の点又は領域を含んだ全ての他のビデオフレームを要求してもよ い。或いは、ユーザは、観察されるべき領域又はオブジェクトをそれの位置座標 によって選択してもよい。 更に、本発明によるシステムは、「総観的参照(synopsis reference)」の 形態によって動的な事象を静止画像情報から識別することによって、関心ある特 定の動的な事象を含んだビデオシーケンスの一部に直接にアクセスする方法を提 供する。総観的参照は、参照モデルに付加された事象の個々のスナップショット を有することによって、動的な事象を含んだ連続的に発生する画像情報を表現す る。ビデオシーケンスにおける総観的参照の例は、ビデオシーケンス内を動いて いるオブジェクトであり、それは、参照モデル上のオブジェクトの軌跡として見 える。図面の簡単な説明 添付の図面を参照して以下の詳細な説明を考察することによって、本発明の趣 旨を容易に理解することができる。 図1は、本発明のソフトウェア実施形態を含んだ汎用コンピュータシステムを 示す。 図2は、本発明のソフトウェア実施形態のフローチャートを示す。 図3は、ビデオシーケンスを参照モデルにマッピングする整列処理を説明する 概略図である。 図4は、総観的参照の利用を説明する概略図である。 図5は、画像索引付け処理のフローチャートである。 図6は、索引付け処理を説明する概略図である。 図7は、画像情報編集処理を説明する概略図である。 理解を容易にするために、図面を通して同一の構成要素は、可能な限り同一の 参照番号によって指示される。詳細な説明 図1は、参照モデルを用いて、例えばビデオシーケンスに含まれるような画像 情報を索引付けするためのシステム100のブロック構成図を示す。このシステ ムは、画像ソース102、コンピュータシステム104、1以上の出力装置10 6、及び、1以上の入力装置108を含む。画像ソース102は、ビデオカメラ 、赤外線カメラ、又は、シーンを表現する一連の2次元画像を生成する他のセン サであってもよい。或いは、画像ソースは、ビデオテープレコーダ、ディスクド ライブ、又は、シーンを表現する連続的な画像を記録する他の手段などの記憶装 置である。このシステムは、一般には、ディジタル画像を処理する。従って、画 像ソースがアナログ画像を提供する場合には、画像ソースとコンピュータシステ ムとの間にディジタイザ(図示しない)が使用される。 汎用コンピュータ104は、参照モデルを生成し、ビデオシーケンスを参照モ デルに対応付け、参照モデル或いはビデオシーケンス内のいかなる位置の画像情 報をも再現するように機能する。具体的には、コンピュータシステムは、データ バッファ110、中央処理装置(CPU)112、サポート回路114、ランダ ムアクセスメモリ(RAM)116、リードオンリメモリ(ROM)118、大 容量記憶装置119、及び、表示ドライブ120を含む。更に、ユーザは、キー ボード、マウス、トラックボール、タッチパッドなどの1以上の入力装置108 を介してコンピュータシステムと対話する。また、コンピュータシステムは画像 を表示し、様々なグラフィカルインタフェースはコンピュータモニタ等の出力表 示装置106上に画像を表示又は上映する。或いは、コンピュータシステムは、 プリンター等の別の出力表示装置と対話して、コンピュータモニタ上に現れるあ らゆる表示のハードコピーを提供してもよい。 データバッファ110は、画像ソースとCPUとの間のデータ転送速度を等し いものにする(フレームバッファリング)。通常、このバッファは、先入れ先出 し(FIFO)バッファである。このようなバッファは、通常、画像ソースによ って発生するデータ転送速度に柔軟性を持たせるとともに、CPUに一定のデー タ転送速度を提供するために使用される。 CPU112は、通常、汎用プロセッサである。本発明のソフトウェア実施形 態は、ある特定のプロセッサによって実現する必要はないので、本発明のルーチ ンは、並列処理コンピュータ環境において、どのような種類のプロセッサでも或 いはどのようなプロセッサの組み合わせでも実行することができる。 CPU112は、RAM116、ROM118、また、コプロセッサ、クロッ ク回路、キヤッシュ、電源及び他の既知の回路などのサポート回路114等の他 の様々な回路と連係して動作する。これらの様々なコンピュータ構成要素の動作 及び相互作用は、この分野において周知であり、更なる説明を必要としない。表 示ドライバ120は、出力装置106に必要なソフトウェア又はハードウェアの ビデオカードプリンタードライバ、或いは他の一般的なドライバであってもよい 。更に、大容量記憶装置は、ディスタドライブ又は他のなんらかのランダムアク セス可能な大容量記憶装置であってもよい。 RAM116は、本発明のソフトウェア実施形態を記憶する。通常、本発明の ルーチンは、大容量記憶装置119に記憶され、CPU112によって実行され るときに、一時的な記憶としてRAM116に読み込まれる。本発明は、索引付 けルーチン122として実装される。 図2は、索引付けルーチン122を示す。ルーチン122のおもな構成要素は 、プレプロセッサ200、ポストプロセッサ202、及び、アクセスマネージャ 204である。ポストプロセッサ202は、本発明のオプションとしての機能を 提供する。オプションとしてのプレプロセッサは、参照地図とも呼ばれる参照モ デルをメモリから生成又は再現することから始める。参照モデルは、ある特定の シーンの航空写真(aerial view)又は衛星画像(satellite view)等のシー ンの 完全な画像としてメモリから読み込まれてもよい。或いは、参照モデルは、建築 物又は他の幾何学的な形状のコンピュータ生成3次元概略図であってもよい。更 に、参照モデルは、特定のシーンを描写したパノラマ集成写真(panoramic mos aic)として継ぎ合わされた一連のビデオ画像から生成されてもよい。そのよう なパノラマ集成写真については、本明細書に援用されている1994年11月1 4日に出願された米国特許出願第08/339,491号明細書に説明されてい る。また、通常の地理学的な地図、又は、建築設計図及び建築見取り図、或いは 、他の形態の図表が、参照モデルとして使用されてもよい。 ステップ208において、画像データが、一連のビデオフレームとしてプレプ ロセッサに提供される。ステップ210において、ルーチンは、変換を実行して 、各フレームを参照モデル内の画像情報に整列させる。2次元の参照モデルを2 次元の画像フレームに整列させることのできるそのような変換は、2次元アフィ ン変換又は他のいかなる2次元パラメトリック変換であってもよい。ある場合に は、2次元変換は、シーンにおける例えば地表及び壁等のなにか平らな表面を整 列させるために十分なものであるかもしれないが、フレームの参照モデルへの整 列を改善するために、相対的なカメラ位置、或いは、全部又は一部のオプティカ ルフロー等の更なる情報が、画像点ごとに必要なこともある。 図3は、どのようにしてフレームが参照モデルに関連づけられるかを示す通常 の例である。ビデオフレーム3001、3002、3003、...300nからな る一連のフレーム300は、変換3021、3022、3023、...302nに よって参照モデル304にマッピングされる。フレーム3001の視野は、地図 304内の領域306である。フレーム3002の視野は、地図304内の領域 308であり、以下同様である。 図2に戻ると、ステップ212において、ビデオシーケンス内のビデオフレー ム、フレームを参照モデルに整列させるための変換(すなわち、変換パラメータ )、及び、参照モデルそのものが大容量記憶装置に記憶される。 ステップ214において、「総観的参照」が、ポストプロセッサ202におい てオプションとして参照モデルに付加され、その結果として、ビデオシーケンス 内の動いているオブジェクトが、参照モデル上の軌跡として現れる。総観的参照 は、参照モデル内における空間的な構造及び時間的な事象の両方として時間的な 事象を捕捉する。この総観的参照は、参照モデルに付加された事象の個々のスナ ップショットを有することによって、動的事象を含んだビデオシーケンスを表現 する。図4にその例が示され、ここでは、ビデオフレーム4001、4002、4 003、...400nが、それぞれ、動いているオブジェクト4021、4022 、4023、...402nを含む。オブジェクトは各フレームの異なる位置に現 れるが、それは同一のオブジェクトである。このルーチンは、ビデオフレームを 参照モデルに整列させることによって、各ビデオフレームの視野408において 捕捉されるような動いているオブジェクトに関しての全ての画像情報を含んだ総 観的参照を提供する。総観的参照404は軌跡406を含み、オブジェクトの軌 跡の図形的な投影を参照地図上に描写する。マークされた軌跡地図上の各点は、 時間的な情報、すなわち、動いているオブジェクトはいつその位置に存在したか の時刻、及び、その位置で見られたときのオブジェクトを提示するオリジナルフ レームの二次画像(sub-image)への参照を含んでもよい。総観的参照を提供す るための方法は、1995年6月20〜23日に開催されたFifthInternational Conference on Computer VisionにおけるIraniらによる「Mosaic Based R epresentations of Video Sequences and Their Applications(連続写真 地図によるビデオシーケンスの表現及びその応用)」の貞605〜611に説明 される。繰り返すと、総観的参照の準備は、後処理機能として構成されるものと 考えられる。すなわち、参照モデル及び画像データが整列された後であり、しか も、索引付け可能な画像情報のデータベースにアクセスを始める前である。 図2に示されるアクセスマネージャ204は、ステップ216において、関心 ある特定の画像をユーザが選択することを可能にするユーザインタフェースを提 供する。更に、索引付けされたフレーム及び/又は他の画像データをユーザに提 供するために、アクセスマネージャは、画像を索引付けする処理218及び出力 するためのステップ220を提供する。具体的には、ユーザは、ユーザインタフ ェースを介して、参照モデル内の特定の点又は領域を選択することができ、或い は、画像データすなわち入力ビデオシーケンスの特定のフレーム内の点又は領域 を選択することができる。そして、この情報は、参照モデル又は画像データのい ずれかを索引付けしてその特定の点又は領域を含む画像データの全てのフレーム を再現するのに使用される。或いは、ユーザが画像データのフレーム内にある点 又は領域をすでに選択していれば、出力されるのは、その点又は領域を含む参照 モデルの一部である。そして、ユーザは、その点又は領域を含む索引付けされた フレームを更に出力することを選択してもよい。図5は、アクセスマネージャが 画像データを索引付けする処理を詳細に示す。 図5は、本発明によるシステムにおいて画像データを索引付けするための処理 500の詳細フローチャートである。ステップ502において、参照モデルが概 略的に表示される。まず最初に、ユーザに対して、デフォルトの表示領域がコン ピュータ表示装置上に描画される。ステップ504において、その表示領域が操 作され、モデル内の様々な位置を観察できる。モデルが3次元モデルであれば、 視点が選択されてもよい。この表示操作処理は、ユーザが、モデル内の関心ある 領域を選択してしまうまで経路506に沿って反復される。 ステップ508において、ユーザは、参照モデル内の特定の点又は位置を選択 する。これは、参照モデル内の領域或いは特定の画像点或いは特定のオブジェク トであってもよい。例えば、参照モデルがアメリカ合衆国の航空写真による地図 であれば、ユーザは、マウスポインターを用いて参照モデル内の様々な領域をズ ームインすることによって、まず最初に、特定の州を選択し、それから、特定の 郡を選択し、そして、特定の町を選択し、特定の市街区域を選択し、最後に、特 定の市街番地を選択してもよい。そして、システムは、参照モデル内のその特定 の位置を含んだビデオの全てのフレームを再現する。或いは、参照モデル内の点 又は領域を選択する代わりに、ユーザは、画像内の特定の点又は領域を選択して もよく、そうすれば、システムは、選択された画像点又は領域に対応する参照モ デルの一部を提供する。これは、更に、この点又は領域を含む他の全てのビデオ フレームを再現するのに使用されてもよい。或いは、ユーザは、領域又はオブジ ェクトの位置座標によって、観察されるべきその領域又はオブジェクトを選択す ることもできる。そのような座標は、GPSユニット又は他の手段による一般的 な地図又はコンピュータ化された地図から供給されてもよい。 そして、インタフェース表示装置を介して、ユーザは、これらのフレームに注 釈を付けるか(ステップ510)、これらのフレームを編集するか(ステップ5 12)、それとも、これらのフレームを表示画面上にただ単に表示するだけか( ステップ514)を選択することができる。そのような選択は、一般には、メニ ュー方式の選択処理である。ステップ510において、ユーザは、画面上に描画 されたフレームに注釈を付加してもよい。そして、ステップ516において、注 釈がモデルに関連づけて保存される。或いは、ステップ512において、ユーザ は、画面上に現れているフレームを編集してもよい。そして、ステップ518に おいて、その変更がモデルに関連づけて記憶される。ステップ514においては 、フレームは、画面上にただ単に表示されるだけであり、編集することも注釈を 付けることもなされない。 図6は、選択処理508の概略図を示す。ビデオフレーム600と参照モデル 602との間の関係が示される。その後に、参照モデル内の特定の位置650が ユーザによって選択される。図示される例においては、参照モデル内のその特定 の点は3つのビデオフレームに対応し、それらは、フレーム6001、6002、 及び、6003である。このように、本発明によるシステムは、各フレーム内に おいて関心ある点を提示するこれらの3つのフレームをフレーム660として表 示する。 関心ある点の人手による選択に加えて、このシステムは、良く知られたどのよ うな自動選択方法によっても動作することができる。例えば、システムは、画像 から得られる特徴、テクスチャ、色及び他の外観に関しての特性、幾何学的な形 状又は他の得ることのできる画像又は記号を表現する属性、付随するデータなど に基づいて画像におけるオブジェクトを探索する良く知られた方法によって動作 することができる。これらの探索技術は、単一のビデオフレーム又は参照モデル における関心あるオブジェクトの画素位置を識別すると考えられる。このように して選択された点が、選択された点を見ることのできるビデオの続きを表示する のに使用される。 動的な事象へのアクセスについては、総観的参照は、動的な事象全体のスナッ プショット写真(snapshot view)を提供するので、時間的な事象に基づいた索 引付けに使用することができる。例えば、オブジェクトの動きが、参照モデルに おける軌跡として表現されるならば、時間的な事象は、軌跡のある区間を痕跡と して残す空間的な事象に変換されてしまう。従って、それは、その時間間隔にお ける全てのフレームを表示することを可能にする時間間隔を表現することに等し い。従って、それらのフレームが再現されてユーザに表示され、ビデオシーケン ス又はビデオクリップとして関心ある事象を提示する。 例えば、航空画像に家を付加するなどのオブジェクトの挿入又はテキストラベ ルの挿入等の参照モデルの編集又は参照モデルへの注釈付けは、参照モデルに直 接になされてもよく、或いは、単一のフレームだけを編集し或いは単一のフレー ムだけに注釈を付けることによってなされてもよい。1つのフレームを編集し或 いは1つのフレームだけに注釈を付ける場合には、システムは、これを参照モデ ルにおける変更に変換する。注釈が付けられた個所或いは編集された個所を見る ことができるフレームが表示されている間に、この変更又は注釈が、表示された フレームに整列されて付加されてもよい。図7は、注釈を付ける処理の概略図を 示す。編集は、ビデオフレームと参照モデル702との間の適切な幾何学的変換 を考慮することによって実現される。参照モデルの全体にオブジェクトを挿入す ることは、オペレータにとって、個々のフレームごとにオブジェクトを挿入する よりもずっと楽である。オブジェクト704は、参照モデル自体に挿入されても よく、或いは、参照モデル702に変換されるビデオフレーム700の中の1つ に挿入されてもよい。このように、挿入されるオブジェクトの位置に対応した関 連するフレームが選択された後、編集処理によって、ユーザは、参照地図又はビ デオフレームを編集することができる。フレームと参照モデルとの間の変換を用 いて、オブジェクトが挿入されるべき領域を含む選択されたフレーム706及び 708のそれぞれにこのオブジェクトを次々に挿入してもよい。オブジェクトの 挿入は再生中になされ、画像自体は変更されない。これは、必要であれば、注釈 のないオリジナルの画像を表示することを可能にする。このように、オブジェク トがフレームの1つに挿入される場合、そのオブジェクトは、編集されたフレー ムと参照モデルとの間の変換、及び、別のフレームと参照モデルとの間の変換を 用いて別のフレームに挿入される。 参照モデルを地理学的な地図に整列させれば、個々のビデオフレームを参照モ デルに関連づける変換によって、入力ビデオシーケンスの各フレームにおける各 画素の地理学的な座標を得ることができる。これは、画像から参照モデルへの変 換及び参照モデルから地図への変換の組み合わせを含む。 ここで、本発明の趣旨を取り入れた様々な実施の形態が図示され詳細に説明さ れたが、当業者は、本発明の趣旨を備えた多くの別の変形した実施の形態を容易 に工夫することができる。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 アナンダン,パドマナバン アメリカ合衆国 ニュー ジャージー州 ローレンスヴィル カーヴァー プレイス ビー―2

Claims (1)

  1. 【特許請求の範囲】 1.整列を定めた変換パラメータを用いて参照モデルに対して整列された複数の 画像フレームである画像情報を、索引付けする方法であって、 前記参照モデル内の位置を選択するステップと、 前記変換パラメータを用いて選択された位置を含む特定の画像フレームを前記 複数の画像フレームの中から決定するステップと、 選択された位置を含む前記特定の画像フレームを出力するステップと、 を備えた方法。 2.前記参照モデルを提供するステップと、 前記複数の画像フレームを提供するステップと、 前記複数の画像フレームの中の各画像フレームに対する一組の変換パラメータ を結果として得ることのできる変換を用いて、前記複数の画像フレームの中の各 画像フレームを前記参照モデルに整列させるステップと、 前記参照モデル、前記複数の画像フレーム、及び、前記変換パラメータを記憶 するステップと、 を更に備えた請求項1に記載の方法。 3.注釈を有する少なくとも1つの前記特定の画像フレームに注釈を付けるステ ップと、 前記参照モデル及び前記注釈を有する前記特定の画像フレームを更新するステ ップと、 を更に備えた請求項1に記載の方法。 4.変更を有する少なくとも1つの前記特定の画像フレームを編集するステップ と、 前記変更を有する前記特定の画像フレーム及び前記参照モデルを更新するステ ップと、 を更に備えた請求項1に記載の方法。 5.前記参照モデルの総観的参照を前記複数の画像フレームから提供するステッ プを更に備えた請求項1に記載の方法。 6.整列を定めた変換パラメータを用いて参照モデルに整列された複数の画像フ レームである画像情報を、索引付けする方法であって、 前記複数の画像フレームの中の1つのフレーム内の位置を選択するステップと 、 前記1つのフレームを参照モデルに整列させる前記変換パラメータを用いて、 前記選択された位置を含む前記参照モデルの領域を決定するステップと、 前記変換パラメータを用いて、選択された位置を含む特定の画像フレームを前 記複数の画像フレームの中から決定するステップと、 選択された位置を含む前記特定の画像フレームを出力するステップと、 を備えた方法。 7.前記参照モデルを提供するステップと、 前記複数の画像フレームを提供するステップと、 前記複数の画像フレームの中の各画像フレームに対する一組の変換パラメータ を結果として得ることのできる変換を用いて、前記複数の画像フレームの中の各 画像フレームを前記参照モデルに整列させるステップと、 前記参照モデル、前記複数の画像フレーム、及び、前記変換パラメータを記憶 するステップと、 を更に備えた請求項6に記載の方法。 8.注釈を有する少なくとも1つの前記特定の画像フレームに注釈を付けるステ ップと、 前記参照モデル及び前記注釈を有する前記特定の画像フレームを更新するステ ップと、 を更に備えた請求項6に記載の方法。 9.変更を有する少なくとも1つの前記特定の画像フレームを編集するステップ と、 前記参照モデル及び前記変更を有する前記特定の画像フレームを更新するステ ップと、 を更に備えた請求項6に記載の方法。 10.前記参照モデルの総観的参照を前記複数の画像フレームから提供するステ ップを更に備えた請求項6に記載の方法。 11.画像情報を索引付けする方法であって、 参照モデルを提供するステップと、 複数の画像フレームを提供するステップと、 前記複数の画像フレームの中の各画像フレームに対する一組の変換パラメータ を結果として得ることのできる変換を用いて、前記複数の画像フレームの中の各 画像フレームを前記参照モデルに整列させるステップと、 前記参照モデル、前記複数の画像フレーム、及び、前記変換パラメータを記憶 するステップと、 前記参照モデル内又は1つの前記画像フレーム内の位置を選択するステップと 、 前記変換パラメータを用いて、選択された位置を含む特定の画像フレームを前 記複数の画像フレームの中から決定するステップと、 選択された位置を含む前記特定の画像フレームを出力するステップと、 を備えた方法。 12.注釈を有する少なくとも1つの前記特定の画像フレームに注釈を付けるス テップと、 前記注釈を有する前記特定の画像フレーム及び前記参照モデルを更新するステ ップと、 を更に備えた請求項11に記載の方法。 13.変更を有する少なくとも1つの前記特定の画像フレームを編集するステッ プと、 前記参照モデル及び前記変更を有する前記特定の画像フレームを更新するステ ップと、 を更に備えた請求項11に記載の方法。 14.前記参照モデルの総観的参照を前記複数の画像フレームから提供するステ ップを更に備えた請求項11に記載の方法。
JP10501891A 1996-06-14 1997-06-16 参照モデルを用いて画像情報を索引付けをする方法 Ceased JP2000512410A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/663,582 1996-06-14
US08/663,582 US5768447A (en) 1996-06-14 1996-06-14 Method for indexing image information using a reference model
PCT/US1997/010534 WO1997048068A1 (en) 1996-06-14 1997-06-16 Method for indexing image information using a reference model

Publications (1)

Publication Number Publication Date
JP2000512410A true JP2000512410A (ja) 2000-09-19

Family

ID=24662453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10501891A Ceased JP2000512410A (ja) 1996-06-14 1997-06-16 参照モデルを用いて画像情報を索引付けをする方法

Country Status (4)

Country Link
US (1) US5768447A (ja)
EP (1) EP0979484A4 (ja)
JP (1) JP2000512410A (ja)
WO (1) WO1997048068A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217713A (ja) * 2007-03-07 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> 映像検索方法及び装置及びプログラム

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5883670A (en) 1996-08-02 1999-03-16 Avid Technology, Inc. Motion video processing circuit for capture playback and manipulation of digital motion video information on a computer
USRE38401E1 (en) * 1997-01-16 2004-01-27 Obvious Technology, Inc. Interactive video icon with designated viewing position
US6532036B1 (en) * 1997-01-30 2003-03-11 Yissum Research Development Company Of The Hebrew University Of Jerusalem Generalized panoramic mosaic
US6167083A (en) * 1997-04-04 2000-12-26 Avid Technology, Inc. Computer system and process for capture editing and playback of motion video compressed using interframe and intraframe techniques
US6105083A (en) 1997-06-20 2000-08-15 Avid Technology, Inc. Apparatus and method for controlling transfer of data between and processing of data by interconnected data processing elements
JP3535724B2 (ja) * 1997-12-25 2004-06-07 キヤノン株式会社 画像撮像装置およびその方法、並びに記憶媒体
US6522325B1 (en) * 1998-04-02 2003-02-18 Kewazinga Corp. Navigable telepresence method and system utilizing an array of cameras
US6192393B1 (en) * 1998-04-07 2001-02-20 Mgi Software Corporation Method and system for panorama viewing
US6816184B1 (en) * 1998-04-30 2004-11-09 Texas Instruments Incorporated Method and apparatus for mapping a location from a video image to a map
US6665003B1 (en) 1998-09-17 2003-12-16 Issum Research Development Company Of The Hebrew University Of Jerusalem System and method for generating and displaying panoramic images and movies
JP3614709B2 (ja) * 1999-05-20 2005-01-26 日本電信電話株式会社 景観画像インデクス方法、装置および景観画像インデクスプログラムを記録した記録媒体
US6795109B2 (en) 1999-09-16 2004-09-21 Yissum Research Development Company Of The Hebrew University Of Jerusalem Stereo panoramic camera arrangements for recording panoramic images useful in a stereo panoramic image pair
US7020351B1 (en) * 1999-10-08 2006-03-28 Sarnoff Corporation Method and apparatus for enhancing and indexing video and audio signals
WO2001028238A2 (en) * 1999-10-08 2001-04-19 Sarnoff Corporation Method and apparatus for enhancing and indexing video and audio signals
US6754389B1 (en) 1999-12-01 2004-06-22 Koninklijke Philips Electronics N.V. Program classification using object tracking
US6693959B1 (en) * 2000-03-03 2004-02-17 Ati International Srl Method and apparatus for indexing and locating key frames in streaming and variable-frame-length data
US7043157B2 (en) * 2000-03-31 2006-05-09 Eastman Kodak Company Index prints for photofinishing services
US6826292B1 (en) 2000-06-23 2004-11-30 Sarnoff Corporation Method and apparatus for tracking moving objects in a sequence of two-dimensional images using a dynamic layered representation
US20020071651A1 (en) * 2000-08-31 2002-06-13 Wurz William Hastings Method of indexing and printing user specified frames during playback or contemporaneous video recording
US6882891B2 (en) * 2000-12-06 2005-04-19 Microsoft Corporation Methods and systems for mixing digital audio signals
US7287226B2 (en) * 2000-12-06 2007-10-23 Microsoft Corporation Methods and systems for effecting video transitions represented by bitmaps
US6774919B2 (en) * 2000-12-06 2004-08-10 Microsoft Corporation Interface and related methods for reducing source accesses in a development system
US7447754B2 (en) * 2000-12-06 2008-11-04 Microsoft Corporation Methods and systems for processing multi-media editing projects
US6983466B2 (en) * 2000-12-06 2006-01-03 Microsoft Corporation Multimedia project processing systems and multimedia project processing matrix systems
US6912717B2 (en) * 2000-12-06 2005-06-28 Microsoft Corporation Methods and systems for implementing dynamic properties on objects that support only static properties
US6959438B2 (en) * 2000-12-06 2005-10-25 Microsoft Corporation Interface and related methods for dynamically generating a filter graph in a development system
US7103677B2 (en) * 2000-12-06 2006-09-05 Microsoft Corporation Methods and systems for efficiently processing compressed and uncompressed media content
US7620622B1 (en) * 2001-03-08 2009-11-17 Yahoo! Inc. Method and system for indexing information and providing results for a search including objects having predetermined attributes
US20040027365A1 (en) * 2002-08-07 2004-02-12 Sayers Craig P. Controlling playback of a temporal stream with a user interface device
JP3744002B2 (ja) * 2002-10-04 2006-02-08 ソニー株式会社 表示装置、撮像装置、および撮像/表示システム
US7082572B2 (en) * 2002-12-30 2006-07-25 The Board Of Trustees Of The Leland Stanford Junior University Methods and apparatus for interactive map-based analysis of digital video content
JP2005303566A (ja) * 2004-04-09 2005-10-27 Tama Tlo Kk ブロック分割領域における動きベクトルの分布を利用した特定シーン抽出方法及び装置
US8949235B2 (en) * 2005-11-15 2015-02-03 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Methods and systems for producing a video synopsis using clustering
JP4972095B2 (ja) * 2005-11-15 2012-07-11 イッサム リサーチ ディベロップメント カンパニー オブ ザ ヘブライ ユニバーシティー オブ エルサレム 映像概要を生成する方法およびシステム
KR101187787B1 (ko) * 2006-02-18 2012-10-05 삼성전자주식회사 키 프레임을 이용하여 동영상을 검색하는 방법 및 장치
JP2009077363A (ja) * 2007-08-24 2009-04-09 Sony Corp 画像処理装置、動画再生装置、これらにおける処理方法およびプログラム
US8522143B2 (en) * 2008-05-05 2013-08-27 Microsoft Corporation Scene-granular geographical-based video footage visualizations
TW201004339A (en) * 2008-07-09 2010-01-16 Univ Nat Taiwan Method and system for processing synthetic graphic images on digital video file
CN103220974A (zh) * 2010-07-21 2013-07-24 阿敏·E·莫尔勒 图像报告方法
CN105847825A (zh) * 2015-01-16 2016-08-10 杭州海康威视数字技术股份有限公司 视频编码码流的编码、索引存储和访问方法及相应装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60196856A (ja) * 1984-03-20 1985-10-05 Olympus Optical Co Ltd 画像検索登録装置
DE69028643T2 (de) * 1989-02-09 1997-02-20 Canon Kk Elektronisches Dateispeicherungssystem und Methode zum Auslesen von Bilddateninformation
EP0526064B1 (en) * 1991-08-02 1997-09-10 The Grass Valley Group, Inc. Video editing system operator interface for visualization and interactive control of video material
JP3234064B2 (ja) * 1993-09-02 2001-12-04 キヤノン株式会社 画像検索方法並びにその装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217713A (ja) * 2007-03-07 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> 映像検索方法及び装置及びプログラム

Also Published As

Publication number Publication date
US5768447A (en) 1998-06-16
EP0979484A1 (en) 2000-02-16
EP0979484A4 (en) 2003-10-08
WO1997048068A1 (en) 1997-12-18

Similar Documents

Publication Publication Date Title
JP2000512410A (ja) 参照モデルを用いて画像情報を索引付けをする方法
US7110592B2 (en) Image recording apparatus, image reproducing apparatus and methods therefor
US9361943B2 (en) System and method for tagging objects in a panoramic video and associating functions and indexing panoramic images with same
US9443555B2 (en) Multi-stage production pipeline system
JP5053404B2 (ja) 関連メタデータに基づくデジタル画像のキャプチャと表示
US7583265B2 (en) Image display method and device, image display system, server, program, and recording medium
AU650179B2 (en) A compositer interface for arranging the components of special effects for a motion picture production
JP3021556B2 (ja) 映像情報処理装置とその方法
US6972757B2 (en) Pseudo 3-D space representation system, pseudo 3-D space constructing system, game system and electronic map providing system
AU2009257959B2 (en) 3D content aggregation built into devices
Tompkin et al. Videoscapes: exploring sparse, unstructured video collections
US8719687B2 (en) Method for summarizing video and displaying the summary in three-dimensional scenes
EP2405349A1 (en) Apparatus and method for providing augmented reality through generation of a virtual marker
CN101729781A (zh) 显示控制设备、显示控制方法和程序
Maiwald et al. Geo-information technologies for a multimodal access on historical photographs and maps for research and communication in urban history
Zhang et al. Annotating and navigating tourist videos
JP3200819B2 (ja) 画像表示方法
Ponto et al. Effective replays and summarization of virtual experiences
Chagnaud et al. Visualization of documented 3D cities
JP2001036840A (ja) 電子地図を用いた撮影画像管理方法及び撮影画像再生方法及びそれらの装置
JP5612457B2 (ja) 動画像表示装置と動画像オブジェクト探索システムと動画像表示方法とプログラム
Kim et al. The interactive geographic video
JP2020119368A (ja) 映像情報管理システムおよび映像情報管理方法
US20240171719A1 (en) Rendering an Immersive Experience
Akutsu et al. Videostyler: Multi-dimensional video computing for eloquent media interface

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070220

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070517

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070702

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070620

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070730

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070718

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070827

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20071003

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080115