WO2006103744A1 - 映像管理システム - Google Patents

映像管理システム Download PDF

Info

Publication number
WO2006103744A1
WO2006103744A1 PCT/JP2005/005907 JP2005005907W WO2006103744A1 WO 2006103744 A1 WO2006103744 A1 WO 2006103744A1 JP 2005005907 W JP2005005907 W JP 2005005907W WO 2006103744 A1 WO2006103744 A1 WO 2006103744A1
Authority
WO
WIPO (PCT)
Prior art keywords
mbr
size
video
tree
subject
Prior art date
Application number
PCT/JP2005/005907
Other languages
English (en)
French (fr)
Inventor
Seiya Shimizu
Asako Kitaura
Motoo Masui
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to JP2007510272A priority Critical patent/JP4601666B2/ja
Priority to PCT/JP2005/005907 priority patent/WO2006103744A1/ja
Priority to EP05727849A priority patent/EP1871105A4/en
Publication of WO2006103744A1 publication Critical patent/WO2006103744A1/ja
Priority to US11/905,384 priority patent/US20080088627A1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7335Graphical querying, e.g. query-by-region, query-by-sketch, query-by-trajectory, GUIs for designating a person/face/object as a query predicate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Definitions

  • Patent Document 1 Japanese Patent Laid-Open No. 11-282851
  • the calculation means of the video management system calculates an MBR corresponding to a plurality of size orders for each of a plurality of videos to be managed,
  • the management means includes
  • the present invention includes a view volume indicating a range in a real space to be captured corresponding to each of a plurality of size orders calculated based on data indicating a shooting position and a shooting direction of a video.
  • Storage means for storing data indicating each circumscribed rectangle (MBR) to be stored as data indicating the imaging range of the video to be managed;
  • FIG. 19 is a diagram showing a display example of a search result display screen.
  • the following configuration can be adopted for managing data D3 (view volume and MBR: metadata for video search).
  • a representative subject size order (representative order) is defined for video data, and a tree index of the video data is created using the MBR calculated for this representative order.
  • the representative order is one order that can be arbitrarily selected from a plurality of order forces defined for video data.
  • the MBR value of each order node is calculated. That is, as shown in Fig. 3, the view volume and MBR corresponding to a plurality of pre-defined orders (excluding representative orders) are calculated for the lowest nodes (N3-1 to N3-6). Is done.
  • the MBR value including all the MBRs of 10 m "and the MBR value including all the MBRs of the order" 100 m "included in the nodes N3-1 to N3-3 are calculated.
  • the calculated three MBR values are stored in node N2-1.
  • the sensor 13 detects the zoom of the camera 11 and records an angle of view sensor 133 that records the angle of view at the time of shooting, and a subject distance measurement sensor 134 that measures the distance from the shooting position of the camera 11 to the subject. And the like. In this case, it can be configured to be recorded in the measurement result force data D2 of the angle of view sensor 133 and the subject distance measurement sensor 134.
  • real-time transmission by streaming or the like can be applied.
  • Formula 1.4 is the formula for calculating the vertex ⁇ of the view volume.
  • the processing by the video management server 61 described above is realized by executing a program stored in a processor power memory included in the computer in a computer that realizes the video management server 61.
  • R-tree and R * -tree are disclosed in the following documents.
  • Figure 14 shows the result of applying an algorithm such as R-tree to the MBR of the representative order. It is a figure which shows the example of the formed tree index.
  • R-tree is used, only the first array element of MBR (MBR of representative order) has been calculated at the time of tree index creation.
  • the metadata MBR is copied to the leaf entry MBR (FIG. 15: [1]).
  • the ORR area of the MBR of the leaf entry (the MBR value including the lower MBR (data indicating MBR) is stored as the MBR value of the upper node entry (Fig. 15: [2]).
  • the MBR OR area (MBR value including the lower MBR) is stored as the MBR value of the upper node entry ( Figure 15: [3])
  • the process in [3] is repeatedly executed up to the root node. .
  • the query for video search needs the subject size and the representative point position (coordinate value) of the subject.
  • the subject size is a numerical value indicating a size of the subject to be searched.
  • the subject size is a scale determined according to the subject. For example, when the subject is a high-rise building, the height of the building is determined as the subject size. When the subject is a car, for example, the total length of the car is determined as the subject size.
  • the search is performed by searching the index tree from the root to the leaf.
  • the video search terminal 2 can be realized by a PC and a Web browser. Alternatively, the video search terminal 2 can be realized by dedicated software or a dedicated terminal.
  • a video playback request is given from the video collection terminal 2 to the video distribution server 62 through the network 5, and the video distribution server 62 reads the video data corresponding to the playback request from the video storage 81, and stream data. Is given to the video search terminal 2.
  • Video playback software plays back video using the received stream data.
  • the operation management terminal 3 shown in FIG. 5 accesses the subject DB 72 and subject information storage 83, the map DB 73, and the map information storage 84, and manages subject information and map information.

Abstract

 映像管理システムは、映像の撮影位置と撮影方向と示すデータに基づいて、撮影される実空間上の範囲を示すビューボリュームを包含する外接四角形(MBR)を、複数のサイズオーダの夫々について算出する算出部と、前記算出部によって算出された複数のサイズオーダに夫々対応するMBRを示すデータを、管理対象の映像の撮影範囲を示すデータとして記憶装置に格納する管理部とを備える。

Description

明 細 書
映像管理システム
技術分野
[0001] 本発明は、蓄積された大量の映像データの中から、特定の被写体が撮影されてい る映像区間を検索するための技術に関する。
背景技術
[0002] 蓄積された大量の映像データ力 特定の被写体映像を抽出する方法として、幾つ カゝの発明が提案されている。例えば、特許文献 1に開示された「映像検索装置及び 映像検索システム」がある。
[0003] 撮影時にカメラパラメータ (画角等)と、カメラ位置座標 (緯度、経度)と、光軸方向 (パ ン,ティルト,ョー)と力 フレーム毎の時系列メタデータとして記録される。カメラパラメ →,位置座標及び光軸方向の情報から、映像を撮影したときのビューボリューム (撮 影空間)を算出することができる。
[0004] ビューボリュームは、図 20に示すように、例えば、 XY平面 (水平面)において、カメラ の撮影位置に対する近接面及び遠方面を示す直線と、カメラの水平画角を規定する 各直線とで囲まれた台形の領域として規定することができる。ビューボリュームは三角 形の領域として規定されることもある。
[0005] 検索すべき被写体の位置がビューボリューム内にある力否かを判定することによつ て、映像内に被写体が撮影されている力否かを判定することができる。この判断はフ レーム毎に行うことができる。
[0006] 判定処理が 1フレーム毎に実行される場合には、検索コスト (検索時間, CPU負荷, メモリ容量等)が高くなる。このため、検索システムが実装される場合には、複数の映 像サブ集合 (ショット,ファイル等)毎にビューボリュームの MBR (外接四角形: Minimum Bounding Region)力予め十算 れる。
[0007] 即ち、図 21の上側に示すように、例えば、複数のショットが映像サブデータとして存 在する場合には、各ショットのビューボリュームに対する外接四角形 (MBR:Minimum Bounding Region)が計算される。図 21に示す例では、 6つの映像サブデータ (ショット) があり、各映像サブデータに対するビューボリューム及び MBRが規定されている。
[0008] さらに、映像データ全体を包含する MBRとして、各映像サブデータの MBRを包含 する MBR (映像サブ集合の MBR)を規定することができる。この場合、映像の検索時 において、映像サブ集合の MBR内に被写体位置が存在しているカゝ否かが判断され る。映像サブ集合の MBR内に被写体位置が存在しない場合には、その映像サブ集 合に対する検索処理は実行されない。これによつて、検索コストの低減を図ることが できる。
[0009] 映像サブ集合及びその MBRは、そのままの状態でデータベースにに格納 (例えば テーブルに格納)される。或いは、映像サブ集合及びその MBRにインデックスが付与 され、 R— treeなどを用いたツリー構造で、階層的なデータ管理が行われる。例えば 、図 21の下側に示すように、映像サブ集合の MBRをルートとして、これに含まれる映 像サブデータの MBRがその位置に応じて分割され (ツリーの中段のノード参照)、最 下位のノードとして、映像サブデータの MBRが格納される。
[0010] ツリーインデックスを用いた階層構造が採用される場合には、データの検索コストが データ数 Nに対して 0(log(N》となる。このコストは、階層構造が採用されない場合の コスト O(N)よりも効率が良い。但し、データの追加 Z削除が行われる毎に、ツリーイン デッタスの構造を作り直す必要がある。このため、データ管理コストが上昇する傾向を 持つ。
[0011] ビューボリュームを基本とする映像検索では、ビューボリューム及び MBRが小さい 程、検索対象の絞り込みが容易となる。このため、ビューボリュームの遠方面を検索 対象とする被写体サイズに合わせてビューボリューム及び検索対象を最小にする必 要がある。
[0012] 例えば、遠方面が例えば撮影位置から 10km先に設定された場合において、自動 車 (数 mのサイズを持つ)が被写体 (検索対象)として検索される場合を想定する。この 場合、遠方面における自動車は 1ピクセル以下で存在することになる。従って、この 遠方面上の自動車の映像は、検索結果として抽出する価値を持たない。しかし、遠 方面の設定条件下において、当該映像は検索結果の一つに含まれる。従って、検 索結果に含まれる映像が増大する。数 mのサイズ有する自動車のような物体は、例 えば lkm以下の遠方面の適用が適当である。
[0013] これに対し、遠方面が近くに設定されると、遠方面以遠の被写体は、実際に映像中 に含まれていても、検索においてヒットしなくなってしまう。
[0014] 例えば、ランドマークとなるような高層ビルや山などは、映像中にぉ 、て撮影位置か ら数 km〜数十 km先に存在していても、その存在を映像で確認することができる。こ のとき、遠方面が lkm以下に設定されていると、その高層ビルや山などはビューボリ ユームに含まれないと判断され、検索結果力 漏れてしまう (図 22参照)。
[0015] このため、従来における映像検索では、以下の二つの対策を二者択一的に選択し ていた。
(1)検索対象のサイズを仮定して、仮定した被写体サイズに対応するビューボリューム でシステムを構築する。
(2)検索コストの増大を許容して大きめのビューボリュームを採用して検索漏れをなく す。
[0016] 従って、従来技術では、被写体サイズに対して柔軟な映像検索ができな 、と 、う問 題点があった。
特許文献 1:特開平 11― 282851号公報
特許文献 2 :特開平 9 259130号公報
発明の開示
発明が解決しょうとする課題
[0017] 本発明の目的の一つは、適正なコストで特定の被写体が撮影されている映像を検 索することができる技術を提供することである。
[0018] また、本発明の目的の一つは、特定の被写体が撮影されている映像をもれなく抽 出することを可能とする技術を提供することである。
課題を解決するための手段
[0019] 本発明は、上記目的を達成するため以下の構成を採用する。
[0020] すなわち、本発明は、映像の撮影位置と撮影方向と示すデータに基づいて、撮影 される実空間上の範囲を示すビューボリュームを包含する外接四角形 (MBR)を、複 数のサイズオーダの夫々について算出する算出手段と、 前記算出手段によって算出された複数のサイズオーダに夫々対応する MBRを示 すデータを、映像の撮影範囲を示すデータとして記憶装置に格納する管理手段と を備える映像管理システムである。
[0021] 本発明において、映像は、静止画及び動画を含む。動画は、複数の映像区間 (フレ ーム)から構成される。
[0022] 本発明によれば、複数のサイズオーダに対応する MBRが撮影範囲を示すデータと して記憶装置に格納される。このため、映像の検索時において、被写体のサイズに 基づき、被写体が適正なサイズで撮影されて ヽると認められる MBRのみを検索すれ ば、検索のコストを低減することができる。
[0023] 好ましくは、本発明による映像管理システムにおける前記算出手段は、特定サイズ の被写体が一定画素サイズ以上 (例えば一画素サイズ以上)、一定画素数以上、及 び一定画素サイズ又は画素数以上且つ一定画角以上のいずれかで撮影される範囲 のビューボリュームを算出する。このようにすれば、利用価値の高い被写体の映像を 含む映像の撮影範囲を規定するデータを作成することができる。
[0024] 好ましくは、本発明による映像管理システムにおける前記算出手段は、被写体サイ ズに応じて予め規定された複数のサイズオーダに夫々対応するビューボリュームの MBRを算出する。
[0025] 好ましくは、本発明による映像管理システムは、被写体の位置及びサイズが入力さ れた場合に、前記被写体のサイズよりも大きく且つ最小のサイズオーダに対応する M BRを特定し、特定した MBRに前記被写体の位置が含まれて 、る力否かを判定する 検索手段をさらに備える。
[0026] このようにすれば、被写体が適正なサイズで撮影されて 、ると認められる MBRのみ を対象として、被写体の位置が含まれているか否かが判定される。これによつて、検 索コストを抑えることができる。また、被写体が適正なサイズで撮影されていると認め られる MBRが特定されることで、検索漏れを防止することができる。
[0027] 好ましくは、本発明による映像管理システムの前記算出手段は、管理対象の複数 の映像に対して共通な代表サイズオーダのビューボリュームの MBRを算出するととも に、各映像に対して規定された複数のサイズオーダに夫々応じたビューボリュームの MBRを算出し、
前記管理手段は、
前記代表サイズオーダに対応する MBRで前記複数の映像を階層的に管理する ためのツリー構造を決定し、
前記ツリー構造を用いて、前記ツリー中の各最下位ノードに前記算出手段で算出 された前記複数の映像の一つに対する前記代表サイズオーダ及び前記複数のサイ ズオーダに応じた各 MBRを示すデータが格納され、前記ツリー中の下位ノードを有 する各ノードに該ノードが有する全ての下位ノードに夫々格納された前記代表サイズ オーダ及び前記複数のサイズオーダに応じた各 MBRを示すデータで特定される各 MBRを夫々包含するサイズオーダ毎の MBRを示すデータが格納されたツリーを作 成し、このツリーを記憶装置に格納する。
[0028] このようにすれば、複数のサイズオーダに応じた複数の MBRを効率的に管理する ことができる。代表サイズオーダは、複数のサイズオーダの一つであっても良ぐ映像 に対して規定された複数のサイズオーダとは別に用意されるものであっても良い。
[0029] また、このような構成を採用すれば、映像の追加 Z削除にぉ 、て、代表サイズォー ダの MBRに係るツリーの改変処理を行えば良いことになる。このため、映像の追カロ /削除に係るツリーの管理コストの低減を図ることができる。
[0030] 好ましくは、本発明による映像管理システムは、任意の被写体の位置及びサイズが 与えられた時に、前記ツリーについて用意されたサイズオーダの中から、前記被写体 のサイズより大きく且つ最小のサイズオーダに応じた MBRを検索 MBRとして決定し 、前記被写体の位置を含む検索 MBRを前記ツリーのルートノードから順にたどり、前 記ツリーの最下位ノードで検索される前記被写体の位置を含む検索 MBRに対応す る映像に係る情報を、映像検索結果の一つとして抽出する検索手段をさらに備える。
[0031] このようにすれば、代表サイズオーダを含む複数のサイズオーダの MBR中に、検 索対象の被写体を含まな 、MBRがあったとしても、被写体を含むと考えられる MBR が特定され、検索される。これによつて、検索漏れを防ぐことができる。
[0032] 好ましくは、本発明による映像管理システムの前記算出手段は、管理対象の複数 の映像の夫々について複数のサイズオーダに応じた MBRを夫々算出し、 前記管理手段は、
前記各サイズオーダに応じた MBRで前記複数の映像を階層的に管理するため のッリ一構造を前記サイズオーダ毎に決定し、
ツリー中の最下位ノードに前記算出手段で算出された複数のサイズオーダの一 つに応じた MBRを示すデータが格納され、前記ツリー中の下位ノードを有する各ノ 一ドに該ノードの有する全ての下位ノードで夫々管理される前記複数のサイズォー ダの一つに応じた MBRのデータに応じた MBRを夫々包含する MBRを示すデータ が格納されたツリーを前記サイズオーダ毎に作成し、これらのツリーを記憶装置に格 納する。
[0033] このようにすれば、サイズオーダ毎に検索に適したツリーを作成することができる。
即ち、代表サイズオーダのツリーよりも適正なツリーを作成することができる。従って、 被写体のサイズに応じたツリーを選択して、検索コストの適正な検索を行うことが可能 となる。
[0034] 好ましくは、本発明による映像管理システムは、任意の被写体の位置及びサイズが 与えられた時に、前記複数のサイズオーダの中から前記被写体のサイズより大きく且 つ最小のサイズオーダを決定し、決定されたサイズオーダに対応するツリーを特定し 、前記被写体の位置を含む MBRを前記特定されたツリーのルートノードから順にた どり、前記特定されたツリーの最下位ノードで検索される前記被写体の位置を含む M BRに対応する映像に係る情報を、映像検索結果の一つとして抽出する検索手段を さらに備える。
[0035] また、本発明は、映像の撮影位置と撮影方向と示すデータに基づいて算出された、 複数のサイズオーダの夫々に対応する、撮影される実空間上の範囲を示すビューボ リュームを包含する外接四角形 (MBR)を夫々示すデータを、管理対象の映像の撮 影範囲を示すデータとして格納した記憶手段と、
検索対象の被写体の位置とサイズとが与えられた場合に、前記被写体のサイズより 大きく且つ最小の前記複数のサイズオーダの一つに対応する前記記憶手段中の M BRを特定し、特定した MBR中に前記被写体の位置が含まれている場合には、その MBRに対応する映像に係るデータを、検索結果の一つとして抽出する検索手段と を備える映像検索システムである。
[0036] 好ましくは、本発明による映像検索システムの前記記憶手段は、複数の映像を階層 的に管理するためのツリーを記憶し、
前記ツリーは、前記複数の映像に対して共通な代表サイズオーダに応じて算出さ れた各映像に対応する MBRで決定されたツリー構造を有し、
前記ツリー中の各最下位ノードは、前記複数の映像の前記代表サイズオーダに応 じた MBRと、前記複数の映像の一つに対して規定された複数のサイズオーダに応じ て算出された複数の MBRとを夫々示すデータを有し、
前記ツリー中の下位ノードを有する各ノードは、該ノードが有する全ての下位ノード に夫々格納された前記代表サイズオーダ及び前記複数のサイズオーダに夫々対応 する各 MBRを示すデータで特定される各 MBRを夫々包含するサイズオーダ毎の M BRを示すデータを有し、
前記検索手段は、任意の被写体の位置及びサイズが与えられた時に、前記ツリー について用意されたサイズオーダの中から、前記被写体のサイズより大きく且つ最小 のサイズオーダに応じた MBRを検索 MBRとして決定し、前記被写体の位置を含む 検索 MBRを前記ツリーのルートノード力 順にたどり、前記ツリーの最下位ノードで 検索される前記被写体の位置を含む検索 MBRに対応する映像に係る情報を、映像 検索結果の一つとして抽出する。
[0037] 本願では、上述したような映像管理システム、映像検索システムと同様の特徴を有 する方法の発明、プログラムの発明、プログラムを記録した記録媒体の発明を、本発 明とすることができる。
発明の効果
[0038] 本発明によれば、適正なコストで特定の被写体が撮影されて 、る映像を検索するこ とがでさる。
[0039] また、本発明によれば、特定の被写体が撮影されている映像をもれなく抽出するこ とが可能となる。
図面の簡単な説明
[0040] [図 1]複数の被写体サイズのオーダで算出した MBRの説明図である。 [図 2]代表的な被写体サイズのオーダに基づくツリー構造の決定を示す説明図であ る。
[図 3]ツリーの各ノードにおける、複数の被写体サイズのオーダに対する MBRの算出 を示す説明図である。
[図 4]被写体サイズを指定した映像検索を示す説明図である。
[図 5]本発明の実施形態による映像管理及び検索システムの構成例を示す図である
[図 6]図 5に示した映像収集端末の構成例を示す図である。
[図 7]映像データのメタデータのリスト例 (リスト 1)を示す図である。
[図 8]図 7に示したリスト中の各メタデータを構成するパラメータを説明するテーブル( テーブル 1)を示す図である。
[図 9]ビューボリュームの計算方法の例を示す説明図である。
[図 10]映像データの MBRの計算方法の例を示す説明図である。
[図 11]遠方面距離の決定手法の例を示す説明図である。
[図 12]メタデータの管理情報を示すテーブル (テーブル 2)の説明図である。
[図 13]ツリーインデックスのデータ構造例を示す図である。
[図 14]ツリーインデックスの例を示す図である。
[図 15]各ノードにおける MBRの計算を示す図である。
[図 16]被写体サイズと代表点の説明図である。
[図 17]被写体映像検索の例を示す図である。
[図 18]検索条件入力画面の表示例を示す図である。
[図 19]検索結果表示画面の表示例を示す図である。
[図 20]ビューボリュームと MBRの説明図である。
[図 21]MBRによる階層化の例を示す図である。
[図 22]従来技術の問題点の説明図である。
符号の説明
A,B,C' . 'ビューボリューム
D1…映像データ D2-• ·メタデータ
D3- ··映像管理用メタデータ
Ml M2.M3---MBR
Nl, N2— 1,N2— 2,N3— 1〜N3-
1·· ,映像収集端末
2·· •映像検索端末
4,5 …ネットワーク
6·· •Webサーバ
7·· •DBサーバ
8·· 'ストレージ
lO- • 'PC (パーソナルコンピュータ) ll- ··カメラ
13· ··センサ
14· ··通信モジュール
15· ··外部メモリ
61· ··映像管理サーバ (算出手段)
62· ··映像配信サーバ
63· ··映像検索サーバ (検索手段)
64· ··地図配信サーバ
71· ··映像 DB (管理手段)
72· ··被写体 DB
73· ··地図 DB
81· • ·映像ストレージ
82· • ·映像メタデータストレージ
83· ··被写体情報ストレージ
84· ··地図情報ストレージ
131 ···位置計測センサ 131
132 …方位計測センサ 発明を実施するための最良の形態
[0042] 以下、本発明の実施形態について図面を用いて説明する。実施形態で説明する 構成は例示であり、本発明は実施形態の構成に限定されない。
[0043] 〔実施形態の概要〕
実施形態では、蓄積された映像データカゝら被写体が撮影されて ヽる映像又は映像 区間を同定するために、映像の撮影時における、カメラパラメータ (画角等)、カメラ位 置座標 (撮影位置)、光軸方向 (パン、ティルト、ョー:撮影方向)が、メタデータとして記 録される。
[0044] また、映像蓄積時に、映像が撮影されたときのビューボリューム (撮影範囲)、及びビ ユーボリュームに対応する MBR (外接四角形: Minimum Bounding Region)が、メタデ 一タカゝら算出される。 MBRは、映像データを検索するための検索インデックスとして 利用される。
[0045] ビューボリューム及び MBRのサイズは、検索すべき被写体のサイズによって異なる 。このため、本実施形態では、複数の被写体サイズのオーダ (lm, 10m, 100m. . ·( 複数のサイズオーダに相当》が予め規定され、オーダ毎に算出された MBRが検索ィ ンデッタスとして管理される。
[0046] 被写体の検索時には、検索対象のサイズ以上かつ最小オーダの MBRが用いられ 、MBRに被写体座標が含まれている映像もしくは映像区間が検索結果として出力さ れる。
[0047] 〈複数のオーダに対するビューボリューム及び MBRの管理〉
本発明の実施形態では、撮影された映像データのメタデータを用いて、予め規定さ れた複数の被写体サイズのオーダ (例えば、 lm, 10m, 100m,等)に対応するビュ 一ボリューム (撮影空間)が計算される。さらに、各ビューボリュームに対する MBR (外 接四角形)が算出される。各 MBRは、検索インデックスとして、被写体が撮影された 映像の検索時に利用される。
[0048] 図 1は、複数の被写体サイズのオーダに応じて算出された MBRの説明図である。
図 1に示す例では、複数の被写体サイズのオーダに対応するビューボリューム A〜C と、ビューボリューム A〜Cに対する MBR M1,M2,M3が示されている。検索すべき 被写体 (検索対象)のサイズに応じて、複数の被写体サイズのオーダが用意される。
[0049] 図 1に示す例では、複数の被写体サイズのオーダは、 lm未満の被写体 (図 1では 看板 Olを例示)に対するオーダ" lm"と、数 mの被写体 (図 1では自動車 02を例示) に対するオーダ" 10m"と、数十 mの被写体 (図 1ではビル 03を例示)に対するオーダ "100m"とを含む。
[0050] 図 1には、複数のオーダ ("lm", "10m"及び" 100m")に従って算出されたビュー ボリューム A〜Cが示されている。オーダ" lm"に対応するビューボリューム Aは、看 板 Olのみを含む。これに対し、オーダ" 10m"に対応するビューボリューム Bは、自動 車 02及び看板 Olを含む。さらに、オーダ" 100m"に対応するビューボリューム Cは 、看板 01、自動車 02及びビル 03を含む。
[0051] このとき、適正な (検索結果として抽出されるに好適な)サイズを有する看板 Olが、 ビューボリューム A内に存在する。適正なサイズを有する自動車 02が、ビューボリュ ーム B内に存在する。適正なサイズを有するビル 03が、ビューボリューム C内に存在 する。
[0052] さらに、図 1には、各ビューボリューム A〜Cに基づいて算出された MBR M1.M2 及び M3が示されている。
[0053] 本実施形態では、図 1に示すように、複数の各オーダに対するビューボリューム及 び MBR (図 1では、 3つのオーダに対するビューボリューム A及び MBR Ml、ビュー ボリューム B及び MBR M2、及びビューボリューム C及び MBR M3)が、映像データ の撮影範囲を規定するデータとして作成 (算出)される。このように、一つの映像デー タについて、その撮影範囲を多段階に示す複数のデータが作成、管理される。特に 、各オーダに応じた MBR (図 1では MBR M1,M2,M3)は、検索対象の被写体を含 む映像データを検索するための検索インデックスとして使用される。
[0054] ここに、映像データが静止画の場合には、各オーダに応じた静止画のビューボリュ ームが計算され、各ビューボリュームに対応する MBRが算出される。
[0055] これに対し、映像データが動画の場合には、例えば、各オーダに対応するビューボ リューム力 フレーム毎に算出される。そして、オーダ毎に、各フレームのビューボリュ ームの全てを含む外接四角形力 MBRとして算出される。 [0056] 本実施形態は、映像データ (データ D1)について、この映像データ (データ D1)に対 するメタデータ (データ D2)力 複数のオーダに対応するビューボリューム及び MBR( データ D3)を夫々算出し、データ D3を映像データ (データ D1)の検索のために管理 することを特徴とする。
[0057] 〈ツリー構造の決定、 MBRの算出〉
データ D3(ビューボリューム及び MBR:映像検索用メタデータ)の管理に際しては、 次の構成を採用することができる。すなわち、代表被写体サイズのオーダ (代表ォー ダ)が映像データに対して規定され、この代表オーダについて算出される MBRを用 いて、映像データのツリーインデックスが作成される。代表オーダは、映像データに 対して規定される複数のオーダ力 任意に選択可能な一つのオーダである。
[0058] ツリーインデックスの作成は、(1)ツリー構造の決定、及び (2)ツリーを構成する各ノ ードに対する MBR値の計算、力もなる 2段階のステップで実行することができる。
[0059] 図 2は、代表的な被写体サイズのオーダに基づくツリー構造の決定 (上記ステップ (1 》を示す説明図である。図 3は、ツリーの各ノードにおける、複数の被写体サイズのォ ーダに対する MBR値の算出 (上記ステップ (2))を示す説明図である。
[0060] 図 2に示すツリー構造の決定の前提として、検索対象の各映像データ (図 2では、 6 つの映像データ (記録単位)が例示される)につ 、て、代表オーダに対するビューボリ ユーム及び MBR値が算出される。
[0061] 図 2に示す例では、代表オーダとして、 "10m"が規定されており、代表オーダ" 10 m"に対応する各映像データのビューボリューム及び MBRが算出されている。
[0062] ツリー構造の決定は、代表オーダの MBRの重なりや距離等に基づいて実行される 。このとき、近傍の代表オーダの MBRが同じノードの子になるように、 MBRが分配さ れる。図 2に示す例では、 6つの映像データに対して作成された 3階層のツリー構造 が示されている。
[0063] このツリー構造では、 6つの映像データに対する代表オーダのビューボリューム及 び MBRについて、最上位層 (ルート)にノード N1が形成され、ノード N1の下位に、第 2層に属するノード N2— 1及び N2— 2が形成され、各ノード N2 - 1及び N2— 2の下 位に、第 3層 (最下位層)のノード N3— 1〜N3— 6が形成されている。 [0064] このツリー構造は、各映像データ (MBR)間の距離や重なりが考慮されるとともに、 一つのノードに含まれる子ノードの数に偏りが発生しな 、ように作成されて 、る。
[0065] その結果、このツリー構造では、 3つの子ノードを夫々包含する 2つの中間ノード N 2— 1及び N2— 2が作成され、 2つの中間ノード N2— 1及び N2— 2を包含するルー トノード N1が作成されている。このようにして、映像データのツリーインデックスのッリ 一構造が、代表オーダの MBRに基づ 、て作成される。
[0066] ツリー構造が決定された後、各オーダのノードの MBR値が算出される。即ち、図 3 に示すように、最下位のノード (N3— 1〜N3— 6)に対し、予め規定された複数のォー ダ (代表オーダを除く)に対応するビューボリューム及び MBRが夫々算出される。
[0067] 例えば、複数のオーダが" lm", "10m", "100m"である場合に、代表オーダが" 10 m"であれば、残りのオーダ" lm"及び" 100m"に対するビューボリューム及び MBR が計算される。算出された複数のオーダに対応するビューボリューム及び MBRの値 は、各最下位ノード (N3 - 1〜N3 - 6)に格納することができる。
[0068] 次に、子ノードを有するノード (図 3では、ノード N1,N2— 1及び N2— 2)では、その ノードの下位に存在する全てのノードに夫々格納された各オーダの MBRを包含する MBRの値力 オーダ毎に算出され、当該ノードに格納される。
[0069] 例えば、ノード N2— 1に着目すると、ノード N2— 1は、下位ノードとして、ノード N3 — 1〜Ν3— 3を持つ。各ノードN3— 1〜N3— 3は、オーダ" lm,,,"10m,,及び" 100 m"に対応する MBRの値を夫々有して!/、る。
[0070] そこで、ノード N2—1について、ノードN3— l〜N3— 3が有するォーダ"lm"のM BRの全てを包含する MBRの値と、ノードN3— l〜N3— 3が有するォーダ"10m"の MBRの全てを包含する MBRの値と、ノードN3— 1〜N3— 3が有するォーダ"100 m"の MBRの全てを包含する MBRの値と、が算出される。算出された 3つの MBRの 値は、ノード N2— 1に格納される。
[0071] このような MBR値の算出処理力 全ての上位ノード (N2— 2, N1)について実行さ れる。その結果、最上位ノード (ルートノード:ノード N1)は、当該ツリーに包含される全 ての映像データのビューボリュームを包含するオーダ毎の MBRの値を有する状態と なる。 [0072] 本実施形態では、代表オーダの MBRでツリー構造が決定され、子ノードを持つ各 ノードにっ 、て、そのノードの全ての子ノードが有する MBRを包含する MBR値が、 オーダ毎に算出され、算出されたオーダ毎の MBR値が各ノードに格納される。各ノ ードが持つ MBR値は、映像 (被写体)検索のためのインデックスとして利用される。
[0073] 〈映像検索〉
図 4は、被写体サイズを指定した映像検索を示す説明図である。映像検索時には、 検索すべき被写体の位置及びサイズが指定される。このとき、指定された被写体サイ ズより大きい最小オーダの MBRが選択 (決定)される。
[0074] その後、指定された被写体位置に基づ 、て、ツリーインデックスのルートノードと、 選択されたオーダの MBRに被写体位置が包含されて 、るノードとが検索される。最 終的に、検索すべき被写体を含むビューボリュームの MBRが発見される。発見され た MBRに対応する映像データは、検索結果に含められる。
[0075] 図 4に示す例では、検索すべき被写体として、被写体サイズ 80mのビル 03が指定 されている。この場合、被写体サイズよりも大きぐ且つ最小のオーダとして、オーダ" 100m"が検索オーダとして決定される。
[0076] そして、被写体位置 (ビルの位置)が含まれる MBRがルートノード力 順に検索され る。この例では、ノード Nl→ノード N2—l→ノード N3— 2の順で、検索オーダに対応 する MBRが検索される。最終的に、ノード N3— 2のオーダ" 100m"に対応する MB R力 Sヒットする。これに従って、ヒットした MBRに対応する映像データ力 検索結果の 一つに含められる。
[0077] なお、検索結果の映像データに対して、更に詳細なビューボリューム包含判定 (映 像データのビューボリューム中に被写体が含まれて 、る力否かの判定)を行うこともで きる。このような、厳密な被写体の包含判定が実行されるようにしても良い。
[0078] 図 1〜4を用いて説明したような構成を採用する場合には、以下の利点がある。
[0079] 〈1〉検索対象 (被写体)のサイズに応じたオーダを複数のオーダ力も決定することが できる。これによつて、検索対象が含まれていない、又は検索対象が含まれていても その利用価値が低 、と考えられるオーダ (の MBR)を、検索範囲力も外すことができる [0080] 〈2〉検索対象のサイズよりも大き!/、オーダが、検索オーダとして決定される。映像デ ータに対して用意された複数のオーダに対応する複数の MBRが検索対象と一致す る物体を含まな ヽ MBRを含んで 、ても、検索対象のサイズより大き!/、オーダが決定 されることで、検索漏れを防ぐことができる。
[0081] 例えば、図 4に示した例では、ビル 03がオーダ" lm"の MBRに含まれていなくても 、この上位オーダに相当するオーダ" 100m"の MBRでビル 03が包含されているか 否かが判定される。このため、検索対象の取りこぼしが生じない。
[0082] 〈3〉また、検索対象のサイズよりも大き!/、最小のオーダが、検索オーダとして決定さ れる。これによつて、検索対象が適正な (利用価値の高い)大きさで撮影されていると 考えられるオーダで、映像検索を行うことができる。これによつて、検索範囲の拡大抑 制と、検索結果の適正化とを図ることができる。
[0083] 〈4〉また、複数のオーダを用意することで、検索時において、無限に拡大した MBR で包含チェックをすることを防ぐことができる。
[0084] 〈5〉さらに、上述したツリー構造の作成手法によれば、映像データの追加 Z削除に 応じてツリーインデックスに改変をカ卩える場合には、代表オーダについてのみ、追カロ Z削除に係る構造ィ匕処理 (ツリー構造の改変処理)を行えば良い。
[0085] 従って、ツリー構造ィ匕のためのコストを従来手法と同様の程度に抑えることができる
。従って、多種多様なサイズの被写体を取り扱うことができる柔軟な映像検索システ ムの構築が可能となる。
[0086] なお、代表オーダは、固定のオーダに定める必要はなぐ映像データ (ツリー)毎に 異なる代表オーダを採用しても良い。例えば、映像の代表被写体サイズのオーダを 撮影者が明示的に入力し、メタデータとして記録して利用しても良 、。
[0087] 或 、は、被写体距離をセンサや画像処理により求め、被写体を含む最小のビュー ボリュームとなる被写体サイズのオーダを代表オーダとして採用しても良 、。
[0088] どちらの場合も映像データ毎に異なる撮影対象によって、異なるオーダが代表ォー ダとして採用されることになる。検索頻度が高 、と認められるオーダが代表オーダに 採用されることで、被写体映像にヒットしやす 、ツリーインデックスを構築することがで きる。 [0089] 以上の概要は、複数の映像データからなる映像データ集合をツリー構造化する場 合について説明した。これに代えて、映像ファイルを更にフレーム、複数のフレーム 集合であるショットなどの映像サブセットに分割し、映像サブセット毎にビューボリユー ムと MBRを算出しても、同様の手法を適用することができる。
[0090] 本発明の特徴及び実装については以下の実施形態によってさらに詳細に説明す る。
[0091] 〔実施形態〕
Webベースの映像蓄積検索システムを元に本発明の実施形態を説明する。ここに 述べるシステムは、多数の映像収集端末によって収集された大量のメタデータ付き 映像をサーバに蓄積し、ノ ックエンドの映像検索端末と映像検索サーバによって、指 定された被写体の写っている映像を検索、表示する。
[0092] 映像収集端末として、カメラ付きの携帯電話,モパイルパソコン (mobile Personal computer with camera), PDA(Personal Digital Assistants)や、通信機能付きのテイジ タルカメラ Zディジタルビデオカメラなどを想定することができる。
[0093] 図 5は、実施形態における映像検索システムの構成例を示す図である。図 5におい て、システムは、映像収集端末 1,映像検索端末 2,運用管理端末 3,ネットワーク 4, ネットワーク 5, Webサーバ 6, DB(database)サーバ 7,ストレージ (記憶手段) 8から構 成される。
[0094] Webサーバ 6, DBサーバ 7,及びストレージ 8は、 CPU等のプロセッサ,記憶装置( メモリ (ROM,RAM),ハードディスク等),入出力インタフェース (IZO),通信インタフエ 一ス等を有する情報処理装置 (コンピュータ)を用いて構成することができる。
[0095] Webサーバ 6を構成するコンピュータは、記憶装置に格納されたプログラムをプロ セッサが実行することによって、映像管理サーバ 61,映像配信サーバ 62,映像検索 サーバ 63,地図配信サーバ 64を実現する装置として機能する。
[0096] また、 DBサーバ 7を構成するコンピュータは、記憶装置に格納されたプログラムを プロセッサが実行することによって、映像 DB71,被写体 DB72,地図 DB73を有す る装置として機能する。
[0097] さらに、ストレージ 8を構成するコンピュータは、記憶装置に格納されたプログラムの 実行によって、記憶装置上に映像ストレージ 81,映像メタデータストレージ 82,被写 体情報ストレージ 83及び地図情報ストレージ 84を有する装置として機能する。もっと も、ストレージ 8は、 DBサーバ 7を構成するコンピュータが備える、又は管理可能な記 憶装置を用いて構成することが可能である。
[0098] 以下、各部の動作と実装とについて説明する。
[0099] 〈映像収集端末〉
図 6は、図 5に示した映像収集端末 1の構成例を示す図である。図 6において、映 像収集端末 1は、カメラ 11により静止画又は動画映像を撮影して映像データ D1に変 換する。
[0100] また、映像収集端末 1は、撮影時におけるセンサ 13からのセンサ情報をメタデータ D2として記録する。さらに、映像収集端末 1は、通信モジュール 14によってネットヮ ーク 4経由で Webサーバ 6に映像データ D1及びメタデータ D2を送信する。
[0101] センサ 13は、少なくとも位置計測センサ 131と方位計測センサ 132とを含む。位置 計測センサ 131として、例えば GPS (Global Positioning System)が適用される。方位 計測センサ 132として、例えば電子コンパスが適用される。但し、位置計測センサ 13 1及び方位計測センサ 132は、他の手段やセンサによる実装であってもよい。
[0102] 図 7は、位置計測センサ 131と方位計測センサ 132とによるメタデータ D2の一例を 示すリスト (リスト 1)である。図 8は、リスト 1に示された各パラメータの説明を示すテープ ル (テーブル 1)を示す図である。
[0103] 図 7に示すメタデータ D2のリストの各行は、所定の記録単位 (例えば 2秒毎)毎に作 成 (撮影)された映像データ (例えば、静止画、フレーム)に対する各パラメータ (図 8)の 内容を示す。即ち、映像データ D1は、記録単位毎に作成され、各映像データに対 するメタデータ D2が作成される。
[0104] なお、センサ 13は、カメラ 11のズームを検知し、撮影時の画角を記録する画角セン サ 133や、カメラ 11の撮影位置から被写体までの距離を計測する被写体距離計測 センサ 134などをさらに含むことができる。この場合、画角センサ 133や被写体距離 計測センサ 134の計測結果力 タデータ D2に記録されるように構成することができる [0105] Webサーバ 6への送信はストリーミング等によるリアルタイム送信を適用することが できる。或いは、映像収集端末 1に蓄積された映像データ D1及びメタデータ D2を電 子メールに添付して送る方式を適用することもできる。また、メタデータ D2が映像デ ータ D1の通信経路と異なる通信経路を通じて送信される構成を適用することもでき る。
[0106] 映像データ D1とメタデータ D2は、図 6に示すように、個別のデータとして作成可能 である。これに対し、静止画の EXIF(Exchangeable image file format for Digital Still Camera)ファイルのように、映像データフォーマット中にメタデータ D2が含まれる形式 を適用することちできる。
[0107] また、メタデータ D2は、映像データ D1の音声トラック,映像トラック,もしくはメタデ ータ専用トラックに書き込まれる形態で映像データ D1と一体化される構成を適用す ることちでさる。
[0108] また、映像データ D1及びメタデータ D2を通信モジュール 14によって送信すること に代えて、次の構成を適用することができる。例えば、図 6に示すように、映像データ D1及びメタデータ D2を SDカードやメモリスティックのような外部メモリ 15に蓄積して おく。その後、オフラインで PC(Personal Computer)10に外部メモリ 15を接続し、 PC1 0が接続されたネットワーク 4を通じて Webサーバ 6に映像データ D1及びメタデータ D2を送信する。
[0109] 〈映像管理サーバ〉
図 6に戻って、映像管理サーバ 61は、 Webサーバ 6の一部を構成する。映像管理 サーバ 61は、 DBサーバ 7を構成する映像 DB71との連携により、映像ストレージ 81 に映像データ D 1を格納する。
[0110] また、映像管理サーバ 61は、メタデータ D2に基づいて映像データの映像撮影範 囲に関するメタデータを算出し (算出手段に相当)、映像 DB71との連携において、映 像メタデータストレージ 82にメタデータ D2と、算出された映像撮影範囲に関するメタ データを格納する (管理手段に相当)。
[0111] すなわち、映像管理サーバ 61は、映像データ D1とメタデータ D2とを映像収集端 末 1から受け取ると、映像データ D1を、映像 DB71を介して映像ストレージ 81に格納 する。更にメタデータ D2より測定時間 (記録単位)ごとの映像のビューボリュームを計 算し、その外接四角形となる MBRを求める。
[0112] 《ビューボリューム及び MBRの算出》
以下、映像管理サーバ 61によるビューボリューム及び MBRの算出方法について 説明する。図 9は、ビューボリュームの計算例の説明図であり、図 10は、映像データ の MBRの説明図であり、図 11は、遠方面距離の決定方法の例を示す説明図であり 、図 12は、メタデータ D2に基づいて作成されるメタデータ D3のパラメータを示す図 である。
[0113] (A)被写体サイズが固定の場合
最初に、被写体サイズが固定の場合におけるビューボリューム及び MBRの算出に ついて説明する。計算の簡略化のため、ビューボリュームの計算は、緯度及び経度 による座標系ではなぐ平面に近似してユークリッド座標系で行われる(図 9)。
[0114] 座標系の基準原点は、東京近辺であれば、北緯 36度 0分 0秒、東経 139度 50分 0 秒(国土交通省の告示による IX系の原点緯度経度)などに設定される。但し、撮影範 囲が特定の位置であったり、屋内で基準原点をローカルに設定したりする場合には、 任意の原点を採用することができる。
[0115] 基準原点に対する映像撮影位置の変位量を (x,y)(単位 [m])、光軸方向を Θ (単位 [rad])、映像を撮影したカメラの水平画角を Δ (単位 [rad])、撮影可能な近接面距離
H
を d (単位 [m])、遠方面距離を d (単位 [m])とする。
near far
[0116] この場合、ビューボリュームは、以下の式 1· 1〜1· 4で算出される Ρν , Ρν , Ρν , Ρ
1 2 3 νを 4頂点とする凸形状 (台形)として求めることができる。
4
[0117] 式 1. 1は、ビューボリュームの頂点 Ρνの算出式であり、式 1. 2は、ビューボリューム
1
の頂点 Ρνの算出式であり、式 1. 3は、ビューボリュームの頂点 Ρνの算出式であり、
2 3 式 1. 4は、ビューボリュームの頂点 Ρνの算出式である。
4
[0118] 一方、 MBRは、ビューボリュームを構成する 4点の X値の最大値 (MBR )と最小
Right 値 (MBR ;)、 Y値の最小値 (MBR )と最大値 (MBR )で定義することができる(
Left Bottom Top
式 2)。式 2は、単一のビューボリュームの MBRの算出式である。
[0119] [数 1] x + d for sin Θ - cos θ tan
Pv x 2
, = 式 1.
Pvvy
y + d cos ^ + sin ^ tan Λ
2
[0120] [数 2]
x + d far sin Θ + cos Θ tan
Pv2.x 2
式 1. 2 y + dfar cos^-sin^tan
2
[0121] [数 3]
尸 v3 = 式 1. 3
Figure imgf000022_0001
[0122] [数 4] 式 1. 4
Figure imgf000022_0002
[0123] [数 5]
MBR =匿一 式 2
MBRTop
Figure imgf000022_0003
式 1. 1〜1. 4、及び式 2を用いて、メタデータ D2の 1記録単位(リスト 1の 1行に相 当)あたりの MBRを算出することができる。映像データ全体の MBRは、算出された 個々の 1記録単位あたりの MBRを全て包含する外接四角形 (MBR)として算出するこ とができる(図 10参照)。
[0124] 図 10に示す例では、複数の映像データの MBRの X値の最大値及び最小値、 Y値 の最大値及び最小値を夫々一辺とする MBRが、映像データ全体の MBRとして規定 されている。
[0125] (B)被写体サイズを指定した場合における MBR算出
次に、被写体サイズが指定された場合における MBRの算出について説明する。
[0126] M個の映像データが Dlm (m= l, 2, · · · , M)で規定され、 S個の被写体サイズが
O (s= l, 2, · · · , S)で規定されるとき、 Dimかつ Oの MBRを MBR(m,s)と記述す s s
る。このとき、 MBR(m,s)は、遠方面距離 d が異なるだけで、被写体サイズ固定の場 far
合と同様の手法で算出することができる。
[0127] 遠方面距離 d は、図 11に示すように、被写体サイズ Oの物体の映像中における far 5
認識限界となるピクセル数 Tと焦点距離 fとで定義される (式 3)。式 3は、遠方面距離 d
h
の算出式である。
far
[0128] [数 6] dfar - ^ · · ·式 3 ここで、焦点距離 fは、映像を撮影したカメラの光学系に依存する。メタデータとして 水平画角 Δ も記録される場合には、水平画角 Δ より焦点距離 fを随時計算すること
H H
で、ズームや接写に対応した遠方面距離 d を算出することができる。このように、本 far
実施形態では、ピクセル数 Tを規定することで、一定画素数以上 (例えば、一画素以
h
上)又は一定画素サイズ以上で撮影される被写体を考慮した遠方面距離を規定する ことができる。また、一定画素数又は画素サイズ以上で且つ一定画角以上で被写体 が撮影された遠方面距離を規定することができる。
[0129] 被写体サイズ Oとして、映像蓄積検索システムが扱う可能性のある複数の被写体 サイズ (オーダ)が設定される。このとき、複数の被写体サイズが網羅的に設定される のが好ましい。
[0130] 映像データ Dimについて代表被写体サイズを決定し、その MBR (代表被写体ォ ーダ (サイ )に対する MBR)を、以下の数 7のように規定する。
[0131] [数 7]
MBR(m) - . - (代表被写体オーダに対する MB R) 《代表被写体サイズの決定》
メタデータ記録単位ごとの代表被写体サイズは、次の方法 (a)又は (b)を用いて決定 することができる。
(a)撮影時に明示的にメタデータに被写体サイズを記述する。
(b)レーザレンジファインダなどの測距センサで撮影位置力 被写体までの距離を計 測しておき、その距離以遠の遠方面となる被写体サイズを採用する。
[0132] 映像データの代表被写体サイズは、例えば、全ての記録単位で最も多く採用され た被写体サイズを用いて決定することができる。
[0133] 以上の処理により、映像管理サーバ 61は、メタデータ D2に加え、被写体オーダご との MBR(MBR(m,s))と、代表被写体オーダに対する MBR (数 7)とを生成する。
[0134] 映像管理サーバ 61は、映像ストレージ 81に格納された映像データ Dimを特定す る URL(Uniform Resource Locator)又は ID(identification)を有する映像管理用メタデ ータ D3 (テーブル 2:図 12参照)を生成し、映像 DB71に登録する。
[0135] 上述した映像管理サーバ 61による処理は、映像管理サーバ 61を実現するコンビュ ータにおいて、そのコンピュータが備えるプロセッサ力メモリに記憶されたプログラム を実行すること〖こよって実現される。
[0136] 上述したビューボリューム及び MBR等を実行するためのデータ (算出式のデータ等 )や、代表オーダを決定するためのデータは、映像管理サーバ 61を実現するコンビュ ータ上に予め記憶されており、メタデータ D2に含まれる情報をパラメータとしてビュー ボリューム及び MBRの算出や、代表オーダの決定が実行される。 [0137] 〈映像 DB71〉
DBサーバ 7の映像 DB71は、メタデータ D3を映像メタデータストレージ 82に登録 する。また、映像 DB71は、映像メタデータストレージ 82中のメタデータ D3を高速に 検索するために MBRを用いてメタデータ D3の検索インデックスを作成する (管理手 段に相当)。
[0138] 《検索インデックスの作成方法》
検索インデックスは、特定の位置座標 (被写体位置座標)を包含する MBRを持つメ タデータ D3を高速に抽出するために使用される。このため、検索インデックスは、ッリ 一構造を持つのが妥当である。
[0139] ツリー構造に求められる性質は、 [1]重複度合いの高い MBRはできるだけ同じノー ドの子に分配されること、 [2]特定のノードに子ノードが集中しないこと、 [3]リーフノー ドの深さが均一な平衡木(Balanced Tree)であることなどである。
[0140] [1]〜[3]の条件を満たすツリー構造を決定するアルゴリズムとして R-treeや、その改 良型である R*-treeなどがある。これらのアルゴリズムを実装することで、ツリー構造を 作成することができる(各アルゴリズムにつ 、てはここでは言及しな!、)。
[0141] なお、 R-treeや、 R*-treeは、下記の文献にて開示されている。
[0142] [Guttman, A. R— Trees: A Dynamic Index Structure for bpatiai Searching. Proc of the 1984 ACM SIGMOD Int'l Conf on Mgmt of Data, 45—57.]
図 13は、生成されるツリーインデックスのデータ構造を示す。データは、ツリーのノ ード (ルートノードを含む)を格納するためのノードデータクラス(CNode)、子ノードへ のポインタを格納するノードエントリクラス(CNodeEntry)と、メタデータ(CMeta)への ポインタを格納するリーフエントリクラス (CLeaffintry)カゝら構成される。各ノードは最大 M個、最小 m個の子ノードを持つ。但し、例外的にルートノードのみ最小 1個の子ノ ードを持つことができる。
[0143] CNodeEntry, CLeaffintry, CMetaはそれぞれ(S + 1)個の配列で被写体オーダご との MBRを格納することができる。配列要素のうち 1番目は代表オーダの MBRを格 納する。
[0144] 図 14は、代表オーダの MBRに対して R-tree等のアルゴリズムを適用することで生 成したツリーインデックス例を示す図である。 R-treeを利用した場合、 MBRの 1番目 の配列要素(代表オーダの MBR)のみツリーインデックス作成時に算出済みである。
[0145] 本実施形態では、ツリー構造決定後に他の MBRの配列要素についても値を算出 して格納する。 MBRの算出は、ツリーインデックスの末端からルート方向に MBRを 伝播させることで行う(図 15参照)。
[0146] 即ち、メタデータの MBRがリーフエントリの MBRにコピーされる (図 15 : [1])。次に、 リーフエントリの MBRの OR領域 (下位の MBRを含む MBR値 (MBRを示すデータ》 がその上位のノードエントリの MBR値として格納される (図 15 : [2])。さらに、ノードエ ントリの MBRの OR領域 (下位の MBRを含む MBR値)がその上位のノードエントリの MBR値として格納される (図 15 : [3])。 [3]の処理は、ルートノードまで繰り返し実行さ れる。
[0147] 上述した処理によって、各ノードエントリには、そのノードの配下の全ての下位ノード の各オーダの MBRを全て包含する各オーダの MBR値力 検索インデックスとして格 糸内されること〖こなる。
[0148] 以上の処理によりメタデータ検索用のツリーインデックスを作成することができる。映 像データの追加 Z削除が行われる場合には、代表オーダにしたがって必要に応じて ツリー構造の変更が行われる。そして、ツリーインデックス作成時と同様に、 MBR伝 播による MBR値の算出が行われる。
[0149] 映像 DB71への映像データの追加 Z削除処理コストを下げるためには、上述したよ うな、代表オーダ MBRによる 1つのインデックスツリーでの映像管理が有効である。 但し、代表オーダ以外の MBRでは最適な検索のためのツリー構造になって 、な ヽ 可能性がある。
[0150] このため、 DBのメンテナンスコストよりも検索時の効率を重視する場合は、 S個のォ ーダごとに用意された S個のインデックスツリーを生成し、指定されたオーダに応じて 選択的にインデックスツリーの一つを使用するように構成することができる。
[0151] 上述した映像 DB71による処理は、映像管理サーバ 61を実現するコンピュータに おいて、そのコンピュータが備えるプロセッサカ モリに記憶されたプログラムを実行 すること〖こよって実現される。作成された検索用のインデックスツリーは、例えば、映 像 DB71が保持していても良ぐメタデータ D3とともに映像メタデータストレージ 82に 格納されるようにしても良い。
[0152] 〈被写体映像検索〉
次に、ツリーインデックスを使った被写体映像検索について説明する。映像検索の ためのクエリとしては、被写体のサイズと被写体の代表点位置 (座標値)が必要である
。図 16は、被写体サイズと代表点の説明図である。
[0153] 被写体サイズは、検索対象の被写体の大きさを示す目安になる数値である。被写 体サイズは、被写体に応じて決定される尺度である。例えば、被写体が高層ビルであ る場合には、ビルの高さが被写体サイズとして決定される。被写体が自動車である場 合には、例えば、 自動車の全長が被写体サイズとして決定される。
[0154] 被写体の代表点は、映像中にその点が撮影されていればその被写体が撮影され たと判断できる点である。 1以上の任意の点を代表点として決定することができる。或 いは、被写体を網羅的に表現できる数の代表点を用意することができる。
[0155] 代表点は被写体の形状に基づき、人手 (マニュアル)で生成することができる。或 、 は、被写体形状をメッシュ分割するなどの手法で代表点が自動的に生成される構成 を適用することちできる。
[0156] 検索時において指定される被写体サイズが Q で規定される場合、 Q ≤0を満
size size s たす最小の被写体サイズオーダ Oが決定される。 Oによって算出された MBRが映 像検索に用いられる。
[0157] 検索は、インデックスツリーをルートからリーフへ探索していくことによって行われる。
探索のゴールは、 MBR[s]属性 (Oの MBR)が代表点位置 Q を包含するメタデ
s location
ータを全て抽出することである。但し、複数の代表点位置 Q が存在する場合には
location
、複数の代表点位置 Q の一部又は全部を含むメタデータを全て抽出することを
location
ゴールに設定することができる。或 、は、複数の代表点位置代表点位置 Q 中の
location 一定以上の個数を含むメタデータを全て抽出することをゴールとして設定することも できる。
[0158] メタデータの探索は、図 17に示すように、縦型探索により行われる。探索が上位の ノード(あるいはルート)から下位のノードへ進む場合、エントリ(CNodeEntry)中の M BR[s]属性が参照され、 Q CMBR[s]となる場合にのみ、下位ノードが探索対象
location
になる。これによつて、無駄な探索を省くことができる。探索がリーフエントリ( CLeaffintry)に進んだとき、リーフエントリの MBR[s]属性に関して Q CMBR[s]
location
が成立する場合には、 meta属性が示すメタデータ(CMeta)の idが検索結果として記 録 (抽出)される。
[0159] 以上説明したような被写体検索機能は映像検索サーバ 63(図 5)に実装される。映 像検索サーバ 63による処理は、映像検索サーバ 63を実現するコンピュータにおい て、そのコンピュータが備えるプロセッサ力 Sメモリに記憶されたプログラムを実行するこ とによって実現される。
[0160] 映像検索サーバ 63は、映像 DB71に検索を依頼し、映像 DB71による検索処理の 結果 (ヒットしたメタデータ D3)を受け取る。或いは、映像検索サーバ 63が、直接的に 検索インデックスツリーを参照し、対応するメタデータ D3を映像メタデータストレージ 82から取得するようにしても良 、。
[0161] 〈映像検索サービスの実現方法〉
次に、図 5に示した映像検索端末 2と映像検索サーバ 63の連携による映像検索サ 一ビスの実現方法につ 、て説明する。
[0162] 映像検索端末 2は、 PCと Webブラウザによって実現することができる。或いは、映 像検索端末 2は、専用ソフトもしくは専用端末によって実現することもできる。
[0163] 図 18は、 PCと Webブラウザで実現される映像検索端末 2で表示される検索条件入 力画面の一例を示す図である。図 18において、検索条件入力画面は、 HTMLと Java (登録商標) Scriptにより作成されている。検索条件入力画面は、地図配信サー ノ 64(図 5)力もネットワーク 5を通じて取得される地図情報 (地図 DB73により管理され 、地図情報ストレージ 84に格納されている)を表示するとともに、 3種類の被写体指定 手段を提供する。
[0164] 第 1の被写体指定手段 (被写体指定手段 1)は、地図表示領域上でマウス等のボイ ンティングデバイスを用いて被写体を指定する手段をユーザに提供する。このとき、 ユーザは、複数の代表点を地図上で指定入力することができる。或いは、ユーザが、 矩形や多角形で規定された地図上の所定範囲を指定すると、矩形や多角形に包含 される被写体の頂点等の形状特徴点が代表点として決定される構成を採用すること ちでさる。
[0165] 地図上の代表点が特定 (入力)されると、映像検索端末 2は、地図上のピクセル座標 を Java (登録商標) Scriptにより実空間における座標値に変換して映像検索のクエリと する。また、映像検索端末 2は、代表点より被写体のサイズを算出し、これもまた映像 検索のクエリとする。例えば代表点のうち最も離れている 2点の距離がサイズとして利 用される。
[0166] 第 2の被写体指定手段 (被写体指定手段 2)は、被写体の代表点座標値を直接指定 する手段をユーザに提供する。例えば、図 18に示すように、検索画面に設けられた 緯度及び経度の入力欄に、所望の被写体の位置を代表点として入力する。複数の 代表点が入力された場合には、映像検索端末 2は、被写体指定手段 1と同様にして 被写体サイズを決定する。指定座標力 点の場合には、おおよその被写体サイズが 直接入力される。被写体指定手段 2は、既に座標値がわかっている被写体を検索す る場合に用いられる。
[0167] 第 3の被写体指定手段 (被写体指定手段 3)は、固有名詞で被写体を指定する手段 をユーザに提供する。ランドマーク等、検索が頻繁に行われる被写体については、被 写体 DB72(図 5)で被写体代表点と被写体サイズとが管理されている (被写体代表点 及び被写体サイズは、被写体情報ストレージ 83に格納されて ヽる)。
[0168] 検索画面に設けられた被写体名の入力欄に被写体の固有名詞を入力することで、 ユーザは被写体を指定することができる。この場合には、映像検索端末 2から映像検 索サーバ 63(図 5)へ被写体名が通知され、映像検索サーバ 63が被写体 DB72にァ クセスして、被写体名称を被写体指定手段 1、 2と同様のクエリに置換して検索処理 が行われる。
[0169] 被写体指定が確定したら実行ボタンをクリックすると、被写体指定情報 (映像検索の クエリ (代表点位置、被写体サイ )、又は被写体名称)が、映像検索サーバ 63にネッ トワーク 5を通じて送信される。映像検索サーバ 63は、代表点位置及び被写体サイズ に基づき、上述した被写体検索機能により該当被写体の映像を検索し、検索結果を 映像検索端末 2に返信する (検索手段に相当)。 [0170] これは、映像検索サーバ 63を CGI(Common Gateway Interface)プログラムにより構 成することで容易に実現でき、検索クエリは CGIプログラムへの引数に、検索結果の 返信は検索結果をリストとして表示する HTMLデータとなる。
[0171] この例では、映像検索サーバ 63が検索クエリを受け取ると、映像 DB71に対し、検 索クエリに対応するメタデータ D3の検索を依頼する。映像 DB71は、自身が保持又 は映像メタデータストレージ 82に格納された検索インデックスツリーを用いて、ヒットし たメタデータ D3を、映像検索サーバ 63に引き渡す。映像検索サーバ 63は、ヒットし たメタデータ D3を含む HTMLデータを作成し、映像検索端末 2に返信する。
[0172] 映像検索端末 2にて、 HTMLデータに基づ 、て、検索結果の HTML画面が表示 される。このとき、映像検索端末 2の webブラウザは、 HTMLデータ中の URLに基づ いて、映像配信サーバ 62に、映像配信要求を出し、映像配信サーバ 62は、映像スト レージ 81から対応する画像データ (サムネイル等)を読み出して、映像検索端末 2〖こ 供給する。
[0173] 図 19は、検索結果の HTML画面の表示例を示す図である。検索された映像は表 形式で表示され、左側にサムネイル静止画、右側にメタデータが表示される。サムネ ィル静止画には該当映像を表示するためのリンクが付けられており、画面をクリックす ると Windows (登録商標) Media Playerのような映像再生ソフトが起動して映像を確認 できる。
[0174] 即ち、映像の再生要求が映像収集端末 2からネットワーク 5を通じて映像配信サー バ 62に与えられ、映像配信サーバ 62が映像ストレージ 81から、再生要求に対応す る映像データを読み出し、ストリームデータとして映像検索端末 2に与える。映像再生 ソフトは、受信されたストリームデータを用いて、映像を再生する。
[0175] 〈運用管理端末〉
なお、図 5に示す運用管理端末 3は、被写体 DB72及び被写体情報ストレージ 83、 地図 DB73及び地図情報ストレージ 84にアクセスして、被写体情報と地図情報の管 理を行う。
[0176] ぐ変形例〉
以上の説明はビューボリューム及び MBRを 2次元平面上で説明した力 3次元空 間上においても同様の機能及び効能があるのは自明である。 3次元空間の場合、ビ ユーボリュームは台形形状力 四角錐台形状となり、 MBRは四角錐台を包含する直 方体となる。
[0177] なお、上述した実施形態では、 MBRとインデックスツリーによる検索により被写体が 撮影されている映像データが抽出される。但し、ビューボリューム中に厳密に被写体 が包含されることを保障するものではな 、。
[0178] なぜなら、 MBRはビューボリュームを包含する四角形にすぎないため、 MBR中で あってもビューボリュームに含まれない座標が存在するためである。
[0179] このため、検索された映像データのメタデータ D2から記録単位ごとにビューボリュ ームを算出し、ビューボリュームへの被写体位置の包含関係をチェックして厳密な被 写体映像区間を決定する処理を追加してもよ!/ヽ。
[0180] ツリーインデックスによるインデキシングができな!/、データベースにお 、て、インデッ タスの操作をデータベース外で行ってもょ 、し、 MBRのインデックスを作成せずメタ データ D3 (テーブル 2)のみをデータベースに格納してもよ!/、。
[0181] 後者の場合、被写体位置が MBRに含まれるレコードの抽出がツリーインデックスを 用いた場合に比べ効率が悪 、ものの、複数オーダの MBRを用いて包含関係をチェ ックするため、従来手法に比べて誤検出を回避できるというメリットがある。
産業上の利用可能性
[0182] 近 、将来にぉ 、て実現すると思われるュビキタス社会では、ディジタルカメラやカメ ラ付き携帯電話が映像収集端末として機能し、これらの端末の利用を通じて大量の 映像収集が実現されると考えられる。
[0183] 本発明は、サーバに蓄積された大量の映像データの中から、特定の被写体が撮影 されている映像区間を検索するための技術とシステムに関するものであり、監視-防 災 ·セキュリティ分野、企業又は個人の映像アーカイブと連携するローカル又はオン ラインの映像検索システム全般への適用が考えられる。
[0184] 例えば、本実施形態に係るシステムが例えば防災,災害対策分野に適用される場 合には、市民あるいは防災対策組織によって収集された映像がサーバに蓄積され、 災害対策本部に設置された映像検索端末によって特定被災地の映像のみをまとめ て表示し、被災状況を把握することが可能となる。

Claims

請求の範囲
[1] 映像の撮影位置と撮影方向と示すデータに基づいて、撮影される実空間上の範囲 を示すビューボリュームを包含する外接四角形 (MBR)を、複数のサイズオーダの夫 々について算出する算出手段と、
前記算出手段によって算出された複数のサイズオーダに夫々対応する MBRを示 すデータを、管理対象の映像の撮影範囲を示すデータとして記憶装置に格納する 管理手段と
を備える映像管理システム。
[2] 前記算出手段は、特定サイズの被写体が一定画素サイズ以上、一定画素数以上、 及び一定画素サイズ又は画素数以上且つ一定画角以上の ヽずれかで撮影される範 囲のビューボリュームを算出する
請求項 1記載の映像管理システム。
[3] 前記算出手段は、被写体サイズに応じて予め規定された複数のサイズオーダに夫 々対応するビューボリュームの MBRを算出する
請求項 1又は 2記載の映像管理システム。
[4] 被写体の位置及びサイズが入力された場合に、前記被写体のサイズよりも大きく且 つ最小のサイズオーダに対応する MBRに前記被写体の位置が含まれている力否か を判定する検索手段をさらに備える
請求項 3記載の映像管理システム。
[5] 前記算出手段は、管理対象の複数の映像に対して共通な代表サイズオーダのビュ 一ボリュームの MBRを算出するとともに、各映像に対して規定された複数のサイズォ ーダに夫々応じたビューボリュームの MBRを算出し、
前記管理手段は、
前記代表サイズオーダに対応する MBRで前記複数の映像を階層的に管理する ためのツリー構造を決定し、
前記ツリー構造を用いて、前記ツリー中の各最下位ノードに前記算出手段で算出 された前記複数の映像の一つに対する前記代表サイズオーダ及び前記複数のサイ ズオーダに応じた各 MBRを示すデータが格納され、前記ツリー中の下位ノードを有 する各ノードに該ノードが有する全ての下位ノードに夫々格納された前記代表サイズ オーダ及び前記複数のサイズオーダに応じた各 MBRを示すデータで特定される各 MBRを夫々包含するサイズオーダ毎の MBRを示すデータが格納されたツリーを作 成し、このツリーを記憶装置に格納する
請求項 1〜4のいずれかに記載の映像管理システム。
[6] 任意の被写体の位置及びサイズが与えられた時に、前記ツリーについて用意され たサイズオーダの中から、前記被写体のサイズより大きく且つ最小のサイズオーダに 応じた MBRを検索 MBRとして決定し、前記被写体の位置を含む検索 MBRを前記 ツリーのルートノードから順にたどり、前記ツリーの最下位ノードで検索される前記被 写体の位置を含む検索 MBRに対応する映像に係る情報を、映像検索結果の一つと して抽出する検索手段
をさらに備えた請求項 5記載の映像管理システム。
[7] 前記算出手段は、管理対象の複数の映像の夫々について複数のサイズオーダに 応じた MBRを夫々算出し、
前記管理手段は、
前記各サイズオーダに応じた MBRで前記複数の映像を階層的に管理するため のッリ一構造を前記サイズオーダ毎に決定し、
ツリー中の最下位ノードに前記算出手段で算出された複数のサイズオーダの一 つに応じた MBRを示すデータが格納され、前記ツリー中の下位ノードを有する各ノ 一ドに該ノードの有する全ての下位ノードで夫々管理される前記複数のサイズォー ダの一つに応じた MBRのデータに応じた MBRを夫々包含する MBRを示すデータ が格納されたツリーを前記サイズオーダ毎に作成し、これらのツリーを記憶装置に格 納する
請求項 1〜6のいずれかに記載の映像管理システム。
[8] 任意の被写体の位置及びサイズが与えられた時に、前記複数のサイズオーダの中 力 前記被写体のサイズより大きく且つ最小のサイズオーダを決定し、決定されたサ ィズオーダに対応するツリーを特定し、前記被写体の位置を含む MBRを前記特定さ れたツリーのルートノードから順にたどり、前記特定されたツリーの最下位ノードで検 索される前記被写体の位置を含む MBRに対応する映像に係る情報を、映像検索結 果の一つとして抽出する検索手段
をさらに備える請求項 7記載の映像管理システム。
[9] 映像の撮影位置と撮影方向と示すデータに基づいて算出された、複数のサイズォ ーダの夫々に対応する、撮影される実空間上の範囲を示すビューボリュームを包含 する外接四角形 (MBR)を夫々示すデータを、管理対象の映像の撮影範囲を示すデ ータとして格納した記憶手段と、
検索対象の被写体の位置とサイズとが与えられた場合に、前記被写体のサイズより 大きく且つ最小の前記複数のサイズオーダの一つに対応する前記記憶手段中の M BRを特定し、特定した MBR中に前記被写体の位置が含まれている場合には、その MBRに対応する映像に係るデータを、検索結果の一つとして抽出する検索手段と を備える映像検索システム。
[10] 前記記憶手段は、複数の映像を階層的に管理するためのツリーを記憶し、
前記ツリーは、前記複数の映像に対して共通な代表サイズオーダに応じて算出さ れた各映像に対応する MBRで決定されたツリー構造を有し、
前記ツリー中の各最下位ノードは、前記複数の映像の前記代表サイズオーダに応 じた MBRと、前記複数の映像の一つに対して規定された複数のサイズオーダに応じ て算出された複数の MBRとを夫々示すデータを有し、
前記ツリー中の下位ノードを有する各ノードは、該ノードが有する全ての下位ノード に夫々格納された前記代表サイズオーダ及び前記複数のサイズオーダに夫々対応 する各 MBRを示すデータで特定される各 MBRを夫々包含するサイズオーダ毎の M BRを示すデータを有し、
前記検索手段は、任意の被写体の位置及びサイズが与えられた時に、前記ツリー について用意されたサイズオーダの中から、前記被写体のサイズより大きく且つ最小 のサイズオーダに応じた MBRを検索 MBRとして決定し、前記被写体の位置を含む 検索 MBRを前記ツリーのルートノード力 順にたどり、前記ツリーの最下位ノードで 検索される前記被写体の位置を含む検索 MBRに対応する映像に係る情報を、映像 検索結果の一つとして抽出する 請求項 9記載の映像検索システム。
[11] コンピュータが、
映像の撮影位置と撮影方向と示すデータに基づいて、撮影される実空間上の範囲 を示すビューボリュームを包含する外接四角形 (MBR)を、複数のサイズオーダの夫 々について算出し、
前記算出手段によって算出された複数のサイズオーダに夫々対応する MBRを示 すデータを、管理対象の映像の撮影範囲を示すデータとして記憶装置に格納する ことを含む映像管理方法。
[12] 管理対象の複数の映像に対して共通な代表サイズオーダのビューボリュームの M BRを算出するとともに、各映像に対して規定された複数のサイズオーダに夫々応じ たビューボリューム及び MBRを算出し、
前記代表サイズオーダに対応する MBRで前記複数の映像を階層的に管理するた めのツリー構造を決定し、
前記ツリー構造を用いて、前記ツリー中の各最下位ノードに前記算出手段で算出さ れた前記複数の映像の一つに対する前記代表サイズオーダ及び前記複数のサイズ オーダに応じた各 MBRを示すデータが格納され、前記ツリー中の下位ノードを有す る各ノードに該ノードが有する全ての下位ノードに夫々格納された前記代表サイズォ ーダ及び前記複数のサイズオーダに応じた各 MBRを示すデータで特定される各 M BRを夫々包含するサイズオーダ毎の MBRを示すデータが格納されたツリーを作成 し、
このツリーを前記記憶装置に格納する
ことをさらに含む請求項 11記載の映像管理方法。
[13] 任意の被写体の位置及びサイズが与えられた時に、前記ツリーについて用意され たサイズオーダの中から、前記被写体のサイズより大きく且つ最小のサイズオーダに 応じた MBRを検索 MBRとして決定し、
前記被写体の位置を含む検索 MBRを前記ツリーのルートノードから順にたどり、前 記ツリーの最下位ノードで検索される前記被写体の位置を含む検索 MBRに対応す る映像に係る情報を、映像検索結果の一つとして抽出する ことをさらに含む請求項 12記載の映像管理方法。
[14] コンピュータが、
検索対象の被写体の位置とサイズとが与えられた場合に、映像の撮影位置と撮影 方向と示すデータに基づいて算出された、複数のサイズオーダの夫々に対応する、 撮影される実空間上の範囲を示すビューボリュームを包含する外接四角形 (MBR)を 夫々示すデータを、管理対象の映像の撮影範囲を示すデータとして格納した記憶手 段にアクセスし、
前記被写体のサイズより大きく且つ最小の前記複数のサイズオーダの一つに対応 する前記記憶手段中の MBRを特定し、
特定した MBR中に前記被写体の位置が含まれて!/、る場合には、その MBRに対応 する映像に係るデータを、検索結果の一つとして抽出する
ことを含む映像検索方法。
[15] 前記記憶手段は、複数の映像を階層的に管理するためのツリーを記憶し、
前記ツリーは、前記複数の映像に対して共通な代表サイズオーダに応じて算出さ れた各映像に対応する MBRで決定されたツリー構造を有し、
前記ツリー中の各最下位ノードは、前記複数の映像の前記代表サイズオーダに応 じた MBRと、前記複数の映像の一つに対して規定された複数のサイズオーダに応じ て算出された複数の MBRとを夫々示すデータを有し、
前記ツリー中の下位ノードを有する各ノードは、該ノードが有する全ての下位ノード に夫々格納された前記代表サイズオーダ及び前記複数のサイズオーダに夫々対応 する各 MBRを示すデータで特定される各 MBRを夫々包含するサイズオーダ毎の M BRを示すデータを有し、
任意の被写体の位置及びサイズが与えられた時に、前記ツリーについて用意され たサイズオーダの中から、前記被写体のサイズより大きく且つ最小のサイズオーダに 応じた MBRを検索 MBRとして決定し、
前記被写体の位置を含む検索 MBRを前記ツリーのルートノードから順にたどり、前 記ツリーの最下位ノードで検索される前記被写体の位置を含む検索 MBRに対応す る映像に係る情報を、映像検索結果の一つとして抽出する ことをさらに含む請求項 14記載の映像検索方法。
[16] 映像の撮影位置と撮影方向と示すデータに基づいて、撮影される実空間上の範囲 を示すビューボリュームを包含する外接四角形 (MBR)を、複数のサイズオーダの夫 々について算出するステップと、
前記算出手段によって算出された複数のサイズオーダに夫々対応する MBRを示 すデータを、管理対象の映像の撮影範囲を示すデータとして記憶装置に格納するス テツプと
をコンピュータに実行させるプログラム。
[17] 管理対象の複数の映像に対して共通な代表サイズオーダのビューボリュームの M BRを算出するとともに、各映像に対して規定された複数のサイズオーダに夫々応じ たビューボリューム及び MBRを算出するステップと、
前記代表サイズオーダに対応する MBRで前記複数の映像を階層的に管理するた めのツリー構造を決定するステップと、
前記ツリー構造を用いて、前記ツリー中の各最下位ノードに前記算出手段で算出さ れた前記複数の映像の一つに対する前記代表サイズオーダ及び前記複数のサイズ オーダに応じた各 MBRを示すデータが格納され、前記ツリー中の下位ノードを有す る各ノードに該ノードが有する全ての下位ノードに夫々格納された前記代表サイズォ ーダ及び前記複数のサイズオーダに応じた各 MBRを示すデータで特定される各 M BRを夫々包含するサイズオーダ毎の MBRを示すデータが格納されたツリーを作成 するステップと、
このツリーを前記記憶装置に格納するステップと、
をコンピュータにさらに実行させる請求項 16記載のプログラム。
[18] 任意の被写体の位置及びサイズが与えられた時に、前記ツリーについて用意され たサイズオーダの中から、前記被写体のサイズより大きく且つ最小のサイズオーダに 応じた MBRを検索 MBRとして決定するステップと、
前記被写体の位置を含む検索 MBRを前記ツリーのルートノードから順にたどり、前 記ツリーの最下位ノードで検索される前記被写体の位置を含む検索 MBRに対応す る映像に係る情報を、映像検索結果の一つとして抽出するステップと をさらにコンピュータに実行させる請求項 17記載のプログラム。
[19] 検索対象の被写体の位置とサイズとが与えられた場合に、映像の撮影位置と撮影 方向と示すデータに基づいて算出された、複数のサイズオーダの夫々に対応する、 撮影される実空間上の範囲を示すビューボリュームを包含する外接四角形 (MBR)を 夫々示すデータを、管理対象の映像の撮影範囲を示すデータとして格納した記憶手 段にアクセスするステップと、
前記被写体のサイズより大きく且つ最小の前記複数のサイズオーダの一つに対応 する前記記憶手段中の MBRを特定するステップと、
特定した MBR中に前記被写体の位置が含まれて!/、る場合には、その MBRに対応 する映像に係るデータを、検索結果の一つとして抽出するステップと
をコンピュータに実行させるプログラム。
[20] 前記記憶手段は、複数の映像を階層的に管理するためのツリーを記憶し、
前記ツリーは、前記複数の映像に対して共通な代表サイズオーダに応じて算出さ れた各映像に対応する MBRで決定されたツリー構造を有し、
前記ツリー中の各最下位ノードは、前記複数の映像の前記代表サイズオーダに応 じた MBRと、前記複数の映像の一つに対して規定された複数のサイズオーダに応じ て算出された複数の MBRとを夫々示すデータを有し、
前記ツリー中の下位ノードを有する各ノードは、該ノードが有する全ての下位ノード に夫々格納された前記代表サイズオーダ及び前記複数のサイズオーダに夫々対応 する各 MBRを示すデータで特定される各 MBRを夫々包含するサイズオーダ毎の M BRを示すデータを有し、
任意の被写体の位置及びサイズが与えられた時に、前記ツリーについて用意され たサイズオーダの中から、前記被写体のサイズより大きく且つ最小のサイズオーダに 応じた MBRを検索 MBRとして決定するステップと、
前記被写体の位置を含む検索 MBRを前記ツリーのルートノードから順にたどり、前 記ツリーの最下位ノードで検索される前記被写体の位置を含む検索 MBRに対応す る映像に係る情報を、映像検索結果の一つとして抽出するステップと
をさらにコンピュータに実行させる請求項 19記載のプログラム。
PCT/JP2005/005907 2005-03-29 2005-03-29 映像管理システム WO2006103744A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007510272A JP4601666B2 (ja) 2005-03-29 2005-03-29 映像検索装置
PCT/JP2005/005907 WO2006103744A1 (ja) 2005-03-29 2005-03-29 映像管理システム
EP05727849A EP1871105A4 (en) 2005-03-29 2005-03-29 VIDEO MANAGEMENT SYSTEM
US11/905,384 US20080088627A1 (en) 2005-03-29 2007-09-28 Video management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/005907 WO2006103744A1 (ja) 2005-03-29 2005-03-29 映像管理システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US11/905,384 Continuation US20080088627A1 (en) 2005-03-29 2007-09-28 Video management system

Publications (1)

Publication Number Publication Date
WO2006103744A1 true WO2006103744A1 (ja) 2006-10-05

Family

ID=37053017

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/005907 WO2006103744A1 (ja) 2005-03-29 2005-03-29 映像管理システム

Country Status (4)

Country Link
US (1) US20080088627A1 (ja)
EP (1) EP1871105A4 (ja)
JP (1) JP4601666B2 (ja)
WO (1) WO2006103744A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013517567A (ja) * 2010-01-12 2013-05-16 クアルコム,インコーポレイテッド 軌道ベースのロケーション判断を使用した画像識別

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008131217A (ja) * 2006-11-20 2008-06-05 Funai Electric Co Ltd 携帯機器
US9325951B2 (en) 2008-03-03 2016-04-26 Avigilon Patent Holding 2 Corporation Content-aware computer networking devices with video analytics for reducing video storage and video communication bandwidth requirements of a video surveillance network camera system
US8872940B2 (en) * 2008-03-03 2014-10-28 Videoiq, Inc. Content aware storage of video data
RU2475968C1 (ru) * 2011-06-28 2013-02-20 Федеральное государственное унитарное предприятие "Государственный космический научно-производственный центр имени М.В. Хруничева" (ФГУП "ГКНПЦ им. М.В. Хруничева") Многофункциональный мобильный комплекс обеспечения потребителей мониторинговой информацией (мкопми)
WO2017036953A1 (en) * 2015-09-02 2017-03-09 Thomson Licensing Method, apparatus and system for facilitating navigation in an extended scene
EP3179406B1 (en) * 2015-12-11 2017-11-22 Axis AB Method for increasing reliability in monitoring systems
US9911194B2 (en) * 2016-05-26 2018-03-06 Disney Enterprises, Inc. Systems and methods for higher order dimensional space video segmentation
WO2018100131A1 (en) * 2016-12-02 2018-06-07 Koninklijke Kpn N.V. Determining size of virtual object

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0749964A (ja) * 1993-08-06 1995-02-21 Matsushita Electric Ind Co Ltd 3次元動画像生成装置
JP2004007271A (ja) * 2002-05-31 2004-01-08 Matsushita Electric Ind Co Ltd オーサリング装置およびオーサリング方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5627915A (en) * 1995-01-31 1997-05-06 Princeton Video Image, Inc. Pattern recognition system employing unlike templates to detect objects having distinctive features in a video field
US6545687B2 (en) * 1997-01-09 2003-04-08 Canon Kabushiki Kaisha Thumbnail manipulation using fast and aspect ratio zooming, compressing and scaling
EP0878965A3 (en) * 1997-05-14 2000-01-12 Hitachi Denshi Kabushiki Kaisha Method for tracking entering object and apparatus for tracking and monitoring entering object
US6816184B1 (en) * 1998-04-30 2004-11-09 Texas Instruments Incorporated Method and apparatus for mapping a location from a video image to a map
JP2000232642A (ja) * 1999-02-10 2000-08-22 Sony Corp 画像処理装置および方法、撮像システム、並びに提供媒体
US6813395B1 (en) * 1999-07-14 2004-11-02 Fuji Photo Film Co., Ltd. Image searching method and image processing method
US20050162515A1 (en) * 2000-10-24 2005-07-28 Objectvideo, Inc. Video surveillance system
EP1211614A1 (fr) * 2000-11-28 2002-06-05 Koninklijke Philips Electronics N.V. Procédé de recherche dans une structure hiérarchique d'objets
KR100419575B1 (ko) * 2000-12-05 2004-02-19 한국전자통신연구원 고차원 색인구조를 위한 벌크 로딩방법
JP3834641B2 (ja) * 2003-01-31 2006-10-18 国立大学法人大阪大学 カメラ映像データ管理システム、カメラ映像データ管理方法、およびプログラム
EP1622081A1 (en) * 2003-04-21 2006-02-01 NEC Corporation Video object recognition device and recognition method, video annotation giving device and giving method, and program
JP4281402B2 (ja) * 2003-04-21 2009-06-17 ソニー株式会社 画像管理システム及び画像管理方法、並びにコンピュータ・プログラム
JP2004326193A (ja) * 2003-04-21 2004-11-18 Sony Corp 画像管理システム及び画像管理方法、並びにコンピュータ・プログラム
JP2004326192A (ja) * 2003-04-21 2004-11-18 Sony Corp 画像管理システム及び画像管理方法、並びにコンピュータ・プログラム
JP2005286379A (ja) * 2004-03-26 2005-10-13 Fuji Photo Film Co Ltd 撮影補助システム及び撮影補助方法
US20060007308A1 (en) * 2004-07-12 2006-01-12 Ide Curtis E Environmentally aware, intelligent surveillance device
US7746378B2 (en) * 2004-10-12 2010-06-29 International Business Machines Corporation Video analysis, archiving and alerting methods and apparatus for a distributed, modular and extensible video surveillance system
US7480414B2 (en) * 2004-10-14 2009-01-20 International Business Machines Corporation Method and apparatus for object normalization using object classification

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0749964A (ja) * 1993-08-06 1995-02-21 Matsushita Electric Ind Co Ltd 3次元動画像生成装置
JP2004007271A (ja) * 2002-05-31 2004-01-08 Matsushita Electric Ind Co Ltd オーサリング装置およびオーサリング方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
OHTA T. ET AL.: "Gazo kara no Object Teigi Jido Chushutsu Shuho no Kenkyu. (Automatic Extraction of Image Object Definition from Sample Images)", IEICE TECHNICAL REPORT (PRMU2002-243 TO 263 PATTERN NINSHIKI . MEDIA RIKAI), vol. 102, no. 708, 7 March 2003 (2003-03-07), pages 93 - 98, XP003002016 *
See also references of EP1871105A4 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013517567A (ja) * 2010-01-12 2013-05-16 クアルコム,インコーポレイテッド 軌道ベースのロケーション判断を使用した画像識別

Also Published As

Publication number Publication date
US20080088627A1 (en) 2008-04-17
JP4601666B2 (ja) 2010-12-22
EP1871105A4 (en) 2008-04-16
JPWO2006103744A1 (ja) 2008-09-04
EP1871105A1 (en) 2007-12-26

Similar Documents

Publication Publication Date Title
JP4601666B2 (ja) 映像検索装置
US9509968B2 (en) Apparatus, system, and method for annotation of media files with sensor data
US8447792B2 (en) System and method for presenting user generated geo-located objects
US10473465B2 (en) System and method for creating, storing and utilizing images of a geographical location
Ay et al. Viewable scene modeling for geospatial video search
CN101506764B (zh) 全景环形用户界面
KR20130085942A (ko) 정보 처리 장치, 정보 처리 시스템, 및 프로그램
US8913083B1 (en) System and method of generating a view for a point of interest
US9600932B2 (en) Three dimensional navigation among photos
Kim et al. Design and implementation of geo-tagged video search framework
Lu et al. GeoUGV: User-generated mobile video dataset with fine granularity spatial metadata
US9437004B2 (en) Surfacing notable changes occurring at locations over time
Hwang et al. MPEG-7 metadata for video-based GIS applications
Han et al. Video data model and retrieval service framework using geographic information
Widiyaningtyas et al. Adaptive Campus Virtual Tour using Location-Based Services
JP2006277196A (ja) 画像データの関連情報提供技術
Lu et al. Efficient indexing and querying of geo-tagged aerial videos
KR101307340B1 (ko) 멀티미디어 정보와 공간 정보를 결합한 복합 컨텐츠의 관리 장치 및 방법
Lewis Linking spatial video and GIS
Kim et al. Automatic geotagging and querying of indoor videos
Lu Efficient Indexing and Querying of Geo-Tagged Mobile Videos
JP2004112614A (ja) 情報収集装置および情報収集処理システム
Kalva et al. Design and Development of a System for Aerial Video Survey of Large Marine Animals

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2007510272

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 11905384

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Country of ref document: DE

WWE Wipo information: entry into national phase

Ref document number: 2005727849

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: RU

WWW Wipo information: withdrawn in national office

Country of ref document: RU

WWP Wipo information: published in national office

Ref document number: 2005727849

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 11905384

Country of ref document: US