JP2007158649A - 映像メタデータ補正装置及びプログラム - Google Patents

映像メタデータ補正装置及びプログラム Download PDF

Info

Publication number
JP2007158649A
JP2007158649A JP2005350265A JP2005350265A JP2007158649A JP 2007158649 A JP2007158649 A JP 2007158649A JP 2005350265 A JP2005350265 A JP 2005350265A JP 2005350265 A JP2005350265 A JP 2005350265A JP 2007158649 A JP2007158649 A JP 2007158649A
Authority
JP
Japan
Prior art keywords
video
metadata
section
video metadata
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005350265A
Other languages
English (en)
Other versions
JP4606318B2 (ja
Inventor
Sotaro Kaneko
宗太郎 金子
Masami Mizutani
政美 水谷
Eiji Morimatsu
映史 森松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005350265A priority Critical patent/JP4606318B2/ja
Priority to US11/390,379 priority patent/US7801927B2/en
Publication of JP2007158649A publication Critical patent/JP2007158649A/ja
Application granted granted Critical
Publication of JP4606318B2 publication Critical patent/JP4606318B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42202Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] environmental sensors, e.g. for detecting temperature, luminosity, pressure, earthquakes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Emergency Management (AREA)
  • Environmental & Geological Engineering (AREA)
  • Environmental Sciences (AREA)
  • Remote Sensing (AREA)
  • Studio Devices (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】映像に関連し且つ同期する映像メタデータを適切に補正する。
【解決手段】映像メタデータ補正装置は、映像と同期した映像メタデータに関する情報を格納する第1映像メタデータ格納部内の映像メタデータに関する情報と当該映像メタデータに関する情報と相関を有し且つ映像から抽出される映像特徴量とに基づき、映像メタデータに誤りが存在する区間を特定する区間特定手段と、上記区間における映像メタデータを、映像特徴量等に基づき補正し、補正後の映像メタデータを第2映像メタデータ格納部に格納する補正手段とを有する。このように、映像メタデータに誤りが存在すると判断された区間に対して、上で述べたような特徴量を用いて補正を行うことによって、映像メタデータを取得するセンサ本来の計測精度を利用しつつ、誤って計測された部分だけを効果的に補正することが可能となる。
【選択図】図2

Description

本発明は、映像に関連且つ同期するメタデータを補正するための技術に関する。
デジタル映像記録装置の普及により、各種センサから得られる環境情報を、映像と同期させて記録することで、映像が持つ情報をより効果的に引き出す技術が求められている。
例えば、映像と共にデジタル映像記録装置(例えばビデオカメラ)の位置や方位角情報を記録し、記録した位置及び方位角と地図情報とを検索時に照合することで、映像内の被写体の情報を抽出することが可能となる。これにより、工事現場の監理を目的とした工事写真を、撮影位置及び方位角付きのビデオ映像に置き換えることで、より詳細な工事記録を行うことが可能となる。また、自動車のような移動体においては、運転状態を記録するドライブレコーダなどにより、映像と同時に位置、方位角等を記録して、事故発生時に原因究明のため用いることもある。さらに、携帯電話機をはじめとする携帯端末においては、持っている人間が行動の軌跡を映像と共に記録したり、マン・ナビゲーションシステムとして利用する際にも、映像と位置や方位角との組み合わせは有効である。
このようなシステムを実現するためのデジタル映像記録装置は、電子コンパス付きGPS(Global Positioning System)装置とデジタル・ビデオカメラとを組み合わせることで実現でき、映像に対して位置や方位角のメタデータを付与する従来技術も、例えば特開平10−42282号公報や特開2000−331019号公報に開示されている。
特開平10−42282号公報には、撮影映像に地図情報を重畳させて提示するシステムの中で、映像記録時に、ジャイロセンサ、GPSセンサ等を用いて得られた撮影位置及び撮影角度をメタ情報として付与する技術が開示されている。
また、特開2000−331019号公報には、自動的に景観画像にインデクスを付与するための技術が開示されている。具体的には、入力制御処理部は、映像情報データベースから、該当個所の映像情報データを入力する。参照モデル算出処理部は、前フレームを撮影したカメラパラメータに幅を持たせたパラメータで、地図情報から参照モデルを生成する。画像マッチング処理部は、処理画像フレームの画像から輪郭情報を抽出し、それを参照モデルと比較することで、最適なモデルを選択し、カメラパラメータを算出する。インデクス処理部は、カメラパラメータを利用して、画像座標系に地図情報を投影することで、フレーム中のオブジェクト領域を算出し、そのオブジェクトを構成する属性データをオブジェクトに付与する。テクスチャ抽出処理部は、算出されたオブジェクトの画像を取得することで、当該オブジェクトのテクスチャ情報を地図情報として取得する。このようにすれば、蓄積された、あるいは実時間で獲得された時系列景観画像に対して、地図情報を利用してそのフレーム内のオブジェクトに自動的にインデクスを付与することにより、画像中に何が写っているかを提示したり、所望する画像を検索したりできる。
特開平10−42282号公報 特開2000−331019号公報
しかし、各種センサは、記録時の動作環境等に起因し、誤った値を示すことがある。例えば、現在主に使用されている方位角センサである2軸地磁気式の電子コンパスは、鉛直方向の地磁気の影響を受けるため、カメラの上下運動により異なる方位角情報を指し示してしまう場合がある。また、位置情報を計測するためのGPSも、マルチパスの発生などで計測位置に誤差が生じる場合がある。映像提示時に、これらのセンサ情報が誤っていると、利用者に対して正しく映像情報を提示できなくなり、混乱をきたすという問題がある。このような問題について第1の従来技術は考慮していない。
また、上で述べた第2の従来技術は、センサ情報の利用を否定し、映像からの情報に過分に依存している点に問題がある。本来、各種センサは対象を計測するために存在するものであり、映像から得られる情報よりも確度は高い。すなわち、センサによる映像メタデータの付与は基本的には有効であるが、一方で映像メタデータの誤りは、それに基づくサービス性能に大きな影響を与えることになる。実世界において、センサによって常に正しい値を記録するのは困難であるため、誤って記録された部分を検出し、補正するための技術が必要となる。
従って、本発明の目的は、映像に関連し且つ同期する映像メタデータを適切に補正する技術を提供することである。
本発明に係る映像メタデータ補正装置は、映像と同期したセンサ情報である映像メタデータに関する情報(例えば、映像メタデータ、映像メタデータの変動量など)を格納する第1映像メタデータ格納部内の映像メタデータに関する情報と当該映像メタデータに関連する情報と相関を有し且つ映像から抽出される映像特徴量とに基づき、映像メタデータに誤りが存在する区間を特定する区間特定手段と、上記区間における映像メタデータを、映像特徴量又は映像メタデータに関する情報と相関を有し且つ映像から抽出される第2の映像特徴量に基づき補正し、補正後の映像メタデータを第2映像メタデータ格納部に格納する補正手段とを有する。このように、映像メタデータに誤りが存在すると判断された区間に対して、上で述べたような特徴量を用いて補正を行うことによって、映像メタデータを取得するセンサ本来の計測精度を利用しつつ、誤って計測された部分だけを効果的に補正することが可能となる。
また、上で述べた区間特定手段が、映像の時系列データから、映像メタデータに関する情報と相関を有し且つ映像の時間変化に応じた特徴量を映像特徴量として抽出する手段を有するようにしてもよい。このようにすれば、補正を行うべき区間を適切に特定することができるようになる。
さらに、上で述べた補正手段が、映像特徴量又は第2の映像特徴量の変動量に比例する映像メタデータの補正量を算出する手段を有するようにしてもよい。このように映像メタデータの補正量を生成することによって、映像の変化に応じた映像メタデータを生成することができるようになる。
また、上で述べた補正手段が、映像特徴量又は第2の映像特徴量の変化量に比例し且つ上記区間の前後又は上記区間及び上記区間の少なくとも前又は後のサブ区間を含む補正区間の前後を連続するように連結するための前記映像メタデータの補正量を算出する手段を有するようにしてもよい。このようにすることによって、映像の変化に応じたより自然な変化を映像メタデータに持たせることができるようになる。
なお、本映像メタデータ補正装置は、コンピュータと当該コンピュータに実行されるプログラムとで構成することができ、このプログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。また、ネットワークなどを介してデジタル信号として配信される場合もある。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。
本発明によれば、映像に関連し且つ同期する映像メタデータを適切に補正することができるようになる。
図1を用いてセンサ情報、すなわち映像メタデータ(以下、単にメタデータと略する場合もある。)を補正する映像メタデータ補正装置を用いた被写体検索システムの一例を説明する。被写体検索システムは、方位角の計測を行うセンサである電子コンパス1と、位置を計測するセンサであるGPS2と、時刻データを出力する時計3と、動画像を撮影するビデオカメラ4と、時計3からの時刻データと共にビデオカメラ4が撮影した映像のデータとを記録する処理を実施する映像記録部5と、映像記録部5の出力である時刻付き映像データを格納する映像データ格納部6と、地図上の建物その他の地図要素のデータを保持し、位置及び方位角のデータにより当該地図要素を検索可能な地図データベース(DB)7と、電子コンパス1及びGPS2からの映像メタデータを必要に応じて補正する映像メタデータ補正装置100と、映像メタデータ補正装置100の出力である各種メタデータを格納するメタデータ格納部8と、ユーザに対するユーザインタフェースとなる入出力装置などを含むユーザインタフェース部11と、映像データ格納部6に格納された映像のデータをユーザインタフェース部11を介して入力された指示等に応じてユーザインタフェース部11に出力する映像再生部10と、ユーザインタフェース部11を介して入力された指示等に応じて映像再生部10によりユーザインタフェース部11に出力される映像の時刻データ(記録時刻)などに基づきメタデータ格納部8を検索し、抽出されたメタデータにより地図DB7をさらに検索して地図要素のデータを取得し、ユーザインタフェース部11に出力する検索制御部9とを有する。
次に、図1に示した被写体検索システムの動作を簡単に説明しておく。例えば、ユーザは、ユーザインタフェース部11を介して映像再生部10から出力された映像とその記録時刻を確認する。そして、映像中の被写体を検索する場合には、ユーザインタフェース部11を介して被写体が出現した際の記録時刻を検索制御部9に検索要求として入力する。このような検索要求を、映像再生部10から検索制御部9に随時出力される時刻データを基に自動的に生成するようにしてもよい。
そうすると、検索制御部9は、入力された記録時刻に対応する位置及び方位角の情報をメタデータ格納部8から抽出して、地図DB7を当該位置及び方位角で検索することによって該当する地図要素のデータを含む検索結果を、ユーザインタフェース部11を介してユーザに出力する。
検索制御部9による地図DB7の検索について、その概念を図2を用いて説明しておく。図2では、例えば扇形D1の中心角を視野角とする範囲で撮影を行っていたとする。その際、撮影位置である位置Pというメタデータと、撮影方向である方位角Cというメタデータとから地図DB7を検索し、被写体を建物Aと特定し、建物Aのデータをユーザインタフェース部11を介してユーザに提示する。なお、建物等の高さを情報として有する地図DB7を用いて、別の建物が隠れているかどうかの隠蔽判定を行うこともある。また、画面内に複数の建物などが存在している場合には、方位角Cからの変位に基づき他の建物を特定する場合もある。
当然ながら、この被写体検索システムではセンサ情報が正しくなければ被写体の正確なデータを提示することはできない。例えば、本来の方位角Cに対して、何らかの原因で方位C’として記録されてしまった場合には、扇形D2の中心角を視野角とする範囲で撮影を行っており、実際の被写体が建物Aであるにもかかわらず建物A’と判定されてしまい、検索結果に誤りが生じてしまう。
一方、本実施の形態における電子コンパス1は、2軸地磁気電子コンパスであって、鉛直方向の地磁気の影響に起因する方位角の誤りを生じやすい。具体的には、上下にカメラを傾ける、すなわち撮影時にビルを仰ぎ見るような、よく行われるカメラワークを行うと、方位角の計測誤りを発生してしまう。
従って、映像メタデータ補正装置100を用いて以下で述べるような処理を行うことによってメタデータの補正を行う。なお、以下では方位角の補正について一例を述べる。
図3に、映像メタデータ補正装置100等の機能ブロック図を示す。なお、図3では、図1に示されており且つ映像メタデータ補正装置100に関連する機能ブロックについても示されている。また、映像メタデータ補正装置100は、GPS2からの出力については、時計3からの時刻のデータと対応付けてメタデータ格納部8に格納するが、図3ではこれについては省略している。
映像メタデータ補正装置100は、補正前のメタデータ等を格納する仮メタデータ格納部102と、電子コンパス1から出力される方位角のデータと時計3からの時刻のデータとを対応付けて仮メタデータ格納部102に格納するメタデータ記録部101と、仮メタデータ格納部102に格納されたデータを用いて誤り候補区間を抽出する誤り候補区間抽出部103と、誤り候補区間抽出部103により抽出された誤り候補区間のデータを格納する誤り候補区間データ格納部104と、映像データ格納部6に格納されている映像データから被写体の移動量等を抽出する移動量抽出部105と、移動量抽出部105により抽出された移動量などのデータを格納する移動量データ格納部106と、仮メタデータ格納部102と誤り候補区間データ格納部104と移動量データ格納部106とに格納されているデータを用いて誤り候補区間のうち誤りが発生している区間を特定する処理などを実施する誤り判定部107と、仮メタデータ格納部102と移動量データ格納部106とに格納されたデータを用いて誤り判定部107により特定された誤り区間等についてメタデータの補正を行うメタデータ補正部108とを有する。なお、メタデータ格納部8は、原則として、誤り区間に該当しない区間については誤り判定部107により仮メタデータ格納部102のデータを、誤り区間に該当する区間についてはメタデータ補正部108により補正されたメタデータを格納する。
次に、図3に示した映像メタデータ補正装置100等の処理について図4乃至図14を用いて説明する。最初に、メタデータ記録部101は、電子コンパス1から方位角のデータを例えば定期的(例えば1秒ごと)に取得し、時計3からのその時の時刻と共に仮メタデータ格納部102に格納し、映像記録部5は、ビデオカメラ4から映像のデータを定期的に取得し、時計3からのその時の時刻と共に映像データ格納部6に格納する(ステップS1)。なお、時刻と共に登録され、映像とメタデータとの同期が取れていれば、必ずしも定期的でなくとも良い。
ここで、例えば図5に示すようなデータが仮メタデータ格納部102に格納される。図5の例では、時刻t1,t2,t3,t4に対応して、方位角(度)の値が登録されている。また、例えば図6に示すようなデータが映像データ格納部6に格納される。図6の例では、時刻t1,t2,t3,t4に対応して、対応するフレーム・データが登録されている。但し、時刻データが対応付けられていない映像データが時刻t1とt2の間などに存在する場合もある。
次に、誤り候補区間抽出部103は、方位角差分値を算出し、例えば仮メタデータ格納部102に格納する(ステップS3)。具体的には、時刻t2における方位角の値と時刻t1における方位角の値との差を算出し、時刻t3における方位角の値と時刻t2における方位角の値との差を算出するといった処理を行う。ステップS3を実施すると、例えば図7に示すようなデータが例えば仮メタデータ格納部102に格納される。具体的には、各時刻について、方位角(度)及び方位角差分(度)が格納されている。なお、時刻t2における方位角の値と時刻t1における方位角の値との差を、時刻t2における方位角差分の値として登録している。以降についても同様に算出され登録される。
そして、誤り候補区間抽出部103は、仮メタデータ格納部102に格納されている方位角差分の時系列データに基づき、誤り候補区間を抽出する(ステップS5)。図8を用いて誤り候補区間の典型例を説明する。
図8は、電子コンパス1付きのビデオカメラ4を上に傾けしばらく静止した後に、ビデオカメラ4の傾きを元に戻した場合に、電子コンパス1により出力される方位角から算出される方位角差分の時間変化を表すグラフである。横軸は時間を表し、縦軸は方位角差分を表す。なお、方位角差分が正であれば右方向(すなわち時計回り)に回転しており、方位角差分が負であれば左方向(すなわち反時計回り)に回転していることを示している。このようにビデオカメラ4を上下に動かしただけであり、電子コンパス1は、水平方向の方位角がほとんど変化しない状況である。しかし、上で述べた電子コンパス1の性質から、方位角差分が大きな値を示してしまうことがある。すなわち、誤りの開始時刻Tsで方位角差分D(Ts)=dが計測されてしまう。その後ビデオカメラ4が静止している間(時刻Ts+1からTeまでの区間Pe)は、方位角差分は0付近の値を示す。そして、ビデオカメラ4の傾きを元に戻すと(時刻Te+1)、元の方位角に戻る。従って、今までの誤った方位角から復帰するために、最初の誤りに現れた方位角差分dと同じような大きさで符号が逆のd’(=D(Te+1)≒−d)という方位角差分が現れる。このとき、方位角差分のd’が現れるときは方位角は正しい方位角に戻っているので、誤り区間Peを時刻TsからTeとし、方位角差分のd’はTe+1の時に現れていることとする。このように、誤り候補区間抽出部103は、Ts乃至Te+1に現れるような方位角差分の時系列変化を探索し、Ts乃至Teを誤り候補区間として特定し、当該誤り候補区間のデータ(例えば開始及び終了時刻データ)を誤り候補区間データ格納部104に格納する。また、別に誤りが生じるケースが存在する場合には、当該誤りが生ずるケースに対応する誤り候補区間を抽出する。
そして、誤り判定部107は、誤り候補区間データ格納部104に誤り候補区間のデータが登録されているか否かにより誤り候補区間が存在するか判断する(ステップS7)。誤り候補区間が存在しない場合には処理を終了する。一方、誤り候補区間が存在する場合には、誤り判定部107は、1つ誤り候補区間を特定する。
次に、移動量抽出部105は、映像データ格納部6に格納された映像の時系列データを用いて、映像における水平方向移動量を算出し、移動量データ格納部106に格納する(ステップS9)。
映像における水平方向移動量は、方位角差分と相関を有する特徴量である。例えば図9(a)に示すように、ビデオカメラ4を、撮影しながら右回りに回した場合には、ビデオカメラ4に付けられた電子コンパス1からは回転前後の方位角のデータが出力され、回転角に対応する方位角差分が算出される。また、撮影範囲がD3からD4に変化するので、図9(b)に示すように、ビデオカメラ4による映像中の被写体(例えば建物)は、全体的に左に動くことになる。また、大きく回った際には方位角差分の値は大きくなるが、やはりこれに応じて映像中の被写体の移動量も大きくなる。このように、映像の水平移動量と方位角差分には相関があるといえる。移動量抽出部105で抽出すべき特徴量であるフレーム間の水平移動量は、既存のグローバルモーションのアフィンパラメータ算出技術により算出可能である。その中でも、前景と背景を分離し、背景の移動量を算出できるような既存技術を用いるとより有効的である。
図6に示すような映像のデータが映像データ格納部6に格納されている場合には、映像中の被写体(建物)は例えば5ピクセル毎右に動いており、移動量抽出部105により抽出され移動量データ格納部106に格納されるデータは、例えば図10に示すようなデータである。右方向の移動は、左方向の回転を示しており、右方向の回転が正とすると−5ピクセル移動したことになる。図10の例では、時刻t2,t3,t4に対応して、映像の水平方向移動量の値が登録されている。時刻t2の映像水平方向移動量は、時刻t2の位置と時刻t1の位置との差であり、以降についても同様に算出され登録される。
さらに、誤り判定部107は、仮メタデータ格納部102に格納されたデータ(図7)と移動量データ格納部106に格納されたデータ(図10)と誤り候補区間データ格納部104に格納されたデータを用いて、以下で述べる方法に従って比較用スケーリング係数αを算出し、メインメモリなどの記憶装置に格納する(ステップS11)。具体的には、比較用スケーリング係数αは以下のような式で定義される。
Figure 2007158649
ここで、aは計算途中のスケーリング係数、tは時刻、Tsは誤り候補区間開始時刻、Teは誤り候補区間終了時刻、D(t)は時刻tにおける方位角差分、X(t)は時刻t−1から時刻tまでの映像水平移動量(実際的には平均値)を表す。また、argは、以下の関数についての引数aという意味である。なお、C(t)を時刻tの方位角とすると、D(t)=C(t)−C(t−1)が成立する。
すなわち、同時刻における方位角差分と映像水平移動量とを比較する際に、映像水平移動量についてはスケーリング係数a倍した上で方位角差分と比較する。比較の結果であるそれらの差(すなわち残差)の絶対値の二乗を、誤り候補区間において累積した値が最小となるようにスケーリング係数aを決定すれば、その時の値が比較用スケーリング係数αとなる。
すなわち、どの時刻においても同じスケーリング係数aを用いて映像水平移動量をスケーリングして、方位角差分との残差の絶対値を小さくすることができれば、上で述べたように方位角差分と映像水平移動量とは相関を有するため、当該誤り候補区間は、誤りのように見えて誤りではないと判断できる。この例を図11を用いて説明する。横軸は時間を表し、縦軸は実線については方位角差分を、点線については映像水平移動量を表している。適切なスケーリング係数αで調整した映像水平移動量を各時刻においてプロットすると点線を描くことができ、実線で表した方位角差分の時間変化にほぼ一致するようになる。
しかし、誤り候補区間が実際に誤り区間である場合には、映像水平移動量と方位角差分との相関はないため、スケーリング係数αが0として算出される場合もある。また、実際には映像水平移動量がほとんど0で無理にスケーリングして方位角差分に適合させるような場合もある。従って、αについては、0より大きく、予め定めた範囲内(下限ALow及び上限AHighの範囲内)に入らなければ、当該誤り候補区間はまさに誤り区間であると判断するものとする。下限ALow及び上限AHighは、実験により求めることができる。
なお、上では誤り候補区間をαの算定基礎期間としているが、誤り候補区間前後の所定区間を加えた区間を算定基礎期間とするようにしてもよい。但し、その区間は別の誤り候補区間を含んでいてはいけない。
αが各誤り候補区間で異なる理由は、それぞれの場面で方位角差分に対応する水平移動量が、撮影している背景との距離等に依存して異なるためである。一方、局所時間においては、方位角差分と水平移動量との間には相関性があると考えても問題なく、誤り候補区間内においてαを一意に決定している。
上でも述べてしまったが、その後、誤り判定部107は、算出された比較用スケーリング係数αが所定範囲内(下限ALow及び上限AHighの範囲内)であるか判断する(ステップS13)。もし、比較用スケーリング係数αが所定範囲内であると判断された場合には、誤り候補区間は実際には誤り区間ではなかったとして、ステップS19に移行する。なお、誤り候補区間とされた区間のメタデータをメタデータ格納部8に格納する。
一方、比較用スケーリング係数αが所定範囲内でないと判断された場合には、誤り判定部107は、誤り候補区間を誤り区間として指定してメタデータ補正部108に処理を指示する。図7及び図10に示した例では、α=0となるので所定範囲外と判断される。メタデータ補正部108は、仮メタデータ格納部102に格納されたデータ(図7)と移動量データ格納部106に格納されたデータ(図10)を用いて、以下で述べる方法に従って補正用スケーリング係数βを算出し、例えばメインメモリ等の記憶装置に格納する(ステップS15)。具体的には、補正用スケーリング係数βは、以下のように定義される。
Figure 2007158649
なお、Q(β)=0であれば、(3)式を変形して以下の式が成立する。
Figure 2007158649
このように、|Q(b)|を最小化する引数bを補正用スケーリング係数βとする。従って、Q(β)=0が好ましい。そして、Q(b)は、誤り区間の方位角を映像水平移動量で調整した際の残差を示しており、より具体的には、誤り区間の直前の方位角C(Ts−1)と、誤り区間の直後の方位角C(Te+1)との差を、スケーリング係数b倍の映像水平移動量X(t)の、誤り区間における累積値で調整する関数である。
(2)式乃至(4)式に示された補正のモデルを図12(a)及び(b)を用いて説明する。図12(a)は、映像水平移動量の時間変化を表しており、その縦軸は映像水平移動量を表し、横軸は時間を表す。移動量データ格納部106に格納されたデータをそのまま示している。また、図12(b)は、方位角の時間変化を表しており、その縦軸は方位角、横軸は時間を表している。ここで、誤り区間Peにおける映像水平移動量X1、X2及びX3をスケーリング係数b倍して累積した値を、誤り区間Peの直前の方位角C(Ts−1)と直後の方位角C(Te+1)との差と一致させることができれば|Q(b)|=0となり、誤り区間前後を最も平滑に且つ完全につなぐことができるようになる。このような場合のbをβとして生成すれば、X1×β、X2×β、X3×βによって方位角の補正量が算出される。
図12(b)には、誤り区間において点線で電子コンパス1の出力値もプロットされているがその値を用いることなく、誤り区間内の第1の時刻の補正量X'1(=X1×β)によって直前の方位角の値を補正し、第2の時刻の補正量X'2(=X2×β)によって第1の時刻における補正方位角の値をさらに補正し、さらに第3の時刻の補正量X'3(=X3×β)によって第2の時刻における補正方位角の値をさらに補正する。そうすると図12(b)に示すように、星印の値が補正後の方位角として算出されるようになり、滑らかに誤り区間前後と連結されるようになる。
これにより、例えば単純に正しい区間同士を線形に結ぶ方法と比較して、映像の動きにあわせて補正を行っているため、より実際の状況を反映した確度の高い補正になっている。なお、比較用スケーリング係数αと同様に、誤り区間ではなく誤り区間の前後の所定区間を含む区間についてβを算出するようにしても良い。
その後、上で述べたように、メタデータ補正部108は、補正用スケーリング係数βと、移動量データ格納部106に格納された、誤り区間の映像水平移動量とを用いて補正量を算出し、当該補正量及び仮メタデータ格納部102に格納された誤り区間の前の値を用いて誤り区間の各方位角の値を補正してゆき、補正後の方位角のデータをメタデータ格納部8に格納する(ステップS17)。例えばステップS15でβ=1.2と算出されたとすると、図7及び図10の例では、補正量は時刻t2及びt3において−6と算出される。従って、図13に示すように、時刻t1における方位角の89と−6とから、時刻t2の補正後方位角は83となり、時刻t3の補正後方位角は77となる。さらに、補正量の−6と時刻t3の補正後方位角の77とから、時刻t4の補正後方位角は71となり、実際も時刻t4の補正後方位角は71であるから、滑らかに補正されていることが分かる。図13においてハッチングが付された部分が補正された部分である。最終的に図14に示すようなデータがメタデータ格納部8に格納される。そして、ステップS19に移行する。
ステップS19では、全ての誤り区間を処理したか判断する。例えば処理対象の時間帯に複数の誤り区間Peが存在している場合には、全ての誤り区間を処理するまでステップS9に戻る。全ての誤り区間を処理し終えた場合には本処理を終了する。
以上のような処理を行うことによって、映像に応じたメタデータが取得できたかを確認することができ、映像と一致しないようなメタデータが取得できた場合には、映像に応じたメタデータとなるように適切に補正を行うことができるようになる。
以上本発明の実施の形態を説明したが、本発明はこれに限定されない。例えば、図1及び図3に示した機能ブロックは、必ずしもプログラムモジュール若しくはデバイス又は部品に対応しない場合もある。
また、映像メタデータ補正装置100の処理は、映像及びセンサ情報を取得しながらリアルタイムで処理することも可能であり、別の形態として、一度誤りを含めてすべて記録したセンサ情報について、一括処理を行って補正してもよい。また、方位角以外、例えば位置情報も、移動距離の差分と映像との移動量から妥当性を判断することで誤り検出を行い、平滑化による補正を行うことができる。このように本発明はセンサ一般に対して広範に適用が可能な技術である。
また本発明は、自動車におけるドライブレコーダの位置及び方位角や、GPS機能付き携帯電話機によるヒューマン・ナビゲーション時の位置及び方位角記録時の映像メタデータ補正方式としても実施できる。
(付記1)
映像と同期したセンサ情報である映像メタデータに関する情報を格納する第1映像メタデータ格納部内における映像メタデータに関する情報と当該映像メタデータに関する情報と相関を有し且つ前記映像から抽出される映像特徴量とに基づき、前記映像メタデータに誤りが存在する区間を特定する区間特定手段と、
前記区間における前記映像メタデータを、前記映像特徴量又は前記映像メタデータに関する情報と相関を有し且つ前記映像から抽出される第2の映像特徴量に基づき補正し、補正後の映像メタデータを第2映像メタデータ格納部に格納する補正手段と、
を有する映像メタデータ補正装置。
(付記2)
前記映像メタデータに関する情報が、前記映像メタデータの変動量であり、
前記区間特定手段が、
前記第1映像メタデータ格納部に格納されている前記映像メタデータの変動量の時間変化に基づき、前記映像メタデータに誤りが存在する区間の候補を抽出する手段
を有する付記1記載の映像メタデータ補正装置。
(付記3)
前記区間特定手段が、
前記映像の時系列データから、前記映像メタデータに関する情報と相関を有し且つ前記映像の時間変化に応じた特徴量を映像特徴量として抽出する手段
を有する付記1記載の映像メタデータ補正装置。
(付記4)
前記区間特定手段が、
特定の区間における前記映像メタデータに関する情報と前記映像特徴量との同時刻における残差を含む関数の値を最小化する当該関数の係数値が、所定の範囲内に入るか否かを判断する手段
を含む付記1記載の映像メタデータ補正装置。
(付記5)
前記補正手段が、
前記映像特徴量又は前記第2の映像特徴量の変動量に比例する前記映像メタデータの補正量を算出する手段
を有する付記1記載の映像メタデータ補正装置。
(付記6)
前記補正手段が、
前記映像特徴量又は前記第2の映像特徴量の変動量に応じて前記映像メタデータを平滑的に変化させるような前記映像メタデータの補正量を算出する手段
を有する付記1記載の映像メタデータ補正装置。
(付記7)
前記補正手段が、
前記映像特徴量又は前記第2の映像特徴量の変動量に比例し且つ前記区間の前後又は前記区間及び前記区間の少なくとも前又は後のサブ区間を含む補正区間の前後を連続するように連結するための前記映像メタデータの補正量を算出する手段
を有する付記1記載の映像メタデータ補正装置。
(付記8)
前記センサ情報が、方位角センサの値とGPSの位置情報との少なくともいずれかである付記1記載の映像メタデータ補正装置。
(付記9)
付記1記載の映像メタデータ補正装置と、
前記映像のデータを格納する映像データ格納部と、
映像のデータを撮影して前記映像データ格納部に格納するカメラと、
前記センサ情報を取得し、前記第1映像メタデータ格納部に格納するセンサと、
を有する映像メタデータ記録装置。
(付記10)
付記1記載の映像メタデータ補正装置と、
前記映像のデータを格納する映像データ格納部と、
各地点の地図要素のデータを保持する地図データベースと、
前記映像データ格納部に格納された映像と前記第2映像メタデータ格納部に格納され且つ前記映像に同期する映像メタデータとを読み出し、前記映像メタデータにより前記地図データベースを検索して該当する地図要素のデータを読み出し、表示装置に出力する手段と、
を有する端末装置。
(付記11)
映像と同期したセンサ情報である映像メタデータに関する情報を格納する第1映像メタデータ格納部内の映像メタデータに関する情報と当該映像メタデータに関する情報と相関を有し且つ前記映像から抽出される映像特徴量とに基づき、前記映像メタデータに誤りが存在する区間を特定する区間特定ステップと、
前記区間における前記映像メタデータを、前記映像特徴量又は前記映像メタデータに関する情報と相関を有し且つ前記映像から抽出される第2の映像特徴量に基づき補正し、補正後の映像メタデータを第2映像メタデータ格納部に格納する補正ステップと、
を含む映像メタデータ補正方法。
(付記12)
映像と同期したセンサ情報である映像メタデータに関する情報を格納する第1映像メタデータ格納部内の映像メタデータに関する情報と当該映像メタデータに関する情報と相関を有し且つ前記映像から抽出される映像特徴量とに基づき、前記映像メタデータに誤りが存在する区間を特定する区間特定ステップと、
前記区間における前記映像メタデータを、前記映像特徴量又は前記映像メタデータに関する情報と相関を有し且つ前記映像から抽出される第2の映像特徴量に基づき補正し、補正後の映像メタデータを第2映像メタデータ格納部に格納する補正ステップと、
をコンピュータにより実行させるための映像メタデータ補正プログラム。
本発明の実施の形態に係る全体の機能ブロック図である。 方位角の用い方を説明するための図である。 本発明の実施の形態に係る映像メタデータ補正装置に関連する機能ブロック図である。 本発明の実施の形態に係る処理フローを示す図である。 仮メタデータ格納部に格納されるデータの一例を示す図である。 映像データ格納部に格納されるデータの一例を示す図である。 仮メタデータ格納部に格納されるデータの一例を示す図である。 誤り区間について説明するための図である。 (a)及び(b)は、ビデオカメラの回転及び映像の変化の関係を示す図である。 移動量データ格納部に格納されるデータの一例を示す図である。 比較用スケーリング係数αを説明するための図である。 (a)及び(b)は、補正用スケーリング係数βを説明するための図である。 方位角の補正処理について説明するための図である。 メタデータ格納部に格納されるデータの一例を示す図である。
符号の説明
1 電子コンパス 2 GPS 3 時計 4 ビデオカメラ
5 映像記録部 6 映像データ格納部 7 地図DB
8 メタデータ格納部 9 検索制御部 10 映像再生部
11 ユーザインタフェース部
100 映像メタデータ補正装置
101 メタデータ記録部 102 仮メタデータ格納部
103 誤り候補区間抽出部 104 誤り区間データ格納部
105 移動量抽出部 106 移動量データ格納部
107 誤り判定部 108 メタデータ補正部

Claims (5)

  1. 映像と同期したセンサ情報である映像メタデータに関する情報を格納する第1映像メタデータ格納部内における映像メタデータに関する情報と当該映像メタデータに関する情報と相関を有し且つ前記映像から抽出される映像特徴量とに基づき、前記映像メタデータに誤りが存在する区間を特定する区間特定手段と、
    前記区間における前記映像メタデータを、前記映像特徴量又は前記映像メタデータに関する情報と相関を有し且つ前記映像から抽出される第2の映像特徴量に基づき補正し、補正後の映像メタデータを第2映像メタデータ格納部に格納する補正手段と、
    を有する映像メタデータ補正装置。
  2. 前記区間特定手段が、
    前記映像の時系列データから、前記映像メタデータに関する情報と相関を有し且つ前記映像の時間変化に応じた特徴量を映像特徴量として抽出する手段
    を有する請求項1記載の映像メタデータ補正装置。
  3. 前記補正手段が、
    前記映像特徴量又は前記第2の映像特徴量の変動量に比例する前記映像メタデータの補正量を算出する手段
    を有する請求項1記載の映像メタデータ補正装置。
  4. 前記補正手段が、
    前記映像特徴量又は前記第2の映像特徴量の変動量に比例し且つ前記区間の前後又は前記区間及び前記区間の少なくとも前又は後のサブ区間を含む補正区間の前後を連続するように連結するための前記映像メタデータの補正量を算出する手段
    を有する請求項1記載の映像メタデータ補正装置。
  5. 映像と同期したセンサ情報である映像メタデータに関する情報を格納する第1映像メタデータ格納部内の映像メタデータに関する情報と当該映像メタデータに関する情報と相関を有し且つ前記映像から抽出される映像特徴量とに基づき、前記映像メタデータに誤りが存在する区間を特定する区間特定ステップと、
    前記区間における前記映像メタデータを、前記映像特徴量又は前記映像メタデータに関する情報と相関を有し且つ前記映像から抽出される第2の映像特徴量に基づき補正し、補正後の映像メタデータを第2映像メタデータ格納部に格納する補正ステップと、
    をコンピュータにより実行させるための映像メタデータ補正プログラム。
JP2005350265A 2005-12-05 2005-12-05 映像メタデータ補正装置及びプログラム Expired - Fee Related JP4606318B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005350265A JP4606318B2 (ja) 2005-12-05 2005-12-05 映像メタデータ補正装置及びプログラム
US11/390,379 US7801927B2 (en) 2005-12-05 2006-03-28 Video metadata correction apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005350265A JP4606318B2 (ja) 2005-12-05 2005-12-05 映像メタデータ補正装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2007158649A true JP2007158649A (ja) 2007-06-21
JP4606318B2 JP4606318B2 (ja) 2011-01-05

Family

ID=38119996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005350265A Expired - Fee Related JP4606318B2 (ja) 2005-12-05 2005-12-05 映像メタデータ補正装置及びプログラム

Country Status (2)

Country Link
US (1) US7801927B2 (ja)
JP (1) JP4606318B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007097076A (ja) * 2005-09-30 2007-04-12 Fujifilm Corp 撮影日時修正装置、撮影日時修正方法及びプログラム
KR101304460B1 (ko) * 2007-06-08 2013-09-04 삼성전자주식회사 컨텐츠 재생 방법 및 장치
US9535450B2 (en) * 2011-07-17 2017-01-03 International Business Machines Corporation Synchronization of data streams with associated metadata streams using smallest sum of absolute differences between time indices of data events and metadata events
US20140331136A1 (en) * 2013-05-03 2014-11-06 Sarl Excelleance Video data sharing and geographic data synchronzation and sharing
FR3010606A1 (fr) * 2013-12-27 2015-03-13 Thomson Licensing Procede de synchronisation de metadonnees avec un document audiovisuel en utilisant des parties de trames et dispositif de production de telles metadonnees
US10433030B2 (en) 2014-10-09 2019-10-01 Thuuz, Inc. Generating a customized highlight sequence depicting multiple events
US10536758B2 (en) * 2014-10-09 2020-01-14 Thuuz, Inc. Customized generation of highlight show with narrative component
US10924636B1 (en) * 2020-04-30 2021-02-16 Gopro, Inc. Systems and methods for synchronizing information for videos

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001309217A (ja) * 2000-04-18 2001-11-02 Canon Inc カメラシステム、画像再生システム及びラボシステム
JP2004213355A (ja) * 2002-12-27 2004-07-29 Canon Inc 情報処理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3225434B2 (ja) 1996-04-23 2001-11-05 重之 山口 映像提示システム
JP3614709B2 (ja) 1999-05-20 2005-01-26 日本電信電話株式会社 景観画像インデクス方法、装置および景観画像インデクスプログラムを記録した記録媒体
JP2001290820A (ja) * 2000-01-31 2001-10-19 Mitsubishi Electric Corp 映像収集装置、映像検索装置および映像収集検索システム
JP4335492B2 (ja) * 2002-03-05 2009-09-30 キヤノン株式会社 動画像管理方法及び装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001309217A (ja) * 2000-04-18 2001-11-02 Canon Inc カメラシステム、画像再生システム及びラボシステム
JP2004213355A (ja) * 2002-12-27 2004-07-29 Canon Inc 情報処理方法

Also Published As

Publication number Publication date
US20070130175A1 (en) 2007-06-07
US7801927B2 (en) 2010-09-21
JP4606318B2 (ja) 2011-01-05

Similar Documents

Publication Publication Date Title
JP4606318B2 (ja) 映像メタデータ補正装置及びプログラム
US9565364B2 (en) Image capture device having tilt and/or perspective correction
US8933986B2 (en) North centered orientation tracking in uninformed environments
KR101423928B1 (ko) 전자지도에 포함된 이미지 파일을 이용한 이미지 재생장치, 이의 재생 방법 및 상기 방법을 실행하기 위한프로그램을 기록한 기록매체.
CN109461208B (zh) 三维地图处理方法、装置、介质和计算设备
JP6338021B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN111445526B (zh) 一种图像帧之间位姿的估计方法、估计装置和存储介质
KR101318867B1 (ko) 촬영 장치, 동화상 재생 장치, 동화상 촬영 재생 장치, 촬영 방법, 재생 방법 및 컴퓨터 판독가능한 기록 매체
EP3168571B1 (en) Utilizing camera to assist with indoor pedestrian navigation
WO2005124594A1 (en) Automatic, real-time, superimposed labeling of points and objects of interest within a view
EP3028252A1 (en) Rolling sequential bundle adjustment
JP2004354257A (ja) キャリブレーションずれ補正装置及びこの装置を備えたステレオカメラ並びにステレオカメラシステム
US20080267453A1 (en) Method for estimating the pose of a ptz camera
US20160050349A1 (en) Panoramic video
US20060215036A1 (en) Method and apparatus for video stabilization
JP5812509B2 (ja) 地図表示装置、地図表示方法及びプログラム
KR20100060472A (ko) 위치 측정 방법 및 이를 이용한 휴대 단말기
JPWO2012133371A1 (ja) 撮像位置および撮像方向推定装置、撮像装置、撮像位置および撮像方向推定方法ならびにプログラム
CN113344789A (zh) 图像拼接方法及装置、电子设备、计算机可读存储介质
JP4752319B2 (ja) 画像認識装置及び画像認識方法
US20110149089A1 (en) System and method for generating an image appended with landscape information
JPH1013720A (ja) 情報提示装置
JP2021068240A (ja) 路面画像管理システム及びその路面画像管理方法
JP5662787B2 (ja) 携帯端末および画像処理方法
JPH0548964A (ja) 映像とその撮影情報の提示方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080416

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101005

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees