JP6668002B2 - 動画生成装置、動画生成システム、および動画生成プログラム - Google Patents

動画生成装置、動画生成システム、および動画生成プログラム Download PDF

Info

Publication number
JP6668002B2
JP6668002B2 JP2015110858A JP2015110858A JP6668002B2 JP 6668002 B2 JP6668002 B2 JP 6668002B2 JP 2015110858 A JP2015110858 A JP 2015110858A JP 2015110858 A JP2015110858 A JP 2015110858A JP 6668002 B2 JP6668002 B2 JP 6668002B2
Authority
JP
Japan
Prior art keywords
moving image
image
camera
frame
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015110858A
Other languages
English (en)
Other versions
JP2016225851A (ja
Inventor
小池 英樹
英樹 小池
洋次 奥寺
洋次 奥寺
稜平 船越
稜平 船越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Institute of Technology NUC
Original Assignee
Tokyo Institute of Technology NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Institute of Technology NUC filed Critical Tokyo Institute of Technology NUC
Priority to JP2015110858A priority Critical patent/JP6668002B2/ja
Publication of JP2016225851A publication Critical patent/JP2016225851A/ja
Application granted granted Critical
Publication of JP6668002B2 publication Critical patent/JP6668002B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Studio Devices (AREA)

Description

本発明の実施形態は、動画生成装置、動画生成システム、および動画生成プログラムに関する。
スポーツ競技等で使用されるボールに複数のカメラを内蔵して、ボール側から見た映像をユーザに提供する技術が知られている(例えば、非特許文献1参照)。
Jonas Pfeil, Kristian Hildebrand, Carsten Gremzow, Bernd Bickel, and Marc Alexa. Throwable panoramic ball camera. In SIGGRAPH Asia 2011 Emerging Technologies, SA ’11, pp.4:1-4:2
しかしながら、従来の技術では、競技中にボールが回転や振動といった運動をすることで、動画内において視点が変動する場合があった。
本発明は、このような事情を考慮してなされたものであり、より視点変動の少ない動画を生成することができる動画生成装置、動画生成システム、および動画生成プログラムを提供することを目的の一つとする。
本発明の一態様は、物体に設けられた3以上のカメラによって時系列に生成された画像に基づいて所定の特徴を有する基準画像を決定する決定部と、決定部によって3以上のカメラに含まれる第Nのカメラによって生成された第Nカメラ画像に基づいて決定された基準画像と、3以上のカメラに含まれ第Nのカメラと異なる第N+1のカメラによって生成された第N+1カメラ画像との一致する度合を示す一致度を算出する算出部と、算出部によって算出された一致度に基づいて、第Nカメラ画像と、第N+1カメラ画像とを結合して動画を生成する生成部と、を備える動画生成装置である。
本発明の一態様において、前記物体は、スポーツ競技または娯楽に用いられる物体であるものとしてもよい。
また、本発明の一態様において、前記決定部は、前記生成部によって前記第Nカメラ画像と、前記第N+1カメラ画像とが結合された後、前記算出部によって算出された一致度に基づいて、前記基準画像を更新するものとしてもよい。
また、本発明の一態様において、前記基準画像および前記第N+1カメラ画像から前記所定の特徴を示す特徴点をそれぞれ抽出する抽出部をさらに備え、前記算出部は、前記抽出部によって抽出された特徴点間の距離を、前記一致度として算出するものとしてもよい。
また、本発明の一態様において、前記決定部は、前記第N+1カメラ画像に基づいて、前記算出部によって算出された一致度が最大となる画像を示す最一致画像を決定し、前記生成部は、前記基準画像の撮像された時刻を示す第1の時刻から、前記決定部によって決定された最一致画像の撮像された時刻を示す第2の時刻までの期間における前記第Nカメラ画像と、前記第2の時刻以降における前記第N+1カメラ画像とを結合して動画を生成するものとしてもよい。
また、本発明の一態様において、前記抽出部は、前記第Nカメラ画像から前記所定の特徴を示す特徴点をさらに抽出し、前記物体に設けられた複数のカメラの配置位置と、前記第Nカメラ画像の撮像された時刻と、前記抽出部によって前記第Nカメラ画像および前記第N+1カメラ画像からそれぞれ抽出された特徴点とに基づいて、前記第1の時刻から前記第2の時刻までの期間における前記第Nカメラ画像を平行移動して補正する補正部をさらに備えるものとしてもよい。
本発明の他の態様は、3以上のカメラが設けられた物体と、前記請求項1から6のうちいずれか1項に記載の動画生成装置と、を備える動画生成システムである。
本発明の他の態様は、コンピュータに、物体に設けられた3以上のカメラによって時系列に生成された画像に基づいて所定の特徴を有する基準画像を決定させ、前記3以上のカメラに含まれる第Nのカメラによって生成された第Nカメラ画像に基づいて決定された基準画像と、前記3以上のカメラに含まれ前記第Nのカメラと異なる第N+1のカメラによって生成された第N+1カメラ画像との一致する度合を示す一致度を算出させ、前記一致度に基づいて、前記第Nカメラ画像と、前記第N+1カメラ画像とを結合して動画を生成させる、動画生成プログラムである。
本発明の一態様によれば、より視点変動の少ない動画を生成することができる。
実施形態における動画生成装置100を含む動画生成システム1の概略図である。 カメラ10−1から10−4の配置例を示す図である。 カメラ10−1から10−4が設置されたボールOBの断面図である。 実施形態における動画生成装置100の機能構成の一例を示す図である。 ボールOBが時計回りに回転する場合においてアンカーフレームの撮像時の方向を撮像するカメラ10の移り変わりの様子を示した図である。 実施形態における制御部110の処理の流れの一例を示す図である。 記憶部130に記憶させる動画の一例を示す図である。 DoG画像D(x、y、σ)の生成における概略例を示す図である。 ヒストグラムの生成方法の概念図である。 抽出部114によって特徴点の方向が複数個決定される様子を示す図である。 特徴量の記述方法を説明するための図である。 比較対象となるフレームとアンカーフレームとの特徴点マッチングを行った際の様子を示す図である。 順次更新されるアンカーフレームを用いた任意視点方向動画の生成の様子を示す図である。 ボールOBに搭載のカメラ10によって撮像された動画を1フレームごとに時系列に並べた一例を示す図である。 図14に示すフレームを用いて決定されたアンカーフレームの一例を示す図である。 図15に示すフレームを補正した編集フレームのうち、アンカーフレームと次のアンカーフレームとの中間に位置するフレームを時系列に並べた図である。 検証に用いたフリスビーを上から見た図である。 フリスビーに搭載のカメラ10によって撮像された動画を1フレームごとに時系列に並べた一例を示す図である。 図18に示すフレームを用いて決定されたアンカーフレームの一例を示す図である。 図19に示すフレームを補正した編集フレームのうち、アンカーフレームと次のアンカーフレームとの中間に位置するフレームを時系列に並べた図である。 図14に示すフレームを用いて決定された別方向のアンカーフレームの一例を示す図である。 図21に示すフレームを補正した編集フレームのうち、アンカーフレームと次のアンカーフレームとの中間に位置するフレームを時系列に並べた図である。 検証に用いた動画生成装置100の動作スペックを表す図である。
[構成]
以下、図面を参照し、本発明の動画生成装置、動画生成システム、および動画生成プログラムの実施形態について説明する。図1は、実施形態における動画生成装置100を含む動画生成システム1の概略図である。本実施形態における動画生成システム1は、ボールOBと、動画生成装置100とを備える。ボールOBは、「物体」の一例である。ボールOBは、例えば、サッカーやバスケットボール等のスポーツ競技に用いられる。なお、本実施形態の動画生成システム1におけるボールOBは、娯楽に用いられる物体であってもよい。例えば、ボールOBは、バトミントンに使用されるシャトルや、ダーツ、フリスビー等である。また、ボールOBは、円筒形状であってもよいし、卵形状であってもよいし、流線形状であってもよい。
ボールOBには、複数のカメラ10−1から10−4が内蔵されている。カメラ10−1から10−4は、所定の視野角θを有している。カメラ10−1から10−4は、例えば、ボールOBの周方向に沿って均等間隔で配置される。図2は、カメラ10−1から10−4の配置例を示す図である。図1または図2に示すように、カメラ10−1から10−4は、例えば、ボールOBの重心O周りに90度間隔で配置される。なお、カメラ10−1から10−4は、自装置の撮像の領域の一部が隣り合うカメラの撮像領域の一部とクロスオーバーするように配置されてもよい。図2に示す領域Aは、他のカメラの撮像領域とクロスオーバーする領域を表している。
図3は、カメラ10−1から10−4が設置されたボールOBの断面図である。図3に示すように、カメラ10−1から10−4は、外部の光を受光するレンズ12をボールOBの表面側に向けつつ、カメラの筐体がボールOBから突出しないように埋め込まれる。なお、上述したカメラの数は4個としたがこれに限られない。カメラの数は、例えば2個や3個であってもよいし、4個以上であってもよく、ボールOBの円周方向180度の視界を全て撮像することができればよい。また、カメラ10−1から10−4が設置された円周線と直交する円周線上に他のカメラが設けられてもよい。以下、カメラ10−1から10−4を特に区別しない場合は、単に「カメラ10」と称する。
カメラ10は、後述する動画生成装置100とネットワークNWを介して接続される。ネットワークNWは、例えば、LAN(Local Area Network)やWAN(Wide Area Network)、シリアル通信線等を含む。例えば、カメラ10は、図示しないアンテナを用いた無線通信によって撮像した動画を動画生成装置100に対して出力する。なお、カメラ10は、シリアル通信線等の有線を用いて撮像した動画を動画生成装置100に対して出力してもよい。
図4は、実施形態における動画生成装置100の機能構成の一例を示す図である。本実施形態における動画生成装置100は、ボールOBに内蔵された複数のカメラ10によって撮像された動画を合成して、新たに1つの動画を生成する。動画生成装置100は、通信インターフェース102と、入力部104と、表示部106と、制御部110と、記憶部130とを備える。
通信インターフェース102は、ボールOBのカメラ10と通信するための無線通信装置である。
入力部104は、ユーザからの操作を受け付けるためのユーザインターフェースである。入力部104は、マウス、キーボード、タッチパネル等を含む。ユーザは、例えば、入力部104を操作して、カメラ10によって撮像された動画内において着目したい対象物が含まれるフレームを設定する。以下、ユーザによって設定されたフレームを、「アンカーフレーム」と称する。例えば、ユーザは、ボールOBがサッカーボールに適用される場合、ゴール等の対象物が含まれるフレームをアンカーフレームとしてカメラ10の動画から選択する。これによって、後述する制御部110の処理において、アンカーフレームが撮像された方向、すなわちユーザが所望する対象物の方向に動画の視点方向を定めることができる。なお、アンカーフレームは、「基準画像」の一例である。
表示部106は、入力された情報に基づいた画像を表示する。表示部106は、液晶ディスプレイ、有機EL(Electroluminescence)ディスプレイ等の表示装置である。表示部106は、例えば、後述する出力部124によって出力された情報を表示したり、入力部104にアンカーフレームを選択させるための情報を表示したりする。
制御部110は、取得部112と、抽出部114と、算出部116と、決定部118と、生成部120と、補正部122と、出力部124とを備える。上述した制御部110の機能部のうち一部または全部は、CPU(Central Processing Unit)等のプロセッサが記憶部130に記憶されたプログラムを実行することによって機能するソフトウェア機能部である。プログラムは、例えば、LANやWAN等のネットワークを介してアプリサーバからダウンロードされる。また、制御部110の機能部のうち一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)等のハードウェア機能部であってもよい。
記憶部130は、例えば、ROM(Read Only Memory)、フラッシュメモリ、HDD等の不揮発性の記憶媒体と、RAM(Random Access Memory)、レジスタ等の揮発性の記憶媒体とを有する。記憶部130に記憶される情報は、プロセッサが実行するプログラムの他、後述するカメラ10から取得した動画、アンカーフレーム、数式等の情報を含む。
本実施形態では、ボールOBは一方向に回転するものとして説明する。また、ボールOBの回転移動は一度きりであるとし、ボールOBの回転はカメラ10が配置されている円周に沿って時計回り、或いは反時計回りのどちらかであると仮定する。このとき、アンカーフレームの撮像元のカメラをカメラ10−1とすると、ボールOBが時計回りに回転している場合、ある程度の時間が経過してボールOBが90度回転するとカメラ10−1の左隣にあるカメラは、アンカーフレームの撮像時の方向と同じ方向を撮像する。同様にボールOBが反時計回りに回転している場合、カメラ10−1の右隣にあるカメラは、ある程度の時間が経過した後に、アンカーフレームの撮像時の方向と同じ方向を撮像する。
図5は、ボールOBが時計回りに回転する場合においてアンカーフレームの撮像時の方向を撮像するカメラ10の移り変わりの様子を示した図である。図5の例では、カメラ10−1の左隣りをカメラ10−2とし、以下、カメラ10−3、10−4の順にボールOBの周方向に並んでいる。このようなカメラ配置の場合、カメラ10−1によって撮像されたアンカーフレームと似た特徴を有したフレームが数フレーム毎にカメラ10−2、カメラ10−3、カメラ10−4、そして再びカメラ10−1上にと周期的に現れる。そのため、本実施形態における制御部110は、各動画からアンカーフレームの特徴に対して最も似ているフレームを抽出し、抽出したフレームを結合することで、アンカーフレームの方向を向き続けているように見える動画を生成する。以下、アンカーフレームの方向を向き続けているように見える動画のことを、「任意視点方向動画」と称する。
[処理の流れ]
以下、任意視点方向動画を生成するための制御部110の各機能部の処理について、フローチャートを用いて説明する。図6は、実施形態における制御部110の処理の流れの一例を示す図である。
まず、取得部112は、カメラ10から動画を取得する(ステップS100)。具体的には、取得部112は、通信インターフェース102を介して、上述したカメラ10から動画を取得する。取得部112は、取得した動画を取得元のカメラ10を識別する情報(以下、「カメラID」と称する)と対応付けて記憶部130に記憶させる(ステップS102)。図7は、記憶部130に記憶させる動画の一例を示す図である。
次に、取得部112は、ユーザによって入力されたアンカーフレームを入力部104から取得する(ステップS104)。以下、アンカーフレームを抽出した動画の取得元であるカメラ10を「カメラ10−1」と仮定して説明する。なお、アンカーフレームを抽出した動画の取得元であるカメラ10は、「第Nのカメラ」の一例であり、アンカーフレームの抽出元の動画は、「第Nカメラ画像」の一例である。
次に、抽出部114は、取得部112によって取得されたアンカーフレームの比較対象となる動画を、記憶部130に記憶される動画から選択する(ステップS106)。より具体的には、抽出部114は、アンカーフレームを含む動画の取得元であるカメラ10−1に対して隣り合うカメラによって撮像された動画を選択する。上述した例の場合、抽出部114は、カメラ10−1に隣り合うカメラ10−2またはカメラ10−4のうちいずれか一方のカメラによって撮像された動画から比較対象の動画を選択する。なお、比較対象の動画の取得元のカメラ10は、「第N+1のカメラ」の一例であり、比較対象の動画は、「第N+1カメラ画像」の一例である。
抽出部114は、選択した比較対象の動画を構成するフレームのうち、アンカーフレームが撮像された時刻よりも後の時刻における撮像されたフレームに対して、特徴点を抽出する処理を行う。本実施形態における抽出部114は、SIFT(Scale-Invariant Feature Transform)を用いて各フレームから特徴点を抽出する。SIFTとは画像におけるスケールや回転に対し不変な特徴点を求めるアルゴリズムである。従って、抽出部114は、様々な強さで平滑化した画像の差分からDoG(Difference-of-Gaussian)画像を生成し、ガウス方向の値の変化、すなわち画像に強さの異なるぼかしを適用した場合の画素値の変化を基に特徴点を抽出する。図8は、DoG画像D(x、y、σ)の生成における概略例を示す図である。DoG画像D(x、y、σ)は、数式(1)によって表される。なお、抽出部114は、SIFTの代わりに、SURFやAKAZE等のアルゴリズムを用いて特徴点を抽出してもよい。
数式(1)中に示すL(x、y、σ)は、平滑化された画像であり、入力画像をI(x、y)とし、平滑化に用いるガウス関数をG(x、y、σ)とすると、以下の数式(2)、(3)によって表される。
抽出部114は、生成したDoG画像D(x、y、σ)に基づいて抽出した特徴点の周囲の画素値(輝度値)の変化を基に、特徴点の向きとその強さを導出する。平滑化画像をL(u、ν)とすると、特徴点の周囲の画素値の変化の強さを示す周辺画素の勾配強度m(u、ν)は、数式(4)によって表され、特徴点の向きを示す勾配方向θ(u、ν)は、数式(5)によって表される。従って、抽出部114は、数式(4)、(5)に基づいて、特徴点の周囲の画素値の変化の強さと、特徴点の向きとを導出する。
抽出部114は、導出した勾配強度m(u、ν)に特徴点を中心とするガウス窓をかけて重みをつけ、勾配方向θ(u、ν)を所定数(例えば36個)の種類に分類したヒストグラムを生成する。図9は、ヒストグラムの生成方法の概念図である。
抽出部114は、生成したヒストグラムの最大値が閾値以上の値を持っている方向を特徴点の方向として決定する。なお、図10に示すようにヒストグラムの値が閾値以上であるものが複数存在する場合、抽出部114は、閾値を超える数に応じて特徴点の方向を複数個決定してもよい。図10は、抽出部114によって特徴点の方向が複数個決定される様子を示す図である。抽出部114は、このように決定した特徴点の方向に従って、特徴量の記述領域を回転させる。これによって、抽出部114は、画像の回転に強い特徴量の記述を行うことができる。
抽出部114は、回転させた記述領域に特徴量を記述する。図11は、特徴量の記述方法を説明するための図である。図11に示すように、抽出部114は、例えば、上述したSIFT手法を用いて、特徴量を128次元のベクトルによって記述する。具体的には、抽出部114は、回転させた記述領域を4×4の16ブロックの領域に分割し、分割したそれぞれの領域において特徴点の方向を決定した時と同様に勾配強度、勾配方向を導出する。抽出部114は、ブロックごとに導出した勾配方向を8方向に分割したヒストグラムを生成する。抽出部114は、この16ブロック×8方向=128次元のベクトル(以下、「特徴ベクトル」と称する)を特徴量として記述する。抽出部114は、最後に各特徴ベクトルの長さをベクトルの総和で正規化することで、輝度変化に強い特徴量を抽出する。
次に、算出部116は、抽出部114によって抽出された特徴点に基づいて、比較対象の動画を構成する各フレームとアンカーフレームとの一致する度合を示す一致度を算出する(ステップS108)。具体的には、算出部116は、比較対象の動画のうち、アンカーフレームが撮像された時刻よりも後の時刻における撮像されたフレームを用いて、当該フレームとアンカーフレームとの両フレーム間において特徴点マッチングを行い、特徴点間の距離dを算出する。例えば、算出部116は、アンカーフレーム上に存在する、ある特徴点νkI1に対し、比較対象となるフレームが持つすべての特徴点とのユークリッド距離を計算し、特徴点間の距離d(νkI1、νkI2)が最小になる点νkI2を対応した特徴点とする。ここで、特徴点間の距離d(νkI1、νkI2)は、数式(6)によって表される。
図12は、比較対象となるフレームとアンカーフレームとの特徴点マッチングを行った際の様子を示す図である。図12に示す特徴点比較対象となるフレームと特徴点とを繋ぐ直線の長さが特徴点間の距離d(νkI1、νkI2)に相当する。
なお、算出部116は、特徴点のマッチングを行う前に、事前に比較対象となるフレームに対して所定のフィルタリング処理を行って特徴点を除去するようにしてもよい。算出部116は、例えば、フレームの上下端の特徴点を除去しておく。これによって、算出部116は、フレームの中心から離れるほど大きくなるレンズ歪みの影響を抑制することができる。また、アンカーフレームと所定のフレームとのマッチングを行う際に、マッチングの対象となる両フレームに写る対象物が同一である場合、ボールOBの自身の位置の変化による変化は多少あるものの基本的には同様のものを写していると推測される。そのため、マッチングする特徴点同士はそれぞれの画像内で近い位置に存在しているはずである。従って、算出部116は、比較対象となるフレームから、アンカーフレームの特徴点の位置(x座標、y座標)との差異が大きくなる特徴点を除去しておく。これによって、算出部116は、特徴点のマッチング精度を向上させることができる。
次に、算出部116は、比較対象となるフレームとアンカーフレームとにおいてマッチングした特徴点に基づいて、比較対象となるフレームをアンカーフレームの空間に投射するホモグラフィ行列を算出する。算出部116は、算出したホモグラフィ行列を用いて、比較対象となるフレームの四隅である左上、左下、右上、右下の特徴点がアンカーフレームの空間内のどの位置に投射されるかを算出する。例えば、比較対象となるフレーム上のある特徴点(x、y)がアンカーフレーム上の空間(X,Y)に投射されるとすると、その点は同次座標とホモグラフィ行列Hを用いて、数式(7)のように表される。
ここで、ホモグラフィ行列Hは、数式(8)で表すことができるため、算出部116は、上述した数式(7)から、数式(9)、(10)、(11)をそれぞれ導出することができる。
上述した数式(7)および(8)において、アンカーフレームと比較対象となるフレームとに全く同じ対象物が写っていれば、ホモグラフィ行列Hは単位行列となり、比較対象となるフレームの四隅の特徴点は、アンカーフレームの四隅に投射されるはずである。実際は、ボールOB自身の位置が3次元的に移動しているため同じ四隅に投射される傾向は小さい。しかしながら、同じ方向が写されているフレームほど投射される特徴点はアンカーフレームの四隅の特徴点に近くなると推定される。従って、算出部116は、投射された四隅の特徴点(比較対象となるフレームの四隅の特徴点)と、アンカーフレームの四隅の特徴点との距離dをそれぞれの点ごとに算出し、算出した複数の距離dの平均を一致度として導出する。距離dが小さいほど比較対象となるフレームとアンカーフレームとの一致度は高くなる。
なお、同じものを写している領域がある程度存在しているフレームに対しては一致度の算出精度は高くなるが、2つのフレームにまったく異なる対象物が写っている場合には一致度の算出精度は低くなる。従って、算出部116は、特徴点マッチングの段階において十分な量(数)のマッチングが検出できなかったフレームを、アンカーフレームとの一致度を算出する対象として除外するようにすると好適である。
次に、決定部118は、算出部116によって算出された一致度に基づいて、現時点での比較対象の動画から、次の比較対象となる動画の一致度の算出に用いるアンカーフレームに相当するフレームを決定し、アンカーフレームを更新する(ステップS110)。更新されたアンカーフレームは、「最一致画像」の一例である。例えば、カメラ10−2の動画に含まれるフレームと、カメラ10−1の動画に含まれるアンカーフレームとの一致度が算出されている場合、決定部118は、比較対象であったカメラ10−2の動画内から、カメラ10−3の動画の一致度を算出するためのアンカーフレームを新たに決定する。具体的には、決定部118は、比較対象であった動画がカメラ10−2の動画であった場合、カメラ10−2の動画のうち、カメラ10−1のアンカーフレーム撮像時刻から所定数のフレームにおいて、アンカーフレームとの一致度が最も高いフレームを、新たなアンカーフレームとして決定し、決定したアンカーフレームを記憶部130に記憶させる。決定部118は、アンカーフレームの更新に使用する動画のフレームが動画の終了を示す最後のフレームであるか否かを判定し(ステップS112)、最後のフレームでない場合は、上述した処理を動画が終了するまで繰り返し行い、アンカーフレームを順次更新し続ける。これによって、決定部118は、一致度の算出精度を向上させることができる。
次に、決定部118は、順次更新したアンカーフレームに基づいて、任意視点方向動画の生成に用いるフレーム(以下、「編集フレーム」と称する)を決定する(ステップ114)。図13は、順次更新されるアンカーフレームの様子を示す図である。図13に示すように、決定部118は、カメラ10−1の動画において、ユーザに決定されたアンカーフレームの撮像時刻t0からカメラ10−2の動画のアンカーフレームの撮像時刻t1までの期間のフレームを編集フレームAとして決定する。また、決定部118は、カメラ10−2の動画において、更新したアンカーフレームの撮像時刻t1からカメラ10−3の動画のアンカーフレームの撮像時刻t2までの期間のフレームを編集フレームBとして決定する。以下同様に、決定部118は、カメラ10−3の動画において、更新したアンカーフレームの撮像時刻t2からカメラ10−4の動画のアンカーフレームの撮像時刻t3までの期間のフレームを編集フレームCとして決定し、カメラ10−4の動画において、更新したアンカーフレームの撮像時刻t3からカメラ10−1の動画のアンカーフレームの撮像時刻t4までの期間のフレームを編集フレームDとして決定する。決定部118は、このような処理を動画が終了するまで繰り返し行い、編集フレームを各カメラ10の動画から決定する。
アンカーフレームを更新して編集フレームを決定しただけでは、同じカメラからの画像を利用しているフレーム間でもボールの回転は起こっているため画像の視点の中心の位置は変化してしまい、視点が固定されているようには見えない場合がある。そのため、表示される画像の位置を移動させることで目標とする視点を常に画像の中心に表示し続けるように、編集フレームを補正する必要がある。従って、上述した課題を解決するために、補正部122は、目標とする視点に写っているものが十分遠方にあり視差の影響を無視できることと、カメラ10の切り替えはボールOBの設置位置に応じた回転角(本実施形態では、回転角は、4つのカメラ10が円周状に均等に配置されるので90度)に基づいて行われることとを加味して、以下の補正を行う。
アンカーフレームからtフレーム後、カメラ10の切り替えが起こる直前に任意視点方向動画に利用されているアンカーフレームとは視野が90度異なるフレームとなる。補正部122は、同じカメラ10を利用しているフレーム間ではボールOBの回転速度は一定であるとし、編集フレームの1フレームごとに画像を、数式12に基づく補正量分だけボールOBの回転方向とは逆方向に平行移動して補正する(ステップS116)。数式(12)に示すように、補正量は、画像の回転方向の長さと回転角との乗算値を、カメラ10の視野角θとフレームの撮像時刻tとの乗算値で除算した値に相当する。これによって、後述する生成部120は、目標とする視点を常にフレームの中心に表示し続けることができる任意視点方向動画を生成することができる。
次に、生成部120は、補正部122によって補正された編集フレームを結合して任意視点方向動画を生成する(ステップS118)。上述した図13の例の場合、生成部120は、編集フレームAからHを時系列順に結合して、任意視点方向動画を生成する。
次に、出力部124は、生成部120によって生成された任意視点方向動画を表示部106や他の表示装置等に出力する(ステップS120)。これによって、本フローチャートの処理が終了する。
[検証例]
本出願の発明者は、動画生成装置100によって生成される任意視点方向動画を確認するための検証を行った。図14は、ボールOBに搭載のカメラ10によって撮像された動画を1フレームごとに時系列に並べた一例を示す図である。また、図15は、図14に示すフレームを用いて決定されたアンカーフレームの一例を示す図である。例えば、図15に示す(a)は、始めにユーザによって指定されたアンカーフレームである。また、図15に示す(b)から(h)は、決定部118によって順次決定されたアンカーフレームを示している。図15から、同じ方向を移しているフレームを推定できていることがわかる。また、図16は、図15に示すフレームを補正した編集フレームのうち、アンカーフレームと次のアンカーフレームとの中間に位置するフレームを時系列に並べた図である。図16に示すように、フレームの補正によって目標とする視点(このフレームの場合、人間)が中心に来るように移動していることがわかる。
また、本出願の発明者は、上述したボールOBとは異なる物体として、フリスビーにカメラ10を搭載して任意視点方向動画の生成の検証を行った。図17は、検証に用いたフリスビーを上から見た図である。図17の例のように、フリスビーは、4つのカメラ10を備える構成とした。
図18は、フリスビーに搭載のカメラ10によって撮像された動画を1フレームごとに時系列に並べた一例を示す図である。また、図19は、図18に示すフレームを用いて決定されたアンカーフレームの一例を示す図である。また、図20は、図19に示すフレームを補正した編集フレームのうち、アンカーフレームと次のアンカーフレームとの中間に位置するフレームを時系列に並べた図である。図20に示すように、フレームの補正によって目標とする視点(このフレームの場合、中央付近の建物と木)が中心に来るように移動していることがわかる。
また、本出願の発明者は、上述した図14に示す動画(フレーム)を用いて、別方向の任意視点方向動画の生成について検証を行った。図21は、図14に示すフレームを用いて決定された別方向のアンカーフレームの一例を示す図である。また図22は、図21に示すフレームを補正した編集フレームのうち、アンカーフレームと次のアンカーフレームとの中間に位置するフレームを時系列に並べた図である。図22に示すように、図16に示す目標とする視点(人間)とは異なる視点が中心に来るように移動していることがわかる。
また、本出願の発明者は、任意視点方向動画の生成時に必要な計算時間を測定して検証を行った。図23は、検証に用いた動画生成装置100の動作スペックを表す図である。また、ボールOBに搭載したカメラ10は、240FPSで動画を撮像することができるものを使用した。任意視点方向動画の生成時に必要な計算時間は、主に、動画を構成する各フレームから画像を抽出する時間と、編集フレームを決定するのに要する時間と、補正に要する時間と、編集フレームを結合するのに要する時間とで構成される。
任意方向視点動画の生成の際には、まず動画から画像を抽出する必要がある。動画から240フレーム分の画像を抽出するのには約9秒かかり、これをカメラ4台分行う必要があるため240フレーム分の画像抽出にはおよそ36秒の時間を要した。
また、編集フレームを決定するためには、更新するアンカーフレームよりも先の時刻のフレームまで一致度の計算を行う必要があり、240フレーム分の動画を生成するためには240回以上の一致度の計算が必要である。本実施形態の動画生成装置100に用いたプログラムでは、アンカーフレームから40フレーム先までのフレームに対して一致度の計算を行っているので、検証に用いたカメラは240FPSのカメラであることを考慮すると1秒間の動画を生成する際に実際に行う一致度の計算回数は、40/編集フレーム数の平均×240によって表される。本検証では、1フレームの計算に平均3000msほどかかっており、ボールOBを投げ上げた場合の平均した編集フレームは、アンカーフレームから16フレームから35フレーム程度のフレーム数を有していた。すなわち、ボールOBを投げ上げた後に撮像された動画を用いて、1秒間の任意方向視点動画を生成するのに要する計算時間は1800秒(30分)から820秒(約14分)程度であった。
また、240フレーム分の画像の補正処理には約6秒の時間を要し、編集フレームを結合して任意方向視点動画を生成するのに240フレーム当たり約16秒の時間を要した。
これらの結果から、計算時間の大半は、特徴点の抽出、及び特徴点マッチングを含む処理によって占められていることがわかる。そのため、計算時間の短縮を行うためには特徴点の抽出、マッチングの回数を減らすことが最も有効であるといえる。従って、動画生成装置100は、例えば、事前にボールOBの回転速度を推定しておき、推定した回転速度に応じて一致度の計算を何フレーム先まで行うかを決定する、この結果、動画生成装置100は、特徴点の抽出およびマッチングの回数を減らすことができ、計算時間を短くすることができる。なおボールOBの回転速度は、数式(13)を用いて導出するものとする。
以上説明した実施形態の動画生成装置100、動画生成システム1、および動画生成プログラムによれば、複数のカメラ10によって撮像された動画からアンカーフレームを決定する決定部118と、アンカーフレームに基づいてフレームを結合して任意視点方向動画を生成する生成部120とを備えることにより、より視点変動の少ない動画を生成することができる。この結果、実施形態の動画生成装置100、動画生成システム1、および動画生成プログラムは、より強い臨場感をユーザに提供することができる。また、動画を視聴するユーザは、新しい視点でスポーツ競技や娯楽等の観戦をすることができる。
また、実施形態の動画生成装置100、動画生成システム1、および動画生成プログラムによれば、所定のフィルタリング処理を行って特徴点を除去することにより、特徴点のマッチング精度を向上させることができる。
また、実施形態の動画生成装置100、動画生成システム1、および動画生成プログラムによれば、動画が終了するまでアンカーフレームを順次更新し続けることにより、一致度の算出精度を向上させることができる。
また、実施形態の動画生成装置100、動画生成システム1、および動画生成プログラムによれば、1フレームごとの画像を平行移動させて補正することによって、目標とする視点を常にフレームの中心に表示し続けることができる任意視点方向動画を生成することができる。
また、実施形態の動画生成装置100、動画生成システム1、および動画生成プログラムによれば、事前にボールOBの回転速度を推定しておき、推定した回転速度に応じて一致度の計算を何フレーム先まで行うかを決定することにより、特徴点の抽出およびマッチングの回数を減らすことができる。この結果、実施形態の動画生成装置100、動画生成システム1、および動画生成プログラムは、計算時間を短くすることができる。
以下、その他の実施形態について説明する。
上述した実施形態における動画生成装置100は、カメラ10と共にボールOBに内蔵されてもよい。この場合、動画生成装置100は、図示しないアンテナを用いた無線通信によって外部の装置に生成した任意視点方向動画を出力する。
また、上述した実施形態では、始めにユーザによって設定されたアンカーフレームを用いて一致度を算出するものとして説明したがこれに限られない。例えば、ユーザが見たい対象物を写した画像や動画等の事前データを予め記憶部130に記憶させておき、当該事前データと比較対象となる動画との特徴点のマッチングを行う。事前データは、例えば、所定のプレイヤーの顔を写した画像等である。これによって、動画生成装置100は、ユーザの設定入力を受けずに、自動でアンカーフレームを決定することができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1…動画生成システム、10…カメラ、100…動画生成装置、102…通信インターフェース、104…入力部、106…表示部、110…制御部、112…取得部、114…抽出部、116…算出部、118…決定部、120…生成部、122…補正部、124…出力部、130…記憶部

Claims (8)

  1. 3以上のカメラが設けられた物体が回転している際に、前記物体の周りに沿って配置された前記3以上のカメラのそれぞれによって生成された動画像のうち、第Nのカメラによって生成された第N動画像に含まれる複数のフレーム画像の中から、所定の特徴を有する一つのフレーム画像である基準画像を決定する決定部と、
    前記決定部によって決定された基準画像と、前記3以上のカメラに含まれ前記第Nのカメラと異なる第N+1のカメラによって生成された第N+1動画像に含まれる複数のフレーム画像のそれぞれとの一致度を算出する算出部と、
    前記算出部によって算出された一致度に基づいて、前記第N動画像と、前記第N+1動画像とを結合する生成部と、を備え、
    前記決定部は、前記第N動画像の中から決定した前記基準画像との一致度に基づいて、前記第N+1動画像に含まれる複数のフレーム画像の中から、新たな基準画像を決定し、
    前記算出部は、前記決定部によって新たに決定された前記基準画像と、前記3以上のカメラに含まれ前記第N+1カメラと異なる第N+2のカメラによって生成された第N+2動画像に含まれる複数のフレーム画像のそれぞれとの一致度を算出し、
    前記生成部は、前記算出部によって算出された一致度に基づいて、前記第N+1動画像と、前記第N+2動画像とを結合する、
    動画生成装置。
  2. 前記物体は、スポーツ競技または娯楽に用いられる物体である、
    請求項1に記載の動画生成装置。
  3. 前記基準画像および前記第N+1動画像に含まれる複数のフレーム画像のそれぞれから前記所定の特徴を示す特徴点をそれぞれ抽出する抽出部をさらに備え、
    前記算出部は、前記抽出部によって抽出された特徴点間の距離を、前記一致度として算出する、
    請求項1または2に記載の動画生成装置。
  4. 前記抽出部は、前記第N動画像に含まれる複数のフレーム画像のそれぞれから前記所定の特徴を示す特徴点をさらに抽出し、
    前記物体に設けられた3以上のカメラの配置位置と、前記第N動画像の撮像された時刻と、前記抽出部によって前記第N動画像および前記第N+1動画像からそれぞれ抽出された特徴点とに基づいて、前記基準画像が撮像された時刻を示す第1の時刻から、前記一致度が最大となるフレーム画像を示す最一致画像が撮像された時刻を示す第2の時刻までの期間における前記第N動画像を平行移動して補正する補正部をさらに備える、
    請求項3に記載の動画生成装置。
  5. 前記決定部は、前記第N+1動画像に基づいて、前記算出部によって算出された一致度が最大となる画像を示す最一致画像を決定し、
    前記生成部は、前記基準画像の撮像された時刻を示す第1の時刻から、前記決定部によって決定された最一致画像の撮像された時刻を示す第2の時刻までの期間における前記第N動画像と、前記第2の時刻以降における前記第N+1動画像とを結合する、
    請求項1から3のうちいずれか1項に記載の動画生成装置。
  6. 前記基準画像および前記第N+1動画像に含まれる複数のフレーム画像のそれぞれから前記所定の特徴を示す特徴点をそれぞれ抽出する抽出部をさらに備え、
    前記抽出部は、前記第N動画像に含まれる複数のフレーム画像のそれぞれから前記所定の特徴を示す特徴点をさらに抽出し、
    前記物体に設けられた3以上のカメラの配置位置と、前記第N動画像の撮像された時刻と、前記抽出部によって前記第N動画像および前記第N+1動画像からそれぞれ抽出された特徴点とに基づいて、前記第1の時刻から前記第2の時刻までの期間における前記第N動画像を平行移動して補正する補正部をさらに備える、
    請求項5に記載の動画生成装置。
  7. 3以上のカメラが設けられた物体と、
    請求項1から6のうちいずれか1項に記載の動画生成装置と、
    を備える動画生成システム。
  8. コンピュータに、
    3以上のカメラが設けられた物体が回転している際に、前記物体の周りに沿って配置された前記3以上のカメラのそれぞれによって生成された動画像のうち、第Nのカメラによって生成された第N動画像に含まれる複数のフレーム画像の中から、所定の特徴を有する一つのフレーム画像である基準画像を決定させ、
    前記第N動画像の中から決定させた基準画像と、前記3以上のカメラに含まれ前記第Nのカメラと異なる第N+1のカメラによって生成された第N+1動画像に含まれる複数のフレーム画像のそれぞれとの一致度を算出させ、
    前記第N動画像の基準画像と第N+1動画像に含まれる複数のフレーム画像のそれぞれとの一致度に基づいて、前記第N動画像と、前記第N+1動画像とを結合させ、
    前記第N動画像の中から決定させた前記基準画像との一致度に基づいて、前記第N+1動画像に含まれる複数のフレーム画像の中から、新たな基準画像を決定させ、
    新たに決定させた前記基準画像と、前記3以上のカメラに含まれ前記第N+1カメラと異なる第N+2のカメラによって生成された第N+2動画像に含まれる複数のフレーム画像のそれぞれとの一致度を算出させ、
    前記第N+1動画像の基準画像と第N+2動画像に含まれる複数のフレーム画像のそれぞれとの一致度に基づいて、前記第N+1動画像と、前記第N+2動画像とを結合させる、
    動画生成プログラム。
JP2015110858A 2015-05-29 2015-05-29 動画生成装置、動画生成システム、および動画生成プログラム Expired - Fee Related JP6668002B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015110858A JP6668002B2 (ja) 2015-05-29 2015-05-29 動画生成装置、動画生成システム、および動画生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015110858A JP6668002B2 (ja) 2015-05-29 2015-05-29 動画生成装置、動画生成システム、および動画生成プログラム

Publications (2)

Publication Number Publication Date
JP2016225851A JP2016225851A (ja) 2016-12-28
JP6668002B2 true JP6668002B2 (ja) 2020-03-18

Family

ID=57748634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015110858A Expired - Fee Related JP6668002B2 (ja) 2015-05-29 2015-05-29 動画生成装置、動画生成システム、および動画生成プログラム

Country Status (1)

Country Link
JP (1) JP6668002B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007043225A (ja) * 2005-07-29 2007-02-15 Univ Of Electro-Communications 撮像画像処理装置及び撮像画像処理方法
JP6218220B2 (ja) * 2013-08-05 2017-10-25 国立大学法人電気通信大学 撮像画像処理装置および方法、撮像画像処理プログラム並びに撮像画像処理システム
JP5804007B2 (ja) * 2013-09-03 2015-11-04 カシオ計算機株式会社 動画生成システム、動画生成方法及びプログラム

Also Published As

Publication number Publication date
JP2016225851A (ja) 2016-12-28

Similar Documents

Publication Publication Date Title
Garon et al. Deep 6-DOF tracking
KR102137264B1 (ko) 카메라 포즈 추정 장치 및 방법
EP2917754B1 (en) Image processing method, particularly used in a vision-based localization of a device
JP6204659B2 (ja) 映像処理装置及び映像処理方法
CN108876804B (zh) 抠像模型训练和图像抠像方法、装置和系统及存储介质
KR101457313B1 (ko) 템플릿 스위칭 및 특징 적응을 이용한 오브젝트 추적을 제공하는 방법, 장치 및 컴퓨터 프로그램 제품
US20120148164A1 (en) Image matching devices and image matching methods thereof
JP2016099941A (ja) オブジェクト位置推定システム、及びそのプログラム
JP2020515931A (ja) シーンのセグメンテーションと3d再構築を組み合わせるための方法及び装置
CN109919971B (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
US9557836B2 (en) Depth image compression
JP2010519629A (ja) 画像内の3次元物体のポーズを決定する方法及びデバイス並びに物体追跡のための少なくとも1つのキー画像を創出する方法及びデバイス
JP2017102708A (ja) オブジェクト追跡装置及びそのプログラム
JP6515039B2 (ja) 連続的な撮影画像に映り込む平面物体の法線ベクトルを算出するプログラム、装置及び方法
KR20150126768A (ko) 이미지 합성 방법 및 그 전자 장치
CN111008935A (zh) 一种人脸图像增强方法、装置、系统及存储介质
WO2020189265A1 (ja) 回転状態推定装置、方法及びプログラム
JPWO2019012632A1 (ja) 認識処理装置、認識処理方法及びプログラム
EP3209398B1 (en) Silhouette-based limb finding
JP6668002B2 (ja) 動画生成装置、動画生成システム、および動画生成プログラム
JP6989877B2 (ja) 位置座標算出方法及び位置座標算出装置
CN107622498B (zh) 基于场景分割的图像穿越处理方法、装置及计算设备
US10706561B2 (en) Systems and methods to track objects in video
JP2019057070A (ja) 画像処理装置、画像処理方法、およびプログラム
KR102233606B1 (ko) 영상 처리 방법 및 그 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180410

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190205

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200226

R150 Certificate of patent or registration of utility model

Ref document number: 6668002

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees