JP7274307B2 - 番組映像制作装置およびカメラモデル学習装置、ならびに、それらのプログラム - Google Patents
番組映像制作装置およびカメラモデル学習装置、ならびに、それらのプログラム Download PDFInfo
- Publication number
- JP7274307B2 JP7274307B2 JP2019039127A JP2019039127A JP7274307B2 JP 7274307 B2 JP7274307 B2 JP 7274307B2 JP 2019039127 A JP2019039127 A JP 2019039127A JP 2019039127 A JP2019039127 A JP 2019039127A JP 7274307 B2 JP7274307 B2 JP 7274307B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- camera
- posture information
- dimensional
- player
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Studio Devices (AREA)
- Image Analysis (AREA)
Description
特に、ゴルフ競技のように大規模な試合会場の異なる場所(ホール)で、ほぼ同じ時間に、複数の選手がプレーを行う場合、漏れなく中継を行うことは困難である。そのため、注目される選手や、主要なホールを撮影対象に絞ることも多い。
このようなスポーツ中継を自動化して撮影する技術としては、ロボットカメラを用いて被写体を撮影する技術が存在する。例えば、GPSやビーコンを用いて被写体の位置を検出し、被写体を追跡して撮影する手法(非特許文献1,2参照)や、画像認識技術によって認識した被写体を追跡する手法(非特許文献3参照)等が存在する。
また、カメラをスイッチングする技術としては、映像中に映っている被写体等に予め与えたメタ情報から、時刻ごとにコスト関数を演算し、その値に応じて、映像を切り替える手法が存在する(非特許文献4,5参照)。
また、従来の被写体が映っている映像をコスト関数の値によって切り替える手法は、映像内に何が映っているのかによってカメラのスイッチングを行っている。そのため、この手法は、例えば、選手が主体となるゴルフの打球前のスイング動作の映像、ゴルフボールが主体となる打球後のボールの映像等のカメラワークや映像の切り替えを行うことができず、競技の流れに伴う番組映像を制作することができないという問題がある。
そして、番組映像制作装置は、姿勢推定手段によって、固定カメラが撮影する選手を含んだ映像のフレーム画像から、OpenPose等の公知の手法によって選手の2次元姿勢情報を検出する。そして、番組映像制作装置は、姿勢推定手段によって、検出した2次元姿勢情報と、3次元姿勢情報記憶手段に記憶されている3次元姿勢情報を2次元座標に投影した2次元姿勢情報との誤差が最小となる3次元姿勢情報を選手の3次元姿勢情報と推定する。
また、番組映像制作装置は、移動物体検出手段によって、移動物体の速度および位置を移動物体情報として検出する。
そして、番組映像制作装置は、カメラ制御情報推定手段によって、カメラモデルを用いて、姿勢推定手段で推定された3次元姿勢情報、移動物体検出手段で検出された移動物体情報、および、インデックス推定手段で推定されたインデックスからカメラワーク情報およびスイッチング情報を推定する。このカメラモデルは、3次元姿勢情報、移動物体情報およびインデックスからロボットカメラのカメラワーク情報およびスイッチング情報を推定する学習済みのニューラルネットワークのモデルである。
また、番組映像制作装置は、映像切替手段によって、スイッチング情報に基づいて、複数のロボットカメラが撮影する映像を切り替える。
なお、番組映像制作装置は、コンピュータを、前記した各手段として機能させるためのプログラムで動作させることができる。
そして、カメラモデル学習装置は、姿勢推定手段によって、固定カメラが撮影する選手を含んだ映像のフレーム画像から、選手の2次元姿勢情報を検出する。そして、カメラモデル学習装置は、姿勢推定手段によって、検出した2次元姿勢情報と、3次元姿勢情報記憶手段に記憶されている3次元姿勢情報を2次元座標に投影した2次元姿勢情報との誤差が最小となる3次元姿勢情報を選手の3次元姿勢情報と推定する。
また、カメラモデル学習装置は、移動物体検出手段によって、移動物体の速度および位置を移動物体情報として検出する。
また、カメラモデル学習装置は、カメラワーク情報入力手段によって、カメラワーク情報およびスイッチング情報を推定する際の複数のロボットカメラと同じ位置に配置した、カメラマンが操作する複数の撮影カメラから、カメラワークを特定する情報であるカメラワーク情報を入力する。
また、カメラモデル学習装置は、スイッチング情報入力手段によって、複数の撮影カメラで撮影した映像をスイッチャが切り替えるスイッチング情報を入力する。
なお、カメラモデル学習装置は、コンピュータを、前記した各手段として機能させるためのプログラムで動作させることができる。
本発明によれば、カメラマンによるカメラワークやスイッチャによるスイッチングを予め学習したモデルを用いて、ロボットカメラのカメラワークや映像の切り替えを制御することができる。
これによって、本発明は、スポーツの競技進行に応じて、カメラマンやスイッチャによって生成される番組映像と同等の番組映像を、人手を介さずに生成することができる。
[映像制作システムの構成]
まず、図1を参照して、本発明の実施形態に係る番組映像制作装置を用いた映像制作システムSの全体構成について説明する。
ここでは、スポーツとして、ゴルフを例に説明するが、選手と、選手が打ったり、投げたりするボール等の移動物体とを撮影可能なスポーツであれば、どのスポーツでもよい。例えば、砲丸投げ等の投てき競技、アーチェリー、カーリング等でもよい。この例示したスポーツの場合、移動物体は、砲丸、弓、ストーン等となる。
映像制作システムSは、ゴルフ場のコース上に設置された複数のロボットカメラRC(RC1,RC2)と、ティーグラウンドに設置されたセンサカメラSCと、番組映像制作装置1と、で構成される。
ロボットカメラRCは、番組映像制作装置1から制御信号を入力し、指示されたパン、チルト、ズームの各値に基づいたカメラワークを行い、撮影した映像を番組映像制作装置1に出力する。このロボットカメラRCが撮影する映像が、番組制作用の素材となる。
センサカメラSCは、撮影した被写体映像SV1,SV2を番組映像制作装置1に出力する。このセンサカメラSCが撮影する1枚の映像(例えば、SV1)は、選手O1の姿勢を計測するための映像である。また、センサカメラSCが撮影するステレオ映像(SV1,SV2)は、ボールO2の速度および位置を計測するための映像である。
番組映像制作装置1は、予め学習したニューラルネットワークによって、選手O1の姿勢、ボールO2の速度、位置から、ロボットカメラRCのカメラワークを決定し、制御信号によって、ロボットカメラRCにパン、チルト、ズームの各値を指示する。また、番組映像制作装置1は、ニューラルネットワークによって、カメラワークとともに、ロボットカメラRCが撮影した映像の切り替え(スイッチング)を決定し、映像を切り替えて番組映像を生成する。
なお、番組映像制作装置1が使用するニューラルネットワークは、選手O1の姿勢、ボールO2の位置等によって、予めカメラマンがロボットカメラRCを操作したカメラワーク、および、映像の切り替えを操作するスイッチャが行ったスイッチングを学習したものである。
これによって、映像制作システムSは、人手を介さずに、スポーツの番組映像を自動で制作することができる。
以下、図2を参照(適宜図1参照)して、番組映像制作装置1の構成について詳細に説明する。
図2に示すように、番組映像制作装置1は、3次元姿勢情報記憶手段10と、動作モデル記憶手段11と、カメラモデル記憶手段12と、姿勢推定手段13と、インデックス推定手段14と、ボール情報検出手段15と、カメラ制御情報推定手段16と、カメラ制御手段17と、映像切替手段18と、を備える。
この3次元姿勢情報は、一般的なモーションキャプチャ等の姿勢計測手法を用いて、選手O1の関節位置を計測したデータである。3次元姿勢情報は、対象スポーツがゴルフであれば、ゴルフのショット前後の姿勢を複数の選手で計測しておく。
この動作モデルM1は、入力層IL、隠れ層HLおよび出力層OLを有する再帰型ニューラルネットワーク(RNN)で構成することができる。
また、動作モデルM1の出力層OLから出力されるデータは、先頭からのフレーム番号である時刻iにおけるインデックスIdxiである。
インデックスは、選手O1のショット動作をある時間単位(例えば、映像のフレーム単位)に付した番号である。例えば、図4に示すように、インデックスは、ゴルフのスイングの開始から終了までのフレームに付した番号Idx1~Idxnである。
なお、動作モデルM1の学習については、後で図8を参照して説明する。
また、カメラモデルM2の出力層OLから出力されるカメラ制御情報のうちのカメラワーク情報は、ある時刻iにおけるロボットカメラRC1のパン値C1pi、チルト値C1ti、ズーム値C1zi、および、ロボットカメラRC2のパン値C2pi、チルト値C2ti、ズーム値C2ziである。
また、カメラモデルM2の出力層OLから出力されるカメラ制御情報のうちのスイッチング情報は、ロボットカメラRC1のON/OFF情報C1si、および、ロボットカメラRC2のON/OFF情報C2siである。このON/OFF情報C1si,C2siは、例えば、OFF値“0”からON値“1”の範囲を示す実数である。
なお、カメラモデルM2の学習については、後で図13を参照して説明する。
姿勢推定手段13は、被写体映像SV1の予め定めたフレーム間隔で時系列に入力される2次元画像であるフレーム画像から、選手O1の関節位置(2次元姿勢情報)を推定し、3次元姿勢情報記憶手段10に記憶されている3次元姿勢情報の中で誤差が最小となる3次元姿勢情報を、選手O1の姿勢として推定する。
(参考文献1:Zhe Cao and Tomas Simon and Shih-En Wei and Yaser Sheikh. Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields. In CVPR, 2017.)
姿勢推定手段13は、選手O1の2次元姿勢情報(2次元関節位置)と、3次元姿勢情報記憶手段10に記憶されている3次元姿勢情報(3次元関節位置)とから、選手O1の3次元姿勢情報を推定する。
2次元関節位置を(u,v)、3次元関節位置を(x,y,z)としたとき、その関係は、以下の式(1)で表すことができる。
これらのカメラパラメータ(内部、外部)のうち、事前校正によって、fx,fy,cx,cyを既知とすることができる。また、sは任意の値であればよく、例えば“1”とする。
なお、r,tは、解が極小値に落ちないように予め定めた大まかな初期値であればよい。例えば、rは、ティーマーカを結んだ線とグラウンド面を基準とした回転行列を用いればよい。また、tは、3次元姿勢情報の2次元座標上の平均値(重心位置)と、3次元姿勢情報に対応する2次元関節位置の重心位置とが一致するように予め定めた行列を用いればよい。
そして、姿勢推定手段13は、誤差の最も小さい2次元関節位置(u′,v′)を、選手O1の3次元関節位置に対応する2次元関節位置とする。なお、この誤差最小の位置を求めるには、非線形最小二乗問題を解く手法として知られるレーベンバーグ・マーカート法等を用いればよい。
そして、姿勢推定手段13は、誤差の最も小さい2次元関節位置(u′,v′)から、式(1)により、関節ごとに3次元関節位置を算出し、選手O1の3次元姿勢情報を求める。
図2に戻って、番組映像制作装置1の構成について説明を続ける。
インデックス推定手段14は、図3に示した動作モデルM1のニューラルネットワークの入力層ILに、ある時刻iにおける3次元姿勢情報(P1xi,P1yi,P1zi)、(P2xi,P2yi,P2zi)、…、(Pjxi,Pjyi,Pjzi)を入力する。
そして、インデックス推定手段14は、動作モデルM1によって、出力層OLから出力される出力値として、インデックスIdxiを算出する。
インデックス推定手段14は、算出したインデックスをカメラ制御情報推定手段16に出力する。
ボール情報検出手段15は、被写体映像SV1,SV2の予め定めたフレーム間隔で時系列に、ステレオ画像(2枚のフレーム画像)を入力し、それぞれの画像上でボールO2の予め定めた形状、色等によってボールO2の2次元座標を検出する。そして、ボール情報検出手段15は、ステレオ画像上のボールO2の位置から、三角測量の原理でボールO2の3次元空間上の位置を求めるとともに、予め定めたフレーム周期に基づいてボールO2の速度を算出する。
(参考文献2:三ッ峰,加藤、“3次元飛翔軌道方程式に基づくゴルフ軌跡表示システムの開発”、NHK技研R&D,No.173,2019年1月発行)
ボール情報検出手段15は、推定したボールO2のボール情報(速度、位置〔3次元座標〕)をカメラ制御情報推定手段16に出力する。
カメラ制御情報推定手段16は、図5に示したカメラモデルM2のニューラルネットワークの入力層ILに、ある時刻iにおける3次元姿勢情報(P1xi,P1yi,P1zi)、(P2xi,P2yi,P2zi)、…、(Pjxi,Pjyi,Pjzi)と、ボールの速度Vi、位置(Xi,Yi,Zi)およびインデックスIdxiを入力する。
カメラ制御情報推定手段16は、算出したカメラワーク情報をカメラ制御手段17に出力する。また、カメラ制御情報推定手段16は、算出したスイッチング情報を映像切替手段18に出力する。
カメラ制御手段17は、カメラ制御情報推定手段16から入力されるロボットカメラRC1のパン値C1pi、チルト値C1tiおよびズーム値C1ziを、第1制御信号CS1として、ロボットカメラRC1に出力する。
これによって、カメラ制御手段17は、カメラ制御情報推定手段16で逐次推定されるカメラワーク情報に基づいて、ロボットカメラRC1,RC2のパン、チルト、ズームのカメラワークを制御することができる。
映像切替手段18は、カメラ制御情報推定手段16から入力されるロボットカメラRC1のON/OFF情報C1siでONが指定された場合、ロボットカメラRC1から入力された第1撮影映像RV1を制作映像として出力する。
また、映像切替手段18は、カメラ制御情報推定手段16から入力されるロボットカメラRC2のON/OFF情報C2siでONが指定された場合、ロボットカメラRC2から入力された第2撮影映像RV2を制作映像として出力する。
このとき、番組映像制作装置1は、選手O1のボールO2のショット前においては、選手の動作に対して重みを付けたカメラワークおよびスイッチングの推定を行い、ショット後においては、ボールO2の速度および位置に対して重みを付けたカメラワークおよびスイッチングの推定を行うことができる。なお、この重み付けは、予め学習した動作モデルM1およびカメラモデルM2において、モデルパラメータとして学習されている。
なお、番組映像制作装置1は、コンピュータを、前記した番組映像制作装置1の各手段として機能させるための映像制作プログラムで動作させることができる。
次に、図7を参照(適宜図1,図2参照)して、番組映像制作装置1の動作について説明する。なお、ここでは、予め3次元姿勢情報記憶手段10に選手O1の3次元姿勢情報として、種々のポーズの関節位置である3次元座標を予め記憶しておくこととする。
また、動作モデル記憶手段11には予め学習した動作モデルM1(図3)が記憶され、カメラモデル記憶手段12には予め学習したカメラモデルM2(図5)が記憶されているものとする。
このとき、姿勢推定手段13は、OpenPose等の公知の手法によって、フレーム画像から選手O1の関節位置(2次元姿勢情報)を推定し、3次元姿勢情報記憶手段10に記憶されている3次元姿勢情報の中で誤差が最小となる3次元姿勢情報を、選手O1の姿勢として推定する。
これによって、ロボットカメラRC1,RC2は、パン、チルト、ズームの各値が制御信号で指示された値となるように制御される。
なお、番組映像制作装置1は、ロボットカメラRC1,RC2から順次撮影映像が入力される場合(ステップS7でYes)、ステップS1に戻って動作を継続する。
次に、図8を参照して、番組映像制作装置1で用いる動作モデルM1(図3)を学習する動作モデル学習装置2の構成について説明する。
図8に示すように、動作モデル学習装置2は、姿勢情報取得手段20と、時系列姿勢情報記憶手段21と、学習データ生成手段22と、モデル学習手段23と、動作モデル記憶手段24と、を備える。
この姿勢情報取得手段20で取得する時系列の3次元姿勢情報は、対象スポーツ(ここでは、ゴルフ)の所定の動作(ここでは、スイング動作)中のデータとする。
また、姿勢情報取得手段20は、複数の選手の3次元姿勢情報を取得する。取得する3次元姿勢情報は、複数の異なる選手がそれぞれ複数の動作を行って取得したデータであることが好ましい。
姿勢情報取得手段20は、取得した時系列の3次元姿勢情報を時系列姿勢情報記憶手段21に記憶する。
この時系列姿勢情報記憶手段21は、選手の一連の動作(例えば、スイング動作)の時系列の3次元姿勢情報を時刻と対応付けて1つのサンプルデータとして、複数のサンプルデータを記憶する。
このマッチング手段220は、サンプルデータごとに、近似するポーズを探索し、複数のサンプルデータ間で対応するポーズの3次元姿勢情報と時刻とを対応付ける。
マッチング手段220は、図9に示すように、サンプルデータSM1,SM2間において、総当たりで近似するポーズ(p1-p1等)を探索する。ここで、ポーズが近似するか否かは、例えば、2つの点群を重ね合わせる手法であるICP(Iterative Closest Point)を用いて、各関節位置の差が最も小さいポーズ同士を近似するポーズと判定する。
このとき、サンプルデータSM1,SM2間にはトータルの時間範囲に差があるため、マッチング手段220は、例えば、サンプルデータSM1の複数のポーズが、サンプルデータSM2の同じポーズに対応することも許容する。
具体的には、マッチング手段220は、以下の式(2)に示すコスト関数eの値が最小となるポーズの組み合わせを求める。
eicp,i,jは、i番目のサンプルデータ対の対応するポーズにおけるj番目のポーズ対の差である。なお、この差には、ICPを用いてポーズ間の近似判定を行う際の差を用いることができる。
pi,jは、重み係数であって、i番目のサンプルデータ対の対応するポーズにおけるj番目のポーズの動作の遷移に誤りがある場合に値を“1.5”、それ以外の場合に値を“1.0”とする。
これによって、図9に示すように、サンプルデータSM1のポーズp2,p3が、サンプルデータSM2のポーズp2,p3に遷移順序が異なるように対応付けられている場合に、コスト関数eの値が大きくなる。
図8に戻って、動作モデル学習装置2の構成について説明を続ける。
また、平均化手段221は、遷移時間を平均化したポーズに対して、番組映像制作装置1で姿勢を推定するための映像のフレームと同じ周期となるように、3次元姿勢情報を時間方向に内挿することとする。
これによって、フレームごとの3次元姿勢情報と、フレームに対応するインデックスとを、動作モデルを学習するための学習データとして生成することができる。
図10では、サンプルデータSM1~SM3において、ポーズp1,p2,p3がそれぞれ近似したポーズとしてマッチングされているものとする。
ここで、サンプルデータSM1のポーズp1からp2の遷移時間がt11、サンプルデータSM2のポーズp1からp2の遷移時間がt21、サンプルデータSM3のポーズp1からp2の遷移時間がt31であったとする。
この場合、平均化手段221は、t11、t21およびt31を平均化した時間t1を、ポーズp1からp2の遷移時間とする。
そして、平均化手段221は、平均化したポーズ間の遷移時間を基準に、内挿によって、フレーム周期の3次元姿勢情報を生成する。
このように、平均化したポーズ間の遷移時間を基準に3次元姿勢情報を生成することで、同一の時間にほぼ同じ姿勢情報が対応することになり、動作モデルを学習する際の学習速度と学習精度を高めることができる。
図8に戻って、動作モデル学習装置2の構成について説明を続ける。
学習データ生成手段22は、生成したフレーム周期の3次元姿勢情報をモデル学習手段23に出力する。
モデル学習手段23は、図3で説明した動作モデルM1において、学習データ生成手段22で生成されたフレーム単位の3次元姿勢情報を入力層ILに入力し、出力層OLから、入力した3次元姿勢情報のフレームの先頭からの番号を示すインデックスを出力するように、ニューラルネットワークの動作モデルM1のパラメータを学習する。
モデル学習手段23は、学習した動作モデルを動作モデル記憶手段24に記憶する。
この動作モデル記憶手段24に記憶された動作モデルは、図2の動作モデル記憶手段11に書き込まれ、番組映像制作装置1のインデックス推定手段14が、3次元姿勢情報からインデックスを推定する際に使用される。
なお、動作モデル学習装置2は、コンピュータを、前記した動作モデル学習装置2の各手段として機能させるための動作モデル学習プログラムで動作させることができる。
次に、図11を参照(適宜図8参照)して、動作モデル学習装置2の動作について説明する。
ステップS12において、学習データ生成手段22のマッチング手段220は、時系列姿勢情報記憶手段21に記憶されている複数の時系列の3次元姿勢情報を、近似するポーズごとにマッチングする。このとき、マッチング手段220は、近似するポーズ同士を対応付けたときの差の総和が最小となる組み合わせを求める。
これによって、学習データ生成手段22は、対応するポーズが同一時刻となるフレーム周期の3次元姿勢情報を学習データとして生成することができる。
このとき、モデル学習手段23は、出力が正解データであるインデックスとなるように、動作モデル記憶手段24に記憶されている動作モデルM1のパラメータを更新する。
ここで、学習の完了は、例えば、モデル学習手段23が学習データ生成手段22で生成された学習データをすべて使用したか否か、モデル学習手段23においてパラメータの補正量が予め定めた閾値よりも小さくなったか否か等により判定する。
以上の動作によって、動作モデル学習装置2は、番組映像制作装置1で用いる動作モデルM1を学習することができる。
次に、図12,図13を参照して、番組映像制作装置1で用いるカメラモデルM2(図5)を学習するカメラモデル学習装置3の構成について説明する。
カメラモデル学習装置3は、図12に示すように、図1で説明した映像制作時と同様、実際のスポーツを行う環境で学習を行う。
図12に示すように、カメラモデルM2(図5)を学習するカメラモデル学習システムSBは、ゴルフ場のコース上に設置された複数の撮影カメラC(C1,C2)と、ティーグラウンドに設置されたセンサカメラSCと、カメラモデル学習装置3と、スイッチャ装置4と、で構成される。
撮影カメラC1,C2は、カメラマンの操作によって変更されたパン、チルト、ズームのカメラワークを特定する情報(第1カメラワーク情報CI1、第2カメラワーク情報CI2)を、カメラモデル学習装置3に出力する。
また、撮影カメラC1,C2は、撮影した映像(第1撮影映像V1,第2撮影映像V2)をスイッチャ装置4に出力する。
センサカメラSCは、図1で説明したものと同じであるため、説明を省略する。
スイッチャ装置4は、図示を省略したモニタに複数の撮影映像を表示し、スイッチャが適宜、出力映像を切り替えることで、番組用の制作映像を生成する。
このスイッチャ装置4は、スイッチャが切り替えた撮影カメラC1,C2の切替情報をスイッチング情報SWとして、カメラモデル学習装置3に出力する。なお、スイッチャ装置4は、一般的なものであるため、説明を省略する。
図13に示すように、カメラモデル学習装置3は、3次元姿勢情報記憶手段10と、動作モデル記憶手段11と、姿勢推定手段13と、インデックス推定手段14と、ボール情報検出手段15と、カメラワーク情報入力手段30と、スイッチング情報入力手段31と、モデル学習手段32と、カメラモデル記憶手段33と、を備える。
ここでは、カメラワーク情報入力手段30は、撮影カメラC1から、撮影カメラC1のカメラワーク情報として、第1カメラワーク情報CI1を入力する。また、カメラワーク情報入力手段30は、撮影カメラC2から、撮影カメラC2のカメラワーク情報として、第2カメラワーク情報CI2を入力する。
カメラワーク情報入力手段30は、入力した撮影カメラCごとのカメラワーク情報を、モデル学習手段32に出力する。
スイッチング情報入力手段31は、入力したスイッチング情報SWを、モデル学習手段32に出力する。
モデル学習手段32は、図5で説明したカメラモデルM2において、姿勢推定手段13で推定された3次元姿勢情報と、インデックス推定手段14で推定されたインデックスと、ボール情報検出手段15で検出されたボール情報(速度、位置)とを入力層ILに入力し、出力層OLから、カメラ制御情報を出力するように、ニューラルネットワークのカメラモデルM2のパラメータを学習する。
ここで、カメラ制御情報は、カメラワーク情報入力手段30で入力されたカメラワーク情報、および、スイッチング情報入力手段31で入力されたスイッチング情報である。
モデル学習手段32は、学習した動作モデルをカメラモデル記憶手段33に記憶する。
このカメラモデル記憶手段33に記憶されたカメラモデルは、図2のカメラモデル記憶手段12に書き込まれ、番組映像制作装置1のカメラ制御情報推定手段16が、3次元姿勢情報、ボール情報(速度、位置)、および、インデックスからカメラ制御情報を推定する際に使用される。
なお、カメラモデル学習装置3は、コンピュータを、前記したカメラモデル学習装置3の各手段として機能させるためのカメラモデル学習プログラムで動作させることができる。
次に、図14を参照(適宜図13参照)して、カメラモデル学習装置3の動作について説明する。なお、ここでは、予め3次元姿勢情報記憶手段10に選手O1の3次元姿勢情報として、種々のポーズの関節位置である3次元座標を予め記憶しておくこととする。また、動作モデル記憶手段11には予め学習した動作モデルM1(図3)が記憶されているものとする。
ステップS20~S22の動作は、図7で説明した番組映像制作装置1のステップS1~S3の動作と同じであるため、説明を省略する。
ステップS24において、スイッチング情報入力手段31は、スイッチャが操作するスイッチャ装置4から、撮影カメラC1,C2の映像の切り替えを示すスイッチング情報SWを入力する。
ここで、学習の完了は、例えば、モデル学習手段32が予め定めた回数の学習を行ったか否か、モデル学習手段32においてパラメータの補正量が予め定めた閾値よりも小さくなったか否か等により判定する。
以上の動作によって、カメラモデル学習装置3は、番組映像制作装置1で用いるカメラモデルM2を学習することができる。
10 3次元姿勢情報記憶手段
11 動作モデル記憶手段
12 カメラモデル記憶手段
13 姿勢推定手段
14 インデックス推定手段
15 ボール情報検出手段(移動物体検出手段)
16 カメラ制御情報推定手段
17 カメラ制御手段
18 映像切替手段
2 動作モデル学習装置
20 姿勢情報取得手段
21 時系列姿勢情報記憶手段
22 学習データ生成手段
220 マッチング手段
221 平均化手段
23 モデル学習手段
24 動作モデル記憶手段
3 カメラモデル学習装置
30 カメラワーク情報入力手段
31 スイッチング情報入力手段
32 モデル学習手段
33 カメラモデル記憶手段
4 スイッチャ装置
SC センサカメラ
RC ロボットカメラ
C 撮影カメラ
Claims (5)
- 移動物体を用いて行うスポーツの番組映像を複数のロボットカメラの撮影映像から制作する番組映像制作装置であって、
前記スポーツを行う選手の予め定めた動作における時系列の3次元姿勢情報を予め複数記憶する3次元姿勢情報記憶手段と、
固定カメラが撮影する前記選手を含んだ映像のフレーム画像から前記選手の2次元姿勢情報を検出し、前記3次元姿勢情報を2次元座標に投影した2次元姿勢情報との誤差が最小となる3次元姿勢情報を前記選手の3次元姿勢情報と推定する姿勢推定手段と、
前記移動物体の速度および位置を移動物体情報として検出する移動物体検出手段と、
前記選手の3次元姿勢情報から前記予め定めた動作の時間位置を示すインデックスを推定する学習済みの動作モデルを用いて、前記姿勢推定手段で推定された3次元姿勢情報に対応するインデックスを推定するインデックス推定手段と、
前記選手の3次元姿勢情報、前記移動物体情報および前記インデックスから前記ロボットカメラのカメラワーク情報およびスイッチング情報を推定する学習済みのカメラモデルを用いて、前記姿勢推定手段で推定された3次元姿勢情報、前記移動物体検出手段で検出された移動物体情報、および、前記インデックス推定手段で推定されたインデックスに対応するカメラワーク情報およびスイッチング情報を推定するカメラ制御情報推定手段と、
前記カメラ制御情報推定手段で推定されたカメラワーク情報に基づいて、前記複数のロボットカメラのカメラワークを制御するカメラ制御手段と、
前記カメラ制御情報推定手段で推定されたスイッチング情報に基づいて、前記複数のロボットカメラが撮影する映像を切り替える映像切替手段と、
を備えることを特徴とする番組映像制作装置。 - 前記スポーツはゴルフであって、
前記3次元姿勢情報記憶手段に記憶する3次元姿勢情報は、前記選手のゴルフスイングにおける時系列の3次元姿勢情報であることを特徴とする請求項1に記載の番組映像制作装置。 - コンピュータを、請求項1または請求項2に記載の番組映像制作装置として機能させるための映像制作プログラム。
- 移動物体を用いて行うスポーツの番組映像を複数のロボットカメラの撮影映像から制作するための前記ロボットカメラのカメラワーク情報およびスイッチング情報を推定するカメラモデルを学習するカメラモデル学習装置であって、
前記スポーツを行う選手の予め定めた動作における時系列の3次元姿勢情報を予め複数記憶する3次元姿勢情報記憶手段と、
固定カメラが撮影する前記選手を含んだ映像のフレーム画像から前記選手の2次元姿勢情報を検出し、前記3次元姿勢情報を2次元座標に投影した2次元姿勢情報との誤差が最小となる3次元姿勢情報を前記選手の3次元姿勢情報と推定する姿勢推定手段と、
前記移動物体の速度および位置を移動物体情報として検出する移動物体検出手段と、
前記選手の3次元姿勢情報から前記予め定めた動作の時間位置を示すインデックスを推定する学習済みの動作モデルを用いて、前記姿勢推定手段で推定された3次元姿勢情報に対応するインデックスを推定するインデックス推定手段と、
前記カメラワーク情報および前記スイッチング情報を推定する際の前記複数のロボットカメラと同じ位置に配置した、カメラマンが操作する複数の撮影カメラから、カメラワークを特定する情報であるカメラワーク情報を入力するカメラワーク情報入力手段と、
前記複数の撮影カメラで撮影した映像をスイッチャが切り替えるスイッチング情報を入力するスイッチング情報入力手段と、
前記選手の3次元姿勢情報、前記移動物体情報および前記インデックスを入力し、前記カメラワーク情報および前記スイッチング情報を出力するようにニューラルネットワークの前記カメラモデルを学習するモデル学習手段と、
を備えることを特徴とするカメラモデル学習装置。 - コンピュータを、請求項4に記載のカメラモデル学習装置として機能させるためのカメラモデル学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019039127A JP7274307B2 (ja) | 2019-03-05 | 2019-03-05 | 番組映像制作装置およびカメラモデル学習装置、ならびに、それらのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019039127A JP7274307B2 (ja) | 2019-03-05 | 2019-03-05 | 番組映像制作装置およびカメラモデル学習装置、ならびに、それらのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020145527A JP2020145527A (ja) | 2020-09-10 |
JP7274307B2 true JP7274307B2 (ja) | 2023-05-16 |
Family
ID=72353755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019039127A Active JP7274307B2 (ja) | 2019-03-05 | 2019-03-05 | 番組映像制作装置およびカメラモデル学習装置、ならびに、それらのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7274307B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013206273A (ja) | 2012-03-29 | 2013-10-07 | Sony Corp | 情報処理装置、情報処理方法、および情報処理システム |
JP2017055175A (ja) | 2015-09-07 | 2017-03-16 | キヤノン株式会社 | 画像処理装置 |
JP2017531979A (ja) | 2014-10-10 | 2017-10-26 | ライブバーン インク | スポーツ競技場における視覚的な選手追跡のためのシステムおよび方法 |
-
2019
- 2019-03-05 JP JP2019039127A patent/JP7274307B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013206273A (ja) | 2012-03-29 | 2013-10-07 | Sony Corp | 情報処理装置、情報処理方法、および情報処理システム |
JP2017531979A (ja) | 2014-10-10 | 2017-10-26 | ライブバーン インク | スポーツ競技場における視覚的な選手追跡のためのシステムおよび方法 |
JP2017055175A (ja) | 2015-09-07 | 2017-03-16 | キヤノン株式会社 | 画像処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2020145527A (ja) | 2020-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11638854B2 (en) | Methods and systems for generating sports analytics with a mobile device | |
CN103019024B (zh) | 实时精确观测和分析乒乓球旋转系统与系统运行方法 | |
KR101385326B1 (ko) | 카메라로 운동하는 피사체를 촬영하고 그 촬영 이미지에 기초하여 피사체의 실제의 운동 궤적을 획득하기 위한 방법 및 시스템 | |
Zhang et al. | Real-time spin estimation of ping-pong ball using its natural brand | |
Suda et al. | Prediction of volleyball trajectory using skeletal motions of setter player | |
AU2012231931A1 (en) | Virtual golf simulation apparatus and sensing device and method used for same | |
JP2008515264A (ja) | オーバラップする画像を供給するためにカメラを有して複合画像を生成するシステム、オーバラップする画像を供給するためにカメラを使用して複合画像を生成する方法 | |
US10083519B2 (en) | Information processing apparatus and information processing method for specifying a composition of a picture | |
KR102239134B1 (ko) | 드론에 부착된 vr 카메라를 이용하여 촬영한 운동 경기 영상을 제공하는 방송 시스템 | |
US11222428B2 (en) | Determining golf swing characteristics | |
JP7078577B2 (ja) | 動作類似度評価装置、方法およびプログラム | |
CN104732560B (zh) | 基于动作捕捉系统的虚拟摄像机拍摄方法 | |
KR101703316B1 (ko) | 영상을 기반으로 속도를 측정하는 방법 및 장치 | |
JP7274307B2 (ja) | 番組映像制作装置およびカメラモデル学習装置、ならびに、それらのプログラム | |
JP2022060900A (ja) | 制御装置および学習装置及び制御方法 | |
JP2021124395A (ja) | パン・チルト角算出装置及びそのプログラム | |
Chao et al. | 3D ball trajectory reconstruction of a ballistic shot from a monocular basketball video | |
JP2013009789A (ja) | カメラシステム、撮影システム及び撮影方法 | |
Shishido et al. | Visual tracking method of a quick and anomalously moving badminton shuttlecock | |
JP2021184540A (ja) | モーションキャプチャ・カメラシステム、及び、当該カメラシステムを用いた動画データ取得方法。 | |
WO2021056552A1 (zh) | 视频的处理方法和装置 | |
TWI850714B (zh) | 用於感測移動的球的影像分析方法及利用該方法的感測裝置 | |
TWI775637B (zh) | 高爾夫揮桿解析系統、高爾夫揮桿解析方法及資訊記憶媒體 | |
TWI775636B (zh) | 高爾夫揮桿解析系統、高爾夫揮桿解析方法及資訊記憶媒體 | |
US20220339496A1 (en) | Ball position identification system, ball position identification method and information storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230501 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7274307 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |