JP7253969B2 - 幾何パラメータ推定装置、幾何パラメータ推定システム、幾何パラメータ推定方法及びコンピュータプログラム - Google Patents
幾何パラメータ推定装置、幾何パラメータ推定システム、幾何パラメータ推定方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP7253969B2 JP7253969B2 JP2019084632A JP2019084632A JP7253969B2 JP 7253969 B2 JP7253969 B2 JP 7253969B2 JP 2019084632 A JP2019084632 A JP 2019084632A JP 2019084632 A JP2019084632 A JP 2019084632A JP 7253969 B2 JP7253969 B2 JP 7253969B2
- Authority
- JP
- Japan
- Prior art keywords
- geometric parameter
- model
- parameter estimation
- output
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
また、視聴体験の観点においても、解析結果を映像と同時に視聴者に提示したり、あるいは映像に重畳表示したりすることで、視聴者の試合に対する理解を深め、視聴体験の質を向上させることが期待できる。スポーツ映像解析の産業応用の素地は広く、その価値は極めて高いと考えられる。
上記の問題は、連続するフレーム間から抽出された局所特徴の対応付け結果や、あるいはオプティカルフローの推定によって推定された対応付け結果を用いることで部分的に自動化することが可能である。しかしながら、これらの方法は競技空間とは独立して動く人物やボールの動きに影響を受けやすく、また十分なテクスチャのない競技空間では対応点が正確に求まらないことが多いため、幾何パラメータ推定の性能は総じて低い。
上記事情に鑑み、本発明は、幾何パラメータを精度よく推定することができる技術の提供を目的としている。
(第1の実施形態)
図1は、第1の実施形態における幾何パラメータ推定装置10の機能構成を表す概略ブロック図である。
幾何パラメータ推定装置10は、所定の空間が撮像されたフレームに基づいて、入力したフレームの画像変換を行うために用いる幾何パラメータを推定する。ここで、所定の空間とは、バスケットボール、サッカー、ラグビー、アイスホッケー等のスポーツが行われる競技場である。フレームとは、映像を構成する1コマの画像である。以下の説明では、所定の空間がバスケットボールの競技場である場合を例に説明する。
幾何パラメータ推定装置10は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、幾何パラメータ推定プログラムを実行する。幾何パラメータ推定プログラムの実行によって、幾何パラメータ推定装置10は、記憶部11、領域分割モデル学習部12、学習データ生成部13、幾何パラメータ推定モデル学習部14、幾何パラメータ推定部15を備える装置として機能する。なお、幾何パラメータ推定装置10の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)やGPU(Graphics Processing Unit)等のハードウェアを用いて実現されてもよい。また、幾何パラメータ推定プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。また、幾何パラメータ推定プログラムは、電気通信回線を介して送受信されてもよい。
領域マスク162は、画像161に撮像されている競技場の空間に対して領域を区分けするラベルが付与されたマスク画像である。より具体的には、領域マスク162は、画像161に撮像されている競技場の空間を、所定の条件に従って分割して、分割後の各領域に対して同一の領域に同一のラベルが付与されたマスク画像である。領域マスク162の例を図2に示す。
正面領域マスク165は、幾何パラメータ164により、真上から(正面から)見た状態に変換された領域マスク162である。例えば、正面領域マスク165は、図2(B)の画像である。正面領域マスク165は、割り当て対象のラベルが4つ以上を付与された領域マスク162である。正面領域マスク165は、1枚あればよい。
生成領域マスク167は、幾何パラメータ164と、正面領域マスク165とに基づいて、学習データ生成部13によって新たに生成された領域マスクである。
領域分割モデル学習部12は、画像161、領域マスク162、領域隣接関係行列163及び生成領域マスク167に基づいて、領域分割部モデル17を学習する。
幾何パラメータ推定モデル学習部14は、領域分割モデル学習部12から出力される領域マスクと、幾何パラメータ164、正面領域マスク165及び生成幾何パラメータ166とに基づいて、幾何パラメータ推定モデル18を学習する。
幾何パラメータ推定部15は、領域分割部モデル17、幾何パラメータ推定モデル18及びテスト画像19を用いて、領域マスク及び幾何パラメータを推定する。具体的には、まず幾何パラメータ推定部15は、テスト画像19を領域分割部モデル17に入力することによって領域マスクを出力させる。そして、幾何パラメータ推定部15は、出力された領域マスクを幾何パラメータ推定モデル18に入力することによって幾何パラメータを出力させる。このように、幾何パラメータ推定部15は、幾何パラメータを推定する。
領域分割モデル学習部12は、画像161、領域マスク162、領域隣接関係行列163及び生成領域マスク167に基づいて、領域分割部モデル17を学習する(ステップS101)。領域分割モデルを学習するアルゴリズムは任意であり、例えばmomentum-SGDやADAMを用いることができる。領域分割モデルの学習は、領域分割モデルが出力する領域マスクと正解領域マスクとの差異と、領域分割モデルが出力する領域マスクに含まれる各ラベルの隣接関係を表した領域隣接関係行列と正解領域隣接関係行列との差異を同時に最小化することで実施される。正解領域マスクは、入力される画像161に対応する領域マスク162である。また、正解領域隣接関係行列は、入力される画像161から得られた領域マスク162に対応する領域隣接関係行列163である。
領域分割部モデル17が出力する領域隣接関係行列と、正解領域隣接関係行列との差異は、行列の各要素のバイナリクロスエントロピーの和で評価すればよい。ここで、領域隣接関係行列は明らかに対称行列となるため、誤差評価に用いる行列要素は、領域隣接関係行列の右上部あるいは左下部のみとする。なお、領域マスクと領域隣接関係行列を出力する領域分割モデルは任意の構成をとることが可能であり、例えば参考文献1で開示されているモデルを用いることができる。領域分割モデル学習部12は、学習により得られた
(参考文献1:Hang Zhang, Kristin Dana, Jianping Shi, Zhongyue Zhang, Xiaogang Wang, Ambrish Tyagi, Amit Agrawal, “Context Encoding for Semantic Segmentation”, in Proc. CVPR, 2018.)
幾何パラメータ推定部15は、記憶部11に記憶されているテスト画像19を読み出し、読み出したテスト画像19を領域分割部モデル17に入力する(ステップS201)。幾何パラメータ推定部15は、テスト画像19を領域分割部モデル17に入力することによって、入力したテスト画像17に対応する領域マスクを領域分割部モデル17から出力させる(ステップS202)。そして、幾何パラメータ推定部14は、領域分割部モデル17から出力された領域マスクを幾何パラメータ推定モデル18に入力する(ステップS203)。幾何パラメータ推定部14は、領域分割部モデル17から出力された領域マスクを幾何パラメータ推定モデル18に入力することによって、入力した領域マスクに対応する幾何パラメータを幾何パラメータ推定モデル18から出力させる。幾何パラメータ推定モデル18では、入力された領域マスクを、所定の座標系(例えば、画像に撮像されている空間を真上から(正面から)見た状態)に変換するための幾何パラメータを出力する。この処理により、幾何パラメータ推定部14は、幾何パラメータを推定する(ステップS204)。
幾何パラメータ推定装置10がクラウド上に設けられて、ネットワークを介して他の装置からの要求に応じて、領域分割部モデル17、幾何パラメータ推定モデル18の学習及び幾何パラメータの推定を行うように構成されてもよい。
第2の実施形態では、幾何パラメータ推定装置が、領域分割モデルと、幾何パラメータ推定モデルとを、幾何パラメータを推定する一つのモデルとして、学習データを用いてその全体のパラメータを最適化する構成について説明する。
幾何パラメータ推定装置10aは、バスで接続されたCPUやメモリや補助記憶装置などを備え、幾何パラメータ推定プログラムを実行する。幾何パラメータ推定プログラムの実行によって、幾何パラメータ推定装置10aは、記憶部11、領域分割モデル学習部12、学習データ生成部13、幾何パラメータ推定モデル学習部14、幾何パラメータ推定部15、モデル同時学習部20を備える装置として機能する。なお、幾何パラメータ推定装置10aの各機能の全て又は一部は、ASICやPLDやFPGAやGPU等のハードウェアを用いて実現されてもよい。また、幾何パラメータ推定プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。また、幾何パラメータ推定プログラムは、電気通信回線を介して送受信されてもよい。
幾何パラメータ推定装置10aがクラウド上に設けられて、ネットワークを介して他の装置からの要求に応じてモデルの学習及び幾何パラメータの推定を行うように構成されてもよい。
第3の実施形態では、幾何パラメータ推定装置10が備える一部又は全ての機能部が、クラウド上のサーバに実装され、クラウド上のサーバでモデルの学習を行う構成について説明する。
図11は、第3の実施形態における幾何パラメータ推定システム100のシステム構成を示す図である。幾何パラメータ推定システム100は、幾何パラメータ推定装置10b及びモデル学習装置300を備える。幾何パラメータ推定装置10b及びモデル学習装置300及びは、ネットワーク30を介して通信可能に接続される。ネットワーク30は、例えばインターネットである。
幾何パラメータ推定装置10bは、モデル学習装置300により学習されたモデルを用いて幾何パラメータを推定する。
まずモデル学習装置300の機能構成について説明する。モデル学習装置300は、バスで接続されたCPUやメモリや補助記憶装置などを備え、学習プログラムを実行する。学習プログラムの実行によって、モデル学習装置300は、記憶部11、領域分割モデル学習部12、学習データ生成部13、幾何パラメータ推定モデル学習部14、幾何パラメータ推定部15を備える装置として機能する。なお、幾何パラメータ推定装置10bの各機能の全て又は一部は、ASICやPLDやFPGAやGPU等のハードウェアを用いて実現されてもよい。また、学習プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。また、学習プログラムは、電気通信回線を介して送受信されてもよい。
通信部301は、幾何パラメータ推定装置10bに対して領域分割部モデル17及び幾何パラメータ推定モデル18を送信する。
幾何パラメータ推定部15は、第1の実施形態における同名の機能部と同様に幾何パラメータを推定する。
モデル学習装置300が備える一部の機能部は、他の装置(例えば、幾何パラメータ推定装置10b)に実装されてもよい。
モデル学習装置300は、第2の実施形態における幾何パラメータ推定装置10と同様に、モデル同時学習部20を備えるように構成されてもよい。
上記の各実施形態では、所定の空間を区分けするラベルが付与されたマスク画像(領域マスク)を領域分割モデルから出力させる構成を示したが、領域分割モデルから区分けした空間毎の位置関係を示す情報をマスク情報として出力させてもよい。
Claims (6)
- 入力されたフレームに撮像されている所定の空間を区分けするラベルが付与されたマスク情報を出力するように学習された領域分割モデルにより得られたマスク情報を用いて、前記フレームを特定の方向から見た画像に変換するための幾何パラメータを推定する幾何パラメータ推定部と、
前記領域分割モデルと、前記幾何パラメータ推定モデルとを同時に学習するモデル同時学習部と、
を備え、
前記幾何パラメータ推定部は、前記領域分割モデルが出力するマスク情報を入力として前記幾何パラメータを出力する幾何パラメータ推定モデルを用いて前記幾何パラメータを推定し、
前記モデル同時学習部は、所定の空間が撮像されたフレームと、前記所定の空間が撮像されたフレームから得られるマスク情報と、前記マスク情報に含まれる各ラベルの隣接関係を表した領域隣接関係行列と、前記所定の空間が撮像されたフレームから予め求められた幾何パラメータとを入力として、入力された前記フレームに基づいて前記領域分割モデルと、前記幾何パラメータ推定モデルとを一つのモデルとして、入力された前記フレームに基づいて前記領域分割モデルが出力する出力マスク情報と、入力された前記マスク情報との差異、入力された前記フレームに基づいて前記領域分割モデルが出力する出力領域隣接関係行列と、入力された前記領域隣接関係行列との差異、及び、前記出力マスク情報に基づいて前記幾何パラメータ推定モデルが出力する出力幾何パラメータと、入力された前記幾何パラメータとの差異を同時に最小化するように前記領域分割モデルと、前記幾何パラメータ推定モデルとを学習する幾何パラメータ推定装置。 - 前記領域分割モデルを学習する領域分割モデル学習部をさらに備え、
前記領域分割モデル学習部は、所定の空間が撮像されたフレームと、前記所定の空間が撮像されたフレームから得られるマスク情報と、前記マスク情報に含まれる各ラベルの隣接関係を表した領域隣接関係行列とを入力として、入力された前記フレームに基づいて前記領域分割モデルが出力する出力マスク情報と、入力された前記マスク情報との差異、及び、入力された前記フレームに基づいて前記領域分割モデルがさらに出力する出力領域隣接関係行列と、入力された前記領域隣接関係行列との差異を最小化するように前記領域分割モデルを学習する、請求項1に記載の幾何パラメータ推定装置。 - 幾何パラメータ推定モデルで利用する学習データを生成する学習データ生成部をさらに備え、
前記学習データ生成部は、予め幾何パラメータの値を変更して、変更後の幾何パラメータと、特定の方向から見たマスク情報とを用いて、新たなマスク情報を学習データとして生成する、請求項1又は2に記載の幾何パラメータ推定装置。 - 入力されたフレームに撮像されている所定の空間を区分けするラベルが付与されたマスク情報を出力するように学習された領域分割モデルにより得られたマスク情報を用いて、前記フレームを特定の方向から見た画像に変換するための幾何パラメータを推定する幾何パラメータ推定部と、
前記領域分割モデルと、前記幾何パラメータ推定モデルとを同時に学習するモデル同時学習部と、
を備え、
前記幾何パラメータ推定部は、前記領域分割モデルが出力するマスク情報を入力として前記幾何パラメータを出力する幾何パラメータ推定モデルを用いて前記幾何パラメータを推定し、
前記モデル同時学習部は、所定の空間が撮像されたフレームと、前記所定の空間が撮像されたフレームから得られるマスク情報と、前記マスク情報に含まれる各ラベルの隣接関係を表した領域隣接関係行列と、前記所定の空間が撮像されたフレームから予め求められた幾何パラメータとを入力として、入力された前記フレームに基づいて前記領域分割モデルと、前記幾何パラメータ推定モデルとを一つのモデルとして、入力された前記フレームに基づいて前記領域分割モデルが出力する出力マスク情報と、入力された前記マスク情報との差異、入力された前記フレームに基づいて前記領域分割モデルが出力する出力領域隣接関係行列と、入力された前記領域隣接関係行列との差異、及び、前記出力マスク情報に基づいて前記幾何パラメータ推定モデルが出力する出力幾何パラメータと、入力された前記幾何パラメータとの差異を同時に最小化するように前記領域分割モデルと、前記幾何パラメータ推定モデルとを学習する幾何パラメータ推定システム。 - コンピュータが、
入力されたフレームに撮像されている所定の空間を区分けするラベルが付与されたマスク情報を出力するように学習された領域分割モデルにより得られたマスク情報を用いて、前記フレームを特定の方向から見た画像に変換するための幾何パラメータを推定する幾何パラメータ推定ステップと、
前記領域分割モデルと、前記幾何パラメータ推定モデルとを同時に学習するモデル同時学習ステップと、
を有し、
前記幾何パラメータ推定ステップにおいて、前記領域分割モデルが出力するマスク情報を入力として前記幾何パラメータを出力する幾何パラメータ推定モデルを用いて前記幾何パラメータを推定し、
前記モデル同時学習ステップにおいて、所定の空間が撮像されたフレームと、前記所定の空間が撮像されたフレームから得られるマスク情報と、前記マスク情報に含まれる各ラベルの隣接関係を表した領域隣接関係行列と、前記所定の空間が撮像されたフレームから予め求められた幾何パラメータとを入力として、入力された前記フレームに基づいて前記領域分割モデルと、前記幾何パラメータ推定モデルとを一つのモデルとして、入力された前記フレームに基づいて前記領域分割モデルが出力する出力マスク情報と、入力された前記マスク情報との差異、入力された前記フレームに基づいて前記領域分割モデルが出力する出力領域隣接関係行列と、入力された前記領域隣接関係行列との差異、及び、前記出力マスク情報に基づいて前記幾何パラメータ推定モデルが出力する出力幾何パラメータと、入力された前記幾何パラメータとの差異を同時に最小化するように前記領域分割モデルと、前記幾何パラメータ推定モデルとを学習する幾何パラメータ推定方法。 - 入力されたフレームに撮像されている所定の空間を区分けするラベルが付与されたマスク情報を出力するように学習された領域分割モデルにより得られたマスク情報を用いて、前記フレームを特定の方向から見た画像に変換するための幾何パラメータを推定する幾何パラメータ推定ステップと、
前記領域分割モデルと、前記幾何パラメータ推定モデルとを同時に学習するモデル同時学習ステップと、
をコンピュータに実行させ、
前記幾何パラメータ推定ステップにおいて、前記領域分割モデルが出力するマスク情報を入力として前記幾何パラメータを出力する幾何パラメータ推定モデルを用いて前記幾何パラメータを推定し、
前記モデル同時学習ステップにおいて、所定の空間が撮像されたフレームと、前記所定の空間が撮像されたフレームから得られるマスク情報と、前記マスク情報に含まれる各ラベルの隣接関係を表した領域隣接関係行列と、前記所定の空間が撮像されたフレームから予め求められた幾何パラメータとを入力として、入力された前記フレームに基づいて前記領域分割モデルと、前記幾何パラメータ推定モデルとを一つのモデルとして、入力された前記フレームに基づいて前記領域分割モデルが出力する出力マスク情報と、入力された前記マスク情報との差異、入力された前記フレームに基づいて前記領域分割モデルが出力する出力領域隣接関係行列と、入力された前記領域隣接関係行列との差異、及び、前記出力マスク情報に基づいて前記幾何パラメータ推定モデルが出力する出力幾何パラメータと、入力された前記幾何パラメータとの差異を同時に最小化するように前記領域分割モデルと、前記幾何パラメータ推定モデルとを学習させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019084632A JP7253969B2 (ja) | 2019-04-25 | 2019-04-25 | 幾何パラメータ推定装置、幾何パラメータ推定システム、幾何パラメータ推定方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019084632A JP7253969B2 (ja) | 2019-04-25 | 2019-04-25 | 幾何パラメータ推定装置、幾何パラメータ推定システム、幾何パラメータ推定方法及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020181417A JP2020181417A (ja) | 2020-11-05 |
JP7253969B2 true JP7253969B2 (ja) | 2023-04-07 |
Family
ID=73024147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019084632A Active JP7253969B2 (ja) | 2019-04-25 | 2019-04-25 | 幾何パラメータ推定装置、幾何パラメータ推定システム、幾何パラメータ推定方法及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7253969B2 (ja) |
-
2019
- 2019-04-25 JP JP2019084632A patent/JP7253969B2/ja active Active
Non-Patent Citations (1)
Title |
---|
Namdar Homayounfar et al.,Sports Field Localization via DeepStructured Models,[online],2017年,https://ieeexplore.ieee.org/document/8099910 |
Also Published As
Publication number | Publication date |
---|---|
JP2020181417A (ja) | 2020-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Detect globally, refine locally: A novel approach to saliency detection | |
Sun et al. | Deep affinity network for multiple object tracking | |
Cioppa et al. | Camera calibration and player localization in soccernet-v2 and investigation of their representations for action spotting | |
US20200302181A1 (en) | System and method for generating visual analytics and player statistics | |
Ren et al. | Multi-camera video surveillance for real-time analysis and reconstruction of soccer games | |
JP7334058B2 (ja) | 幾何パラメータ推定装置、幾何パラメータ推定システム、幾何パラメータ推定方法及びコンピュータプログラム | |
CA2913432A1 (en) | System and method for identifying, analyzing, and reporting on players in a game from video | |
Kim et al. | Ev-tta: Test-time adaptation for event-based object recognition | |
US20240029278A1 (en) | Systems and methods for video-based sports field registration | |
US20230095568A1 (en) | Object tracking device, object tracking method, and program | |
Kotera et al. | Intra-frame object tracking by deblatting | |
Theiner et al. | Tvcalib: Camera calibration for sports field registration in soccer | |
KR20180054406A (ko) | 영상 처리 장치 및 방법 | |
US8164633B2 (en) | Calibration apparatus and method for imaging devices and computer program | |
Chen et al. | Autocorrect: Deep inductive alignment of noisy geometric annotations | |
JP7253969B2 (ja) | 幾何パラメータ推定装置、幾何パラメータ推定システム、幾何パラメータ推定方法及びコンピュータプログラム | |
JP7195892B2 (ja) | 座標変換行列推定方法及びコンピュータプログラム | |
Chen et al. | Player trajectory reconstruction for tactical analysis | |
Jiang et al. | Court Detection Using Masked Perspective Fields Network | |
Bright et al. | Mitigating motion blur for robust 3d baseball player pose modeling for pitch analysis | |
CN111860261B (zh) | 一种客流值的统计方法、装置、设备及介质 | |
Gomez-Nieto et al. | Quality aware features for performance prediction and time reduction in video object tracking | |
Pandya et al. | Homography based player identification in live sports | |
Zhang et al. | A fast and effective framework for camera calibration in sport videos | |
Yan et al. | Design and image Research of tennis line examination based on machine vision analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7253969 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |