JP2021124748A - 映像変換方法、装置およびプログラム - Google Patents

映像変換方法、装置およびプログラム Download PDF

Info

Publication number
JP2021124748A
JP2021124748A JP2020015316A JP2020015316A JP2021124748A JP 2021124748 A JP2021124748 A JP 2021124748A JP 2020015316 A JP2020015316 A JP 2020015316A JP 2020015316 A JP2020015316 A JP 2020015316A JP 2021124748 A JP2021124748 A JP 2021124748A
Authority
JP
Japan
Prior art keywords
analysis section
video
site
evaluation
bit rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020015316A
Other languages
English (en)
Other versions
JP7231573B2 (ja
JP2021124748A5 (ja
Inventor
和之 田坂
Kazuyuki Tasaka
和之 田坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2020015316A priority Critical patent/JP7231573B2/ja
Publication of JP2021124748A publication Critical patent/JP2021124748A/ja
Publication of JP2021124748A5 publication Critical patent/JP2021124748A5/ja
Application granted granted Critical
Publication of JP7231573B2 publication Critical patent/JP7231573B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】動画映像を高品質での解析が望ましい解析区間とそれ以外の非解析区間とに識別し、識別結果に応じてビットレートを変換することでデータ量を削減する。【解決手段】映像取得部101は、ユーザのカメラ映像をフレーム単位で取得する。人物領域抽出部102は、カメラ映像の各フレーム画像から人物領域を抽出する。骨格情報抽出部103は、フレーム画像の人物領域から骨格情報を抽出する。位置推定部104は、ユーザが指定した評価部位を評価部位指定受付部104aで受け付け、評価部位に対応した骨格の位置を推定する。解析区間決定部105は、評価部位の位置と所定の基準部位の位置との相対的な位置関係を計算し、この位置関係に基づいて解析区間および非解析区間を決定する。映像変換部106は、非解析区間のビットレートが解析区間のビットレートよりも相対的に低下するようにカメラ映像のビットレートを低下させる。【選択図】図2

Description

本発明は、動画の映像を解析する映像変換方法、装置およびプログラムに係り、特に、動画映像を高品質での解析が望ましい解析区間とそれ以外の非解析区間とに分類し、分類結果に応じてビットレートを変換する映像変換方法、装置およびプログラムに関する。
野球、ラグビーあるいはゴルフのように骨格の動きが上達を左右するスポーツでは、体全体の動きのみならず骨格の位置や動きが重要となる。したがって、その上達には専門化の指導が有効となることが多い。しかしながら、スタジオやスクールに出向いて専門家から指導を受けるためには、相応のコスト負担を強いられ、また時間的かつ場所的な拘束も増すことになる。
特許文献1には、入力画像に映る人物の運動を認識する認識部と、認識された運動の有効性に応じて異なる仮想オブジェクトを入力画像に重畳する表示制御部とを備え、認識部により認識される運動の有効性を示すスコアを算出し、算出結果を入力画像に重畳することで、運動の有効性に関するフィードバックを目に見える形でユーザに呈示する画像処理装置が提案されている。
しかしながら、特許文献1では、ユーザのトレーニング映像をユーザ自身が確認し、更には重畳表示される仮想オブジェクトの動きと比較することでトレーニングを主観的に評価することが可能になるものの、専門家の具体的な指導を受けることはできない。したがって、ユーザ自身が専門知識を有していない限り有効はトレーニングを実現できない。
このような技術課題に対して、本発明の発明者等は、複数のトレーニングメニューを記憶するデータベースからトレーニングメニューを選択し、選択されたトレーニングメニューをユーザ端末へ配信し、トレーニングメニューを実施するユーザを撮影したトレーニング映像をユーザ端末から取得し、トレーニング映像からユーザの骨格情報を抽出し、骨格情報に基づいてユーザのトレーニングを評価し、トレーニングの評価をユーザ端末へ配信するトレーニング支援方法および装置を発明し、特許出願した(特許文献2)。
特許文献3には、車両に搭載される映像記録装置において、駐車中に車両周囲を撮影するカメラからの映像信号に基づいて記録用の映像データを生成する一方、カメラによる撮影映像を解析し、その映像変化に基づき映像データの映像品質を制御することにより、記憶ユニットに格納する映像データの量を制御する技術が開示されている。
特許文献4には、情報処理装置と接続可能な電子黒板において、ユーザからの画面に対する入力を受け付け、情報処理装置から映像信号を取得して画像データを生成し、ユーザからの入力を受け付けた場合に画像データのフレームレートを入力受け付け前よりも低い値に変更する技術が開示されている。
特開2013-103010号公報 特願2018-181304号 特開2019-161350号公報 特開2019-159261号公報
Z. Cao, T. Simon, S. Wei and Y. Sheikh, "Realtime Multi-person 2D Pose Estimation Using Part Affinity Fields," 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, HI, 2017, pp. 1302-1310.
特許文献2によれば、ユーザは、配信されたトレーニングメニューを実施する自身のトレーニング映像をユーザ端末で撮影、送信するだけで、専門家が常駐するトレーニングジム等の施設に出向くことなく、自宅などで専門的なトレーニングを手軽に受けられるようになる。
一方、特許文献2ではトレーニング映像をユーザ端末で撮影して送信する必要があるが、動画はデータ量が大きいのでトラヒック量が増加する。また、評価側でも多数のユーザから同時刻に動画を配信されるとネットワークに輻輳が生じ、サーバの負荷が増大する。
特許文献3,4によれば動画映像のデータ量が削減できるので、映像の伝送によるネットワークの輻輳やサーバの負荷増大を軽減できる。しかしながら、データ量を削減すると映像品質が低下するため、その解析に支障をきたす可能性があった。
本発明の目的は、上記の技術課題を解決し、動画映像の解析に支障をきたさない様に、そのビットレートを低下させてデータ量を削減できる映像変換方法、装置およびプログラムを提供することにある。
上記の目的を達成するために、本発明は、人物を被写体とする動画映像のデータ量を変換する映像変換装置において、以下の構成を具備した点に特徴がある。
(1) 各フレームから人物の骨格情報を抽出する抽出手段と、骨格情報に基づいて所定の評価部位の位置を推定する位置推定手段と、前記評価部位の位置に基づいて解析区間を決定する決定手段と、非解析区間のビットレートを解析区間のビットレートよりも低いビットレートに変換してデータ量を減じる変換手段とを具備した。
(2) 位置推定手段は、骨格情報に基づいて所定の基準部位の位置を更に推定し、前記決定手段は、評価部位と基準部位との相対的な位置関係が所定の開始要件を充足する開始タイミングから所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定するようにした。
(3) 前記位置推定手段は、骨格情報に基づいて複数の評価部位および対応する複数の基準部位の各位置を推定し、前記決定手段は、各評価部位と対応する各基準部位との相対的な位置関係が所定の開始要件を充足する開始タイミングから、各評価部位と対応する各基準部位との相対的な位置関係が所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定するようにした。
(4) 前記位置推定手段は、骨格情報に基づいて複数の評価部位および対応する複数の基準部位の各位置を推定し、前記決定手段は、一の評価部位と対応する一の基準部位との相対的な位置関係が所定の開始要件を充足する開始タイミングから、他の一の評価部位と対応する他の一の基準部位との相対的な位置関係が所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定するようにした。
(5) 前記決定手段は、評価部位の移動軌跡が所定の開始要件を充足する開始タイミングから所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定するようにした。
(6) 前記決定手段は、評価部位と基準部位との相対的な位置関係および評価部位の移動軌跡の、一方が所定の開始要件を充足する開始タイミングから他方が所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定するようにした。
(7) 評価部位の指定を受け付ける手段を具備し、前記位置推定手段は、指定された評価部位の位置を推定するようにした。
(8) 前記動画映像に基づいて人物の動きの種別を判定する手段と、前記動きの判定結果に基づいて評価部位を決定する手段とを具備し、前記位置推定手段は、決定された評価部位の位置を推定するようにした。
(9) 前記決定手段は、前記評価部位の位置に基づいて決定した解析区間よりも所定の時間だけ前のタイミングを解析区間の開始タイミングとみなすようにした。
本発明によれば、以下のような効果が達成される。
(1) 人物を被写体とする動画映像のデータ量を変換する映像変換装置において、各フレームから抽出した骨格情報に基づいて所定の評価部位の位置を推定する位置推定手段と、評価部位の位置に基づいて解析区間を決定する決定手段と、非解析区間のビットレートを解析区間のビットレートよりも低いビットレートに変換してデータ量を減じる変換手段とを具備したので、高品質映像を用いた解析が望ましい解析区間を正確に決定できる。したがって、動画映像の解析に支障をきたすことなく動画映像のデータ量やトラヒック量を削減できるようになる。
(2) 位置推定手段は、骨格情報に基づいて所定の基準部位の位置を更に推定し、決定手段は、評価部位と基準部位との相対的な位置関係が所定の開始要件を充足する開始タイミングから所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定するようにした。したがって、解析区間が評価部位と基準部位との相対的な位置関係に依存する場合に解析区間を正確に決定できるようになる。
(3) 位置推定手段は、骨格情報に基づいて複数の評価部位および対応する複数の基準部位の各位置を推定し、決定手段は、各評価部位と対応する各基準部位との相対的な位置関係が所定の開始要件を充足する開始タイミングから所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定するようにした。したがって、解析区間が複数の評価部位とその対応する基準部位との相対的な位置関係に依存する場合でも解析区間を正確に決定できるようになる。
(4) 位置推定手段は、骨格情報に基づいて複数の評価部位および対応する複数の基準部位の各位置を推定し、決定手段は、一の評価部位と対応する一の基準部位との相対的な位置関係が所定の開始要件を充足する開始タイミングから、他の一の評価部位と対応する他の一の基準部位との相対的な位置関係が所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定するようにした。したがって、解析区間の開始タイミングおよび終了タイミングが、複数の異なる評価部位とその対応する各基準部位との相対的な位置関係にそれぞれ依存する場合も解析区間を正確に決定できるようになる。
(5) 決定手段は、評価部位の移動軌跡が所定の開始要件を充足する開始タイミングから所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定するようにしたので、解析区間の開始タイミングおよび終了タイミングが評価部位の移動軌跡に依存する場合に解析区間を正確に決定できるようになる。
(6) 決定手段は、評価部位と基準部位との相対的な位置関係および評価部位の移動軌跡の、一方が所定の開始要件を充足する開始タイミングから他方が所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定するので、解析区間の開始タイミングおよび終了タイミングの一方が評価部位と基準部位との相対的な位置関係に依存し、他方が評価部位の移動軌跡に依存する場合でも解析区間を正確に決定できるようになる。
(7) 評価部位の指定を受け付ける手段を具備し、指定された評価部位の位置を推定するようにしたので、評価部位をユーザの意志で設定できるようになる。
(8) 動画映像に基づいて人物の動きの種別を判定する手段と、種別の判定結果に基づいて評価部位を決定する手段とを具備し、位置推定手段は、決定された評価部位の位置を推定するようにしたので、ユーザに専門知識や負担を強いることなく最適な評価部位を自動的に設定することができ、最適な解析区間を決定できるようになる。
(9) 評価部位の位置に基づいて決定した解析区間よりも所定の時間だけ前のタイミングを解析区間の開始タイミングとみなすようにしたので、映像解析に重要となる解析区間の開始タイミングの抽出漏れを防ぐことができるようになる。
本発明が適用される映像分析システムの構成を示したブロック図である。 ローカル端末の第1実施形態の構成を示した機能ブロック図である。 抽出対象の骨格を示した図である。 第1実施形態による解析区間の決定方法を示した図(その1)である。 第1実施形態による解析区間の決定方法を示した図(その2)である。 ローカル端末の第2実施形態の構成を示した機能ブロック図である。 ローカル端末の第3実施形態の構成を示した機能ブロック図である。 第3実施形態による解析区間の決定方法を示した図である。
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は、本発明が適用される映像分析システムの構成を示したブロック図であり、カメラおよび通信機能に加えて本発明に係る動画変換機能を備えたローカル端末1と、ローカル端末1が撮影したカメラ映像を、例えばWi-Fi、無線基地局BSおよびネットワークNW経由で取得し、分析する映像分析サーバ2とを主要な構成としている。ただし、ローカル端末1の処理能力が十分に高ければ、ローカル端末1のみで映像分析システムを構成することもできる。
ローカル端末1は、運動、演舞あるいはトレーニング等するユーザのカメラ映像を骨格レベルで解析し、ユーザの動きを詳細に分析すべき解析区間とそれ以外の非解析区間とに分類する。ローカル端末1は更に、非解析区間のビットレートが解析区間のビットレートよりも低下するようにカメラ映像を変換し、変換後カメラ映像を蓄積し、更には映像分析サーバ2へ配信する。
本実施形態では、非解析区間のビットレートが減ぜられた結果、変換後のカメラ映像のデータ量は変換前のカメラ映像のデータ量よりも減ぜられるので、ローカル端末1がカメラ映像の保存に要する記憶容量を減じ、またローカル端末1から映像分析サーバ2への映像配信に係るトラヒック量を減じることができる。
前記映像分析サーバ2では、受信した変換後カメラ映像を専門家等がモニター上で確認する。このとき、分析区間の映像はビットレートが低下していないので十分な映像品質を維持している。したがって、専門家等は高品位の映像を参照しながらユーザの動きを細かく分析し、正確なアドバイスやコーチングをユーザに提供できるようになる。
図2は、前記ローカル端末1の第1実施形態の機能ブロック図であり、映像取得部101、人物領域抽出部102、骨格情報抽出部103、位置推定部104、解析区間決定部105および映像変換部106を主要な構成としている。
このようなローカル端末1は、汎用のコンピュータやモバイル端末に、後述する各機能を実現するアプリケーション(プログラム)を実装することで構成できる。あるいは、アプリケーションの一部をハードウェア化またはプログラム化した専用機や単能機としても構成できる。本実施形態では、ローカル端末1をスマートフォンやタブレット端末で代用する場合を例にして説明する。
前記映像取得部101は、ローカル端末1のカメラ機能が撮影したユーザのカメラ映像(動画像)をフレーム単位で取得する。人物領域抽出部102は、カメラ映像の各フレーム画像から人物領域を抽出する。人物領域の抽出には、例えばSSD (Single Shot Multibox Detector) を用いることができる。
骨格情報抽出部103は、フレーム画像の人物領域から、予め抽出対象として登録されている骨格を抽出し、その位置情報や他の骨格との連結状態を骨格情報として登録する。骨格情報の抽出には、既存の骨格抽出技術 (Cascaded Pyramid Network) を用いることができる。
図3は、前記骨格情報抽出部103が抽出対象とする骨格を示した図であり、左右の肘関節P3,P6、左右の手首関節P4,P7、左右の膝関節P9,P12および左右の足首関節P10,P13ならびにこれらの関節を連結する骨などが抽出される。
なお、骨格の抽出手法は、上記のように予め抽出した人物領域を対象とする方法に限定されない。例えば、非特許文献1に開示されるように、フレーム画像から抽出した特徴マップに対して、身体パーツの位置をエンコードするConfidence Mapおよび身体パーツ間の連結性をエンコードするPart Affinity Fields(PAFs)を用いた二つの逐次予測プロセスを順次に適用し、フレーム画像から抽出した人物オブジェクト(ユーザ)の身体パーツの位置および連結性をボトムアップ的アプローチにより一回の推論で推定することでスケルトンモデルを構築してもよい。
このとき、異なる部分領域から抽出した身体パーツの連結性を推定対象外とする処理を実装することで、身体パーツの位置および連結性を部分領域ごとに、すなわちユーザごとにオブジェクトのスケルトンモデルを推定できるようになる。
位置推定部104は、ユーザが指定した評価部位を評価部位指定受付部104aで受け付け、指定された評価部位に対応した骨格の位置Pを推定する。
解析区間決定部105は、前記位置推定部104が推定した評価部位の位置Pと所定の基準部位との相対的な位置関係を計算し、この位置関係が所定の開始要件を充足したタイミングを解析区間の始点として登録し、所定の終了要件を充足したタイミングを解析区間の終点として登録する。基準部位は評価部位以外のいずれかの骨格位置に設定することができる。
図4は、ユーザのゴルフスイング映像を対象に解析区間を決定する方法を示した図である。ゴルフスイングの評価では左手の動きが重要となるので左手首関節P7が評価部位に指定され、基準部位として例えば頭部Hが設定される。なお、図3のように頭部を骨格情報として直接抽出できない場合は、鼻骨格P0の位置あるいは両目P14,P15の中心位置等で頭部Hの位置を代表できる。
そして、ゴルフスイングを評価する際は、バックスイングからダウンスイングに切り替わり、その後、フォロースイングに至るまでを解析区間とすることが望ましい。一般的に、右利きユーザのスイングがバックスイングからダウンスイングに切り替わるタイミングでは、左手首関節P7が頭部Hの右側に位置し、フォロースイングの終了タイミングでは、左手首関節P7が頭部Hの左下方に位置することが経験的に認められる。
そこで、本実施形態ではスイングがバックスイングからダウンスイングに切り替わる時刻t1からフォロースイングが終了する時刻t2までが解析区間に決定されるように、左手首関節P7が頭部Hの右側に移動している位置関係を解析区間の開始要件として登録し、その後、左手首関節P7が頭部Hの左下方位置まで移動した位置関係を解析区間の終了要件として規定する。これにより、バックスイングからダウンスイングに切り替わり、その後、フォロースイングに至るまでの映像区間を解析区間とすることができる。
本実施形態によれば、解析区間が評価部位と基準部位との相対的な位置関係に依存する場合に解析区間を正確に決定できるようになる。
なお、解析区間の抽出においては、特に開始タイミングに遅れが生じないようにすることが望ましい。そこで、図5に示したように、評価部位と基準部位との相対的な位置関係に基づいて開始タイミングt1が検知されると、解析区間が当該タイミングt1よりも所定時間αだけ遡るようにしても良い。
このようにすれば、映像解析に重要となる解析区間の開始タイミングの抽出漏れを防ぐことができるようになる。
映像変換部106は、非解析区間のビットレートが解析区間のビットレートよりも相対的に低下するようにカメラ映像のビットレートを低下させる。このとき、映像変換部106は解析区間のビットレートを撮影時のビットレートに維持したまま、非解析区間のビットレートのみを選択的に低下させることができる。あるいは解析区間および非解析区間のビットレートをいずれも低下させ、その際、非解析区間のビットレートが解析区間のビットレートよりも相対的に低くなるようにしても良い。
前記映像変換部106はビットレートの変換にあたり、非解析区間のフレームレートを解析区間のフレームレートよりも低下させることができる。例えば、カメラ映像が30fpsのフレームレートで撮影されていれば、解析区間は30fpsのフレームレートを維持したまま非解析区間のフレームレートのみを、例えば10fpsまで低下させるようにしても良い。
あるいは、解析区間のフレームレートは20fpsまで低下させる一方、非解析区間のフレームレートは10fpsまで低下させるというように、フレームレートの低下率を異ならせるようにしても良い。
さらに、カメラ映像がカラー画像であれば非解析区間のみをモノクロ映像に変換することでビットレートを変換しても下げても良いし、あるいは非解析区間の解像度を解析区間よりも低解像に変換することでビットレートを下げても良い。
本実施形態によれば、高品質映像を用いた解析が望ましい解析区間を正確に決定できるのみならず、高品質映像による分析が要請されない非解析区間のビットレートを、高品質映像による分析が要請される解析区間のビットレートよりも低下させるので、映像分析の精度や確度に影響を与えることなくカメラ映像の転送データ量や記憶容量を削減できるようになる。
図6は、ローカル端末1の第2実施形態の機能ブロック図であり、図2と同一の符号は同一または同等部分を表しているので、その説明は省略する。本実施形態は、位置推定部104が動き種別判別部104bおよび評価部位決定部104cを具備し、評価部位がカメラ映像に基づいて自動的に設定されるようにした点に特徴がある。
動き種別判別部104bは、カメラ映像を予め学習した推定モデルに適用することでユーザの動き種別を判別する。例えば、前記図4,5を参照して説明したゴルフスイングのカメラ映像が入力されるとユーザの動き種別を「ゴルフスイング」と判別する。
評価部位決定部104cは、ユーザの動き種別の判別結果に基づいて、当該動き種別に対する解析区間の決定指標となる評価部位、基準部位ならびに前記解析区間の開始要件および終了要件を、予め登録されている動き種別との対応関係に基づいて決定する。
例えば、ユーザの動き種別が「ゴルフスイング」と判別されると、評価部位が「左手首関節」、基準部位が「頭部」、開始要件が「左手首関節が頭部の右側」、終了要件として「左手首関節が頭部の左下側」に決定される。
本実施形態によれば、カメラ映像に基づいて、解析区間の決定指標となる評価部位、開始要件、終了要件が自動的に決定されるので、ユーザに専門知識や負担を強いることなく、ユーザの動き種別や最適な解析区間を自動的に決定できるようになる。
図7は、本発明の第3実施形態に係る映像変換機能を備えたローカル端末1の主要部の構成を示した機能ブロック図であり、図2と同一の符号は同一または同等部分を表しているので、その説明は省略する。本実施形態は、評価部位の移動の軌跡に基づいて解析区間を決定するために、解析区間決定部105が軌跡登録部105aを具備した点に特徴がある。
図8は、第3実施形態における解析区間の決定方法を説明するための図であり、ここではゴルフスイング中の左手首関節P7の位置を例にして、その軌跡TRに基づいて解析区間を決定する方法を説明する。
ゴルフスイングのように、手や足に規則的、画一的な動きを要求されるシーンでは、各関節が所定の規則通りに動いているか否かが分析指標となり得る。そこで、本実施形態では位置推定部104が推定した左手首関節P7の軌跡TRを軌跡登録部105aに登録し、軌跡上で左手首関節P7の位置が所定の開始要件を充足する開始タイミングから終了要件を充足する終了タイミングまでを解析区間に決定する。
本実施形態では、バックスイングからダウンスイングに切り替わり、その後、フォロースウイングが終了するまでの区間を解析区間に決定すべく、バックスイングからダウンスイングに切り替わる際に左手首関節P7の位置がUターンすることに着目し、左手首関節P7の軌跡TRがUターンしたことが開始要件として登録される。
さらに、ダウンスイングからフォロースイングに切り替わる際に軌跡TRが下向きの円弧に沿って降下し、インパクト後に上昇に転じることに着目し、軌跡TRが下向きの円弧に沿って降下から上昇に転じ、更に所定の時間が経過したことが終了要件として登録される。これにより、バックスイングがダウンスイングに切り替わる時刻t1からフォロースイングに至る時刻t2までを解析区間とすることができる。
本実施形態によれば、解析区間の開始タイミングおよび終了タイミングが評価部位の移動軌跡に依存する場合に解析区間を正確に決定できるようになる。
なお、上記の第1,第3実施形態では一つの評価部位に注目し、対応する基準部位との相対的な位置関係(第1実施形態)、あるいは移動軌跡(第3実施形態)に基づいてユーザの動きを評価するものとして説明した。しかしながら、本発明はこれのみに限定されるものではなく、第1、第3実施形態を組み合わせ、注目した評価部位と基準部位との相対的な位置関係が対応する開始要件を充足し、かつ当該評価部位の移動軌跡が対応する開始要件を充足したときに開始タイミングと判断するようにしても良い。終了タイミングについても同様である。
さらに、上記の第1,第3実施形態では注目する評価部位が一つであったが、本発明はこれのみに限定されるものではなく、複数の評価部位に注目し、全ての評価部位が前記相対位置や移動軌跡に関して所定の開始要件を同時又は所定の順序で充足したときに開始タイミングと判断するようにしても良い。
例えば、第1実施形態のゴルフスイングにおいて、左右の肘関節P3,P6の一方を評価部位、他方を基準部位として定義し、左手首関節P7が頭部Hの右側に位置し、これと同時または前後して、更に左右の肘関節P3,P6の間隔が基準距離を下回ったことを開始要件と定義するようにしても良い。終了タイミングについても同様である。
第3実施形態であれば、左手首関節P7の軌跡TRがUターンしたことが認められ、これと同時または前後して、右膝関節の正面右方向への移動が認められたときに開始タイミングと判断するようにしても良い。終了タイミングについても同様である。
このようにすれば、解析区間が複数の評価部位とその基準部位との相対的な位置関係に依存する場合、解析区間が複数の評価部位の移動軌跡に依存する場合、あるいは解析区間が一の評価部位とその基準部位との相対的な位置関係および当該一の又は他の一の評価部位の移動軌跡の双方に依存する場合でも、解析区間を正確に決定できるようになる。
さらに、上記の各実施形態では開始要件や終了要件が充足されたか否かを同一の一つの評価部位に注目して判断するものとして説明したが、本発明はこれのみに限定されるものではなく、異なる評価部位に注目して判断するようにしても良い。
例えば、第1実施形態のゴルフスイングにおいて、左右の肘関節P3,P6の一方を評価部位、他方を基準部位と定義し、左右の肘関節P3,P6の間隔が基準距離を下回ったことを開始要件とし、その後、左手首関節P7が頭部Hの左下方位置まで移動したことを終了要件としても良い。
第3実施形態であれば、右膝関節の正面右方向への移動が認められたことを開始要件とし、その後、左手首関節P7の軌跡が下向きの円弧に沿って降下から上昇に転じ、更に所定の時間が経過したことを終了要件としても良い。
さらに、第1,第3実施形態を組み合わせ、評価部位と基準部位との相対的な位置関係および評価部位の移動軌跡のうち、一方が所定の開始要件を充足したときに開始タイミングと判断し、他方が所定の終了要件を充足したときに終了タイミングと判断するようにしても良い。
このようにすれば、解析区間の開始タイミングおよび終了タイミングが、複数の異なる評価部位の位置や軌跡に依存する場合も解析区間を正確に決定できるようになる。
さらに、データの変換対象となるカメラ映像はカメラからリアルタイムで出力される動映像に限定されるものではなく、予めカメラで撮影し、一時的に記憶解体等に記憶されていた動画映像であっても良い。
1…ローカル端末,2…映像分析サーバ,101…映像取得部,102…人物領域抽出部,103…骨格情報抽出部,104…位置推定部,104a…評価部位指定受付部,104b…動き種別判別部,104c…評価部位決定部,105…解析区間決定部,105a…軌跡登録部,106…映像変換部

Claims (14)

  1. 人物を被写体とする動画映像のデータ量を変換する映像変換装置において、
    各フレームから人物の骨格情報を抽出する抽出手段と、
    骨格情報に基づいて所定の評価部位の位置を推定する位置推定手段と、
    前記評価部位の位置に基づいて解析区間を決定する決定手段と、
    非解析区間のビットレートを解析区間のビットレートよりも低いビットレートに変換してデータ量を減じる変換手段とを具備したことを特徴とする映像変換装置。
  2. 前記位置推定手段は、骨格情報に基づいて所定の基準部位の位置を更に推定し、
    前記決定手段は、評価部位と基準部位との相対的な位置関係が所定の開始要件を充足する開始タイミングから所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定することを特徴とする請求項1に記載の映像変換装置。
  3. 前記位置推定手段は、骨格情報に基づいて複数の評価部位および対応する複数の基準部位の各位置を推定し、
    前記決定手段は、各評価部位と対応する各基準部位との相対的な位置関係が所定の開始要件を充足する開始タイミングから、各評価部位と対応する各基準部位との相対的な位置関係が所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定することを特徴とする請求項1に記載の映像変換装置。
  4. 前記位置推定手段は、骨格情報に基づいて複数の評価部位および対応する複数の基準部位の各位置を推定し、
    前記決定手段は、一の評価部位と対応する一の基準部位との相対的な位置関係が所定の開始要件を充足する開始タイミングから、他の一の評価部位と対応する他の一の基準部位との相対的な位置関係が所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定することを特徴とする請求項1に記載の映像変換装置。
  5. 前記決定手段は、評価部位の移動軌跡が所定の開始要件を充足する開始タイミングから所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定することを特徴とする請求項1に記載の映像変換装置。
  6. 前記位置推定手段は、骨格情報に基づいて所定の基準部位の位置を更に推定し、
    前記決定手段は、評価部位と基準部位との相対的な位置関係および評価部位の移動軌跡の、一方が所定の開始要件を充足する開始タイミングから他方が所定の終了要件を充足する終了タイミングまでの映像を解析区間に決定することを特徴とする請求項1に記載の映像変換装置。
  7. 前記変換手段は、前記解析区間のビットレートを維持したまま非解析区間のビットレートを低下させることを特徴とする請求項1ないし6のいずれかに記載の映像変換装置。
  8. 前記変換手段は、前記解析区間および非解析区間の各ビットレートを、非解析区間のビットレートが解析区間のビットレートよりも低くなるように、いずれも低下させることを特徴とする請求項1ないし6のいずれかに記載の映像変換装置。
  9. 前記変換手段は、非解析区間のフレームレートを解析区間のフレームレートよりも低いフレームレートに変換することを特徴とする請求項1ないし8のいずれかに記載の映像変換装置。
  10. 評価部位の指定を受け付ける手段を具備し、
    前記位置推定手段は、指定された評価部位の位置を推定することを特徴とする請求項1ないし9のいずれかに記載の映像変換装置。
  11. 前記動画映像に基づいて人物の動きの種別を判定する手段と、
    前記動種別の判定結果に基づいて評価部位を決定する手段とを具備し、
    前記位置推定手段は、決定された評価部位の位置を推定することを特徴とする請求項1ないし10のいずれかに記載の映像変換装置。
  12. 前記決定手段は、前記評価部位の位置に基づいて決定した解析区間よりも所定の時間だけ前のタイミングを解析区間の開始タイミングとみなすことを特徴とする請求項1ないし11のいずれかに記載の映像変換装置。
  13. コンピュータが、人物を被写体とする動画映像のデータ量を変換する映像変換方法において、
    各フレームから人物の骨格情報を抽出し、
    骨格情報に基づいて所定の評価部位の位置を推定し、
    前記評価部位の位置に基づいて解析区間を決定し、
    非解析区間のビットレートを解析区間のビットレートよりも低いビットレートに変換することを特徴とする映像変換方法。
  14. 人物を被写体とする動画映像のデータ量を変換する映像変換プログラムにおいて、
    各フレームから人物の骨格情報を抽出する手順と、
    骨格情報に基づいて所定の評価部位の位置を推定する手順と、
    前記評価部位の位置に基づいて解析区間を決定する手順と、
    非解析区間のビットレートを解析区間のビットレートよりも低いビットレートに変換する手順と、をコンピュータに実行させる映像変換プログラム。
JP2020015316A 2020-01-31 2020-01-31 映像変換方法、装置およびプログラム Active JP7231573B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020015316A JP7231573B2 (ja) 2020-01-31 2020-01-31 映像変換方法、装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020015316A JP7231573B2 (ja) 2020-01-31 2020-01-31 映像変換方法、装置およびプログラム

Publications (3)

Publication Number Publication Date
JP2021124748A true JP2021124748A (ja) 2021-08-30
JP2021124748A5 JP2021124748A5 (ja) 2022-01-19
JP7231573B2 JP7231573B2 (ja) 2023-03-01

Family

ID=77458757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020015316A Active JP7231573B2 (ja) 2020-01-31 2020-01-31 映像変換方法、装置およびプログラム

Country Status (1)

Country Link
JP (1) JP7231573B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023047621A1 (ja) * 2021-09-24 2023-03-30 ソニーグループ株式会社 情報処理システム、情報処理方法およびプログラム
JP7365737B1 (ja) * 2023-04-11 2023-10-20 株式会社歯科専門集患アウトソーシング 歯列改善トレーニング支援装置及び歯列改善トレーニング支援プログラム、並びに、呼吸改善トレーニング支援装置及び呼吸改善トレーニング支援プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013021707A1 (ja) * 2011-08-10 2013-02-14 本田技研工業株式会社 乗員検知装置
JP2014186559A (ja) * 2013-03-22 2014-10-02 Casio Comput Co Ltd 動画像抽出装置、動画像抽出方法及びプログラム
WO2017187641A1 (ja) * 2016-04-28 2017-11-02 富士通株式会社 骨格推定装置、骨格推定方法および骨格推定プログラム
JP2018501677A (ja) * 2014-10-03 2018-01-18 マイクロソフト テクノロジー ライセンシング,エルエルシー シーンに存在するユーザーに基づく特性の適応コーディング
JP2019045967A (ja) * 2017-08-30 2019-03-22 富士通株式会社 姿勢推定装置、方法、及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013021707A1 (ja) * 2011-08-10 2013-02-14 本田技研工業株式会社 乗員検知装置
JP2014186559A (ja) * 2013-03-22 2014-10-02 Casio Comput Co Ltd 動画像抽出装置、動画像抽出方法及びプログラム
JP2018501677A (ja) * 2014-10-03 2018-01-18 マイクロソフト テクノロジー ライセンシング,エルエルシー シーンに存在するユーザーに基づく特性の適応コーディング
WO2017187641A1 (ja) * 2016-04-28 2017-11-02 富士通株式会社 骨格推定装置、骨格推定方法および骨格推定プログラム
JP2019045967A (ja) * 2017-08-30 2019-03-22 富士通株式会社 姿勢推定装置、方法、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
脇田航他: "没入型VR環境における舞踊動作訓練システム", 電気学会論文誌C, vol. 第137巻 第3号, JPN6023005439, 1 March 2017 (2017-03-01), JP, pages 495 - 501, ISSN: 0004990785 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023047621A1 (ja) * 2021-09-24 2023-03-30 ソニーグループ株式会社 情報処理システム、情報処理方法およびプログラム
JP7365737B1 (ja) * 2023-04-11 2023-10-20 株式会社歯科専門集患アウトソーシング 歯列改善トレーニング支援装置及び歯列改善トレーニング支援プログラム、並びに、呼吸改善トレーニング支援装置及び呼吸改善トレーニング支援プログラム

Also Published As

Publication number Publication date
JP7231573B2 (ja) 2023-03-01

Similar Documents

Publication Publication Date Title
US20230233905A1 (en) Methods and systems for generating sports analytics with a mobile device
US10489656B2 (en) Methods and systems for ball game analytics with a mobile device
CN104346816B (zh) 一种深度确定方法、装置及电子设备
KR102514697B1 (ko) 골프 동작 분석 장치 및 방법
KR101399655B1 (ko) 체형별 스윙분석장치 및 이를 이용한 골프레슨 관리 시스템 및 방법
EP3734551A1 (en) Extraction program, extraction method, and information processing device
KR102238085B1 (ko) 동작분석 장치 및 방법
JP2021124748A (ja) 映像変換方法、装置およびプログラム
US20100208945A1 (en) Method and system for selecting the viewing configuration of a rendered figure
KR101133736B1 (ko) 촬영 영상을 이용한 수영 훈련 장치 및 그 제어 방법
KR102594938B1 (ko) 인공신경망을 이용한 스포츠 자세를 비교 및 교정하는 장치 및 방법
KR102356685B1 (ko) 온라인 그룹을 기반으로 하는 홈 트레이닝 제공 시스템 및 그 방법
JP7060549B2 (ja) コーチングアプリケーションの構築装置、方法およびプログラム
CN110929595A (zh) 一种基于人工智能的有球无球训练或娱乐系统及方法
JP7103998B2 (ja) 骨格抽出方法、装置およびプログラム
KR102268954B1 (ko) 골프 공 타격을 감지하는 방법 및 이를 이용한 골프 스윙 모션 분석 장치
KR101703316B1 (ko) 영상을 기반으로 속도를 측정하는 방법 및 장치
KR20160106455A (ko) 영상기기를 활용한 골프 자세 분석 방법
JP7264838B2 (ja) 映像変換方法、装置およびプログラム
US11837255B2 (en) Display method, computer-readable recording medium recording display program, and information processing apparatus
CN115520214A (zh) 高尔夫球杆车的控制方法、装置、电子设备及存储介质
JP7007330B2 (ja) トレーニング評価装置、方法およびプログラム
JP7074727B2 (ja) スポーツ行動認識装置、方法およびプログラム
CN111260678A (zh) 体操辅助学习的方法、装置、存储介质和终端设备
KR101696812B1 (ko) 골프 동영상 제공 서비스를 운영하는 방법과 시스템 및 이 방법을 기록한 컴퓨터로 읽을 수 있는 기록 매체

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230216

R150 Certificate of patent or registration of utility model

Ref document number: 7231573

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150