JP6635848B2 - 3次元動画データ生成装置、3次元動画データ生成プログラム、及びその方法 - Google Patents

3次元動画データ生成装置、3次元動画データ生成プログラム、及びその方法 Download PDF

Info

Publication number
JP6635848B2
JP6635848B2 JP2016071649A JP2016071649A JP6635848B2 JP 6635848 B2 JP6635848 B2 JP 6635848B2 JP 2016071649 A JP2016071649 A JP 2016071649A JP 2016071649 A JP2016071649 A JP 2016071649A JP 6635848 B2 JP6635848 B2 JP 6635848B2
Authority
JP
Japan
Prior art keywords
dimensional
posture
moving image
image data
joint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016071649A
Other languages
English (en)
Other versions
JP2017182615A (ja
Inventor
裕子 石若
裕子 石若
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoftBank Corp
Original Assignee
SoftBank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SoftBank Corp filed Critical SoftBank Corp
Priority to JP2016071649A priority Critical patent/JP6635848B2/ja
Priority to PCT/JP2017/013047 priority patent/WO2017170761A1/ja
Publication of JP2017182615A publication Critical patent/JP2017182615A/ja
Application granted granted Critical
Publication of JP6635848B2 publication Critical patent/JP6635848B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/802D [Two Dimensional] animation, e.g. using sprites

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Studio Devices (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Description

本発明は、3次元動画データ生成装置、3次元動画データ生成プログラム、及びその方法に関する。
人物等の動体の動作を示す3次元動画を示す動画データを生成する種々の方法が知られている。例えば、特許文献1には、それぞれが発光素子を有する複数のマーカを装着した人物を撮像することにより、人物の動作を示す動画データを取得する方法が記載される。しかしながら、マーカを装着した人物を撮像して人物の動作を示す動画データを取得する場合、取得したい動作ができる人物を確保する必要がある上に、撮像したフレームからノイズを除去する等の前処理を施す必要があり、3次元動画生成コストが高くなるおそれがある。
人物等の動作を取得するコストを抑制するために、単眼カメラから取得した人物等の動体の2次元フレームから3次元の位置姿勢を推定することが知られる。例えば、特許文献2には、フレームに所定の処理を施すことによって抽出された対象物についての幾何学的特徴を表す数値を特徴量として用いて、マッチングを行うことが記載される。また、特許文献3及び4には、フレームに含まれる認識対象の特徴量を抽出するパラメータを、遺伝的アルゴリズムとも称される進化的アルゴリズムを使用して最適化することが記載される。また、特許文献5には、姿勢モデルが取り得る姿勢の範囲内で3次元モデルに基づいて生成されたシルエットフレームと、取得したフレームに含まれる人物のシルエットフレームとのマッチングを行って姿勢を示すデータを生成することが記載される。そして、特許文献6には、染色体の遺伝子情報に応じて仮想3次元人物モデルの姿勢を変化させて、仮想人物モデルの姿勢を人物の姿勢に近づけることで、姿勢を検出することが記載される。
国際公開第2004/094943号公報 特開第2010−97341号公報 特開第2009−64162号公報 特開第2010−266983号公報 国際公開第2007/010893号公報 特開第2011−113313号公報
しかしながら、動体の特徴量を抽出して動体の姿勢を推定する場合、特徴量を抽出する部位の数が増加するに従って、特徴量を抽出するための演算処理が増加して演算コストが増大するおそれがある。また、3次元モデルに基づいて生成されたシルエットフレームと、取得したフレームに含まれる人物のシルエットフレームとのマッチングにより姿勢を示すデータを生成するときに、人物のシルエットフレームに対応する複数のフレームモデルが存在する場合がある。例えば、両腕を胸の前で組んでいる人物のシルエットフレームのフレームモデルとして、両腕を胸の前で組むフレームモデル、両腕を背中の後ろで組むフレームモデル、一方の腕を胸の前に配置し且つ他方の腕を背中の後ろに配置するフレームモデルが挙げられる。一連のフレームのそれぞれにおいて多くの姿勢を示すデータが生成されると、3次元モデルの姿勢を含む一連のフレームを含む動画を示す3次元動画データを生成する生成コストが増加するおそれがある。
本発明は、2次元動画に含まれる動体の輪郭から3次元モデルの姿勢を含む一連のフレームを含む動画を示す3次元動画データを生成する生成コストを低減することができる3次元動画データ生成装置を提供することを目的とする。
上記目的を実現するため、本発明に係る3次元動画データ生成装置は、複数の関節を有する動体を撮像した一連のフレームを含む2次元動画データを取得する2次元動画データ取得部と、一連のフレームのそれぞれから、動体の輪郭を抽出する輪郭抽出部と、輪郭に対応した1又は2以上の3次元姿勢データを一連のフレームのそれぞれについて生成する3次元姿勢データ生成部と、生成された3次元姿勢データのそれぞれについて、それぞれの3次元姿勢データに対応する3次元モデルの姿勢が適切であるか否かを判定する姿勢判定部と、一連のフレームのそれぞれに対応付けて、適切であると判定された3次元姿勢データを連続して配置することによって、一連の3次元姿勢データを含む3次元動画データを生成する3次元動画データ生成部と、3次元動画データを出力する出力部とを有することを特徴とする。
また、本発明に係る3次元動画データ生成装置では、姿勢判定部は、1つ又は2つ以上の3次元モデルの姿勢のそれぞれについて、関節で接合された一対の骨の間の角度を推定する関節角推定部と、推定された一対の骨の間の角度が所定の適正範囲内であるか否かを判定する関節角判定部と、検出された一対の骨の間の角度が何れも適正範囲内であると判定されたときに、3次元モデルの姿勢が適切であることを決定する第1決定処理を実行する第1姿勢決定部とを有することが好ましい。
また、本発明に係る3次元動画データ生成装置では、姿勢判定部は、第1決定処理において姿勢が適切であると判定された3次元モデルを時系列順に配列するフレーム配列部と、時系列順に配列された3次元モデルの関節の位置を推定する関節位置推定部と、それぞれの関節について、現在の3次元モデルの関節と、次の時間の3次元モデルの関節との間の位置関係が適切であるか否かを判定する関節位置判定部と、関節の間の位置関係が適切であると判定されたときに、3次元モデルの姿勢が適切であることを決定する第2決定処理を実行する第2姿勢決定部とを更に有することが好ましい。
また、本発明に係る3次元動画データ生成装置では、3次元姿勢データ生成部は、対応するフレームに含まれる動体が撮像された角度から見たときの3次元モデルの輪郭と、対応するフレームに含まれる動体の輪郭との差が所定のしきい値以下になるように、3次元モデルの姿勢を生成することが好ましい。
さらに、本発明に係る3次元動画データ生成方法は、複数の関節を有する動体を撮像した一連のフレームを含む2次元動画データを取得し、一連のフレームのそれぞれから、動体の輪郭を抽出し、輪郭に対応した1又は2以上の3次元姿勢データを一連のフレームのそれぞれについて生成し、生成された3次元姿勢データのそれぞれについて、それぞれの3次元姿勢データに対応する3次元モデルの姿勢が適切であるか否かを判定し、一連のフレームのそれぞれに対応付けて、適切であると判定された3次元姿勢データを連続して配置することによって、一連の3次元姿勢データを含む3次元動画データを生成し、3次元動画データを出力することを含むことを特徴とする。
さらに、本発明に係る3次元動画データ生成プログラムは、複数の関節を有する動体を撮像した一連のフレームを含む2次元動画データを取得し、一連のフレームのそれぞれから、動体の輪郭を抽出し、輪郭に対応した1又は2以上の3次元姿勢データを一連のフレームのそれぞれについて生成し、生成された3次元姿勢データのそれぞれについて、それぞれの3次元姿勢データに対応する3次元モデルの姿勢が適切であるか否かを判定し、一連のフレームのそれぞれに対応付けて、適切であると判定された3次元姿勢データを連続して配置することによって、一連の3次元姿勢データを含む3次元動画データを生成し、3次元動画データを出力することをコンピュータに実行させることを特徴とする。
本発明によれば、2次元動画に含まれる動体の輪郭から3次元モデルの姿勢を含む一連のフレームを含む動画を示す3次元動画データを生成する生成コストを低減することができる3次元動画データ生成装置が提供される。
実施形態に係る3次元動画データ生成装置により実行される3次元動画データ生成処理を概略的に示す図である。 実施形態に係る3次元動画データ生成装置のブロック図である。 3次元動画データ生成装置1による3次元動画データ生成処理のフローチャートである。 (a)は動画に含まれる時刻t1におけるフレームを示す図であり、(b)は動画に含まれる時刻t1よりも遅い時刻t2におけるフレームを示す図であり、(c)は動画に含まれる時刻t2よりも更に遅い時刻t3におけるフレームを示す図である。 (a)は図2に示す3次元姿勢データ生成部が3次元姿勢データを生成するときに使用する3次元モデルの一例を示す図であり、図5(b)は図5(a)に示す3次元モデルの関節を示すテーブルである。 図3に示すS104のより詳細な処理を示すフローチャートである。 図3に示すS104の処理を説明するための第1の図であり、(a)はS101の処理で取得された動画の第1フレームを示し、(b)は第1フレームの次の第2フレームを示し、(c)は第2フレームの次の第3フレームを示し、(d)は第1フレームの動体の姿勢と同一の姿勢である3次元モデルを正面から見たフレームを示し、(e)は第2フレームの動体の姿勢と同一の姿勢である3次元モデルを正面から見たフレームを示し、(f)は第3フレームの動体の姿勢と同一の姿勢である3次元モデルを正面から見たフレームを示す。 S104の処理を説明するための第2の図であり、図6に示すS201〜S203の処理を説明するための図であり、(a)は図7(a)に示す3次元モデルの姿勢を横から見た第1姿勢を含むフレームを示し、(b)は図7(a)に示す3次元モデルの姿勢を横から見た第2姿勢を含むフレームを示し、(c)は図7(a)に示す3次元モデルの姿勢を横から見た第3姿勢を含むフレームを示す。 S104の処理を説明するための第3の図であり、図6に示すS204〜S207の処理を説明するための図である。 S104の処理を説明するための第4の図であり、図6に示すS204〜S207の処理を説明するための図である。 S104の処理を説明するための第5の図であり、図6に示す第1フレーム〜第3フレームから図3に示すS104の処理で適切であると決定された3次元モデルの姿勢を示す図である。 犬の3次元モデルの一例を示す図である。
以下の図面を参照して、本発明に係る3次元動画データ生成装置、3次元動画データ生成プログラム、及びその方法について説明する。但し、本発明の技術的範囲はそれらの実施の形態に限定されず、特許請求の範囲に記載された発明との均等物に及ぶ点に留意されたい。
(実施形態に係る3次元動画データ生成装置の概要)
図1は、実施形態に係る3次元動画データ生成装置により実行される3次元動画データ生成処理を概略的に示す図である。
まず、実施形態に係る3次元動画データ生成装置は、人物等の動体が撮像された一連のフレームを含む動画を示す2次元動画データを取得する(S1)。一例では、実施形態に係る3次元動画データ生成装置は、インタネットを介して2次元動画データを取得する。次いで、実施形態に係る3次元動画データ生成装置は、動画データに対応する動画に含まれる動体を検出し、検出した動体の輪郭を抽出する(S2)。次いで、実施形態に係る3次元動画データ生成装置は、抽出した輪郭に対応する1つ又は2つ以上の3次元モデルの姿勢を示す3次元姿勢データを一連のフレームのそれぞれについて生成する(S3)。次いで、実施形態に係る3次元動画データ生成装置は、一連のフレームのそれぞれについて生成された1つ又は2つ以上の3次元姿勢データに対応する3次元モデルの姿勢のそれぞれが適切であるか否かを判定する(S4)。そして、実施形態に係る3次元動画データ生成装置は、一連のフレームのそれぞれに対応付けて、適切であると判定された3次元姿勢データを連続して配置することによって、一連の3次元姿勢データを含む3次元動画データを生成する(S5)。実施形態に係る3次元動画データ生成装置は、生成した3次元姿勢データに対応する3次元モデルの姿勢が適切であるか否かを判定することで、取得した2次元フレームに含まれる動体の輪郭から生成可能な姿勢の中で、適切な姿勢を選択する。実施形態に係る3次元動画データ生成装置は、フレームに含まれる動体の適切な姿勢を選択して、3次元動画データを生成することで、動体の動作を示す3次元動画データを生成する生成コストを抑制する。
(実施形態に係る3次元動画データ生成装置の構成及び機能)
図2は、実施形態に係る3次元動画データ生成装置のブロック図である。
3次元動画データ生成装置1は、通信部10と、記憶部11と、入力部12と、出力部13と、処理部20とを有する。
通信部10は、HTTP(Hypertext Transfer Protocol)のプロトコルに従ってインタネットを介して不図示のサーバ等と通信を行う。そして、通信部10は、サーバ等から受信したデータを処理部20に供給する。また、通信部10は、処理部20から供給されたデータをサーバ等に送信する。
記憶部11は、例えば、半導体装置、磁気テープ装置、磁気ディスク装置、又は光ディスク装置のうちの少なくとも一つを備える。記憶部11は、処理部20での処理に用いられるオペレーティングシステムプログラム、ドライバプログラム、アプリケーションプログラム、データ等を記憶する。例えば、記憶部11は、アプリケーションプログラムとして、2次元動画データから3次元動画データを生成する3次元動画データ生成処理を、処理部20に実行させるための3次元動画データ生成プログラム等を記憶する。3次元動画データ生成プログラムは、例えばCD−ROM、DVD−ROM等のコンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラム等を用いて記憶部11にインストールされてもよい。
また、記憶部11は、データとして、入力処理で使用するデータ等を記憶する。さらに、記憶部11は、入力処理等の処理で一時的に使用されるデータを一時的に記憶してもよい。
入力部12は、データの入力が可能であればどのようなデバイスでもよく、例えば、タッチパネル、キーボタン等である。操作者は、入力部12を用いて、文字、数字、記号等を入力することができる。入力部12は、操作者により操作されると、その操作に対応する信号を生成する。そして、生成された信号は、操作者の指示として、処理部20に供給される。
出力部13は、映像やフレーム等の表示が可能であればどのようなデバイスでもよく、例えば、液晶ディスプレイ又は有機EL(Electro−Luminescence)ディスプレイ等である。出力部13は、処理部20から供給された映像データに応じた映像や、動画データに応じたフレーム等を表示する。また、出力部13は、紙などの表示媒体に、映像、フレーム又は文字等を印刷する出力装置であってもよい。
処理部20は、一又は複数個のプロセッサ及びその周辺回路を有する。処理部20は、3次元動画データ生成装置1の全体的な動作を統括的に制御するものであり、例えば、CPUである。処理部20は、記憶部11に記憶されているプログラム(ドライバプログラム、オペレーティングシステムプログラム、アプリケーションプログラム等)に基づいて処理を実行する。また、処理部20は、複数のプログラム(アプリケーションプログラム等)を並列に実行できる。
処理部20は、2次元動画データ取得部21と、輪郭抽出部22と、3次元姿勢データ生成部23と、姿勢判定部24と、3次元動画データ生成部25と、3次元動画データ出力部26とを有する。姿勢判定部24は、関節角推定部31と、関節角判定部32と、第1姿勢決定部33と、フレーム配列部34と、関節位置推定部35と、関節位置判定部36と、第2姿勢決定部37とを有する。これらの各部は、処理部20が備えるプロセッサで実行されるプログラムにより実現される機能モジュールである。あるいは、これらの各部は、ファームウェアとして3次元動画データ生成装置1に実装されてもよい。
(実施形態に係る3次元動画データ生成装置の動作)
図3は、3次元動画データ生成装置1による3次元動画データ生成処理のフローチャートである。図3に示す3次元動画データ生成処理は、予め記憶部11に記憶されているプログラムに基づいて、主に処理部20により、3次元動画データ生成装置1の各要素と協働して実行される。
まず、2次元動画データ取得部21は、人物等の動体が撮像された一連のフレームを含む動画を示す2次元動画データを取得する(S101)。3次元動画データ生成装置1は、既知の検索エンジンを使用してインタネットを介して所望の条件に対応する2次元動画データを取得する。一例では、3次元動画データ生成装置1は、人物を取得する対象の動体としてもよい。3次元動画データ生成装置1は、人間の大人を対象の動体として取得してもよく、人間の子供を対象の動体として取得してもよい。
次いで、輪郭抽出部22は、S101の処理で取得された2次元動画データに対応する2次元動画に撮像された対象の動体を検出し、検出された一連のフレームのそれぞれに含まれる動体の輪郭を抽出する(S102)。輪郭抽出部22は、抽出した動画の輪郭を、対応するフレームの時刻及び動体の向き等の情報と共に記憶部11に記憶する。輪郭抽出部22は、HOG(Histograms of Oriented Gradients)等の既知の人物検出アルゴリズムを使用して、2次元動画データに対応する2次元動画に含まれる一連のフレームの何れかに含まれる対象の動体を検出する。輪郭抽出部22は、一連のフレームの何れかに含まれる対象の動体を検出すると、検出したフレームの前後のフレームに含まれる動体の位置及び輪郭を予測することにより、動体が検出できなかったフレームに含まれる動体を検出する。
図4(a)は動画に含まれる時刻t1におけるフレームを示す図であり、図4(b)は動画に含まれる時刻t1よりも遅い時刻t2におけるフレームを示す図であり、図4(c)は動画に含まれる時刻t2よりも更に遅い時刻t3におけるフレームを示す図である。
フレーム401は、顔を横方向に向けて腕を横方向に広げたバレリーナである動体411を含む。フレーム402は、顔を前方に向けて腕を上方向に掲げ且つ片足を振り上げたバレリーナである動体412を含む。フレーム401は、顔を後方に向けて腕を横方向に広げたバレリーナである動体411を含む。輪郭抽出部22は、動体411を検出できず且つ動体412を検出できたとき、動体412を検出した時刻t2から動体412を含むフレーム401に対応する時刻t1まで、時系列を逆方向に動体の位置及び形状を順次予測して動体411を検出する。また、輪郭抽出部22は、動体412を検出でき且つ動体411を検出できたが、動体413が後方に向いていることを検出できなかったとき、動体412から動体の位置及び形状を時系列方向に順次予測して動体413が後ろに向いていることを検出する。
輪郭抽出部22は、2次元動画に含まれる一連のフレームに撮像された動体の位置及び姿勢を、検出された動画から時系列方向及び時系列の反対方向に順次予測することで、一連のフレームに含まれる対象の動体の動作をフレーム毎に検出できる。また、対象の動体の位置及び姿勢をフレーム毎に検出することで、対象の動体以外の動画に撮像された動体を対象の動体と分離できる。例えば、フレーム401とフレーム402との間の複数のフレームに対象の動体411及び412に対応するバレリーナ以外のバレリーナ等の他の動体が撮像されていた場合でも、対象の動体の位置及び姿勢を順次予測することで対象の動体は他の動体と分離できる。
次いで、3次元姿勢データ生成部23は、S102の処理で抽出された動体の輪郭に対応する1つ又は2つ以上の3次元モデルの姿勢を示す3次元姿勢データを一連のフレームのそれぞれについて生成する(S103)。3次元姿勢データは、対応するフレームの時刻及び動体の向き等の情報と共に記憶部11に記憶される。
図5(a)は3次元姿勢データ生成部23が3次元姿勢データを生成するときに使用する3次元モデルの一例を示す図であり、図5(b)は図5(a)に示す3次元モデルの関節を示すテーブルである。
3次元モデル501は、人物の3次元モデルであり、骨格及び皮膚形状を有する。3次元モデル501にはテーブル502に示される24個の関節を有し、関節の動作に応じて皮膚形状が変形する。3次元モデル501は、人物の外観を有する形状にリグ(Rig)を組み込むことにより形成される。3次元モデル501を示す3次元モデルデータは、一例ではPeter Borosanらによる論文「RigMesh: Automatic Rigging for Part-Based Shape Modeling and Deformation」等で説明されるコンピュータプログラム「Rigmesh」を使用して生成されてもよい。また、3次元モデル501を示す3次元モデルデータは、テンプレートをモーフィング(morphing)することで、生成されてもよい。例えば、細身の8頭身のテンプレートのパーツを膨らませること又は細くすることにより、二次元データから抽出した輪郭に一致するように形状を変更して生成された複数の候補モデルの中で、抽出された輪郭との間の差分が最も少ないものを3次元モデルに採用してもよい。この場合、モーションデータ推定の際のパラメータが一つ増える。また、3次元モデル501を示す3次元モデルデータは、予め記憶した「Rigmesh」で生成したデータとテンプレートのデータの差分を示す差分データに基づいて生成されてもよい。この場合、身体の形状は「Rigmesh」のデータに基づいて評価され、関節の角度はテンプレートのデータに基づいて評価される。
3次元モデル501は、腰関節(HipCenter)511を有する。3次元モデル501は、脊髄関節(Spince)521と、肩中央関節(ShoulderCenter)522と、首関節(Neck)523と、眼関節(Eye)524と、頭関節(Head)525と、左眼関節(EyeLeft)526と、右眼関節(EyeRight)527とを更に有する。3次元モデル501は、左肩関節(ShoulderLeft)531と、左肘関節(ElbowLeft)532と、左手首関節(WristLeft)533とを更に有する。3次元モデル501は、右肩関節(ShoulderRight)541と、右肘関節(ElbowRight)542と、右手首関節(WristRight)543とを更に有する。3次元モデル501は、左腰関節(HipLeft)551と、左膝関節(KneeLeft)552と、左足首関節(AnkleLeft)553と、左踵関節(HeelLeft)554と、左つま先関節(ToeLeft)555とを更に有する。3次元モデル501は、右腰関節(HipRight)561と、右膝関節(KneeRight)562と、右足首関節(AnkleRight)563と、右踵関節(HeelRight)564と、右つま先関節(ToeRight)565とを更に有する。
3次元姿勢データ生成部23は、3次元モデル501の複数の関節のそれぞれの位置及び3次元モデル501の関節で接合された一対の骨の間の角度を調整することで、S102の処理で抽出された動体の輪郭に対応する1つ又は2つ以上の3次元姿勢データを生成する。3次元姿勢データ生成部23は、遺伝的アルゴリズム(Genetic Algorithm、GA)又はディープランニング等の機械学習等の既知の演算アルゴリズムを使用して、S102の処理で抽出された動体の輪郭に対応する1つ又は2つ以上の3次元姿勢データを生成する。例えば、3次元姿勢データ生成部23は、対応するフレームに含まれる動体が撮像された角度から見たときの3次元モデルの輪郭と、対応するフレームに含まれる動体の輪郭との差が所定のしきい値以下になるように、3次元姿勢データを生成する。一例では、3次元姿勢データ生成部23は、3次元モデルの輪郭の面積と、対応するフレームに含まれる動体の輪郭の面積との差が所定のしきい値以下であるか否かを判定する。
次いで、姿勢判定部24は、S103の処理で生成された1つ又は2つ以上の3次元姿勢データに対応する3次元モデルの姿勢のそれぞれが適切であるか否かを判定する(S104)。
次いで、3次元動画データ生成部25は、S104の処理で姿勢が一連のフレームのそれぞれに対応付けて、適切であると判定された3次元姿勢データを連続して配置することによって、一連の3次元姿勢データを含む3次元動画データを生成する(S105)。S104の処理において、一連のフレームのそれぞれに含まれる動体の輪郭に対して、複数の姿勢が適切であると判断されることがある。すなわち、一連のフレームのそれぞれに複数の3次元モデルの姿勢が関連付けられる可能性がある。一例では、3次元動画データ生成部25は、肘の関節の角度の動作が最小になるように、遺伝的アルゴリズム等又はディープランニング等の機械学習等の既知の演算アルゴリズムを使用して、一連のフレームを含む3次元動画を示す3次元動画を示す動画データを生成してもよい。また、3次元動画データ生成部25は、動画データを生成するときに、アルゴリズムに処理された最適解である単一の動画データだけではなく、所定の条件を満たす複数の動画データを生成してもよい。また、3次元動画データ生成部25は、学習アルゴリズムを使用して動画データを生成するときに、報酬(reward)の条件を変更することで動きが異なる種々の動画データを生成することができる。例えば、動きの激しいモーションデータを作成したいときは、人間の動きがありえる範囲で、動きが大きいものを「優秀」とすることで動きの激しい動作を含む3次元動画データを生成することができる。
そして、3次元動画データ出力部26は、S105の処理で生成された3次元動画データを出力する(S106)。
図6は、S104のより詳細な処理を示すフローチャートである。
まず、関節角推定部31は、S103の処理で生成された3次元モデルの姿勢のそれぞれについて、関節で接合された一対の骨の間の角度を推定する(S201)。次いで、関節角判定部32は、推定された一対の骨の間の角度が所定の適正範囲内であるか否かを判定する(S202)。次いで、第1姿勢決定部33は、検出された一対の骨の間の角度が何れも適正範囲内であると判定されたときに、3次元モデルの姿勢が適切であることを決定する第1決定処理を実行する(S203)。
次いで、フレーム配列部34は、第1決定処理において、姿勢が適切であると決定された3次元モデルを時系列順に配列する(S204)。次いで、関節位置推定部35は、S204の処理で時系列順に配列された3次元モデルの関節の位置を推定する(S205)。次いで、関節位置判定部36は、それぞれの関節について、現在の3次元モデルの関節と、次の時間の3次元モデルの関節との間の位置関係が適切であるか否かを判定する(S206)。一例では、関節位置判定部36は、現在の関節の位置から次の時間の関節の位置まで関節が移動する移動距離及びフレーム間の時間から演算した関節の移動速度が所定の基準速度範囲内にあるときに、現在の関節と次の時間の関節の位置関係が適切であると判定する。一方、関節位置判定部36は、関節の移動速度が所定の基準速度範囲内の速度よりも速いとき、及び関節の移動速度が所定の基準速度範囲内の速度よりも遅いときに現在の関節と次の時間の関節の位置関係が適切でないと判定する。そして、第2姿勢決定部37は、S206の処理で、関節の間の位置関係が適切であると判定されたときに、3次元モデルの姿勢が適切であることを決定する第2決定処理を実行する(S207)。
図7はS104の処理を説明するための第1の図であり、図7(a)はS101の処理で取得された動画の第1フレームを示し、図7(b)は第1フレームの次の第2フレームを示し、図7(c)は第2フレームの次の第3フレームを示す。図7(a)〜7(c)において、動体は正面から撮像される。図7(d)は第1フレームの動体の姿勢と同一の姿勢である3次元モデルを正面から見たフレームを示し、図7(e)は第2フレームの動体の姿勢と同一の姿勢である3次元モデルを正面から見たフレームを示す。図7(f)は、第3フレームの動体の姿勢と同一の姿勢である3次元モデルを正面から見たフレームを示す。図7(d)〜7(f)に示すフレームを示すデータはS103の処理で生成される。
図8はS104の処理を説明するための第2の図であり、S201〜S203の処理を説明するための図である。図8(a)は、図7(a)に示す3次元モデルの姿勢を横から見た第1姿勢を含むフレームを示す。図8(b)は、図7(a)に示す3次元モデルの姿勢を横から見た第2姿勢を含むフレームを示す。図8(c)は、図7(a)に示す3次元モデルの姿勢を横から見た第3姿を含むフレーム勢を示す。
S101〜S103の処理では、2次元動画に含まれる2次元のフレームから3次元姿勢データを生成するため、撮像された方向から見た姿勢が同一である複数の3次元姿勢データが生成されることがある。例えば、図7(a)及び7(d)に示す第1フレームでは、図8(a)〜8(c)に示す3つの3次元姿勢データが生成される。S101〜S103の処理では、関節で接合された一対の骨の間の角度が、人体の関節の可動範囲から外れた角度であるときに3次元モデルの姿勢が適切でないと判定する。
図8(b)では、3次元モデルの右腕が略直線的に肩と平行方向に後方に伸びているにもかかわらず、右手の手首の関節に接合された一対の骨の間の角度は、右手の手のひらが外側に向いて且つ右手の指先が頭部方向に向く角度となっている。人間の手首の関節は、図8(b)に示される姿勢をとることができないので、S201〜S203の処理において、図8(b)に示される姿勢は、適切でないと判定される。
図8(c)では、3次元モデルの右肩と右肘との間の骨は右肩から左肩方向に略平行に伸びており、3次元モデルの右肩と右肘との間の骨と右肘と右手首との間の骨との間の角度は60度程度であり、右肘と右手首との間の骨は上方後ろ方向に延伸する。しかしながら、右手の手首の関節に接合された一対の骨の間の角度は、右手の手のひらが外側に向いている。人間の手首の関節は、図8(c)に示される姿勢をとることができないので、S201〜S203の処理において、図8(c)に示される姿勢は、適切でないと判定される。
図9はS104の処理を説明するための第3の図であり、S204〜S207の処理を説明するための図である。図9において、フレーム901は、図7(a)及び7(d)に示す第1フレームの姿勢を横からみた3次元モデルの姿勢を示す。フレーム911は、図7(b)及び7(e)に示す第2フレームの姿勢を横からみた3次元モデルの第1姿勢を示す。フレーム912は、図7(b)及び7(e)に示す第2フレームの姿勢を横からみた3次元モデルの第2姿勢を示す。フレーム913は、図7(b)及び7(e)に示す第2フレームの姿勢を横からみた3次元モデルの第3姿勢を示す。
S204〜S207の処理では、現在のフレームと次の時間のフレームの間の3次元モデルの関節の移動速度を演算し、演算された関節の移動速度が基準速度の範囲外であるときに、次の時間のフレームの3次元モデルの姿勢が適切でないと判定する。フレーム901からフレーム911への移動では、右肘及び左肘等の3次元モデルの関節の第1フレームから第2フレームへの移動速度は、基準速度範囲内であると判定され、フレーム911に示される姿勢は適切であると判定される。フレーム901からフレーム912への移動では、3次元モデルの右肘の関節の第1フレームから第2フレームへの移動速度は、遅いため基準速度範囲外であると判定され、フレーム912に示される姿勢は適切でないと判定される。フレーム901からフレーム913への移動では、右肘及び左肘等の3次元モデルの関節の第1フレームから第2フレームへの移動速度は、基準速度範囲内であると判定され、フレーム913に示される姿勢は適切であると判定される。
図10はS104の処理を説明するための第4の図であり、S204〜S207の処理を説明するための図である。図10において、フレーム1011及び1012は、図9の処理で姿勢が適切であると判定された3次元モデルの姿勢を示す。フレーム1021は、図7(c)及び7(f)に示す第3フレームの姿勢を横からみた3次元モデルの第1姿勢を示す。フレーム1022は、図7(c)及び7(f)に示す第3フレームの姿勢を横からみた3次元モデルの第2姿勢を示す。フレーム1023は、図7(c)及び7(f)に示す第3フレームの姿勢を横からみた3次元モデルの第3姿勢を示す。
フレーム1011からフレーム1021〜1023のそれぞれへの移動では、右肘及び左肘等の3次元モデルの関節の第2フレームから第3フレームへの移動速度は、基準速度範囲内であると判定される。3次元モデルの関節の第2フレームから第3フレームへの移動速度は、基準速度範囲内であると判定されるので、フレーム1021〜1023のそれぞれに示される姿勢は適切であると判定される。
フレーム1012からフレーム1021〜1023のそれぞれへの移動では、右肘及び左肘等の3次元モデルの関節の第2フレームから第3フレームへの移動速度は、基準速度範囲内であると判定される。3次元モデルの関節の第2フレームから第3フレームへの移動速度は、基準速度範囲内であると判定されるので、フレーム1021〜1023のそれぞれに示される姿勢は適切であると判定される。
図11はS104の処理を説明するための第5の図であり、図7に示す第1フレーム〜第3フレームからS104の処理で適切であると決定された3次元モデルの姿勢を示す図である。
第1フレームはフレーム1101に示す姿勢が適切であるとは判定され、第2フレームはフレーム1111及び1112に示す姿勢が適切であるとは判定され、第3フレームはフレーム1121〜1123に示す姿勢が適切であるとは判定される。
S104に続くS105の処理では、6種類(=1×2×3)の組み合わせについて、何れの組み合わせが人間の動作として自然であるかが判定され、3次元動画を示す3次元動画データが生成される。一例では、第1フレームではフレーム1101に示す姿勢が選択され、第2フレームではフレーム1111に示す姿勢が選択され、第3フレームではフレーム1121に示す姿勢が選択される。なお、S105の処理の処理では、単一の3次元動画データのみを生成するのではなく、所定の条件を満たす場合、複数の3次元動画データが作成されてもよい。例えば、フレーム1101、1111及び1121を組み合わせた3次元動画データの他に、フレーム1101、1112及び1121に示す姿勢を組み合わせた3次元動画データが生成されてもよい。
(実施形態に係る3次元動画データ生成装置の作用効果)
3次元動画データ生成装置1は、2次元動画のフレームに含まれる動体の輪郭から生成した3次元モデルの姿勢から適切な姿勢を選択することで、フレームに含まれる動体の姿勢の候補の数を低減することで、3次元動画データを生成する生成コストを抑制する。
また、3次元動画データ生成装置1は、インタネットを介して所望の条件に対応する2次元動画データを取得するので、インタネット上で取得可能な既存の2次元動画から3次元動画データを生成することができる。3次元動画データ生成装置1は、インタネット上で取得可能な既存の2次元動画を利用して3次元動画データを生成するのでインタネット上で取得可能なリソースを有効活用することができる。
また、3次元動画データ生成装置1は、S105の処理において最適解だけではなく、所定の条件を満たす複数の動画データを生成することができるので、生成された複数の動画データに対応する動画に含まれる動体の動きを種々の処理に利用できる。例えば、3次元動画データ生成装置1は、S105の処理で生成した動画データに対応する動画に含まれる人間の肘及び膝等のパーツの動きをパーツごとに記憶、管理してもよい。そして、3次元動画データ生成装置1は、記憶、管理するパーツの動きを組み合わせた動きをする人間を含む画像を示す新たな3次元動画データを自動生成してもよい。3次元動画データ生成装置1は、様々なパターンの動作データを自動で生成できるため、時間及びコスト削減が可能となる。
また、3次元動画データ生成装置1は、記憶、管理するパーツの動きを組み合わせて自動生成した新たな3次元動画データをS105のアルゴリズムにフィードバックすることで、S105のアルゴリズムの学習機能を自動的に向上させることができる。3次元動画データ生成装置1は、自動生成した新たな3次元動画データを使用してS105のアルゴリズムの学習機能を自動的に向上させることで、S105の処理の処理精度及び処理速度を向上させることができる。
3次元動画データ生成装置1は、関節で接合された一対の骨の間の角度が何れも適正範囲内であると判定されたときに、3次元モデルの姿勢が適切であることを決定することで、動体がとることができない姿勢を3次元モデルの姿勢の候補から除外できる。
また、3次元動画データ生成装置1は、現在のフレームの関節と次の時間のフレームの関節の間の位置関係が適切であるか否かを判定することで、不自然な動作を示す姿勢を3次元モデルの姿勢の候補から除外できる。
(実施形態に係る3次元動画データ生成装置の変形例)
3次元動画データ生成装置1は、図5に示す人物の3次元モデルを使用して3次元動画データを生成したが、実施形態に係る3次元動画データ生成装置は、人物以外の複数の関節を有する動体の3次元モデルを使用して3次元動画データを生成してもよい。例えば、実施形態に係る3次元動画データ生成装置は、犬、猫及びハムスターの3次元モデルを使用して3次元動画データを生成してもよい。
図12は、犬の3次元モデルの一例を示す図である。
3次元モデル1301は、骨格及び皮膚形状を有し、関節の動作に応じて皮膚形状が変形する。3次元モデル1301は、コンピュータプログラム「Rigmesh」を使用して、犬の外観を有する形状にリグ(Rig)を組み込むことにより形成される。また、3次元モデル1301を示す3次元モデルデータは、3次元モデル501を示す3次元モデルデータと同様に、テンプレートをモーフィングすることで、生成されてもよい。例えば、ダックスフンドの3次元モデルは、犬を示すテンプレートの足を短くして胴を長くすることで自動生成される。また、3次元モデル501を示す3次元モデルデータは、3次元モデル501を示す3次元モデルデータと同様に、予め記憶した「Rigmesh」で生成したデータとテンプレートのデータの差分を示す差分データに基づいて生成されてもよい。
1 3次元動画データ生成装置
10 通信部
11 記憶部
12 入力部
13 出力部
20 処理部
21 2次元動画データ取得部
22 輪郭抽出部
23 3次元姿勢データ生成部
24 姿勢判定部
25 3次元動画データ生成部
26 3次元動画データ出力部
31 関節角推定部
32 関節角判定部
33 第1姿勢決定部
34 フレーム配列部
35 関節位置推定部
36 関節位置判定部
37 第2姿勢決定部

Claims (6)

  1. 複数の関節を有する動体を撮像した一連のフレームを含む2次元動画データを取得する2次元動画データ取得部と、
    前記一連のフレームのそれぞれから、前記動体の輪郭を抽出する輪郭抽出部と、
    前記輪郭に対応した1又は2以上の3次元姿勢データを前記一連のフレームのそれぞれについて生成する3次元姿勢データ生成部と、
    生成された3次元姿勢データのそれぞれについて、前記関節で接合された一対の骨の間の角度に基づいてそれぞれの3次元姿勢データに対応する3次元モデルの姿勢が適切であるか否かを判定する姿勢判定部と、
    前記一連のフレームのそれぞれに対応付けて、適切であると判定された3次元姿勢データを連続して配置することによって、一連の3次元姿勢データを含む3次元動画データを生成する3次元動画データ生成部と、
    前記3次元動画データを出力する出力部と、
    を有することを特徴とする3次元動画データ生成装置。
  2. 前記姿勢判定部は、
    前記1つ又は2つ以上の3次元モデルの姿勢のそれぞれについて、前記関節で接合された一対の骨の間の角度を推定する関節角推定部と、
    推定された前記一対の骨の間の角度が所定の適正範囲内であるか否かを判定する関節角判定部と、
    検出された前記一対の骨の間の角度が何れも前記適正範囲内であると判定されたときに、前記3次元モデルの姿勢が適切であることを決定する第1決定処理を実行する第1姿勢決定部と、
    を有する、請求項1に記載の3次元動画データ生成装置。
  3. 前記姿勢判定部は、
    前記第1決定処理において姿勢が適切であると判定された3次元モデルを時系列順に配列するフレーム配列部と、
    時系列順に配列された3次元モデルの関節の位置を推定する関節位置推定部と、
    それぞれの関節について、現在の3次元モデルの関節と、次の時間の3次元モデルの関節との間の位置関係が適切であるか否かを判定する関節位置判定部と、
    前記関節の間の位置関係が適切であると判定されたときに、前記3次元モデルの姿勢が適切であることを決定する第2決定処理を実行する第2姿勢決定部と、
    を更に有する、請求項2に記載の3次元動画データ生成装置。
  4. 前記3次元姿勢データ生成部は、対応するフレームに含まれる前記動体が撮像された角度から見たときの前記3次元モデルの輪郭と、対応するフレームに含まれる前記動体の輪郭との差が所定のしきい値以下になるように、前記3次元モデルの姿勢を生成する、請求項1〜3の何れか一項に記載の3次元動画データ生成装置。
  5. 複数の関節を有する動体を撮像した一連のフレームを含む2次元動画データを取得し、
    前記一連のフレームのそれぞれから、前記動体の輪郭を抽出し、
    前記輪郭に対応した1又は2以上の3次元姿勢データを前記一連のフレームのそれぞれについて生成し、
    生成された3次元姿勢データのそれぞれについて、前記関節で接合された一対の骨の間の角度に基づいてそれぞれの3次元姿勢データに対応する3次元モデルの姿勢が適切であるか否かを判定し、
    前記一連のフレームのそれぞれに対応付けて、適切であると判定された3次元姿勢データを連続して配置することによって、一連の3次元姿勢データを含む3次元動画データを生成し、
    前記3次元動画データを出力する、
    ことを含むことを特徴とする3次元動画データ生成方法。
  6. 複数の関節を有する動体を撮像した一連のフレームを含む2次元動画データを取得し、
    前記一連のフレームのそれぞれから、前記動体の輪郭を抽出し、
    前記輪郭に対応した1又は2以上の3次元姿勢データを前記一連のフレームのそれぞれについて生成し、
    生成された3次元姿勢データのそれぞれについて、前記関節で接合された一対の骨の間の角度に基づいてそれぞれの3次元姿勢データに対応する3次元モデルの姿勢が適切であるか否かを判定し、
    前記一連のフレームのそれぞれに対応付けて、適切であると判定された3次元姿勢データを連続して配置することによって、一連の3次元姿勢データを含む3次元動画データを生成し、
    前記3次元動画データを出力する、
    ことをコンピュータに実行させること特徴とする3次元動画データ生成プログラム。
JP2016071649A 2016-03-31 2016-03-31 3次元動画データ生成装置、3次元動画データ生成プログラム、及びその方法 Active JP6635848B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016071649A JP6635848B2 (ja) 2016-03-31 2016-03-31 3次元動画データ生成装置、3次元動画データ生成プログラム、及びその方法
PCT/JP2017/013047 WO2017170761A1 (ja) 2016-03-31 2017-03-29 3次元動画データ生成装置、3次元動画データ生成プログラム、及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016071649A JP6635848B2 (ja) 2016-03-31 2016-03-31 3次元動画データ生成装置、3次元動画データ生成プログラム、及びその方法

Publications (2)

Publication Number Publication Date
JP2017182615A JP2017182615A (ja) 2017-10-05
JP6635848B2 true JP6635848B2 (ja) 2020-01-29

Family

ID=59964666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016071649A Active JP6635848B2 (ja) 2016-03-31 2016-03-31 3次元動画データ生成装置、3次元動画データ生成プログラム、及びその方法

Country Status (2)

Country Link
JP (1) JP6635848B2 (ja)
WO (1) WO2017170761A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111447504B (zh) 2020-03-27 2022-05-03 北京字节跳动网络技术有限公司 三维视频的处理方法、装置、可读存储介质和电子设备
JP7405010B2 (ja) 2020-06-16 2023-12-26 コニカミノルタ株式会社 診断支援システム、診断支援装置及びプログラム
JP7468684B2 (ja) 2020-10-05 2024-04-16 株式会社島津製作所 姿勢検出装置、姿勢検出方法および寝相判定方法
CN117978937B (zh) * 2024-03-28 2024-06-25 之江实验室 一种视频生成的方法、装置、存储介质及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5820366B2 (ja) * 2010-10-08 2015-11-24 パナソニック株式会社 姿勢推定装置及び姿勢推定方法
JP5795250B2 (ja) * 2011-12-08 2015-10-14 Kddi株式会社 被写体姿勢推定装置および映像描画装置

Also Published As

Publication number Publication date
JP2017182615A (ja) 2017-10-05
WO2017170761A1 (ja) 2017-10-05

Similar Documents

Publication Publication Date Title
JP5211069B2 (ja) ラベル付けを用いた人体姿勢の推定および追跡
JP5931215B2 (ja) 姿勢を推定する方法及び装置
US9330470B2 (en) Method and system for modeling subjects from a depth map
US9058663B2 (en) Modeling human-human interactions for monocular 3D pose estimation
KR101902702B1 (ko) 치축 추정 프로그램, 치축 추정 장치 및 그 방법, 및 치형 데이터 생성 프로그램, 치형 데이터 생성 장치 및 그 방법
JP6635848B2 (ja) 3次元動画データ生成装置、3次元動画データ生成プログラム、及びその方法
Chaudhari et al. Yog-guru: Real-time yoga pose correction system using deep learning methods
Hu et al. 3D Pose tracking of walker users' lower limb with a structured-light camera on a moving platform
JP7367764B2 (ja) 骨格認識方法、骨格認識プログラムおよび情報処理装置
CN102609683A (zh) 一种基于单目视频的人体关节自动标注方法
JP2016099982A (ja) 行動認識装置、行動学習装置、方法、及びプログラム
JP7335370B2 (ja) 3次元姿勢推定データを生成するためのコンピュータ実装方法、データ処理装置およびコンピュータプログラム
JPWO2018087933A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2020135747A (ja) 行動分析装置および行動分析方法
JP2010113530A (ja) 画像認識装置及びプログラム
JP7171745B2 (ja) 推定装置、学習装置、推定方法、学習方法及びプログラム
CN110910426A (zh) 动作过程和动作趋势识别方法、存储介质和电子装置
JP2002218449A (ja) 移動物体追跡装置
JP2018180894A (ja) 情報処理装置、情報処理方法及びプログラム
US9460364B2 (en) Method of extracting ridge data and apparatus and method for tracking joint motion of object
JP6929043B2 (ja) 画像処理装置、画像処理方法
JP2019197278A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JP7334337B2 (ja) モーション決定装置、学習装置、モーション決定方法、学習方法及びプログラム
WO2022208859A1 (ja) 技認識方法、技認識装置および体操採点支援システム
JP7439832B2 (ja) 3次元姿勢推定方法、プログラム、記録媒体および3次元姿勢推定装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20170418

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180622

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191217

R150 Certificate of patent or registration of utility model

Ref document number: 6635848

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250