JP2024103791A - 情報処理装置、情報処理方法及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法及び情報処理プログラム Download PDF

Info

Publication number
JP2024103791A
JP2024103791A JP2024092499A JP2024092499A JP2024103791A JP 2024103791 A JP2024103791 A JP 2024103791A JP 2024092499 A JP2024092499 A JP 2024092499A JP 2024092499 A JP2024092499 A JP 2024092499A JP 2024103791 A JP2024103791 A JP 2024103791A
Authority
JP
Japan
Prior art keywords
information processing
skeletal
processing device
joint
bone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2024092499A
Other languages
English (en)
Inventor
大資 田原
Daishi Tahara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Group Corp filed Critical Sony Group Corp
Publication of JP2024103791A publication Critical patent/JP2024103791A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/10Constructive solid geometry [CSG] using solid primitives, e.g. cylinders, cubes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/015Input arrangements based on nervous system activity detection, e.g. brain waves [EEG] detection, electromyograms [EMG] detection, electrodermal response detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/251Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/292Multi-camera tracking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/75Determining position or orientation of objects or cameras using feature-based methods involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30221Sports video; Sports image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2219/00Indexing scheme for manipulating 3D models or images for computer graphics
    • G06T2219/20Indexing scheme for editing of 3D models
    • G06T2219/2012Colour editing, changing, or manipulating; Use of colour codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Dermatology (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Architecture (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】立体感のある骨格モデルを生成することを課題とする。【解決手段】情報処理装置の一例に対応するサーバ装置10は、複数の視点の撮像画像に基づいて3次元の骨格を推定する推定部15Bと、3次元の骨格がモデル化された骨格モデルを生成する生成部15Cと、を備える。【選択図】図1

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
スポーツやゲームなどのコンピュータグラフィクスの制作や解析、編集といった様々な場面でモーションキャプチャが活用されている。
例えば、3次元の骨格推定に慣性航法を用いるモーションキャプチャが知られている。慣性航法を用いるモーションキャプチャでは、関節に装着されたモーションセンサにより取得されるセンサデータから各関節の位置が測定される。このようにモーションキャプチャに慣性航法が用いられる場合、モーションセンサの装着が避けられない。このため、モーションセンサの装着により、スポーツやゲームなどの競技における動作の妨げとなったり、実写映像の臨場感等の視覚的価値が損なわれたりする。
また、マーカレスなモーションキャプチャの1つとして、単眼カメラの画像から2次元の姿勢検出を行うOpenPoseと呼ばれる手法が提案されている。
国際公開第2019/016152号公報
Zhe Cao, Tomas Simon, Shih-EnWei, Yaser Sheikh "Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields"
しかしながら、上記のOpenPoseでは、2次元の姿勢検出が行われるに過ぎないので、オクルージョンにより隠される骨格部位を正確に検出するのが困難である。それ故、立体感に欠ける骨格モデルしか生成できない。
そこで、本開示では、立体感のある骨格モデルを生成できる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。
上記の課題を解決するために、本開示に係る一形態の情報処理装置は、複数の視点の撮像画像に基づいて3次元の骨格を推定する推定部と、前記3次元の骨格がモデル化された骨格モデルを生成する生成部と、を備える。
第1の実施形態に係るシステムの構成例を示す図である。 スケルトン画像の一例を示す図である。 3次元骨格モデルの一例を示す図である。 スケルトン画像及び撮像画像の関連付け方法の一例を示す図である。 第1の実施形態に係る画像生成処理の手順を示すフローチャートである。 第2の実施形態に係るシステムの構成例を示す図である。 ヒートマップのエフェクトの一例を示す図である。 強調表示のエフェクトの一例を示す図である。 第2の実施形態に係る画像生成処理の手順を示すフローチャートである。 CGキャラクタモデルの一例を示す図である。 骨格部位の位置の軌跡の一例を示す図である。 骨格部位の位置の軌跡の一例を示す図である。 コンピュータの一例を示すハードウェア構成図である。
以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。
また、以下に示す項目順序に従って本開示を説明する。
1.第1の実施形態
1-1.システム構成例
1-1-1.サーバ装置
1-1-2.カメラ
1-1-3.クライアント端末
1-2.課題解決のアプローチの一側面
1-3.サーバ装置の機能構成例
1-3-1.通信インターフェイス
1-3-2.記憶部
1-3-2-1.カメラパラメータ
1-3-2-2.3次元骨格データ
1-3-3.制御部
1-3-3-1.取得部
1-3-3-2.推定部
1-3-3-3.生成部
1-4.サーバ装置の処理手順
1-5.効果の一面
2.第2の実施形態
2-1.サーバ装置の機能構成例
2-1-1.設定部
2-2.サーバ装置の処理手順
2-3.効果の一面
3.応用例
3-1.CG(Computer Graphics)キャラクタモデル
3-2.個人識別との連動
3-3.骨格推定精度の可視化
3-4.骨格部位の軌跡
4.変形例
5.ハードウェア構成
<<1.第1の実施形態>>
<1-1.システム構成例>
図1は、第1の実施形態に係るシステム1の構成例を示す図である。図1に示すシステム1は、マーカレスなモーションキャプチャにより得られる3次元の骨格がモデル化された3次元骨格モデルをコンピュータグラフィクスとして生成する画像生成サービスを提供するものである。
このような画像生成サービスは、1つの側面として、スポーツやゲームなどのコンピュータグラフィクスの制作や解析、編集といった様々なユースケースで活用され得る。
以下、コンピュータグラフィクスである3次元骨格モデルを含むスケルトン画像との間でカメラ30が撮像する画像、すなわち実写映像のラベルを区別する側面から、カメラ30が撮像する画像のことを「撮像画像」と記載する場合がある。
図1に示すように、システム1には、サーバ装置10と、カメラ30A~30Nと、クライアント端末50とが含まれ得る。以下、カメラ30A~30Nの各々の個体を区別せずともよい場合、「カメラ30」と記載する場合がある。なお、図1には、システム1に1つクライアント端末50が含まれる例を挙げたが、複数のクライアント端末50が含まれることとしてもかまわない。
これらサーバ装置10、カメラ30及びクライアント端末50の間は、任意のネットワークNWを介して接続され得る。例えば、ネットワークNWは、有線または無線を問わず、インターネットやLAN(Local Area Network)などの任意の種類の通信網であってかまわない。
なお、図1には、サーバ装置10がネットワークNWを介して3次元骨格モデルを含むスケルトン画像をクライアント端末50へ提供する場合を例示するが、サーバ装置10及びクライアント端末50の間で必ずしも双方向に通信が行われずともかまわない。例えば、スケルトン画像は、必ずしもネットワークNWを経由させずともよく、放送波を介してサーバ装置10からクライアント端末50へ提供されることとしてもかまわない。
<1-1-1.サーバ装置>
サーバ装置10は、上記の画像生成サービスを提供するコンピュータである。このサーバ装置10は、情報処理装置の一例に対応し得る。
一実施形態として、サーバ装置10は、パッケージソフトウェア又はオンラインソフトウェアとして、上記の画像生成サービスに対応する機能を実現する画像生成プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、サーバ装置10は、上記の画像生成サービスに関する機能をオンプレミスに提供するサーバ、例えばWebサーバとして実装することができる。これに限定されず、サーバ装置10は、SaaS(Software as a Service)型のアプリケーションとして実装することで、上記の画像生成サービスをクラウドサービスとして提供することとしてもかまわない。
<1-1-2.カメラ>
カメラ30は、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子を搭載する撮像装置の一例である。
例えば、複数のカメラ30の撮影範囲が組み合わさることにより、コンピュータグラフィクスの生成対象とするスポーツやゲーム等の競技が行われる3次元空間の全域が複数のカメラ30の撮影範囲に収まる配置で各カメラ30が設置される。さらに、2つ以上のカメラ30により撮像された撮像画像から3次元空間上に存在する被写体の3次元骨格を推定する側面から、各カメラ30は、他のカメラ30との間で撮影範囲の一部が重複する状態で配置することができる。このような配置の下、複数のカメラ30がフレームごとに同期して撮像することにより、異なる視点ごとに同一のタイミングで撮像された複数の画像、すなわち多視点の撮像画像がフレーム単位で得られる。なお、当然のことながら、各カメラ30が画像を撮像するフレームレートも同一のフレームレートに統一される。
<1-1-3.クライアント端末>
クライアント端末50は、上記の画像生成サービスに対応する機能の提供を受けるコンピュータの一例に対応する。例えば、クライアント端末50には、パーソナルコンピュータなどのデスクトップ型のコンピュータなどが対応し得る。これはあくまで一例に過ぎず、クライアント端末50は、ラップトップ型のコンピュータや携帯端末装置、ウェアラブル端末などの任意のコンピュータであってかまわない。
なお、図1には、システム1がサーバ装置10及びクライアント端末50を含むクライアントサーバシステムとして構築される例を挙げたが、システム1の構成例はこれに限定されない。例えば、上記の画像生成サービスに対応する機能は、スタンドアローンで動作するコンピュータにより実現されてもかまわない。
<1-2.課題解決のアプローチの一側面>
上記の背景技術の欄で説明した通り、慣性航法を用いるモーションキャプチャでは、モーションセンサの装着が避けられない。このため、モーションセンサの装着により、スポーツやゲームなどの競技における動作の妨げとなったり、実写映像の臨場感等の視覚的価値が損なわれたりする。このように、慣性航法を用いるモーションキャプチャでは、マーカレスなモーションキャプチャを実現できない。
そうであるからと言って、OpenPoseでは、2次元の姿勢検出が行われるに過ぎないので、オクルージョンにより隠される骨格部位の姿勢は正確に検出することができない。それ故、OpenPoseでは、立体感に欠ける骨格モデルしか生成できない。
また、Kinectのようなデプスセンサを併用しても、依然として、上記のオクルージョンの課題は解決し得ない。さらに、単眼3次元姿勢推定と呼ばれる関節の奥行情報を機械学習で推定する技術も出てきているが、不定問題に対する機械学習による予想であるので、関節の奥行情報を正確に推定するのは困難である。
そこで、本開示のサーバ装置10は、上記の画像生成サービスの一環として、多視点の撮像画像から3次元の骨格を推定する。これによって、オクルージョンにより隠される骨格部位の推定を実現すると共に、3次元の骨格推定をマーカレスなモーションキャプチャにより実現できる。その上で、本開示のサーバ装置10は、このようにして推定された3次元の骨格がモデル化された3次元骨格モデルを生成する。したがって、本開示のサーバ装置10によれば、立体感のある骨格モデルを生成することが可能になる。
<1-3.サーバ装置の機能構成例>
次に、本開示のサーバ装置10の機能構成例について説明する。図1には、システム1に含まれる装置のうち、サーバ装置10が備える機能に対応するブロックが模式化されている。図1に示すように、サーバ装置10は、通信インターフェイス11と、記憶部13と、制御部15とを有する。
なお、図1には、上記の画像生成サービスに関連する機能部が抜粋して示されているに過ぎず、図示以外の機能部、例えば既存のコンピュータがデフォルトまたはオプションで装備する機能部がサーバ装置10に備わることを妨げない。
<1-3-1.通信インターフェイス>
通信インターフェイス11は、他の装置、例えばカメラ30やクライアント端末50との間で通信制御を行う通信制御部の一例に対応する。
あくまで一例として、通信インターフェイス11には、LANカードなどのネットワークインターフェイスカードを採用することができる。例えば、通信インターフェイス11は、各カメラ30へ撮像画像の撮像開始指示や撮像終了指示を通知したり、カメラ30から撮像画像を受信したりする。また、通信インターフェイス11は、クライアント端末50からスケルトン画像の視聴に関する各種の設定操作、例えば仮想視点を含むカメラの視点の設定操作を受け付けたり、スケルトン画像を出力したりする。
<1-3-2.記憶部>
記憶部13は、制御部15で実行されるOS(Operating System)を始め、上記の画像生成プログラムなどの各種プログラムに用いられるデータを記憶するハードウェアに対応し得る。
一実施形態として、記憶部13は、サーバ装置10における補助記憶装置に対応し得る。例えば、HDD(Hard Disk Drive)、光ディスクやSSD(Solid State Drive)などが補助記憶装置に対応する。この他、EPROM(Erasable Programmable Read Only Memory)などのフラッシュメモリも補助記憶装置に対応し得る。
記憶部13は、制御部15で実行されるプログラムに用いられるデータの一例として、カメラパラメータ13Aと、3次元骨格データ13Bとを記憶する。これらカメラパラメータ13A及び3次元骨格データ13B以外にも、記憶部13は、各視点の撮像画像の他、クライアント端末50のユーザのアカウント情報などの各種のデータを記憶することができる。
<1-3-2-1.カメラパラメータ>
カメラパラメータ13Aは、カメラパラメータに関するデータである。あくまで一例として、カメラパラメータ13Aには、各カメラ30の位置や向きなどの外部パラメータ及び各カメラ30の画角やレンズの歪みなどの内部パラメータなどが含まれ得る。
<1-3-2-2.3次元骨格データ>
3次元骨格データ13Bは、3次元の骨格の推定結果に関するデータである。あくまで一例として、3次元骨格データ13Bは、カメラ30により撮像される撮像画像のフレームごとに被写体が有する関節の3次元空間上の位置が後述の推定部15Bにより推定される。このように、3次元骨格データ13Bには、一例として、各関節の3次元空間上の位置の時系列データが含まれ得る。さらに、3次元骨格データ13Bには、3次元空間上の位置以外にも、各関節の3次元空間上の姿勢、例えば逆運動学に基づいて計算される関節角が含まれ得る。
<1-3-3.制御部>
制御部15は、サーバ装置10の全体制御を行う処理部である。
一実施形態として、制御部15は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などのハードウェアプロセッサにより実装することができる。ここでは、プロセッサの一例として、CPUやMPUを例示したが、汎用型および特化型を問わず、任意のプロセッサにより実装することができる。この他、制御部15は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジックによって実現されることとしてもかまわない。
制御部15は、図示しない主記憶装置として実装されるRAM(Random Access Memory)のワークエリア上に、上記の画像生成プログラムを展開することにより、下記の処理部を仮想的に実現する。なお、図1には、上記の画像生成プログラムに対応する機能部を図示したが、上記の画像生成プログラムに対応するプログラムモジュールが他の機能とパッケージ化されたパッケージソフトウェアに対応する機能部が含まれてもかまわない。
制御部15は、図1に示すように、取得部15Aと、推定部15Bと、生成部15Cとを有する。
<1-3-3-1.取得部>
取得部15Aは、各視点の撮像画像を取得する処理部である。
一実施形態として、取得部15Aは、カメラ30A~カメラ30Nから伝送される各視点の撮像画像をフレーム単位で取得することができる。ここで、取得部15Aが撮像画像を取得する情報ソースは、任意の情報ソースであってよく、カメラ30に限定されない。例えば、取得部15Aは、各視点の撮像画像を蓄積するハードディスクや光ディスクなどの補助記憶装置またはメモリカードやUSB(Universal Serial Bus)メモリなどのリムーバブルメディアから多視点の撮像画像を取得することもできる。この他、取得部15Aは、カメラ5以外の外部装置からネットワークNWを介して各視点の撮像画像を取得することもできる。
<1-3-3-2.推定部>
推定部15Bは、各視点の撮像画像に基づいて3次元骨格を推定する処理部である。
一実施形態として、推定部15Bは、カメラ30の視点ごとにディープラーニング等の機械学習により得られたモデルへ撮像画像を入力することにより、関節ごとに撮像画像上の位置の確信度のマップ等の出力を得る。その上で、推定部15Bは、撮像画像ごとに得られた関節の位置に基づいて撮像画像間の三角測量を行うことにより、各関節の3次元空間上の位置を推定する。さらに、推定部15Bは、各関節の3次元空間上の位置を用いて、逆運動学に基づく関節角の計算を行うことにより、各関節の3次元空間上の姿勢を算出することもできる。このように撮像画像のフレームごとに得られる各関節の3次元空間上の位置および姿勢が3次元骨格データとして記憶部13に保存される。
なお、ここでは、被写体のあくまで一例として、人物を例に挙げて各関節の3次元空間上の位置および姿勢を推定する場合を説明したが、人物以外の環境の3次元モデルを生成することもできる。
<1-3-3-3.生成部>
生成部15Cは、3次元の骨格がモデル化された骨格モデルを生成する処理部である。
1つの側面として、生成部15Cは、カメラ30A~カメラ30Nの視点、あるいは3次元空間上の任意の仮想視点におけるスケルトン画像をレンダリングする。例えば、生成部15Cは、クライアント端末50等によるユーザ設定、あるいはシステム設定が行われた視点の位置と、3次元骨格データ13Bに含まれる関節の位置とに基づいて、被写体ごとに当該被写体の3次元の骨格モデルをレンダリングする。
図2は、スケルトン画像の一例を示す図である。あくまで一例として、図2には、卓球の試合が撮影された撮像画像から生成されたスケルトン画像200が示されている。さらに、図2には、卓球台の長手方向の中央正面の位置が仮想視点Vcに設定された場合におけるスケルトン画像200が示されている。図2に示すように、スケルトン画像200には、卓球の試合を行う2人の選手に対応する3次元骨格モデルM1及びM2がレンダリングされている。さらに、スケルトン画像200には、人物以外の環境の3次元モデルの一例として、卓球台に対応する3次元モデルM3がレンダリングされている。ここで、卓球台の3次元モデルM3は、必ずしも撮像画像から生成したモデリングデータでなくともかまわない。例えば、3次元モデルM3等のように3次元空間上で位置や姿勢に変化がない環境物は、予め作成されていたモデリングデータであって良い。スケルトン画像200にはこのようなモデリングデータを追加可能である。このように、スケルトン画像200には、3次元骨格モデルがレンダリングされるので、オクルージョンにより隠される骨格部位の表現能力も向上する。
図3は、3次元骨格モデルの一例を示す図である。図3には、図2に示された3次元骨格モデルM2が拡大して示されている。図3に示すように、3次元骨格モデルM2には、目や鼻等の特徴点を含む頭部、さらには、鎖骨、左右の肩、肘、手首、肩、肘、手首、腰、膝、足首、つま先等といった部位に対応し得る関節J1~関節J20と、各関節を接続する骨B1~骨B17とが含まれる。このように3次元骨格モデルM2が生成される際、関節J1~関節J20は、球状にモデル化される一方で、骨B1~骨B17は、線状または円柱状にモデル化される。
ここで、関節J1~J20の球のサイズは、仮想視点Vcおよび関節J1~J20の間の距離に応じて設定される。例えば、仮想視点Vcからの距離が小さくなるに連れて、言い換えれば関節がより手前側に位置するに連れて関節の球の半径が大きく設定される。その一方で、仮想視点Vcからの距離が大きくなるに連れて、言い換えれば関節がより奥側に位置するに連れて関節の球の半径が小さく設定される。あくまで1つの側面として、関節J4、関節J7及び関節J8を例に挙げれば、仮想視点Vcからの距離が小さい順に、関節J8、関節J7、関節J4となる。この場合、図3に示された通り、関節J4、関節J7及び関節J8の球の半径は、J8>J7>J4となるように設定される。
また、骨B1~骨B17の円柱の太さは、仮想視点Vcおよび骨B1~骨B17の間の距離に応じて設定される。例えば、仮想視点Vcからの距離が小さくなるに連れて、言い換えれば骨がより手前側に位置するに連れて骨の円柱の半径が大きく設定される。その一方で、仮想視点Vcからの距離が大きくなるに連れて、言い換えれば骨がより奥側に位置するに連れて骨の円柱の半径が小さく設定される。あくまで1つの側面として、骨B5及び骨B6を例に挙げれば、仮想視点Vcからの距離が小さい順に、骨B6、骨B5となる。この場合、図3に示された通り、骨B5及び骨B6の円柱の半径は、B6>B5となるように設定される。
このような関節J1~J20及び骨B1~骨B17を含む3次元骨格モデルM2をモデル化することにより、関節および骨の前後方向、すなわち奥行き方向の表現能力が向上する。
なお、スケルトン画像の視点は、必ずしも仮想カメラに与えられる仮想視点に限らず、カメラ30A~カメラ30Nのいずれかの視点であってもかまわない。さらに、スケルトン画像の視点は、必ずしも固定でなくともよく、クライアント端末50等によるユーザ設定あるいはGUI操作が行われた軌跡にしたがって移動させることもできる。
他の側面として、生成部15Cは、3次元骨格モデルを各視点の撮像画像の他、複数の撮像画像を用いて生成される仮想視点の撮像画像に関連付けて表示させることもできる。例えば、生成部15Cは、同一のフレームに対応するスケルトン画像および撮像画像を左右または上下に並べて表示したり、あるいは3次元骨格モデルを撮像画像に投影することにより撮像画像にスケルトン画像を重畳して表示したりすることができる。このように3次元骨格モデルを撮像画像に投影する際、各関節の位置に加えて関節角を用いることで、関節のねじれの表現能力を向上させることができる。
図4は、スケルトン画像及び撮像画像の関連付け方法の一例を示す図である。図4に示すように、カメラ30A~30Cの3つの視点の撮像画像40A~40Cが表示されている。これら撮像画像40A~40Cの右側に並べて、各視点に対応する3次元骨格モデルM1及びM2を撮像画像40A~40Cに投影することにより各視点のスケルトン画像が撮像画像40A~40Cに重畳された重畳画像40α~40γが表示されている。このようにスケルトン画像が撮像画像に重畳される場合、撮像画像に比べてスケルトン画像のコントラストを上げる側面から、撮像画像のコントラスト比を減少させる画像処理、例えば輝度や彩度の減少、透明度の増加などを行った上で重畳画像40α~40γを生成することができる。
このような重畳画像40α~40γの表示、ひいては、撮像画像40A~40C及び重畳画像40α~40γの整列表示により、実写映像および骨格モデルの比較を容易化することができる。
なお、3次元骨格モデルが環境の3次元モデルによりオクルージョンが発生する場合、3次元骨格モデルのうち環境の3次元モデルにより隠れる部分を描画するか否かを制御することもできる。例えば、重畳画像40γのように、3次元骨格モデルM2の脚部が卓球台に隠れる場合、3次元骨格モデルM2の脚部を描画することにより透視効果を与えたり、3次元骨格モデルM2の脚部の描画を抑制することにより違和感の発生を抑えたりすることができる。
<1-4.サーバ装置の処理手順>
図5は、第1の実施形態に係る画像生成処理の手順を示すフローチャートである。この処理は、あくまで一例として、カメラ30から撮像画像の取得が終了するまで継続して行うことができる。
図5に示すように、取得部15Aにより各視点の撮像画像が取得されるまで(ステップS101No)、ステップS102の処理を待機する。そして、取得部15Aにより各視点の撮像画像が取得された場合(ステップS101Yes)、推定部15Bは、各視点の撮像画像に基づいて3次元骨格を推定する(ステップS102)。
その上、生成部15Cは、ステップS102で推定された3次元の骨格がモデル化された3次元骨格モデルを生成する(ステップS103)。このようにステップS103の処理が行われた後、ステップS101の処理へ移行する。
<1-5.効果の一面>
上述してきたように、本開示のサーバ装置10は、上記の画像生成サービスの一環として、多視点の撮像画像から3次元の骨格を推定する。これによって、オクルージョンにより隠される骨格部位の推定を実現すると共に、3次元の骨格推定をマーカレスなモーションキャプチャにより実現できる。その上で、本開示のサーバ装置10は、このようにして推定された3次元の骨格がモデル化された3次元骨格モデルを生成する。したがって、本開示のサーバ装置10によれば、立体感のある骨格モデルを生成することが可能である。
<<2.第2の実施形態>>
上記の第1の実施形態で説明してきた3次元骨格モデルには、各種のエフェクトを付加することができる。以下、第2の実施形態として、各種のエフェクトの内容およびその設定方法について例示する。
<2-1.サーバ装置の機能構成例>
図6は、第2の実施形態に係るシステムの構成例を示す図である。図6に示すように、システム2は、図1に示されたシステム1に比べて、上記のエフェクトに関する機能のアドオンが行われたサーバ装置20を有する点が異なる。さらに、サーバ装置20は、図1に示すサーバ装置10に比べて、設定部25Aを制御部25がさらに有する点で異なる。
<2-1-1.設定部>
設定部25Aは、3次元骨格モデルにエフェクトを設定する処理部である。
1つの側面として、設定部25Aは、3次元骨格モデルの関節や骨などの骨格部位にヒートマップのエフェクトを設定できる。図7は、ヒートマップのエフェクトの一例を示す図である。図7には、図3に示された3次元骨格モデルM2にヒートマップのエフェクトが付加される例が示されている。図7に示すように、3次元骨格モデルM2に含まれる関節には、骨格部位によって異なる色のヒートマップが付加されている。より具体的には、右腕、左腕、右脚および左脚の骨格部位の違いによって関節を覆うヒートマップの色が区別して設定される。例えば、右腕に含まれる関節J3、関節J5及び関節J6には、第1の色、例えば図中の格子模様のハッチングに対応するヒートマップが付加されている。また、左腕に含まれる関節J4、関節J7及び関節J8には、第2の色、すなわち図中の点のハッチングに対応するヒートマップが付加されている。さらに、右脚に含まれる関節J13~関節J16には、第3の色、すなわち図中の斜線のハッチングに対応するヒートマップが付加されている。さらに、左脚に含まれる関節J17~関節J20には、第4の色、すなわち図中の縦線のハッチングに対応するヒートマップが付加されている。
このように、骨格部位の位置に応じて異なる色のヒートマップを設定することで、関節の部位の識別を容易化できる。なお、図7には、関節にヒートマップのエフェクトが付加される例を挙げたが、同様のエフェクトを骨に付加することができるのも言うまでもない。また、図7には、骨格部位の位置に応じて異なる色のヒートマップを設定する例を挙げたが、骨格部位の位置に応じて異なる面積のヒートマップを設定することとしてもよい。
他の側面として、設定部25Aは、3次元骨格モデルの関節や骨などの骨格部位の表示色を強調表示するエフェクトを設定できる。あくまで一例として、設定部25Aは、関節や骨などの骨格部位の動きに応じて色変化のエフェクトを設定できる。
このようにエフェクトの付加の基準に用いる骨格部位の動きの指標の一例として、設定部25Aは、骨格部位の移動量を用いることができる。例えば、設定部25Aは、スケルトン画像が表示中であるフレームにおける骨格部位の位置と、当該フレームよりも前のフレームにおける骨格部位の位置とから求まる骨格部位の移動量を算出できる。例えば、Nフレーム目のスケルトン画像が表示中であるとしたとき、N-1フレーム目からNフレーム目までの骨格部位の移動量を算出できる。その上で、設定部25Aは、移動量が大きくなるに連れて骨格部位の彩度を高く設定する一方で、移動量が小さくなるに連れて骨格部位の彩度を低く設定する。また、設定部25Aは、移動量のレンジごとに割り当てられた色のうち骨格部位の移動量が対応するレンジの色を当該骨格部位の表示色として設定することもできる。これによって、移動量の大きさによって表示色を区別するエフェクトを実現できる。なお、ここでは、隣接フレーム間の骨格部位の移動量を算出する例を挙げたが、移動量の算出に用いるフレームの間隔は必ずしも隣接せずともかまわない。例えば、所定数のフレーム間で骨格部位の移動量を算出するもできる。
この他、設定部25Aは、3次元骨格モデルに含まれる骨格部位のうち移動量の大きさが所定の閾値以上である骨格部位を強調表示するエフェクトを設定することもできる。このとき、各骨格部位の間で動きの相対差が大きい骨格部位を強調する側面から、設定部25Aは、各骨格部位の移動量から3次元骨格モデル全体の重心の移動量を減算した上で移動量の減算値が所定の閾値以上である骨格部位を強調表示するエフェクト、例えば表示色の変更やブリンク表示を設定することができる。
図8は、強調表示のエフェクトの一例を示す図である。図8には、関節J1~関節J20および骨B1~骨B17の骨格部位の移動量から3次元骨格モデルM2全体の重心の移動量が減算された減算値が閾値以上である骨格部位に強調表示のエフェクトが付加されている。図8に示すように、関節J1~関節J20のうち、移動量の減算値が閾値以上である関節J5、関節J6、関節J18、関節J19及び関節J20の表示色が他の関節の表示色とは異なる表示色に設定されている。さらに、骨B1~骨B17のうち、移動量の減算値が閾値以上である骨B3、骨B4、骨B16および骨B17の表示色が他の骨の表示色とは異なる表示色に設定されている。
このように、骨格部位の移動量から3次元骨格モデルM2全体の重心の移動量が減算された減算値が閾値以上である骨格部位に強調表示のエフェクトを設定することで、他の部位に比べて移動量が相対的に大きい骨格部位の識別を容易化できる。例えば、卓球の例で言えば、ラケットをスイングする場面等で動きが激しい骨格部位を識別することで、フォームの評価や解析などを支援することができる。
なお、ここでは、動きの指標のあくまで一例として、骨格部位の移動量を例に挙げたが、これに限定されない。例えば、所定数のフレームにおける移動量から単位時間、例えば1フレームあたりの移動量の変化を計算することにより骨格部位ごとに速度を算出することができる。また、所定数のフレームにおける速度から単位時間、例えば1フレームあたりの速度の変化を計算することにより骨格部位ごとに加速度を算出することができる。これら速度や加速度を上記の強調表示のエフェクトの設定に用いることができる。
また、ここでは、骨格部位の動きの変化に応じて強調表示のエフェクトを設定する例を挙げたが、骨格部位の動きの変化に応じて異なる色または異なる面積のヒートマップのエフェクトを設定することもできる。また、逆に、骨格部位の位置に応じて強調表示のエフェクトを設定することもできる。
さらに、ここでは、関節や骨の表示色を変更する例を挙げたが、関節の球のサイズや骨の円柱の太さ、あるいはヒートマップの面積を変更するエフェクトを設定してもよい。例えば、移動量が大きくなるに連れて骨格部位に対応する関節の球のサイズ、骨の円柱の太さまたはヒートマップの面積を大きく設定したり、移動量が小さくなるに連れて骨格部位に対応する関節の球のサイズ、骨の円柱の太さまたはヒートマップの面積を小さく設定したりすることができる。
<2-2.サーバ装置の処理手順>
図9は、第2の実施形態に係る画像生成処理の手順を示すフローチャートである。この処理は、あくまで一例として、カメラ30から撮像画像の取得が終了するまで継続して行うことができる。
図9に示すように、取得部15Aにより各視点の撮像画像が取得されるまで(ステップS101No)、ステップS102の処理を待機する。そして、取得部15Aにより各視点の撮像画像が取得された場合(ステップS101Yes)、推定部15Bは、各視点の撮像画像に基づいて3次元骨格を推定する(ステップS102)。
そして、設定部25Aは、ステップS102で推定された3次元の骨格の部位や移動量に基づいてヒートマップのエフェクトや強調表示のエフェクトを設定する(ステップS201)。
その後、生成部15Cは、ステップS102で推定された3次元の骨格がモデル化された3次元骨格モデルを生成する(ステップS103)。その上で、生成部15Cは、ステップS201で設定されたエフェクトをステップS103で生成された3次元骨格モデルに付加する(ステップS202)。このようにステップS202の処理が行われた後、ステップS101の処理へ移行する。
<2-3.効果の一面>
上述してきたように、本開示のサーバ装置20は、上記の画像生成サービスの一環として、3次元の骨格の部位や移動量に基づいてヒートマップのエフェクトや強調表示のエフェクトを設定する。したがって、本開示のサーバ装置20によれば、映像の評価や解析等の目的に応じて骨格部位の視認性を高めることが可能である。
<<3.応用例>>
以下、第1の実施形態および第2の実施形態の応用例について例示する。
<3-1.CGキャラクタモデル>
第1の実施形態および第2の実施形態では、3次元骨格モデルを生成してクライアント端末50に表示させる例を挙げたが、3次元骨格モデルの代わりに、CGキャラクタモデルを生成することもできる。図10は、CGキャラクタモデルの一例を示す図である。図10に示すように、CG画像210には、3次元骨格モデルM1に対応するCGキャラクタモデルCG1と、3次元骨格モデルM2に対応するCGキャラクタモデルCG2とがレンダリングされる。これらCGキャラクタモデルCG1及びCGキャラクタモデルCG2の表示により、状況理解や視聴効果を向上させることができる。
また、3次元骨格モデルとCGキャラクタモデルとを並列して表示し、視点移動も連動させることもできる。これにより、状況理解(骨格モデルが分かりやすい)と仕上りの確認(CGキャラ)を両立させることもができる。この他、実写のカメラ視点、例えばカメラ30A~30Nのいずれかの視点でCGキャラクタモデルを描画することで、実写と比較を容易化し、もって状況理解の効果が向上させることができる。
<3-2.個人識別との連動>
例えば、サーバ装置10やサーバ装置20は、撮像画像に含まれる人物に顔認証や虹彩認証などの認証処理を実行することにより個人を識別する。その上で、サーバ装置10やサーバ装置20は、CGキャラクタモデルやエフェクトの個人設定を参照して、認証処理の結果として識別された個人に対応する個人設定にしたがってCGキャラクタモデルやエフェクトを選択することができる。
<3-3.骨格推定精度の可視化>
第2の実施形態では、骨格部位の識別にヒートマップの表示を用いる例を挙げたが、骨格部位における3次元骨格の推定結果の確信度に応じてヒートマップの色または大きさを変更することができる。例えば、推定結果の確信度が高いほど、骨格部位のヒートマップの色の彩度を上げたり、骨格部位のヒートマップの面積を大きくしたりすることができる。また、推定結果の確信度が低いほど、骨格部位のヒートマップの色の彩度を下げたり、骨格部位のヒートマップの面積を小さくしたりすることができる。これにより、3次元骨格モデル上で3次元骨格の推定精度を可視化できる。
<3-4.骨格部位の軌跡>
第1の実施形態および第2の実施形態では、取得部15Aにより最新の撮像画像が取得されたフレームに絞って骨格部位をモデル化する例を挙げたが、過去の所定数のフレームに跨がって骨格部位の位置をモデル化することもできる。
図11及び図12は、骨格部位の位置の軌跡の一例を示す図である。図11には、取得部15Aにより最新の撮像画像が取得されたt番目のフレームからNフレーム前のt-N番目のフレームにおけるカメラ30A~30Cの3つの撮像画像にt-N番目のフレームにおける骨格部位の位置が重畳された重畳画像60A~60Cが示されている。これら重畳画像60A~60Cの右側に並べて、t番目のフレームにおけるカメラ30A~30Cの3つの撮像画像にt-N番目からt番目までのN個のフレームにおける骨格部位の位置の軌跡が重畳された重畳画像80A~80Cが示されている。また、図12には、t番目のフレームにおける俯瞰視点(仮想視点)の撮像画像にt-N番目からt番目までのN個のフレームにおける骨格部位の位置の軌跡が重畳された重畳画像80Vが示されている。さらに、図11に示す重畳画像80A~80C及び図12に示す重畳画像80Vでは、t番目のフレームにおける3次元骨格モデル全体の重心の移動量が減算された減算値が閾値以上である関節に絞ってN個のフレームにおける関節の位置の軌跡が重畳されており、他の骨格部位についてはt番目のフレームにおける骨格部位の位置のみが重畳されている。
ここで、重畳画像80A~80Cや重畳画像80VでN個のフレームにおける関節の位置の軌跡が重畳される場合、t番目のフレーム以外の過去のフレームにおける関節の球はt番目のフレームにおける関節の球の半径よりも小さい半径が設定される。すなわち、同一の関節については、t番目のフレームにおける関節の球の半径を最大値とし、t番目のフレームから過去のフレームに遡るに連れてt番目のフレームにおける関節の球の半径を単調減少させることによりN個のフレームの関節の球の半径を設定する。この他、t番目のフレームから過去のフレームに遡るに連れてt番目のフレームにおける関節よりも輝度や彩度を単調減少させたり、透明度を単調増加させたりすることもできる。
このようにして生成される重畳画像80A~80Cや重畳画像80Vによれば、骨格部位の位置の軌跡を可視化できる。さらに、t番目のフレームから過去のフレームに遡るに連れてt番目のフレームにおける関節の球の半径を単調減少させるので、骨格部位の位置の時系列変化がより識別しやすくなる。なお、ここでは、関節の位置の軌跡を生成する例を挙げたが、同様の方法で骨の位置の軌跡やヒートマップの位置の軌跡を生成することができるのは言うまでもない。
<<4.変形例>>
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
また、本明細書に記載された各実施形態における効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。
<<5.ハードウェア構成>>
上述してきた各実施形態に係るサーバ装置10は、例えば図13に示すような構成のコンピュータ1000によって実現される。以下、上述の実施形態に係るサーバ装置10またはサーバ装置20を例に挙げて説明する。図13は、コンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス1500、及び入出力インターフェイス1600を有する。コンピュータ1000の各部は、バス1050によって接続される。
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、CPU1100は、ROM1300又はHDD1400に格納されたプログラムをRAM1200に展開し、各種プログラムに対応した処理を実行する。
ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるBIOS(Basic Input Output System)等のブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、HDD1400は、プログラムデータ1450の一例である本開示に係る開発支援プログラムを記録する記録媒体である。
通信インターフェイス1500は、コンピュータ1000が外部ネットワーク1550(例えばインターネット)と接続するためのインターフェイスである。例えば、CPU1100は、通信インターフェイス1500を介して、他の機器からデータを受信したり、CPU1100が生成したデータを他の機器へ送信したりする。
入出力インターフェイス1600は、入出力デバイス1650とコンピュータ1000とを接続するためのインターフェイスである。例えば、CPU1100は、入出力インターフェイス1600を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、CPU1100は、入出力インターフェイス1600を介して、ディスプレイやスピーカーやプリンタ等の出力デバイスにデータを送信する。また、入出力インターフェイス1600は、所定の記録媒体(メディア)に記録されたプログラム等を読み取るメディアインターフェイスとして機能してもよい。メディアとは、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が上述の実施形態に係るサーバ装置10またはサーバ装置20として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされた画像生成プログラムを実行することにより、制御部15に含まれる各機能部を実現する。また、HDD1400には、本開示に係る画像生成プログラムや、コンテンツ記憶部121内のデータが格納される。なお、CPU1100は、プログラムデータ1450をHDD1400から読み取って実行するが、他の例として、外部ネットワーク1550を介して、他の装置からこれらのプログラムを取得してもよい。
なお、本技術は以下のような構成も取ることができる。
(1)
複数の視点の撮像画像に基づいて3次元の骨格を推定する推定部と、
前記3次元の骨格がモデル化された骨格モデルを生成する生成部と、
を備える情報処理装置。
(2)
前記生成部は、前記3次元の骨格のうち関節を球状にモデル化すると共に骨を円柱状にモデル化する、
前記(1)に記載の情報処理装置。
(3)
前記生成部は、前記複数の視点のうちいずれかの視点または仮想視点と、前記関節または前記骨との距離に基づいて前記関節の球の半径または前記骨の円柱の半径を設定する、
前記(2)に記載の情報処理装置。
(4)
前記生成部は、前記距離が小さくなるに連れて前記関節の球の半径または前記骨の円柱の半径を大きく設定するか、あるいは前記距離が大きくなるに連れて前記関節の球の半径または前記骨の円柱の半径を小さく設定する、
前記(3)に記載の情報処理装置。
(5)
前記骨格モデルは、前記複数の視点または仮想視点の撮像画像に関連付けて表示される、
前記(1)に記載の情報処理装置。
(6)
前記骨格モデルは、前記骨格モデルと同一のフレームの撮像画像と左右または上下に並べて表示される、
前記(5)に記載の情報処理装置。
(7)
前記骨格モデルは、前記骨格モデルと同一のフレームの撮像画像に重畳して表示される、
前記(5)に記載の情報処理装置。
(8)
前記撮像画像は、輝度または彩度を減少させるか、あるいは透明度を増加して表示される、
前記(7)に記載の情報処理装置。
(9)
前記骨格モデルにエフェクトを設定する設定部をさらに備える、
前記(2)に記載の情報処理装置。
(10)
前記設定部は、前記関節または前記骨を覆うヒートマップのエフェクトを設定する、
前記(9)に記載の情報処理装置。
(11)
前記設定部は、前記関節または前記骨の位置に応じて異なる色または異なる面積のヒートマップを設定する、
前記(10)に記載の情報処理装置。
(12)
前記設定部は、前記関節または前記骨の骨格部位の移動量、速度または加速度に応じて異なる色または異なる面積のヒートマップを設定する、
前記(10)に記載の情報処理装置。
(13)
前記設定部は、前記関節または前記骨の骨格部位における3次元の骨格の推定結果の確信度に応じて異なる色または異なる面積のヒートマップを設定する、
前記(10)に記載の情報処理装置。
(14)
前記設定部は、前記関節または前記骨の骨格部位を強調表示するエフェクトを設定する、
前記(9)に記載の情報処理装置。
(15)
前記設定部は、前記関節または前記骨の骨格部位の移動量、速度または加速度に応じて異なる表示色を設定する、
前記(14)に記載の情報処理装置。
(16)
前記設定部は、前記関節または前記骨の骨格部位のうち移動量、速度または加速度が所定の閾値以上である骨格部位を強調表示するエフェクトを設定する、
前記(14)に記載の情報処理装置。
(17)
前記設定部は、前記関節または前記骨の骨格部位の移動量から前記骨格モデルの重心の移動量が減算された減算値が所定の閾値以上である骨格部位を強調表示するエフェクトを設定する、
前記(16)に記載の情報処理装置。
(18)
前記生成部は、前記撮像画像が取得された最新のフレームから過去の所定数のフレームに跨がって前記関節または前記骨の骨格部位の位置の軌跡をモデル化する、
前記(2)に記載の情報処理装置。
(19)
前記生成部は、前記最新のフレーム以外の過去のフレームにおける関節の球の半径または骨の円柱の半径を前記最新のフレームにおける関節の球の半径または骨の円柱の半径よりも小さい半径を設定する、
前記(18)に記載の情報処理装置。
(20)
前記生成部は、前記最新のフレームにおける関節の球の半径または骨の円柱の半径を最大値とし、前記最新のフレームから過去のフレームに遡るに連れて前記最新のフレームにおける関節の球の半径または骨の円柱の半径を単調減少させることにより過去のフレームの関節の球の半径または骨の円柱の半径を設定する、
前記(19)に記載の情報処理装置。
(21)
複数の視点の撮像画像に基づいて3次元の骨格を推定し、
前記3次元の骨格がモデル化された骨格モデルを生成する、
処理をコンピュータが実行する情報処理方法。
(22)
複数の視点の撮像画像に基づいて3次元の骨格を推定し、
前記3次元の骨格がモデル化された骨格モデルを生成する、
処理をコンピュータに実行させる情報処理プログラム。
1 システム
10 サーバ装置
11 通信インターフェイス
13 記憶部
13A カメラパラメータ
13B 3次元骨格データ
15 制御部
15A 取得部
15B 推定部
15C 生成部
30A,30B,30N カメラ
50 クライアント端末

Claims (20)

  1. 複数の視点の撮像画像に基づいて3次元の骨格を推定する推定部と、
    前記3次元の骨格がモデル化された骨格モデルを生成する生成部と、
    を備える情報処理装置。
  2. 前記生成部は、前記3次元の骨格のうち関節を球状にモデル化すると共に骨を円柱状にモデル化する、
    請求項1に記載の情報処理装置。
  3. 前記生成部は、前記複数の視点のうちいずれかの視点または仮想視点と、前記関節または前記骨との距離に基づいて前記関節の球の半径または前記骨の円柱の半径を設定する、
    請求項2に記載の情報処理装置。
  4. 前記生成部は、前記距離が小さくなるに連れて前記関節の球の半径または前記骨の円柱の半径を大きく設定するか、あるいは前記距離が大きくなるに連れて前記関節の球の半径または前記骨の円柱の半径を小さく設定する、
    請求項3に記載の情報処理装置。
  5. 前記骨格モデルは、前記複数の視点または仮想視点の撮像画像に関連付けて表示される、
    請求項1に記載の情報処理装置。
  6. 前記骨格モデルは、前記骨格モデルと同一のフレームの撮像画像と左右または上下に並べて表示される、
    請求項5に記載の情報処理装置。
  7. 前記骨格モデルは、前記骨格モデルと同一のフレームの撮像画像に重畳して表示される、
    請求項5に記載の情報処理装置。
  8. 前記撮像画像は、輝度または彩度を減少させるか、あるいは透明度を増加して表示される、
    請求項7に記載の情報処理装置。
  9. 前記骨格モデルにエフェクトを設定する設定部をさらに備える、
    請求項2に記載の情報処理装置。
  10. 前記設定部は、前記関節または前記骨を覆うヒートマップのエフェクトを設定する、
    請求項9に記載の情報処理装置。
  11. 前記設定部は、前記関節または前記骨の位置に応じて異なる色または異なる面積のヒートマップを設定する、
    請求項10に記載の情報処理装置。
  12. 前記設定部は、前記関節または前記骨の骨格部位の移動量、速度または加速度に応じて異なる色または異なる面積のヒートマップを設定する、
    請求項10に記載の情報処理装置。
  13. 前記設定部は、前記関節または前記骨の骨格部位における3次元の骨格の推定結果の確信度に応じて異なる色または異なる面積のヒートマップを設定する、
    請求項10に記載の情報処理装置。
  14. 前記設定部は、前記関節または前記骨の骨格部位を強調表示するエフェクトを設定する、
    請求項9に記載の情報処理装置。
  15. 前記設定部は、前記関節または前記骨の骨格部位の移動量、速度または加速度に応じて異なる表示色を設定する、
    請求項14に記載の情報処理装置。
  16. 前記設定部は、前記関節または前記骨の骨格部位のうち移動量、速度または加速度が所定の閾値以上である骨格部位を強調表示するエフェクトを設定する、
    請求項14に記載の情報処理装置。
  17. 前記設定部は、前記関節または前記骨の骨格部位の移動量から前記骨格モデルの重心の移動量が減算された減算値が所定の閾値以上である骨格部位を強調表示するエフェクトを設定する、
    請求項16に記載の情報処理装置。
  18. 前記生成部は、前記撮像画像が取得された最新のフレームから過去の所定数のフレームに跨がって前記関節または前記骨の骨格部位の位置の軌跡をモデル化する、
    請求項2に記載の情報処理装置。
  19. 複数の視点の撮像画像に基づいて3次元の骨格を推定し、
    前記3次元の骨格がモデル化された骨格モデルを生成する、
    処理をコンピュータが実行する情報処理方法。
  20. 複数の視点の撮像画像に基づいて3次元の骨格を推定し、
    前記3次元の骨格がモデル化された骨格モデルを生成する、
    処理をコンピュータに実行させる情報処理プログラム。
JP2024092499A 2019-12-27 2024-06-06 情報処理装置、情報処理方法及び情報処理プログラム Pending JP2024103791A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2019239053 2019-12-27
JP2019239053 2019-12-27
JP2021567205A JP7501543B2 (ja) 2019-12-27 2020-12-10 情報処理装置、情報処理方法及び情報処理プログラム
PCT/JP2020/045994 WO2021131738A1 (ja) 2019-12-27 2020-12-10 情報処理装置、情報処理方法及び情報処理プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021567205A Division JP7501543B2 (ja) 2019-12-27 2020-12-10 情報処理装置、情報処理方法及び情報処理プログラム

Publications (1)

Publication Number Publication Date
JP2024103791A true JP2024103791A (ja) 2024-08-01

Family

ID=76575470

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021567205A Active JP7501543B2 (ja) 2019-12-27 2020-12-10 情報処理装置、情報処理方法及び情報処理プログラム
JP2024092499A Pending JP2024103791A (ja) 2019-12-27 2024-06-06 情報処理装置、情報処理方法及び情報処理プログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021567205A Active JP7501543B2 (ja) 2019-12-27 2020-12-10 情報処理装置、情報処理方法及び情報処理プログラム

Country Status (5)

Country Link
US (1) US12067677B2 (ja)
EP (1) EP4083926A4 (ja)
JP (2) JP7501543B2 (ja)
CN (1) CN114830183A (ja)
WO (1) WO2021131738A1 (ja)

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4127402B2 (ja) * 2004-11-16 2008-07-30 独立行政法人産業技術総合研究所 関節運動情報の電子透かし処理方法および装置
US20080221487A1 (en) * 2007-03-07 2008-09-11 Motek Bv Method for real time interactive visualization of muscle forces and joint torques in the human body
WO2009061283A2 (en) 2007-11-09 2009-05-14 National University Of Singapore Human motion analysis system and method
JP2010017447A (ja) 2008-07-14 2010-01-28 Nippon Telegr & Teleph Corp <Ntt> 歩行動作分析装置、歩行動作分析方法、歩行動作分析プログラムおよびその記録媒体
US9355305B2 (en) * 2010-10-08 2016-05-31 Panasonic Corporation Posture estimation device and posture estimation method
JP2014068714A (ja) 2012-09-28 2014-04-21 Kitasato Institute 関節角度測定システム
JP6341355B2 (ja) 2013-05-20 2018-06-13 コニカミノルタ株式会社 拡張現実空間表示装置
US10664690B2 (en) 2013-11-21 2020-05-26 Mo' Motion Ventures Jump shot and athletic activity analysis system
WO2019012520A1 (en) * 2017-07-08 2019-01-17 Vuze Medical Ltd. APPARATUS AND METHODS FOR USE WITH IMAGE-GUIDED SKELETAL PROCEDURES
WO2018115469A1 (en) * 2016-12-22 2018-06-28 Episurf Ip-Management Ab System and method for optimizing an implant position in an anatomical joint
EP3398551B1 (en) * 2017-05-03 2024-10-30 Stryker European Operations Holdings LLC Methods of pose estimation of three-dimensional bone models in surgical planning a total ankle replacement
JP7291683B2 (ja) 2017-07-18 2023-06-15 モレキュラー デバイシーズ, エルエルシー ピペット先端の撮像ベースの位置特定を伴う物体ピッキング装置
EP3431511A1 (en) 2017-07-19 2019-01-23 ARLANXEO Deutschland GmbH Star-branched diene rubber
US11648405B2 (en) * 2019-11-01 2023-05-16 Resolute 360, LLC Percutaneous nerve evaluation for sacral neuromodulation
US11621086B2 (en) * 2020-06-04 2023-04-04 Episurf Ip-Management Ab Customization of individualized implant
US20230005232A1 (en) * 2021-07-01 2023-01-05 Microport Orthopedics Holdings Inc. Systems and methods of using three-dimensional image reconstruction to aid in assessing bone or soft tissue aberrations for orthopedic surgery
US11983833B2 (en) * 2022-03-30 2024-05-14 Health Connect Global Limited Computer-implemented method of generating an avatar

Also Published As

Publication number Publication date
JPWO2021131738A1 (ja) 2021-07-01
EP4083926A1 (en) 2022-11-02
EP4083926A4 (en) 2023-07-05
CN114830183A (zh) 2022-07-29
US20240005600A1 (en) 2024-01-04
US12067677B2 (en) 2024-08-20
WO2021131738A1 (ja) 2021-07-01
JP7501543B2 (ja) 2024-06-18

Similar Documents

Publication Publication Date Title
Achenbach et al. Fast generation of realistic virtual humans
Tome et al. Selfpose: 3d egocentric pose estimation from a headset mounted camera
US8737767B2 (en) Perceptually guided capture and stylization of 3D human figures
JP6934887B2 (ja) 単眼カメラを用いたリアルタイム3d捕捉およびライブフィードバックのための方法およびシステム
TWI659335B (zh) 圖形處理方法和裝置、虛擬實境系統和計算機儲存介質
JP7566973B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP5773944B2 (ja) 情報処理装置および情報処理方法
Zhou et al. Image-based clothes animation for virtual fitting
US20110210970A1 (en) Digital mirror apparatus
JP2006249618A (ja) 仮想試着装置
JP7164968B2 (ja) 画像処理装置、画像処理装置の制御方法及びプログラム
CN109816766A (zh) 图像处理装置、图像处理方法及存储介质
Wenninger et al. Realistic virtual humans from smartphone videos
JP2018206025A (ja) 情報処理装置、情報処理方法
KR101586010B1 (ko) 증강 현실 기반 가상 피팅을 위한 의상의 물리적 시뮬레이션 장치 및 방법
EP3796644A1 (en) A method for capturing and rendering a video stream
Ami-Williams et al. Digitizing traditional dances under extreme clothing: The case study of eyo
JP6799468B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
US11501577B2 (en) Information processing apparatus, information processing method, and storage medium for determining a contact between objects
JP2017156880A (ja) 画像処理装置および画像処理方法
JP7520539B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7501543B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Amirkhanov et al. WithTeeth: Denture Preview in Augmented Reality.
KR20200004754A (ko) 정보 처리장치, 그 제어방법 및 컴퓨터 프로그램
JP2019057070A (ja) 画像処理装置、画像処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240705