JP7164045B2 - 骨格認識方法、骨格認識プログラムおよび骨格認識システム - Google Patents
骨格認識方法、骨格認識プログラムおよび骨格認識システム Download PDFInfo
- Publication number
- JP7164045B2 JP7164045B2 JP2021529879A JP2021529879A JP7164045B2 JP 7164045 B2 JP7164045 B2 JP 7164045B2 JP 2021529879 A JP2021529879 A JP 2021529879A JP 2021529879 A JP2021529879 A JP 2021529879A JP 7164045 B2 JP7164045 B2 JP 7164045B2
- Authority
- JP
- Japan
- Prior art keywords
- skeleton
- heat map
- image
- subject
- directions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/75—Determining position or orientation of objects or cameras using feature-based methods involving models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
図1は、実施例1にかかる認識装置を含むシステムの全体構成例を示す図である。図1に示すように、このシステムは、3Dレーザセンサ5、学習装置10、認識装置50、採点装置90を有し、被写体である演技者1の3次元データを撮像し、骨格等を認識して正確な技の採点を行うシステムである。なお、本実施例では、一例として、体操競技における演技者の骨格情報を認識する例で説明する。また、本実施例では、骨格位置の2次元座標や2次元座標の骨格位置を、単に2次元骨格位置などと記載する場合がある。
図3は、実施例1にかかる学習装置10と認識装置50の機能構成を示す機能ブロック図である。なお、採点装置90は、骨格情報を用いて、演技における技を認識し、演技者の演技を採点する装置である。
図3に示すように、学習装置10は、通信部11、記憶部12、制御部20を有する。通信部11は、他の装置との間の通信を制御する処理部であり、例えば通信インタフェースなどである。例えば、通信部11は、学習結果などを認識装置50に出力する。
図3に示すように、認識装置50は、通信部51、撮像部52、記憶部53、制御部60を有する。通信部51は、他の装置との間の通信を制御する処理部であり、例えば通信インタフェースなどである。例えば、通信部51は、学習装置10から学習済みの学習モデルを取得して記憶部53に保存し、演技者1の骨格情報を採点装置90に送信する。
次に、上述した学習装置10が実行する学習処理と、認識装置50が実行する認識処理のそれぞれについて説明する。
図9は、実施例1にかかる学習処理の流れを示すフローチャートである。図9に示すように、学習装置10のヒートマップ生成部21は、学習処理の開始が指示されると(S101:Yes)、学習データDB14から学習データを取得し(S102)、学習データ内の骨格情報を取得する(S103)。
図10は、実施例1にかかる認識処理の流れを示すフローチャートである。図10に示すように、認識装置50のヒートマップ認識部62は、事前に学習モデル54から学習済みの学習モデルを読み出して構築する(S201)。
上述したように、実施例1にかかるシステムでは、3Dレーザセンサ5から得られた距離画像から複数方向から見たヒートマップを取得できるため、ある方向から見たときに演技者1の体の一部が器具などに隠れていたとしても、各関節の3次元位置を認識することができる。つまり、骨格認識の精度を向上させることができる。さらに、距離画像からヒートマップを得るための学習モデルは、姿勢ごとに準備する必要がない。よって、どのような姿勢であっても、演技者1の3次元骨格を認識することができる。さらに、本実施例に係るシステムは、従来技術と比較して処理負荷が低いため、骨格認識結果を得るまでの処理速度を向上させることができる。したがって、骨格認識結果を利用した採点競技の自動採点システムや採点支援システムにおいて、自動採点の精度や、表示する3Dモデルの精度を向上させることができる。さらには、これらのシステムの処理時間を短縮することができる。
上記実施例では、体操競技を例にして説明したが、これに限定されるものではなく、選手が一連の技を行って審判が採点する他の競技にも適用することができる。他の競技の一例としては、フィギュアスケート、新体操、チアリーディング、水泳の飛び込み、空手の型、モーグルのエアーなどがある。また、スポーツに限らず、トラック、タクシー、電車などの運転手の姿勢検出やパイロットの姿勢検出などにも適用することができる。
また、上記実施例では、18個の各関節の位置を学習する例を説明したが、これに限定されるものではなく、1個以上の関節を指定して学習することもできる。また、上記実施例では、骨格情報の一例として各関節の位置を例示して説明したが、これに限定されるものではなく、各関節の角度、手足の向き、顔の向きなど、予め定義できる情報であれば、様々な情報を採用することができる。
上記実施例で用いた数値などがあくまで一例であり、実施例を限定するものではなく、任意に設定変更することができる。また、上記実施例では、2方向のヒートマップ画像を例示して説明したが、これに限定されるものではなく、3方向以上のヒートマップ画像を対象とすることもできる。
上記実施例では、基準視点のヒートマップ画像と、基準視点に対して任意の数値分平行移動、回転させた位置に仮定した仮想視点のヒートマップ画像とを使用して3次元の骨格位置を算出する例を説明したが、仮想視点の相対的な位置関係を示す情報であれば他の情報を用いることもでき、任意に設定した回転行列の値や平行移動を用いることができる。ここで、片方の仮想視点の座標系Aを基準に、もう一方の仮想視点の座標系Bを座標系Aと一致させるために必要な情報が、平行移動[X,Y,Z]と回転行列である。
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
次に、学習装置10や認識装置50などのコンピュータのハードウェア構成について説明する。図13は、ハードウェア構成例を説明する図である。図13に示すように、コンピュータ100は、通信装置100a、HDD(Hard Disk Drive)100b、メモリ100c、プロセッサ100dを有する。また、図13に示した各部は、バス等で相互に接続される。
10 学習装置
11 通信部
12 記憶部
13 骨格定義DB
14 学習データDB
15 学習モデル
20 制御部
21 ヒートマップ生成部
22 学習部
50 認識装置
51 通信部
52 撮像部
53 記憶部
54 学習モデル
55 算出結果DB
60 制御部
61 距離画像取得部
62 ヒートマップ認識部
63 2次元算出部
64 3次元算出部
65 重心算出部
66 奥行き値算出部
67 骨格算出部
Claims (9)
- コンピュータが、
被写体の距離画像から、前記被写体の複数の関節位置の尤度を複数方向から投影したヒートマップ画像を認識する学習モデルを取得し、
処理対象の距離画像を前記学習モデルに入力して、前記複数方向それぞれのヒートマップ画像を取得し、
前記複数方向それぞれのヒートマップ画像と前記複数方向の相対位置関係を示す情報とを用いて、前記被写体の前記複数の関節位置に関する3次元座標を算出し、
前記複数の関節位置に関する3次元座標を含む骨格認識結果を、出力する
処理を実行することを特徴とする骨格認識方法。 - 前記算出する処理において、前記ヒートマップ画像を用いて、前記複数方向それぞれから前記被写体を見た場合の前記被写体の関節位置の2次元座標を算出し、
前記複数方向それぞれについて算出された前記複数の関節それぞれの関節位置の2次元座標と、前記距離画像とに基づき、前記3次元座標を算出する、ことを特徴とする請求項1に記載の骨格認識方法。 - 前記学習モデルは、予め撮像された被写体の距離画像と、予め定義された既知である複数の関節の位置情報とを用いて、前記距離画像に対応する複数方向のヒートマップ画像を生成し、前記予め撮像された被写体の距離画像を説明変数、生成された前記複数方向のヒートマップ画像を目的変数とする訓練データを用いて、学習する処理によって生成されたことを特徴とする請求項1に記載の骨格認識方法。
- 前記複数方向は、前記被写体に対する正面方向と前記被写体に対する真上方向であることを特徴とする請求項2に記載の骨格認識方法。
- 前記2次元座標を算出する処理は、前記正面方向からみた第一のヒートマップ画像を用いて、前記被写体を正面方向から見たときの前記被写体の骨格位置の2次元座標である第1の骨格位置を算出し、前記真上方向からみた第二のヒートマップ画像を用いて、前記被写体を真上方向から見たときの前記被写体の骨格位置の2次元座標である第2の骨格位置を算出し、
前記3次元座標を算出する処理は、前記処理対象の距離画像から算出される前記被写体の重心と、前記第2の骨格位置とを用いて、関節数分の奥行き値を算出し、前記関節数分の奥行き値と、前記第1の骨格位置とを用いて、前記被写体の骨格位置の3次元座標を算出することを特徴とする請求項4に記載の骨格認識方法。 - 前記複数方向は、前記被写体に対する正面方向と、前記正面方向から横方向に移動した視差位置であることを特徴とする請求項2に記載の骨格認識方法。
- 前記2次元座標を算出する処理は、前記正面方向からみた第一のヒートマップ画像を用いて、前記被写体を正面方向から見たときの前記被写体の骨格位置の2次元座標である第1の骨格位置を算出し、前記視差位置からみた第二のヒートマップ画像を用いて、前記被写体を視差位置から見たときの前記被写体の骨格位置の2次元座標である第2の骨格位置を算出し、
前記3次元座標を算出する処理は、前記視差位置から撮像する際に予め定められた設定値を含む視差情報と、前記第1の骨格位置と、前記第2の骨格位置とを用いて、前記被写体の骨格位置の3次元座標を算出することを特徴とする請求項6に記載の骨格認識方法。 - コンピュータに、
被写体の距離画像から、前記被写体の複数の関節位置の尤度を複数方向から投影したヒートマップ画像を認識する学習モデルを取得し、
処理対象の距離画像を前記学習モデルに入力して、前記複数方向それぞれのヒートマップ画像を取得し、
前記複数方向それぞれのヒートマップ画像と前記複数方向の相対位置関係を示す情報とを用いて、前記被写体の前記複数の関節位置に関する3次元座標を算出し、
前記複数の関節位置に関する3次元座標を含む骨格認識結果を、出力する
処理を実行させることを特徴とする骨格認識プログラム。 - 学習装置と認識装置とを含む骨格認識システムにおいて、
前記学習装置は、
予め撮像された被写体の距離画像と、予め定義された複数の関節の位置情報とを用いて、前記被写体の複数の関節位置の尤度を複数方向から投影したヒートマップ画像を生成する生成部と、
前記予め撮像された被写体の距離画像を説明変数、生成された前記複数方向のヒートマップ画像を目的変数とする訓練データを用いて、前記複数方向それぞれのヒートマップ画像を認識する学習モデルを学習する学習部と、を有し、
前記認識装置は、
前記学習モデルを取得する取得部と、
処理対象の距離画像を前記学習モデルに入力して、前記複数方向それぞれのヒートマップ画像を取得する取得部と、
前記複数方向それぞれのヒートマップ画像と前記複数方向の相対位置関係を示す情報とを用いて、前記被写体の前記複数の関節の位置に関する3次元座標を算出する算出部と、
前記複数の関節の位置に関する3次元座標を含む骨格認識結果を、出力する出力部と、を有する
ことを特徴とする骨格認識システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/026746 WO2021002025A1 (ja) | 2019-07-04 | 2019-07-04 | 骨格認識方法、骨格認識プログラム、骨格認識システム、学習方法、学習プログラムおよび学習装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021002025A1 JPWO2021002025A1 (ja) | 2021-01-07 |
JPWO2021002025A5 JPWO2021002025A5 (ja) | 2022-02-03 |
JP7164045B2 true JP7164045B2 (ja) | 2022-11-01 |
Family
ID=74101206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021529879A Active JP7164045B2 (ja) | 2019-07-04 | 2019-07-04 | 骨格認識方法、骨格認識プログラムおよび骨格認識システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220092302A1 (ja) |
JP (1) | JP7164045B2 (ja) |
WO (1) | WO2021002025A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112975993B (zh) * | 2021-02-22 | 2022-11-25 | 北京国腾联信科技有限公司 | 一种机器人示教方法、装置、存储介质和设备 |
US20240202933A1 (en) * | 2021-05-19 | 2024-06-20 | Nippon Telegraph And Telephone Corporation | Learning apparatus, estimation apparatus, learning model data generation method, estimation method and program |
KR20220169005A (ko) * | 2021-06-14 | 2022-12-26 | 주식회사 히타치하이테크 | 컴퓨터 시스템, 치수 계측 방법, 및 기억 매체 |
CN114066986B (zh) * | 2022-01-11 | 2022-04-19 | 南昌虚拟现实研究院股份有限公司 | 三维坐标的确定方法、装置、电子设备及存储介质 |
CN115330753B (zh) * | 2022-10-10 | 2022-12-20 | 博志生物科技(深圳)有限公司 | 椎骨识别方法、装置、设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6589144B2 (ja) * | 2014-10-30 | 2019-10-16 | パナソニックIpマネジメント株式会社 | 姿勢推定方法および姿勢推定装置 |
JP6923789B2 (ja) * | 2017-07-05 | 2021-08-25 | 富士通株式会社 | 情報処理プログラム、情報処理装置、情報処理方法、及び情報処理システム |
-
2019
- 2019-07-04 WO PCT/JP2019/026746 patent/WO2021002025A1/ja active Application Filing
- 2019-07-04 JP JP2021529879A patent/JP7164045B2/ja active Active
-
2021
- 2021-12-05 US US17/542,425 patent/US20220092302A1/en not_active Abandoned
Non-Patent Citations (1)
Title |
---|
Adrian Bulat and Georgios Tzimiropoulos,Human pose estimation via Convolutional Part Heatmap Regression,[online],2016年09月06日,https://arxiv.org/abs/1609.01743 |
Also Published As
Publication number | Publication date |
---|---|
US20220092302A1 (en) | 2022-03-24 |
JPWO2021002025A1 (ja) | 2021-01-07 |
WO2021002025A1 (ja) | 2021-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7164045B2 (ja) | 骨格認識方法、骨格認識プログラムおよび骨格認識システム | |
JP7367764B2 (ja) | 骨格認識方法、骨格認識プログラムおよび情報処理装置 | |
EP4002198A1 (en) | Posture acquisition method and device, and key point coordinate positioning model training method and device | |
WO2020054442A1 (ja) | 関節位置の取得方法及び装置、動作の取得方法及び装置 | |
US11948376B2 (en) | Method, system, and device of generating a reduced-size volumetric dataset | |
US8737767B2 (en) | Perceptually guided capture and stylization of 3D human figures | |
CN102609954B (zh) | 对人类目标跟踪的确认分析 | |
EP3605470A1 (en) | Generating device, generating method, and program | |
US20110292036A1 (en) | Depth sensor with application interface | |
CN109176512A (zh) | 一种体感控制机器人的方法、机器人及控制装置 | |
US11490062B2 (en) | Information processing apparatus, information processing method, and storage medium | |
KR102450931B1 (ko) | 이미지 정합 방법 및 연관된 모델 훈련 방법, 기기, 장치 | |
CN113449570A (zh) | 图像处理方法和装置 | |
JP2003061936A (ja) | 動立体モデル生成装置及び方法 | |
WO2020145224A1 (ja) | 映像処理装置、映像処理方法、及び映像処理プログラム | |
JP7318814B2 (ja) | データ生成方法、データ生成プログラムおよび情報処理装置 | |
CN115994944A (zh) | 三维关键点预测方法、训练方法及相关设备 | |
Zhang et al. | Kinect-based Universal Range Sensor and its Application in Educational Laboratories. | |
Chang et al. | Using line consistency to estimate 3D indoor Manhattan scene layout from a single image | |
JP7500333B2 (ja) | 生成装置、生成方法、およびプログラム | |
JP2019197278A (ja) | 画像処理装置、画像処理装置の制御方法およびプログラム | |
JP7272470B2 (ja) | 運動認識方法、運動認識プログラムおよび情報処理装置 | |
Schacter | Multi-camera active-vision system reconfiguration for deformable object motion capture | |
JP2023011218A (ja) | マップ情報生成装置、位置特定装置、マップ情報生成方法、位置特定方法、プログラム及び記録媒体 | |
CN116958350A (zh) | 一种三维点云骨骼运动模拟方法、介质及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211102 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7164045 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |