JP7235826B2 - 人体の方向を検出する検出装置、および、人体の方向を検出する検出方法 - Google Patents
人体の方向を検出する検出装置、および、人体の方向を検出する検出方法 Download PDFInfo
- Publication number
- JP7235826B2 JP7235826B2 JP2021170311A JP2021170311A JP7235826B2 JP 7235826 B2 JP7235826 B2 JP 7235826B2 JP 2021170311 A JP2021170311 A JP 2021170311A JP 2021170311 A JP2021170311 A JP 2021170311A JP 7235826 B2 JP7235826 B2 JP 7235826B2
- Authority
- JP
- Japan
- Prior art keywords
- human body
- orientation
- probability
- image
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 41
- 238000013527 convolutional neural network Methods 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 17
- 230000003190 augmentative effect Effects 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 18
- 101150071665 img2 gene Proteins 0.000 description 15
- 101150013335 img1 gene Proteins 0.000 description 10
- 238000007477 logistic regression Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Indicating Or Recording The Presence, Absence, Or Direction Of Movement (AREA)
- Geophysics And Detection Of Objects (AREA)
- Burglar Alarm Systems (AREA)
Description
10 カメラ
20 処理装置
30 ストレージデバイス
40 ディスプレイ
USR ユーザー
300 人体の方向を検出する検出方法
305~325、310~340 工程
IMG0 初期イメージ
USR’ ユーザーイメージ
IMG1、IMG3、IMG4 人体イメージ
IMG2 入力イメージ
FCL 全結合層
A 左肩の実際の特徴点
B 襟(胸)の実際の特徴点
C 右肩の実際の特徴点
A’左肩特徴点
B’胸特徴点
C’右肩特徴点
L1 第一直線
L2 第二直線
α 挟み角
0 円中心
Claims (5)
- 人体の方向を検出する検出方法であって、
カメラを用いて、人体イメージを捕捉する工程と、
前記人体イメージ中の人頭の輪郭イメージを切り取って、入力イメージを得るとともに、前記入力イメージを分類器に入力し、前記分類器が、前記入力イメージの複数の人体方向確率を出力する工程と、
最大の人体方向確率を見つけるとともに、前記最大の人体方向確率が、正確なスレショルドより大きいか否か判断する工程、および、
前記最大の人体方向確率が、前記正確なスレショルドより大きいとき、前記最大の人体方向確率に対応する前記人体の方向が、判断された人体の方向であると見なす工程、を有し、
前記分類器は、前記入力イメージの複数の骨格特徴点を出力し、
前記最大の人体方向確率が、前記正確なスレショルドより小さいとき、前記骨格特徴点により判断された前記人体の方向を、前記判断された人体の方向であると見なすことを特徴とする人体の方向を検出する検出方法。 - 前記分類器は、畳み込みニューラルネットワーク (CNN)により実行され、
前記畳み込みニューラルネットワークが、訓練段階で、前記入力イメージを受信した後、前記畳み込みニューラルネットワークは、全結合層で、前記人体方向確率、および、骨格特徴点を出力し、前記最大の人体方向確率、および、実際の方向データに対応する前記人体の方向で、回帰損失を計算するとともに、前記骨格特徴点、および、複数の実際の特徴点位置データで、ユークリッド距離損失を計算し、その後、前記回帰損失と前記ユークリッド距離損失を加算して、全損を得るとともに、誤差逆伝搬方法を用いて、前記畳み込みニューラルネットワークのパラメータを調整して、前記畳み込みニューラルネットワークを再訓練して、各訓練後、前記計算された全損が小さくなり、
前記人体方向確率は、前記畳み込みニューラルネットワークにより出力される複数の特徴ベクトルに対応することを特徴とする請求項1に記載の人体の方向を検出する検出方法。 - 前記人体方向確率は、それぞれ、人体の正面の確率、人体の左側の確率、人体の右側の確率、および、人体の背面の確率であり、前記骨格特徴点はさらに、左肩特徴点座標、右肩特徴点座標、および、胸特徴点座標を有し、
前記左肩特徴点座標と前記右肩特徴点座標間の間で第一直線を接続し、前記第一直線の中間点を円中心と見なし、
前記胸特徴点座標と前記円中心を接続して、第二直線を形成し、
前記第二直線と前記第一直線の間の挟角の角度を計算し、および
角度スレショルドより小さい前記挟角の第一挟角を選択して、前記判断された人体の方向を判断し、
前記角度スレショルドは、90度より小さく、且つ、0度より大きい一角度であり、前記第一挟角が90度に等しいとき、これは、前記判断された人体の方向が、前記人体の正面であることを意味し、
前記第一挟角が、前記角度スレショルド以下で、および、前記第一挟角が、前記第一直線の前記左側にあるとき、前記判断された人体の方向は、左側身体であり、
前記第一挟角が、前記角度スレショルド以下で、且つ、前記第一挟角が、前記第一直線の前記右側に位置するとき、前記判断された人体の方向は、右側身体であり、および、
前記第一挟角が全て、前記角度スレショルドより大きいとき、前記判断された人体の方向は、前記人体の正面であり、
前記人体イメージ中の前記人頭の輪郭イメージに、人の顔があるか否か判断し、
処理装置が、前記人体イメージ中の前記人頭の輪郭イメージに、顔がないと判断するとき、前記判断された人体の方向は、前記人体の前記背面であることを特徴とする請求項1に記載の人体の方向を検出する検出方法。 - さらに、
前記判断された人体の方向を統計(counting)して、使用習慣情報を得る工程と、
前記判断された人体の方向を、拡張現実モジュールに送信する工程と、
前記判断された人体の方向にしたがって、前記拡張現実モジュールにより、前記人体イメージとバーチャル製品を結合して、結合イメージを生成する工程、および、
ディスプレイモジュールにより、ディスプレイ上で、前記結合イメージを表示する工程、
を有することを特徴とする請求項1に記載の人体の方向を検出する検出方法。 - 人体の方向を検出する検出装置であって、
人体イメージを捕捉するカメラ、および
前記人体イメージ中の人頭の輪郭イメージを切り取って、入力イメージを得るとともに、前記入力イメージを分類器に入力し、前記分類器が、前記入力イメージの複数の人体方向確率を出力する処理装置、を有し、
前記処理装置は、最大の人体方向確率を見つけるとともに、前記最大の人体方向確率が、正確なスレショルドより大きいか否か判断し、
前記最大の人体方向確率が、前記正確なスレショルドより大きいとき、前記処理装置は、前記最大の人体方向確率に対応する前記人体の方向を、判断された人体の方向であると見なし、
前記分類器は、前記入力イメージの複数の骨格特徴点を出力し、
前記最大の人体方向確率が、前記正確なスレショルドより小さいとき、前記骨格特徴点により判断された前記人体の方向を、前記判断された人体の方向であると見なすことを特徴とする人体の方向を検出する検出装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110115222 | 2021-04-28 | ||
TW110115222A TWI768852B (zh) | 2021-04-28 | 2021-04-28 | 人體方向之偵測裝置及人體方向之偵測方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022170649A JP2022170649A (ja) | 2022-11-10 |
JP7235826B2 true JP7235826B2 (ja) | 2023-03-08 |
Family
ID=83103988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021170311A Active JP7235826B2 (ja) | 2021-04-28 | 2021-10-18 | 人体の方向を検出する検出装置、および、人体の方向を検出する検出方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11816860B2 (ja) |
JP (1) | JP7235826B2 (ja) |
CN (1) | CN115249365A (ja) |
TW (1) | TWI768852B (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115862074B (zh) * | 2023-02-28 | 2023-05-30 | 科大讯飞股份有限公司 | 人体指向确定、屏幕控制方法、装置及相关设备 |
CN117115862A (zh) * | 2023-10-23 | 2023-11-24 | 四川泓宝润业工程技术有限公司 | 一种基于深度学习的多个人体的跌倒检测方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202653A (ja) | 2004-01-15 | 2005-07-28 | Canon Inc | 動作認識装置及び方法、動物体認識装置及び方法、機器制御装置及び方法、並びにプログラム |
JP2006304331A (ja) | 2006-05-25 | 2006-11-02 | Sony Corp | 試着画像生成装置及び試着画像生成方法、試着画像利用端末及び試着画像利用方法、並びにコンピュータ・プログラム |
JP2016001447A (ja) | 2014-06-12 | 2016-01-07 | キヤノン株式会社 | 画像認識システム、画像認識装置、画像認識方法、およびコンピュータプログラム |
JP2017016512A (ja) | 2015-07-03 | 2017-01-19 | パナソニックIpマネジメント株式会社 | 判定装置、判定方法、および判定プログラム |
WO2020065790A1 (ja) | 2018-09-26 | 2020-04-02 | 日本電気株式会社 | 推定装置、推定方法、および記憶媒体 |
WO2020110857A1 (ja) | 2018-11-26 | 2020-06-04 | 住友電気工業株式会社 | 交通情報処理サーバ、交通情報の処理方法、及びコンピュータプログラム |
CN112164091A (zh) | 2020-08-25 | 2021-01-01 | 南京邮电大学 | 基于三维骨架提取的移动设备人体位姿估计方法 |
CN112258275A (zh) | 2020-10-22 | 2021-01-22 | 郝凌宇 | 远程可视化服装设计定制方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102009025077A1 (de) * | 2009-06-10 | 2010-12-16 | Karl Storz Gmbh & Co. Kg | System zur Orientierungsunterstützung und Darstellung eines Instruments im Inneren eines Untersuchungsobjektes insbesondere im menschlichen Körper |
TWM537277U (zh) * | 2016-09-26 | 2017-02-21 | Hungkuang Univ | 嬰兒照護資訊系統 |
US10885708B2 (en) * | 2018-10-16 | 2021-01-05 | Disney Enterprises, Inc. | Automated costume augmentation using shape estimation |
US11847730B2 (en) * | 2020-01-24 | 2023-12-19 | Covidien Lp | Orientation detection in fluoroscopic images |
US11482041B2 (en) * | 2020-10-21 | 2022-10-25 | Adobe Inc. | Identity obfuscation in images utilizing synthesized faces |
-
2021
- 2021-04-28 TW TW110115222A patent/TWI768852B/zh active
- 2021-06-02 CN CN202110613296.4A patent/CN115249365A/zh active Pending
- 2021-07-12 US US17/373,681 patent/US11816860B2/en active Active
- 2021-10-18 JP JP2021170311A patent/JP7235826B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202653A (ja) | 2004-01-15 | 2005-07-28 | Canon Inc | 動作認識装置及び方法、動物体認識装置及び方法、機器制御装置及び方法、並びにプログラム |
JP2006304331A (ja) | 2006-05-25 | 2006-11-02 | Sony Corp | 試着画像生成装置及び試着画像生成方法、試着画像利用端末及び試着画像利用方法、並びにコンピュータ・プログラム |
JP2016001447A (ja) | 2014-06-12 | 2016-01-07 | キヤノン株式会社 | 画像認識システム、画像認識装置、画像認識方法、およびコンピュータプログラム |
JP2017016512A (ja) | 2015-07-03 | 2017-01-19 | パナソニックIpマネジメント株式会社 | 判定装置、判定方法、および判定プログラム |
WO2020065790A1 (ja) | 2018-09-26 | 2020-04-02 | 日本電気株式会社 | 推定装置、推定方法、および記憶媒体 |
WO2020110857A1 (ja) | 2018-11-26 | 2020-06-04 | 住友電気工業株式会社 | 交通情報処理サーバ、交通情報の処理方法、及びコンピュータプログラム |
CN112164091A (zh) | 2020-08-25 | 2021-01-01 | 南京邮电大学 | 基于三维骨架提取的移动设备人体位姿估计方法 |
CN112258275A (zh) | 2020-10-22 | 2021-01-22 | 郝凌宇 | 远程可视化服装设计定制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115249365A (zh) | 2022-10-28 |
US11816860B2 (en) | 2023-11-14 |
US20220351408A1 (en) | 2022-11-03 |
TWI768852B (zh) | 2022-06-21 |
TW202242797A (zh) | 2022-11-01 |
JP2022170649A (ja) | 2022-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10546417B2 (en) | Method and apparatus for estimating body shape | |
US10470510B1 (en) | Systems and methods for full body measurements extraction using multiple deep learning networks for body feature measurements | |
Jegham et al. | Vision-based human action recognition: An overview and real world challenges | |
US10621779B1 (en) | Artificial intelligence based generation and analysis of 3D models | |
JP7342919B2 (ja) | 情報処理システム、制御方法、及びプログラム | |
US9372546B2 (en) | Hand pointing estimation for human computer interaction | |
JP7235826B2 (ja) | 人体の方向を検出する検出装置、および、人体の方向を検出する検出方法 | |
JP4830650B2 (ja) | 追跡装置 | |
US20100086213A1 (en) | Image recognition apparatus and image recognition method | |
WO2017141344A1 (ja) | 3次元モデル生成システム、3次元モデル生成方法、及びプログラム | |
EP2339507B1 (en) | Head detection and localisation method | |
Yi et al. | Egolocate: Real-time motion capture, localization, and mapping with sparse body-mounted sensors | |
Papadopoulos et al. | Human action recognition using 3d reconstruction data | |
Tsalakanidou et al. | A 3D face and hand biometric system for robust user-friendly authentication | |
WO2022009301A1 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
KR20200113743A (ko) | 인체 자세 추정 및 보정을 하는 방법 및 장치 | |
Shadrach et al. | Smart virtual trial room for apparel industry | |
JP2005351814A (ja) | 検出装置および検出方法 | |
CN116246343A (zh) | 轻量化的人体行为识别方法及装置 | |
CN114219578A (zh) | 无人服装售卖方法、装置、终端及存储介质 | |
Pham et al. | Hand detection and segmentation using multimodal information from Kinect | |
KR101844367B1 (ko) | 부분 포즈 추정에 의하여 개략적인 전체 초기설정을 사용하는 머리 포즈 추정 방법 및 장치 | |
CN114641794A (zh) | 图像处理装置、图像处理方法以及存储图像处理程序的非暂时性计算机可读介质 | |
JP7374401B1 (ja) | 人物相関判定装置、人物相関判定方法および人物相関判定プログラム | |
JP7103443B2 (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7235826 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |