JP6877072B1 - 領域抽出装置、領域抽出方法、及び領域抽出プログラム - Google Patents
領域抽出装置、領域抽出方法、及び領域抽出プログラム Download PDFInfo
- Publication number
- JP6877072B1 JP6877072B1 JP2021515668A JP2021515668A JP6877072B1 JP 6877072 B1 JP6877072 B1 JP 6877072B1 JP 2021515668 A JP2021515668 A JP 2021515668A JP 2021515668 A JP2021515668 A JP 2021515668A JP 6877072 B1 JP6877072 B1 JP 6877072B1
- Authority
- JP
- Japan
- Prior art keywords
- region
- frame image
- motion information
- acquired
- hand
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 121
- 210000000707 wrist Anatomy 0.000 claims abstract description 36
- 239000000284 extract Substances 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims description 30
- 238000001514 detection method Methods 0.000 claims description 21
- 230000003287 optical effect Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 description 57
- 210000003811 finger Anatomy 0.000 description 24
- 238000000034 method Methods 0.000 description 22
- 238000003384 imaging method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 210000004932 little finger Anatomy 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011410 subtraction method Methods 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 235000013361 beverage Nutrition 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000001145 finger joint Anatomy 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000004247 hand Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/955—Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/62—Extraction of image or video features relating to a temporal dimension, e.g. time-based feature extraction; Pattern tracking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
Abstract
Description
先ず、画像処理装置1の構成について、図1を用いて説明する。図1は、本実施形態に係る画像処理装置1の概要構成の一例を示すブロック図である。図1に示すように、画像処理装置1は、システム制御部11と、システムバス12と、入出力インターフェース13と、記憶部14と、通信部15と、入力部16と、表示部17と、GPU(Graphics Processing Unit)18と、GPUメモリ19(または、ビデオRAM)と、撮像部20と、を備えている。システム制御部11と入出力インターフェース13とは、システムバス12を介して接続されている。画像処理装置1の例として、サーバ装置、パーソナルコンピュータ等が挙げられる。
次に、図2乃至図6を用いて、システム制御部11及びGPU18の機能概要について説明する。図2は、本実施形態に係る画像処理装置1のシステム制御部11及びGPU18の機能ブロックの一例を示す図である。システム制御部11及びGPU18は、CPU11aが、記憶部14に記憶されているプログラムに含まれる各種コード等を読み出し実行することにより、図2に示すように、フレーム取得部111、動き情報取得部112、関節検出部113、領域抽出部114、訓練部115、オブジェクト情報出力部116等として機能する。
次に、画像処理装置1の動作について、図7及び図8を用いて説明する。図7は、画像処理装置1のシステム制御部11及びGPU18による学習処理の一例を示すフローチャートである。モデル生成用のプログラムに含まれるプログラムコードに従って、システム制御部11及びGPU18は学習処理を実行する。例えば、入力部16を用いたオペレータからの指示に応じて、学習処理が実行されてもよい。
11 システム制御部
12 システムバス
13 入出力インターフェース
14 記憶部
15 通信部
16 入力部
17 表示部
18 GPU
19 GPUメモリ
20 撮像部
111 フレーム取得部
112 動き情報取得部
113 関節検出部
114 領域抽出部
115 訓練部
116 オブジェクト情報出力部
2 モデル
Claims (11)
- 時間的に連続する第1フレーム画像及び第2フレーム画像を取得するフレーム画像取得手段と、
前記取得された第1フレーム画像及び第2フレーム画像に基づいて、前記第1フレーム画像内で動きのある領域を示す動き情報を取得する動き情報取得手段と、
前記取得された第1フレーム画像に基づいて、前記取得された動き情報により示される前記動きのある領域から、人体の肘及び手首の位置を検出する検出手段と、
前記検出された位置に基づいて、前記取得された動き情報により示される前記動きのある領域のうち、前記手首から前記人体の手側の部分に対応する領域を抽出する抽出手段と、
を備えることを特徴とする領域抽出装置。 - 前記抽出手段は、前記手側の部分の色と、所定の肌色と、の比較の結果に基づいて、前記手側の部分に対応する前記領域の抽出を制御することを特徴とする請求項1に記載の領域抽出装置。
- 前記抽出手段は、前記手側の部分の色と前記肌色との差が所定程度を超える場合に、前記手側の部分に対応する前記領域を抽出することを特徴とする請求項2に記載の領域抽出装置。
- 前記検出手段は、前記動きのある領域から、前記人体の指の関節及び指先の位置を更に検出し、
前記抽出手段は、前記指の関節及び指先の位置に基づいて、前記抽出される領域を修正することを特徴とする請求項1乃至3の何れか一項に記載の領域抽出装置。 - 前記抽出手段は、前記指の関節から前記指先への方向に従って、前記抽出される領域を広げることを特徴とする請求項4に記載の領域抽出装置。
- 前記検出手段は、所定の姿勢推定モデルを用いて、前記肘及び前記手首の位置を検出することを特徴とする請求項1乃至5の何れか一項に記載の領域抽出装置。
- 前記抽出された領域の画像を用いて、画像内のオブジェクトを識別するためのモデルを訓練する訓練手段を更に備えることを特徴とする請求項1乃至6の何れか一項に記載の領域抽出装置。
- 前記抽出された領域の画像を、所定のモデルに入力することにより、前記抽出された領域に存在するオブジェクトを示すオブジェクト情報を出力する出力手段を更に備えることを特徴とする請求項1乃至7の何れか一項に記載の領域抽出装置。
- 前記取得される動き情報は、デンスオプティカルフローであることを特徴とする請求項1乃至8の何れか一項に記載の領域抽出装置。
- コンピュータにより実行される領域抽出方法において、
時間的に連続する第1フレーム画像及び第2フレーム画像を取得するフレーム画像取得ステップと、
前記取得された第1フレーム画像及び第2フレーム画像に基づいて、前記第1フレーム画像内で動きのある領域を示す動き情報を取得する動き情報取得ステップと、
前記取得された第1フレーム画像に基づいて、前記取得された動き情報により示される前記動きのある領域から、人体の肘及び手首の位置を検出する検出ステップと、
前記検出された位置に基づいて、前記取得された動き情報により示される前記動きのある領域のうち、前記手首から前記人体の手側の部分に対応する領域を抽出する抽出ステップと、
を備えることを特徴とする領域抽出方法。 - コンピュータを、
時間的に連続する第1フレーム画像及び第2フレーム画像を取得するフレーム画像取得手段と、
前記取得された第1フレーム画像及び第2フレーム画像に基づいて、前記第1フレーム画像内で動きのある領域を示す動き情報を取得する動き情報取得手段と、
前記取得された第1フレーム画像に基づいて、前記取得された動き情報により示される前記動きのある領域から、人体の肘及び手首の位置を検出する検出手段と、
前記検出された位置に基づいて、前記取得された動き情報により示される前記動きのある領域のうち、前記手首から前記人体の手側の部分に対応する領域を抽出する抽出手段と、
として機能させることを特徴とする領域抽出プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/026550 WO2022009305A1 (ja) | 2020-07-07 | 2020-07-07 | 領域抽出装置、領域抽出方法、及び領域抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6877072B1 true JP6877072B1 (ja) | 2021-05-26 |
JPWO2022009305A1 JPWO2022009305A1 (ja) | 2022-01-13 |
Family
ID=75961505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021515668A Active JP6877072B1 (ja) | 2020-07-07 | 2020-07-07 | 領域抽出装置、領域抽出方法、及び領域抽出プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11881045B2 (ja) |
EP (1) | EP3958212A4 (ja) |
JP (1) | JP6877072B1 (ja) |
CN (1) | CN114158281A (ja) |
WO (1) | WO2022009305A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018042751A1 (ja) * | 2016-09-01 | 2018-03-08 | 三菱電機株式会社 | ジェスチャー判定装置、ジェスチャー操作装置、及びジェスチャー判定方法 |
WO2018235198A1 (ja) * | 2017-06-21 | 2018-12-27 | 日本電気株式会社 | 情報処理装置、制御方法、及びプログラム |
JP2019133232A (ja) * | 2018-01-29 | 2019-08-08 | 大黒天物産株式会社 | 商品管理サーバ、自動レジシステム、商品管理プログラムおよび商品管理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4332649B2 (ja) * | 1999-06-08 | 2009-09-16 | 独立行政法人情報通信研究機構 | 手の形状と姿勢の認識装置および手の形状と姿勢の認識方法並びに当該方法を実施するプログラムを記録した記録媒体 |
JP2016201105A (ja) | 2015-04-07 | 2016-12-01 | 三菱電機株式会社 | 情報処理装置及び情報処理方法 |
JP6562752B2 (ja) * | 2015-07-30 | 2019-08-21 | キヤノン株式会社 | 情報処理装置とその制御方法、プログラム、記憶媒体 |
-
2020
- 2020-07-07 JP JP2021515668A patent/JP6877072B1/ja active Active
- 2020-07-07 CN CN202080006866.7A patent/CN114158281A/zh active Pending
- 2020-07-07 WO PCT/JP2020/026550 patent/WO2022009305A1/ja unknown
- 2020-07-07 EP EP20897622.5A patent/EP3958212A4/en active Pending
- 2020-07-07 US US17/311,409 patent/US11881045B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018042751A1 (ja) * | 2016-09-01 | 2018-03-08 | 三菱電機株式会社 | ジェスチャー判定装置、ジェスチャー操作装置、及びジェスチャー判定方法 |
WO2018235198A1 (ja) * | 2017-06-21 | 2018-12-27 | 日本電気株式会社 | 情報処理装置、制御方法、及びプログラム |
JP2019133232A (ja) * | 2018-01-29 | 2019-08-08 | 大黒天物産株式会社 | 商品管理サーバ、自動レジシステム、商品管理プログラムおよび商品管理方法 |
Also Published As
Publication number | Publication date |
---|---|
US11881045B2 (en) | 2024-01-23 |
US20220189194A1 (en) | 2022-06-16 |
CN114158281A (zh) | 2022-03-08 |
EP3958212A1 (en) | 2022-02-23 |
WO2022009305A1 (ja) | 2022-01-13 |
JPWO2022009305A1 (ja) | 2022-01-13 |
EP3958212A4 (en) | 2022-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | A novel finger and hand pose estimation technique for real-time hand gesture recognition | |
Hasan et al. | RETRACTED ARTICLE: Static hand gesture recognition using neural networks | |
Yao et al. | Contour model-based hand-gesture recognition using the Kinect sensor | |
Kulshreshth et al. | Poster: Real-time markerless kinect based finger tracking and hand gesture recognition for HCI | |
JP2011253292A (ja) | 情報処理装置および方法、並びにプログラム | |
KR20110003146A (ko) | 제스쳐 인식 장치, 이를 구비한 로봇 시스템 및 이를 이용한 제스쳐 인식 방법 | |
JP6066093B2 (ja) | 手指形状推定装置、手指形状推定方法、及び手指形状推定プログラム | |
CN112088348A (zh) | 经由头部姿态远程控制显示设备的方法、系统和计算机程序 | |
JP2000331170A (ja) | 手振り認識装置 | |
Shin et al. | Vision-based multimodal human computer interface based on parallel tracking of eye and hand motion | |
CN110910426A (zh) | 动作过程和动作趋势识别方法、存储介质和电子装置 | |
JP2005351814A (ja) | 検出装置および検出方法 | |
JP2000149025A (ja) | ジェスチャ認識装置及び方法 | |
JP6877072B1 (ja) | 領域抽出装置、領域抽出方法、及び領域抽出プログラム | |
Roy et al. | Real time hand gesture based user friendly human computer interaction system | |
Chaudhary et al. | An ANN based Approach to Calculate Robotic fingers positions | |
Shah et al. | Gesture recognition technique: a review | |
Siam et al. | Human computer interaction using marker based hand gesture recognition | |
Yu et al. | Real time fingertip detection with kinect depth image sequences | |
Bellarbi et al. | Hand gesture recognition using contour based method for tabletop surfaces | |
Ghosh et al. | Real-time 3d markerless multiple hand detection and tracking for human computer interaction applications | |
JP2832333B2 (ja) | 物体の形状・姿勢検出装置 | |
De Beugher et al. | Semi-automatic hand annotation making human-human interaction analysis fast and accurate | |
US11922667B2 (en) | Object region identification device, object region identification method, and object region identification program | |
CN113379930B (zh) | 通过人体曲线图进行的沉浸式交互方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210319 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210319 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210319 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20210413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210420 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210423 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6877072 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |