JP7483060B2 - 手検出装置、ジェスチャー認識装置および手検出方法 - Google Patents
手検出装置、ジェスチャー認識装置および手検出方法 Download PDFInfo
- Publication number
- JP7483060B2 JP7483060B2 JP2022576293A JP2022576293A JP7483060B2 JP 7483060 B2 JP7483060 B2 JP 7483060B2 JP 2022576293 A JP2022576293 A JP 2022576293A JP 2022576293 A JP2022576293 A JP 2022576293A JP 7483060 B2 JP7483060 B2 JP 7483060B2
- Authority
- JP
- Japan
- Prior art keywords
- hand
- hand detection
- detection
- detected
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 261
- 238000009966 trimming Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000007257 malfunction Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/60—Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/59—Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/59—Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
- G06V20/597—Recognising the driver's state or behaviour, e.g. attention or drowsiness
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Social Psychology (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Psychiatry (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Description
図1は、実施の形態1に係るジェスチャー認識装置1の構成を示す図である。実施の形態1では、ジェスチャー認識装置1は車両に搭載されているものと仮定する。ただし、ジェスチャー認識装置1は、車両に常設されなくてもよく、例えば、携帯電話やスマートフォンのなど車両に持ち込み可能な携帯型の装置上に構築されていてもよい。また、ジェスチャー認識装置1の機能の一部が、車両外に設置されジェスチャー認識装置1との通信が可能なサーバー上に構築されていてもよい。
実施の形態1では、手検出用映像のフレーム間の輝度差分として、手検出用映像の平均輝度のフレーム間の差分を用いた。実施の形態2では、手検出用映像のフレーム間の輝度差分として、手検出用映像のHOG(Histograms of Oriented Gradients)特徴量のフレーム間の差分を用いる例を示す。HOG特徴量とは、映像を複数のブロックに分割し、各ブロックにおける輝度の勾配方向をヒストグラム化した特徴量である。
実施の形態3では、実施の形態1と実施の形態2とを組み合わせた例を示す。実施の形態3の手検出装置10およびジェスチャー認識装置1の構成は、図1と同様であり、その動作は図4と同様である。
図8および図9は、それぞれ手検出装置10のハードウェア構成の例を示す図である。図1に示した手検出装置10の構成要素の各機能は、例えば図8に示す処理回路50により実現される。すなわち、手検出装置10は、車両内の手検出用領域を撮影した映像である手検出用映像を取得し、手検出用映像のフレーム間の輝度差分を算出し、手検出用映像からユーザの手を検出し、手検出用映像の手が検出されたフレームとその直前フレームとの輝度差分に基づいて、検出された手が誤検出されたものか否かを判定するための処理回路50を備える。処理回路50は、専用のハードウェアであってもよいし、メモリに格納されたプログラムを実行するプロセッサ(中央処理装置(CPU:Central Processing Unit)、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、DSP(Digital Signal Processor)とも呼ばれる)を用いて構成されていてもよい。
Claims (10)
- 車両内の手検出用領域を撮影した映像である手検出用映像を取得する映像取得部と、
前記手検出用映像のフレーム間の輝度差分を算出する輝度差分算出部と、
前記手検出用映像からユーザの手を検出する手検出部と、
前記手検出用映像の前記手が検出されたフレームとその直前フレームとの前記輝度差分に基づいて、検出された前記手が誤検出されたものか否かを判定する誤検出判定部と、
を備え、
前記輝度差分算出部は、前記輝度差分として、前記手検出用映像の平均輝度のフレーム間の差分を算出し、
前記誤検出判定部は、前記手検出用映像の前記手が検出されたフレームとその直前フレームとの前記平均輝度の差分が予め定められた閾値以下の場合に、前記手が誤検出されたと判定する、
手検出装置。 - 車両内の手検出用領域を撮影した映像である手検出用映像を取得する映像取得部と、
前記手検出用映像のフレーム間の輝度差分を算出する輝度差分算出部と、
前記手検出用映像からユーザの手を検出する手検出部と、
前記手検出用映像の前記手が検出されたフレームとその直前フレームとの前記輝度差分に基づいて、検出された前記手が誤検出されたものか否かを判定する誤検出判定部と、
を備え、
前記輝度差分算出部は、前記手検出用映像を複数のブロックに分割し、前記輝度差分として、各ブロックのHOG(Histograms of Oriented Gradients)特徴量のフレーム間の差分を算出し、
前記誤検出判定部は、前記手検出用映像の前記手が検出されたフレームとその直前フレームとの前記HOG特徴量の差分が予め定められた閾値を超える前記ブロックの個数が一定個数以下の場合に、前記手が誤検出されたと判定する、
手検出装置。 - 前記手検出用映像は、前記車両に搭載されたカメラが撮影した映像から前記手検出用領域に対応する部分をトリミングした映像である、
請求項1または請求項2に記載の手検出装置。 - 前記手検出用領域は、前記車両の運転席と助手席との間の領域である、
請求項1または請求項2に記載の手検出装置。 - 前記誤検出判定部は、前記手が誤検出されたと判定しなかった場合には前記手が正常に検出されたと判定し、前記手が正常に検出されたと判定した後は、直前フレームとの前記HOG特徴量の差分が前記閾値を超える前記ブロックの個数が前記一定個数以下のフレームが予め定められた回数連続するまで、前記手検出用映像から検出された前記手を正常に検出されたものと判定する、
請求項2に記載の手検出装置。 - 前記手検出用映像を含む前記車両内の映像を撮影するカメラをさらに備える、
請求項1または請求項2に記載の手検出装置。 - 前記カメラは前記車両のダッシュボードの中央部に配置される、
請求項6に記載の手検出装置。 - 請求項1または請求項2に記載の手検出装置と、
前記手によるジェスチャーを認識するジェスチャー認識部と、
を備え、
前記誤検出判定部は、前記手が誤検出されたと判定しなかった場合には前記手が正常に検出されたと判定し、
前記ジェスチャー認識部は、正常に検出されたと判定された前記手によるジェスチャーの認識を行い、誤検出されたと判定された前記手によるジェスチャーの認識は行わない、
ジェスチャー認識装置。 - 手検出装置の映像取得部が、車両内の手検出用領域を撮影した映像である手検出用映像を取得し、
前記手検出装置の輝度差分算出部が、前記手検出用映像のフレーム間の輝度差分を算出し、
前記手検出装置の手検出部が、前記手検出用映像からユーザの手を検出し、
前記手検出装置の誤検出判定部が、前記手検出用映像の前記手が検出されたフレームとその直前フレームとの前記輝度差分に基づいて、検出された前記手が誤検出されたものか否かを判定し、
前記輝度差分算出部は、前記輝度差分として、前記手検出用映像の平均輝度のフレーム間の差分を算出し、
前記誤検出判定部は、前記手検出用映像の前記手が検出されたフレームとその直前フレームとの前記平均輝度の差分が予め定められた閾値以下の場合に、前記手が誤検出されたと判定する、
手検出方法。 - 手検出装置の映像取得部が、車両内の手検出用領域を撮影した映像である手検出用映像を取得し、
前記手検出装置の輝度差分算出部が、前記手検出用映像のフレーム間の輝度差分を算出し、
前記手検出装置の手検出部が、前記手検出用映像からユーザの手を検出し、
前記手検出装置の誤検出判定部が、前記手検出用映像の前記手が検出されたフレームとその直前フレームとの前記輝度差分に基づいて、検出された前記手が誤検出されたものか否かを判定し、
前記輝度差分算出部は、前記手検出用映像を複数のブロックに分割し、前記輝度差分として、各ブロックのHOG(Histograms of Oriented Gradients)特徴量のフレーム間の差分を算出し、
前記誤検出判定部は、前記手検出用映像の前記手が検出されたフレームとその直前フレームとの前記HOG特徴量の差分が予め定められた閾値を超える前記ブロックの個数が一定個数以下の場合に、前記手が誤検出されたと判定する、
手検出方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/002016 WO2022157880A1 (ja) | 2021-01-21 | 2021-01-21 | 手検出装置、ジェスチャー認識装置および手検出方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2022157880A1 JPWO2022157880A1 (ja) | 2022-07-28 |
JPWO2022157880A5 JPWO2022157880A5 (ja) | 2023-04-18 |
JP7483060B2 true JP7483060B2 (ja) | 2024-05-14 |
Family
ID=82548551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022576293A Active JP7483060B2 (ja) | 2021-01-21 | 2021-01-21 | 手検出装置、ジェスチャー認識装置および手検出方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230401898A1 (ja) |
JP (1) | JP7483060B2 (ja) |
WO (1) | WO2022157880A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009104297A (ja) | 2007-10-22 | 2009-05-14 | Mitsubishi Electric Corp | 操作入力装置 |
JP2012150837A (ja) | 2012-04-27 | 2012-08-09 | Casio Comput Co Ltd | ジェスチャー認識装置、ジェスチャー認識方法及びそのプログラム |
JP2016171511A (ja) | 2015-03-13 | 2016-09-23 | リコーイメージング株式会社 | 撮像装置および撮像方法 |
JP2018055614A (ja) | 2016-09-30 | 2018-04-05 | 島根県 | ジェスチャ操作システム、ジェスチャ操作方法およびプログラム |
-
2021
- 2021-01-21 WO PCT/JP2021/002016 patent/WO2022157880A1/ja active Application Filing
- 2021-01-21 US US18/036,344 patent/US20230401898A1/en active Pending
- 2021-01-21 JP JP2022576293A patent/JP7483060B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009104297A (ja) | 2007-10-22 | 2009-05-14 | Mitsubishi Electric Corp | 操作入力装置 |
JP2012150837A (ja) | 2012-04-27 | 2012-08-09 | Casio Comput Co Ltd | ジェスチャー認識装置、ジェスチャー認識方法及びそのプログラム |
JP2016171511A (ja) | 2015-03-13 | 2016-09-23 | リコーイメージング株式会社 | 撮像装置および撮像方法 |
JP2018055614A (ja) | 2016-09-30 | 2018-04-05 | 島根県 | ジェスチャ操作システム、ジェスチャ操作方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2022157880A1 (ja) | 2022-07-28 |
JPWO2022157880A1 (ja) | 2022-07-28 |
US20230401898A1 (en) | 2023-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9706100B2 (en) | Imaging apparatus, method for setting voice command, and storage medium | |
KR101573744B1 (ko) | 입력 사운드 신호에 기반한 영상 저장장치 및 방법 | |
CN109460697B (zh) | 人脸辨识的辅助过滤装置及电子装置的启动方法 | |
JP2012121386A (ja) | 車載装置 | |
US10503885B2 (en) | Electronic device and unlocking method therefor | |
CN102939617A (zh) | 姿势识别装置、姿势识别方法和程序 | |
JP4942604B2 (ja) | 車両用電話通話判定装置 | |
JP2009117978A (ja) | 車両周辺表示装置 | |
JP7483060B2 (ja) | 手検出装置、ジェスチャー認識装置および手検出方法 | |
US20100014760A1 (en) | Information Extracting Method, Registration Device, Verification Device, and Program | |
JP2008243111A (ja) | 画像処理装置および画像処理方法 | |
US20150070267A1 (en) | Misrecognition reducing motion recognition apparatus and method | |
US20180005016A1 (en) | Image processing apparatus, image processing method, and storage medium for detecting object from image | |
WO2019030855A1 (ja) | 運転不能状態判定装置および運転不能状態判定方法 | |
JP6735801B2 (ja) | 物体認識装置およびこれを用いた車両制御装置並びに物体認識方法およびこれを用いた車両制御方法 | |
JP7289406B2 (ja) | ジェスチャ検出装置およびジェスチャ検出方法 | |
JP7072737B2 (ja) | ジェスチャ検出装置およびジェスチャ検出方法 | |
US20190208100A1 (en) | Vehicle camera device and exposure parameter setting method thereof | |
JP2020194224A (ja) | 運転者判定装置、運転者判定方法、および運転者判定プログラム | |
JP7412614B1 (ja) | 追跡装置、追跡方法及び追跡プログラム | |
JP7217838B2 (ja) | 開口度算出装置 | |
WO2021186710A1 (ja) | ジェスチャ検出装置及びジェスチャ検出方法 | |
WO2021240668A1 (ja) | ジェスチャ検出装置およびジェスチャ検出方法 | |
JPWO2020188788A1 (ja) | 覚醒度推定装置、自動運転支援装置および覚醒度推定方法 | |
WO2022234632A1 (ja) | 反射性眼球運動評価装置、反射性眼球運動評価システム、および反射性眼球運動評価方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230131 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240318 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240430 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7483060 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |