JP2015102897A - 画像認識装置、及び画像認識方法 - Google Patents
画像認識装置、及び画像認識方法 Download PDFInfo
- Publication number
- JP2015102897A JP2015102897A JP2013240963A JP2013240963A JP2015102897A JP 2015102897 A JP2015102897 A JP 2015102897A JP 2013240963 A JP2013240963 A JP 2013240963A JP 2013240963 A JP2013240963 A JP 2013240963A JP 2015102897 A JP2015102897 A JP 2015102897A
- Authority
- JP
- Japan
- Prior art keywords
- gesture
- meaning
- recognition
- sounds
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000033001 locomotion Effects 0.000 claims abstract description 137
- 238000011156 evaluation Methods 0.000 claims description 16
- 230000001360 synchronised effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 210000003811 finger Anatomy 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 241001026509 Kata Species 0.000 description 1
- 241000348346 Suta Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
Description
図5に示した例では、ジェスチャとそのジェスチャに対応する唇の動きとの同期が取れている場合について説明したが、ジェスチャとそのジェスチャに対応する唇の動きによる音数との間にずれがある場合の判断方法について説明する。図7を用いて、「どんなヘアスタイルにする?」という手話動作において、ジェスチャと、ジェスチャに対応する唇の動きとの同期が取れていない場合の例を説明する。図7に示すように、対象となるジェスチャの意味の文字数と、当該ジェスチャに対応する唇の動きの回数に乖離がある場合(例えば、あるジェスチャの最大文字数と唇の動きの数が2以上乖離している場合)は、次のジェスチャに対応する唇の動きも含んでいると仮定して、複数のパターンでスコア化(重み付け)を行う。
Claims (9)
- 撮影対象を画像データにして取得する画像取得手段と、
前記画像取得手段により取得された画像データに基づいて、撮影対象のジェスチャを認識する第1認識手段と、
前記画像取得手段により取得された画像データに基づいて、前記第1認識手段が認識したジェスチャ中における前記撮影対象の口の動作を認識する第2認識手段と、
前記第1認識手段によるジェスチャの認識結果に対応する意味候補と、前記第2認識手段による前記撮影対象の口の動作の認識結果とに基づいて、ジェスチャの意味を判断する判断手段と、
前記判断手段が判断したジェスチャの意味を出力する出力手段と、
を備える画像認識装置。 - 前記第2認識手段は、前記撮影対象の口の動作の認識として、前記ジェスチャ中における口の動きに基づいた音数の認識をする、請求項1に記載の画像認識装置。
- 前記第2認識手段は、前記ジェスチャ中における、最初に口を開いた時間から、最後に口を閉じた時間までの期間内の、前記口の開閉の回数に基づいた音数を認識する、請求項2に記載の画像認識装置。
- 前記判断手段は、ジェスチャの意味候補の音数と、前記第2認識手段による前記ジェスチャ中における音数との合致度に基づいてジェスチャの意味を判断する、請求項2又は3に記載の画像認識装置。
- 前記第2認識手段は、前記口の動作の認識として、口の動作による音情報の認識をし、
前記判断手段は、前記ジェスチャの意味候補の音情報と、前記第2認識手段による認識結果の音情報との一致度にさらに基づいてジェスチャの意味を判断する、請求項4に記載の画像認識装置。 - 前記第2認識手段により認識された音数が、前記判断手段が判断した意味の文字数を上回った場合、前記第2認識手段により認識された音数と、前記判断手段が判断した意味の文字数との差分情報を未使用情報として保持する未使用情報保持手段をさらに備え、
前記判断手段は、認識対象のジェスチャの直前のジェスチャ中における未使用情報がある場合、当該未使用情報を、前記第2認識手段により認識された認識された音数に加えてジェスチャの意味を判断する、請求項2に記載の画像認識装置。 - 前記判断手段は、前記ジェスチャの意味候補の文字数と、前記第2認識手段により認識された音数との差が所定値以上である場合、前記第2認識手段により認識された音数を、前記ジェスチャの意味候補の何れか少なくとも1つの文字数と仮定して、ジェスチャの意味を判断する、請求項2に記載の画像認識装置。
- 前記判断手段は、前記ジェスチャにおける複数の意味候補のそれぞれの文字数で区別した文字数グループごとに、当該意味候補のそれぞれに対する文字数に基づいた評価値を含んだ評価管理情報を複数生成し、
前記評価管理情報における評価値と、前記文字数グループで区別された文字数とを用いて、複数の意味候補から一の意味候補を選択することで、前記ジェスチャの意味を判断する、請求項7に記載の画像認識装置。 - 撮影対象のジェスチャを認識する画像認識装置において、
前記撮影対象を画像データにして取得する画像取得ステップと、
前記画像取得ステップにより取得された画像データに基づいて、撮影対象のジェスチャを認識する第1認識ステップと、
前記画像取得ステップにより取得された画像データに基づいて、前記第1認識ステップで認識したジェスチャ中における撮影対象の口の動作を認識する第2認識ステップと、
前記第1認識ステップによるジェスチャの認識結果に対応する意味候補と、前記第2認識ステップによる撮影対象の口の動作の認識結果とに基づいて、ジェスチャの意味を判断する判断ステップと、
前記判断ステップで判断したジェスチャの意味を出力する出力ステップと、
を備える画像認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013240963A JP6209067B2 (ja) | 2013-11-21 | 2013-11-21 | 画像認識装置、及び画像認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013240963A JP6209067B2 (ja) | 2013-11-21 | 2013-11-21 | 画像認識装置、及び画像認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015102897A true JP2015102897A (ja) | 2015-06-04 |
JP6209067B2 JP6209067B2 (ja) | 2017-10-04 |
Family
ID=53378575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013240963A Expired - Fee Related JP6209067B2 (ja) | 2013-11-21 | 2013-11-21 | 画像認識装置、及び画像認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6209067B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10601821B2 (en) * | 2014-09-03 | 2020-03-24 | Alibaba Group Holding Limited | Identity authentication method and apparatus, terminal and server |
CN113157080A (zh) * | 2020-01-07 | 2021-07-23 | 宝马股份公司 | 用于车辆的指令输入方法、存储介质、系统及车辆 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1049194A (ja) * | 1996-07-30 | 1998-02-20 | Aqueous Res:Kk | 音声認識装置 |
JPH11149296A (ja) * | 1997-09-10 | 1999-06-02 | Oki Electric Ind Co Ltd | 単語認識装置 |
JPH11203023A (ja) * | 1998-01-09 | 1999-07-30 | Norio Aigase | 連想文字の文字画像を主体とした文字入力システム |
JPH11306316A (ja) * | 1998-04-24 | 1999-11-05 | Toshiba Corp | 手話認識方法および手話認識装置および記録媒体 |
JP2004015250A (ja) * | 2002-06-05 | 2004-01-15 | Nec Corp | 携帯端末装置 |
JP2008310382A (ja) * | 2007-06-12 | 2008-12-25 | Omron Corp | 読唇装置および方法、情報処理装置および方法、検出装置および方法、プログラム、データ構造、並びに、記録媒体 |
JP2012118679A (ja) * | 2010-11-30 | 2012-06-21 | Nec Commun Syst Ltd | 情報処理装置、単語判別装置、画面表示操作装置、単語登録装置およびこれらに関する方法ならびにプログラム |
JP2013089238A (ja) * | 2011-10-20 | 2013-05-13 | Fuji Xerox Co Ltd | ジェスチャ処理プログラム |
-
2013
- 2013-11-21 JP JP2013240963A patent/JP6209067B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1049194A (ja) * | 1996-07-30 | 1998-02-20 | Aqueous Res:Kk | 音声認識装置 |
JPH11149296A (ja) * | 1997-09-10 | 1999-06-02 | Oki Electric Ind Co Ltd | 単語認識装置 |
JPH11203023A (ja) * | 1998-01-09 | 1999-07-30 | Norio Aigase | 連想文字の文字画像を主体とした文字入力システム |
JPH11306316A (ja) * | 1998-04-24 | 1999-11-05 | Toshiba Corp | 手話認識方法および手話認識装置および記録媒体 |
JP2004015250A (ja) * | 2002-06-05 | 2004-01-15 | Nec Corp | 携帯端末装置 |
JP2008310382A (ja) * | 2007-06-12 | 2008-12-25 | Omron Corp | 読唇装置および方法、情報処理装置および方法、検出装置および方法、プログラム、データ構造、並びに、記録媒体 |
JP2012118679A (ja) * | 2010-11-30 | 2012-06-21 | Nec Commun Syst Ltd | 情報処理装置、単語判別装置、画面表示操作装置、単語登録装置およびこれらに関する方法ならびにプログラム |
JP2013089238A (ja) * | 2011-10-20 | 2013-05-13 | Fuji Xerox Co Ltd | ジェスチャ処理プログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10601821B2 (en) * | 2014-09-03 | 2020-03-24 | Alibaba Group Holding Limited | Identity authentication method and apparatus, terminal and server |
CN113157080A (zh) * | 2020-01-07 | 2021-07-23 | 宝马股份公司 | 用于车辆的指令输入方法、存储介质、系统及车辆 |
Also Published As
Publication number | Publication date |
---|---|
JP6209067B2 (ja) | 2017-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6467965B2 (ja) | 感情推定装置及び感情推定方法 | |
JP6798798B2 (ja) | ユーザ認証のためのデータを更新する方法及び装置 | |
US10678342B2 (en) | Method of virtual user interface interaction based on gesture recognition and related device | |
Buriro et al. | Itsme: Multi-modal and unobtrusive behavioural user authentication for smartphones | |
KR101612605B1 (ko) | 얼굴 특징점 추출 방법 및 이를 수행하는 장치 | |
JP7107598B2 (ja) | 認証用顔画像候補判定装置、認証用顔画像候補判定方法、プログラム、および記録媒体 | |
JP2012512478A (ja) | 顔姿勢推定を提供するための方法、装置、およびコンピュータプログラム | |
WO2019000817A1 (zh) | 手势识别控制方法和电子设备 | |
Oza et al. | Federated learning-based active authentication on mobile devices | |
CN108596079B (zh) | 手势识别方法、装置及电子设备 | |
KR102094953B1 (ko) | 시선 추적 방법 및 이를 수행하기 위한 단말 | |
KR20220042335A (ko) | 자동 수어 인식 방법 및 시스템 | |
CN111103981B (zh) | 控制指令生成方法及装置 | |
JPWO2013145496A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2016099643A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP6209067B2 (ja) | 画像認識装置、及び画像認識方法 | |
Ouadjer et al. | Feature importance evaluation of smartphone touch gestures for biometric authentication | |
KR101869304B1 (ko) | 컴퓨터를 이용한 수화어 인식시스템, 방법 및 인식프로그램 | |
KR20190132885A (ko) | 영상으로부터 손을 검출하는 장치, 방법 및 컴퓨터 프로그램 | |
Tarrataca et al. | The current feasibility of gesture recognition for a smartphone using J2ME | |
KR101909326B1 (ko) | 얼굴 모션 변화에 따른 삼각 매쉬 모델을 활용하는 사용자 인터페이스 제어 방법 및 시스템 | |
JP6144192B2 (ja) | 画像認識装置、及び画像認識方法 | |
US10936052B2 (en) | Method and device for determining head movement according to electrooculographic information | |
CN111989693A (zh) | 生物识别方法及装置 | |
JP7400987B2 (ja) | 顔認証装置、顔認証方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170908 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6209067 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |