JP2011128766A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2011128766A5 JP2011128766A5 JP2009285106A JP2009285106A JP2011128766A5 JP 2011128766 A5 JP2011128766 A5 JP 2011128766A5 JP 2009285106 A JP2009285106 A JP 2009285106A JP 2009285106 A JP2009285106 A JP 2009285106A JP 2011128766 A5 JP2011128766 A5 JP 2011128766A5
- Authority
- JP
- Japan
- Prior art keywords
- input
- command
- gesture
- recognition score
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Claims (10)
- 操作対象装置へ入力するコマンドを操作者による音声及びジェスチャの両方に基づいて決定する入力装置であって、
操作者による音声が入力される音声入力部と、
操作者によるジェスチャを撮影した画像が入力される画像入力部と、
前記入力される音声に対して音声認識処理を行い、操作対象装置へコマンドを入力するための音声として予め定められた音声のうち該入力される音声と一致する音声の候補を特定し、該入力される音声が該特定した候補に一致する確からしさの指標である音声認識スコアを算出する音声認識スコア算出部と、
前記入力される画像に対して画像認識処理を行い、操作対象装置へコマンドを入力するためのジェスチャとして予め定められたジェスチャのうち該入力される画像に撮影されたジェスチャと一致するジェスチャの候補を特定し、該入力される画像に撮影されたジェスチャが該特定した候補に一致する確からしさの指標であるジェスチャ認識スコアを算出するジェスチャ認識スコア算出部と、
前記特定した候補に基づいて操作対象装置へ入力するコマンドを決定するコマンド決定部と、
を備え、
前記コマンド決定部は、前記算出した音声認識スコア及びジェスチャ認識スコアのいずれか一方が所定の第1の閾値より小さい場合、他方の認識スコアに対応する候補のみに基づいて操作対象装置へ入力するコマンドを決定することを特徴とする入力装置。 - 前記コマンド決定部は、前記算出した音声認識スコア及びジェスチャ認識スコアが両方とも前記第1の閾値より小さい場合、前記特定した候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項1に記載の入力装置。
- 前記コマンド決定部は、前記算出した音声認識スコア及びジェスチャ認識スコアの少なくとも一方が、前記第1の閾値より小さい所定の第2の閾値より小さい場合、前記特定した両方の候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項1又は2に記載の入力装置。
- 操作対象装置へ入力するコマンドを操作者による音声及びジェスチャの両方に基づいて決定する入力装置であって、
操作者による音声が入力される音声入力部と、
操作者によるジェスチャを撮影した画像が入力される画像入力部と、
前記入力される音声に対して音声認識処理を行い、操作対象装置へコマンドを入力するための音声として予め定められた音声のうち該入力される音声と一致する音声の候補を特定し、該入力される音声が該特定した候補に一致する確からしさの指標である音声認識スコアを算出する音声認識スコア算出部と、
前記入力される画像に対して画像認識処理を行い、操作対象装置へコマンドを入力するためのジェスチャとして予め定められたジェスチャのうち該入力される画像に撮影されたジェスチャと一致するジェスチャの候補を特定し、該入力される画像に撮影されたジェスチャが該特定した候補に一致する確からしさの指標であるジェスチャ認識スコアを算出するジェスチャ認識スコア算出部と、
前記特定した候補に基づいて操作対象装置へ入力するコマンドを決定するコマンド決定部と、
を備え、
前記コマンド決定部は、前記算出した音声認識スコアとジェスチャ認識スコアとの差の大きさが所定の第3の閾値より大きい場合、該音声認識スコアとジェスチャ認識スコアのうち大きい方に対応する候補のみに基づいて操作対象装置へ入力するコマンドを決定することを特徴とする入力装置。 - 前記コマンド決定部は、前記算出した音声認識スコア及びジェスチャ認識スコアの少なくとも一方が、所定の第2の閾値より小さい場合、前記特定した両方の候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項4に記載の入力装置。
- 操作対象装置へ入力するコマンドを操作者による音声及びジェスチャの両方に基づいて決定する入力方法であって、
操作者による音声が入力される音声入力工程と、
操作者によるジェスチャを撮影した画像が入力される画像入力工程と、
前記入力される音声に対して音声認識処理を行い、操作対象装置へコマンドを入力するための音声として予め定められた音声のうち該入力される音声と一致する音声の候補を特定し、該入力される音声が該特定した候補に一致する確からしさの指標である音声認識スコアを算出する音声認識スコア算出工程と、
前記入力される画像に対して画像認識処理を行い、操作対象装置へコマンドを入力するためのジェスチャとして予め定められたジェスチャのうち該入力される画像に撮影されたジェスチャと一致するジェスチャの候補を特定し、該入力される画像に撮影されたジェスチャが該特定した候補に一致する確からしさの指標であるジェスチャ認識スコアを算出するジェスチャ認識スコア算出工程と、
前記特定した候補に基づいて操作対象装置へ入力するコマンドを決定するコマンド決定工程と、
を有し、
前記コマンド決定工程は、前記算出した音声認識スコア及びジェスチャ認識スコアのいずれか一方が所定の第1の閾値より小さい場合、他方の認識スコアに対応する候補のみに基づいて操作対象装置へ入力するコマンドを決定することを特徴とする入力方法。 - 前記コマンド決定工程では、前記算出した音声認識スコア及びジェスチャ認識スコアが両方とも前記第1の閾値より小さい場合、前記特定した候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項6に記載の入力方法。
- 前記コマンド決定工程では、前記算出した音声認識スコア及びジェスチャ認識スコアの少なくとも一方が、前記第1の閾値より小さい所定の第2の閾値より小さい場合、前記特定した両方の候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項6又は7に記載の入力方法。
- 操作対象装置へ入力するコマンドを操作者による音声及びジェスチャの両方に基づいて決定する入力方法であって、
操作者による音声が入力される音声入力工程と、
操作者によるジェスチャを撮影した画像が入力される画像入力工程と、
前記入力される音声に対して音声認識処理を行い、操作対象装置へコマンドを入力するための音声として予め定められた音声のうち該入力される音声と一致する音声の候補を特定し、該入力される音声が該特定した候補に一致する確からしさの指標である音声認識スコアを算出する音声認識スコア算出工程と、
前記入力される画像に対して画像認識処理を行い、操作対象装置へコマンドを入力するためのジェスチャとして予め定められたジェスチャのうち該入力される画像に撮影されたジェスチャと一致するジェスチャの候補を特定し、該入力される画像に撮影されたジェスチャが該特定した候補に一致する確からしさの指標であるジェスチャ認識スコアを算出するジェスチャ認識スコア算出工程と、
前記特定した候補に基づいて操作対象装置へ入力するコマンドを決定するコマンド決定工程と、
を有し、
前記コマンド決定工程は、前記算出した音声認識スコアとジェスチャ認識スコアとの差の大きさが所定の第3の閾値より大きい場合、該音声認識スコアとジェスチャ認識スコアのうち大きい方に対応する候補のみに基づいて操作対象装置へ入力するコマンドを決定することを特徴とする入力方法。 - 前記コマンド決定工程では、前記算出した音声認識スコア及びジェスチャ認識スコアの少なくとも一方が、所定の第2の閾値より小さい場合、前記特定した両方の候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項9に記載の入力方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009285106A JP5430382B2 (ja) | 2009-12-16 | 2009-12-16 | 入力装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009285106A JP5430382B2 (ja) | 2009-12-16 | 2009-12-16 | 入力装置及び方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011128766A JP2011128766A (ja) | 2011-06-30 |
JP2011128766A5 true JP2011128766A5 (ja) | 2013-01-31 |
JP5430382B2 JP5430382B2 (ja) | 2014-02-26 |
Family
ID=44291324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009285106A Expired - Fee Related JP5430382B2 (ja) | 2009-12-16 | 2009-12-16 | 入力装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5430382B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6123121B2 (ja) * | 2011-10-14 | 2017-05-10 | ヴイアールアイ株式会社 | 音声制御システム及びプログラム |
JP6169864B2 (ja) | 2012-03-21 | 2017-07-26 | 株式会社デンソーアイティーラボラトリ | 音声認識装置、音声認識プログラム、及び、音声認識方法 |
WO2014186841A1 (en) * | 2013-05-21 | 2014-11-27 | Fairlight.Au Pty Ltd | User interface for controlling software applications |
JP6377328B2 (ja) * | 2013-08-21 | 2018-08-22 | 東急テクノシステム株式会社 | 列車見張員訓練用シミュレータ |
CN106537489B (zh) * | 2014-07-22 | 2020-01-17 | 三菱电机株式会社 | 用于识别包括单词序列的语音的方法和系统 |
US10475448B2 (en) | 2014-09-30 | 2019-11-12 | Mitsubishi Electric Corporation | Speech recognition system |
JP6768323B2 (ja) * | 2016-03-25 | 2020-10-14 | パイオニア株式会社 | 音声認識装置及び方法、並びにコンピュータプログラム及び記録媒体 |
WO2018003862A1 (ja) * | 2016-06-28 | 2018-01-04 | 株式会社ニコン | 制御装置、表示装置、プログラムおよび検出方法 |
JP6719434B2 (ja) * | 2017-09-25 | 2020-07-08 | Kddi株式会社 | 機器制御装置、機器制御方法及び機器制御システム |
US20210208550A1 (en) * | 2018-06-12 | 2021-07-08 | Sony Corporation | Information processing apparatus and information processing method |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11272293A (ja) * | 1998-03-24 | 1999-10-08 | Sanyo Electric Co Ltd | 遠隔制御装置 |
JP2001229180A (ja) * | 2000-02-17 | 2001-08-24 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ検索装置 |
-
2009
- 2009-12-16 JP JP2009285106A patent/JP5430382B2/ja not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011128766A5 (ja) | ||
EP3614377B1 (en) | Object recognition method, computer device and computer readable storage medium | |
US20110299737A1 (en) | Vision-based hand movement recognition system and method thereof | |
US10019992B2 (en) | Speech-controlled actions based on keywords and context thereof | |
JP5430382B2 (ja) | 入力装置及び方法 | |
AU2018256555A1 (en) | Image and feature quality, image enhancement and feature extraction for ocular-vascular and facial recognition, and fusing ocular-vascular with facial and/or sub-facial information for biometric systems | |
KR101734829B1 (ko) | 지역성 말투를 구분하는 음성 데이터 인식 방법, 장치 및 서버 | |
RU2016150852A (ru) | Система и способ для ввода в действие функциональной возможности с помощью распознавания жестов и речевой команды | |
GB2536836A (en) | Voice command triggered speech enhancement | |
JP2017511915A5 (ja) | ||
JP2016511473A5 (ja) | ||
JP2016522910A5 (ja) | ||
JP2016540250A5 (ja) | ||
JP2011165008A5 (ja) | ||
JP2017531372A5 (ja) | ||
JP2010086482A5 (ja) | ||
EP2693359A3 (en) | Mobile device, and method for releasing lock of the mobile device via handwriting recognition | |
KR102203720B1 (ko) | 음성 인식 방법 및 장치 | |
KR101151571B1 (ko) | 음성 대화 시스템을 위한 음성 인식 환경 제어 장치 및 그 방법 | |
JP5849761B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
JP2018159788A5 (ja) | 情報処理装置、感情認識方法、及び、プログラム | |
JP2016062183A5 (ja) | ||
Ghaemmaghami et al. | Speaker attribution of multiple telephone conversations using a complete-linkage clustering approach | |
JP2017144521A5 (ja) | ||
JP2015141226A5 (ja) |