JP2011128766A5 - - Google Patents

Download PDF

Info

Publication number
JP2011128766A5
JP2011128766A5 JP2009285106A JP2009285106A JP2011128766A5 JP 2011128766 A5 JP2011128766 A5 JP 2011128766A5 JP 2009285106 A JP2009285106 A JP 2009285106A JP 2009285106 A JP2009285106 A JP 2009285106A JP 2011128766 A5 JP2011128766 A5 JP 2011128766A5
Authority
JP
Japan
Prior art keywords
input
command
gesture
recognition score
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009285106A
Other languages
English (en)
Other versions
JP5430382B2 (ja
JP2011128766A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2009285106A priority Critical patent/JP5430382B2/ja
Priority claimed from JP2009285106A external-priority patent/JP5430382B2/ja
Publication of JP2011128766A publication Critical patent/JP2011128766A/ja
Publication of JP2011128766A5 publication Critical patent/JP2011128766A5/ja
Application granted granted Critical
Publication of JP5430382B2 publication Critical patent/JP5430382B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (10)

  1. 操作対象装置へ入力するコマンドを操作者による音声及びジェスチャの両方に基づいて決定する入力装置であって、
    操作者による音声が入力される音声入力部と、
    操作者によるジェスチャを撮影した画像が入力される画像入力部と、
    前記入力される音声に対して音声認識処理を行い、操作対象装置へコマンドを入力するための音声として予め定められた音声のうち該入力される音声と一致する音声の候補を特定し、該入力される音声が該特定した候補に一致する確からしさの指標である音声認識スコアを算出する音声認識スコア算出部と、
    前記入力される画像に対して画像認識処理を行い、操作対象装置へコマンドを入力するためのジェスチャとして予め定められたジェスチャのうち該入力される画像に撮影されたジェスチャと一致するジェスチャの候補を特定し、該入力される画像に撮影されたジェスチャが該特定した候補に一致する確からしさの指標であるジェスチャ認識スコアを算出するジェスチャ認識スコア算出部と、
    前記特定した候補に基づいて操作対象装置へ入力するコマンドを決定するコマンド決定部と、
    を備え、
    前記コマンド決定部は、前記算出した音声認識スコア及びジェスチャ認識スコアのいずれか一方が所定の第1の閾値より小さい場合、他方の認識スコアに対応する候補のみに基づいて操作対象装置へ入力するコマンドを決定することを特徴とする入力装置。
  2. 前記コマンド決定部は、前記算出した音声認識スコア及びジェスチャ認識スコアが両方とも前記第1の閾値より小さい場合、前記特定した候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項1に記載の入力装置。
  3. 前記コマンド決定部は、前記算出した音声認識スコア及びジェスチャ認識スコアの少なくとも一方が、前記第1の閾値より小さい所定の第2の閾値より小さい場合、前記特定した両方の候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項1又は2に記載の入力装置。
  4. 操作対象装置へ入力するコマンドを操作者による音声及びジェスチャの両方に基づいて決定する入力装置であって、
    操作者による音声が入力される音声入力部と、
    操作者によるジェスチャを撮影した画像が入力される画像入力部と、
    前記入力される音声に対して音声認識処理を行い、操作対象装置へコマンドを入力するための音声として予め定められた音声のうち該入力される音声と一致する音声の候補を特定し、該入力される音声が該特定した候補に一致する確からしさの指標である音声認識スコアを算出する音声認識スコア算出部と、
    前記入力される画像に対して画像認識処理を行い、操作対象装置へコマンドを入力するためのジェスチャとして予め定められたジェスチャのうち該入力される画像に撮影されたジェスチャと一致するジェスチャの候補を特定し、該入力される画像に撮影されたジェスチャが該特定した候補に一致する確からしさの指標であるジェスチャ認識スコアを算出するジェスチャ認識スコア算出部と、
    前記特定した候補に基づいて操作対象装置へ入力するコマンドを決定するコマンド決定部と、
    を備え、
    前記コマンド決定部は、前記算出した音声認識スコアとジェスチャ認識スコアとの差の大きさが所定の第3の閾値より大きい場合、該音声認識スコアとジェスチャ認識スコアのうち大きい方に対応する候補のみに基づいて操作対象装置へ入力するコマンドを決定することを特徴とする入力装置。
  5. 前記コマンド決定部は、前記算出した音声認識スコア及びジェスチャ認識スコアの少なくとも一方が、所定の第2の閾値より小さい場合、前記特定した両方の候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項4に記載の入力装置。
  6. 操作対象装置へ入力するコマンドを操作者による音声及びジェスチャの両方に基づいて決定する入力方法であって、
    操作者による音声が入力される音声入力工程と、
    操作者によるジェスチャを撮影した画像が入力される画像入力工程と、
    前記入力される音声に対して音声認識処理を行い、操作対象装置へコマンドを入力するための音声として予め定められた音声のうち該入力される音声と一致する音声の候補を特定し、該入力される音声が該特定した候補に一致する確からしさの指標である音声認識スコアを算出する音声認識スコア算出工程と、
    前記入力される画像に対して画像認識処理を行い、操作対象装置へコマンドを入力するためのジェスチャとして予め定められたジェスチャのうち該入力される画像に撮影されたジェスチャと一致するジェスチャの候補を特定し、該入力される画像に撮影されたジェスチャが該特定した候補に一致する確からしさの指標であるジェスチャ認識スコアを算出するジェスチャ認識スコア算出工程と、
    前記特定した候補に基づいて操作対象装置へ入力するコマンドを決定するコマンド決定工程と、
    を有し、
    前記コマンド決定工程は、前記算出した音声認識スコア及びジェスチャ認識スコアのいずれか一方が所定の第1の閾値より小さい場合、他方の認識スコアに対応する候補のみに基づいて操作対象装置へ入力するコマンドを決定することを特徴とする入力方法。
  7. 前記コマンド決定工程では、前記算出した音声認識スコア及びジェスチャ認識スコアが両方とも前記第1の閾値より小さい場合、前記特定した候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項6に記載の入力方法。
  8. 前記コマンド決定工程では、前記算出した音声認識スコア及びジェスチャ認識スコアの少なくとも一方が、前記第1の閾値より小さい所定の第2の閾値より小さい場合、前記特定した両方の候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項6又は7に記載の入力方法。
  9. 操作対象装置へ入力するコマンドを操作者による音声及びジェスチャの両方に基づいて決定する入力方法であって、
    操作者による音声が入力される音声入力工程と、
    操作者によるジェスチャを撮影した画像が入力される画像入力工程と、
    前記入力される音声に対して音声認識処理を行い、操作対象装置へコマンドを入力するための音声として予め定められた音声のうち該入力される音声と一致する音声の候補を特定し、該入力される音声が該特定した候補に一致する確からしさの指標である音声認識スコアを算出する音声認識スコア算出工程と、
    前記入力される画像に対して画像認識処理を行い、操作対象装置へコマンドを入力するためのジェスチャとして予め定められたジェスチャのうち該入力される画像に撮影されたジェスチャと一致するジェスチャの候補を特定し、該入力される画像に撮影されたジェスチャが該特定した候補に一致する確からしさの指標であるジェスチャ認識スコアを算出するジェスチャ認識スコア算出工程と、
    前記特定した候補に基づいて操作対象装置へ入力するコマンドを決定するコマンド決定工程と、
    を有し、
    前記コマンド決定工程は、前記算出した音声認識スコアとジェスチャ認識スコアとの差の大きさが所定の第3の閾値より大きい場合、該音声認識スコアとジェスチャ認識スコアのうち大きい方に対応する候補のみに基づいて操作対象装置へ入力するコマンドを決定することを特徴とする入力方法。
  10. 前記コマンド決定工程では、前記算出した音声認識スコア及びジェスチャ認識スコアの少なくとも一方が、所定の第2の閾値より小さい場合、前記特定した両方の候補を破棄し、前記特定した候補に基づく操作対象装置へ入力するコマンドの決定を行わないことを特徴とする請求項9に記載の入力方法。
JP2009285106A 2009-12-16 2009-12-16 入力装置及び方法 Expired - Fee Related JP5430382B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009285106A JP5430382B2 (ja) 2009-12-16 2009-12-16 入力装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009285106A JP5430382B2 (ja) 2009-12-16 2009-12-16 入力装置及び方法

Publications (3)

Publication Number Publication Date
JP2011128766A JP2011128766A (ja) 2011-06-30
JP2011128766A5 true JP2011128766A5 (ja) 2013-01-31
JP5430382B2 JP5430382B2 (ja) 2014-02-26

Family

ID=44291324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009285106A Expired - Fee Related JP5430382B2 (ja) 2009-12-16 2009-12-16 入力装置及び方法

Country Status (1)

Country Link
JP (1) JP5430382B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6123121B2 (ja) * 2011-10-14 2017-05-10 ヴイアールアイ株式会社 音声制御システム及びプログラム
JP6169864B2 (ja) 2012-03-21 2017-07-26 株式会社デンソーアイティーラボラトリ 音声認識装置、音声認識プログラム、及び、音声認識方法
WO2014186841A1 (en) * 2013-05-21 2014-11-27 Fairlight.Au Pty Ltd User interface for controlling software applications
JP6377328B2 (ja) * 2013-08-21 2018-08-22 東急テクノシステム株式会社 列車見張員訓練用シミュレータ
CN106537489B (zh) * 2014-07-22 2020-01-17 三菱电机株式会社 用于识别包括单词序列的语音的方法和系统
US10475448B2 (en) 2014-09-30 2019-11-12 Mitsubishi Electric Corporation Speech recognition system
JP6768323B2 (ja) * 2016-03-25 2020-10-14 パイオニア株式会社 音声認識装置及び方法、並びにコンピュータプログラム及び記録媒体
WO2018003862A1 (ja) * 2016-06-28 2018-01-04 株式会社ニコン 制御装置、表示装置、プログラムおよび検出方法
JP6719434B2 (ja) * 2017-09-25 2020-07-08 Kddi株式会社 機器制御装置、機器制御方法及び機器制御システム
US20210208550A1 (en) * 2018-06-12 2021-07-08 Sony Corporation Information processing apparatus and information processing method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11272293A (ja) * 1998-03-24 1999-10-08 Sanyo Electric Co Ltd 遠隔制御装置
JP2001229180A (ja) * 2000-02-17 2001-08-24 Nippon Telegr & Teleph Corp <Ntt> コンテンツ検索装置

Similar Documents

Publication Publication Date Title
JP2011128766A5 (ja)
EP3614377B1 (en) Object recognition method, computer device and computer readable storage medium
US20110299737A1 (en) Vision-based hand movement recognition system and method thereof
US10019992B2 (en) Speech-controlled actions based on keywords and context thereof
JP5430382B2 (ja) 入力装置及び方法
AU2018256555A1 (en) Image and feature quality, image enhancement and feature extraction for ocular-vascular and facial recognition, and fusing ocular-vascular with facial and/or sub-facial information for biometric systems
KR101734829B1 (ko) 지역성 말투를 구분하는 음성 데이터 인식 방법, 장치 및 서버
RU2016150852A (ru) Система и способ для ввода в действие функциональной возможности с помощью распознавания жестов и речевой команды
GB2536836A (en) Voice command triggered speech enhancement
JP2017511915A5 (ja)
JP2016511473A5 (ja)
JP2016522910A5 (ja)
JP2016540250A5 (ja)
JP2011165008A5 (ja)
JP2017531372A5 (ja)
JP2010086482A5 (ja)
EP2693359A3 (en) Mobile device, and method for releasing lock of the mobile device via handwriting recognition
KR102203720B1 (ko) 음성 인식 방법 및 장치
KR101151571B1 (ko) 음성 대화 시스템을 위한 음성 인식 환경 제어 장치 및 그 방법
JP5849761B2 (ja) 音声認識システム、音声認識方法および音声認識プログラム
JP2018159788A5 (ja) 情報処理装置、感情認識方法、及び、プログラム
JP2016062183A5 (ja)
Ghaemmaghami et al. Speaker attribution of multiple telephone conversations using a complete-linkage clustering approach
JP2017144521A5 (ja)
JP2015141226A5 (ja)