JP2007094104A5 - - Google Patents

Download PDF

Info

Publication number
JP2007094104A5
JP2007094104A5 JP2005284521A JP2005284521A JP2007094104A5 JP 2007094104 A5 JP2007094104 A5 JP 2007094104A5 JP 2005284521 A JP2005284521 A JP 2005284521A JP 2005284521 A JP2005284521 A JP 2005284521A JP 2007094104 A5 JP2007094104 A5 JP 2007094104A5
Authority
JP
Japan
Prior art keywords
speaker
motion pattern
speech
information processing
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005284521A
Other languages
English (en)
Other versions
JP2007094104A (ja
JP4992218B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2005284521A priority Critical patent/JP4992218B2/ja
Priority claimed from JP2005284521A external-priority patent/JP4992218B2/ja
Publication of JP2007094104A publication Critical patent/JP2007094104A/ja
Publication of JP2007094104A5 publication Critical patent/JP2007094104A5/ja
Application granted granted Critical
Publication of JP4992218B2 publication Critical patent/JP4992218B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (8)

  1. 話者が撮影された映像から、前記話者の体の複数部分の動きパターンを検出する検出手段と、
    出された前記動きパターンが、前記話者による発話時の動きパターンであるか否かを判定する判定手段と、
    検出された前記動きパターンの判定よる判定結果に基づいて、前記話者による発話時の音声を認識する音声認識手段と
    を備える情報処理装置。
  2. 前記検出手段は、
    前記映像に基づいて、前記話者の体の複数部分のうち、動きを検出する対象であるトラッキング対象を決定するトラッキング対象決定手段と、
    前記映像から、決定された前記トラッキング対象のオプティカルフローを検出するオプティカルフロー検出手段と、
    検出された前記オプティカルフローに基づいて、前記トラッキング対象の動きを認識する動き認識手段と、
    認識された前記動きが、予め想定した動きの想定範囲内である場合、前記動きを追跡する動き追跡手段と、
    追跡された前記動きに基づいて、前記トラッキング対象の動きパターンを決定する動きパターン決定手段と
    を有する請求項1に記載の情報処理装置。
  3. 前記トラッキング対象決定手段は、前記映像内の前記話者の顔を表す肌色領域に基づいて、前記話者の顔を、前記トラッキング対象として決定する
    請求項2に記載の情報処理装置。
  4. 前記判定手段は、隠れマルコフモデル、又はベイジアンネットワークのいずれか一方を用いて、検出された前記動きパターンが、前記話者による発話時の動きパターンであるか否かを判定する
    請求項1に記載の情報処理装置。
  5. 前記音声認識手段は、検出された前記動きパターンが、前記話者による発話時の動きパターンであると判定された場合、前記話者による発話時の音声を認識する
    請求項1に記載の情報処理装置。
  6. 前記検出手段は、少なくとも、前記話者の口及び頭の動きパターンを検出する
    請求項1に記載の情報処理装置。
  7. 話者の体の複数部分の動きパターンに基づいて、前記話者による発話時の音声を認識する情報処理装置の情報処理方法において、
    話者が撮影された映像から、前記話者の体の複数部分の動きパターンを検出する検出ステップと、
    出された前記動きパターンが、前記話者による発話時の動きパターンであるか否かを判定する判定ステップと、
    検出された前記動きパターンの判定よる判定結果に基づいて、前記話者による発話時の音声を認識する音声認識ステップと
    を含む情報処理方法。
  8. 話者が撮影された映像から、前記話者の体の複数部分の動きパターンを検出する検出ステップと、
    出された前記動きパターンが、前記話者による発話時の動きパターンであるか否かを判定する判定ステップと、
    検出された前記動きパターンの判定よる判定結果に基づいて、前記話者による発話時の音声を認識する音声認識ステップと
    を含む処理をコンピュータに実行させるプログラム。
JP2005284521A 2005-09-29 2005-09-29 情報処理装置および方法、並びにプログラム Expired - Fee Related JP4992218B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005284521A JP4992218B2 (ja) 2005-09-29 2005-09-29 情報処理装置および方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005284521A JP4992218B2 (ja) 2005-09-29 2005-09-29 情報処理装置および方法、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2007094104A JP2007094104A (ja) 2007-04-12
JP2007094104A5 true JP2007094104A5 (ja) 2008-11-13
JP4992218B2 JP4992218B2 (ja) 2012-08-08

Family

ID=37979893

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005284521A Expired - Fee Related JP4992218B2 (ja) 2005-09-29 2005-09-29 情報処理装置および方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP4992218B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009157905A (ja) * 2007-12-07 2009-07-16 Sony Corp 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
KR20210152028A (ko) 2008-11-10 2021-12-14 구글 엘엘씨 멀티센서 음성 검출
JP5797009B2 (ja) * 2011-05-19 2015-10-21 三菱重工業株式会社 音声認識装置、ロボット、及び音声認識方法
JP2013142843A (ja) * 2012-01-12 2013-07-22 Fuji Xerox Co Ltd 動作解析装置、音声取得装置、および、動作解析システム
BR112014018604B1 (pt) 2012-04-27 2022-02-01 Hewlett-Packard Development Company, L.P. Dispositivo de computação, método para receber entrada de áudio e meio legível por computador não volátil
CN102945672B (zh) 2012-09-29 2013-10-16 深圳市国华识别科技开发有限公司 一种多媒体设备语音控制系统及方法
JP6729555B2 (ja) * 2015-03-23 2020-07-22 ソニー株式会社 情報処理システムおよび情報処理方法
EP3451335B1 (en) 2016-04-29 2023-06-14 Vtouch Co., Ltd. Optimum control method based on multi-mode command of operation-voice, and electronic device to which same is applied
JP6855737B2 (ja) * 2016-10-05 2021-04-07 富士ゼロックス株式会社 情報処理装置、評価システムおよびプログラム
KR102392087B1 (ko) 2017-07-10 2022-04-29 삼성전자주식회사 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법
WO2019150708A1 (ja) * 2018-02-01 2019-08-08 ソニー株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
JP7259447B2 (ja) * 2019-03-20 2023-04-18 株式会社リコー 発話者検出システム、発話者検出方法及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3729179B2 (ja) * 1992-11-02 2005-12-21 松下電器産業株式会社 音声入力装置
JPH07306692A (ja) * 1994-05-13 1995-11-21 Matsushita Electric Ind Co Ltd 音声認識装置及び音声入力装置
JP2004112518A (ja) * 2002-09-19 2004-04-08 Takenaka Komuten Co Ltd 情報提供装置
JP2005004535A (ja) * 2003-06-12 2005-01-06 Mitsubishi Electric Corp 携帯通信端末及び画像処理方法

Similar Documents

Publication Publication Date Title
JP2007094104A5 (ja)
JP5323770B2 (ja) ユーザ指示取得装置、ユーザ指示取得プログラムおよびテレビ受像機
JP5751610B2 (ja) 会話ロボット
JP4992218B2 (ja) 情報処理装置および方法、並びにプログラム
JP5797009B2 (ja) 音声認識装置、ロボット、及び音声認識方法
JP2009222969A (ja) 音声認識ロボットおよび音声認識ロボットの制御方法
CN110750152B (zh) 一种基于唇部动作的人机交互方法和系统
CN109558788B (zh) 静默语音输入辨识方法、计算装置和计算机可读介质
WO2020140840A1 (zh) 用于唤醒可穿戴设备的方法及装置
JP2006251266A (ja) 視聴覚連携認識方法および装置
KR100822880B1 (ko) 지능형 로봇 환경에서 오디오-비디오 기반 음원추적을 통한화자 인식 시스템 및 방법
CN110097875A (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN110223711A (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
WO2017219450A1 (zh) 一种信息处理方法、装置及移动终端
WO2007138503A1 (en) Method of driving a speech recognition system
Rekik et al. Human machine interaction via visual speech spotting
JP6147198B2 (ja) ロボット
Haider et al. Towards speaker detection using lips movements for humanmachine multiparty dialogue
US20150039314A1 (en) Speech recognition method and apparatus based on sound mapping
KR20210066774A (ko) 멀티모달 기반 사용자 구별 방법 및 장치
Navarathna et al. Visual voice activity detection using frontal versus profile views
JP4650888B2 (ja) 発話検出装置、方法及びプログラム
Yau et al. Visual speech recognition using motion features and hidden markov models
JP2002224981A (ja) 人の姿勢を感知するロボット
Yoshinaga et al. Audio-visual speech recognition using new lip features extracted from side-face images