JP2007094104A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2007094104A5 JP2007094104A5 JP2005284521A JP2005284521A JP2007094104A5 JP 2007094104 A5 JP2007094104 A5 JP 2007094104A5 JP 2005284521 A JP2005284521 A JP 2005284521A JP 2005284521 A JP2005284521 A JP 2005284521A JP 2007094104 A5 JP2007094104 A5 JP 2007094104A5
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- motion pattern
- speech
- information processing
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 claims 5
- 230000003287 optical Effects 0.000 claims 3
- 238000003672 processing method Methods 0.000 claims 2
- 210000003491 Skin Anatomy 0.000 claims 1
Claims (8)
- 話者が撮影された映像から、前記話者の体の複数部分の動きパターンを検出する検出手段と、
検出された前記動きパターンが、前記話者による発話時の動きパターンであるか否かを判定する判定手段と、
検出された前記動きパターンの判定による判定結果に基づいて、前記話者による発話時の音声を認識する音声認識手段と
を備える情報処理装置。 - 前記検出手段は、
前記映像に基づいて、前記話者の体の複数部分のうち、動きを検出する対象であるトラッキング対象を決定するトラッキング対象決定手段と、
前記映像から、決定された前記トラッキング対象のオプティカルフローを検出するオプティカルフロー検出手段と、
検出された前記オプティカルフローに基づいて、前記トラッキング対象の動きを認識する動き認識手段と、
認識された前記動きが、予め想定した動きの想定範囲内である場合、前記動きを追跡する動き追跡手段と、
追跡された前記動きに基づいて、前記トラッキング対象の動きパターンを決定する動きパターン決定手段と
を有する請求項1に記載の情報処理装置。 - 前記トラッキング対象決定手段は、前記映像内の前記話者の顔を表す肌色領域に基づいて、前記話者の顔を、前記トラッキング対象として決定する
請求項2に記載の情報処理装置。 - 前記判定手段は、隠れマルコフモデル、又はベイジアンネットワークのいずれか一方を用いて、検出された前記動きパターンが、前記話者による発話時の動きパターンであるか否かを判定する
請求項1に記載の情報処理装置。 - 前記音声認識手段は、検出された前記動きパターンが、前記話者による発話時の動きパターンであると判定された場合、前記話者による発話時の音声を認識する
請求項1に記載の情報処理装置。 - 前記検出手段は、少なくとも、前記話者の口及び頭の動きパターンを検出する
請求項1に記載の情報処理装置。 - 話者の体の複数部分の動きパターンに基づいて、前記話者による発話時の音声を認識する情報処理装置の情報処理方法において、
話者が撮影された映像から、前記話者の体の複数部分の動きパターンを検出する検出ステップと、
検出された前記動きパターンが、前記話者による発話時の動きパターンであるか否かを判定する判定ステップと、
検出された前記動きパターンの判定による判定結果に基づいて、前記話者による発話時の音声を認識する音声認識ステップと
を含む情報処理方法。 - 話者が撮影された映像から、前記話者の体の複数部分の動きパターンを検出する検出ステップと、
検出された前記動きパターンが、前記話者による発話時の動きパターンであるか否かを判定する判定ステップと、
検出された前記動きパターンの判定による判定結果に基づいて、前記話者による発話時の音声を認識する音声認識ステップと
を含む処理をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005284521A JP4992218B2 (ja) | 2005-09-29 | 2005-09-29 | 情報処理装置および方法、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005284521A JP4992218B2 (ja) | 2005-09-29 | 2005-09-29 | 情報処理装置および方法、並びにプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007094104A JP2007094104A (ja) | 2007-04-12 |
JP2007094104A5 true JP2007094104A5 (ja) | 2008-11-13 |
JP4992218B2 JP4992218B2 (ja) | 2012-08-08 |
Family
ID=37979893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005284521A Expired - Fee Related JP4992218B2 (ja) | 2005-09-29 | 2005-09-29 | 情報処理装置および方法、並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4992218B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009157905A (ja) * | 2007-12-07 | 2009-07-16 | Sony Corp | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
KR20210152028A (ko) | 2008-11-10 | 2021-12-14 | 구글 엘엘씨 | 멀티센서 음성 검출 |
JP5797009B2 (ja) * | 2011-05-19 | 2015-10-21 | 三菱重工業株式会社 | 音声認識装置、ロボット、及び音声認識方法 |
JP2013142843A (ja) * | 2012-01-12 | 2013-07-22 | Fuji Xerox Co Ltd | 動作解析装置、音声取得装置、および、動作解析システム |
BR112014018604B1 (pt) | 2012-04-27 | 2022-02-01 | Hewlett-Packard Development Company, L.P. | Dispositivo de computação, método para receber entrada de áudio e meio legível por computador não volátil |
CN102945672B (zh) | 2012-09-29 | 2013-10-16 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
JP6729555B2 (ja) * | 2015-03-23 | 2020-07-22 | ソニー株式会社 | 情報処理システムおよび情報処理方法 |
EP3451335B1 (en) | 2016-04-29 | 2023-06-14 | Vtouch Co., Ltd. | Optimum control method based on multi-mode command of operation-voice, and electronic device to which same is applied |
JP6855737B2 (ja) * | 2016-10-05 | 2021-04-07 | 富士ゼロックス株式会社 | 情報処理装置、評価システムおよびプログラム |
KR102392087B1 (ko) | 2017-07-10 | 2022-04-29 | 삼성전자주식회사 | 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법 |
WO2019150708A1 (ja) * | 2018-02-01 | 2019-08-08 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
JP7259447B2 (ja) * | 2019-03-20 | 2023-04-18 | 株式会社リコー | 発話者検出システム、発話者検出方法及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3729179B2 (ja) * | 1992-11-02 | 2005-12-21 | 松下電器産業株式会社 | 音声入力装置 |
JPH07306692A (ja) * | 1994-05-13 | 1995-11-21 | Matsushita Electric Ind Co Ltd | 音声認識装置及び音声入力装置 |
JP2004112518A (ja) * | 2002-09-19 | 2004-04-08 | Takenaka Komuten Co Ltd | 情報提供装置 |
JP2005004535A (ja) * | 2003-06-12 | 2005-01-06 | Mitsubishi Electric Corp | 携帯通信端末及び画像処理方法 |
-
2005
- 2005-09-29 JP JP2005284521A patent/JP4992218B2/ja not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007094104A5 (ja) | ||
JP5323770B2 (ja) | ユーザ指示取得装置、ユーザ指示取得プログラムおよびテレビ受像機 | |
JP5751610B2 (ja) | 会話ロボット | |
JP4992218B2 (ja) | 情報処理装置および方法、並びにプログラム | |
JP5797009B2 (ja) | 音声認識装置、ロボット、及び音声認識方法 | |
JP2009222969A (ja) | 音声認識ロボットおよび音声認識ロボットの制御方法 | |
CN110750152B (zh) | 一种基于唇部动作的人机交互方法和系统 | |
CN109558788B (zh) | 静默语音输入辨识方法、计算装置和计算机可读介质 | |
WO2020140840A1 (zh) | 用于唤醒可穿戴设备的方法及装置 | |
JP2006251266A (ja) | 視聴覚連携認識方法および装置 | |
KR100822880B1 (ko) | 지능형 로봇 환경에서 오디오-비디오 기반 음원추적을 통한화자 인식 시스템 및 방법 | |
CN110097875A (zh) | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 | |
CN110223711A (zh) | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 | |
WO2017219450A1 (zh) | 一种信息处理方法、装置及移动终端 | |
WO2007138503A1 (en) | Method of driving a speech recognition system | |
Rekik et al. | Human machine interaction via visual speech spotting | |
JP6147198B2 (ja) | ロボット | |
Haider et al. | Towards speaker detection using lips movements for humanmachine multiparty dialogue | |
US20150039314A1 (en) | Speech recognition method and apparatus based on sound mapping | |
KR20210066774A (ko) | 멀티모달 기반 사용자 구별 방법 및 장치 | |
Navarathna et al. | Visual voice activity detection using frontal versus profile views | |
JP4650888B2 (ja) | 発話検出装置、方法及びプログラム | |
Yau et al. | Visual speech recognition using motion features and hidden markov models | |
JP2002224981A (ja) | 人の姿勢を感知するロボット | |
Yoshinaga et al. | Audio-visual speech recognition using new lip features extracted from side-face images |