JP5465166B2 - 発声内容認識装置および発声内容認識方法 - Google Patents
発声内容認識装置および発声内容認識方法 Download PDFInfo
- Publication number
- JP5465166B2 JP5465166B2 JP2010287127A JP2010287127A JP5465166B2 JP 5465166 B2 JP5465166 B2 JP 5465166B2 JP 2010287127 A JP2010287127 A JP 2010287127A JP 2010287127 A JP2010287127 A JP 2010287127A JP 5465166 B2 JP5465166 B2 JP 5465166B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- mouth
- voice
- unit
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
口元探索部、126 口元認識部、128 口元認識学習部、130 音声取得部、132 音声認識機能部、134 信号レベル計測部、136 音声認識部、140 指向性制御部、142 認識・学習判定部、144 統合処理部
Claims (4)
- 収音手段と、
画像を撮影する撮影手段と、
前記収音される音声に基づく音声認識を行う音声認識手段と、
前記撮影される画像に前記収音手段に対し音声を発する発声者の口元が含まれていない場合に、前記音声認識手段が音声認識を行うことを制限する音声認識実施制限手段と、
前記撮影される画像に含まれる前記発声者の口元の形状又は該形状の推移に基づいて口元認識を行う口元認識手段と、
前記音声認識手段の認識結果と、前記撮影される画像に含まれる前記発声者の口元の形状又は該形状の推移と、に基づいて、前記口元認識手段による口元認識の学習を行う口元認識学習手段と、
前記収音手段により収音される音声から抽出される特徴パターンに基づいて、前記発声者が発した音声を含む音声を、該発声者が発した音声である音声信号とその他の雑音信号とに分離し、該分離された音声信号および雑音信号に基づく収音状態の良さを示す収音状態評価値を取得する収音状態評価値取得手段と、を含み、
前記口元認識学習手段による学習は、前記収音状態評価値により示される収音状態が所定閾値以上である場合の前記音声認識手段の認識結果に基づいて行われる、
ことを特徴とする発声内容認識装置。 - 請求項1に記載の発声内容認識装置において、
前記撮影手段は、前記画像を順次撮影し、
前記音声認識実施制限手段は、前記撮影される画像に口元が含まれている場合であっても、順次取得された該画像により示される口元が動いていない場合に、前記音声認識手段が音声認識を行うことを制限する、
ことを特徴とする発声内容認識装置。 - 請求項1又は2に記載の発声内容認識装置において、
前記撮影される画像に含まれる口元に向けて、前記収音手段の指向性を合わせる音声指向性制御手段、
をさらに含むことを特徴とする発声内容認識装置。 - 収音される音声に基づく音声認識を行うステップAと、
撮影される画像に音声を発する発声者の口元が含まれていない場合に、前記音声認識を行うことを制限するステップBと、
前記撮影される画像に含まれる前記発声者の口元の形状又は該形状の推移に基づいて口元認識を行うステップCと、
前記音声認識の認識結果と、前記撮影される画像に含まれる前記発声者の口元の形状又は該形状の推移と、に基づいて、前記口元認識の学習を行うステップDと、
前記収音される音声から抽出される特徴パターンに基づいて、前記発声者が発した音声を含む音声を、該発声者が発した音声である音声信号とその他の雑音信号とに分離し、該分離された音声信号および雑音信号に基づく収音状態の良さを示す収音状態評価値を取得するステップEと、を含み、
前記ステップDによる学習は、前記収音状態評価値により示される収音状態が所定閾値以上である場合の前記音声認識の認識結果に基づいて行われる、
ことを特徴とする発声内容認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010287127A JP5465166B2 (ja) | 2010-12-24 | 2010-12-24 | 発声内容認識装置および発声内容認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010287127A JP5465166B2 (ja) | 2010-12-24 | 2010-12-24 | 発声内容認識装置および発声内容認識方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005020813A Division JP4847022B2 (ja) | 2005-01-28 | 2005-01-28 | 発声内容認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011070224A JP2011070224A (ja) | 2011-04-07 |
JP5465166B2 true JP5465166B2 (ja) | 2014-04-09 |
Family
ID=44015488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010287127A Expired - Fee Related JP5465166B2 (ja) | 2010-12-24 | 2010-12-24 | 発声内容認識装置および発声内容認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5465166B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014186713A (ja) * | 2013-02-21 | 2014-10-02 | Panasonic Corp | 会話システムおよびその会話処理方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03129400A (ja) * | 1989-10-13 | 1991-06-03 | Seiko Epson Corp | 音声認識装置 |
JP4675514B2 (ja) * | 2001-07-16 | 2011-04-27 | シャープ株式会社 | 音声処理装置、音声処理方法、及びその方法を実施するためのプログラムを記録したコンピュータにより読取り可能な記録媒体 |
JP3891023B2 (ja) * | 2002-04-01 | 2007-03-07 | 日本電気株式会社 | 通訳システム及びプログラム |
JP2004240154A (ja) * | 2003-02-06 | 2004-08-26 | Hitachi Ltd | 情報認識装置 |
JP2004246095A (ja) * | 2003-02-14 | 2004-09-02 | Nec Saitama Ltd | 携帯電話装置及び遠隔制御方法 |
-
2010
- 2010-12-24 JP JP2010287127A patent/JP5465166B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011070224A (ja) | 2011-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4847022B2 (ja) | 発声内容認識装置 | |
JP4204541B2 (ja) | 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム | |
JP6230726B2 (ja) | 音声認識装置および音声認識方法 | |
JP4729927B2 (ja) | 音声検出装置、自動撮像装置、および音声検出方法 | |
US9330673B2 (en) | Method and apparatus for performing microphone beamforming | |
JP4715738B2 (ja) | 発話検出装置及び発話検出方法 | |
WO2019044157A1 (ja) | 収音装置、収音方法、及びプログラム | |
CN105989836B (zh) | 一种语音采集方法、装置及终端设备 | |
JP2006251266A (ja) | 視聴覚連携認識方法および装置 | |
JP4825552B2 (ja) | 音声認識装置、周波数スペクトル取得装置および音声認識方法 | |
CN113643707A (zh) | 一种身份验证方法、装置和电子设备 | |
CN107533415B (zh) | 声纹检测的方法和装置 | |
JP5465166B2 (ja) | 発声内容認識装置および発声内容認識方法 | |
JP6607092B2 (ja) | 案内ロボット制御システム、プログラム及び案内ロボット | |
JP2001067098A (ja) | 人物検出方法と人物検出機能搭載装置 | |
CN110653812B (zh) | 一种机器人的交互方法、机器人及具有存储功能的装置 | |
JP6916130B2 (ja) | 話者推定方法および話者推定装置 | |
KR20210039583A (ko) | 멀티모달 기반 사용자 구별 방법 및 장치 | |
KR101353936B1 (ko) | 음성 인식 장치 및 음성 인식 방법 | |
JP4781248B2 (ja) | 撮像装置、撮像装置の制御方法、プログラム及び記録媒体 | |
CN110033790B (zh) | 声音认识装置、机器人、声音认识方法以及记录介质 | |
JP2020086034A (ja) | 情報処理装置、情報処理装置およびプログラム | |
EP4178220A1 (en) | Voice-input device | |
JP2024046308A (ja) | 撮像装置、制御方法、およびプログラム | |
CN112948792A (zh) | 一种解锁方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5465166 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |