JP2011070224A - 発声内容認識装置 - Google Patents
発声内容認識装置 Download PDFInfo
- Publication number
- JP2011070224A JP2011070224A JP2010287127A JP2010287127A JP2011070224A JP 2011070224 A JP2011070224 A JP 2011070224A JP 2010287127 A JP2010287127 A JP 2010287127A JP 2010287127 A JP2010287127 A JP 2010287127A JP 2011070224 A JP2011070224 A JP 2011070224A
- Authority
- JP
- Japan
- Prior art keywords
- mouth
- recognition
- voice
- unit
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】収音する収音器16と、収音器16に対し音声を発する発声者の画像を撮影する撮影機18と、前記収音される音声に基づく音声認識を行う音声認識機能部132と、前記撮影される画像に前記発声者の少なくとも一部を示す発声者画像が含まれていない場合に、音声認識機能部132が音声認識を行うことを制限する認識・学習判定部142と、を含むことを特徴とする発声内容認識装置10。
【選択図】図2
Description
口元探索部、126 口元認識部、128 口元認識学習部、130 音声取得部、132 音声認識機能部、134 信号レベル計測部、136 音声認識部、140 指向性制御部、142 認識・学習判定部、144 統合処理部
Claims (7)
- 収音する収音手段と、
前記収音手段に対し音声を発する発声者の画像を撮影する撮影手段と、
前記収音される音声に基づく音声認識を行う音声認識手段と、
前記撮影される画像に前記発声者の少なくとも一部を示す発声者画像が含まれていない場合に、前記音声認識手段が音声認識を行うことを制限する音声認識実施制限手段と、
を含むことを特徴とする発声内容認識装置。 - 請求項1に記載の発声内容認識装置において、
前記発声者画像は前記発声者の口元を示す口元画像である、
ことを特徴とする発声内容認識装置。 - 請求項2に記載の発声内容認識装置において、
前記撮影手段は、前記画像を順次撮影し、
前記音声認識実施制限手段は、前記撮影される画像に前記口元画像が含まれている場合であっても、順次取得された該口元画像により示される口元が動いていない場合に、前記音声認識手段が音声認識を行うことを制限する、
ことを特徴とする発声内容認識装置。 - 請求項2又は3に記載の発声内容認識装置において、
前記撮影される画像に含まれる前記口元画像により示される口元に向けて、前記音声取得手段の指向性を合わせる音声指向性制御手段、
をさらに含むことを特徴とする発声内容認識装置。 - 請求項2乃至4のいずれか一項に記載の発声内容認識装置において、
前記撮影される画像に含まれる前記口元画像により示される発声者の口元の形状又は該形状の推移に基づいて口元認識を行う口元認識手段と、
前記収音される音声に基づく前記音声認識手段の認識結果と、該音声の発声者が該音声を発する際の前記撮影される画像に含まれる口元画像により示される口元の形状又は該形状の推移と、に基づいて、前記口元認識手段による口元認識の学習を行う口元認識学習手段と、
をさらに含むことを特徴とする発声内容認識装置。 - 請求項5に記載の発声内容認識装置において、
前記収音手段により収音される音声の収音状態の良さを示す収音状態評価値を取得する収音状態評価値取得手段、
をさらに含み、
前記口元認識学習手段による学習は、前記収音状態評価値により示される収音状態が所定閾値以上である場合の前記音声認識手段の認識結果に基づいて行われる、
ことを特徴とする発声内容認識装置。 - 収音する収音手段と、
前記収音手段に対し音声を発する発声者の口元を示す口元画像を撮影する撮影手段と、
前記収音手段により収音される音声の収音状態の良さを示す収音状態評価値を取得する収音状態評価値取得手段と、
前記収音される音声に基づく音声認識を行う音声認識手段と、
前記撮影される画像に含まれる前記口元画像により示される発声者の口元の形状又は該形状の推移に基づいて口元認識を行う口元認識手段と、
前記収音状態評価値により示される収音状態に応じて、前記音声認識手段又は前記口元認識手段のいずれにより認識を行うか決定する決定手段と、
を含むことを特徴とする発声内容認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010287127A JP5465166B2 (ja) | 2010-12-24 | 2010-12-24 | 発声内容認識装置および発声内容認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010287127A JP5465166B2 (ja) | 2010-12-24 | 2010-12-24 | 発声内容認識装置および発声内容認識方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005020813A Division JP4847022B2 (ja) | 2005-01-28 | 2005-01-28 | 発声内容認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011070224A true JP2011070224A (ja) | 2011-04-07 |
JP5465166B2 JP5465166B2 (ja) | 2014-04-09 |
Family
ID=44015488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010287127A Expired - Fee Related JP5465166B2 (ja) | 2010-12-24 | 2010-12-24 | 発声内容認識装置および発声内容認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5465166B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014186713A (ja) * | 2013-02-21 | 2014-10-02 | Panasonic Corp | 会話システムおよびその会話処理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03129400A (ja) * | 1989-10-13 | 1991-06-03 | Seiko Epson Corp | 音声認識装置 |
JP2003029777A (ja) * | 2001-07-16 | 2003-01-31 | Sharp Corp | 音声処理装置、音声処理方法、及びその方法を実施するためのプログラムを記録した記録媒体 |
JP2003295892A (ja) * | 2002-04-01 | 2003-10-15 | Nec Corp | 通訳システム及びプログラム |
JP2004240154A (ja) * | 2003-02-06 | 2004-08-26 | Hitachi Ltd | 情報認識装置 |
JP2004246095A (ja) * | 2003-02-14 | 2004-09-02 | Nec Saitama Ltd | 携帯電話装置及び遠隔制御方法 |
-
2010
- 2010-12-24 JP JP2010287127A patent/JP5465166B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03129400A (ja) * | 1989-10-13 | 1991-06-03 | Seiko Epson Corp | 音声認識装置 |
JP2003029777A (ja) * | 2001-07-16 | 2003-01-31 | Sharp Corp | 音声処理装置、音声処理方法、及びその方法を実施するためのプログラムを記録した記録媒体 |
JP2003295892A (ja) * | 2002-04-01 | 2003-10-15 | Nec Corp | 通訳システム及びプログラム |
JP2004240154A (ja) * | 2003-02-06 | 2004-08-26 | Hitachi Ltd | 情報認識装置 |
JP2004246095A (ja) * | 2003-02-14 | 2004-09-02 | Nec Saitama Ltd | 携帯電話装置及び遠隔制御方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014186713A (ja) * | 2013-02-21 | 2014-10-02 | Panasonic Corp | 会話システムおよびその会話処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5465166B2 (ja) | 2014-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4847022B2 (ja) | 発声内容認識装置 | |
JP4204541B2 (ja) | 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム | |
EP2052347B1 (en) | Real-time face tracking in a digital image acquisition device | |
JP4729927B2 (ja) | 音声検出装置、自動撮像装置、および音声検出方法 | |
JP4715738B2 (ja) | 発話検出装置及び発話検出方法 | |
WO2019044157A1 (ja) | 収音装置、収音方法、及びプログラム | |
JP6705656B2 (ja) | 視覚補助装置及びオブジェクトの分類の検出方法 | |
JP2006251266A (ja) | 視聴覚連携認識方法および装置 | |
JP2007257088A (ja) | ロボット装置及びそのコミュニケーション方法 | |
CN107533415B (zh) | 声纹检测的方法和装置 | |
JP5465166B2 (ja) | 発声内容認識装置および発声内容認識方法 | |
JP6607092B2 (ja) | 案内ロボット制御システム、プログラム及び案内ロボット | |
JP5940944B2 (ja) | 視聴状況判定装置、識別器構築装置、視聴状況判定方法、識別器構築方法およびプログラム | |
JP2001067098A (ja) | 人物検出方法と人物検出機能搭載装置 | |
JP2020086034A (ja) | 情報処理装置、情報処理装置およびプログラム | |
JP4781248B2 (ja) | 撮像装置、撮像装置の制御方法、プログラム及び記録媒体 | |
KR101353936B1 (ko) | 음성 인식 장치 및 음성 인식 방법 | |
JP2007155985A (ja) | ロボットおよび音声認識装置ならびにその方法 | |
KR20060044008A (ko) | 다수의 화자 분별을 위한 음성 인식장치 | |
CN110033790B (zh) | 声音认识装置、机器人、声音认识方法以及记录介质 | |
CN114586374A (zh) | 拾音装置以及拾音方法 | |
EP4178220A1 (en) | Voice-input device | |
JP2024046308A (ja) | 撮像装置、制御方法、およびプログラム | |
CN112948792A (zh) | 一种解锁方法及装置 | |
JP2020129234A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5465166 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |