JP2012132950A - 音声認識装置、音声認識方法および音声認識プログラム - Google Patents
音声認識装置、音声認識方法および音声認識プログラム Download PDFInfo
- Publication number
- JP2012132950A JP2012132950A JP2010282438A JP2010282438A JP2012132950A JP 2012132950 A JP2012132950 A JP 2012132950A JP 2010282438 A JP2010282438 A JP 2010282438A JP 2010282438 A JP2010282438 A JP 2010282438A JP 2012132950 A JP2012132950 A JP 2012132950A
- Authority
- JP
- Japan
- Prior art keywords
- template
- signal
- unit
- speech recognition
- meta information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】オンラインテンプレート収集部140が、コントローラ200から取得するメタ情報と、発話区間の信号とを基にして、テンプレートメモリ142に記憶されたテンプレートを順次更新する。テンプレート選択部150は、入力信号と一致度の高いテンプレートをテンプレートメモリ142から検索し、雑音除去部160に出力する。雑音除去部160は、入力信号からテンプレートの信号を除去することで雑音成分を除去し、音声認識部170が、雑音成分の除去された信号に対して音声認識を実行する。
【選択図】図1
Description
前記発話区間検出部によって検出された発話区間の信号と、記憶部に記憶された複数のテンプレートの信号とをそれぞれ比較して、一致度が閾値以上であるテンプレートが存在するか否かを判定し、
前記一致度が閾値以上のテンプレートが存在する場合には、該テンプレートの信号と前記発話区間の信号とを平均化した値によって前記テンプレートの信号を更新し、
前記一致度が閾値未満の場合には、前記発話区間の信号をテンプレートの信号として前記記憶部に記憶するテンプレート更新部と、
前記記憶部に記憶されたテンプレートを利用して前記集音装置が取得する信号から雑音成分を除去する雑音除去部と、
前記雑音除去部が雑音成分を除去した発話区間の信号を基にして、音声認識を実行する音声認識部と
を有することを特徴とする音声認識装置。
集音装置から取得する信号に基づいて、該信号に含まれる発話区間の信号を検出し、
検出した前記発話区間の信号と、記憶装置に記憶された複数のテンプレートの信号とをそれぞれ比較して、一致度が閾値以上であるテンプレートが存在するか否かを判定し、
前記一致度が閾値以上のテンプレートが存在する場合には、該テンプレートの信号と前記発話区間の信号とを平均化した値によって前記テンプレートの信号を更新し、
前記一致度が閾値未満の場合には、前記発話区間の情報をテンプレートの信号として前記記憶装置に記憶し、
前記記憶装置に記憶されたテンプレートを利用して前記発話区間の雑音成分を除去し、音声認識を実行することを特徴とする音声認識方法。
集音装置から取得する信号に基づいて、該信号に含まれる発話区間の信号を検出し、
検出した前記発話区間の信号と、記憶装置に記憶された複数のテンプレートの信号とをそれぞれ比較して、一致度が閾値以上であるテンプレートが存在するか否かを判定し、
前記一致度が閾値以上のテンプレートが存在する場合には、該テンプレートの信号と前記発話区間の信号とを平均化した値によって前記テンプレートの信号を更新し、
前記一致度が閾値未満の場合には、前記発話区間の情報をテンプレートの信号として前記記憶装置に記憶し、
前記記憶装置に記憶されたテンプレートを利用して前記発話区間の雑音成分を除去し、音声認識を実行させる音声認識プログラム。
120 ADC部
130 ディレイ部
140 オンラインテンプレート収集部
150 テンプレート選択部
160 雑音除去部
170 音声認識部
200 コントローラ
Claims (8)
- 集音装置から取得する信号に基づいて、該信号に含まれる発話区間を検出する発話区間検出部と、
前記発話区間検出部によって検出された発話区間の信号と、記憶部に記憶された複数のテンプレートの信号とをそれぞれ比較して、一致度が閾値以上であるテンプレートが存在するか否かを判定し、
前記一致度が閾値以上のテンプレートが存在する場合には、該テンプレートの信号と前記発話区間の信号とを平均化した値によって前記テンプレートの信号を更新し、
前記一致度が閾値未満の場合には、前記発話区間の信号をテンプレートの信号として前記記憶部に記憶するテンプレート更新部と、
前記記憶部に記憶されたテンプレートを利用して前記集音装置が取得する信号から雑音成分を除去する雑音除去部と、
前記雑音除去部が雑音成分を除去した発話区間の信号を基にして、音声認識を実行する音声認識部と
を有することを特徴とする音声認識装置。 - 前記記憶部は、動作体の駆動状態を含むメタ情報とテンプレートとを対応付けて記憶し、前記テンプレート更新部は、前記発話区間の信号に対応するメタ情報を基にして、発話区間のメタ情報と類似のメタ情報に対応づけられたテンプレートを検索し、検索したテンプレートの信号と発話区間の信号との一致度が閾値以上か否かを判定することを特徴とする請求項1に記載の音声認識装置。
- 前記雑音除去部は、前記集音装置から取得した信号と前記記憶部に記憶された複数のテンプレートの信号とをそれぞれ比較して、一致度が閾値以上となるテンプレートを選択し、選択したテンプレートを利用して信号の雑音成分を除去することを特徴とする請求項1または2に記載の音声認識装置。
- 前記雑音除去部は、前記集音装置から取得した信号の一部と、前記記憶部に記憶された複数のテンプレートの信号の一部とをそれぞれ比較し、一致度が閾値以上となるテンプレートを選択することを特徴とする請求項3に記載の音声認識装置。
- 前記雑音除去部は、前記集音装置から取得した時点で得られるメタ情報と類似のメタ情報に対応づけられたテンプレートを前記記憶部から検索し、検索したテンプレートの信号と集音装置から取得した信号との一致度が閾値以上か否かを判定することを特徴とする請求項3または4に記載の音声認識装置。
- 前記雑音除去部は、複数のテンプレートの信号を位相に基づいて合成し、集音装置が集音した信号から合成したテンプレートの信号を除去することで、雑音成分を除去することを特徴とする請求項3、4または5に記載の音声認識装置。
- コンピュータが実行する音声認識方法であって、
集音装置から取得する信号に基づいて、該信号に含まれる発話区間の信号を検出し、
検出した前記発話区間の信号と、記憶装置に記憶された複数のテンプレートの信号とをそれぞれ比較して、一致度が閾値以上であるテンプレートが存在するか否かを判定し、
前記一致度が閾値以上のテンプレートが存在する場合には、該テンプレートの信号と前記発話区間の信号とを平均化した値によって前記テンプレートの信号を更新し、
前記一致度が閾値未満の場合には、前記発話区間の情報をテンプレートの信号として前記記憶装置に記憶し、
前記記憶装置に記憶されたテンプレートを利用して前記発話区間の雑音成分を除去し、音声認識を実行することを特徴とする音声認識方法。 - コンピュータに、
集音装置から取得する信号に基づいて、該信号に含まれる発話区間の信号を検出し、
検出した前記発話区間の信号と、記憶装置に記憶された複数のテンプレートの信号とをそれぞれ比較して、一致度が閾値以上であるテンプレートが存在するか否かを判定し、
前記一致度が閾値以上のテンプレートが存在する場合には、該テンプレートの信号と前記発話区間の信号とを平均化した値によって前記テンプレートの信号を更新し、
前記一致度が閾値未満の場合には、前記発話区間の情報をテンプレートの信号として前記記憶装置に記憶し、
前記記憶装置に記憶されたテンプレートを利用して前記発話区間の雑音成分を除去し、音声認識を実行させる音声認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010282438A JP5724361B2 (ja) | 2010-12-17 | 2010-12-17 | 音声認識装置、音声認識方法および音声認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010282438A JP5724361B2 (ja) | 2010-12-17 | 2010-12-17 | 音声認識装置、音声認識方法および音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012132950A true JP2012132950A (ja) | 2012-07-12 |
JP5724361B2 JP5724361B2 (ja) | 2015-05-27 |
Family
ID=46648662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010282438A Active JP5724361B2 (ja) | 2010-12-17 | 2010-12-17 | 音声認識装置、音声認識方法および音声認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5724361B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020095091A (ja) * | 2018-12-10 | 2020-06-18 | コニカミノルタ株式会社 | 音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8039552B2 (en) | 2008-07-04 | 2011-10-18 | Sumitomo Chemical Company, Limited | Process for producing propylene block copolymer |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0293697A (ja) * | 1988-09-30 | 1990-04-04 | Sanyo Electric Co Ltd | 雑音除去方法 |
JPH04295897A (ja) * | 1991-03-26 | 1992-10-20 | Sanyo Electric Co Ltd | 神経回路網モデルによる音声認識方法 |
JP2000029500A (ja) * | 1998-07-08 | 2000-01-28 | Denso Corp | 雑音抑圧装置及び当該装置を用いた音声認識システム |
US20020035471A1 (en) * | 2000-05-09 | 2002-03-21 | Thomson-Csf | Method and device for voice recognition in environments with fluctuating noise levels |
JP2002513479A (ja) * | 1997-07-04 | 2002-05-08 | セクスタン アビオニク | ノイズを含む音声信号内のノイズモデルを探索する方法 |
JP2003308092A (ja) * | 2002-04-15 | 2003-10-31 | Mitsubishi Electric Corp | 雑音除去装置及び雑音除去方法 |
JP2004325936A (ja) * | 2003-04-25 | 2004-11-18 | Pioneer Electronic Corp | 音声認識装置、音声認識方法、並びに、音声認識プログラムおよびそれを記録した記録媒体 |
JP2005070367A (ja) * | 2003-08-22 | 2005-03-17 | Sharp Corp | 信号分析装置、信号処理装置、音声認識装置、信号分析プログラム、信号処理プログラムおよび音声認識プログラム、記録媒体、並びに電子機器 |
JP2006039267A (ja) * | 2004-07-28 | 2006-02-09 | Nissan Motor Co Ltd | 音声入力装置 |
JP2006047639A (ja) * | 2004-08-04 | 2006-02-16 | Advanced Telecommunication Research Institute International | 雑音除去装置 |
JP2007072481A (ja) * | 2006-11-20 | 2007-03-22 | Ricoh Co Ltd | 音声認識システムおよび音声認識方法および記録媒体 |
US20080071540A1 (en) * | 2006-09-13 | 2008-03-20 | Honda Motor Co., Ltd. | Speech recognition method for robot under motor noise thereof |
JP2008116686A (ja) * | 2006-11-06 | 2008-05-22 | Nec Engineering Ltd | 雑音抑圧装置 |
JP2008250059A (ja) * | 2007-03-30 | 2008-10-16 | Advanced Telecommunication Research Institute International | 音声認識装置、音声認識システムおよび音声認識方法 |
US20090076813A1 (en) * | 2007-09-19 | 2009-03-19 | Electronics And Telecommunications Research Institute | Method for speech recognition using uncertainty information for sub-bands in noise environment and apparatus thereof |
WO2010052749A1 (ja) * | 2008-11-04 | 2010-05-14 | 三菱電機株式会社 | 雑音抑圧装置 |
-
2010
- 2010-12-17 JP JP2010282438A patent/JP5724361B2/ja active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0293697A (ja) * | 1988-09-30 | 1990-04-04 | Sanyo Electric Co Ltd | 雑音除去方法 |
JPH04295897A (ja) * | 1991-03-26 | 1992-10-20 | Sanyo Electric Co Ltd | 神経回路網モデルによる音声認識方法 |
JP2002513479A (ja) * | 1997-07-04 | 2002-05-08 | セクスタン アビオニク | ノイズを含む音声信号内のノイズモデルを探索する方法 |
JP2000029500A (ja) * | 1998-07-08 | 2000-01-28 | Denso Corp | 雑音抑圧装置及び当該装置を用いた音声認識システム |
US20020035471A1 (en) * | 2000-05-09 | 2002-03-21 | Thomson-Csf | Method and device for voice recognition in environments with fluctuating noise levels |
JP2003308092A (ja) * | 2002-04-15 | 2003-10-31 | Mitsubishi Electric Corp | 雑音除去装置及び雑音除去方法 |
JP2004325936A (ja) * | 2003-04-25 | 2004-11-18 | Pioneer Electronic Corp | 音声認識装置、音声認識方法、並びに、音声認識プログラムおよびそれを記録した記録媒体 |
JP2005070367A (ja) * | 2003-08-22 | 2005-03-17 | Sharp Corp | 信号分析装置、信号処理装置、音声認識装置、信号分析プログラム、信号処理プログラムおよび音声認識プログラム、記録媒体、並びに電子機器 |
JP2006039267A (ja) * | 2004-07-28 | 2006-02-09 | Nissan Motor Co Ltd | 音声入力装置 |
JP2006047639A (ja) * | 2004-08-04 | 2006-02-16 | Advanced Telecommunication Research Institute International | 雑音除去装置 |
US20080071540A1 (en) * | 2006-09-13 | 2008-03-20 | Honda Motor Co., Ltd. | Speech recognition method for robot under motor noise thereof |
JP2008116686A (ja) * | 2006-11-06 | 2008-05-22 | Nec Engineering Ltd | 雑音抑圧装置 |
JP2007072481A (ja) * | 2006-11-20 | 2007-03-22 | Ricoh Co Ltd | 音声認識システムおよび音声認識方法および記録媒体 |
JP2008250059A (ja) * | 2007-03-30 | 2008-10-16 | Advanced Telecommunication Research Institute International | 音声認識装置、音声認識システムおよび音声認識方法 |
US20090076813A1 (en) * | 2007-09-19 | 2009-03-19 | Electronics And Telecommunications Research Institute | Method for speech recognition using uncertainty information for sub-bands in noise environment and apparatus thereof |
WO2010052749A1 (ja) * | 2008-11-04 | 2010-05-14 | 三菱電機株式会社 | 雑音抑圧装置 |
Non-Patent Citations (1)
Title |
---|
JPN6014019949; 谷口賢一,外2名: '適応的に雑音を推定するスペクトルサブトラクション法' 電子情報通信学会技術研究報告 , 199503, pp.63-68, 社団法人電子情報通信学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020095091A (ja) * | 2018-12-10 | 2020-06-18 | コニカミノルタ株式会社 | 音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム |
JP7119967B2 (ja) | 2018-12-10 | 2022-08-17 | コニカミノルタ株式会社 | 音声認識装置、画像形成装置、音声認識方法よび音声認識プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5724361B2 (ja) | 2015-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105741836B (zh) | 声音识别装置以及声音识别方法 | |
US11250843B2 (en) | Speech recognition method and speech recognition device | |
JP5218052B2 (ja) | 言語モデル生成システム、言語モデル生成方法および言語モデル生成用プログラム | |
JP5949550B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
JP6844608B2 (ja) | 音声処理装置および音声処理方法 | |
JP2017509009A (ja) | オーディオストリームの中の音楽の追跡 | |
JP2018136493A (ja) | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 | |
JP2015069063A (ja) | 音声認識システム、音声認識方法、及び音声認識プログラム | |
US11823669B2 (en) | Information processing apparatus and information processing method | |
JP5724361B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP4906776B2 (ja) | 音声制御装置 | |
JP2013022188A (ja) | 歩容解析方法、歩容解析装置及びそのプログラム | |
CN111918196B (zh) | 一种音频采集器录音异常的诊断方法、装置、设备及存储介质 | |
CN113271386B (zh) | 啸叫检测方法及装置、存储介质、电子设备 | |
JP5388447B2 (ja) | 発音期間を特定する音信号処理装置および音信号処理方法 | |
CN110070891B (zh) | 一种歌曲识别方法、装置以及存储介质 | |
US10964311B2 (en) | Word detection system, word detection method, and storage medium | |
JP2004109712A (ja) | 話者方向検出装置 | |
JP2014186347A (ja) | 話者速度変換システムおよびその方法ならびに速度変換装置 | |
WO2011110897A1 (en) | Device and method for context recognition | |
JP2011039434A (ja) | 音声認識装置およびその特徴量正規化方法 | |
JPWO2020183845A1 (ja) | 音響処理方法 | |
JP4659556B2 (ja) | 音源方向検出装置 | |
EP3660842A1 (en) | Voice operation apparatus and control method therefor | |
Balamurali et al. | Automated Classification of Vowel-Gesture Parameters Using External Broadband Excitation. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130904 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150316 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5724361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |