JP2011039434A - 音声認識装置およびその特徴量正規化方法 - Google Patents
音声認識装置およびその特徴量正規化方法 Download PDFInfo
- Publication number
- JP2011039434A JP2011039434A JP2009189159A JP2009189159A JP2011039434A JP 2011039434 A JP2011039434 A JP 2011039434A JP 2009189159 A JP2009189159 A JP 2009189159A JP 2009189159 A JP2009189159 A JP 2009189159A JP 2011039434 A JP2011039434 A JP 2011039434A
- Authority
- JP
- Japan
- Prior art keywords
- value
- time
- correction value
- speech recognition
- initial value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010606 normalization Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 claims description 24
- 230000003044 adaptive effect Effects 0.000 claims description 10
- 230000006978 adaptation Effects 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 15
- 238000009825 accumulation Methods 0.000 abstract description 9
- 230000004044 response Effects 0.000 abstract description 7
- 230000007613 environmental effect Effects 0.000 description 6
- 238000009826 distribution Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Abstract
【解決手段】初期補正値蓄積部101には正規化用CM値の初期値cm_initが蓄積されている。各時刻補正値算出部102は、音声認識ごとに所定の時刻周期で入力される音響特徴量x(t)の、認識開始時刻sから現在時刻cまでの経過期間TcにおけるCM値[cm_current(c)]を算出する。補正値更新部103は、現在の初期CM値cm_initおよび各時刻CM値cm_current(c)に基づいて正規化用CM値cm(c)を算出し、これを特徴量正規化部2で用いるCM値として更新登録する。音響特徴量蓄積部104は、音響特徴量を入力音声全体にわたって蓄積する。初期補正値算出部105は、音響特徴量蓄積部104に蓄積された音響特徴量を用いて、初期補正値蓄積部101に蓄積する初期CM値cm_initを算出する。
【選択図】図2
Description
(10)初期値を記憶する手段には、音声に含まれる背景雑音の種類やレベルといった特性ごとに初期値が記憶されており、背景雑音特性に対応した初期値が前記補正値の算出に用いられることを特徴とする。
Claims (12)
- 音声信号から抽出された音響特徴量を正規化して音声認識に用いる音声認識装置において、
前記正規化用の補正値を音響特徴量の時系列に基づいて適応的に決定する補正値適応的決定手段を具備し、
前記補正値適応的決定手段は、
補正値の初期値を記憶する手段と、
所定の時刻周期で音声認識の開始時刻から現在時刻までの音響特徴量の時系列に基づいて各時刻補正値を算出する手段と、
現在時刻における補正値を、前記初期値および各時刻補正値の重み付け和として算出する手段とを具備したことを特徴とする音声認識装置。 - 前記音響特徴量の時系列を蓄積する手段と、
前記蓄積された音響特徴量の少なくとも一つの時系列に基づいて補正値の初期値を算出する手段と、
前記算出された初期値を前記初期値を記憶する手段に更新登録する手段とを具備したことを特徴とする請求項1に記載の音声認識装置。 - 前記正規化された音響特徴量が音響モデルと照合されることを特徴とする請求項1または2に記載の音声認識装置。
- 前記正規化された音響特徴量を用いて音響モデルを入力音声に適応させる手段をさらに具備したことを特徴とする請求項1または2に記載の音声認識装置。
- 前記音響モデルを入力音声に適応させる手段がMAP適応法およびMLLR適応法のいずれかであることを特徴とする請求項4に記載の音声認識装置。
- 前記各時刻補正値を算出する手段は、音声認識の開始時刻から現在時刻までの音響特徴量の平均値を算出することを特徴とする請求項1ないし5のいずれかに記載の音声認識装置。
- 前記音声認識の開始時刻が、音声の入力が最初に検出された時刻であることを特徴とする請求項1ないし6のいずれかに記載の音声認識装置。
- 前記各時刻補正値を算出する手段は、音声認識の開始時刻から現在時刻までの音響特徴量の時系列から無音区間を除いた発声区間の平均値を算出することを特徴とする請求項1ないし7のいずれかに記載の音声認識装置。
- 前記初期値を記憶する手段には、音声信号の入力デバイスごとに初期値が記憶されており、入力デバイスに対応した初期値が前記補正値の算出に用いられることを特徴とする請求項1ないし8のいずれかに記載の音声認識装置。
- 前記初期値を記憶する手段には、入力音声の発話者ごとに初期値が記憶されており、発話者に対応した初期値が前記補正値の算出に用いられることを特徴とする請求項1ないし8のいずれかに記載の音声認識装置。
- 前記初期値を記憶する手段には、音声に含まれる背景雑音特性ごとに初期値が記憶されており、背景雑音特性に対応した初期値が前記補正値の算出に用いられることを特徴とする請求項1ないし8のいずれかに記載の音声認識装置。
- 音声信号から抽出された音響特徴量を正規化して音響モデルと照合する音声認識装置の特徴量正規化方法において、
補正値の初期値を記憶する手順と、
所定の時刻周期で音声認識の開始時刻から現在時刻までの音響特徴量の時系列に基づいて各時刻補正値を算出する手順と、
現在時刻における補正値を、前記初期値および各時刻補正値の重み付け和として算出する手順とを含むことを特徴とする音声認識装置の特徴量正規化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009189159A JP5473116B2 (ja) | 2009-08-18 | 2009-08-18 | 音声認識装置およびその特徴量正規化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009189159A JP5473116B2 (ja) | 2009-08-18 | 2009-08-18 | 音声認識装置およびその特徴量正規化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011039434A true JP2011039434A (ja) | 2011-02-24 |
JP5473116B2 JP5473116B2 (ja) | 2014-04-16 |
Family
ID=43767244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009189159A Expired - Fee Related JP5473116B2 (ja) | 2009-08-18 | 2009-08-18 | 音声認識装置およびその特徴量正規化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5473116B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015108654A (ja) * | 2013-12-03 | 2015-06-11 | 三菱電機株式会社 | 音声認識装置 |
CN105161092A (zh) * | 2015-09-17 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 一种语音识别方法和装置 |
JP6128287B1 (ja) * | 2016-05-20 | 2017-05-17 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10214097A (ja) * | 1996-11-29 | 1998-08-11 | N T T Data Tsushin Kk | 音声特徴量の適応化方法及び音声認識装置、記録媒体 |
JP2008233782A (ja) * | 2007-03-23 | 2008-10-02 | Kddi Corp | パタンマッチング装置、パタンマッチングプログラム、およびパタンマッチング方法 |
JP2008309945A (ja) * | 2007-06-13 | 2008-12-25 | Kddi Corp | パターンマッチング方法および装置ならびにその特徴量正規化方法および装置 |
-
2009
- 2009-08-18 JP JP2009189159A patent/JP5473116B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10214097A (ja) * | 1996-11-29 | 1998-08-11 | N T T Data Tsushin Kk | 音声特徴量の適応化方法及び音声認識装置、記録媒体 |
JP2008233782A (ja) * | 2007-03-23 | 2008-10-02 | Kddi Corp | パタンマッチング装置、パタンマッチングプログラム、およびパタンマッチング方法 |
JP2008309945A (ja) * | 2007-06-13 | 2008-12-25 | Kddi Corp | パターンマッチング方法および装置ならびにその特徴量正規化方法および装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015108654A (ja) * | 2013-12-03 | 2015-06-11 | 三菱電機株式会社 | 音声認識装置 |
CN105161092A (zh) * | 2015-09-17 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 一种语音识别方法和装置 |
CN105161092B (zh) * | 2015-09-17 | 2017-03-01 | 百度在线网络技术(北京)有限公司 | 一种语音识别方法和装置 |
JP6128287B1 (ja) * | 2016-05-20 | 2017-05-17 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
WO2017199417A1 (ja) * | 2016-05-20 | 2017-11-23 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5473116B2 (ja) | 2014-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101616054B1 (ko) | 음성 검출 장치 및 방법 | |
JP5229234B2 (ja) | 非音声区間検出方法及び非音声区間検出装置 | |
JP5621783B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
JP4355322B2 (ja) | フレーム別に重み付けされたキーワードモデルの信頼度に基づく音声認識方法、及びその方法を用いた装置 | |
JP6654611B2 (ja) | 成長型対話装置 | |
US20120130716A1 (en) | Speech recognition method for robot | |
JP6464005B2 (ja) | 雑音抑圧音声認識装置およびそのプログラム | |
US9595261B2 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
JP6336219B1 (ja) | 音声認識装置および音声認識方法 | |
JP4705414B2 (ja) | 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体 | |
KR100682909B1 (ko) | 음성 인식 방법 및 장치 | |
WO2018163279A1 (ja) | 音声処理装置、音声処理方法、および音声処理プログラム | |
JP7191792B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5473116B2 (ja) | 音声認識装置およびその特徴量正規化方法 | |
JP6027754B2 (ja) | 適応化装置、音声認識装置、およびそのプログラム | |
US9311916B2 (en) | Apparatus and method for improving voice recognition | |
JP6716513B2 (ja) | 音声区間検出装置、その方法、及びプログラム | |
GB2564607A (en) | Acoustic model learning device, acoustic model learning method, speech recognition device, and speech recognition method | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
JP2014092751A (ja) | 音響モデル生成装置とその方法とプログラム | |
JP5225952B2 (ja) | 音声認識装置およびその特徴量正規化方法 | |
JP4843646B2 (ja) | 音声認識装置とその方法と、プログラムと記録媒体 | |
JP5166195B2 (ja) | 音響分析パラメータ生成方法とその装置と、プログラムと記録媒体 | |
JP2001109491A (ja) | 連続音声認識装置および方法 | |
JP5895501B2 (ja) | 音声認識装置および音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130131 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130520 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130814 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5473116 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |