JP5473116B2 - 音声認識装置およびその特徴量正規化方法 - Google Patents
音声認識装置およびその特徴量正規化方法 Download PDFInfo
- Publication number
- JP5473116B2 JP5473116B2 JP2009189159A JP2009189159A JP5473116B2 JP 5473116 B2 JP5473116 B2 JP 5473116B2 JP 2009189159 A JP2009189159 A JP 2009189159A JP 2009189159 A JP2009189159 A JP 2009189159A JP 5473116 B2 JP5473116 B2 JP 5473116B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- time
- correction value
- initial value
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000010606 normalization Methods 0.000 title claims description 32
- 238000000034 method Methods 0.000 claims description 24
- 230000003044 adaptive effect Effects 0.000 claims description 10
- 230000006978 adaptation Effects 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 13
- 230000007613 environmental effect Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000009825 accumulation Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Description
(10)初期値を記憶する手段には、音声に含まれる背景雑音の種類やレベルといった特性ごとに初期値が記憶されており、背景雑音特性に対応した初期値が前記補正値の算出に用いられることを特徴とする。
Claims (12)
- 音声信号から抽出された音響特徴量を正規化して音声認識に用いる音声認識装置において、
前記正規化用の補正値を音響特徴量の時系列に基づいて適応的に決定する補正値適応的決定手段を具備し、
前記補正値適応的決定手段は、
補正値の初期値を記憶する手段と、
所定の時刻周期で音声認識の開始時刻から現在時刻までの音響特徴量の時系列に基づいて、現在時刻の時刻補正値を算出する手段と、
現在時刻における補正値を、前記初期値および時刻補正値の重み付け和として算出する手段と、
背景雑音レベルを計測する手段とを具備し、
前記背景雑音レベルが相対的に小さければ初期値の影響が大きくなり、背景雑音レベルが相対的に大きければ現入力音声の影響が大きくなるように前記初期値および時刻補正値が重み付けされることを特徴とする音声認識装置。 - 前記音響特徴量の時系列を蓄積する手段と、
前記蓄積された音響特徴量の少なくとも一つの時系列に基づいて補正値の初期値を算出する手段と、
前記算出された初期値を前記初期値を記憶する手段に更新登録する手段とを具備したことを特徴とする請求項1に記載の音声認識装置。 - 前記正規化された音響特徴量が音響モデルと照合されることを特徴とする請求項1または2に記載の音声認識装置。
- 前記正規化された音響特徴量を用いて音響モデルを入力音声に適応させる手段をさらに具備したことを特徴とする請求項1または2に記載の音声認識装置。
- 前記音響モデルを入力音声に適応させる手段がMAP適応法およびMLLR適応法のいずれかであることを特徴とする請求項4に記載の音声認識装置。
- 前記各時刻補正値を算出する手段は、音声認識の開始時刻から現在時刻までの音響特徴量の平均値を算出することを特徴とする請求項1ないし5のいずれかに記載の音声認識装置。
- 前記音声認識の開始時刻が、音声の入力が最初に検出された時刻であることを特徴とする請求項1ないし6のいずれかに記載の音声認識装置。
- 前記各時刻補正値を算出する手段は、音声認識の開始時刻から現在時刻までの音響特徴量の時系列から無音区間を除いた発声区間の平均値を算出することを特徴とする請求項1ないし7のいずれかに記載の音声認識装置。
- 前記初期値を記憶する手段には、音声信号の入力デバイスごとに初期値が記憶されており、入力デバイスに対応した初期値が前記補正値の算出に用いられることを特徴とする請求項1ないし8のいずれかに記載の音声認識装置。
- 前記初期値を記憶する手段には、入力音声の発話者ごとに初期値が記憶されており、発話者に対応した初期値が前記補正値の算出に用いられることを特徴とする請求項1ないし8のいずれかに記載の音声認識装置。
- 前記初期値を記憶する手段には、音声に含まれる背景雑音特性ごとに初期値が記憶されており、背景雑音特性に対応した初期値が前記補正値の算出に用いられることを特徴とする請求項1ないし8のいずれかに記載の音声認識装置。
- 音声信号から抽出された音響特徴量を正規化して音響モデルと照合する音声認識装置の特徴量正規化方法において、
補正値の初期値を記憶する手順と、
所定の時刻周期で音声認識の開始時刻から現在時刻までの音響特徴量の時系列に基づいて、現在時刻の時刻補正値を算出する手順と、
現在時刻における補正値を、前記初期値および時刻補正値の重み付け和として算出する手順と、
背景雑音レベルを計測する手順とを含み、
前記背景雑音レベルが相対的に小さければ初期値の影響が大きくなり、背景雑音レベルが相対的に大きければ現入力音声の影響が大きくなるように前記初期値および時刻補正値が重み付けされることを特徴とする音声認識装置の特徴量正規化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009189159A JP5473116B2 (ja) | 2009-08-18 | 2009-08-18 | 音声認識装置およびその特徴量正規化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009189159A JP5473116B2 (ja) | 2009-08-18 | 2009-08-18 | 音声認識装置およびその特徴量正規化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011039434A JP2011039434A (ja) | 2011-02-24 |
JP5473116B2 true JP5473116B2 (ja) | 2014-04-16 |
Family
ID=43767244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009189159A Expired - Fee Related JP5473116B2 (ja) | 2009-08-18 | 2009-08-18 | 音声認識装置およびその特徴量正規化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5473116B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015108654A (ja) * | 2013-12-03 | 2015-06-11 | 三菱電機株式会社 | 音声認識装置 |
CN105161092B (zh) * | 2015-09-17 | 2017-03-01 | 百度在线网络技术(北京)有限公司 | 一种语音识别方法和装置 |
JP6128287B1 (ja) * | 2016-05-20 | 2017-05-17 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
CN114566155B (zh) * | 2022-03-14 | 2024-07-12 | 成都启英泰伦科技有限公司 | 一种连续语音识别的特征缩减方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10214097A (ja) * | 1996-11-29 | 1998-08-11 | N T T Data Tsushin Kk | 音声特徴量の適応化方法及び音声認識装置、記録媒体 |
JP4864783B2 (ja) * | 2007-03-23 | 2012-02-01 | Kddi株式会社 | パタンマッチング装置、パタンマッチングプログラム、およびパタンマッチング方法 |
JP2008309945A (ja) * | 2007-06-13 | 2008-12-25 | Kddi Corp | パターンマッチング方法および装置ならびにその特徴量正規化方法および装置 |
-
2009
- 2009-08-18 JP JP2009189159A patent/JP5473116B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011039434A (ja) | 2011-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101616054B1 (ko) | 음성 검출 장치 및 방법 | |
JP4355322B2 (ja) | フレーム別に重み付けされたキーワードモデルの信頼度に基づく音声認識方法、及びその方法を用いた装置 | |
JP5229234B2 (ja) | 非音声区間検出方法及び非音声区間検出装置 | |
JP5621783B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
JP6654611B2 (ja) | 成長型対話装置 | |
US20120130716A1 (en) | Speech recognition method for robot | |
JP6464005B2 (ja) | 雑音抑圧音声認識装置およびそのプログラム | |
US9595261B2 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
EP1675102A2 (en) | Method for extracting feature vectors for speech recognition | |
WO2018163279A1 (ja) | 音声処理装置、音声処理方法、および音声処理プログラム | |
JP5473116B2 (ja) | 音声認識装置およびその特徴量正規化方法 | |
JP4705414B2 (ja) | 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体 | |
KR100682909B1 (ko) | 음성 인식 방법 및 장치 | |
JP6027754B2 (ja) | 適応化装置、音声認識装置、およびそのプログラム | |
JPH11184491A (ja) | 音声認識装置 | |
JP6716513B2 (ja) | 音声区間検出装置、その方法、及びプログラム | |
JP4666129B2 (ja) | 発声速度正規化分析を用いた音声認識装置 | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
JP5225952B2 (ja) | 音声認識装置およびその特徴量正規化方法 | |
JP4843646B2 (ja) | 音声認識装置とその方法と、プログラムと記録媒体 | |
JP4576612B2 (ja) | 音声認識方法および音声認識装置 | |
JP3615088B2 (ja) | 音声認識方法及び装置 | |
JP5895501B2 (ja) | 音声認識装置および音声認識方法 | |
JP2001109491A (ja) | 連続音声認識装置および方法 | |
JP7216348B2 (ja) | 音声処理装置、音声処理方法、および音声処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130131 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130520 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130814 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5473116 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |