JP5966689B2 - 音響モデル適応装置、音響モデル適応方法および音響モデル適応プログラム - Google Patents
音響モデル適応装置、音響モデル適応方法および音響モデル適応プログラム Download PDFInfo
- Publication number
- JP5966689B2 JP5966689B2 JP2012150743A JP2012150743A JP5966689B2 JP 5966689 B2 JP5966689 B2 JP 5966689B2 JP 2012150743 A JP2012150743 A JP 2012150743A JP 2012150743 A JP2012150743 A JP 2012150743A JP 5966689 B2 JP5966689 B2 JP 5966689B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- adaptation
- acoustic model
- unit
- gaussian distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
以下、本発明の第1の実施形態を図面を参照して説明する。
以下、本発明の第2の実施形態を図面を参照して説明する。
以下、本発明の第3の実施形態を図面を参照して説明する。
2 雑音統計量記憶装置
3 雑音適応音響モデル記憶装置
7 詳細クリーン音響モデル記憶装置
10、103、203、303 適応方式選択部
20−1、104、204、3041 第一の雑音適応部
20−2、105、3042 第二の雑音適応部
20−3 第三の雑音適応部
20−4、3044 第四の雑音適応部
100、200、300 モデル適応装置
101 雑音統計量取得部
102 ガウス分布取得部
106 ガウス分布格納部
207 詳細ガウス分布取得部
Claims (8)
- 音響モデルを雑音に適応して雑音音響モデルを生成する音響モデル適応装置であって、
雑音に適応する音響モデルを増やして雑音適応する第一の雑音適応部と、
線形近似を用いて雑音適応する第二の雑音適応部と、
音響モデルと当該音響モデルを適応する雑音の統計量とに基づいて、前記第一の雑音適応部または前記第二の雑音適応部を選択する適応方式選択部とを備えた
ことを特徴とする音響モデル適応装置。 - 適応方式選択部は、音響モデルと当該音響モデルを適応する雑音の統計量とに基づいて、前記音響モデルの学習時に用いられた音声と前記雑音とのパワーの差を判定し、前記パワーの差が予め定められた閾値より大きい場合は第一の雑音適応部を選択し、閾値以下である場合は第二の雑音適応部を選択する
請求項1に記載の音響モデル適応装置。 - 音響モデルはガウス分布を含み、
第一の雑音適応部は、前記ガウス分布ごとに複数のシグマポイントを生成し、前記複数のシグマポイントごとに雑音適応を行う
請求項1または請求項2に記載の音響モデル適応装置。 - 音響モデルはガウス分布を含み、
第一の雑音適応部は、前記ガウス分布から派生させた複数のガウス分布を雑音に適応する
請求項1または請求項2に記載の音響モデル適応装置。 - 音響モデルを雑音音響モデルとして出力する第三の雑音適応部と、
雑音の統計量を雑音音響モデルとして出力する第四の雑音適応部とを備え、
適応方式選択部は、前記音響モデルの学習時に用いられた音声と前記雑音とのパワーの差が予め定められた第二の閾値以上である場合に、前記音声のパワーの方が大きいときは第三の雑音適応部を選択し、小さいときは第四の雑音適応部を選択する
請求項1から請求項4のうちのいずれか1項に記載の音響モデル適応装置。 - 音響モデルを雑音に適応して雑音音響モデルを生成する音響モデル適応装置であって、
演算量と適応精度とがそれぞれ異なる複数の雑音適応部と、
音響モデルおよび音響モデルに適応する雑音の統計量に基づいて、前記複数の雑音適応部のうちのいずれか一つを選択する適応方式選択部とを備える
ことを特徴とする音響モデル適応装置。 - 音響モデルを雑音に適応して雑音音響モデルを生成する音響モデル適応方法であって、
音響モデルと当該音響モデルを適応する雑音の統計量とに基づいて、雑音に適応する音響モデルを増やして雑音適応を行うか、または、線形近似を用いて雑音適応を行うかを選択し、前記選択に基づいて雑音適応を行う
ことを特徴とする音響モデル適応方法。 - 音響モデルを雑音に適応して雑音音響モデルを生成する音響モデル適応装置における音響モデル適応プログラムであって、
コンピュータに、
音響モデルと当該音響モデルを適応する雑音の統計量とに基づいて、雑音に適応する音響モデルを増やして雑音適応を行うか、または、線形近似を用いて雑音適応を行うかを選択し、前記選択に基づいて雑音適応を行う処理を実行させる
ための音響モデル適応プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012150743A JP5966689B2 (ja) | 2012-07-04 | 2012-07-04 | 音響モデル適応装置、音響モデル適応方法および音響モデル適応プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012150743A JP5966689B2 (ja) | 2012-07-04 | 2012-07-04 | 音響モデル適応装置、音響モデル適応方法および音響モデル適応プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014013324A JP2014013324A (ja) | 2014-01-23 |
JP5966689B2 true JP5966689B2 (ja) | 2016-08-10 |
Family
ID=50109035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012150743A Active JP5966689B2 (ja) | 2012-07-04 | 2012-07-04 | 音響モデル適応装置、音響モデル適応方法および音響モデル適応プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5966689B2 (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7505905B1 (en) * | 1999-05-13 | 2009-03-17 | Nuance Communications, Inc. | In-the-field adaptation of a large vocabulary automatic speech recognizer (ASR) |
US6529872B1 (en) * | 2000-04-18 | 2003-03-04 | Matsushita Electric Industrial Co., Ltd. | Method for noise adaptation in automatic speech recognition using transformed matrices |
JP4233831B2 (ja) * | 2002-09-25 | 2009-03-04 | 株式会社エヌ・ティ・ティ・ドコモ | 音声モデルの雑音適応化システム、雑音適応化方法、及び、音声認識雑音適応化プログラム |
TWI245259B (en) * | 2002-12-20 | 2005-12-11 | Ibm | Sensor based speech recognizer selection, adaptation and combination |
JP4242320B2 (ja) * | 2004-05-14 | 2009-03-25 | 日本電信電話株式会社 | 音声認識方法、その装置およびプログラム、その記録媒体 |
JP5041934B2 (ja) * | 2006-09-13 | 2012-10-03 | 本田技研工業株式会社 | ロボット |
JP2010078650A (ja) * | 2008-09-24 | 2010-04-08 | Toshiba Corp | 音声認識装置及びその方法 |
-
2012
- 2012-07-04 JP JP2012150743A patent/JP5966689B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014013324A (ja) | 2014-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10217456B2 (en) | Method, apparatus, and program for generating training speech data for target domain | |
US8566093B2 (en) | Intersession variability compensation for automatic extraction of information from voice | |
US20140114650A1 (en) | Method for Transforming Non-Stationary Signals Using a Dynamic Model | |
Liu et al. | Stochastic kriging for efficient nested simulation of expected shortfall | |
JP5150542B2 (ja) | パターン認識装置、パターン認識方法、及び、プログラム | |
JP2012504250A (ja) | 音声認識方法 | |
Ferrer et al. | Spoken language recognition based on senone posteriors. | |
JP2010078650A (ja) | 音声認識装置及びその方法 | |
CN110428848B (zh) | 一种基于公共空间语音模型预测的语音增强方法 | |
JP5994639B2 (ja) | 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム | |
JP5881454B2 (ja) | 音源ごとに信号のスペクトル形状特徴量を推定する装置、方法、目的信号のスペクトル特徴量を推定する装置、方法、プログラム | |
WO2012105385A1 (ja) | 有音区間分類装置、有音区間分類方法、及び有音区間分類プログラム | |
JP5068228B2 (ja) | 非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体 | |
KR20170088165A (ko) | 심층 신경망 기반 음성인식 방법 및 그 장치 | |
JP5966689B2 (ja) | 音響モデル適応装置、音響モデル適応方法および音響モデル適応プログラム | |
JP7020331B2 (ja) | クラスタリング装置、方法、及びプログラム | |
JP6827004B2 (ja) | 音声変換モデル学習装置、音声変換装置、方法、及びプログラム | |
JP5738778B2 (ja) | 最適モデル推定装置、方法、及びプログラム | |
WO2020054402A1 (ja) | ニューラルネットワーク処理装置、コンピュータプログラム、ニューラルネットワーク製造方法、ニューラルネットワークデータの製造方法、ニューラルネットワーク利用装置、及びニューラルネットワーク小規模化方法 | |
JP2017134321A (ja) | 信号処理方法、信号処理装置及び信号処理プログラム | |
JP5244452B2 (ja) | 文書特徴表現計算装置、及びプログラム | |
JP6376486B2 (ja) | 音響モデル生成装置、音響モデル生成方法、およびプログラム | |
JP6067760B2 (ja) | パラメータ決定装置、パラメータ決定方法、およびプログラム | |
CN113037523B (zh) | 网络流量流向预测方法、装置以及存储介质 | |
Hua | Do WaveNets Dream of Acoustic Waves? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150608 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160620 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Ref document number: 5966689 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |