JP4877113B2 - 音響モデル処理装置およびプログラム - Google Patents
音響モデル処理装置およびプログラム Download PDFInfo
- Publication number
- JP4877113B2 JP4877113B2 JP2007183481A JP2007183481A JP4877113B2 JP 4877113 B2 JP4877113 B2 JP 4877113B2 JP 2007183481 A JP2007183481 A JP 2007183481A JP 2007183481 A JP2007183481 A JP 2007183481A JP 4877113 B2 JP4877113 B2 JP 4877113B2
- Authority
- JP
- Japan
- Prior art keywords
- acoustic model
- acoustic
- sound
- models
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明の第2態様(例えば図4の構成)において、演算手段は、第1音響モデルと第2音響モデルとを加算する加算手段と、加算手段による加算後の音響モデルから複数の第3音響モデルの各々を減算することで複数の第4音響モデルを生成する減算手段とを具備する。
本発明の第3態様(例えば図5の構成)において、演算手段は、複数の第3音響モデルの各々と第1音響モデルとを加算する加算手段と、加算手段による加算後の各音響モデルから第2音響モデルを減算することで複数の第4音響モデルを生成する減算手段とを具備する。
MC[sid,i]=Msid+MB[s1,i]−MA[s1,0] ……(1)
以上の各形態には様々な変形を加えることができる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の各態様を組合わせてもよい。
以上の形態においては適応用の音声が放音装置52から出力される構成を例示したが、利用者が空間R内で実際に発声した音声を音響モデルMsidの適応化に利用してもよい。例えば、利用者が収音装置42に近接して発声した音声の音声信号SAに基づいて第1適応部21が音響モデルMA[s1,0]を生成する構成や、ひとりの利用者が空間R内の位置Piにて発声した音声の音声信号SBiに基づいて第2適応部22が音響モデルMB[s1,i]を生成する構成が採用される。
加算部242による音響モデルMsidの加算の時点は適宜に変更される。例えば、図4に示すように、第1適応部21が生成した音響モデルMA[s1,0]と音響モデルMsidとを加算部242が加算する構成も採用される。減算部241は、加算部242による加算後の音響モデルからK個の音響モデルMB[s1,1]〜MB[s1,K]を減算することで音響モデルMC[sid,1]〜MC[sid,K]を生成する。また、図5に示すように、第2適応部22が生成した音響モデルMB[s1,1]〜MB[s1,K]の各々と音響モデルMsidとを加算部242が加算する構成も採用される。減算部241は、音響モデルMB[s1,i]と音響モデルMsidとの加算から音響モデルMA[s1,0]を減算することで音響モデルMC[sid,i]を生成する。以上の例示から理解されるように、演算部24は、音響モデルMsidと音響モデルMA[s1,0]と音響モデルMB[s1,1]〜MB[s1,K]の各々とに基づいて音響モデルMC[sid,1]〜MC[sid,K]を生成する手段であれば足り、演算部24による具体的な処理の内容は任意である。
Claims (6)
- 発話環境に非依存な不特定話者の第1音響モデルを記憶する記憶手段と、
発話環境に非依存な特定話者の音声信号に基づいて前記第1音響モデルを適応化することで、発話環境に非依存な特定話者の第2音響モデルを生成する第1適応化手段と、
発話環境が相違する前記特定話者の複数の音声信号の各々に基づいて前記第1音響モデルを適応化することで、発話環境が相違する前記特定話者の複数の第3音響モデルを生成する第2適応化手段と、
前記第2音響モデルと前記複数の第3音響モデルの各々との差分を前記第1音響モデルに付加するための演算により、発話環境が相違する不特定話者の複数の第4音響モデルを生成する演算手段と
を具備する音響モデル処理装置。 - 前記演算手段は、
前記複数の第3音響モデルの各々と前記第2音響モデルとの差分を算定する減算手段と、
前記第1音響モデルと前記各差分とを加算することで前記複数の第4音響モデルを生成する加算手段と
を具備する請求項1の音響モデル処理装置。 - 前記演算手段は、
前記第1音響モデルと前記第2音響モデルとを加算する加算手段と、
前記加算手段による加算後の音響モデルから前記複数の第3音響モデルの各々を減算することで前記複数の第4音響モデルを生成する減算手段と
を具備する請求項1の音響モデル処理装置。 - 前記演算手段は、
前記複数の第3音響モデルの各々と前記第1音響モデルとを加算する加算手段と、
前記加算手段による加算後の各音響モデルから前記第2音響モデルを減算することで前記複数の第4音響モデルを生成する減算手段と
を具備する請求項1の音響モデル処理装置。 - 前記特定話者の音声信号を記憶する音声記憶手段と、
前記音声記憶手段が記憶する音声信号が表わす音声を出力する放音手段と、
前記放音手段が出力した音声に応じた音声信号を生成する収音手段とを具備し、
前記第1適応化手段および前記第2適応化手段は、前記収音手段が生成した音声信号に基づいて前記第1音響モデルを適応化する
請求項1から請求項4の何れかの音響モデル処理装置。 - 発話環境に非依存な不特定話者の第1音響モデルを、発話環境に非依存な特定話者の音声信号に基づいて適応化することで、発話環境に非依存な特定話者の第2音響モデルを生成する第1適応化処理と、
発話環境が相違する前記特定話者の複数の音声信号の各々に基づいて前記第1音響モデルを適応化することで、発話環境が相違する特定話者の複数の第3音響モデルを生成する第2適応化処理と、
前記第2音響モデルと前記複数の第3音響モデルの各々との差分を前記第1音響モデルに付加するための演算により、発話環境が相違する不特定話者の複数の第4音響モデルを生成する演算処理と
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007183481A JP4877113B2 (ja) | 2007-07-12 | 2007-07-12 | 音響モデル処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007183481A JP4877113B2 (ja) | 2007-07-12 | 2007-07-12 | 音響モデル処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009020353A JP2009020353A (ja) | 2009-01-29 |
JP4877113B2 true JP4877113B2 (ja) | 2012-02-15 |
Family
ID=40360030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007183481A Expired - Fee Related JP4877113B2 (ja) | 2007-07-12 | 2007-07-12 | 音響モデル処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4877113B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2471875B (en) * | 2009-07-15 | 2011-08-10 | Toshiba Res Europ Ltd | A speech recognition system and method |
GB2493413B (en) | 2011-07-25 | 2013-12-25 | Ibm | Maintaining and supplying speech models |
US10718059B2 (en) * | 2017-07-10 | 2020-07-21 | Rohm And Haas Electronic Materials Llc | Nickel electroplating compositions with cationic polymers and methods of electroplating nickel |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3505967B2 (ja) * | 1997-07-31 | 2004-03-15 | 株式会社日立製作所 | 適応型音声認識装置 |
JPH1195786A (ja) * | 1997-09-16 | 1999-04-09 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法および装置とパターン認識プログラムを格納した記録媒体 |
JP2004317776A (ja) * | 2003-04-16 | 2004-11-11 | Sharp Corp | 音響特性校正装置、方法およびプログラム並びにそのプログラムを記録した記録媒体 |
JP2005196020A (ja) * | 2004-01-09 | 2005-07-21 | Nec Corp | 音声処理装置と方法並びにプログラム |
-
2007
- 2007-07-12 JP JP2007183481A patent/JP4877113B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009020353A (ja) | 2009-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019214047A1 (zh) | 建立声纹模型的方法、装置、计算机设备和存储介质 | |
WO2017006766A1 (ja) | 音声対話方法および音声対話装置 | |
CN101432799B (zh) | 基于高斯混合模型的变换中的软校准 | |
JP2006098993A (ja) | 音声処理装置およびそのためのコンピュータプログラム | |
JP6664670B2 (ja) | 声質変換システム | |
JP2001215993A (ja) | 対話処理装置および対話処理方法、並びに記録媒体 | |
JP2002108383A (ja) | 音声認識システム | |
US11727949B2 (en) | Methods and apparatus for reducing stuttering | |
JP2014123072A (ja) | 音声合成システム及び音声合成方法 | |
JP2012163692A (ja) | 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム | |
CN115668367A (zh) | 音频源分离和音频配音 | |
JP4877113B2 (ja) | 音響モデル処理装置およびプログラム | |
WO2019172397A1 (ja) | 音処理方法、音処理装置および記録媒体 | |
US20230186782A1 (en) | Electronic device, method and computer program | |
JP7339151B2 (ja) | 音声合成装置、音声合成プログラム及び音声合成方法 | |
CN111837184A (zh) | 声音处理方法、声音处理装置及程序 | |
JP2006234888A (ja) | 残響除去装置、残響除去方法、残響除去プログラムおよび記録媒体 | |
Sirikongtham et al. | Improving speech recognition using dynamic multi-pipeline API | |
JP4877112B2 (ja) | 音声処理装置およびプログラム | |
WO2020208926A1 (ja) | 信号処理装置、信号処理方法及びプログラム | |
JP2006003617A (ja) | 音声認識方法、その装置およびプログラム、その記録媒体 | |
JP2005283646A (ja) | 音声認識率推定装置 | |
JP2015079122A (ja) | 音響処理装置 | |
JP6372066B2 (ja) | 合成情報管理装置および音声合成装置 | |
JP2015040931A (ja) | 信号処理装置、音声処理装置、信号処理方法および音声処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100520 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110719 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110907 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111101 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4877113 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |