JP6006674B2 - 音響モデル選択装置とその方法とプログラム - Google Patents
音響モデル選択装置とその方法とプログラム Download PDFInfo
- Publication number
- JP6006674B2 JP6006674B2 JP2013095109A JP2013095109A JP6006674B2 JP 6006674 B2 JP6006674 B2 JP 6006674B2 JP 2013095109 A JP2013095109 A JP 2013095109A JP 2013095109 A JP2013095109 A JP 2013095109A JP 6006674 B2 JP6006674 B2 JP 6006674B2
- Authority
- JP
- Japan
- Prior art keywords
- pseudo
- reading sequence
- acoustic model
- likelihood
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
〔変形例1〕
図1に、この発明の音響モデル選択装置200の機能構成例を示す。音響モデル選択装置200は、音響モデル選択装置100のモデル選定部140が、モデル選定部240に置き換わった点のみが異なる。
〔変形例2〕
図9に、この発明の音響モデル選択装置600の機能構成例を示す。音響モデル選択装置600は、音響モデル選択装置500(図7)の疑似読み系列生成部520を、疑似読み系列生成部620に置き換えたものである。
Claims (9)
- 音声ファイルと、当該音声ファイルに対応した疑似正解読み系列と疑似誤認識読み系列と、複数の音響モデルと、を入力として上記音声ファイルを、上記疑似正解読み系列と上記疑似誤認識読み系列から生成した文法に基づいて上記複数の音響モデルごとに文法型音声認識を行って正解尤度と誤認識尤度を出力する音響尤度計算部と、
上記正解尤度と上記誤認識尤度の差を計算して尤度差として出力する尤度差計算部と、
上記尤度差を入力として、当該尤度差の最も大きな音響モデルを、上記複数の音響モデルの中から選択して選択済み音響モデルとして出力するモデル選定部と、
を具備する音響モデル選択装置。 - 請求項1に記載した音響モデル選択装置において、
上記モデル選定部は、上記尤度差が所定値以上で、且つ、上記正解尤度が最も大きな音響モデルを選択して選択済み音響モデルとして出力することを特徴とする音響モデル選択装置。 - 音声ファイルを入力として、当該音声ファイルを音声認識処理し、音声認識結果のNベスト候補を出力する音声認識部と、
上記Nベスト候補を入力として、上記音声ファイルに対応した疑似正解読み系列と疑似誤認識読み系列を生成する疑似読み系列生成部と、
上記音声ファイルと上記疑似正解読み系列と上記疑似誤認識読み系列を入力とする請求項1に記載した音響モデル選択装置と、
を具備する音響モデル選択装置。 - 音声ファイルを入力として、当該音声ファイルに歪みを加えた歪み付与音声ファイルを出力する歪み付与部と、
上記音声ファイルと歪み付与音声ファイルを入力として、上記音声ファイルを音声認識処理した音声認識結果と、上記歪み付与音声ファイルを音声認識した誤認識音声認識結果と、を出力する音声認識部と、
上記音声認識結果と上記誤認識音声認識結果を入力として、上記音声認識結果から上記音声ファイルに対応した疑似正解読み系列を生成し、上記誤認識音声認識結果から上記歪み付与音声ファイルに対応した疑似誤認識読み系列を生成する疑似読み系列生成部と、
上記音声ファイルと上記疑似正解読み系列と上記疑似誤認識読み系列を入力とする請求項1に記載した音響モデル選択装置と、
を具備する音響モデル選択装置。 - 請求項3に記載した音響モデル選択装置において、
上記疑似読み系列生成部は、上記Nベスト候補を入力として、上記音声ファイルに対応した疑似正解読み系列を生成すると共に、当該疑似正解読み系列の音素を誤認識し易い音素に入れ替えた疑似誤認識読み系列を生成するものであることを特徴とする音響モデル選択装置。 - 音響尤度計算部が、音声ファイルと、当該音声ファイルに対応した疑似正解読み系列と疑似誤認識読み系列と、複数の音響モデルと、を入力として上記音声ファイルを、上記疑似正解読み系列と上記疑似誤認識読み系列から生成した文法に基づいて上記複数の音響モデルごとに文法型音声認識を行って正解尤度と誤認識尤度を出力する音響尤度計算過程と、
尤度差計算部が、上記正解尤度と上記誤認識尤度の差を計算して尤度差として出力する尤度差計算過程と、
モデル選定部が、上記尤度差を入力として、当該尤度差の最も大きな音響モデルを、上記複数の音響モデルの中から選択して選択済み音響モデルとして出力するモデル選定過程と、
を備える音響モデル選択方法。 - 音声認識部が、音声ファイルを入力として、当該音声ファイルを音声認識処理し、音声認識結果のNベスト候補を出力する音声認識過程と、
疑似読み系列生成部が、上記Nベスト候補を入力として、上記音声ファイルに対応した疑似正解読み系列と疑似誤認識読み系列を生成する疑似読み系列生成過程と、
請求項6に記載した上記音声ファイルと上記疑似正解読み系列と上記疑似誤認識読み系列を入力とする音響モデル選択方法と、
を備える音響モデル選択方法。 - 歪み付与部が、音声ファイルを入力として、当該音声ファイルに歪みを加えた歪み付与音声ファイルを出力する歪み付与過程と、
音声認識部が、上記音声ファイルと歪み付与音声ファイルを入力として、上記音声ファイルを音声認識処理した音声認識結果と、上記歪み付与音声ファイルを音声認識した誤認識音声認識結果と、を出力する音声認識過程と、
疑似読み系列生成部が、上記音声認識結果と上記誤認識音声認識結果を入力として、上記音声認識結果から上記音声ファイルに対応した疑似正解読み系列を生成し、上記誤認識音声認識結果から上記歪み付与音声ファイルに対応した疑似誤認識読み系列を生成する疑似読み系列生成過程と、
請求項6に記載した上記音声ファイルと上記疑似正解読み系列と上記疑似誤認識読み系列を入力とする音響モデル選択方法と、
を備える音響モデル選択方法。 - 請求項1乃至5の何れかに記載した音響モデル選択装置としてコンピュータを動作させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013095109A JP6006674B2 (ja) | 2013-04-30 | 2013-04-30 | 音響モデル選択装置とその方法とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013095109A JP6006674B2 (ja) | 2013-04-30 | 2013-04-30 | 音響モデル選択装置とその方法とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014215578A JP2014215578A (ja) | 2014-11-17 |
JP6006674B2 true JP6006674B2 (ja) | 2016-10-12 |
Family
ID=51941342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013095109A Active JP6006674B2 (ja) | 2013-04-30 | 2013-04-30 | 音響モデル選択装置とその方法とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6006674B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113330185A (zh) * | 2018-11-29 | 2021-08-31 | Bp探索操作有限公司 | 利用机器学习使用das特征的事件检测 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09244692A (ja) * | 1996-03-07 | 1997-09-19 | Nippon Telegr & Teleph Corp <Ntt> | 発声単語認証方法およびこの方法を実施する装置 |
JPH1083195A (ja) * | 1996-09-09 | 1998-03-31 | Oki Electric Ind Co Ltd | 入力言語認識装置及び入力言語認識方法 |
JP2001005483A (ja) * | 1999-06-21 | 2001-01-12 | Oki Electric Ind Co Ltd | 単語音声認識方法及び単語音声認識装置 |
JP4583772B2 (ja) * | 2004-02-05 | 2010-11-17 | 日本電気株式会社 | 音声認識システム、音声認識方法および音声認識用プログラム |
JP4295675B2 (ja) * | 2004-06-03 | 2009-07-15 | 日本電信電話株式会社 | 音声認識方法、この方法を実施する装置、プログラムおよびその記録媒体 |
JP4951035B2 (ja) * | 2009-07-08 | 2012-06-13 | 日本電信電話株式会社 | 音声単位別尤度比モデル作成装置、音声単位別尤度比モデル作成方法、音声認識信頼度算出装置、音声認識信頼度算出方法、プログラム |
JP5824829B2 (ja) * | 2011-03-15 | 2015-12-02 | 富士通株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
JP5982265B2 (ja) * | 2012-11-16 | 2016-08-31 | 日本電信電話株式会社 | 音声認識装置、音声認識方法、およびプログラム |
-
2013
- 2013-04-30 JP JP2013095109A patent/JP6006674B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014215578A (ja) | 2014-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106463113B (zh) | 在语音辨识中预测发音 | |
JP6580882B2 (ja) | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム | |
US20090083036A1 (en) | Unnatural prosody detection in speech synthesis | |
US20110218805A1 (en) | Spoken term detection apparatus, method, program, and storage medium | |
JP6235280B2 (ja) | 音声同時処理装置、方法およびプログラム | |
JP6370749B2 (ja) | 発話意図モデル学習装置、発話意図抽出装置、発話意図モデル学習方法、発話意図抽出方法、プログラム | |
JP2005208643A (ja) | ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法 | |
US8645139B2 (en) | Apparatus and method of extending pronunciation dictionary used for speech recognition | |
US9905224B2 (en) | System and method for automatic language model generation | |
JP6336219B1 (ja) | 音声認識装置および音声認識方法 | |
US20080154591A1 (en) | Audio Recognition System For Generating Response Audio by Using Audio Data Extracted | |
JP6552999B2 (ja) | テキスト補正装置、テキスト補正方法、およびプログラム | |
JP6027754B2 (ja) | 適応化装置、音声認識装置、およびそのプログラム | |
JP6006674B2 (ja) | 音響モデル選択装置とその方法とプログラム | |
JP5980101B2 (ja) | 音響モデル学習用テキスト作成装置とその方法とプログラム | |
JP5852550B2 (ja) | 音響モデル生成装置とその方法とプログラム | |
JP5914119B2 (ja) | 音響モデル性能評価装置とその方法とプログラム | |
JP4922377B2 (ja) | 音声認識装置とその方法と、プログラム | |
JP6546070B2 (ja) | 音響モデル学習装置、音声認識装置、音響モデル学習方法、音声認識方法、およびプログラム | |
JP2011022476A (ja) | 音声認識用の閾値管理プログラム、音声認識用の閾値管理方法、音声認識装置 | |
JP5982265B2 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
JP5152020B2 (ja) | 音声認識装置及び音声認識方法 | |
JP6903613B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
JP5369079B2 (ja) | 音響モデル作成方法とその装置とプログラム | |
JP5772219B2 (ja) | 音響モデル生成装置、音響モデル生成方法及び音響モデル生成用コンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150714 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160802 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160909 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Ref document number: 6006674 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |