JP5104732B2 - 拡張認識辞書学習装置、これを用いた音声認識システム、その方法及びそのプログラム - Google Patents
拡張認識辞書学習装置、これを用いた音声認識システム、その方法及びそのプログラム Download PDFInfo
- Publication number
- JP5104732B2 JP5104732B2 JP2008292132A JP2008292132A JP5104732B2 JP 5104732 B2 JP5104732 B2 JP 5104732B2 JP 2008292132 A JP2008292132 A JP 2008292132A JP 2008292132 A JP2008292132 A JP 2008292132A JP 5104732 B2 JP5104732 B2 JP 5104732B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- deformation
- recognition dictionary
- speech
- extended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
110、510 音声入力部
111、511 発声ラベル入力部
112、512 音響モデル記憶部
113、513 認識辞書記憶部
114、514 音声認識部
115、515 発声変形データ算出部
116、516 発声変形データ記憶部
117、517 発声変形データ分類部
118、518 認識辞書拡張部
119、519 拡張認識辞書記憶部
119−1、519−1 拡張認識辞書D1
119−M、519−M 拡張認識辞書DM
120、520 音声認識装置
121、521 音声入力部
122、522 音声認識部
123、523 認識結果出力部
151 発声変形集合判別情報抽出部
152 発声変形集合判別情報記憶部
153 認識辞書適応部
153−1 認識結果音素列
153−2 発声変形集合重み推定部
153−3 拡張認識辞書統合部
153−4 適応認識辞書
Claims (15)
- 入力された学習用音声の音声認識結果から出力される音響モデル系列と、入力された正解音響モデル系列とを比較して、それらモデルの対応を発声変形データとして算出する発声変形データ算出手段と、
算出された前記発声変形データにおいて、広く出現する発声変形、及び、偏って出現する発声変形を分類する発声変形データ分類手段と、
分類された前記広く出現する発声変形及び前記偏って出現する発声変形を組み合わせて、複数の発声変形集合とし、それぞれの発声変形集合に含まれる発声変形により、前記発声変形集合ごとに認識辞書を拡張する認識辞書拡張手段と、
特に、前記発声変形集合のそれぞれを判別するのに有効な発声変形要素、及び、当該発声変形要素と前記発声変形集合との確率加重情報量を、発声変形集合判別情報として抽出する発声変形集合判別情報抽出手段と、
を有することを特徴とする拡張認識辞書学習装置。 - 請求項1又は2に記載の拡張認識辞書学習装置を利用する、拡張認識辞書利用装置において、
入力された音声認識対象音声の音声認識結果に対し、前記発声変形集合判別情報抽出手段により抽出された前記発声変形集合判別情報を適用して、発声変形仮説を生成し、生成した当該発声変形仮説と、前記音声認識結果との間の音響尤度比較を行い、発声変形仮説における音響尤度のほうが上回るものをもって、その話者に対し適した発声変形要素として抽出し、抽出された当該発声変形要素と、前記発声変形集合判別情報に含まれる確率加重情報量を用いて、その話者に対する各発声変形集合の重みを算出する、発声変形集合重み推定手段と、
前記各発声変形集合に対応する前記拡張認識辞書を、前記算出された重みの重み付け和により統合することにより、適応認識辞書を生成する、認識辞書適応統合手段と、
を備えることを特徴とする拡張認識辞書利用装置。 - 請求項3又は4に記載の拡張認識辞書利用装置において、
前記認識辞書適応統合手段の生成した前記適応認識辞書を用いて音声認識を行うことを特徴とする拡張認識辞書利用装置。 - 入力された学習用音声の音声認識結果から出力される音響モデル系列と、入力された正解音響モデル系列とを比較して、それらモデルの対応を発声変形データとして算出する発声変形データ算出ステップと、
算出された前記発声変形データにおいて、広く出現する発声変形、及び、偏って出現する発声変形を分類する発声変形データ分類ステップと、
分類された前記広く出現する発声変形及び前記偏って出現する発声変形を組み合わせて、複数の発声変形集合とし、それぞれの発声変形集合に含まれる発声変形により、前記発声変形集合ごとに認識辞書を拡張する認識辞書拡張ステップと、
特に、前記発声変形集合のそれぞれを判別するのに有効な発声変形要素、及び、当該発声変形要素と前記発声変形集合との確率加重情報量を、発声変形集合判別情報として抽出する発声変形集合判別情報抽出ステップと、
を有することを特徴とする拡張認識辞書利用方法。 - 請求項6又は7に記載の拡張認識辞書利用方法において、
入力された音声認識対象音声の音声認識結果に対し、前記発声変形集合判別情報抽出ステップにより抽出された前記発声変形集合判別情報を適用して、発声変形仮説を生成し、生成した当該発声変形仮説と、前記音声認識結果との間の音響尤度比較を行い、発声変形仮説における音響尤度のほうが上回るものをもって、その話者に対し適した発声変形要素として抽出し、抽出された当該発声変形要素と、前記発声変形集合判別情報に含まれる確率加重情報量を用いて、その話者に対する各発声変形集合の重みを算出する、発声変形集合重み推定ステップと、
前記各発声変形集合に対応する前記拡張認識辞書を、前記算出された重みの重み付け和により統合することにより、適応認識辞書を生成する、認識辞書適応統合ステップと、
を備えることを特徴とする音声認識辞書利用方法。 - 請求項8又は9に記載の音声認識辞書利用方法において、
前記認識辞書適応統合ステップにおいて生成した前記適応認識辞書を用いて音声認識を行うことを特徴とする音声認識辞書利用方法。 - 入力された学習用音声の音声認識結果から出力される音響モデル系列と、入力された正解音響モデル系列とを比較して、それらモデルの対応を発声変形データとして算出する発声変形データ算出手段と、
算出された前記発声変形データにおいて、広く出現する発声変形、及び、偏って出現する発声変形を分類する発声変形データ分類手段と、
分類された前記広く出現する発声変形及び前記偏って出現する発声変形を組み合わせて、複数の発声変形集合とし、それぞれの発声変形集合に含まれる発声変形により、前記発声変形集合ごとに認識辞書を拡張する認識辞書拡張手段と、
特に、前記発声変形集合のそれぞれを判別するのに有効な発声変形要素、及び、当該発声変形要素と前記発声変形集合との確率加重情報量を、発声変形集合判別情報として抽出する発声変形集合判別情報抽出手段と、
を有する拡張認識辞書利用装置としてコンピュータを機能させるための拡張認識辞書利用プログラム。 - 請求項11又は12に記載の拡張認識辞書利用プログラムにおいて、前記拡張認識辞書利用装置は、
入力された音声認識対象音声の音声認識結果に対し、前記発声変形集合判別情報抽出手段により抽出された前記発声変形集合判別情報を適用して、発声変形仮説を生成し、生成した当該発声変形仮説と、前記音声認識結果との間の音響尤度比較を行い、発声変形仮説における音響尤度のほうが上回るものをもって、その話者に対し適した発声変形要素として抽出し、抽出された当該発声変形要素と、前記発声変形集合判別情報に含まれる確率加重情報量を用いて、その話者に対する各発声変形集合の重みを算出する、発声変形集合重み推定手段と、
前記各発声変形集合に対応する前記拡張認識辞書を、前記算出された重みの重み付け和により統合することにより、適応認識辞書を生成する、認識辞書適応統合手段と、
を備えることを特徴とする拡張認識辞書利用プログラム。 - 請求項13又は14に記載の拡張認識辞書利用プログラムにおいて、
前記認識辞書適応統合手段の生成した前記適応認識辞書を用いて音声認識を行うことを特徴とする拡張認識辞書利用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008292132A JP5104732B2 (ja) | 2008-11-14 | 2008-11-14 | 拡張認識辞書学習装置、これを用いた音声認識システム、その方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008292132A JP5104732B2 (ja) | 2008-11-14 | 2008-11-14 | 拡張認識辞書学習装置、これを用いた音声認識システム、その方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010117651A JP2010117651A (ja) | 2010-05-27 |
JP5104732B2 true JP5104732B2 (ja) | 2012-12-19 |
Family
ID=42305347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008292132A Active JP5104732B2 (ja) | 2008-11-14 | 2008-11-14 | 拡張認識辞書学習装置、これを用いた音声認識システム、その方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5104732B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107924679A (zh) * | 2015-07-13 | 2018-04-17 | 微软技术许可有限责任公司 | 输入理解处理期间在响应选择中的延迟绑定 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112141837A (zh) * | 2020-09-08 | 2020-12-29 | 金陵科技学院 | 一种基于多层字典学习的智能语音电梯系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5240457B2 (ja) * | 2007-01-16 | 2013-07-17 | 日本電気株式会社 | 拡張認識辞書学習装置と音声認識システム |
-
2008
- 2008-11-14 JP JP2008292132A patent/JP5104732B2/ja active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107924679A (zh) * | 2015-07-13 | 2018-04-17 | 微软技术许可有限责任公司 | 输入理解处理期间在响应选择中的延迟绑定 |
CN107924679B (zh) * | 2015-07-13 | 2021-11-05 | 微软技术许可有限责任公司 | 计算机实施的方法、输入理解系统和计算机可读存储设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2010117651A (ja) | 2010-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5240457B2 (ja) | 拡張認識辞書学習装置と音声認識システム | |
US7689419B2 (en) | Updating hidden conditional random field model parameters after processing individual training samples | |
CN107615376B (zh) | 声音识别装置及计算机程序记录介质 | |
US8515758B2 (en) | Speech recognition including removal of irrelevant information | |
JP5229478B2 (ja) | 統計モデル学習装置、統計モデル学習方法、およびプログラム | |
US20050256706A1 (en) | Removing noise from feature vectors | |
JP5752060B2 (ja) | 情報処理装置、大語彙連続音声認識方法及びプログラム | |
CN107093422B (zh) | 一种语音识别方法和语音识别系统 | |
JP5249967B2 (ja) | 音声認識装置、重みベクトル学習装置、音声認識方法、重みベクトル学習方法、プログラム | |
JP2006215564A (ja) | 自動音声認識システムにおける単語精度予測方法、及び装置 | |
JP2010181884A (ja) | 隠れマルコフモデル作成プログラム、情報記憶媒体、隠れマルコフモデル作成システム、音声認識システム及び音声認識方法 | |
JPWO2007105409A1 (ja) | 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム | |
US8078462B2 (en) | Apparatus for creating speaker model, and computer program product | |
JP2002342323A (ja) | 言語モデル学習装置およびそれを用いた音声認識装置ならびに言語モデル学習方法およびそれを用いた音声認識方法ならびにそれらの方法を記憶した記憶媒体 | |
JP5104732B2 (ja) | 拡張認識辞書学習装置、これを用いた音声認識システム、その方法及びそのプログラム | |
JP2007078943A (ja) | 音響スコア計算プログラム | |
JP2938866B1 (ja) | 統計的言語モデル生成装置及び音声認識装置 | |
JP2006201265A (ja) | 音声認識装置 | |
JP2011033879A (ja) | サンプルを用いずあらゆる言語を識別可能な識別方法 | |
JP2001312293A (ja) | 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体 | |
JP2002082690A (ja) | 言語モデル生成方法、音声認識方法及びそのプログラム記録媒体 | |
JP5749186B2 (ja) | 音響モデル適応装置と音声認識装置とそれらの方法と、プログラム | |
JP5315976B2 (ja) | 音声認識装置、音声認識方法、および、プログラム | |
WO2020049687A1 (ja) | 音声処理装置、音声処理方法、およびプログラム記録媒体 | |
JP2000259198A (ja) | パターン認識装置および方法、並びに提供媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20100721 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100721 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110831 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5104732 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151012 Year of fee payment: 3 |