JP5308102B2 - 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 - Google Patents
誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 Download PDFInfo
- Publication number
- JP5308102B2 JP5308102B2 JP2008225998A JP2008225998A JP5308102B2 JP 5308102 B2 JP5308102 B2 JP 5308102B2 JP 2008225998 A JP2008225998 A JP 2008225998A JP 2008225998 A JP2008225998 A JP 2008225998A JP 5308102 B2 JP5308102 B2 JP 5308102B2
- Authority
- JP
- Japan
- Prior art keywords
- errors
- score
- error
- local
- lattice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
D.Povey and P.Woodland, "Minimum Phone Error and I−smoothing for improved discriminative training,"in Proc.ICASSP02,pp.105-108,2002.
することができる。最適化の収束を判定するのに特徴量情報系列の総損失ΓMGE1(Z)(式
21)とその偏微分係数値(式(22))を用いる。Zは様々な部分特徴量情報系列Xr1,
…,Xrmを含む全体の特徴量情報系列(Z∈{Xr(m)|m=1,…,M})である。Xr(m)
は式中の表記が正しい。
この発明の誤り数重み付き識別学習装置100を音声認識に応用した例を説明する。図6にこの発明の誤り数重み付き識別学習装置100を用いて音声認識装置600を構成した機能構成例を示す。音声認識装置600は、従来技術で説明した音声認識装置800の音声認識用学習装置700をこの発明の誤り数重み付き識別学習装置100に置き換えたものである。
この発明の誤り数重み付き識別学習方法の効果を確認する目的で実験を行った。この発明による学習方法、損失関数値を式(22)、偏微分係数値を式(23)で求め、ψ=0.04、φ=0.25、ν=0.65、ε=20の条件で、日本語の学会講演約230時間分の音声を学習した。その後、上記学習データとは別の約130分の長さの評価音声を、この発明の音声認識装置700で音声認識した結果の単語誤り率は18.8%であった。従来技術の音声認識装置800で評価音声を音声認識した結果の単語誤り率は19.3%であった。また、初期値のモデルパラメータで音声認識した結果の単語誤り率は21.6%であった。したがって、初期の誤り率を100とした相対誤り削減率はこの発明の方法が13.0%、従来法の削減率が10.6%であり、この発明の学習方法の方が優れた認識性能を示すことが確認できた。
Claims (11)
- 局所スコア・局所誤り計算部と誤り数別識別スコア計算部と誤り数別事後確率計算部の各部をコンピュータが実行する誤り数別識別スコア・事後確率計算方法であって、
局所スコア・局所誤り計算部が、特徴量情報系列と、上記特徴量情報系列に対応した正解シンボル系列と、上記特徴量情報系列を複数の認識シンボル系列で表現したラティスと、モデルパラメータとを入力として、上記ラティスに含まれる各々の有向弧に対する局所スコアと、有向弧に含まれる局所誤り数とを計算する局所スコア・局所誤り計算過程と、
誤り数別識別スコア計算部が、上記局所スコアと、上記局所誤り数と、上記ラティスとを入力として、上記ラティスの誤り数別の識別スコアと誤り数別前向き累積スコアと誤り数別後ろ向き累積スコアとを計算する誤り数別識別スコア計算過程と、
誤り数別事後確率計算部が、上記ラティスの誤り数別の識別スコアと、上記誤り数別前向き累積スコアと、上記誤り数別後ろ向き累積スコアと、上記局所スコアとを入力として、上記正解シンボル系列が上記ラティスに含まれる各々の有向弧を含むことの事後確率を誤り数別に計算する誤り数別事後確率計算過程と、
を含む誤り数別識別スコア・事後確率計算方法。 - 局所スコア・局所誤り計算部と誤り数別識別スコア計算部と誤り数別事後確率計算部とを備え、誤り数別に識別スコアを重み付けてモデルパラメータを学習する誤り数重み付き識別学習装置が行う誤り数別識別スコア・事後確率計算方法であって、
局所スコア・局所誤り計算部が、特徴量情報系列と、上記特徴量情報系列に対応した正解シンボル系列と、上記特徴量情報系列を複数の認識シンボル系列で表現したラティスと、モデルパラメータとを入力として、上記ラティスに含まれる各々の有向弧に対する局所スコアと、有向弧に含まれる局所誤り数とを計算する局所スコア・局所誤り計算過程と、
誤り数別識別スコア計算部が、上記局所スコアと、上記局所誤り数と、上記ラティスとを入力として、上記ラティスの誤り数別の識別スコアと誤り数別前向き累積スコアと誤り数別後ろ向き累積スコアとを計算する誤り数別識別スコア計算過程と、
誤り数別事後確率計算部が、上記ラティスの誤り数別の識別スコアと、上記誤り数別前向き累積スコアと、上記誤り数別後ろ向き累積スコアと、上記局所スコアとを入力として、上記正解シンボル系列が上記ラティスに含まれる各々の有向弧を含むことの事後確率を誤り数別に計算する誤り数別事後確率計算過程と、
を含む誤り数別識別スコア・事後確率計算方法。 - 局所スコア・局所誤り計算部と誤り数別識別スコア計算部と誤り数別事後確率計算部と損失関数値計算部と偏微分係数値計算部とモデルパラメータ更新部を備える誤り数重み付き識別学習装置が行う誤り数重み付き識別学習方法であって、
局所スコア・局所誤り計算部が、特徴量情報系列と、上記特徴量情報系列に対応した正解シンボル系列と、上記特徴量情報系列を複数の認識シンボル系列で表現したラティスと、モデルパラメータとを入力として、上記ラティスに含まれる各々の有向弧に対する局所スコアと、有向弧に含まれる局所誤り数とを計算する局所スコア・局所誤り計算過程と、
誤り数別識別スコア計算部が、上記局所スコアと、上記局所誤り数と、上記ラティスとを入力として、上記ラティスの誤り数別の識別スコアと誤り数別前向き累積スコアと誤り数別後ろ向き累積スコアとを計算する誤り数別識別スコア計算過程と、
誤り数別事後確率計算部が、上記ラティスの誤り数別の識別スコアと、上記誤り数別前向き累積スコアと、上記誤り数別後ろ向き累積スコアと、上記局所スコアとを入力として、上記正解シンボル系列が上記ラティスに含まれる各々の有向弧を含むことの事後確率を誤り数別に計算する誤り数別事後確率計算過程と、
損失関数値計算部が、上記ラティスの誤り数別の識別スコアを入力として損失関数値を計算する損失関数値計算過程と、
偏微分係数値計算部が、上記ラティスの誤り数別の識別スコアと、上記損失関数値と、上記誤り数別事後確率とを入力として有向弧での偏微分係数値を計算する偏微分係数値計算過程と、
モデルパラメータ更新部が、上記偏微分係数値と、上記損失関数値と、上記モデルパラメータとを入力として上記モデルパラメータを更新するモデルパラメータ更新過程と、
を含む誤り数重み付き識別学習方法。 - 請求項3に記載した誤り数重み付き識別学習方法において、
上記損失関数値計算過程は、上記ラティスの誤り数別の識別スコアを制御係数でべき乗した値を、全ての有向弧の識別スコアを上記制御係数でべき乗した値の累積値で除し、更にその値に上記誤り数を乗算した値を上記誤り数で累積して上記損失関数値とする過程であることを特徴とする誤り数重み付き識別学習方法。 - 請求項1又は2に記載した誤り数別識別スコア・事後確率計算方法において、
上記誤り数別識別スコア計算過程は、
上記誤り数別前向き累積スコアを、上記有向弧の先行有向弧の局所スコアと上記先行有向弧までの誤り数別前向き累積スコアの誤り数の和毎に累積した前向き確率総和として求める前向き確率総和算出ステップと、
上記誤り数別後ろ向き累積スコアを、上記有向弧の後続有向弧の局所スコアと上記後続有向弧までの誤り数別後ろ向き累積スコアの誤り数の和毎に累積した後ろ向き確率総和として求める後ろ向き確率総和算出ステップと、
上記ラティスの誤り数別の識別スコアを、上記有向弧の局所スコアと上記前向き確率総和と上記後ろ向き確率総和との誤り数の和毎の事後確率として求める事後確率算出ステップと、
を含むことを特徴とする誤り数別識別スコア・事後確率計算方法。 - モデルパラメータを記録するモデルパラメータ記録部と、
特徴量情報系列を入力として複数のシンボル系列を表現するラティスを上記モデルパラメータ記録部から探索して出力するパターン認識部と、
上記特徴量情報系列と、上記特徴量情報系列に対応した正解シンボル系列と、上記特徴量情報系列を複数の認識シンボル系列で表現したラティスと、上記モデルパラメータとを入力として、上記ラティスに含まれる各々の有向弧に対する局所スコアと、有向弧に含まれる局所誤り数とを計算する局所スコア・局所誤り計算部と、
上記局所スコアと、上記局所誤り数と、上記ラティスとを入力として上記ラティスの誤り数別の識別スコアと、誤り数別前向き累積スコアと、誤り数別後ろ向き累積スコアとを計算する誤り数別識別スコア計算部と、
上記ラティスの誤り数別の識別スコアと、上記誤り数別前向き累積スコアと、上記誤り数別後ろ向き累積スコアと、上記局所スコアとを入力として上記正解シンボル系列が上記ラティスに含まれる各々の有向弧を含むことの事後確率を誤り数別に計算する誤り数別事後確率計算部と、
上記ラティスの誤り数別の識別スコアを入力として損失関数値を計算する損失関数値計算部と、
上記ラティスの誤り数別の識別スコアと、上記損失関数値と、上記誤り数別事後確率とを入力として有向弧での偏微分係数値を計算する偏微分係数値計算部と、
上記偏微分係数値と、上記損失関数値と、上記モデルパラメータとを入力として上記モデルパラメータを更新するモデルパラメータ更新部と、
を具備する誤り数重み付き識別学習装置。 - 請求項6に記載した誤り数重み付き識別学習装置において、
上記損失関数値計算部は、上記ラティスの誤り数別の識別スコアを制御係数でべき乗した値を、上記ラティスの誤り数別の識別スコアの累積値を上記制御係数でべき乗した値で除し、更に上記誤り数を乗算した値を、誤り数で累積して上記損失関数値とするものであることを特徴とする誤り数重み付き識別学習装置。 - 請求項6又は7に記載した誤り数重み付き識別学習装置と、
音声情報列を入力として音声情報列の音声特徴量情報系列を算出する音声特徴量抽出部と、
上記誤り数重み付き識別学習装置で学習した音響モデルを記録する音響モデル記録部と、
上記音声特徴量情報系列を入力として、複数のシンボル系列で表現される単語ラティスを上記音響モデル記録部から探索して出力する単語列探索部と、
を具備する音声認識装置。 - 請求項6又は7に記載した誤り数重み付き識別学習装置としてコンピュータを機能させるための装置プログラム。
- 請求項8に記載した音声認識装置としてコンピュータを機能させるための装置プログラム。
- 請求項9又は10に記載した装置プログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008225998A JP5308102B2 (ja) | 2008-09-03 | 2008-09-03 | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008225998A JP5308102B2 (ja) | 2008-09-03 | 2008-09-03 | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010060809A JP2010060809A (ja) | 2010-03-18 |
JP5308102B2 true JP5308102B2 (ja) | 2013-10-09 |
Family
ID=42187690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008225998A Active JP5308102B2 (ja) | 2008-09-03 | 2008-09-03 | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5308102B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5826680B2 (ja) * | 2012-03-09 | 2015-12-02 | Ntn株式会社 | ステアバイワイヤ式操舵機構の制御装置 |
CN112236782A (zh) * | 2018-04-03 | 2021-01-15 | 诺基亚技术有限公司 | 通信系统中的端到端学习 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0990975A (ja) * | 1995-09-22 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識のためのモデル学習方法 |
CN101390156B (zh) * | 2006-02-27 | 2011-12-07 | 日本电气株式会社 | 标准模式适应装置、标准模式适应方法 |
-
2008
- 2008-09-03 JP JP2008225998A patent/JP5308102B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010060809A (ja) | 2010-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6637078B2 (ja) | 音響モデル学習装置、音響モデル学習方法及びプログラム | |
JP6222821B2 (ja) | 誤り修正モデル学習装置、及びプログラム | |
JP4860265B2 (ja) | テキスト処理方法/プログラム/プログラム記録媒体/装置 | |
US9767790B2 (en) | Voice retrieval apparatus, voice retrieval method, and non-transitory recording medium | |
JP6831343B2 (ja) | 学習装置、学習方法及び学習プログラム | |
JP5294086B2 (ja) | 重み係数学習システム及び音声認識システム | |
JP7209330B2 (ja) | 識別器、学習済モデル、学習方法 | |
JPH0934486A (ja) | 音声認識方法、情報形成方法、音声認識装置および記録媒体 | |
KR102406512B1 (ko) | 음성인식 방법 및 그 장치 | |
JP4796460B2 (ja) | 音声認識装置及び音声認識プログラム | |
JP6646337B2 (ja) | 音声データ処理装置、音声データ処理方法および音声データ処理プログラム | |
JP5308102B2 (ja) | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 | |
JP4533160B2 (ja) | 識別的学習方法、装置、プログラム、識別的学習プログラムを記録した記録媒体 | |
JP3920749B2 (ja) | 音声認識用音響モデル作成方法、その装置、そのプログラムおよびその記録媒体、上記音響モデルを用いる音声認識装置 | |
JP4950600B2 (ja) | 音響モデル作成装置、その装置を用いた音声認識装置、これらの方法、これらのプログラム、およびこれらの記録媒体 | |
Becerra et al. | A comparative case study of neural network training by using frame-level cost functions for automatic speech recognition purposes in Spanish | |
JP4964194B2 (ja) | 音声認識モデル作成装置とその方法、音声認識装置とその方法、プログラムとその記録媒体 | |
JP6158105B2 (ja) | 言語モデル作成装置、音声認識装置、その方法及びプログラム | |
JP2013182261A (ja) | 適応化装置、音声認識装置、およびそのプログラム | |
JP5738216B2 (ja) | 特徴量補正パラメータ推定装置、音声認識システム、特徴量補正パラメータ推定方法、音声認識方法及びプログラム | |
JP6121187B2 (ja) | 音響モデル補正パラメータ推定装置、その方法及びプログラム | |
JP5113797B2 (ja) | 相違度利用型識別的学習装置とその方法、そのプログラム | |
JP2011048163A (ja) | 音響モデルの話者適応装置及びそのためのコンピュータプログラム | |
JP5385810B2 (ja) | 線形分類モデルに基づく音響モデルパラメータ学習方法とその装置、音素重み付き有限状態変換器生成方法とその装置、それらのプログラム | |
JP5161174B2 (ja) | 経路探索装置、音声認識装置、これらの方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100726 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130618 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130628 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5308102 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |