JP2010060809A - 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 - Google Patents
誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 Download PDFInfo
- Publication number
- JP2010060809A JP2010060809A JP2008225998A JP2008225998A JP2010060809A JP 2010060809 A JP2010060809 A JP 2010060809A JP 2008225998 A JP2008225998 A JP 2008225998A JP 2008225998 A JP2008225998 A JP 2008225998A JP 2010060809 A JP2010060809 A JP 2010060809A
- Authority
- JP
- Japan
- Prior art keywords
- errors
- score
- error
- lattice
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】この発明の誤り数別識別スコア・事後確率計算方法は、局所スコア・局所誤り計算過程と、誤り数別識別スコア計算過程と、誤り数別事後確率計算過程とを含む。誤り数別識別スコア計算過程は、上記局所スコアと、上記局所誤り数と、上記ラティスとを入力として上記ラティスの誤り数別の識別スコアと、誤り数別前向き累積スコアと、誤り数別後ろ向き累積スコアとを計算する。誤り数別事後確率計算過程は、上記ラティスの誤り数別の識別スコアと、上記誤り数別前向き累積スコアと、上記誤り数別後ろ向き累積スコアと、上記局所スコアとを入力として上記正解シンボル系列が上記ラティスに含まれる各々の有向弧を含むことの事後確率を誤り数別に計算する。
【選択図】図1
Description
D.Povey and P.Woodland, "Minimum Phone Error and I−smoothing for improved discriminative training,"in Proc.ICASSP02,pp.105-108,2002.
することができる。最適化の収束を判定するのに特徴量情報系列の総損失ΓMGE1(Z)(式
21)とその偏微分係数値(式(22))を用いる。Zは様々な部分特徴量情報系列Xr1,
…,Xrmを含む全体の特徴量情報系列(Z∈{Xr(m)|m=1,…,M})である。Xr(m)
は式中の表記が正しい。
この発明の誤り数重み付き識別学習装置100を音声認識に応用した例を説明する。図6にこの発明の誤り数重み付き識別学習装置100を用いて音声認識装置600を構成した機能構成例を示す。音声認識装置600は、従来技術で説明した音声認識装置800の音声認識用学習装置700をこの発明の誤り数重み付き識別学習装置100に置き換えたものである。
この発明の誤り数重み付き識別学習方法の効果を確認する目的で実験を行った。この発明による学習方法、損失関数値を式(22)、偏微分係数値を式(23)で求め、ψ=0.04、φ=0.25、ν=0.65、ε=20の条件で、日本語の学会講演約230時間分の音声を学習した。その後、上記学習データとは別の約130分の長さの評価音声を、この発明の音声認識装置700で音声認識した結果の単語誤り率は18.8%であった。従来技術の音声認識装置800で評価音声を音声認識した結果の単語誤り率は19.3%であった。また、初期値のモデルパラメータで音声認識した結果の単語誤り率は21.6%であった。したがって、初期の誤り率を100とした相対誤り削減率はこの発明の方法が13.0%、従来法の削減率が10.6%であり、この発明の学習方法の方が優れた認識性能を示すことが確認できた。
Claims (10)
- 局所スコア・局所誤り計算部が、特徴量情報系列と、上記特徴量情報系列に対応した正解シンボル系列と、上記特徴量情報系列を複数の認識シンンボル系列で表現したラティスと、モデルパラメータとを入力として、上記ラティスに含まれる各々の有向弧に対する局所スコアと、有向弧に含まれる局所誤り数とを計算する局所スコア・局所誤り計算過程と、
誤り数別識別スコア計算部が、上記局所スコアと、上記局所誤り数と、上記ラティスとを入力として、上記ラティスの誤り数別の識別スコアと誤り数別前向き累積スコアと誤り数別後ろ向き累積スコアとを計算する誤り数別識別スコア計算過程と、
誤り数別事後確率計算部が、上記ラティスの誤り数別の識別スコアと、上記誤り数別前向き累積スコアと、上記誤り数別後ろ向き累積スコアと、上記局所スコアとを入力として、上記正解シンボル系列が上記ラティスに含まれる各々の有向弧を含むことの事後確率を誤り数別に計算する誤り数別事後確率計算過程と、
を含む誤り数別識別スコア・事後確率計算方法。 - 請求項1に記載した誤り数別識別スコア・事後確率計算方法において、
上記誤り数別識別スコア計算過程は、
上記誤り数別前向き累積スコアを、上記有向弧の先行有向弧の局所スコアと上記先行有向弧までの誤り数別前向き累積スコアの誤り数の和毎に累積した前向き確率総和として求める前向き確率総和算出ステップと、
上記誤り数別後ろ向き累積スコアを、上記有向弧の後続有向弧の局所スコアと上記後続有効弧までの誤り数別後ろ向き累積スコアの誤り数の和毎に累積した後ろ向き確率総和として求める後ろ向き確率総和算出ステップと、
上記ラティスの誤り数別の識別スコアを、上記有向弧の局所スコアと上記前向き確率総和と上記後ろ向き確率総和との誤り数の和毎の事後確率として求める事後確率算出ステップと、
を含むことを特徴とする誤り数別識別スコア・事後確率計算方法。 - 請求項1又は2に記載した誤り数別識別スコア・事後確率計算方法と、
パターン認識部が、特徴量情報系列を入力として複数のシンボル系列を表現するラティスを上記モデルパラメータ記録部から探索して出力するパターン認識過程と、
損失関数値計算部が、上記ラティスの誤り数別の識別スコアを入力として損失関数値を計算する損失関数値計算過程と、
偏微分係数値計算部が、上記ラティスの誤り数別の識別スコアと、上記損失関数値と、上記誤り数別事後確率とを入力として有向弧での偏微分係数値を計算する偏微分係数値計算過程と、
モデルパラメータ更新部が、上記偏微分係数値と、上記損失関数と、上記モデルパラメータとを入力として上記モデルパラメータを更新するモデルパラメータ更新過程と、
を含む誤り数重み付き識別学習方法。 - 請求項3に記載した誤り数重み付き識別学習方法において、
上記損失関数値計算過程は、上記ラティスの誤り数別の識別スコアを制御係数でべき乗した値を、全ての有向弧の識別スコアを上記制御係数でべき乗した値の累積値で除し、更にその値に上記誤り数を乗算した値を上記誤り数で累積して上記損失関数とする過程であることを特徴とする誤り数重み付き識別学習方法。 - モデルパラメータを記録するモデルパラメータ記録部と、
特徴量情報系列を入力として複数のシンボル系列を表現するラティスを上記モデルパラメータ記録部から探索して出力するパターン認識部と、
上記特徴量情報系列と、上記特徴量情報系列に対応した正解シンボル系列と、上記特徴量情報系列を複数の認識シンンボル系列で表現したラティスと、モデルパラメータとを入力として、上記ラティスに含まれる各々の有向弧に対する局所スコアと、有向弧に含まれる局所誤り数とを計算する局所スコア・局所誤り計算部と、
上記局所スコアと、上記局所誤り数と、上記ラティスとを入力として上記ラティスの誤り数別の識別スコアと、誤り数別前向き累積スコアと、誤り数別後ろ向き累積スコアとを計算する誤り数別識別スコア計算部と、
上記ラティスの誤り数別の識別スコアと、上記誤り数別前向き累積スコアと、上記誤り数別後ろ向き累積スコアと、上記局所スコアとを入力として上記正解シンボル系列が上記ラティスに含まれる各々の有向弧を含むことの事後確率を誤り数別に計算する誤り数別事後確率計算部と、
上記ラティスの誤り数別の識別スコアを入力として損失関数値を計算する損失関数値計算部と、
上記ラティスの誤り数別の識別スコアと、上記損失関数値と、上記誤り数別事後確率とを入力として有向弧での偏微分係数値を計算する偏微分係数値計算部と、
上記偏微分係数値と、上記損失関数と、上記モデルパラメータとを入力として上記モデルパラメータを更新するモデルパラメータ更新部と、
を具備する誤り数重み付き識別学習装置。 - 請求項5に記載した誤り数重み付き識別学習装置において、
上記損失関数値計算部は、上記ラティスの誤り数別の識別スコアを制御係数でべき乗した値を、上記ラティスの誤り数別の識別スコアの累積値を上記制御係数でべき乗した値で除し、更に上記誤り数を乗算した値を、誤り数で累積して上記損失関数とするものであることを特徴とする誤り数重み付き識別学習装置。 - 請求項5又は6に記載した誤り数重み付き識別学習装置と、
音声情報列を入力として音声情報列の音声特徴量情報系列を算出する音声特徴量抽出部と、
上記誤り数重み付き識別学習装置で学習した音響モデルを記録する音響モデル記録部と、
上記音声特徴量情報系列に応じて、上記音響モデルパラメータ記録部内に記録された特徴量情報系列を探索して複数のシンボル系列で表現される単語ラティスを出力する単語列探索部と、
を具備する音声認識装置。 - 請求項5又は6に記載した誤り数重み付き識別学習装置としてコンピュータを機能させるための装置プログラム。
- 請求項7に記載した音声認識装置としてコンピュータを機能させるための装置プログラム。
- 請求項8又は9に記載した装置プログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008225998A JP5308102B2 (ja) | 2008-09-03 | 2008-09-03 | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008225998A JP5308102B2 (ja) | 2008-09-03 | 2008-09-03 | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010060809A true JP2010060809A (ja) | 2010-03-18 |
| JP5308102B2 JP5308102B2 (ja) | 2013-10-09 |
Family
ID=42187690
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008225998A Active JP5308102B2 (ja) | 2008-09-03 | 2008-09-03 | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5308102B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150012183A1 (en) * | 2012-03-09 | 2015-01-08 | Ntn Corporation | Control device for steer-by-wire steering mechanism |
| CN112166567A (zh) * | 2018-04-03 | 2021-01-01 | 诺基亚技术有限公司 | 通信系统中的学习 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0990975A (ja) * | 1995-09-22 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識のためのモデル学習方法 |
| WO2007105409A1 (ja) * | 2006-02-27 | 2007-09-20 | Nec Corporation | 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム |
-
2008
- 2008-09-03 JP JP2008225998A patent/JP5308102B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0990975A (ja) * | 1995-09-22 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識のためのモデル学習方法 |
| WO2007105409A1 (ja) * | 2006-02-27 | 2007-09-20 | Nec Corporation | 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム |
Non-Patent Citations (8)
| Title |
|---|
| CSNG200600193001; 南條 浩輝 Hiroaki NANJO: '音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング ASR Evaluation Measure and Minim' 電子情報通信学会技術研究報告 Vol.104 No.540 IEICE Technical Report p.1-6, 200412, 社団法人電子情報通信学会 The Institute of Electro * |
| CSNG200700238017; 南條 浩輝 Hiroaki NANJO: '単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出 Minimum Bayes-Risk Decoding' 情報処理学会研究報告 Vol.2006 No.136 IPSJ SIG Technical Reports , 20061221, p.125-130, 社団法人情報処理学会 Information Processing Socie * |
| CSNG200800063102; 鈴木 潤: '学習誤り最小化に基づく条件付き確率場の学習:言語解析への適用' 言語処理学会第12回年次大会発表論文集 Proceedings of The Twelfth Annual Meeting of The Association , 200603, p.548-551, 言語処理学会 The Association for Natural Language * |
| CSNJ201110010422; マクダーモット エリック Erik McDermott: 日本音響学会 2010年 春季研究発表会講演論文集CD-ROM [CD-ROM] , 201003, p.271-274 * |
| JPN6012002055; 鈴木 潤: '学習誤り最小化に基づく条件付き確率場の学習:言語解析への適用' 言語処理学会第12回年次大会発表論文集 Proceedings of The Twelfth Annual Meeting of The Association , 200603, p.548-551, 言語処理学会 The Association for Natural Language * |
| JPN6012002059; 南條 浩輝 Hiroaki NANJO: '単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出 Minimum Bayes-Risk Decoding' 情報処理学会研究報告 Vol.2006 No.136 IPSJ SIG Technical Reports , 20061221, p.125-130, 社団法人情報処理学会 Information Processing Socie * |
| JPN6012002060; マクダーモット エリック Erik McDermott: 日本音響学会 2010年 春季研究発表会講演論文集CD-ROM [CD-ROM] , 201003, p.271-274 * |
| JPN6012002062; 南條 浩輝 Hiroaki NANJO: '音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング ASR Evaluation Measure and Minim' 電子情報通信学会技術研究報告 Vol.104 No.540 IEICE Technical Report p.1-6, 200412, 社団法人電子情報通信学会 The Institute of Electro * |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150012183A1 (en) * | 2012-03-09 | 2015-01-08 | Ntn Corporation | Control device for steer-by-wire steering mechanism |
| US9771100B2 (en) * | 2012-03-09 | 2017-09-26 | Ntn Corporation | Control device for steer-by-wire steering mechanism |
| CN112166567A (zh) * | 2018-04-03 | 2021-01-01 | 诺基亚技术有限公司 | 通信系统中的学习 |
| CN112166567B (zh) * | 2018-04-03 | 2023-04-18 | 诺基亚技术有限公司 | 通信系统中的学习 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5308102B2 (ja) | 2013-10-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6637078B2 (ja) | 音響モデル学習装置、音響モデル学習方法及びプログラム | |
| CN108346436B (zh) | 语音情感检测方法、装置、计算机设备及存储介质 | |
| JP6222821B2 (ja) | 誤り修正モデル学習装置、及びプログラム | |
| JP5982297B2 (ja) | 音声認識装置、音響モデル学習装置、その方法及びプログラム | |
| JP5294086B2 (ja) | 重み係数学習システム及び音声認識システム | |
| JP6831343B2 (ja) | 学習装置、学習方法及び学習プログラム | |
| US20160180839A1 (en) | Voice retrieval apparatus, voice retrieval method, and non-transitory recording medium | |
| JP7209330B2 (ja) | 識別器、学習済モデル、学習方法 | |
| WO2008001485A1 (en) | Language model generating system, language model generating method, and language model generating program | |
| JPH0934486A (ja) | 音声認識方法、情報形成方法、音声認識装置および記録媒体 | |
| JP2017058877A (ja) | 学習装置、音声検出装置、学習方法およびプログラム | |
| JP4860265B2 (ja) | テキスト処理方法/プログラム/プログラム記録媒体/装置 | |
| KR102406512B1 (ko) | 음성인식 방법 및 그 장치 | |
| JP6027754B2 (ja) | 適応化装置、音声認識装置、およびそのプログラム | |
| JP5308102B2 (ja) | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 | |
| JP6646337B2 (ja) | 音声データ処理装置、音声データ処理方法および音声データ処理プログラム | |
| JP3920749B2 (ja) | 音声認識用音響モデル作成方法、その装置、そのプログラムおよびその記録媒体、上記音響モデルを用いる音声認識装置 | |
| JP4964194B2 (ja) | 音声認識モデル作成装置とその方法、音声認識装置とその方法、プログラムとその記録媒体 | |
| JP5288378B2 (ja) | 音響モデルの話者適応装置及びそのためのコンピュータプログラム | |
| JP5738216B2 (ja) | 特徴量補正パラメータ推定装置、音声認識システム、特徴量補正パラメータ推定方法、音声認識方法及びプログラム | |
| Becerra et al. | A comparative case study of neural network training by using frame-level cost functions for automatic speech recognition purposes in Spanish | |
| JP5914119B2 (ja) | 音響モデル性能評価装置とその方法とプログラム | |
| JP2011048262A (ja) | 音響モデルパラメータ学習装置、音響モデルパラメータ学習方法、音響モデルパラメータ学習プログラム | |
| JP5113797B2 (ja) | 相違度利用型識別的学習装置とその方法、そのプログラム | |
| JP4796460B2 (ja) | 音声認識装置及び音声認識プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100726 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111116 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120323 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121002 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121128 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130618 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130628 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5308102 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
