JP2011039432A - 情報圧縮型モデルパラメータ推定装置、方法及びプログラム - Google Patents
情報圧縮型モデルパラメータ推定装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2011039432A JP2011039432A JP2009189112A JP2009189112A JP2011039432A JP 2011039432 A JP2011039432 A JP 2011039432A JP 2009189112 A JP2009189112 A JP 2009189112A JP 2009189112 A JP2009189112 A JP 2009189112A JP 2011039432 A JP2011039432 A JP 2011039432A
- Authority
- JP
- Japan
- Prior art keywords
- model parameter
- importance
- parameter estimation
- symbol
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】それぞれ重要度ei,jが割り当てられ素性ベクトルで表現された複数のシンボル系列fi,jからなる1以上のリストiと各リストiの正解シンボル系列fi,0とが入力され、モデルパラメータを推定する装置であり、グルーピング部とマージング部とモデルパラメータ推定部とを備える。グルーピング部はリストに属する複数のシンボル系列fi,jを複数のグループに分ける。マージング部はグループ内の複数のシンボル系列fi,jから代表シンボル系列fi,xを、グループ内の複数のシンボル系列fi,jに対応する複数の重要度ei,jから代表重要度ei,xをそれぞれ求める。モデルパラメータ推定部は代表シンボル系列fi,xと正解シンボル系列fi,0と代表重要度ei,xとからモデルパラメータを推定する。
【選択図】図1
Description
マージ関数Eにより代表重要度ei,xにマージする方法についても、例えば式(9)に示す重要度の平均値を用いる方法などが挙げられる。
日本語話し言葉コーパス(CSJ)を用い、本発明の効果を検証する。CSJは講演音声データとその書き起こしからなるデータベースである。なお、検証にあたり、図3に示す学習用と開発用と2つの評価用のセットを用意した。
Claims (7)
- それぞれ重要度ei,jが割り当てられ素性ベクトルで表現された複数のシンボル系列fi,jからなる、1以上のリストi(iはリストのインデックス(i=1、2、・・・、N)、jは各iにおけるシンボル系列のインデックス(j=1、2、・・・、ni))と、それぞれ素性ベクトルで表現された各リストiの正解シンボル系列fi,0とが入力され、モデルパラメータwを推定する情報圧縮型モデルパラメータ推定装置であって、
上記リストiごとに、リストに属する複数のシンボル系列fi,jを所定の方法により複数のグループGi(x)(xはグループのインデックス)にグループ分けするグルーピング部と、
上記グループGi(x)に属する複数のシンボル系列fi,jから代表シンボル系列fi,xを、また上記グループGi(x)に属する複数のシンボル系列fi,jに対応する複数の重要度ei,jから代表重要度ei,xをそれぞれ求めるマージング部と、
上記代表シンボル系列fi,xと上記正解シンボル系列fi,0と上記代表重要度ei,xとから、モデルパラメータwを推定するモデルパラメータ推定部と、
を備える情報圧縮型モデルパラメータ推定装置。 - 請求項1に記載の情報圧縮型モデルパラメータ推定装置において、
上記グルーピング部は、素性ベクトル空間上での距離、又は重要度の値に基づいてグループ分けすることを特徴とする情報圧縮型モデルパラメータ推定装置。 - 請求項1又は2のいずれかに記載の情報圧縮型モデルパラメータ推定装置において、
上記マージング部は、代表シンボル系列fi,xをグループGi(x)に属する複数のシンボル系列fi,jのセントロイド又は重み付き内分点として求め、代表重要度ei,xをグループGi(x)に属する複数のシンボル系列fi,jに対応する複数の重要度ei,jの平均値として求めることを特徴とする情報圧縮型モデルパラメータ推定装置。 - それぞれ重要度ei,jが割り当てられ素性ベクトルで表現された複数のシンボル系列fi,jからなる、1以上のリストi(iはリストのインデックス(i=1、2、・・・、N)、jは各iにおけるシンボル系列のインデックス(j=1、2、・・・、ni))と、それぞれ素性ベクトルで表現された各リストiの正解シンボル系列fi,0とが入力され、モデルパラメータwを推定する情報圧縮型モデルパラメータ推定方法であって、
上記リストiごとに、リストに属する複数のシンボル系列fi,jを所定の方法により複数のグループGi(x)(xはグループのインデックス)にグループ分けするグルーピングステップと、
上記グループGi(x)に属する複数のシンボル系列fi,jから代表シンボル系列fi,xを、また上記グループGi(x)に属する複数のシンボル系列fi,jに対応する複数の重要度ei,jから代表重要度ei,xをそれぞれ求めるマージングステップと、
上記代表シンボル系列fi,xと上記正解シンボル系列fi,0と上記代表重要度ei,xとから、モデルパラメータwを推定するモデルパラメータ推定ステップと、
を実行する情報圧縮型モデルパラメータ推定方法。 - 請求項4に記載の情報圧縮型モデルパラメータ推定方法において、
上記グルーピングステップは、素性ベクトル空間上での距離、又は重要度の値に基づいてグループ分けすることを特徴とする情報圧縮型モデルパラメータ推定方法。 - 請求項4又は5のいずれかに記載の情報圧縮型モデルパラメータ推定方法において、
上記マージングステップは、代表シンボル系列fi,xをグループGi(x)に属する複数のシンボル系列fi,jのセントロイド又は重み付き内分点として求め、代表重要度ei,xをグループGi(x)に属する複数のシンボル系列fi,jに対応する複数の重要度ei,jの平均値として求めることを特徴とする情報圧縮型モデルパラメータ推定方法。 - 請求項1乃至3のいずれかに記載の装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009189112A JP5264649B2 (ja) | 2009-08-18 | 2009-08-18 | 情報圧縮型モデルパラメータ推定装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009189112A JP5264649B2 (ja) | 2009-08-18 | 2009-08-18 | 情報圧縮型モデルパラメータ推定装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011039432A true JP2011039432A (ja) | 2011-02-24 |
JP5264649B2 JP5264649B2 (ja) | 2013-08-14 |
Family
ID=43767243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009189112A Active JP5264649B2 (ja) | 2009-08-18 | 2009-08-18 | 情報圧縮型モデルパラメータ推定装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5264649B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012256198A (ja) * | 2011-06-08 | 2012-12-27 | Nippon Telegr & Teleph Corp <Ntt> | 縮約素性生成装置、方法、プログラム、モデル構築装置及び方法 |
JP2013084136A (ja) * | 2011-10-11 | 2013-05-09 | Nippon Hoso Kyokai <Nhk> | 意味分析装置およびそのプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006201553A (ja) * | 2005-01-21 | 2006-08-03 | Nippon Telegr & Teleph Corp <Ntt> | 識別的学習方法、装置、プログラム、音声認識装置、プログラム、これらのプログラムを記録した記録媒体 |
JP2010164780A (ja) * | 2009-01-15 | 2010-07-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル作成装置、音響モデル作成方法、音響モデル作成プログラム |
JP2010250161A (ja) * | 2009-04-17 | 2010-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 相違度利用型識別的学習装置とその方法、そのプログラム |
JP2011039785A (ja) * | 2009-08-11 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | ConditionalRandomFieldsもしくはGlobalConditionalLog−linearModelsを用いる学習装置及びその学習装置におけるパラメータ学習方法、プログラム |
JP2011039965A (ja) * | 2009-08-18 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | モデルパラメータ推定装置、方法及びプログラム |
-
2009
- 2009-08-18 JP JP2009189112A patent/JP5264649B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006201553A (ja) * | 2005-01-21 | 2006-08-03 | Nippon Telegr & Teleph Corp <Ntt> | 識別的学習方法、装置、プログラム、音声認識装置、プログラム、これらのプログラムを記録した記録媒体 |
JP2010164780A (ja) * | 2009-01-15 | 2010-07-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル作成装置、音響モデル作成方法、音響モデル作成プログラム |
JP2010250161A (ja) * | 2009-04-17 | 2010-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 相違度利用型識別的学習装置とその方法、そのプログラム |
JP2011039785A (ja) * | 2009-08-11 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | ConditionalRandomFieldsもしくはGlobalConditionalLog−linearModelsを用いる学習装置及びその学習装置におけるパラメータ学習方法、プログラム |
JP2011039965A (ja) * | 2009-08-18 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | モデルパラメータ推定装置、方法及びプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012256198A (ja) * | 2011-06-08 | 2012-12-27 | Nippon Telegr & Teleph Corp <Ntt> | 縮約素性生成装置、方法、プログラム、モデル構築装置及び方法 |
JP2013084136A (ja) * | 2011-10-11 | 2013-05-09 | Nippon Hoso Kyokai <Nhk> | 意味分析装置およびそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5264649B2 (ja) | 2013-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8959014B2 (en) | Training acoustic models using distributed computing techniques | |
US9176936B2 (en) | Transliteration pair matching | |
Hall et al. | Composition-based on-the-fly rescoring for salient n-gram biasing. | |
US20120323560A1 (en) | Method for symbolic correction in human-machine interfaces | |
US9747893B2 (en) | Unsupervised training method, training apparatus, and training program for an N-gram language model based upon recognition reliability | |
JP2008165786A (ja) | 機械翻訳用のシーケンス分類 | |
JP2008165783A (ja) | シーケンス分類のためのモデルの識別トレーニング | |
JP6051004B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
US11232786B2 (en) | System and method to improve performance of a speech recognition system by measuring amount of confusion between words | |
JP6031316B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
Hifny | Smoothing techniques for Arabic diacritics restoration | |
KR20230156125A (ko) | 룩업 테이블 순환 언어 모델 | |
Gondala et al. | Error-driven pruning of language models for virtual assistants | |
Hifny | Restoration of Arabic diacritics using dynamic programming | |
JP5914054B2 (ja) | 言語モデル作成装置、音声認識装置、およびそのプログラム | |
JP6366166B2 (ja) | 音声認識装置、及びプログラム | |
JP2013117683A (ja) | 音声認識装置、誤り傾向学習方法、及びプログラム | |
JP5264649B2 (ja) | 情報圧縮型モデルパラメータ推定装置、方法及びプログラム | |
JP5295037B2 (ja) | ConditionalRandomFieldsもしくはGlobalConditionalLog−linearModelsを用いる学習装置及びその学習装置におけるパラメータ学習方法、プログラム | |
JP5268825B2 (ja) | モデルパラメータ推定装置、方法及びプログラム | |
JP5860439B2 (ja) | 言語モデル作成装置とその方法、そのプログラムと記録媒体 | |
Evanini et al. | Call classification for automated troubleshooting on large corpora | |
Ni et al. | Investigation of using different Chinese word segmentation standards and algorithms for automatic speech recognition | |
Rasipuram et al. | Probabilistic lexical modeling and unsupervised training for zero-resourced ASR | |
Xu et al. | Continuous space discriminative language modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110721 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130430 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5264649 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |