JP2011039785A - ConditionalRandomFieldsもしくはGlobalConditionalLog−linearModelsを用いる学習装置及びその学習装置におけるパラメータ学習方法、プログラム - Google Patents
ConditionalRandomFieldsもしくはGlobalConditionalLog−linearModelsを用いる学習装置及びその学習装置におけるパラメータ学習方法、プログラム Download PDFInfo
- Publication number
- JP2011039785A JP2011039785A JP2009186668A JP2009186668A JP2011039785A JP 2011039785 A JP2011039785 A JP 2011039785A JP 2009186668 A JP2009186668 A JP 2009186668A JP 2009186668 A JP2009186668 A JP 2009186668A JP 2011039785 A JP2011039785 A JP 2011039785A
- Authority
- JP
- Japan
- Prior art keywords
- score
- linear
- exponent
- parameter
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】複数のシンボル系列の素性ベクトルと、対応する正解シンボル系列の素性ベクトルと、各シンボル系列のシンボル系列重みとからなるリストの集合を学習データとして取り込むリスト入力部11と、目的関数のパラメータ初期化部21と、パラメータと素性ベクトルの内積により線形スコアを算出し、その線形スコアとシンボル系列重みから指数スコアを算出するリスト内処理部22と、リスト内処理部22で算出された全ての指数スコア及び素性ベクトルを用いて目的関数及びその傾きを算出する目的関数算出部23と、前記傾きから目的関数の収束を判定する収束判定部24と、パラメータを更新するパラメータ更新部25とを備える。
【選択図】図3
Description
参考文献:小林彰夫、他5名,「単語ラティスの識別的スコアリングによる音声認識」 ,秋季音響学会講演論文集,pp.233-234(2007)
シンボル系列重みは人為的に与えられたモデル学習を助ける補助情報であるため、これを用いて学習を行うことは高精度なモデルの生成に繋がる。そのため、シンボル系列重みが与えられている場合にはシンボル系列重みを扱う枠組みを持つ学習機械を選択する必要がある。
・リスト入力(ステップS1)
リスト入力部11は複数のシンボル系列の素性ベクトルと、それに対応する正解シンボル系列の素性ベクトルとからなるリストの集合を学習データとして取り込み、全てのi,jについてf→ i,0 及びf→ i,j が入力される。
・パラメータ初期化(ステップS2)
パラメータ初期化部21は式(2)に示した目的関数Lのパラメータw→を初期化する。
・線形スコア算出(ステップS3)
リスト内処理部22の線形スコア算出部22aはパラメータw→と素性ベクトルf→との内積により線形スコア〈w→,f→〉を算出する。
・指数スコア算出(ステップS4)
指数スコア算出部22bは線形スコア〈w→,f→〉から指数スコアexp(〈w→,f→〉)を算出する。各iにおいて、正解シンボル系列の指数スコアexp(〈w→,f→ i,0 〉)を含む{exp(〈w→,f→ i,j 〉)|j=0,1,…,ni}が算出される。
・目的関数及びその傾き算出(ステップS5)
目的関数算出部23はリスト内処理部22で算出された全ての指数スコア及び素性ベクトルを用いて式(2)の目的関数L及びその傾きを算出する。傾きは、
・収束判定(ステップS6)
収束判定部24は式(3)に示した傾きから目的関数Lの収束を判定する。
・パラメータ更新(ステップS7)
パラメータ更新部25は収束判定部24で収束未と判定された時、パラメータw→の更新を行う。
[等価な2種類のシンボル系列重みの導入]
実施例1における目的関数Lは次式となる。
[凹型な目的関数]
式(4)が凹型であることを示すために、等式変形された式(6)を用いて考える。今、w→及びf→ i,j にそれぞれ新たな要素として、c及びlog(si,j )を追加する。追加されたものをそれぞれW→及びF→ i,j と表記する。このとき、式(6)は
式(5)も同様の理由からパラメータw→に対して凹型であることがわかる。
リストから最適なシンボル系列を求める場合には、学習により得られたパラメータw→と各シンボル系列の素性ベクトルf→の内積〈w→,f→〉が最も大きなシンボル系列を選択する。
《検証》
日本語話し言葉コーパス(CSJ)を用い、本発明の効果を検証した。CSJは講演音声データとその書き起こしからなるデータベースである。下記の表に示したような学習用と2つの評価セットを用意した。
Claims (7)
- Conditional Random FieldsもしくはGlobal Conditional Log-linear Modelsを用いる学習装置であって、
複数のシンボル系列の素性ベクトルと、それに対応する正解シンボル系列の素性ベクトルと、それら各シンボル系列のシンボル系列重みとからなるリストの集合を学習データとして取り込むリスト入力部と、
目的関数のパラメータを初期化するパラメータ初期化部と、
前記パラメータと前記素性ベクトルとの内積により線形スコアを算出し、その線形スコアと前記シンボル系列重みとから重み付けされた指数スコアを前記各シンボル系列に対して算出するリスト内処理部と、
前記リスト内処理部で算出された全ての指数スコア及び前記素性ベクトルを用いて前記目的関数及びその傾きを算出する目的関数算出部と、
前記傾きから前記目的関数の収束を判定する収束判定部と、
前記パラメータを更新するパラメータ更新部とを備えることを特徴とする学習装置。 - 請求項1記載のConditional Random FieldsもしくはGlobal Conditional Log-linear Modelsを用いる学習装置において、
前記リスト内処理部は、前記線形スコアを算出する線形スコア算出部と、その線形スコア算出部で算出された線形スコアから指数スコアを算出する指数スコア算出部と、その指数スコア算出部で算出された指数スコアに前記シンボル系列重みを乗算して前記重み付けされた指数スコアを算出する重み乗算部とよりなることを特徴とする学習装置。 - 請求項1記載のConditional Random FieldsもしくはGlobal Conditional Log-linear Modelsを用いる学習装置において、
前記リスト内処理部は、前記線形スコアを算出する線形スコア算出部と、その線形スコア算出部で算出された線形スコアに前記シンボル系列重みを加算して重み付けされた線形スコアを算出する重み加算部と、その重み加算部で算出された重み付けされた線形スコアから前記重み付けされた指数スコアを算出する指数スコア算出部とよりなることを特徴とする学習装置。 - Conditional Random FieldsもしくはGlobal Conditional Log-linear Modelsを用いる学習装置におけるパラメータ学習方法であって、
複数のシンボル系列の素性ベクトルと、それに対応する正解シンボル系列の素性ベクトルと、それら各シンボル系列のシンボル系列重みとからなるリストの集合を学習データとして取り込むリスト入力過程と、
目的関数のパラメータを初期化するパラメータ初期化過程と、
前記パラメータと前記素性ベクトルとの内積により線形スコアを算出し、その線形スコアと前記シンボル系列重みとから重み付けされた指数スコアを前記各シンボル系列に対して算出するリスト内処理過程と、
前記リスト内処理過程で算出された全ての指数スコア及び前記素性ベクトルを用いて前記目的関数及びその傾きを算出する目的関数算出過程と、
前記傾きから前記目的関数の収束を判定する収束判定過程と、
前記パラメータを更新するパラメータ更新過程とを含むことを特徴とするパラメータ学習方法。 - 請求項4記載のConditional Random FieldsもしくはGlobal Conditional Log-linear Modelsを用いる学習装置におけるパラメータ学習方法において、
前記リスト内処理過程は、前記線形スコアを算出する線形スコア算出過程と、その線形スコア算出過程で算出された線形スコアから指数スコアを算出する指数スコア算出過程と、その指数スコア算出過程で算出された指数スコアに前記シンボル系列重みを乗算して前記重み付けされた指数スコアを算出する重み乗算過程とよりなることを特徴とするパラメータ学習方法。 - 請求項4記載のConditional Random FieldsもしくはGlobal Conditional Log-linear Modelsを用いる学習装置におけるパラメータ学習方法において、
前記リスト内処理過程は、前記線形スコアを算出する線形スコア算出過程と、その線形スコア算出過程で算出された線形スコアに前記シンボル系列重みを加算して重み付けされた線形スコアを算出する重み加算過程と、その重み加算過程で算出された重み付けされた線形スコアから前記重み付けされた指数スコアを算出する指数スコア算出過程とよりなることを特徴とするパラメータ学習方法。 - 請求項1乃至3のいずれかに記載のConditional Random FieldsもしくはGlobal Conditional Log-linear Modelsを用いる学習装置としてコンピュータを機能させるためのパラメータ学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009186668A JP5295037B2 (ja) | 2009-08-11 | 2009-08-11 | ConditionalRandomFieldsもしくはGlobalConditionalLog−linearModelsを用いる学習装置及びその学習装置におけるパラメータ学習方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009186668A JP5295037B2 (ja) | 2009-08-11 | 2009-08-11 | ConditionalRandomFieldsもしくはGlobalConditionalLog−linearModelsを用いる学習装置及びその学習装置におけるパラメータ学習方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011039785A true JP2011039785A (ja) | 2011-02-24 |
JP5295037B2 JP5295037B2 (ja) | 2013-09-18 |
Family
ID=43767490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009186668A Active JP5295037B2 (ja) | 2009-08-11 | 2009-08-11 | ConditionalRandomFieldsもしくはGlobalConditionalLog−linearModelsを用いる学習装置及びその学習装置におけるパラメータ学習方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5295037B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011039432A (ja) * | 2009-08-18 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | 情報圧縮型モデルパラメータ推定装置、方法及びプログラム |
CN102929916A (zh) * | 2012-09-19 | 2013-02-13 | 无锡华御信息技术有限公司 | 一种基于文档名称识别的备份文档的方法 |
CN113342525A (zh) * | 2020-07-24 | 2021-09-03 | 北京一流科技有限公司 | 分布式数据处理系统及其方法 |
-
2009
- 2009-08-11 JP JP2009186668A patent/JP5295037B2/ja active Active
Non-Patent Citations (2)
Title |
---|
JPN6013013899; 小林彰夫 外5名: '単語誤り最小化に基づく識別的リスコアリングによる音声認識' 電子情報通信学会技術研究報告(NLC2008-067,SP2008-122) 第108巻,第338号, 20081202, p.255-260, 一般社団法人電子情報通信学会 * |
JPN6013013902; Zhengyu Zhou 外3名: 'A Comparative Study of Discriminative Methods for Reranking LVCSR N-Best Hypotheses in Domain Adapta' Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing 2006 (ICASSP Volume I, 20060519, p.141-144, IEEE * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011039432A (ja) * | 2009-08-18 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | 情報圧縮型モデルパラメータ推定装置、方法及びプログラム |
CN102929916A (zh) * | 2012-09-19 | 2013-02-13 | 无锡华御信息技术有限公司 | 一种基于文档名称识别的备份文档的方法 |
CN102929916B (zh) * | 2012-09-19 | 2015-09-30 | 无锡华御信息技术有限公司 | 一种基于文档名称识别的备份文档的方法 |
CN113342525A (zh) * | 2020-07-24 | 2021-09-03 | 北京一流科技有限公司 | 分布式数据处理系统及其方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5295037B2 (ja) | 2013-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107729322B (zh) | 分词方法及装置、建立句子向量生成模型方法及装置 | |
IE20170201A1 (en) | Neural machine translation systems | |
US9747893B2 (en) | Unsupervised training method, training apparatus, and training program for an N-gram language model based upon recognition reliability | |
JP6051004B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
JP5752060B2 (ja) | 情報処理装置、大語彙連続音声認識方法及びプログラム | |
JP5276610B2 (ja) | 言語モデル生成装置、そのプログラムおよび音声認識システム | |
JP5975938B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
US20180061395A1 (en) | Apparatus and method for training a neural network auxiliary model, speech recognition apparatus and method | |
JP5295037B2 (ja) | ConditionalRandomFieldsもしくはGlobalConditionalLog−linearModelsを用いる学習装置及びその学習装置におけるパラメータ学習方法、プログラム | |
JP6366166B2 (ja) | 音声認識装置、及びプログラム | |
JP2013117683A (ja) | 音声認識装置、誤り傾向学習方法、及びプログラム | |
CN115860009A (zh) | 一种引入辅助样本进行对比学习的句子嵌入方法及系统 | |
JP6086714B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
KR20200074624A (ko) | 도메인 기반의 음성 인식 모델의 최적화가 가능한 음성 인식 장치 및 그 동작 방법 | |
JP5264649B2 (ja) | 情報圧縮型モデルパラメータ推定装置、方法及びプログラム | |
Zhang et al. | Character-Aware Sub-Word Level Language Modeling for Uyghur and Turkish ASR | |
JP2004348552A (ja) | 音声文書検索装置および方法およびプログラム | |
JP2007317132A (ja) | 概念ベクトル推定方法及び装置及びプログラム | |
Zhang et al. | Discriminatively trained sparse inverse covariance matrices for speech recognition | |
JP5268825B2 (ja) | モデルパラメータ推定装置、方法及びプログラム | |
JP5860439B2 (ja) | 言語モデル作成装置とその方法、そのプログラムと記録媒体 | |
CN109815483B (zh) | 合成词识别方法、装置、可读存储介质及电子设备 | |
JP2009063773A (ja) | 音声特徴学習装置、音声認識装置、それらの方法、それらのプログラム、それらの記録媒体 | |
CN111274392B (zh) | 一种多频道联合处理方法和装置 | |
JP5700566B2 (ja) | スコアリングモデル生成装置、学習データ生成装置、検索システム、スコアリングモデル生成方法、学習データ生成方法、検索方法及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110721 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130611 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5295037 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |