JP5199985B2 - 重み付き有限状態トランスデューサ作成装置、作成方法及びプログラム - Google Patents
重み付き有限状態トランスデューサ作成装置、作成方法及びプログラム Download PDFInfo
- Publication number
- JP5199985B2 JP5199985B2 JP2009271854A JP2009271854A JP5199985B2 JP 5199985 B2 JP5199985 B2 JP 5199985B2 JP 2009271854 A JP2009271854 A JP 2009271854A JP 2009271854 A JP2009271854 A JP 2009271854A JP 5199985 B2 JP5199985 B2 JP 5199985B2
- Authority
- JP
- Japan
- Prior art keywords
- wfst
- state transition
- basic
- additional
- wfsts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
前回単語の追加したときに追加状態遷移情報記憶部21に記憶した追加状態遷移情報に対し、入力部300から新たに追加する単語の状態遷移を追加し、
それによって更新された追加状態遷移情報を使って基本WFST記憶部141〜14Mに保持されている基本WFSTに対し図5Bで説明したと同様に状態遷移の追加処理を行って追加WFSTを生成して追加WFST記憶部231〜23Mに記憶し、
追加WFST記憶部231〜23Mの追加WFSTに対し認識用WFST演算部24により合成化及び/又は最適化を行って認識用WFSTを作成し認識用WFST記憶部25に記憶すればよい。
図2中に破線で示すように、追加WFST記憶部231〜23Mに保持されている前回の追加WFSTに対して状態遷移追加部221〜22Mにより追加すべき状態遷移を追加し、
以下、図5BのステップS26を実行すればよい。
前述の図2、図6及び図10による重み付き有限状態トランスデューサ作成装置は、例えば図5A,Bのフローを実施するプログラムに従って動作するコンピュータにより実施してもよい。その場合、WFST記憶部111〜11N,基本WFST記憶部141〜14M、追加WFST記憶部231〜23M、認識用WFST記憶部25等はコンピュータの例えばハードディスクのような不揮発性メモリ内のそれぞれの記憶領域として実現することができる。基本WFST演算情報記憶部12及び追加状態遷移情報記憶部21は、それらに記憶する情報がWFST作成後に不要となる場合は任意の一時メモリにより実現し、それらの情報が次回の新たな状態遷移の追加に必要な場合は、ハートディスク内の任意の領域に実現すればよい。基本WFST演算部13、状態遷移追加部211〜22M、認識用WFST演算部25の処理は、プログラムに従って制御部400として機能するプロセサにより実行される。プログラムはコンピュータで読み取り可能な任意の記録媒体、例えばハードディスクや他の外部メモリに保持してもよい。
図14に示す表1は単語を追加する際の実施例1において、従来の辞書に単語を追加してからWFSTを作成する時間と、本発明の基本WFSTに単語を追加してWFSTを作成する時間の比較の表である。 本発明は事前に可能な処理を実施して基本WFSTとして記憶、それを元に単語を追加し、認識用WFSTを作成するため、単語追加から認識用WFSTを作成する時間が114秒と従来の289秒よりも大幅に削減できる。
Claims (7)
- 異なる種類のN個の重み付き有限状態トランスデューサ(以下、WFSTと呼ぶ)を記憶するN個のWFST記憶部と、Nは3以上の整数であり、
少なくとも1つのWFSTを状態遷移を追加するWFSTと指定し、他の少なくとも1つのWFSTを追加しないWFSTと指定するよう上記N個のWFSTのそれぞれに対し状態遷移を追加するWFSTか追加しないWFSTかを指定し、全ての上記追加しないWFSTに対してそれらを合成化するか又は最適化するか又は合成化及び最適化するかをそれぞれ指定する基本WFST演算情報が入力され、上記基本WFST演算情報に従って、上記N個のWFST記憶部に保持されている全ての上記追加しないWFSTを合成化及び/又は最適化して基本WFSTとし、全ての上記追加するWFSTをそのまま基本WFSTとすることによりM個の基本WFSTを作成する基本WFST演算部と、Mは2以上N以下の整数であり、
M個の上記基本WFSTをそれぞれ記憶するM個の基本WFST記憶部と、
追加する状態遷移とその状態遷移を追加する対象の基本WFSTを指定する追加状態遷移情報が入力され、上記追加状態遷移情報に従って、M個の上記基本WFST記憶部の全ての上記追加するWFSTに対応する基本WFSTに状態遷移を追加して追加WFSTとし、それ以外の全ての基本WFSTはそのまま追加WFSTとすることによりM個の追加WFSTを生成する状態遷移追加手段と、
M個の上記追加WFSTをそれぞれ記憶するM個の追加WFST記憶部と、
上記追加WFSTに記憶されているM個の追加WFSTを合成化及び/又は最適化して少なくとも1つの認識用WFSTを作成する認識用WFST演算部と、
上記認識用WFSTを記憶する認識用WFST記憶部と、
を含むことを特徴とする重み付き有限状態トランスデューサ作成装置。 - 請求項1記載の重み付き有限状態トランスデューサ作成装置において、上記追加する状態遷移は単語の状態遷移であり、上記N個のWFSTは、音響モデルWFSTと、トライフォンWFSTと、単語辞書WFSTと、ユニグラムWFSTと、クラスWFSTと、トライグラムWFSTとを含み、上記状態遷移を追加するWFSTは上記単語辞書WFSTと、ユニグラムWFSTと、クラスWFSTとを含み、上記状態遷移を追加しないWFSTは上記音響モデルWFSTと、上記トライフォンWFSTと、上記トライグラムWFSTとを含むことを特徴とする重み付き有限状態トランスデューサ作成装置。
- 請求項1記載の重み付き有限状態トランスデューサ作成装置において、上記追加する状態遷移は雑音モデルの状態遷移であり、上記N個のWFSTは、音響モデルWFSTと、トライフォンWFSTと、単語辞書WFSTと、言語モデルWFSTとを含み、上記状態遷移を追加するWFSTは上記音響モデルWFSTと上記トライフォンWFSTとを含み、上記状態遷移を追加しないWFSTは上記単語辞書WFSTと上記言語モデルWFSTとを含むことを特徴とする重み付き有限状態トランスデューサ作成装置。
- 請求項1乃至3のいずれか記載の重み付き有限状態トランスデューサ作成装置において、上記追加状態遷移情報を記憶する追加状態遷移情報記憶部が更に設けられており、新たな状態遷移の追加をするときに、新たな追加状態遷移情報を上記追加状態遷移情報記憶部に追加して記憶し、上記状態遷移追加手段は上記M個の基本WFST記憶部の基本WFSTに対し上記追加状態遷移記憶部内の全ての追加状態遷移情報について状態遷移の追加処理を実行するように構成されていることを特徴とする重み付き有限状態トランスデューサ作成装置。
- 請求項1乃至3のいずれか記載の重み付き有限状態トランスデューサ作成装置において、上記追加状態遷移情報を記憶する追加状態遷移情報記憶部が更に設けられており、上記追加状態遷移情報記憶部が新たな追加状態遷移情報により更新されると、上記状態遷移追加手段は上記追加状態遷移情報記憶部内の上記新たな追加状態遷移情報に従って上記M個の追加WFST記憶部に記憶されている追加WFSTに対し状態遷移の追加処理を行い、その処理結果により上記M個の追加WFST記憶部を更新するように構成されていることを特徴とする重み付き有限状態トランスデューサ作成装置。
- 重み付き有限状態トランスデューサを作成する方法であり、
異なる種類のN個の重み付き有限状態トランスデューサ(以下、WFSTと呼ぶ)に対し入力された基本WFST演算情報に従って、状態遷移を追加するWFSTと追加しないWFSTにそれぞれ分け、全ての上記追加しないWFSTを予め合成化及び/又は最適化して基本WFSTとし、全ての上記追加するWFSTはそのまま基本WFSTとすることによりM個の基本WFSTを作成する基本WFST作成工程と、Nは3以上の整数であり、Mは2以上N以下の整数であり、
追加する状態遷移とその状態遷移を追加する対象の基本WFSTを指定する追加状態遷移情報が入力され、M個の上記基本WFSTの、全ての上記追加するWFSTに対応する指定された基本WFSTに対し状態遷移を追加して追加WFSTとし、それ以外の全ての基本WFSTはそのまま追加WFSTとすることによりM個の追加WFSTを生成し、それらM個の追加WFSTを合成化及び/又は最適化して少なくとも1つの認識用WFSTを作成する認識用WFST作成工程と、
を含むことを特徴とする重み付き有限状態トランスデューサ作成方法。 - 請求項6記載の重み付き有限状態トランスデューサ作成方法をコンピュータで実行可能なプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009271854A JP5199985B2 (ja) | 2009-11-30 | 2009-11-30 | 重み付き有限状態トランスデューサ作成装置、作成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009271854A JP5199985B2 (ja) | 2009-11-30 | 2009-11-30 | 重み付き有限状態トランスデューサ作成装置、作成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011113043A JP2011113043A (ja) | 2011-06-09 |
JP5199985B2 true JP5199985B2 (ja) | 2013-05-15 |
Family
ID=44235386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009271854A Expired - Fee Related JP5199985B2 (ja) | 2009-11-30 | 2009-11-30 | 重み付き有限状態トランスデューサ作成装置、作成方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5199985B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10109274B2 (en) | 2014-11-28 | 2018-10-23 | Kabushiki Kaisha Toshiba | Generation device, recognition device, generation method, and computer program product |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5881157B2 (ja) * | 2012-02-22 | 2016-03-09 | 国立研究開発法人情報通信研究機構 | 情報処理装置、およびプログラム |
KR101394253B1 (ko) | 2012-05-16 | 2014-05-13 | 광주과학기술원 | 음성 인식 오류 보정 장치 |
JP6179884B2 (ja) * | 2012-11-26 | 2017-08-16 | 国立研究開発法人情報通信研究機構 | Wfst作成装置、音声認識装置、音声翻訳装置、wfst作成方法、およびプログラム |
JP6095588B2 (ja) * | 2013-06-03 | 2017-03-15 | 日本電信電話株式会社 | 音声認識用wfst作成装置、音声認識装置、音声認識用wfst作成方法、音声認識方法及びプログラム |
JP5701348B2 (ja) * | 2013-08-23 | 2015-04-15 | ヤフー株式会社 | 音声認識装置、音声認識方法、およびプログラム |
CN110610700B (zh) * | 2019-10-16 | 2022-01-14 | 科大讯飞股份有限公司 | 解码网络构建方法、语音识别方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08248980A (ja) * | 1995-03-06 | 1996-09-27 | Fuji Xerox Co Ltd | 音声認識装置 |
-
2009
- 2009-11-30 JP JP2009271854A patent/JP5199985B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10109274B2 (en) | 2014-11-28 | 2018-10-23 | Kabushiki Kaisha Toshiba | Generation device, recognition device, generation method, and computer program product |
Also Published As
Publication number | Publication date |
---|---|
JP2011113043A (ja) | 2011-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102057927B1 (ko) | 음성 합성 장치 및 그 방법 | |
JP5199985B2 (ja) | 重み付き有限状態トランスデューサ作成装置、作成方法及びプログラム | |
Zen et al. | Statistical parametric speech synthesis using deep neural networks | |
US9305547B2 (en) | System and method for adapting automatic speech recognition pronunciation by acoustic model restructuring | |
CN101828218B (zh) | 通过多形式段的生成和连接进行的合成 | |
JP6495850B2 (ja) | 情報処理装置、情報処理方法、プログラムおよび認識システム | |
JP4455610B2 (ja) | 韻律パタン生成装置、音声合成装置、プログラムおよび韻律パタン生成方法 | |
McGraw et al. | Learning lexicons from speech using a pronunciation mixture model | |
US11763797B2 (en) | Text-to-speech (TTS) processing | |
JP6453631B2 (ja) | 認識システム、認識方法およびプログラム | |
JP2001215985A (ja) | 視覚的音声のトランスリンガル合成 | |
JP2004109464A (ja) | 音声認識装置及び音声認識方法 | |
JP2006084715A (ja) | 素片セット作成方法および装置 | |
JPH0772840B2 (ja) | 音声モデルの構成方法、音声認識方法、音声認識装置及び音声モデルの訓練方法 | |
US8626510B2 (en) | Speech synthesizing device, computer program product, and method | |
Kayte et al. | Hidden Markov model based speech synthesis: A review | |
JP2018146803A (ja) | 音声合成装置及びプログラム | |
King | A beginners’ guide to statistical parametric speech synthesis | |
JP2015014774A (ja) | 音声認識用wfst作成装置、音声認識装置、音声認識用wfst作成方法、音声認識方法及びプログラム | |
JP7314079B2 (ja) | データ生成装置、データ生成方法およびプログラム | |
KR20150001191A (ko) | 연속어 음성 인식 장치 및 방법 | |
JP2012058343A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP5268731B2 (ja) | 音声合成装置、方法およびプログラム | |
KR100259777B1 (ko) | 텍스트/음성변환기에서의최적합성단위열선정방법 | |
JP2014142465A (ja) | 音響モデル生成装置及び方法、並びに音声認識装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110722 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120307 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130208 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160215 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5199985 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |