JP4243777B2 - トランスデューサ処理装置、機械翻訳モデル作成装置、音声認識モデル作成装置、トランスデューサ処理方法、トランスデューサ処理プログラム、および、記録媒体 - Google Patents
トランスデューサ処理装置、機械翻訳モデル作成装置、音声認識モデル作成装置、トランスデューサ処理方法、トランスデューサ処理プログラム、および、記録媒体 Download PDFInfo
- Publication number
- JP4243777B2 JP4243777B2 JP2004209218A JP2004209218A JP4243777B2 JP 4243777 B2 JP4243777 B2 JP 4243777B2 JP 2004209218 A JP2004209218 A JP 2004209218A JP 2004209218 A JP2004209218 A JP 2004209218A JP 4243777 B2 JP4243777 B2 JP 4243777B2
- Authority
- JP
- Japan
- Prior art keywords
- wfst
- symbol string
- semi
- input
- transducer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
Mehryar Mohri著、"Finite-State Transducers in Language and Speech Processing"、Computational Linguistics Volume 23, No.2,1997.
Σ:入力シンボル
Δ:出力シンボル
Q:状態の有限集合
K:重みの半環
E:Q×(Σ∪{ε})×(Δ∪{ε})×K×Q:遷移の有限集合
λ:I→K:初期状態重み関数
ρ:F→K:最終状態重み関数
I:初期状態の集合
F:最終状態の集合
C:1の状態の順序集合
M:入力のεがないように遷移を書き換えたWFST
仮説候補ID:(モデル状態,累積重み,バックポインタ集合)
[入カシンボル,出力シンボル,遷移重み,仮説候補ID]
仮説候補ID:(推定重み,累積重み,バックポインタ,前向きサーチ仮説候補ID)
(入力シンボル,出力シンボル,後向きサーチ仮説候補ID)
a=freq(q1,q2)
b=freq(q1)−a
c=freq(q2)−a
d=N−a−b−c
1a 機械翻訳モデル作成装置
1b 音声認識モデル作成装置
10 トランスデューサ入力部
11 機械翻訳データ処理部
12 音声データ処理部
20 トランスデューサ合成部
30 準決定化演算部
31 シンボル列変換部
32 状態結合部
Claims (10)
- 状態とその状態間の遷移とで表現される有限状態オートマトンを拡張し、入力シンボル、出力シンボル、および、重みを定義したWFSTを準決定化するトランスデューサ処理装置であって、
準決定化の対象となるWFSTの入力を受け付けるトランスデューサ入力部と、入力シンボル列に対して、所定のWFSTによって、累積重みが所定のものとなるような出力シンボル列を求めるシンボル列変換部と、前記準決定化の対象となるWFSTの状態を所定の条件により結合して、準決定化したWFSTを作成する状態結合部と、を含めて構成され、
前記所定の条件は、前記シンボル列変換部が、前記入力シンボル列および前記入力シンボル列に対応した正解シンボル列をもとに変換される前記所定のWFSTにより、前記入力シンボル列を変換する際に、候補管理集合の中に共起する状態の頻度から算出される統計量が、所定の閾値を上回る条件とすることを特徴とするトランスデューサ処理装置。 - 前記シンボル列変換部は、前記準決定化したWFSTを、シンボル列の変換処理に使用することを特徴とする請求項1に記載のトランスデューサ処理装置。
- 前記トランスデューサ処理装置は、前記準決定化の対象となるWFSTが複数ある場合に、1つのWFSTに合成するトランスデューサ合成部をさらに含めて構成されることを特徴とする請求項1または請求項2に記載のトランスデューサ処理装置。
- 状態とその状態間の遷移とで表現される有限状態オートマトンを拡張し、入力シンボル、出力シンボル、および、重みを定義したWFSTを準決定化する機械翻訳モデル作成装置であって、
機械翻訳の対象となるコーパスをもとに準決定化の対象となるWFSTを作成する機械翻訳データ処理部と、入力シンボル列に対して、所定のWFSTによって、累積重みが所定のものとなるような出力シンボル列を求めるシンボル列変換部と、前記準決定化の対象となるWFSTの状態を所定の条件により結合して、準決定化したWFSTを作成する状態結合部と、を含めて構成され、
前記所定の条件は、前記シンボル列変換部が、前記入力シンボル列および前記入力シンボル列に対応した正解シンボル列をもとに変換される前記所定のWFSTにより、前記入力シンボル列を変換する際に、候補管理集合の中に共起する状態の頻度から算出される統計量が、所定の閾値を上回る条件とすることを特徴とする機械翻訳モデル作成装置。 - 状態とその状態間の遷移とで表現される有限状態オートマトンを拡張し、入力シンボル、出力シンボル、および、重みを定義したWFSTを準決定化する音声認識モデル作成装置であって、
入力された音声に関するデータをもとに準決定化の対象となるWFSTを作成する音声データ処理部と、入力シンボル列に対して、所定のWFSTによって、累積重みが所定のものとなるような出力シンボル列を求めるシンボル列変換部と、前記準決定化の対象となるWFSTの状態を所定の条件により結合して、準決定化したWFSTを作成する状態結合部と、を含めて構成され、
前記所定の条件は、前記シンボル列変換部が、前記入力シンボル列および前記入力シンボル列に対応した正解シンボル列をもとに変換される前記所定のWFSTにより、前記入力シンボル列を変換する際に、候補管理集合の中に共起する状態の頻度から算出される統計量が、所定の閾値を上回る条件とすることを特徴とする音声認識モデル作成装置。 - 状態とその状態間の遷移とで表現される有限状態オートマトンを拡張し、入力シンボル、出力シンボル、および、重みを定義したWFSTをコンピュータが準決定化するトランスデューサ処理方法であって、
前記コンピュータが、準決定化の対象となるWFSTの入力を受け付ける手順と、入力シンボル列に対して、記憶手段に格納された所定のWFSTによって、累積重みが所定のものとなるような出力シンボル列を求めるシンボル列変換手順と、前記準決定化の対象となるWFSTの状態を所定の条件により結合して、準決定化したWFSTを作成する手順と、を実行し、
前記所定の条件は、前記シンボル列変換手順が、前記入力シンボル列および前記入力シンボル列に対応した正解シンボル列をもとに変換される前記所定のWFSTにより、前記入力シンボル列を変換する際に、候補管理集合の中に共起する状態の頻度から算出される統計量が、所定の閾値を上回る条件とすることを特徴とするトランスデューサ処理方法。 - 前記シンボル列変換手順は、前記準決定化したWFSTを、シンボル列の変換処理に使用することを特徴とする請求項6に記載のトランスデューサ処理方法。
- 前記トランスデューサ処理方法は、前記準決定化の対象となるWFSTが複数ある場合に、1つのWFSTに合成する手順をさらに含めて実行することを特徴とする請求項6または請求項7に記載のトランスデューサ処理方法。
- 請求項6ないし請求項8のいずれか1項に記載されたトランスデューサ処理方法をコンピュータに実行させるためのトランスデューサ処理プログラム。
- 請求項9に記載されたトランスデューサ処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004209218A JP4243777B2 (ja) | 2004-07-15 | 2004-07-15 | トランスデューサ処理装置、機械翻訳モデル作成装置、音声認識モデル作成装置、トランスデューサ処理方法、トランスデューサ処理プログラム、および、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004209218A JP4243777B2 (ja) | 2004-07-15 | 2004-07-15 | トランスデューサ処理装置、機械翻訳モデル作成装置、音声認識モデル作成装置、トランスデューサ処理方法、トランスデューサ処理プログラム、および、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006031403A JP2006031403A (ja) | 2006-02-02 |
JP4243777B2 true JP4243777B2 (ja) | 2009-03-25 |
Family
ID=35897662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004209218A Expired - Fee Related JP4243777B2 (ja) | 2004-07-15 | 2004-07-15 | トランスデューサ処理装置、機械翻訳モデル作成装置、音声認識モデル作成装置、トランスデューサ処理方法、トランスデューサ処理プログラム、および、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4243777B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10452355B2 (en) | 2014-09-18 | 2019-10-22 | Kabushiki Kaisha Toshiba | Automaton deforming device, automaton deforming method, and computer program product |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5121650B2 (ja) * | 2008-09-26 | 2013-01-16 | 株式会社東芝 | 情報処理装置、情報処理方法及びプログラム |
JP4977163B2 (ja) * | 2009-03-30 | 2012-07-18 | 株式会社東芝 | 有限状態トランスデューサ決定化装置及び有限状態トランスデューサ決定化方法 |
JP5385810B2 (ja) * | 2010-02-04 | 2014-01-08 | 日本電信電話株式会社 | 線形分類モデルに基づく音響モデルパラメータ学習方法とその装置、音素重み付き有限状態変換器生成方法とその装置、それらのプログラム |
JP5888729B2 (ja) * | 2012-01-10 | 2016-03-22 | 国立研究開発法人情報通信研究機構 | 言語モデル結合装置、言語処理装置、およびプログラム |
-
2004
- 2004-07-15 JP JP2004209218A patent/JP4243777B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10452355B2 (en) | 2014-09-18 | 2019-10-22 | Kabushiki Kaisha Toshiba | Automaton deforming device, automaton deforming method, and computer program product |
Also Published As
Publication number | Publication date |
---|---|
JP2006031403A (ja) | 2006-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5377889B2 (ja) | 言語処理装置およびプログラム | |
US5652898A (en) | Dictionary memory for text processing using word frequency and word recency occurrence information | |
JP4977163B2 (ja) | 有限状態トランスデューサ決定化装置及び有限状態トランスデューサ決定化方法 | |
JP5554304B2 (ja) | オートマトン決定化方法、オートマトン決定化装置およびオートマトン決定化プログラム | |
JP4215418B2 (ja) | 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム | |
JP4769031B2 (ja) | 言語モデルを作成する方法、かな漢字変換方法、その装置、コンピュータプログラムおよびコンピュータ読み取り可能な記憶媒体 | |
JP4956334B2 (ja) | オートマトンの決定化方法、有限状態トランスデューサの決定化方法、オートマトン決定化装置及び決定化プログラム | |
JP2005258439A (ja) | 文字から音声への変換のための相互情報量基準を用いた大きな文字音素単位の生成 | |
JPH0320800A (ja) | 音声認識方法および装置 | |
JP6453631B2 (ja) | 認識システム、認識方法およびプログラム | |
JP2005182795A (ja) | 語彙と文法を有する言語の上のストリングの内部構造の各レベルにインデックス付けを行うためのシステム及び方法 | |
JP2006243728A (ja) | 音素をテキストに変換する方法、そのコンピュータシステム、及びコンピュータプログラム | |
CN113655893A (zh) | 一种词句生成方法、模型训练方法及相关设备 | |
JP4243777B2 (ja) | トランスデューサ処理装置、機械翻訳モデル作成装置、音声認識モデル作成装置、トランスデューサ処理方法、トランスデューサ処理プログラム、および、記録媒体 | |
US6735560B1 (en) | Method of identifying members of classes in a natural language understanding system | |
JP6301794B2 (ja) | オートマトン変形装置、オートマトン変形方法およびプログラム | |
JP4004376B2 (ja) | 音声合成装置、音声合成プログラム | |
Sproat et al. | Applications of lexicographic semirings to problems in speech and language processing | |
JP2005092682A (ja) | 翻字装置、及び翻字プログラム | |
JP2005025555A (ja) | シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体 | |
JP2000222406A (ja) | 音声認識翻訳装置及び方法 | |
JP4430964B2 (ja) | 記号列変換方法及びその記号列変換方法を用いた音声認識方法、並びに記号列変換装置及びその記号列変換装置を用いた音声認識装置 | |
US7617089B2 (en) | Method and apparatus for compiling two-level morphology rules | |
JP2007233823A (ja) | 自動要約装置及びコンピュータプログラム | |
JP2001249921A (ja) | 複合語解析方法、装置、および複合語解析プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060711 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081216 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20081219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4243777 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130116 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |