JPH08292792A - 重み付き有限状態変換機能を用いた書記素−音素変換 - Google Patents

重み付き有限状態変換機能を用いた書記素−音素変換

Info

Publication number
JPH08292792A
JPH08292792A JP8065574A JP6557496A JPH08292792A JP H08292792 A JPH08292792 A JP H08292792A JP 8065574 A JP8065574 A JP 8065574A JP 6557496 A JP6557496 A JP 6557496A JP H08292792 A JPH08292792 A JP H08292792A
Authority
JP
Japan
Prior art keywords
language
words
weighted finite
phoneme
grapheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8065574A
Other languages
English (en)
Inventor
Fernando Carlos Neves Pereira
カルロス ネイヴス ペレイラ フェルナンド
Michael Dennis Riley
デニス リレイ マイケル
Richard William Sproat
ウィリアム スプロート リチャード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH08292792A publication Critical patent/JPH08292792A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 特別なルールにより数字の列を単語群に変換
したり、中国語などの単語間の境界が欠落した言語の文
書中の単語間にスペース等を挿入できるようにし、関係
する重みまたは確率によって複数の解析をコード化でき
る書記素−音素モジュールを提供することである。 【解決手段】 本発明は、一つ以上のアラビア数字を展
開し、その数字に相当する言葉を形成する方法を供給す
る。その相当する言葉の形成に対する述部として、数字
の文法の言語学的な記述が与えられる。この記述は、一
つ以上の重み付き有限状態変換機能にコンパイルされ
る。一つ以上のアラビア数字のシーケンスに相当する言
葉は、その後一つ以上の重み付き有限状態変換機能を用
いて合成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキストからの音
声合成システムのためのテキスト解析システムに関す
る。
【0002】
【従来の技術】テキスト解析が重要な役割を果たす領域
は、テキストからの音声合成(TTS)システムであ
る。TTSシステムが直面する最初の問題の1つは、入
力テキストから構文上の基本単位となる文字列を切り出
して(トークン化して)単語に分割すること、および、
その後それらの単語を品詞割り当て(part-of-speech a
ssignment )アルゴリズムや書記素−音素変換アルゴリ
ズムなどを用いて解析することである。トークン化およ
びテキスト解析システムを設計するのは、テキスト中に
単語の境界に印のない中国語や日本語、単語の境界に印
のあるヨーロッパの言語を含む広範囲の言語を処理でき
る多言語システムを構築したいときには特に困難とな
る。本明細書は、広範囲の言語に適用できるテキスト解
析のためのアーキテクチャを記述するものである。な
お、TTSシステムはさらに自動音声認識(ATR)シ
ステムのための発音を生成するために使用されるので、
ここで記述された種類のテキスト解析モジュールは単な
るTTSよりも広い適用範囲を有する。
【0003】すべてのTTSシステムは、入力を発音す
る目的のため、書記素列(graphemicstring)を音素表現
(phonological representation) に変換できなければな
らない。ルールのほとんどをハードウエアに組み込んだ
比較的アドホックな処理系(すなわち[1])から、形
態論的な解析ルーチンと音形規則コンパイラを取り入れ
たより理に適ったアプローチ(すなわち[2、3])、
さらに(その他)すべてのアプローチにわたる現在の書
記素−音素変換のためのシステムは、それらの問題を抱
えている。
【0004】言語情報のほとんどをハードウエアに組み
込んだシステムでは、明らかに新たな言語は移植しにく
い。より一般的なアプローチでは、大体完全な形態論的
な解析を行い、そして形態素の根源的な音声表示から外
面音声形式を生成するのが良いとされてきた。しかし、
そのようなシステムに取り入れられてきた言語的前提に
よれば、このアプローチはある程度適切であるというだ
けである。特定の例をあげると、ロシア語の単語кос
тра/kastra/(焚き火+所有格.単数)の形
態素での形式はкост{Ё}раであるとして論じる
ことができる。ここで{Ё}は、この例では削除するが
(所有格を表す印としての−aのため)主音素(archip
honeme)であり、他の例(すなわち、単数主格形のко
стёр/kastjor/)ではёとして表面に出
る。これらの選択は、一般的な音声規則により決定され
るので、表面文字列を解析してその形態論的な要素に
し、それらの形態素の音声表示から正しい発音を生成す
ることが可能だろう。しかしながら、このアプローチは
冗長さを含んでいる。問題での母音の削除はつづり字の
中で既に表現されており、今ここで説明したアプローチ
は、要するに、既にわかっていることを再計算する必要
があるというだけで根源的形式を再構成するのである。
また一方、いくつかのロシア語の母音はアクセントを置
く位置に依存し、これが今度は形態論的な解析によって
決められるため、形態素情報が全くなしでは実現できな
い。この例では、アクセントが最後にあるので最初の<
о>の発音は/a/である。
【0005】さらに、2つの欠点が最近のアプローチに
よって確認できる。まず最初に、書記素−音素変換は概
して、通常の言葉を音素列に変換する問題として見られ
ているが、一般的な書き言葉には、数字や略語を含む別
の種類の入力がある。前に述べたとおり、中国語のよう
ないくつかの言語は、単語と単語を分ける情報が文書か
ら欠落しており、トークン化機能を用いて再構成しなけ
ればならない。我々が知っているすべてのTTSシステ
ムでは、これらの後者の問題点は、文書処理の問題とし
扱われている。それゆえ、特別なルールにより数列を単
語群に変換したり、中国語の文書中の単語と単語の間に
スペースを挿入したりする。これら別の問題は、より一
般的な書記素−音素変換の問題の単に特別な例とは思わ
れていない。
【0006】
【外1】
【0007】
【課題を解決するための手段】本発明は、一つ以上のア
ラビア数字を展開し、相当する言葉を形成する方法を供
給する。本発明によれば、数字の文法の言語学的な記述
が与えられる。この記述は、一つ以上の重み付き有限状
態変換機能にコンパイルされる。一つ以上のアラビア数
字のシーケンスに相当する言葉は一つ以上の重み付き有
限状態変換機能を用いて合成される。
【0008】
【発明の実施の形態】
〈図1の詳細な説明〉 1.書記素−音素変換の説明 言語記述システムはすべて−中国語[4]であっても−
基本的に音素的である。書かれた記号に加えて、種々の
言語は、程度の差はあるが入力文字列の適切な音声表示
を生成するために辞書情報を必要とする。要求される辞
書情報の量は、明らかに正書法のシステムが音声を表す
とみなせる度合と正に逆の関係を持っており、この意味
においては音声を完全に表す記述システムを持つ言語が
おそらくないということは指摘するに値する。上記の前
提は、正書法、音韻体系および、形態を媒介するには、
第4レベルの表現が必要であることを示唆する。この表
現は、私達が「最小形態論的注釈(minimal morphologi
cal annotation)」またはMMAと呼ぼうとするもので
あり、正しい発音を考慮した十分な辞書情報を含むが、
形態の完全な形態論的な解析までには(一般に)達しな
い。これらのレベルは、図7に示されるように、変換機
能により、より詳しくは有限状態変換機能(FST)に
関係し、より一般的には重み付きFST(WFST)
[5]に関係し、これはレベル−レベルを関係させる言
語ルールを実行するものである。本システムにおいて
は、(W)FSTはカプラン−ケイ(Kaplan-Kay)
[6]ルール翻訳アルゴリズムを含む辞書ツールキット
を使用する言語記述から、重み付けされたルールを考慮
に入れる展開をして、派生したものである。
【0009】システムは、表面からMMAへの(W)F
STで重み付けの無い有限状態アクセプタ(FSA)と
いわれる表面形式をまず組み立て、その後可能なMMA
の束を表すFSAを生成するため出力を創出することに
より動作する。第2に、MMAのFSAを形態からMM
Aへのマッピングによって組み立てる。形態からMMA
へのマッピングは、入力形式の可能な限りの(深い)形
態論的な解析のみを作り出し、形態論的な解析に対応可
能なすべてのMMA形式のみにMMAのFSAを限定す
る組み込まれた効果を有するものである。システムの更
なる変形には、形態論的な解析は、言語モデル(以下参
照)を用いてさらに制限されるであろう。最後に、MM
Aから音素へのFSTは、入力形式の可能な音韻論的翻
訳のひとセットを作り出すようにMMAからなる。
【0010】具体例として、従来の説明のところで述べ
られたロシア語の例костра(焚き火+所有格.単
数)に戻る。上述したように、ロシア語の単語を発音す
るために必要な重大な情報は、語彙のアクセントの場所
である。これは、表面形式からは一般に予測できるもの
ではなく、形態の認識によるものである。2、3の形態
的シンタクティクスの特徴もまた必要である。たとえ
ば、音声学上の前後関係によって/g/または/k/が
一般的に発音される<г>は、形容詞の男性/中性の所
有格の語尾−(о/е)гоでは通常/v/が発音され
る。従って、形容詞については少なくとも特徴+所有格
は、MMA内に存在しなければならない。特定の例で
は、アクセントが第2音節にある情報を有するкост
ра、すなわちкостр’аの表面上のスペルについ
て論じよう。これは、次のように成し遂げられる。MM
Aから表面正書法表現へマッピングするFSTにより、
単語のアクセントが削除され、(教授法のテキスト外で
は、ロシア語の表面正書法においてアクセントは表され
ない)、結局、この関係の逆によって、あらゆる場所の
アクセントの挿入が可能になる。これは、あらゆる可能
な箇所におけるアクセントを伴った格子状の解析(ラチ
ス)を提供するであろう。そしてこれらの解析のうちの
ひとつが正しいものである。意識的なロシア語の形態に
は、костёр「焚き火」はアクセントがその語尾に
あり、あるいは一カ所の場合、語幹に戻る、この場合
は、語幹の最後の音節である格変化に属する名詞である
という知識を含んでいる。
【0011】
【外2】
【0012】2.テキストの単語へのトークン化 上述の説明では、われわれは書記素−音素システムへの
入力がすでに単語にセグメント化されているものとして
無条件に仮定してきたが、実はこの仮定にはなんら根拠
はない。われわれは単に入力センテンスが通常の表現に
よって表されるものと容易に仮定することができる。
【0013】
【数1】 よって、入力センテンスは単一のFSAとして表され、
また入力は辞書の推移的仕切りによって交差され、入力
のすべての単語のすべての可能な形態論的な解析を含む
ラチスを作り出すことができる。これは、次の2つの理
由により望ましい。第1に、さらに(有限状態)言語モ
デルで語彙的解析を抑制する目的で、センテンスレベル
の抑制を実行する(有限状態)言語モデルを伴う単に語
彙的な抑制から派生するラチスを交差することができ、
またこれは、単に、センテンス内のすべての単語のすべ
ての可能な語彙的解析が単一表現に存在する場合にあり
うることである。
【0014】
【外3】
【0015】
【外4】
【0016】3.数字の展開 自然に発生するテキストにおける表現の重要な問題のひ
とつは、数字である。あいまいでない数字のシーケンス
(とりわけ日付や電話番号などを示すものなどの特別な
場合)の問題については置いておいて、いかにしてアラ
ビア数字のシーケンスからそのシーケンスが示す数字の
適切な発音へ変換するかという問題に焦点を当ててみま
しょう。最近のライティングシステムは少なくともいく
つかの異なったアラビア数字のシステムを許容するの
で、ここでは数字の表現の取り扱いに焦点を当てる。注
目すべき第1の点は、実際にはどんな風に数字が言語上
発音されてもアラビア数字の表現は、つまり3005
は、同じ数字的な「概念」を常に表現しているといえ
る。数字を単語にさらにその単語の発音へ変換する問題
を分かり易くするために、アラビア数字の文字列から数
字の概念へマッピングする普遍的な問題とこれらの数字
的概念を調音する言語特有の問題とにこの問題をブレー
クダウンする。
【0017】第1の問題は、通常の数字的表現から十の
総累乗値(sum of powers of ten)〔十の累乗は限定さ
れた語彙を構築しないので、明らかにこれは一般的には
有限関係として表現されない。しかし、実際は、言語に
は「数字の名称」は数少なく、またいずれにしてもアラ
ビア数字の連続する長さには事実上の制限が存在するの
で、現実にひとつの数として読まれ、有限状態モデルを
用いてこの問題は処理できる。〕へ変換するFSTを設
計することにより処理される。すなわち、3,005
は、{3}{1000}{0}{100}{0}{1
0}{5}のような「展開」形式に表現される。
【0018】言語特有の語彙的な情報は、次の通り、中
国語を例にとって実行される。中国語の辞書は、次のよ
うな登録(エントリー)を含む。
【数2】 辞書内に登録の推移的仕切りを形成し(これによりどの
数の名称も他のものに続けることができる)、すべての
中国語の文字を削減するFSTでこれを組み立てる。展
開された形式{3}{1000}{0}{100}
{0}{10}{5}で交差された場合の結果として生
じたFSTは、T1 と称され、それを{3}三{100
0}千{0}零{100}百{0}零{10}十{5}
五にマッピングする。展開された表現における数字上の
要素を削り、「零」のあとの「百」や「十」のような記
号を削り、シーケンスにおける零以外のすべてを削るも
のが書かれる。これらのルールは、FSTにコンパイル
され、表面からMMAへマッピングするFSTを形成
し、これは3005をMMA三千零五(sanの第1
声、qianの第1声、lingの第2声、wuの第3
声)にマッピングする。ロシア語のアラビア数字の文字
列の変換機能は、この場合単一の翻訳ではなく、異なっ
たケースや性によって印づけられる複数の翻訳が生成さ
れる以外は、中国語の場合と同様に機能する。これは曖
昧さをなくすために構文上の前後関係によって生成され
る。
【0019】図2は、言語的記述から図1における表現
の2つのレベルに関連する重み付き有限状態変換機能を
組み立てる行程を示している。図の「A」とラベル付け
されたセクションに示されたように、さまざまな解析問
題の言語的記述から開始する。これらの言語的記述は、
曖昧な場合において異なる解析の見込みを記号化する重
みを含んでいる。たとえば、われわれは、通常の言葉に
ついての形態論的な記述および略語のリスト、可能な展
開や数の標準語法を供給する。これらの記述は語彙的な
ツールキット([6]参照)を用いてFSTにコンパイ
ルされる。これは図中「B」でラベル付けされたところ
に示されている。その後、FSTはそれぞれ、結合(ま
たは、合計)操作([5]などを参照)を用いて結合さ
れ、図中「C」でラベル付けされたところに示されてお
り、また、最小化の操作([5]などを参照)によって
小型化される。この結果、FSTでは、いかなる単一の
単語も解析することができる。センテンス全体を解析す
ることのできるFSTを組み立てるためには、言語は単
語間の境界を定めるためにスペースを用いるため、これ
まで組み立てられたFSTに(単語間の境界を定める)
できる限りの句読点およびスペースを挿入し(「D」で
ラベル付けされたところを参照)、機械の推移的仕切り
を算出する必要がある([5]などを参照)。
【0020】〈他の問題〉われわれは、多言語のテキス
ト解析システムについて述べてきた。その機能は、正し
いつづりの文字列をトークン化することおよび発音する
ことを含んでいる。システムの基本的な作動機能は重み
付き有限状態変換機能であり、ここで述べたもの以上に
さらに有用な情報の組合せは、本発明の主旨および範囲
を逸脱しない限り実行されても良い。
【0021】
【外5】
【0022】形態素の有限状態モデルの使用はまた、形
態論的情報とシンタックスの有限状態モデルとのインタ
ーフェースを容易にすることができる(たとえば、
[9])。ある明らかな有限状態シンタクティクスモデ
ルは、品詞のシーケンスのnグラムのモデルである[1
0]。センテンスにおけるすべての単語のすべての可能
な形態論的解析のラチス(格子)を有するとし、WFS
Aとして実行されるnグラムの品詞モデルを有すると仮
定すると、言語モデルを形態素のラチスと交差すること
により解析のもっとも適切なシーケンスを推測すること
ができる。
【0023】(引用文献) [1] C. Coker, K. Church, and M. Liberman, "Morphol
ogy and rhyming: Two powerful alternatives to lett
er-to-sound rules for speech synthesis," inProceed
ings of the ESCA Workshop on Speech Synthesis (G.
Bailly and C. Benoit, eds.), 83〜86ページ、1
990年 [2] A Nunn and V. van Heuven, "MORPHON: Lexicon-ba
sed text-to phoneme conversion and phonological ru
les," in Analysis and Synthesis of Speech: Strateg
ic Research towards High-Quality Text-to-Speech Ge
neration (V. vanHeuven and L. Pols, eds.), 87〜
99ページ、ベルリン: Mouton de Gruyter, 1993
年 [3] A. Lindstr嗄 and M. Ljungqvist, "Text processi
ng within a speech synthesis systems", in Proceedi
ngs of the International Conference on Spoken Lang
uage Processing, (Yokohama), ICSLP, 1994年9月 [4] J. DeFrancis, The Chinese Language. ホノルル:
University of Hawaii Press, 1984年 [5] F. Pereira, M. Riley, and R. Sproat, "Weighted
rational transductions and their application to h
uman language processing," in ARPA Workshopon Huma
n Language Technology, pp. 249-254, Advanced Resea
rch Projects Agency, 1994年3月8〜11日 [6] R. Kaplan and M. Kay, "Regular models of phono
logical rule systems,"Computational Linguistics,
第20巻、331〜378ページ、1994年 [7] R. Sproat, C. Shih, W. Gale, and N. Chang, "A
stochastic finite-state word-segmentation algorith
m for Chinese," in Association for Computational L
inguistics, Proceedings of 32nd Annual Meeting, 6
6〜73ページ1994年 [8] M. Riley, "A statistical model for generating
pronunciation networks," in Proceedings of the Spe
ech and Natural Language Workshop, p. S11.1., DARP
A, Morgan Kaufmann, 1991年10月 [9] M. Mohri, Analyse et repr市entation par automa
tes de structures syntaxiques compos仔s. PhD thesi
s, University of Paris 7, パリ、1993年 [10] K. Church, "A stochastic parts program and no
un phrase parser for unrestricted text," in Procee
dings of the Second Conference on Applied Natural
Language Processing, (Morristown, NJ), 136〜1
43ページ、Association for Computational Linguist
ics, 1988年
【図面の簡単な説明】
【図1】ロシア語костра/kastra/(焚き
火+所有格.単数)の表現の様々なレベルを表す本発明
の書記素/音素システムの構築を示す。発明の実施の形
態の第1項にて詳細に説明されている。
【図2】図2における表現の2つのレベルに関するFS
Tを構築するためのプロセスを図示する。発明の実施の
形態の第2項にて詳細に説明される。本発明システムの
更なる説明は付表に示されている。
【表1】
【表2】
【表3】
【表4】
【表5】
【表6】
【表7】
【表8】
【表9】
【表10】
【表11】
【表12】
【表13】
【表14】
【表15】
【表16】
【表17】
【表18】
【表19】
【表20】
【表21】
【表22】
【表23】
【表24】
【表25】
【表26】
【表27】
【表28】
【表29】
【表30】
【表31】
【表32】
【表33】
【表34】
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マイケル デニス リレイ アメリカ合衆国 10011 ニューヨーク, ニューヨーク,アパートメント ナンバー 2ジー,シックス アヴェニュー 450 (72)発明者 リチャード ウィリアム スプロート アメリカ合衆国 07922 ニュージャーシ ィ,バークレイ ハイツ,マックマーン アヴェニュー 150

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 ひとつ以上のアラビア数字を展開し相当
    する言葉を形成する方法において、 (a)数字の文法の言語学的な記述を供給する工程と、 (b)ひとつ以上の重み付き有限状態変換機能へ前記記
    述をコンパイルする工程と、 (c)前記ひとつ以上の重み付き有限状態変換機能を用
    いて前記相当する言葉を合成する工程とから構成される
    ことを特徴とする方法。
JP8065574A 1995-03-24 1996-03-22 重み付き有限状態変換機能を用いた書記素−音素変換 Withdrawn JPH08292792A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US41017095A 1995-03-24 1995-03-24
US08/410170 1995-03-24

Publications (1)

Publication Number Publication Date
JPH08292792A true JPH08292792A (ja) 1996-11-05

Family

ID=23623537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8065574A Withdrawn JPH08292792A (ja) 1995-03-24 1996-03-22 重み付き有限状態変換機能を用いた書記素−音素変換

Country Status (4)

Country Link
US (1) US5781884A (ja)
EP (1) EP0736856A2 (ja)
JP (1) JPH08292792A (ja)
CA (1) CA2170669A1 (ja)

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5806032A (en) * 1996-06-14 1998-09-08 Lucent Technologies Inc. Compilation of weighted finite-state transducers from decision trees
US6134528A (en) * 1997-06-13 2000-10-17 Motorola, Inc. Method device and article of manufacture for neural-network based generation of postlexical pronunciations from lexical pronunciations
JP2000163418A (ja) * 1997-12-26 2000-06-16 Canon Inc 自然言語処理装置及びその方法、及びそのプログラムを格納した記憶媒体
US6493662B1 (en) * 1998-02-11 2002-12-10 International Business Machines Corporation Rule-based number parser
US6513002B1 (en) * 1998-02-11 2003-01-28 International Business Machines Corporation Rule-based number formatter
EP0952531A1 (en) * 1998-04-24 1999-10-27 BRITISH TELECOMMUNICATIONS public limited company Linguistic converter
US6360010B1 (en) 1998-08-12 2002-03-19 Lucent Technologies, Inc. E-mail signature block segmentation
US6347295B1 (en) * 1998-10-26 2002-02-12 Compaq Computer Corporation Computer method and apparatus for grapheme-to-phoneme rule-set-generation
CN1343337B (zh) * 1999-03-05 2013-03-20 佳能株式会社 用于产生包括音素数据和解码的字的注释数据的方法和设备
WO2001031627A2 (en) * 1999-10-28 2001-05-03 Canon Kabushiki Kaisha Pattern matching method and apparatus
US6882970B1 (en) 1999-10-28 2005-04-19 Canon Kabushiki Kaisha Language recognition using sequence frequency
US7310600B1 (en) 1999-10-28 2007-12-18 Canon Kabushiki Kaisha Language recognition using a similarity measure
US7403888B1 (en) 1999-11-05 2008-07-22 Microsoft Corporation Language input user interface
US7165019B1 (en) * 1999-11-05 2007-01-16 Microsoft Corporation Language input architecture for converting one text form to another text form with modeless entry
US6848080B1 (en) 1999-11-05 2005-01-25 Microsoft Corporation Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
US7047493B1 (en) * 2000-03-31 2006-05-16 Brill Eric D Spell checker with arbitrary length string-to-string transformations to improve noisy channel spelling correction
GB0011798D0 (en) * 2000-05-16 2000-07-05 Canon Kk Database annotation and retrieval
GB0015233D0 (en) 2000-06-21 2000-08-16 Canon Kk Indexing method and apparatus
GB0023930D0 (en) 2000-09-29 2000-11-15 Canon Kk Database annotation and retrieval
GB0027178D0 (en) 2000-11-07 2000-12-27 Canon Kk Speech processing system
GB0028277D0 (en) 2000-11-20 2001-01-03 Canon Kk Speech processing system
WO2002097663A1 (en) * 2001-05-31 2002-12-05 University Of Southern California Integer programming decoder for machine translation
US8214196B2 (en) 2001-07-03 2012-07-03 University Of Southern California Syntax-based statistical translation model
US20030149562A1 (en) * 2002-02-07 2003-08-07 Markus Walther Context-aware linear time tokenizer
US7620538B2 (en) 2002-03-26 2009-11-17 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
WO2003105023A2 (en) * 2002-03-26 2003-12-18 University Of Southern California Statistical translation using a large monolingual corpus
US20030216920A1 (en) * 2002-05-16 2003-11-20 Jianghua Bao Method and apparatus for processing number in a text to speech (TTS) application
WO2004097793A1 (en) * 2003-04-30 2004-11-11 Loquendo S.P.A. Grapheme to phoneme alignment method and relative rule-set generating system
JP3768205B2 (ja) * 2003-05-30 2006-04-19 沖電気工業株式会社 形態素解析装置、形態素解析方法及び形態素解析プログラム
US7711545B2 (en) * 2003-07-02 2010-05-04 Language Weaver, Inc. Empirical methods for splitting compound words with application to machine translation
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US7617091B2 (en) * 2003-11-14 2009-11-10 Xerox Corporation Method and apparatus for processing natural language using tape-intersection
US7698125B2 (en) * 2004-03-15 2010-04-13 Language Weaver, Inc. Training tree transducers for probabilistic operations
US8296127B2 (en) * 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) * 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US20060031069A1 (en) * 2004-08-03 2006-02-09 Sony Corporation System and method for performing a grapheme-to-phoneme conversion
DE202005022113U1 (de) 2004-10-12 2014-02-05 University Of Southern California Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US7974833B2 (en) 2005-06-21 2011-07-05 Language Weaver, Inc. Weighted system of expressing language information using a compact notation
US20070027673A1 (en) * 2005-07-29 2007-02-01 Marko Moberg Conversion of number into text and speech
US7389222B1 (en) 2005-08-02 2008-06-17 Language Weaver, Inc. Task parallelization in a text-to-text system
US7813918B2 (en) * 2005-08-03 2010-10-12 Language Weaver, Inc. Identifying documents which form translated pairs, within a document collection
US7624020B2 (en) * 2005-09-09 2009-11-24 Language Weaver, Inc. Adapter for allowing both online and offline training of a text to text system
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US20080312929A1 (en) * 2007-06-12 2008-12-18 International Business Machines Corporation Using finite state grammars to vary output generated by a text-to-speech system
US8065300B2 (en) * 2008-03-12 2011-11-22 At&T Intellectual Property Ii, L.P. Finding the website of a business using the business name
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US8468021B2 (en) * 2010-07-15 2013-06-18 King Abdulaziz City For Science And Technology System and method for writing digits in words and pronunciation of numbers, fractions, and units
US20120089400A1 (en) * 2010-10-06 2012-04-12 Caroline Gilles Henton Systems and methods for using homophone lexicons in english text-to-speech
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
WO2013043165A1 (en) * 2011-09-21 2013-03-28 Nuance Communications, Inc. Efficient incremental modification of optimized finite-state transducers (fsts) for use in speech applications
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
CN103985392A (zh) * 2014-04-16 2014-08-13 柳超 音素级的低功耗的口语评价与缺陷诊断方法
CN105843811B (zh) 2015-01-13 2019-12-06 华为技术有限公司 转换文本的方法和设备
US9972314B2 (en) 2016-06-01 2018-05-15 Microsoft Technology Licensing, Llc No loss-optimization for weighted transducer

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5353336A (en) * 1992-08-24 1994-10-04 At&T Bell Laboratories Voice directed communications system archetecture
US5634084A (en) * 1995-01-20 1997-05-27 Centigram Communications Corporation Abbreviation and acronym/initialism expansion procedures for a text to speech reader

Also Published As

Publication number Publication date
CA2170669A1 (en) 1996-09-25
EP0736856A2 (en) 1996-10-09
US5781884A (en) 1998-07-14

Similar Documents

Publication Publication Date Title
JPH08292792A (ja) 重み付き有限状態変換機能を用いた書記素−音素変換
Dedina et al. PRONOUNCE: a program for pronunciation by analogy
El-Imam Phonetization of Arabic: rules and algorithms
US7197457B2 (en) Method for statistical language modeling in speech recognition
Thomason et al. Before the Lingua Franca: pidginized Arabic in the eleventh century AD
RU2386178C2 (ru) Способ предварительной обработки текста
Pérennou et al. MHATLex: Lexical Resources for Modelling the French Pronunciation.
Dutoit et al. TTSBOX: A MATLAB toolbox for teaching text-to-speech synthesis
Umeda et al. The parsing program for automatic text-to-speech synthesis developed at the Electrotechnical Laboratory in 1968
Akinwonmi Development of a prosodic read speech syllabic corpus of the Yoruba language
Ghani et al. Jawi-Malay Transliteration
Hill The promises and limitations of the newest type of grammatical analysis
Dijkstra et al. Frisian TTS, an example of bootstrapping TTS for minority languages
Stoel et al. Fataluku as a tone language
Gros et al. SI-PRON pronunciation lexicon: a new language resource for Slovenian
Hanane et al. TTS-SA (A text-to-speech system based on standard arabic)
Newman et al. The Hausa lexicographic tradition
Tuffour et al. Phonological analysis of Fish naming with Particular Reference to akans in Ghana
al-Kuran Perceptions of Vowels and Consonants in Arabic and English: Implications for Translators and Dictionary Users
Hussain To-sound conversion for Urdu text-to-speech system
Nath et al. A Grapheme to Phoneme Based Text to Speech Conversion Technique in Unicode Language
Ajah Users’ Guide to the Use of Dictionary
Dal Corso A Comparative Analysis of an East Sakhalin Ainu Folktale Collected by Bronisław Piłsudski
Karmakar Bangla Grammatical Tradition: Socio-genesis of Linguistic Structures
Wickramasinghe et al. Practical issues in the development of TTS and SR for the Sinhala language

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030603