JP2571857B2

JP2571857B2 - 入力語の起源の言語群の判定方法及び合成器による音素の発生方法

Info

Publication number: JP2571857B2
Application number: JP1300967A
Authority: JP
Inventors: アントニー・ジョン・ヴィテイル; トーマス・マーク・レーヴァーグッド; デェイヴィド・ゲラルド・コンロイ
Original assignee: Digital Equipment Corp
Current assignee: Digital Equipment Corp
Priority date: 1988-11-23
Filing date: 1989-11-21
Publication date: 1997-01-16
Anticipated expiration: 2012-01-16
Also published as: EP0372734A1; US5040218A; CA2003565A1; AU610766B2; JPH02224000A; EP0372734B1; DE68913669D1; DE68913669T2; AU4541489A; ATE102731T1; NZ231483A

Description

【発明の詳細な説明】（産業上の利用分野）本発明はコンピュータによる文書から話し言葉への変
換に関するものであり、特に文書から適正な名前を発音
することに関する。

（発明の背景）名前の発音は電話産業およびコンピュータ産業におい
て現場サービスの分野で使用することができる。また、
逆ディレクトリ援助（数値から名前へ）を有するより大
きな会社においての他、最後の名前フィールドが共通エ
ンテイテイである文書伝言システムにおいても使用され
る。

アメリカ英語の談話をコンピュータにより合成する多
数の装置を市場から入手することができる。談話合成に
ついて探される機能で特殊な問題を提起するものの一つ
は無数の民族学的に多様な姓氏の発音である。アメリカ
合衆国のような民族学的に多様な国家においては極端に
多数の異なる姓氏があるため、姓氏の発音をオーディオ
テープまたはディジタル化記憶音声のような他の音声出
力技術を用いて実用的に実現することは現在のところ不
可能である。

その根源言語に関する談話合成器の発音の正確さと第
２の言語に関する同じ合成器の発音の正確さとの間には
典型的に逆の関係が存在する。アメリカ合衆国はフラン
ス語、イタリア語、ポーランド語、スペイン語、ドイツ
語、アイルランド語などのような共通のインド・ヨーロ
ッパ語から日本語、アルメニア語、中国語、アラビア
語、およびベトナム語のような一層異国的なものまでに
亘る言語から由来する名前を持つ民族学的に異質の多様
な国家である。各種民族群からの名前の発音は標準のア
メリカ英語の規則に合致しない。たとえば、最もゲルマ
ン的な名前は最初の音節にアクセントがあるが、日本語
およびスペイン語の名前は語尾から二番目の音節にアク
セントを、フランス語の名前は最後の音節にアクセント
を置く傾向がある。同様に、正字法による綴りCHは英語
の名前（たとえば、CHILDERS）では［ｃ］と発音し、CH
ARPENTERのようなフランス語の名前では［ｓ］、および
BRONCHETTIのようなイタリア語の名前では［ｋ］と発音
する。人間の話し手は名前の起源となる言語を「知る」
ことにより正しい発音をすることが非常に多い。音声合
成器が直面する問題はこれらの名前を正しい発音を使つ
て話すことであるが、コンピュータは名前の民族学的起
源を「知」らないので、その発音はしばしば正しくな
い。

従来技術では名前を先づ多数の異なる言語群からの最
も普通の名前を備えている辞書中の多数のエントリに対
して合せるシステムが提案されている。辞書の各エント
リは正字法綴りのフォームおよび音声の相当語句を備え
ている。合致があると、音声の相当語句が合成器に送ら
れ、合成器はこれをその名前に対する可聴発音に戻す。

名前が辞書内に見つからないときは、提案されたシス
テムは統計的三字銘モデルを使用した。この三字銘分析
法は名前の各３文字の連鎖（すなわち三字銘）が語源と
関連している確率を推定することを含んでいる。プログ
ラムが新しい語を見つけると、各語源に対して語の各３
文字連鎖（三字銘）に基き確率を推定するため統計学の
公式を適用した。

（発明が解決しようとする課題）この手法に伴う問題点は三字銘分析の正確さである。
これは三字銘分析が確率だけを計算し、すべての言語群
を語の起源の言語群に対する可能な候補者と考えるの
で、語の起源の言語群を選定する正確さが可能な候補者
がもっと少いときのように高くないからである。

（発明の概要）本発明は三字銘分析の正確さを改良して上述の問題点
を解決するものである。すなわち、本発明は、言語合成
器に用いるための入力語の起源の言語群の判定方法であ
って、複数の言語群のいずれかが、入力された入力語の
起源の言語群と一致するか、あるいは当該一致判定から
除外されるべきかを、プログラム可能なコンピュータを
用いて決定する方法において、（ａ）上記プログラム可能なコンピュータのメモリ手段
に保存された１組のろ過規則を、上記入力語の書記素の
所定の複数の亜記号列に適用して、上記亜記号列の１つと１つの言語群の複数のろ過規則の
１つとの間に、上記入力語が上記１つの言語群の一部で
あると明らかに認定できる一致があるか、あるいは、上
記入力語の書記素の上記所定の複数の亜記号列のいずれ
かと、上記複数の言語群のある言語群のろ過規則との間
に一致がないかを判定し、一致がない場合は、上記ある
言語群を上記入力語の起源の言語群判定から除外するス
テップと（ここで、上記複数の言語群の各言語群のろ過
規則はＧ個の書記素を含んでおり、Ｇは１より大きく、
上記入力語の書記素の数以下である）、（ｂ）上記一致がある場合は、上記入力語の起源の言語
群を代表する言語付票を生成し、上記一致がない場合
は、上記ろ過規則に基づき上記入力語の起源の言語群と
して可能性がある言語群のリストを作成するステップと
からなる入力語の起源の言語群の判定方法である。

書記素の亜記号列である三字銘は、言語群を起源の言
語群として明確に識別するか、または言語群を所定の入
力語に対する起源の言語群として除外することによって
行われる。本発明によるろ過法は言語群を一組の記憶さ
れているろ過規則にしたがって識別するかまたは除外す
ることから構成される。

これら亜記号列の一つとろ過規則の一つと比較して言
語群を入力語に対する起源の言語として考察から除外す
べきことが示されたとき除外される。

この比較は亜記号列の一つが規則の一つと一致して言
語群を明確に識別するまで行われる。言語群が所定の入
力語に対するすべての亜文字列を比較してから起源の言
語群として明確に識別認定されないと、入力語の起源の
言語群として可能性のある言語群のリストが作られる。
一方明確な識別が行われたときは、すなわち亜記号列と
ろ過規則とが明らかに一致したときは言語群を出力す
る。

三字銘分析を行う前にフィルタを使用する利点にはろ
過規則が言語群を起源の言語群として明確に識別するこ
とができるとき不必要な三字銘分析を回避することが挙
げられる。言語群を明確に識別することができないと、
ろ過法は起源の言語群として考えている可能な言語群の
数を減らすことにより三字銘分析で行われている正しく
ない質問を行う機会を減らす。幾つかの言語群を除外す
ることにより、起源の言語群の識別が、上述のように、
一層正確になる。

本発明はまた入力語の起源の言語群にしたがって所定
の入力語に対する正しい音素を発生する方法を含んでい
る。この方法は辞書の入力語に対応するエントリを探す
ことから構成されている。各エントリには語およびその
語に対する音素を備えている。このエントリを辞書の探
索により入力語に対応するエントリが明らかになったら
発音用音声具現ユニットに送る。入力語が辞書内に対応
するエントリを持っていないとき入力語はフィルタに送
られる。

方法の次の段階はろ過して入力語に対する起源の言語
群を識別するか、または入力語に対する起源の少くとも
一つの言語群を除外することである。フィルタが入力語
に対する起源の言語群を明確に識別すると、入力語、お
よび入力語に対する起源の言語群を示す言語付票がフィ
ルタから文字対音響モジュールに送られる。起源の言語
群がフィルタにより明確に識別されないときは、入力語
および除外されない言語群がフィルタから三字銘分析器
に送られる。

入力語に対する起源の最も蓋然的な言語群が入力語に
生ずる三字銘を分析することにより示される。この三字
銘分析器により示された起源の最も蓋然的な言語群は入
力語と共に最も蓋然的な言語群に対応している文字対音
響規則のサブセットに送られる。音素は文字対音響規則
の対応するサブセットにしたがって入力語に対して発生
される。

（好適実施例）第１図は本発明の各種論理ブロックを示す図である。
システムの物理的実施例は図示のとおり論理的に配置さ
れた市場入手可能なプロセッサにより実現することがで
きる。

発音すべき名前が入力として受入れられる。この入力
名前に対して辞書10のエントリを通して探索が行われ
る。各辞書エントリは名前およびその名前に対する音素
を備えている。

語義付票が語を名前であると識別する。

辞書10のエントリに対応する入力名前を探すと的中が
生ずる。辞書10は直ちにエントリ（名前および音素）を
音声具現ユニット50に送り、このユニットがエントリに
入っている音素にしたがって名前を発音する。この入力
語に対する発音プロセスはこれで完了することになる。

辞書10に入力名前に対応するエントリが存在しないと
辞書ミスが発生する。正しい発音を発生するために、シ
ステムは入力名前の起源の言語群を識別しようとする。
これはフィルタ12に辞書10に見つからなかった入力名前
を送ることによって行われる。入力名前は言語群を明確
に識別するかまたは或る言語群を考察から除外するため
にフィルタ12により分析される。

フィルタ12は所定の規則集に基いて入力名前に対する
言語群をろ過し去るように動作する。これら規則は後に
説明する規則記憶装置によりフィルタ12に与えられる。

各入力名前は書記素の記号列から成ると考えられる。
入力名前の中の或る記号列はその名前に対する言語群を
一義的に識別（または除外）する。たとえば、一つの規
則によれば、記号列BAUMは入力名前をドイツ語（たとえ
ばTANNENBAUM）であると明確に識別する。他の規則によ
れば、名前の終りの記号列MOTOは言語群を日本語（たと
えばKAWAMOTO）であると明確に識別する。このような明
確な識別が存在すれば、入力名前および識別された言語
群（Ｌ付票）は適切な音素を音声具現ユニット50に、供
給する文字音響変換部20に直接送られる。

フィルタ12はその他の場合には明確な識別が不可能な
とき可能なかぎり多数の言語群をそれ以後の考察から除
外しようとする。これにより入力名前の残りの分析の確
率確度が増大する。たとえば、ろ過規則は記号列−Ｂが
名前の終りにあれば、日本語、スラブ語、フランス語、
スペイン語、およびアイルランド語のような言語群を以
後の考察から除外することができる。この除外により、
明確に識別されなかった入力名前に対する起源の言語群
を決定する次段の分析が簡略化され改善される。

言語群がフィルタ12により起源の言語群として明確に
識別することができないと仮定すると、更に分析が必要
である。これは三字銘分析器14により行われる。三字銘
分析器14は入力名前、およびフィルタ12により除外され
なかった言語群のリストを受取る。三字銘分析器14は書
記素の記号列（入力名前）を、３書記素長である書記素
記号列である三字銘に解剖する。たとえば、書記素記号
列#SMITH#は次の五つの三字銘に解剖される。すなわ
ち、#SM、SMI、MIT、ITH、TH#。三字銘分析の場合、ポ
ンド符号（語境界）は書記素と考える。それ故、三字銘
の数は常に名前の中の書記素の数と同じである。

各三字銘が特定の言語群からである確率が三字銘分析
器14に入力される。この確率は、名前データベースの分
析から計算されるが、フィルタ12により除外されなかっ
た各言語群に対する三字銘の度数表から入力として受取
られる。同じことは書記素記号列の各他の三字銘に対し
ても行われる。

次の（部分的）マトリックスは姓氏VITALEに対する標
本確率を示す。

上記の配列において、Ｌは言語群であり、ｎはフィル
タ12により除外されなかった言語群の数である。三字銘
#VIは言語群Liから由来する0.0679の確率、言語群Ljか
ら由来する0.4659の確率、および言語群Lnから由来する
0.2093の確率を備えている。Ljは最高確率として平均し
たものであり、こうして言語群が識別される。

書記素記号列の各三字銘の確率が三字銘分析器14に同
様に入力される。入力名前の中の各三字銘の確率は各言
語群について平均される。これは特定の言語群に起源を
有する入力名前の確率を表わしている。書記素記号列#V
ITALE#が特定の言語群に属する確率は総合確率の行から
確率のベクトルとして作られる。この確率のベクトルか
ら、標準偏差およびしきい値のような他の項目も計算す
ることができる。これにより一つの三字銘だけが総合確
率に寄与しすぎたり、ゆがめたりすることがないように
なる。

例示した実施例は三字銘を分析するが、分析器14は、
２書記素記号列または４書記素記号列のような、異なる
長さの書記素記号列を分析するように構成することがで
きる。

上記の例では、三字銘分析器14は、言語群Ljが、最高
確率を持っているため、所定の入力名前に対する起源の
最も蓋然的な言語群であることを示す。入力名前に対し
て言語付票となるのはこの最も蓋然的な言語群である。
言語付票および名前は次に文字音響変換部20に送られ、
入力に対する音素を発生する。

ろ過規則は識別のかいまいさが不可能なように構成さ
れる。すなわち、卓越関係が明確な識別が矛盾するあり
そうもない事象に関する除外規則より優るように適用さ
れるので、言語が両方共に除外されたり明確に識別され
たりすることはない。

同様に、言語群が二つ以上の言語に対して明確に識別
されることはない。ろ過規則は最初の明確な識別が適用
されるように順序正しい集合を構成しているからであ
る。

システムは二つのしきい値判定基準の一つが満たされ
れば一定の言語群にデフォルトすることができる。
（ａ）三字銘分析器14により求められた最高確率が所定
のしきい値Tiより低いとき絶対しきい値が発生する。こ
のことは三字銘分析器14が言語群中から妥当な程度の確
信を持って単一言語群を決定することができないことを
意味する。（ｂ）最高確率を持っているとして識別され
た言語群と二番目に高い確率を持っているとして識別さ
れた言語群との間の確率の差が三字銘分析器14によって
求められたしきい値Tjより低いときは相対的しきい値が
発生する。

指定された言語群へのデフォルトは設定可能なパラメ
ータである。たとえば、英語を話す環境において、英語
の発音へのデフォルトは、人間は、信頼性水準を低くし
た場合、入力名前の一般的な英語発音に最も頼るように
思われるから、一般に最も安全な進路である。設定可能
なパラメータとしてのデフォルトの値はデフォルトが一
定の状況、たとえば、電話交換により電話番号が比較的
均質な民族学的近隣地に設置されていることが示された
場合、において変えられるようになっている。

前に述べたように、フィルタ12または三字銘分析器14
により送られる名前および言語付票（LTAG）は文字音響
変換規則部20により受取られる。文字音響変換規則部20
は概念的に各言語群に対して別々のブロックに分解され
る。換言すれば、言語群（Li）は、言語群（Li）、言語
群（Lk）などから言語群（Ln）までが持つように、それ
自身の文字音響変換規則集を備えている。

入力名前がデフォルト発音を発生しないように充分に
識別されていると仮定すれば、入力名前は入力名前に関
連する言語付票にしたがって適切な言語群の文字音響変
換ブロック22i−ｎに送られる。

文字音響変換規則部20において、個々の言語群ブロッ
ク22に対する規則は英語を含む他の言語群に対する一層
大きく且つ一層複雑な文字音響変換規則集のサブセット
である。起源の言語群として識別されている特定の言語
群Liに対する文字音響変換ブロック22iは最大の書記素
連鎖を規則に合わせようとする。これは上から下へ、こ
の実施例では右から左へ、ろ過規則に適合する入力名前
中の書記素の記号列を探すフィルタ12とは異なる。特定
の言語群に対する文字音響変換ブロック22i−ｎは書記
素記号列を左から右へまたは右から左へ走査する。例示
した実施例では右から左への走査を行っている。

特定のブロックLiに対する文字音響変換規則の一例を
MANKIEWICZのような名前に対して示すことができる。こ
の入力名前は、最高の確率を有するスラブ系言語群から
由来するものとして識別され、それ故スラブ文字音響変
換規則ブロック22iに送られる。このブロック22iで、書
記素記号列−WICZは記号列の正しい分節音素を発生する
発音規則を備えている。しかし、書記素記号列−KIEWIC
Zはまたスラブ規則集にも規則を備えている。これは一
層長い書記素列であるから、この規則が先に適用され
る。言語特有発音規則に対応しない残りの書記素に対す
る分節音素は一般発音ブロックから決定される。この例
では、書記素Ｍ、Ａ、およびＮに対する分節音素は一般
発音規則にしたがって（別々に）決定される。文字音響
変換ブロック22iは言語敏感書記素記号列および言語不
敏感書記素記号列の双方の鎖状連結音素と共に発音用音
声具現ユニット50に送る。

フィルタ12は文字音響変換規則20にある言語特有の一
層大きな記号列のすべてを備えているわけではない。一
層大きな記号列は、たとえば、記号列−WICZは入力名前
をスラブ起源として明確に識別するので、必らずしもす
べてが必要ではない。それで、−WICZは−KIEWICZのサ
ブセットであり、したがって入力名前が識別されるか
ら、記号列−KIEWICZのろ過規則の必要はない。

文字音響変換モジュールは名前に対する音素を主とし
て分節音素情報の形で出力する。文字音響変換規則ブロ
ック22i−ｎの出力は強勢部24i−ｎの入力として働く。
これら強勢部24i−ｎはLTAGを個々の文字音響変換規則
ブロック22i−ｎにより作られた音素と共に取り、分節
音素（文字音響変換規則ブロック22i−ｎからの）およ
びその言語に対する正しい強勢パターンを共に備えた完
全な音素記号列を出力する。たとえば、名前VITALEに対
して識別された言語がイタリア語であり、文字音響変換
規則ブロック22が音素記号列［vitali］を発生したとす
れば、強勢部24iは最終音節記号列が［vitali］になる
ように末尾から２番目の音節にアクセントを置くことに
なる。

文字音響変換部20のフィルタ12、および強勢部24i−
ｎに使用する実際の規則は言語学に関する当業者に既知
であるかまたは容易に得られる規則であることに注目す
べきである。

上述のシステムは音声具現ユニット50に対するフロン
トエント・プロセッサと見ることができる。音声具現ユ
ニット50は人間の談話を書記素または音素の入力から発
生する市場入手可能なユニットとすることができる。合
成器は音素基準式または音響の或る他のユニット、たと
えばダイフォーンまたは半音節に基くものとすることが
できる。合成器は英語以外の言語を合成することもでき
る。

第２図はシステムの一部としての言語群識別音声具現
ブロック60を示す。言語群識別音声具現ブロック60は、
第１図に示す機能ブロックから構成されている。図示の
とおり、言語識別音声具現ブロック60への入力は名前、
ろ過規則、および三字銘確率である。出力は名前、言語
付票、および音素であり、これらは音声具現ユニット50
に送られる。音素とはこの文脈ではダイフォーンおよび
半音節を含む音響信号のすべてのアルファベットを意味
することに注目すべきである。

第２図によるシステムは書記素記号列を特定の言語群
に属するとして標示する。確率表を特定のデータベース
に対して洗練するために新しいデータベースを予備ろ過
するのに言語識別子を使用する。分析ブロック62は入力
として名前および言語付票および言語統計を言語識別音
声具現ブロック60から受取る。分析ブロックはこの情報
を取り、名前および言語付票をマスター言語ファイル64
に出力し、規則をろ過規則記憶装置68に対して発生す
る。このようにして、システムのデータベースが新しい
入力名前が処理されるにつれて拡張されるので将来の入
力名前が一層容易に処理されることになる。ろ過規則記
憶装置68はろ過規則をフィルタ12および言語識別音声具
現ブロック60に供給する。

マスター・ファイルはすべての書記素記号列およびそ
の言語群付票を備えている。このブロック64は分析ブロ
ック62により作られる。三字銘確率は所定の入力三字銘
の探索を容易にするために設計されたデータ構造66で配
列される。たとえば、例示した実施例は深さｎの三次元
マトリックスを使用している。ただしｎは言語群の数で
ある。

三字銘確率表は下記アルゴリズムを使用してマスター
・ファイルから計算される。

すべての言語群Ｌ（１−Ｎ）に対する各三字銘の発生
の総数を計算する。

Ｌの中のすべての書記素記号列ＳについてＳの中のすべての三字銘Ｔについて（カウント［Ｔ］［Ｌ］＝０）ならばユニーク［Ｌ］＋＝１カウント［Ｔ］［Ｌ］＋＝１マスター内のすべての可能な三字銘Ｔについて和＝０すべての言語群Ｌについて和＋＝カウント［Ｔ］［Ｌ］／ユニーク［Ｌ］すべての言語群Ｌについて和＞０ならば、確率［Ｔ］［Ｌ］＝カウント［Ｔ］［Ｌ］／ユニーク［Ｌ］／和その他の場合、確率［Ｔ］［Ｌ］＝0.0; 先に述べた三字銘度数表を三字銘、言語群、および度
数の三次元配列と考えることができる。度数とは名前の
大きな標本に基くそれぞれの言語群に対する三字銘連鎖
の発生の百分率を意味する。特定の言語群の構成員であ
る三字銘の確率は多数の方法で求めることができる。こ
の実施例においては、特定の言語群の構成員である三字
銘の確率は、下に示す公式にしたがって、周知のバイエ
の定理から求められる。

バイエの規則はBjが所定のＡを発生する確率Ｐ（Bj/
A）はであることを述べている。

問題に更に特定すれば、言語群に三字銘Ｔが与えられ
る確率はＰ（Li/T）である。ここで更に解析してただしＸ＝言語群Liに発生するトークンＴの回数Ｙ＝言語群Liに一義的に発生するトークンの回数ただしＮ＝言語群の数（重複しない）故にこれにより最終表は、三字銘の書記素に一つづつ、お
よび言語群に対して一つ、の四次元を有する。

ブロック66により計算された三字銘の確率は言語識別
音声具現ブロック60に、特に書記素記号列が特定の言語
群に属している確率のベクトルを発生する三字銘分析器
14に送られる。

（発明の効果）上述のシステムを使用すれば、名前を一層正確に発音
することができる。姓氏を一層正確に発音するために姓
氏と関連して洗礼名を使用することのようななお一層の
発展が期待される。これには現存する知識ベースおよび
規則の組合せを拡張することが必要である。

【図面の簡単な説明】

第１図は言語識別音声具現モジュールの論理ブロック図
を示す。第２図は本発明にしたがって構成された、第１図の言語
群識別音声具現モジュールを備えている、名前分析シス
テムの論理ブロック図を示す。 10……辞書。12……フィルタ。14……三字銘分析器。20
……文字音響変換規則部。50……音声具現ユニット。60
……言語識別音声具現ブロック。64……マスター言語フ
ァイル。

フロントページの続き (72)発明者デェイヴィド・ゲラルド・コンロイアメリカ合衆国・マサチューセッツ州・ 01754・メイナード・コンコードストリート・78番地

Claims

(57)【特許請求の範囲】

【請求項１】言語合成器に用いるための入力語の起源の
言語群の判定方法であって、複数の言語群のいずれか
が、入力された入力語の起源の言語群と一致するか、あ
るいは当該一致判定から除外されるべきかを、プログラ
ム可能なコンピュータを用いて決定する方法において、（ａ）上記プログラム可能なコンピュータのメモリ手段
に保存された１組のろ過規則を、上記入力語の書記素の
所定の複数の亜記号列に適用して、上記亜記号列の１つと１つの言語群の複数のろ過規則の
１つとの間に、上記入力語が上記１つの言語群の一部で
あると明らかに認定できる一致があるか、あるいは、上
記入力語の書記素の上記所定の複数の亜記号列のいずれ
かと、上記複数の言語群のある言語群のろ過規則との間
に一致がないかを判定し、一致がない場合は、上記ある
言語群を上記入力語の起源の言語群判定から除外するス
テップと（ここで、上記複数の言語群の各言語群のろ過
規則はＧ個の書記素を含んでおり、Ｇは１より大きく、
上記入力語の書記素の数以下である）、（ｂ）上記一致がある場合は、上記入力語の起源の言語
群を代表する言語付票を生成し、上記一致がない場合
は、上記ろ過規則に基づき上記入力語の起源の言語群と
して可能性がある言語群のリストを作成するステップと
からなる入力語の起源の言語群の判定方法。
【請求項２】入力語の起源の言語群にしたがって所定の
語に対する正しい音素を発生する方法であって、各々がその語に対する語および音素を含んでいる，辞書
のエントリを探す段階、辞書を探して前記入力語に対応
するエントリが明らかになったとき前記エントリを発音
用音声具現ユニットに送る段階、前記入力語が前記辞書内に対応するエントリを備えてい
ないとき前記入力語をフィルタに送る段階、前記フィルタにより前記入力語に対する起源の言語群を
識別するように、または前記入力語に対する起源の少く
とも一つの言語群を除外するようにろ過する段階、前記フィルタが前記入力語に対する起源の言語群を明確
に識別したとき、前記入力語、および前記入力語に対す
る起源の言語群を示す言語付票を、前記フィルタから文
字音響変換規則を備えている文字音響交換モジュールに
送る段階、前記入力語に対する起源の言語群が前記フィルタにより
明確に識別されないとき前記フィルタから前記入力語お
よび除外されない言語群を書記素分析器に送る段階、前記入力語中の書記素を分析することにより前記入力語
に対する起源の最も蓋然的な言語群を発生する段階、前記入力語および起源の前記最も蓋然的な言語群を前記
最も蓋然的な言語群に対応する前記文字音響変換規則の
サブセットに送る段階、前記文字音響変換規則のサブセット内に前記入力語に対
する分節音素を発生する段階、前記分節音素および前記言語付票を前記文字音響変換モ
ジュールから強勢割当て部に送る段階、前記入力語に対する強制割当て情報を前記強勢割当て部
内に作る段階、および前記分節音素および前記強勢割当
て情報を音声具現ユニットに送る段階、から成る前記方法。
【請求項３】前記書記素が三字銘である請求項２に記載
の方法。
【請求項４】起源の最も蓋然的な言語群を発生する前記
段階がバイエスの規則を使用して特定の言語群から入力
語群に対する書記素の確率を計算する段階を含んでいる
請求項２に記載の方法。
【請求項５】更に、起源の最も蓋然的な言語群を発生す
る段階が、所定のしきい値より低い確率を有する起源の
最も蓋然的な言語群を発生するとき、一般的発音にデフ
ォルトする段階、を含む請求項２に記載の方法。
【請求項６】更に、起源の最も蓋然的な言語群を発生す
る段階が、起源の二番目に最も蓋然的な言語群の確率よ
り所定量だけ大きくない確率を有する起源の最も蓋然的
な言語群を発生するとき、一般的発音にデフォルトする
段階を含む、請求項２に記載の方法。
【請求項７】言語群を所定の語に対する起源の言語群と
して明確に識別し、または除外する装置であって、一組のろ過規則、すなわち該ろ過規則の第１のサブセッ
トが言語群を明確に識別し、該ろ過規則の第２のサブセ
ットが言語群を除外するもの、を格納するろ過規則記憶
装置、入力語の書記素の亜記号列を、該亜記号列の一つがろ過
規則の前記第１のサブセットの一つと合致して言語群を
識別するまで、または前記亜記号列の一つがろ過規則の
前記第２のサブセットの一つと合致して言語群が前記入
力語に対する起源の言語群として考察から除外されるこ
とを示すとき言語群を除外するまで、ろ過規則の前記第
１および第２のサブセットと比較する比較器、および起源の言語群として言語群が明確に識別されないとき起
源の可能な言語群のリストを作り、起源の前記言語群が
明確に識別されるとき起源の前記言語群を表示する出
力、から成る前記装置。