JP2571857B2 - 入力語の起源の言語群の判定方法及び合成器による音素の発生方法 - Google Patents
入力語の起源の言語群の判定方法及び合成器による音素の発生方法Info
- Publication number
- JP2571857B2 JP2571857B2 JP1300967A JP30096789A JP2571857B2 JP 2571857 B2 JP2571857 B2 JP 2571857B2 JP 1300967 A JP1300967 A JP 1300967A JP 30096789 A JP30096789 A JP 30096789A JP 2571857 B2 JP2571857 B2 JP 2571857B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- origin
- language group
- group
- input word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明はコンピュータによる文書から話し言葉への変
換に関するものであり、特に文書から適正な名前を発音
することに関する。
換に関するものであり、特に文書から適正な名前を発音
することに関する。
(発明の背景) 名前の発音は電話産業およびコンピュータ産業におい
て現場サービスの分野で使用することができる。また、
逆ディレクトリ援助(数値から名前へ)を有するより大
きな会社においての他、最後の名前フィールドが共通エ
ンテイテイである文書伝言システムにおいても使用され
る。
て現場サービスの分野で使用することができる。また、
逆ディレクトリ援助(数値から名前へ)を有するより大
きな会社においての他、最後の名前フィールドが共通エ
ンテイテイである文書伝言システムにおいても使用され
る。
アメリカ英語の談話をコンピュータにより合成する多
数の装置を市場から入手することができる。談話合成に
ついて探される機能で特殊な問題を提起するものの一つ
は無数の民族学的に多様な姓氏の発音である。アメリカ
合衆国のような民族学的に多様な国家においては極端に
多数の異なる姓氏があるため、姓氏の発音をオーディオ
テープまたはディジタル化記憶音声のような他の音声出
力技術を用いて実用的に実現することは現在のところ不
可能である。
数の装置を市場から入手することができる。談話合成に
ついて探される機能で特殊な問題を提起するものの一つ
は無数の民族学的に多様な姓氏の発音である。アメリカ
合衆国のような民族学的に多様な国家においては極端に
多数の異なる姓氏があるため、姓氏の発音をオーディオ
テープまたはディジタル化記憶音声のような他の音声出
力技術を用いて実用的に実現することは現在のところ不
可能である。
その根源言語に関する談話合成器の発音の正確さと第
2の言語に関する同じ合成器の発音の正確さとの間には
典型的に逆の関係が存在する。アメリカ合衆国はフラン
ス語、イタリア語、ポーランド語、スペイン語、ドイツ
語、アイルランド語などのような共通のインド・ヨーロ
ッパ語から日本語、アルメニア語、中国語、アラビア
語、およびベトナム語のような一層異国的なものまでに
亘る言語から由来する名前を持つ民族学的に異質の多様
な国家である。各種民族群からの名前の発音は標準のア
メリカ英語の規則に合致しない。たとえば、最もゲルマ
ン的な名前は最初の音節にアクセントがあるが、日本語
およびスペイン語の名前は語尾から二番目の音節にアク
セントを、フランス語の名前は最後の音節にアクセント
を置く傾向がある。同様に、正字法による綴りCHは英語
の名前(たとえば、CHILDERS)では[c]と発音し、CH
ARPENTERのようなフランス語の名前では[s]、および
BRONCHETTIのようなイタリア語の名前では[k]と発音
する。人間の話し手は名前の起源となる言語を「知る」
ことにより正しい発音をすることが非常に多い。音声合
成器が直面する問題はこれらの名前を正しい発音を使つ
て話すことであるが、コンピュータは名前の民族学的起
源を「知」らないので、その発音はしばしば正しくな
い。
2の言語に関する同じ合成器の発音の正確さとの間には
典型的に逆の関係が存在する。アメリカ合衆国はフラン
ス語、イタリア語、ポーランド語、スペイン語、ドイツ
語、アイルランド語などのような共通のインド・ヨーロ
ッパ語から日本語、アルメニア語、中国語、アラビア
語、およびベトナム語のような一層異国的なものまでに
亘る言語から由来する名前を持つ民族学的に異質の多様
な国家である。各種民族群からの名前の発音は標準のア
メリカ英語の規則に合致しない。たとえば、最もゲルマ
ン的な名前は最初の音節にアクセントがあるが、日本語
およびスペイン語の名前は語尾から二番目の音節にアク
セントを、フランス語の名前は最後の音節にアクセント
を置く傾向がある。同様に、正字法による綴りCHは英語
の名前(たとえば、CHILDERS)では[c]と発音し、CH
ARPENTERのようなフランス語の名前では[s]、および
BRONCHETTIのようなイタリア語の名前では[k]と発音
する。人間の話し手は名前の起源となる言語を「知る」
ことにより正しい発音をすることが非常に多い。音声合
成器が直面する問題はこれらの名前を正しい発音を使つ
て話すことであるが、コンピュータは名前の民族学的起
源を「知」らないので、その発音はしばしば正しくな
い。
従来技術では名前を先づ多数の異なる言語群からの最
も普通の名前を備えている辞書中の多数のエントリに対
して合せるシステムが提案されている。辞書の各エント
リは正字法綴りのフォームおよび音声の相当語句を備え
ている。合致があると、音声の相当語句が合成器に送ら
れ、合成器はこれをその名前に対する可聴発音に戻す。
も普通の名前を備えている辞書中の多数のエントリに対
して合せるシステムが提案されている。辞書の各エント
リは正字法綴りのフォームおよび音声の相当語句を備え
ている。合致があると、音声の相当語句が合成器に送ら
れ、合成器はこれをその名前に対する可聴発音に戻す。
名前が辞書内に見つからないときは、提案されたシス
テムは統計的三字銘モデルを使用した。この三字銘分析
法は名前の各3文字の連鎖(すなわち三字銘)が語源と
関連している確率を推定することを含んでいる。プログ
ラムが新しい語を見つけると、各語源に対して語の各3
文字連鎖(三字銘)に基き確率を推定するため統計学の
公式を適用した。
テムは統計的三字銘モデルを使用した。この三字銘分析
法は名前の各3文字の連鎖(すなわち三字銘)が語源と
関連している確率を推定することを含んでいる。プログ
ラムが新しい語を見つけると、各語源に対して語の各3
文字連鎖(三字銘)に基き確率を推定するため統計学の
公式を適用した。
(発明が解決しようとする課題) この手法に伴う問題点は三字銘分析の正確さである。
これは三字銘分析が確率だけを計算し、すべての言語群
を語の起源の言語群に対する可能な候補者と考えるの
で、語の起源の言語群を選定する正確さが可能な候補者
がもっと少いときのように高くないからである。
これは三字銘分析が確率だけを計算し、すべての言語群
を語の起源の言語群に対する可能な候補者と考えるの
で、語の起源の言語群を選定する正確さが可能な候補者
がもっと少いときのように高くないからである。
(発明の概要) 本発明は三字銘分析の正確さを改良して上述の問題点
を解決するものである。すなわち、本発明は、言語合成
器に用いるための入力語の起源の言語群の判定方法であ
って、複数の言語群のいずれかが、入力された入力語の
起源の言語群と一致するか、あるいは当該一致判定から
除外されるべきかを、プログラム可能なコンピュータを
用いて決定する方法において、 (a)上記プログラム可能なコンピュータのメモリ手段
に保存された1組のろ過規則を、上記入力語の書記素の
所定の複数の亜記号列に適用して、 上記亜記号列の1つと1つの言語群の複数のろ過規則の
1つとの間に、上記入力語が上記1つの言語群の一部で
あると明らかに認定できる一致があるか、あるいは、上
記入力語の書記素の上記所定の複数の亜記号列のいずれ
かと、上記複数の言語群のある言語群のろ過規則との間
に一致がないかを判定し、一致がない場合は、上記ある
言語群を上記入力語の起源の言語群判定から除外するス
テップと(ここで、上記複数の言語群の各言語群のろ過
規則はG個の書記素を含んでおり、Gは1より大きく、
上記入力語の書記素の数以下である)、 (b)上記一致がある場合は、上記入力語の起源の言語
群を代表する言語付票を生成し、上記一致がない場合
は、上記ろ過規則に基づき上記入力語の起源の言語群と
して可能性がある言語群のリストを作成するステップと
からなる入力語の起源の言語群の判定方法である。
を解決するものである。すなわち、本発明は、言語合成
器に用いるための入力語の起源の言語群の判定方法であ
って、複数の言語群のいずれかが、入力された入力語の
起源の言語群と一致するか、あるいは当該一致判定から
除外されるべきかを、プログラム可能なコンピュータを
用いて決定する方法において、 (a)上記プログラム可能なコンピュータのメモリ手段
に保存された1組のろ過規則を、上記入力語の書記素の
所定の複数の亜記号列に適用して、 上記亜記号列の1つと1つの言語群の複数のろ過規則の
1つとの間に、上記入力語が上記1つの言語群の一部で
あると明らかに認定できる一致があるか、あるいは、上
記入力語の書記素の上記所定の複数の亜記号列のいずれ
かと、上記複数の言語群のある言語群のろ過規則との間
に一致がないかを判定し、一致がない場合は、上記ある
言語群を上記入力語の起源の言語群判定から除外するス
テップと(ここで、上記複数の言語群の各言語群のろ過
規則はG個の書記素を含んでおり、Gは1より大きく、
上記入力語の書記素の数以下である)、 (b)上記一致がある場合は、上記入力語の起源の言語
群を代表する言語付票を生成し、上記一致がない場合
は、上記ろ過規則に基づき上記入力語の起源の言語群と
して可能性がある言語群のリストを作成するステップと
からなる入力語の起源の言語群の判定方法である。
書記素の亜記号列である三字銘は、言語群を起源の言
語群として明確に識別するか、または言語群を所定の入
力語に対する起源の言語群として除外することによって
行われる。本発明によるろ過法は言語群を一組の記憶さ
れているろ過規則にしたがって識別するかまたは除外す
ることから構成される。
語群として明確に識別するか、または言語群を所定の入
力語に対する起源の言語群として除外することによって
行われる。本発明によるろ過法は言語群を一組の記憶さ
れているろ過規則にしたがって識別するかまたは除外す
ることから構成される。
これら亜記号列の一つとろ過規則の一つと比較して言
語群を入力語に対する起源の言語として考察から除外す
べきことが示されたとき除外される。
語群を入力語に対する起源の言語として考察から除外す
べきことが示されたとき除外される。
この比較は亜記号列の一つが規則の一つと一致して言
語群を明確に識別するまで行われる。言語群が所定の入
力語に対するすべての亜文字列を比較してから起源の言
語群として明確に識別認定されないと、入力語の起源の
言語群として可能性のある言語群のリストが作られる。
一方明確な識別が行われたときは、すなわち亜記号列と
ろ過規則とが明らかに一致したときは言語群を出力す
る。
語群を明確に識別するまで行われる。言語群が所定の入
力語に対するすべての亜文字列を比較してから起源の言
語群として明確に識別認定されないと、入力語の起源の
言語群として可能性のある言語群のリストが作られる。
一方明確な識別が行われたときは、すなわち亜記号列と
ろ過規則とが明らかに一致したときは言語群を出力す
る。
三字銘分析を行う前にフィルタを使用する利点にはろ
過規則が言語群を起源の言語群として明確に識別するこ
とができるとき不必要な三字銘分析を回避することが挙
げられる。言語群を明確に識別することができないと、
ろ過法は起源の言語群として考えている可能な言語群の
数を減らすことにより三字銘分析で行われている正しく
ない質問を行う機会を減らす。幾つかの言語群を除外す
ることにより、起源の言語群の識別が、上述のように、
一層正確になる。
過規則が言語群を起源の言語群として明確に識別するこ
とができるとき不必要な三字銘分析を回避することが挙
げられる。言語群を明確に識別することができないと、
ろ過法は起源の言語群として考えている可能な言語群の
数を減らすことにより三字銘分析で行われている正しく
ない質問を行う機会を減らす。幾つかの言語群を除外す
ることにより、起源の言語群の識別が、上述のように、
一層正確になる。
本発明はまた入力語の起源の言語群にしたがって所定
の入力語に対する正しい音素を発生する方法を含んでい
る。この方法は辞書の入力語に対応するエントリを探す
ことから構成されている。各エントリには語およびその
語に対する音素を備えている。このエントリを辞書の探
索により入力語に対応するエントリが明らかになったら
発音用音声具現ユニットに送る。入力語が辞書内に対応
するエントリを持っていないとき入力語はフィルタに送
られる。
の入力語に対する正しい音素を発生する方法を含んでい
る。この方法は辞書の入力語に対応するエントリを探す
ことから構成されている。各エントリには語およびその
語に対する音素を備えている。このエントリを辞書の探
索により入力語に対応するエントリが明らかになったら
発音用音声具現ユニットに送る。入力語が辞書内に対応
するエントリを持っていないとき入力語はフィルタに送
られる。
方法の次の段階はろ過して入力語に対する起源の言語
群を識別するか、または入力語に対する起源の少くとも
一つの言語群を除外することである。フィルタが入力語
に対する起源の言語群を明確に識別すると、入力語、お
よび入力語に対する起源の言語群を示す言語付票がフィ
ルタから文字対音響モジュールに送られる。起源の言語
群がフィルタにより明確に識別されないときは、入力語
および除外されない言語群がフィルタから三字銘分析器
に送られる。
群を識別するか、または入力語に対する起源の少くとも
一つの言語群を除外することである。フィルタが入力語
に対する起源の言語群を明確に識別すると、入力語、お
よび入力語に対する起源の言語群を示す言語付票がフィ
ルタから文字対音響モジュールに送られる。起源の言語
群がフィルタにより明確に識別されないときは、入力語
および除外されない言語群がフィルタから三字銘分析器
に送られる。
入力語に対する起源の最も蓋然的な言語群が入力語に
生ずる三字銘を分析することにより示される。この三字
銘分析器により示された起源の最も蓋然的な言語群は入
力語と共に最も蓋然的な言語群に対応している文字対音
響規則のサブセットに送られる。音素は文字対音響規則
の対応するサブセットにしたがって入力語に対して発生
される。
生ずる三字銘を分析することにより示される。この三字
銘分析器により示された起源の最も蓋然的な言語群は入
力語と共に最も蓋然的な言語群に対応している文字対音
響規則のサブセットに送られる。音素は文字対音響規則
の対応するサブセットにしたがって入力語に対して発生
される。
(好適実施例) 第1図は本発明の各種論理ブロックを示す図である。
システムの物理的実施例は図示のとおり論理的に配置さ
れた市場入手可能なプロセッサにより実現することがで
きる。
システムの物理的実施例は図示のとおり論理的に配置さ
れた市場入手可能なプロセッサにより実現することがで
きる。
発音すべき名前が入力として受入れられる。この入力
名前に対して辞書10のエントリを通して探索が行われ
る。各辞書エントリは名前およびその名前に対する音素
を備えている。
名前に対して辞書10のエントリを通して探索が行われ
る。各辞書エントリは名前およびその名前に対する音素
を備えている。
語義付票が語を名前であると識別する。
辞書10のエントリに対応する入力名前を探すと的中が
生ずる。辞書10は直ちにエントリ(名前および音素)を
音声具現ユニット50に送り、このユニットがエントリに
入っている音素にしたがって名前を発音する。この入力
語に対する発音プロセスはこれで完了することになる。
生ずる。辞書10は直ちにエントリ(名前および音素)を
音声具現ユニット50に送り、このユニットがエントリに
入っている音素にしたがって名前を発音する。この入力
語に対する発音プロセスはこれで完了することになる。
辞書10に入力名前に対応するエントリが存在しないと
辞書ミスが発生する。正しい発音を発生するために、シ
ステムは入力名前の起源の言語群を識別しようとする。
これはフィルタ12に辞書10に見つからなかった入力名前
を送ることによって行われる。入力名前は言語群を明確
に識別するかまたは或る言語群を考察から除外するため
にフィルタ12により分析される。
辞書ミスが発生する。正しい発音を発生するために、シ
ステムは入力名前の起源の言語群を識別しようとする。
これはフィルタ12に辞書10に見つからなかった入力名前
を送ることによって行われる。入力名前は言語群を明確
に識別するかまたは或る言語群を考察から除外するため
にフィルタ12により分析される。
フィルタ12は所定の規則集に基いて入力名前に対する
言語群をろ過し去るように動作する。これら規則は後に
説明する規則記憶装置によりフィルタ12に与えられる。
言語群をろ過し去るように動作する。これら規則は後に
説明する規則記憶装置によりフィルタ12に与えられる。
各入力名前は書記素の記号列から成ると考えられる。
入力名前の中の或る記号列はその名前に対する言語群を
一義的に識別(または除外)する。たとえば、一つの規
則によれば、記号列BAUMは入力名前をドイツ語(たとえ
ばTANNENBAUM)であると明確に識別する。他の規則によ
れば、名前の終りの記号列MOTOは言語群を日本語(たと
えばKAWAMOTO)であると明確に識別する。このような明
確な識別が存在すれば、入力名前および識別された言語
群(L付票)は適切な音素を音声具現ユニット50に、供
給する文字音響変換部20に直接送られる。
入力名前の中の或る記号列はその名前に対する言語群を
一義的に識別(または除外)する。たとえば、一つの規
則によれば、記号列BAUMは入力名前をドイツ語(たとえ
ばTANNENBAUM)であると明確に識別する。他の規則によ
れば、名前の終りの記号列MOTOは言語群を日本語(たと
えばKAWAMOTO)であると明確に識別する。このような明
確な識別が存在すれば、入力名前および識別された言語
群(L付票)は適切な音素を音声具現ユニット50に、供
給する文字音響変換部20に直接送られる。
フィルタ12はその他の場合には明確な識別が不可能な
とき可能なかぎり多数の言語群をそれ以後の考察から除
外しようとする。これにより入力名前の残りの分析の確
率確度が増大する。たとえば、ろ過規則は記号列−Bが
名前の終りにあれば、日本語、スラブ語、フランス語、
スペイン語、およびアイルランド語のような言語群を以
後の考察から除外することができる。この除外により、
明確に識別されなかった入力名前に対する起源の言語群
を決定する次段の分析が簡略化され改善される。
とき可能なかぎり多数の言語群をそれ以後の考察から除
外しようとする。これにより入力名前の残りの分析の確
率確度が増大する。たとえば、ろ過規則は記号列−Bが
名前の終りにあれば、日本語、スラブ語、フランス語、
スペイン語、およびアイルランド語のような言語群を以
後の考察から除外することができる。この除外により、
明確に識別されなかった入力名前に対する起源の言語群
を決定する次段の分析が簡略化され改善される。
言語群がフィルタ12により起源の言語群として明確に
識別することができないと仮定すると、更に分析が必要
である。これは三字銘分析器14により行われる。三字銘
分析器14は入力名前、およびフィルタ12により除外され
なかった言語群のリストを受取る。三字銘分析器14は書
記素の記号列(入力名前)を、3書記素長である書記素
記号列である三字銘に解剖する。たとえば、書記素記号
列#SMITH#は次の五つの三字銘に解剖される。すなわ
ち、#SM、SMI、MIT、ITH、TH#。三字銘分析の場合、ポ
ンド符号(語境界)は書記素と考える。それ故、三字銘
の数は常に名前の中の書記素の数と同じである。
識別することができないと仮定すると、更に分析が必要
である。これは三字銘分析器14により行われる。三字銘
分析器14は入力名前、およびフィルタ12により除外され
なかった言語群のリストを受取る。三字銘分析器14は書
記素の記号列(入力名前)を、3書記素長である書記素
記号列である三字銘に解剖する。たとえば、書記素記号
列#SMITH#は次の五つの三字銘に解剖される。すなわ
ち、#SM、SMI、MIT、ITH、TH#。三字銘分析の場合、ポ
ンド符号(語境界)は書記素と考える。それ故、三字銘
の数は常に名前の中の書記素の数と同じである。
各三字銘が特定の言語群からである確率が三字銘分析
器14に入力される。この確率は、名前データベースの分
析から計算されるが、フィルタ12により除外されなかっ
た各言語群に対する三字銘の度数表から入力として受取
られる。同じことは書記素記号列の各他の三字銘に対し
ても行われる。
器14に入力される。この確率は、名前データベースの分
析から計算されるが、フィルタ12により除外されなかっ
た各言語群に対する三字銘の度数表から入力として受取
られる。同じことは書記素記号列の各他の三字銘に対し
ても行われる。
次の(部分的)マトリックスは姓氏VITALEに対する標
本確率を示す。
本確率を示す。
上記の配列において、Lは言語群であり、nはフィル
タ12により除外されなかった言語群の数である。三字銘
#VIは言語群Liから由来する0.0679の確率、言語群Ljか
ら由来する0.4659の確率、および言語群Lnから由来する
0.2093の確率を備えている。Ljは最高確率として平均し
たものであり、こうして言語群が識別される。
タ12により除外されなかった言語群の数である。三字銘
#VIは言語群Liから由来する0.0679の確率、言語群Ljか
ら由来する0.4659の確率、および言語群Lnから由来する
0.2093の確率を備えている。Ljは最高確率として平均し
たものであり、こうして言語群が識別される。
書記素記号列の各三字銘の確率が三字銘分析器14に同
様に入力される。入力名前の中の各三字銘の確率は各言
語群について平均される。これは特定の言語群に起源を
有する入力名前の確率を表わしている。書記素記号列#V
ITALE#が特定の言語群に属する確率は総合確率の行から
確率のベクトルとして作られる。この確率のベクトルか
ら、標準偏差およびしきい値のような他の項目も計算す
ることができる。これにより一つの三字銘だけが総合確
率に寄与しすぎたり、ゆがめたりすることがないように
なる。
様に入力される。入力名前の中の各三字銘の確率は各言
語群について平均される。これは特定の言語群に起源を
有する入力名前の確率を表わしている。書記素記号列#V
ITALE#が特定の言語群に属する確率は総合確率の行から
確率のベクトルとして作られる。この確率のベクトルか
ら、標準偏差およびしきい値のような他の項目も計算す
ることができる。これにより一つの三字銘だけが総合確
率に寄与しすぎたり、ゆがめたりすることがないように
なる。
例示した実施例は三字銘を分析するが、分析器14は、
2書記素記号列または4書記素記号列のような、異なる
長さの書記素記号列を分析するように構成することがで
きる。
2書記素記号列または4書記素記号列のような、異なる
長さの書記素記号列を分析するように構成することがで
きる。
上記の例では、三字銘分析器14は、言語群Ljが、最高
確率を持っているため、所定の入力名前に対する起源の
最も蓋然的な言語群であることを示す。入力名前に対し
て言語付票となるのはこの最も蓋然的な言語群である。
言語付票および名前は次に文字音響変換部20に送られ、
入力に対する音素を発生する。
確率を持っているため、所定の入力名前に対する起源の
最も蓋然的な言語群であることを示す。入力名前に対し
て言語付票となるのはこの最も蓋然的な言語群である。
言語付票および名前は次に文字音響変換部20に送られ、
入力に対する音素を発生する。
ろ過規則は識別のかいまいさが不可能なように構成さ
れる。すなわち、卓越関係が明確な識別が矛盾するあり
そうもない事象に関する除外規則より優るように適用さ
れるので、言語が両方共に除外されたり明確に識別され
たりすることはない。
れる。すなわち、卓越関係が明確な識別が矛盾するあり
そうもない事象に関する除外規則より優るように適用さ
れるので、言語が両方共に除外されたり明確に識別され
たりすることはない。
同様に、言語群が二つ以上の言語に対して明確に識別
されることはない。ろ過規則は最初の明確な識別が適用
されるように順序正しい集合を構成しているからであ
る。
されることはない。ろ過規則は最初の明確な識別が適用
されるように順序正しい集合を構成しているからであ
る。
システムは二つのしきい値判定基準の一つが満たされ
れば一定の言語群にデフォルトすることができる。
(a)三字銘分析器14により求められた最高確率が所定
のしきい値Tiより低いとき絶対しきい値が発生する。こ
のことは三字銘分析器14が言語群中から妥当な程度の確
信を持って単一言語群を決定することができないことを
意味する。(b)最高確率を持っているとして識別され
た言語群と二番目に高い確率を持っているとして識別さ
れた言語群との間の確率の差が三字銘分析器14によって
求められたしきい値Tjより低いときは相対的しきい値が
発生する。
れば一定の言語群にデフォルトすることができる。
(a)三字銘分析器14により求められた最高確率が所定
のしきい値Tiより低いとき絶対しきい値が発生する。こ
のことは三字銘分析器14が言語群中から妥当な程度の確
信を持って単一言語群を決定することができないことを
意味する。(b)最高確率を持っているとして識別され
た言語群と二番目に高い確率を持っているとして識別さ
れた言語群との間の確率の差が三字銘分析器14によって
求められたしきい値Tjより低いときは相対的しきい値が
発生する。
指定された言語群へのデフォルトは設定可能なパラメ
ータである。たとえば、英語を話す環境において、英語
の発音へのデフォルトは、人間は、信頼性水準を低くし
た場合、入力名前の一般的な英語発音に最も頼るように
思われるから、一般に最も安全な進路である。設定可能
なパラメータとしてのデフォルトの値はデフォルトが一
定の状況、たとえば、電話交換により電話番号が比較的
均質な民族学的近隣地に設置されていることが示された
場合、において変えられるようになっている。
ータである。たとえば、英語を話す環境において、英語
の発音へのデフォルトは、人間は、信頼性水準を低くし
た場合、入力名前の一般的な英語発音に最も頼るように
思われるから、一般に最も安全な進路である。設定可能
なパラメータとしてのデフォルトの値はデフォルトが一
定の状況、たとえば、電話交換により電話番号が比較的
均質な民族学的近隣地に設置されていることが示された
場合、において変えられるようになっている。
前に述べたように、フィルタ12または三字銘分析器14
により送られる名前および言語付票(LTAG)は文字音響
変換規則部20により受取られる。文字音響変換規則部20
は概念的に各言語群に対して別々のブロックに分解され
る。換言すれば、言語群(Li)は、言語群(Li)、言語
群(Lk)などから言語群(Ln)までが持つように、それ
自身の文字音響変換規則集を備えている。
により送られる名前および言語付票(LTAG)は文字音響
変換規則部20により受取られる。文字音響変換規則部20
は概念的に各言語群に対して別々のブロックに分解され
る。換言すれば、言語群(Li)は、言語群(Li)、言語
群(Lk)などから言語群(Ln)までが持つように、それ
自身の文字音響変換規則集を備えている。
入力名前がデフォルト発音を発生しないように充分に
識別されていると仮定すれば、入力名前は入力名前に関
連する言語付票にしたがって適切な言語群の文字音響変
換ブロック22i−nに送られる。
識別されていると仮定すれば、入力名前は入力名前に関
連する言語付票にしたがって適切な言語群の文字音響変
換ブロック22i−nに送られる。
文字音響変換規則部20において、個々の言語群ブロッ
ク22に対する規則は英語を含む他の言語群に対する一層
大きく且つ一層複雑な文字音響変換規則集のサブセット
である。起源の言語群として識別されている特定の言語
群Liに対する文字音響変換ブロック22iは最大の書記素
連鎖を規則に合わせようとする。これは上から下へ、こ
の実施例では右から左へ、ろ過規則に適合する入力名前
中の書記素の記号列を探すフィルタ12とは異なる。特定
の言語群に対する文字音響変換ブロック22i−nは書記
素記号列を左から右へまたは右から左へ走査する。例示
した実施例では右から左への走査を行っている。
ク22に対する規則は英語を含む他の言語群に対する一層
大きく且つ一層複雑な文字音響変換規則集のサブセット
である。起源の言語群として識別されている特定の言語
群Liに対する文字音響変換ブロック22iは最大の書記素
連鎖を規則に合わせようとする。これは上から下へ、こ
の実施例では右から左へ、ろ過規則に適合する入力名前
中の書記素の記号列を探すフィルタ12とは異なる。特定
の言語群に対する文字音響変換ブロック22i−nは書記
素記号列を左から右へまたは右から左へ走査する。例示
した実施例では右から左への走査を行っている。
特定のブロックLiに対する文字音響変換規則の一例を
MANKIEWICZのような名前に対して示すことができる。こ
の入力名前は、最高の確率を有するスラブ系言語群から
由来するものとして識別され、それ故スラブ文字音響変
換規則ブロック22iに送られる。このブロック22iで、書
記素記号列−WICZは記号列の正しい分節音素を発生する
発音規則を備えている。しかし、書記素記号列−KIEWIC
Zはまたスラブ規則集にも規則を備えている。これは一
層長い書記素列であるから、この規則が先に適用され
る。言語特有発音規則に対応しない残りの書記素に対す
る分節音素は一般発音ブロックから決定される。この例
では、書記素M、A、およびNに対する分節音素は一般
発音規則にしたがって(別々に)決定される。文字音響
変換ブロック22iは言語敏感書記素記号列および言語不
敏感書記素記号列の双方の鎖状連結音素と共に発音用音
声具現ユニット50に送る。
MANKIEWICZのような名前に対して示すことができる。こ
の入力名前は、最高の確率を有するスラブ系言語群から
由来するものとして識別され、それ故スラブ文字音響変
換規則ブロック22iに送られる。このブロック22iで、書
記素記号列−WICZは記号列の正しい分節音素を発生する
発音規則を備えている。しかし、書記素記号列−KIEWIC
Zはまたスラブ規則集にも規則を備えている。これは一
層長い書記素列であるから、この規則が先に適用され
る。言語特有発音規則に対応しない残りの書記素に対す
る分節音素は一般発音ブロックから決定される。この例
では、書記素M、A、およびNに対する分節音素は一般
発音規則にしたがって(別々に)決定される。文字音響
変換ブロック22iは言語敏感書記素記号列および言語不
敏感書記素記号列の双方の鎖状連結音素と共に発音用音
声具現ユニット50に送る。
フィルタ12は文字音響変換規則20にある言語特有の一
層大きな記号列のすべてを備えているわけではない。一
層大きな記号列は、たとえば、記号列−WICZは入力名前
をスラブ起源として明確に識別するので、必らずしもす
べてが必要ではない。それで、−WICZは−KIEWICZのサ
ブセットであり、したがって入力名前が識別されるか
ら、記号列−KIEWICZのろ過規則の必要はない。
層大きな記号列のすべてを備えているわけではない。一
層大きな記号列は、たとえば、記号列−WICZは入力名前
をスラブ起源として明確に識別するので、必らずしもす
べてが必要ではない。それで、−WICZは−KIEWICZのサ
ブセットであり、したがって入力名前が識別されるか
ら、記号列−KIEWICZのろ過規則の必要はない。
文字音響変換モジュールは名前に対する音素を主とし
て分節音素情報の形で出力する。文字音響変換規則ブロ
ック22i−nの出力は強勢部24i−nの入力として働く。
これら強勢部24i−nはLTAGを個々の文字音響変換規則
ブロック22i−nにより作られた音素と共に取り、分節
音素(文字音響変換規則ブロック22i−nからの)およ
びその言語に対する正しい強勢パターンを共に備えた完
全な音素記号列を出力する。たとえば、名前VITALEに対
して識別された言語がイタリア語であり、文字音響変換
規則ブロック22が音素記号列[vitali]を発生したとす
れば、強勢部24iは最終音節記号列が[vitali]になる
ように末尾から2番目の音節にアクセントを置くことに
なる。
て分節音素情報の形で出力する。文字音響変換規則ブロ
ック22i−nの出力は強勢部24i−nの入力として働く。
これら強勢部24i−nはLTAGを個々の文字音響変換規則
ブロック22i−nにより作られた音素と共に取り、分節
音素(文字音響変換規則ブロック22i−nからの)およ
びその言語に対する正しい強勢パターンを共に備えた完
全な音素記号列を出力する。たとえば、名前VITALEに対
して識別された言語がイタリア語であり、文字音響変換
規則ブロック22が音素記号列[vitali]を発生したとす
れば、強勢部24iは最終音節記号列が[vitali]になる
ように末尾から2番目の音節にアクセントを置くことに
なる。
文字音響変換部20のフィルタ12、および強勢部24i−
nに使用する実際の規則は言語学に関する当業者に既知
であるかまたは容易に得られる規則であることに注目す
べきである。
nに使用する実際の規則は言語学に関する当業者に既知
であるかまたは容易に得られる規則であることに注目す
べきである。
上述のシステムは音声具現ユニット50に対するフロン
トエント・プロセッサと見ることができる。音声具現ユ
ニット50は人間の談話を書記素または音素の入力から発
生する市場入手可能なユニットとすることができる。合
成器は音素基準式または音響の或る他のユニット、たと
えばダイフォーンまたは半音節に基くものとすることが
できる。合成器は英語以外の言語を合成することもでき
る。
トエント・プロセッサと見ることができる。音声具現ユ
ニット50は人間の談話を書記素または音素の入力から発
生する市場入手可能なユニットとすることができる。合
成器は音素基準式または音響の或る他のユニット、たと
えばダイフォーンまたは半音節に基くものとすることが
できる。合成器は英語以外の言語を合成することもでき
る。
第2図はシステムの一部としての言語群識別音声具現
ブロック60を示す。言語群識別音声具現ブロック60は、
第1図に示す機能ブロックから構成されている。図示の
とおり、言語識別音声具現ブロック60への入力は名前、
ろ過規則、および三字銘確率である。出力は名前、言語
付票、および音素であり、これらは音声具現ユニット50
に送られる。音素とはこの文脈ではダイフォーンおよび
半音節を含む音響信号のすべてのアルファベットを意味
することに注目すべきである。
ブロック60を示す。言語群識別音声具現ブロック60は、
第1図に示す機能ブロックから構成されている。図示の
とおり、言語識別音声具現ブロック60への入力は名前、
ろ過規則、および三字銘確率である。出力は名前、言語
付票、および音素であり、これらは音声具現ユニット50
に送られる。音素とはこの文脈ではダイフォーンおよび
半音節を含む音響信号のすべてのアルファベットを意味
することに注目すべきである。
第2図によるシステムは書記素記号列を特定の言語群
に属するとして標示する。確率表を特定のデータベース
に対して洗練するために新しいデータベースを予備ろ過
するのに言語識別子を使用する。分析ブロック62は入力
として名前および言語付票および言語統計を言語識別音
声具現ブロック60から受取る。分析ブロックはこの情報
を取り、名前および言語付票をマスター言語ファイル64
に出力し、規則をろ過規則記憶装置68に対して発生す
る。このようにして、システムのデータベースが新しい
入力名前が処理されるにつれて拡張されるので将来の入
力名前が一層容易に処理されることになる。ろ過規則記
憶装置68はろ過規則をフィルタ12および言語識別音声具
現ブロック60に供給する。
に属するとして標示する。確率表を特定のデータベース
に対して洗練するために新しいデータベースを予備ろ過
するのに言語識別子を使用する。分析ブロック62は入力
として名前および言語付票および言語統計を言語識別音
声具現ブロック60から受取る。分析ブロックはこの情報
を取り、名前および言語付票をマスター言語ファイル64
に出力し、規則をろ過規則記憶装置68に対して発生す
る。このようにして、システムのデータベースが新しい
入力名前が処理されるにつれて拡張されるので将来の入
力名前が一層容易に処理されることになる。ろ過規則記
憶装置68はろ過規則をフィルタ12および言語識別音声具
現ブロック60に供給する。
マスター・ファイルはすべての書記素記号列およびそ
の言語群付票を備えている。このブロック64は分析ブロ
ック62により作られる。三字銘確率は所定の入力三字銘
の探索を容易にするために設計されたデータ構造66で配
列される。たとえば、例示した実施例は深さnの三次元
マトリックスを使用している。ただしnは言語群の数で
ある。
の言語群付票を備えている。このブロック64は分析ブロ
ック62により作られる。三字銘確率は所定の入力三字銘
の探索を容易にするために設計されたデータ構造66で配
列される。たとえば、例示した実施例は深さnの三次元
マトリックスを使用している。ただしnは言語群の数で
ある。
三字銘確率表は下記アルゴリズムを使用してマスター
・ファイルから計算される。
・ファイルから計算される。
すべての言語群L(1−N)に対する各三字銘の発生
の総数を計算する。
の総数を計算する。
Lの中のすべての書記素記号列Sについて Sの中のすべての三字銘Tについて (カウント[T][L]=0)ならば ユニーク[L]+=1 カウント[T][L]+=1 マスター内のすべての可能な三字銘Tについて 和=0 すべての言語群Lについて 和+=カウント[T][L]/ユニーク[L] すべての言語群Lについて 和>0ならば、確率[T][L] =カウント[T][L]/ユニーク[L]/和 その他の場合、確率[T][L]=0.0; 先に述べた三字銘度数表を三字銘、言語群、および度
数の三次元配列と考えることができる。度数とは名前の
大きな標本に基くそれぞれの言語群に対する三字銘連鎖
の発生の百分率を意味する。特定の言語群の構成員であ
る三字銘の確率は多数の方法で求めることができる。こ
の実施例においては、特定の言語群の構成員である三字
銘の確率は、下に示す公式にしたがって、周知のバイエ
の定理から求められる。
数の三次元配列と考えることができる。度数とは名前の
大きな標本に基くそれぞれの言語群に対する三字銘連鎖
の発生の百分率を意味する。特定の言語群の構成員であ
る三字銘の確率は多数の方法で求めることができる。こ
の実施例においては、特定の言語群の構成員である三字
銘の確率は、下に示す公式にしたがって、周知のバイエ
の定理から求められる。
バイエの規則はBjが所定のAを発生する確率P(Bj/
A)は であることを述べている。
A)は であることを述べている。
問題に更に特定すれば、言語群に三字銘Tが与えられ
る確率はP(Li/T)である。ここで 更に解析して ただし X=言語群Liに発生するトークンTの回数 Y=言語群Liに一義的に発生するトークンの回数 ただし N=言語群の数(重複しない) 故に これにより最終表は、三字銘の書記素に一つづつ、お
よび言語群に対して一つ、の四次元を有する。
る確率はP(Li/T)である。ここで 更に解析して ただし X=言語群Liに発生するトークンTの回数 Y=言語群Liに一義的に発生するトークンの回数 ただし N=言語群の数(重複しない) 故に これにより最終表は、三字銘の書記素に一つづつ、お
よび言語群に対して一つ、の四次元を有する。
ブロック66により計算された三字銘の確率は言語識別
音声具現ブロック60に、特に書記素記号列が特定の言語
群に属している確率のベクトルを発生する三字銘分析器
14に送られる。
音声具現ブロック60に、特に書記素記号列が特定の言語
群に属している確率のベクトルを発生する三字銘分析器
14に送られる。
(発明の効果) 上述のシステムを使用すれば、名前を一層正確に発音
することができる。姓氏を一層正確に発音するために姓
氏と関連して洗礼名を使用することのようななお一層の
発展が期待される。これには現存する知識ベースおよび
規則の組合せを拡張することが必要である。
することができる。姓氏を一層正確に発音するために姓
氏と関連して洗礼名を使用することのようななお一層の
発展が期待される。これには現存する知識ベースおよび
規則の組合せを拡張することが必要である。
第1図は言語識別音声具現モジュールの論理ブロック図
を示す。 第2図は本発明にしたがって構成された、第1図の言語
群識別音声具現モジュールを備えている、名前分析シス
テムの論理ブロック図を示す。 10……辞書。12……フィルタ。14……三字銘分析器。20
……文字音響変換規則部。50……音声具現ユニット。60
……言語識別音声具現ブロック。64……マスター言語フ
ァイル。
を示す。 第2図は本発明にしたがって構成された、第1図の言語
群識別音声具現モジュールを備えている、名前分析シス
テムの論理ブロック図を示す。 10……辞書。12……フィルタ。14……三字銘分析器。20
……文字音響変換規則部。50……音声具現ユニット。60
……言語識別音声具現ブロック。64……マスター言語フ
ァイル。
フロントページの続き (72)発明者 デェイヴィド・ゲラルド・コンロイ アメリカ合衆国・マサチューセッツ州・ 01754・メイナード・コンコード スト リート・78番地
Claims (7)
- 【請求項1】言語合成器に用いるための入力語の起源の
言語群の判定方法であって、複数の言語群のいずれか
が、入力された入力語の起源の言語群と一致するか、あ
るいは当該一致判定から除外されるべきかを、プログラ
ム可能なコンピュータを用いて決定する方法において、 (a)上記プログラム可能なコンピュータのメモリ手段
に保存された1組のろ過規則を、上記入力語の書記素の
所定の複数の亜記号列に適用して、 上記亜記号列の1つと1つの言語群の複数のろ過規則の
1つとの間に、上記入力語が上記1つの言語群の一部で
あると明らかに認定できる一致があるか、あるいは、上
記入力語の書記素の上記所定の複数の亜記号列のいずれ
かと、上記複数の言語群のある言語群のろ過規則との間
に一致がないかを判定し、一致がない場合は、上記ある
言語群を上記入力語の起源の言語群判定から除外するス
テップと(ここで、上記複数の言語群の各言語群のろ過
規則はG個の書記素を含んでおり、Gは1より大きく、
上記入力語の書記素の数以下である)、 (b)上記一致がある場合は、上記入力語の起源の言語
群を代表する言語付票を生成し、上記一致がない場合
は、上記ろ過規則に基づき上記入力語の起源の言語群と
して可能性がある言語群のリストを作成するステップと
からなる入力語の起源の言語群の判定方法。 - 【請求項2】入力語の起源の言語群にしたがって所定の
語に対する正しい音素を発生する方法であって、 各々がその語に対する語および音素を含んでいる,辞書
のエントリを探す段階、辞書を探して前記入力語に対応
するエントリが明らかになったとき前記エントリを発音
用音声具現ユニットに送る段階、 前記入力語が前記辞書内に対応するエントリを備えてい
ないとき前記入力語をフィルタに送る段階、 前記フィルタにより前記入力語に対する起源の言語群を
識別するように、または前記入力語に対する起源の少く
とも一つの言語群を除外するようにろ過する段階、 前記フィルタが前記入力語に対する起源の言語群を明確
に識別したとき、前記入力語、および前記入力語に対す
る起源の言語群を示す言語付票を、前記フィルタから文
字音響変換規則を備えている文字音響交換モジュールに
送る段階、 前記入力語に対する起源の言語群が前記フィルタにより
明確に識別されないとき前記フィルタから前記入力語お
よび除外されない言語群を書記素分析器に送る段階、 前記入力語中の書記素を分析することにより前記入力語
に対する起源の最も蓋然的な言語群を発生する段階、 前記入力語および起源の前記最も蓋然的な言語群を前記
最も蓋然的な言語群に対応する前記文字音響変換規則の
サブセットに送る段階、 前記文字音響変換規則のサブセット内に前記入力語に対
する分節音素を発生する段階、 前記分節音素および前記言語付票を前記文字音響変換モ
ジュールから強勢割当て部に送る段階、 前記入力語に対する強制割当て情報を前記強勢割当て部
内に作る段階、および前記分節音素および前記強勢割当
て情報を音声具現ユニットに送る段階、 から成る前記方法。 - 【請求項3】前記書記素が三字銘である請求項2に記載
の方法。 - 【請求項4】起源の最も蓋然的な言語群を発生する前記
段階がバイエスの規則を使用して特定の言語群から入力
語群に対する書記素の確率を計算する段階を含んでいる
請求項2に記載の方法。 - 【請求項5】更に、起源の最も蓋然的な言語群を発生す
る段階が、所定のしきい値より低い確率を有する起源の
最も蓋然的な言語群を発生するとき、一般的発音にデフ
ォルトする段階、 を含む請求項2に記載の方法。 - 【請求項6】更に、起源の最も蓋然的な言語群を発生す
る段階が、起源の二番目に最も蓋然的な言語群の確率よ
り所定量だけ大きくない確率を有する起源の最も蓋然的
な言語群を発生するとき、一般的発音にデフォルトする
段階を含む、請求項2に記載の方法。 - 【請求項7】言語群を所定の語に対する起源の言語群と
して明確に識別し、または除外する装置であって、 一組のろ過規則、すなわち該ろ過規則の第1のサブセッ
トが言語群を明確に識別し、該ろ過規則の第2のサブセ
ットが言語群を除外するもの、を格納するろ過規則記憶
装置、 入力語の書記素の亜記号列を、該亜記号列の一つがろ過
規則の前記第1のサブセットの一つと合致して言語群を
識別するまで、または前記亜記号列の一つがろ過規則の
前記第2のサブセットの一つと合致して言語群が前記入
力語に対する起源の言語群として考察から除外されるこ
とを示すとき言語群を除外するまで、ろ過規則の前記第
1および第2のサブセットと比較する比較器、および 起源の言語群として言語群が明確に識別されないとき起
源の可能な言語群のリストを作り、起源の前記言語群が
明確に識別されるとき起源の前記言語群を表示する出
力、 から成る前記装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US27558188A | 1988-11-23 | 1988-11-23 | |
US275,581 | 1988-11-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02224000A JPH02224000A (ja) | 1990-09-06 |
JP2571857B2 true JP2571857B2 (ja) | 1997-01-16 |
Family
ID=23052951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1300967A Expired - Lifetime JP2571857B2 (ja) | 1988-11-23 | 1989-11-21 | 入力語の起源の言語群の判定方法及び合成器による音素の発生方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5040218A (ja) |
EP (1) | EP0372734B1 (ja) |
JP (1) | JP2571857B2 (ja) |
AT (1) | ATE102731T1 (ja) |
AU (1) | AU610766B2 (ja) |
CA (1) | CA2003565A1 (ja) |
DE (1) | DE68913669T2 (ja) |
NZ (1) | NZ231483A (ja) |
Families Citing this family (204)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR950008022B1 (ko) * | 1991-06-19 | 1995-07-24 | 가부시끼가이샤 히다찌세이사꾸쇼 | 문자처리방법 및 장치와 문자입력방법 및 장치 |
US5212730A (en) * | 1991-07-01 | 1993-05-18 | Texas Instruments Incorporated | Voice recognition of proper names using text-derived recognition models |
US5613038A (en) * | 1992-12-18 | 1997-03-18 | International Business Machines Corporation | Communications system for multiple individually addressed messages |
CA2119397C (en) * | 1993-03-19 | 2007-10-02 | Kim E.A. Silverman | Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation |
US5651095A (en) * | 1993-10-04 | 1997-07-22 | British Telecommunications Public Limited Company | Speech synthesis using word parser with knowledge base having dictionary of morphemes with binding properties and combining rules to identify input word class |
US5787231A (en) * | 1995-02-02 | 1998-07-28 | International Business Machines Corporation | Method and system for improving pronunciation in a voice control system |
US5761640A (en) * | 1995-12-18 | 1998-06-02 | Nynex Science & Technology, Inc. | Name and address processor |
US5884262A (en) * | 1996-03-28 | 1999-03-16 | Bell Atlantic Network Services, Inc. | Computer network audio access and conversion system |
US5832433A (en) * | 1996-06-24 | 1998-11-03 | Nynex Science And Technology, Inc. | Speech synthesis method for operator assistance telecommunications calls comprising a plurality of text-to-speech (TTS) devices |
US6134528A (en) * | 1997-06-13 | 2000-10-17 | Motorola, Inc. | Method device and article of manufacture for neural-network based generation of postlexical pronunciations from lexical pronunciations |
US5930754A (en) * | 1997-06-13 | 1999-07-27 | Motorola, Inc. | Method, device and article of manufacture for neural-network based orthography-phonetics transformation |
US6415250B1 (en) * | 1997-06-18 | 2002-07-02 | Novell, Inc. | System and method for identifying language using morphologically-based techniques |
CA2242065C (en) | 1997-07-03 | 2004-12-14 | Henry C.A. Hyde-Thomson | Unified messaging system with automatic language identification for text-to-speech conversion |
US6108627A (en) * | 1997-10-31 | 2000-08-22 | Nortel Networks Corporation | Automatic transcription tool |
US6269188B1 (en) * | 1998-03-12 | 2001-07-31 | Canon Kabushiki Kaisha | Word grouping accuracy value generation |
US8812300B2 (en) | 1998-03-25 | 2014-08-19 | International Business Machines Corporation | Identifying related names |
US8855998B2 (en) | 1998-03-25 | 2014-10-07 | International Business Machines Corporation | Parsing culturally diverse names |
US6963871B1 (en) * | 1998-03-25 | 2005-11-08 | Language Analysis Systems, Inc. | System and method for adaptive multi-cultural searching and matching of personal names |
US6411932B1 (en) * | 1998-06-12 | 2002-06-25 | Texas Instruments Incorporated | Rule-based learning of word pronunciations from training corpora |
US7099876B1 (en) | 1998-12-15 | 2006-08-29 | International Business Machines Corporation | Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class |
US6389386B1 (en) | 1998-12-15 | 2002-05-14 | International Business Machines Corporation | Method, system and computer program product for sorting text strings |
US6460015B1 (en) | 1998-12-15 | 2002-10-01 | International Business Machines Corporation | Method, system and computer program product for automatic character transliteration in a text string object |
US6496844B1 (en) | 1998-12-15 | 2002-12-17 | International Business Machines Corporation | Method, system and computer program product for providing a user interface with alternative display language choices |
US6411948B1 (en) | 1998-12-15 | 2002-06-25 | International Business Machines Corporation | Method, system and computer program product for automatically capturing language translation and sorting information in a text class |
US6185524B1 (en) * | 1998-12-31 | 2001-02-06 | Lernout & Hauspie Speech Products N.V. | Method and apparatus for automatic identification of word boundaries in continuous text and computation of word boundary scores |
US7292980B1 (en) * | 1999-04-30 | 2007-11-06 | Lucent Technologies Inc. | Graphical user interface and method for modifying pronunciations in text-to-speech and speech recognition systems |
DE19942178C1 (de) * | 1999-09-03 | 2001-01-25 | Siemens Ag | Verfahren zum Aufbereiten einer Datenbank für die automatische Sprachverarbeitung |
DE19963812A1 (de) | 1999-12-30 | 2001-07-05 | Nokia Mobile Phones Ltd | Verfahren zum Erkennen einer Sprache und zum Steuern einer Sprachsyntheseeinheit sowie Kommunikationsvorrichtung |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US6272464B1 (en) * | 2000-03-27 | 2001-08-07 | Lucent Technologies Inc. | Method and apparatus for assembling a prediction list of name pronunciation variations for use during speech recognition |
US6519557B1 (en) | 2000-06-06 | 2003-02-11 | International Business Machines Corporation | Software and method for recognizing similarity of documents written in different languages based on a quantitative measure of similarity |
JP4734715B2 (ja) * | 2000-12-26 | 2011-07-27 | パナソニック株式会社 | 電話装置及びコードレス電話装置 |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
US20040034532A1 (en) * | 2002-08-16 | 2004-02-19 | Sugata Mukhopadhyay | Filter architecture for rapid enablement of voice access to data repositories |
US7353164B1 (en) | 2002-09-13 | 2008-04-01 | Apple Inc. | Representation of orthography in a continuous vector space |
US7047193B1 (en) * | 2002-09-13 | 2006-05-16 | Apple Computer, Inc. | Unsupervised data-driven pronunciation modeling |
US8285537B2 (en) * | 2003-01-31 | 2012-10-09 | Comverse, Inc. | Recognition of proper nouns using native-language pronunciation |
TWI233589B (en) * | 2004-03-05 | 2005-06-01 | Ind Tech Res Inst | Method for text-to-pronunciation conversion capable of increasing the accuracy by re-scoring graphemes likely to be tagged erroneously |
US20070005586A1 (en) * | 2004-03-30 | 2007-01-04 | Shaefer Leonard A Jr | Parsing culturally diverse names |
US20050267757A1 (en) * | 2004-05-27 | 2005-12-01 | Nokia Corporation | Handling of acronyms and digits in a speech recognition and text-to-speech engine |
EP1693830B1 (en) * | 2005-02-21 | 2017-12-20 | Harman Becker Automotive Systems GmbH | Voice-controlled data system |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
KR101063607B1 (ko) * | 2005-10-14 | 2011-09-07 | 주식회사 현대오토넷 | 음성인식을 이용한 명칭 검색 기능을 가지는 네비게이션시스템 및 그 방법 |
US20070127652A1 (en) * | 2005-12-01 | 2007-06-07 | Divine Abha S | Method and system for processing calls |
US20070150279A1 (en) * | 2005-12-27 | 2007-06-28 | Oracle International Corporation | Word matching with context sensitive character to sound correlating |
US20070206747A1 (en) * | 2006-03-01 | 2007-09-06 | Carol Gruchala | System and method for performing call screening |
US20070233490A1 (en) * | 2006-04-03 | 2007-10-04 | Texas Instruments, Incorporated | System and method for text-to-phoneme mapping with prior knowledge |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8719027B2 (en) * | 2007-02-28 | 2014-05-06 | Microsoft Corporation | Name synthesis |
US7873621B1 (en) * | 2007-03-30 | 2011-01-18 | Google Inc. | Embedding advertisements based on names |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
DE112011100329T5 (de) | 2010-01-25 | 2012-10-31 | Andrew Peter Nelson Jerram | Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8688435B2 (en) | 2010-09-22 | 2014-04-01 | Voice On The Go Inc. | Systems and methods for normalizing input media |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10672399B2 (en) | 2011-06-03 | 2020-06-02 | Apple Inc. | Switching between text data and audio data based on a mapping |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US8812295B1 (en) | 2011-07-26 | 2014-08-19 | Google Inc. | Techniques for performing language detection and translation for multi-language content feeds |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
DE102011118059A1 (de) | 2011-11-09 | 2013-05-16 | Elektrobit Automotive Gmbh | Technik zur Ausgabe eines akustischen Signals mittels eines Navigationssystems |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) * | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
CN103065630B (zh) * | 2012-12-28 | 2015-01-07 | 科大讯飞股份有限公司 | 用户个性化信息语音识别方法及系统 |
CN104969289B (zh) | 2013-02-07 | 2021-05-28 | 苹果公司 | 数字助理的语音触发器 |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
KR102057795B1 (ko) | 2013-03-15 | 2019-12-19 | 애플 인크. | 콘텍스트-민감성 방해 처리 |
EP2973002B1 (en) | 2013-03-15 | 2019-06-26 | Apple Inc. | User training by intelligent digital assistant |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
KR101759009B1 (ko) | 2013-03-15 | 2017-07-17 | 애플 인크. | 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것 |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101959188B1 (ko) | 2013-06-09 | 2019-07-02 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
WO2014200731A1 (en) | 2013-06-13 | 2014-12-18 | Apple Inc. | System and method for emergency calls initiated by voice command |
KR101749009B1 (ko) | 2013-08-06 | 2017-06-19 | 애플 인크. | 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화 |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9747891B1 (en) | 2016-05-18 | 2017-08-29 | International Business Machines Corporation | Name pronunciation recommendation |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
CN106920547B (zh) * | 2017-02-21 | 2021-11-02 | 腾讯科技(上海)有限公司 | 语音转换方法和装置 |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
WO2019183543A1 (en) * | 2018-03-23 | 2019-09-26 | John Rankin | System and method for identifying a speaker's community of origin from a sound sample |
WO2020014354A1 (en) | 2018-07-10 | 2020-01-16 | John Rankin | System and method for indexing sound fragments containing speech |
US11699037B2 (en) | 2020-03-09 | 2023-07-11 | Rankin Labs, Llc | Systems and methods for morpheme reflective engagement response for revision and transmission of a recording to a target individual |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3704345A (en) * | 1971-03-19 | 1972-11-28 | Bell Telephone Labor Inc | Conversion of printed text into synthetic speech |
BG24190A1 (en) * | 1976-09-08 | 1978-01-10 | Antonov | Method of synthesis of speech and device for effecting same |
US4337375A (en) * | 1980-06-12 | 1982-06-29 | Texas Instruments Incorporated | Manually controllable data reading apparatus for speech synthesizers |
NL8200726A (nl) * | 1982-02-24 | 1983-09-16 | Philips Nv | Inrichting voor het genereren van de auditieve informatie van een verzameling karakters. |
US4692941A (en) * | 1984-04-10 | 1987-09-08 | First Byte | Real-time text-to-speech conversion system |
JPH083718B2 (ja) * | 1986-08-20 | 1996-01-17 | 日本電信電話株式会社 | 音声出力装置 |
JPH0827635B2 (ja) * | 1986-09-17 | 1996-03-21 | 富士通株式会社 | 文―音声変換装置に用いる複合語処理装置 |
JPH077335B2 (ja) * | 1986-12-20 | 1995-01-30 | 富士通株式会社 | 会話型文章読み上げ装置 |
JP2702919B2 (ja) * | 1987-03-13 | 1998-01-26 | 富士通株式会社 | 文−音声変換装置 |
-
1989
- 1989-11-15 AT AT89311830T patent/ATE102731T1/de not_active IP Right Cessation
- 1989-11-15 EP EP89311830A patent/EP0372734B1/en not_active Expired - Lifetime
- 1989-11-15 DE DE68913669T patent/DE68913669T2/de not_active Expired - Fee Related
- 1989-11-21 JP JP1300967A patent/JP2571857B2/ja not_active Expired - Lifetime
- 1989-11-22 CA CA002003565A patent/CA2003565A1/en not_active Abandoned
- 1989-11-22 NZ NZ231483A patent/NZ231483A/en unknown
- 1989-11-22 AU AU45414/89A patent/AU610766B2/en not_active Ceased
-
1990
- 1990-07-06 US US07/551,045 patent/US5040218A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US5040218A (en) | 1991-08-13 |
EP0372734B1 (en) | 1994-03-09 |
DE68913669D1 (de) | 1994-04-14 |
AU4541489A (en) | 1990-05-31 |
JPH02224000A (ja) | 1990-09-06 |
CA2003565A1 (en) | 1990-05-23 |
EP0372734A1 (en) | 1990-06-13 |
ATE102731T1 (de) | 1994-03-15 |
AU610766B2 (en) | 1991-05-23 |
NZ231483A (en) | 1995-07-26 |
DE68913669T2 (de) | 1994-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2571857B2 (ja) | 入力語の起源の言語群の判定方法及び合成器による音素の発生方法 | |
US6243680B1 (en) | Method and apparatus for obtaining a transcription of phrases through text and spoken utterances | |
Zissman et al. | Automatic language identification | |
US5949961A (en) | Word syllabification in speech synthesis system | |
US6684187B1 (en) | Method and system for preselection of suitable units for concatenative speech | |
JP3481497B2 (ja) | 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置 | |
EP2595143B1 (en) | Text to speech synthesis for texts with foreign language inclusions | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
US8868431B2 (en) | Recognition dictionary creation device and voice recognition device | |
US20020052742A1 (en) | Method and apparatus for generating and displaying N-best alternatives in a speech recognition system | |
Klatt et al. | On the automatic recognition of continuous speech: Implications from a spectrogram-reading experiment | |
KR19990008459A (ko) | 개선된 신뢰도의 단어 인식방법 및 단어 인식기 | |
US7406408B1 (en) | Method of recognizing phones in speech of any language | |
US6963834B2 (en) | Method of speech recognition using empirically determined word candidates | |
Patel et al. | Development of Large Vocabulary Speech Recognition System with Keyword Search for Manipuri. | |
Szarvas et al. | Automatic recognition of Hungarian: Theory and practice | |
US6408271B1 (en) | Method and apparatus for generating phrasal transcriptions | |
US7430503B1 (en) | Method of combining corpora to achieve consistency in phonetic labeling | |
JPH06282290A (ja) | 自然言語処理装置およびその方法 | |
Akinwonmi | Development of a prosodic read speech syllabic corpus of the Yoruba language | |
Müller | Probabilistic context-free grammars for syllabification and grapheme-to-phoneme conversion | |
Huerta et al. | The development of the 1997 CMU Spanish broadcast news transcription system | |
EP3051437A1 (en) | Method for query processing for search in multilingual audio-archive and device for search of that processed query | |
US20060206301A1 (en) | Determining the reading of a kanji word | |
GB2292235A (en) | Word syllabification. |