JP2848458B2 - 言語翻訳システム - Google Patents
言語翻訳システムInfo
- Publication number
- JP2848458B2 JP2848458B2 JP62505852A JP50585287A JP2848458B2 JP 2848458 B2 JP2848458 B2 JP 2848458B2 JP 62505852 A JP62505852 A JP 62505852A JP 50585287 A JP50585287 A JP 50585287A JP 2848458 B2 JP2848458 B2 JP 2848458B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- language
- phrases
- input
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/04—Electrically-operated educational appliances with audible presentation of the material to be studied
Description
【発明の詳細な説明】
本発明は句を第1言語から第2言語に翻訳するシステ
ムに関するがより詳細には第1言語の音声から第2言語
の音声を生成するシステムに限定されない。 長い間、言語、特に音声を素早く自動的に翻訳する機
械が望まれていた。しかしながら計算能力、音声認識お
よび音声合成の最近の大きな進歩にもかかわらず、その
ような機械の出現は夢あるいはフィクションに過ぎな
い。 テキストの自動翻訳に関する多くの研究がなされた。
2、3のかなり制限された応用(例えば、天気予報の翻
訳)は別として、自動的に正確な翻訳を行い人間の通訳
者にとってかわる製品は皆無である。音声翻訳における
問題は、音声認識、イントネーションの付加情報、アク
セントなどのエラーや、音声自身の不正確さによって倍
加される。 不幸なことに、現在のテキスト言語翻訳パッケージは
多かれすくなかれ不完全であり、音声から音声への翻訳
システムの要件を満たしていない。多くのパッケージは
プロフェッショナルな翻訳者のための助けとして設計さ
れており、生成された出力は目標の言語に直される前に
プレエディットされねばならない。多くのパッケージは
メニュー駆動された相互作用式であり、時間のかかるバ
ッチ処理モードで動作するのでリアルタイムの音声動作
には不適当である。さらに、翻訳パッケージはインディ
オムや他の例外に対して誤りの多い出力を容易に発生す
るので信頼性がない。出力が正しく翻訳されたという保
証もない。また、現在のシステムは、CPUに対して集中
性を有するので実行するのに高価なものとなり、コスト
に敏感な応用に対しては不適当である。 本発明は、これらの欠如および欠点を緩和する翻訳シ
ステムを提供することを求めるものである。 本発明は、句を第1言語から第2言語に翻訳するシス
テムであり、第2言語の句の集合を保持する記憶装置
と、第1言語の句を受ける入力手段と、前記句の集合か
らの1つを含む句を第2言語で出力する出力手段と、前
記句の集合のどれが前記入力句に相応するかを決定する
特徴づけ手段と、出力手段を制御して前記入力句に相応
する前記集合からの句の出力を保証すべく前記特徴づけ
手段に応答する手段とを具備する。 そのようなシステムは大変素早い翻訳を提供し、所要
時間は、入力句を識別/特徴づけし、第2言語の答えを
調べる時間である。 さらに、本システムは、彼女/彼がシステムによって
正確に認識/理解されたという確認を使用者に提供すべ
く実行され、このことは特に音声翻訳システムにおいて
重要である。 メッセージが正しく特徴づけされたことが使用者によ
って確認されれば、記憶された句の集合は予め生成され
た正確な翻訳のみからなるので翻訳の正確さは保証され
る。 また、本システムはいくつかの第2言語に同時に素早
く翻訳することが可能であり、その場合必要となるのは
付加的なそれぞれの第2言語の句の集合を保持する付加
的記憶装置のみである。 添附の図面を参照にして本発明の実施例が説明され
る。 第1図は、本発明のシステムの主要素を示すブロック
ダイヤグラムである。 本発明は、かなり少数のキーワードによって多数の別
個な句の意味上の要旨を特徴づけてとらえることが可能
であるという認識を基礎にしている。キーワードを適当
に選択することによって、現在の市場で入手可能な音声
認識装置を使用することが可能であるが、多くの組の句
を特徴づけかつ識別すべく有効な多くの組の句に含まれ
る単語よりもかなり少数の単語を認識できるのみであ
る。 したがって、翻訳システムの能力は句と句を正しく認
識するキーワードの能力に依存する。句の分離が大きい
ほどシステムの認識エラーに対する許容度が大きくな
り、かつ話者自身によって引起こされた不一致に対する
許容度も大きくなる。 キーワードの選択 適当な探索手順は次の通りである。 1. 句に含まれる単語の発生回数に従って、特定のN個
の句に含まれるK個の単語のそれぞれを指定する。 2. 最も発生頻度の高いM個の単語を初期キーワードリ
ストとして選択する。(Mは音声認識装置の語いに含ま
れる単語の数である。 3. それぞれの句に各キーワードがあるかないかを決定
する。キーワードによって識別されない句の数(E)が
計数される。 4. i=1とする。 5. キーワードがリストから一時的に削除され、Eの新
しい値(E′)が計算される。 6. 得点E′−Eが一時的に削除されたキーワードに割
当てられる。これはキーワードの更新の後の能力の悪化
の目安となり、さらには全体能力に与える影響の目安と
なる。結果的に、この目安は、各キーワードが他の機能
を単に反復せずに出来るだけ多くの組の句の分離に寄与
することを保証するのに使用される。 7. 一時的に削除されたキーワードが交換され、M個の
キーワードのそれぞれに対してプロセスが反復される。 8. 最低の得点値の単語が現在のキーワードリストから
除去される。 9. M+i番目の最も頻度の高い単語が除去された単語
を交換するのに使用され、新しいEが計算される。 10. もし、新しいEが前のEに対して改善された能力
を示した場合はiが増加され、M+i>Kでない限りプ
ロセスがステップ5から反復され、M+i>Kのときプ
ロセスが停止する。他方、M+i番目の単語が拒絶され
る。iが増加され、M+i>Kでない限りプロセスをス
テップ9から反復し、M+i>Kのときステップ8で最
後に除去された単語が交換されてプロセスが停止する。 最後のキーワードリストは、M個の単一なキーワード
の最適な組を含み、句の識別に最適である。 最良のM個の単語からさらに反復すれば句の分離がさ
らに改善される。特に、priori言語学上の情報が利用可
能な時は回数指定以外のヒューリスティックスがステッ
プ1の一連の候補単語を提供すべく使用される。また、
発生リストの底部に向かうに従って単語は句の分離の助
けとならず、したがって、発生リストの例えば上方3分
の1または上方2分の1より多くを探索する価値はな
い。 時々、多くの句が識別され、探索のかなり始めにおい
てEが零にかなり近くなる場合がある。このような場合
は、1つ以上のキーワードが異なるときのみ句が識別さ
れたと見なされることを基礎にしてEを計算することに
よってさらに改善することができる。これにより、多く
の句が最小数のキーワード以上によって分離されること
が保証され、音声認識エラーに対する免除となる。 探索中、句のいくつかの種類はキーワードの語いが延
長されない限り、分離されないことが明らかになる。こ
れろの句群または句“集団”(例えば、ビジネスレター
における日付け)は単一の単語または単語の従属ストリ
ングのみだけ異なる傾向があり、キーワードの副次的語
いの準備のために使用すべく自動的に得られる候補であ
る。(下記に詳細に示す)。 単一キーワードの認識は単語の順序および付加的意味
を考慮しないことは明らかである。様々な分離をそれら
の間に有するキーワードの2組(または他の倍数)のあ
るなしもまた単一キーワードの組の効率を改善すべく使
用される。これは、能力が認識語いを増大させずに改善
されるという音声認識上の利点を有する。テキストへの
応用においては、句読点、単語の一部、単語の組合せお
よび単語群の一部を含めるべくキーワードを一般化する
ことによってさらに改善される。例えば、“−ing*be
d"(*はどんな単語でも良い)は、“making the be
d"および“selling a bed"内に有する。 もし、これ以上の句の混乱が解明されるなら、対にな
ったキーワード(例えばwe**to)の使用はコンポーネ
ント単一単語の価値を高める。必ずしも隣接してなく異
なる数の他の単語によって分離される単語対の探索は回
数指定の準備と共に始まる。M個のキーワードに含まれ
る両方のコンポーネント単語を持つ単語対は、もしそれ
らが残りの全ての句混乱を解決するなら、順序リストか
ら作成される。単一キーワードおよび対キーワードの最
終リストは前回と同様にそれぞれ利点され、全体の句混
乱得点Eが計算される。 片方または両方のコンポーネントキーワードが現在の
キーワードリストにない、よりよい能力の単語対の探索
が始まる。次の単語対候補が回数指定の上方から取出さ
れキーワードリストに追加される。すでに存在しない追
加単語対の単一キーワードもまた追加され、それと等し
い数の最低能力の単一キーワードが削除される。これ
は、もしそれらのコンポーネント単語がもはや存在しな
いなら、他の単語対も削除される。Eの新しい値
(E′)が計算される。もし改善が得られ、E′<Eな
らキーワードリストの最も新しい変更が維持され、さも
なければリストは前の状態に再記憶される。さらに単語
対が回数指定から処理され、単一キーワード探索であっ
ても他のヒューリスティックスが候補となる単語対を提
供すべく使用される。いくつかのキーワードがそれ自身
よりもいくつかの単語群の中に加わることによって全体
の能力により多く寄与することがわかる。 この方法は、より大きいキーワード群(>2単語)へ
と延長するが発生頻度が減少するとき句混乱の解明に対
する寄与は句の大変大きなコーパスにおいてのみ重要で
ある。キーワードの探索における計算量はキーワードの
数および句の数と共に増大する。これは、最初に、混乱
または混乱に大変近い半組の句に関してアルゴリズムを
ランすることによって減少する。キーワードおよびそれ
らの得点は、より完全な組の句とともに作用するメイン
アルゴリズムに対して候補キーワードのより効率のよい
指定を提供する。 音声認識の応用において、キーワード組にないいくつ
かの単語は多くのスプリアスなキーワード認識を生成す
る。例えば、単語“I"の発生はキーワード“by"として
いつも認識される。しかしながら、もし、キーワード探
索が始まる前および続く句の識別において混乱された単
語群が類義語であると見なされた場合、実質的な句の分
離はこの問題による影響を受けない。さらに、そのよう
な全体の類義単語の頻度は分離された単語よりも必然的
に高いので、大量の句情報が通常それらの検出に関連し
ている。 キーワードは、高い頻度で起り、全体の単語よりもよ
り多くの句識別情報を持つキーワード部(例えば音素)
に対しても延長して使用される。さらに、連続的音声に
おけるある単語パーツの識別は、しばしば完全な単語よ
りも容易であり、連続的音声入力を受ける翻訳システム
において好まれる。この明細書を通して、単語“キーワ
ード”は簡潔さのために全キーワードおよびキーワード
の一部を表すのに使用される。句の多くの種類は年月
日、時間、価格、アイテム、名前または他の単語群の詳
細を含む従属句および節が互いに異なるのみである。音
声認識装置の語いは句を句の特定の種類または群に割当
てるのに十分であるが、従属的構造を分離すべく十分な
キーワードを保持するほど大きくはない。さらに、句ク
ラスおよび従属構造を分離するのに要する全語いはより
多くの単語を含み、容易に混乱する。このことは、たと
えば認識装置の容量が全語いを包含するほど十分であっ
ても能力は信頼性ある句および従属句識別を得るには低
すぎる。句の種類が決定されれば、その句の種類に特定
の従属単語列に予期される1組のキーワードを使用して
原発声または原発声の変形がバッファに記憶され、認識
プロセスが反復さされることは本発明による方法の利点
である。このようにして、認識装置は一度に多くの使用
者による単語混乱の可能性がある全語いに対処する必要
がない。第2認識プロセスの速度は原発声の速度によっ
て制限されず、原則的にリアルタイムよりもはるかに速
く実行され、目立つ遅れを必ずしも発生しない。認識の
反復は、必要な句およびその副構造を認識するのに必要
な回数実行される。すなわち、認識プロセスを“重ねあ
わせる”のが可能になり、句は多くの分離段階で特徴づ
けられ、各段階における認識子は異なる語いのキーワー
ドを使用する。 全てではないが、多くの従属単語列はソース言語にお
いて文脈上独立している。これは、従属単語列の位置が
あたかも幾つかの選択が可能であるかのように指定さ
れ、どの選択に対しても緊密な文脈上の従属をより少な
くしている。さらに、文脈上の重要性は、可能な従属列
の内部および外部の単語の間に従属関係があることを暗
示し、すなわち、キーワードがその列の内部の単語を使
用しないで全部の句を識別することは限界がある。これ
は、変化する日付けを含む句において例示され、日付け
それ自身以外に句に必要な単語の変化がほとんどない。
(そのような文脈独立が概して言語間で不変であり、慣
用句集の翻訳を無限に延長するためにそれを使用すると
言う推測を示威することは将来の研究課題である。) 本発明のこの特定された側面はさらに、テキストの翻
訳に用いられたとき大きな利点を有し、大きな辞書を捜
すことの計算コストを類似した階層の小さな辞書および
慣用句集を使用することによって大幅に減らすことが出
来る。いくつかの従属句は翻訳の必要がなく、この場
合、しばしば、これらの句の単語を自動的に認識するこ
とが可能でない。最も一般的な例は例えば、“Can I
speak to Mr. Smith please?"の固有名詞等のラ
ベルに言及する発声において起こる。以前のように、シ
ステムはラベル参照に相応するバッファの単語の場所と
共に句クラスを識別できる。翻訳中のそのようなラベル
参照単語の処理は、単に、目標言語の発声の適当な場所
における原音響信号の伝達である。合成された目標言語
の音声は原話者の音声に一致するのが望ましく、ある言
語パラメータは、そのような一致が出来るだけ遠くまで
設定される必要がある。 正しい句が第2の言語である目標言語において出力さ
れることを使用者が確証するように、システムは第1の
言語である入力言語のどの句が翻訳されるかを示す。こ
のことを可能にすべくシステムは入力言語の句の全てを
保持する記憶装置を有する。好ましくは、本システムに
おいては、通常、圧伸および非圧伸音声に必要なものに
比べて記憶容量への要件を大きく減らすので句はテキス
トとして、例えばASCIIコードの形で記憶される。音声
出力が必要な場合は、テキストは記憶装置から回収さ
れ、確認出力手段である音声変換器および音声合成器に
渡される。ASCIIコード化されたテキストの記憶におい
ては、1文字あたり1バイト必要であり、約1万の句が
記憶のメガバイトの半分と共に記憶される。すなわち、
約1万の句の翻訳を提供するシステムは約1メガバイト
の記憶容量を必要とし、これはハードディスクに容易に
供給される。対称に構成された2つの翻訳システムを使
用することによって双方向通信システムが可能である。
これは、各ユニットがユニットを操作している人の言語
の認識および合成単語のみを考慮すれば良い利点を持っ
ている。第2ユニットとの通信は句といくつかの従属句
の内容を特定するプロトコルによる。プロトコルは言語
から独立しており、目標言語を識別することなしにメッ
セージを送信可能にする。さらに、プロトコルは多くの
異なる言語を使用する人が単一ユニットの出力から同時
に翻訳を受けることを可能にする。 例 電話網に結合されたデモンストレーションシステムは
慣用表現集による方法の可能性を証明するのに使用され
てきた。デモンストレーションシステムはVotan音声認
識装置、Invox音声合成装置およびIBM PC XTコンピュ
ータを使用する。 Votan音声認識装置は電話網で64までの連続して話さ
れた単語を認識可能である。“yes"、“no"、“quit"お
よび“enter"などのシステムコントロールワードは60ワ
ードまでキーワードとして選択される。どのシステムコ
ントロールワードも入力句に含まれないので話された命
令よりも制御ボタンまたはキーを使用するのが好まし
い。 記憶される句は400の英語の句とそれと同じフランス
語の句とか成る。 英語の句は約1100の異なる単語を含む。これらの数を
文脈に挿入すべくビジネス表現からなる慣用表現集は概
して、この数の句を含む。 上記した原理を基礎としてキーワード抽出ソフトウエ
アを使用の後、60のキーワードが選択され、全ての句が
首尾よく分離される。400の句のうち、たった32の句が
単一の単語によって識別された(これらの32の句は16対
である)。 キーワードを認識すると同時にデモンストレーション
システムは適当な句にアクセスし、使用者によって口頭
で確認しテキストを介してフランス語の同等語を音声合
成装置に出力する。 テキストから音声への合成はこの発明においては本質
的ではない。あらかじめ録音されたまたはコード化され
た単語および句から目標言語の音声を合成することは可
能であり、利点ともなる。このことは、音声が使用者に
よって記録され、いくつかのうめこみ音声と音響的に一
致させ、テキストから音声への合成に必要な部分を除け
るという利点を有する。この方法は、例えばヒンズ−語
やアラビア語等、技術的にみて近い将来、使用可能なハ
ードウエアを作り出しそうもない重要な国の言語のテキ
ストから音声への合成に対する必要性を除去する。 音声から音声への翻訳の他に、本発明はもちろん、メ
ッセージを通常使用されるキーボードで入力し、テキス
トからテキスト、テキストから音声または、音声からテ
キストへの翻訳にも応用可能である。特に有用な応用は
オフィスオートメーションの分野にあり、音声によって
駆動された外国語テキスト製造装置が容易に履行され
る。そのような機械は、実質的に音声認識装置、ソフト
ウエア、および上記の制御システムを使用し、第2の言
語のテキストをプリンタまたはテレックスまたは他のテ
レコミュニケーションリンクに出力される。もちろん、
いくつかの言語の毎日のビジネス通信文を提供すること
は容易なことである。 本発明のシステムはデータリンクを介して動作可能な
結合された第1および第2ターミナルを具備し、第1タ
ーミナルは入力手段と特徴付け手段とを具備し、第2タ
ーミナルは記憶装置と出力手段とを具備し、第1ターミ
ナルはさらにデータリンクを介して第2ターミナルに送
信すべく句の集合体のどれが入力句に相応するかを示す
メッセージを生成する手段を具備することができる。
ムに関するがより詳細には第1言語の音声から第2言語
の音声を生成するシステムに限定されない。 長い間、言語、特に音声を素早く自動的に翻訳する機
械が望まれていた。しかしながら計算能力、音声認識お
よび音声合成の最近の大きな進歩にもかかわらず、その
ような機械の出現は夢あるいはフィクションに過ぎな
い。 テキストの自動翻訳に関する多くの研究がなされた。
2、3のかなり制限された応用(例えば、天気予報の翻
訳)は別として、自動的に正確な翻訳を行い人間の通訳
者にとってかわる製品は皆無である。音声翻訳における
問題は、音声認識、イントネーションの付加情報、アク
セントなどのエラーや、音声自身の不正確さによって倍
加される。 不幸なことに、現在のテキスト言語翻訳パッケージは
多かれすくなかれ不完全であり、音声から音声への翻訳
システムの要件を満たしていない。多くのパッケージは
プロフェッショナルな翻訳者のための助けとして設計さ
れており、生成された出力は目標の言語に直される前に
プレエディットされねばならない。多くのパッケージは
メニュー駆動された相互作用式であり、時間のかかるバ
ッチ処理モードで動作するのでリアルタイムの音声動作
には不適当である。さらに、翻訳パッケージはインディ
オムや他の例外に対して誤りの多い出力を容易に発生す
るので信頼性がない。出力が正しく翻訳されたという保
証もない。また、現在のシステムは、CPUに対して集中
性を有するので実行するのに高価なものとなり、コスト
に敏感な応用に対しては不適当である。 本発明は、これらの欠如および欠点を緩和する翻訳シ
ステムを提供することを求めるものである。 本発明は、句を第1言語から第2言語に翻訳するシス
テムであり、第2言語の句の集合を保持する記憶装置
と、第1言語の句を受ける入力手段と、前記句の集合か
らの1つを含む句を第2言語で出力する出力手段と、前
記句の集合のどれが前記入力句に相応するかを決定する
特徴づけ手段と、出力手段を制御して前記入力句に相応
する前記集合からの句の出力を保証すべく前記特徴づけ
手段に応答する手段とを具備する。 そのようなシステムは大変素早い翻訳を提供し、所要
時間は、入力句を識別/特徴づけし、第2言語の答えを
調べる時間である。 さらに、本システムは、彼女/彼がシステムによって
正確に認識/理解されたという確認を使用者に提供すべ
く実行され、このことは特に音声翻訳システムにおいて
重要である。 メッセージが正しく特徴づけされたことが使用者によ
って確認されれば、記憶された句の集合は予め生成され
た正確な翻訳のみからなるので翻訳の正確さは保証され
る。 また、本システムはいくつかの第2言語に同時に素早
く翻訳することが可能であり、その場合必要となるのは
付加的なそれぞれの第2言語の句の集合を保持する付加
的記憶装置のみである。 添附の図面を参照にして本発明の実施例が説明され
る。 第1図は、本発明のシステムの主要素を示すブロック
ダイヤグラムである。 本発明は、かなり少数のキーワードによって多数の別
個な句の意味上の要旨を特徴づけてとらえることが可能
であるという認識を基礎にしている。キーワードを適当
に選択することによって、現在の市場で入手可能な音声
認識装置を使用することが可能であるが、多くの組の句
を特徴づけかつ識別すべく有効な多くの組の句に含まれ
る単語よりもかなり少数の単語を認識できるのみであ
る。 したがって、翻訳システムの能力は句と句を正しく認
識するキーワードの能力に依存する。句の分離が大きい
ほどシステムの認識エラーに対する許容度が大きくな
り、かつ話者自身によって引起こされた不一致に対する
許容度も大きくなる。 キーワードの選択 適当な探索手順は次の通りである。 1. 句に含まれる単語の発生回数に従って、特定のN個
の句に含まれるK個の単語のそれぞれを指定する。 2. 最も発生頻度の高いM個の単語を初期キーワードリ
ストとして選択する。(Mは音声認識装置の語いに含ま
れる単語の数である。 3. それぞれの句に各キーワードがあるかないかを決定
する。キーワードによって識別されない句の数(E)が
計数される。 4. i=1とする。 5. キーワードがリストから一時的に削除され、Eの新
しい値(E′)が計算される。 6. 得点E′−Eが一時的に削除されたキーワードに割
当てられる。これはキーワードの更新の後の能力の悪化
の目安となり、さらには全体能力に与える影響の目安と
なる。結果的に、この目安は、各キーワードが他の機能
を単に反復せずに出来るだけ多くの組の句の分離に寄与
することを保証するのに使用される。 7. 一時的に削除されたキーワードが交換され、M個の
キーワードのそれぞれに対してプロセスが反復される。 8. 最低の得点値の単語が現在のキーワードリストから
除去される。 9. M+i番目の最も頻度の高い単語が除去された単語
を交換するのに使用され、新しいEが計算される。 10. もし、新しいEが前のEに対して改善された能力
を示した場合はiが増加され、M+i>Kでない限りプ
ロセスがステップ5から反復され、M+i>Kのときプ
ロセスが停止する。他方、M+i番目の単語が拒絶され
る。iが増加され、M+i>Kでない限りプロセスをス
テップ9から反復し、M+i>Kのときステップ8で最
後に除去された単語が交換されてプロセスが停止する。 最後のキーワードリストは、M個の単一なキーワード
の最適な組を含み、句の識別に最適である。 最良のM個の単語からさらに反復すれば句の分離がさ
らに改善される。特に、priori言語学上の情報が利用可
能な時は回数指定以外のヒューリスティックスがステッ
プ1の一連の候補単語を提供すべく使用される。また、
発生リストの底部に向かうに従って単語は句の分離の助
けとならず、したがって、発生リストの例えば上方3分
の1または上方2分の1より多くを探索する価値はな
い。 時々、多くの句が識別され、探索のかなり始めにおい
てEが零にかなり近くなる場合がある。このような場合
は、1つ以上のキーワードが異なるときのみ句が識別さ
れたと見なされることを基礎にしてEを計算することに
よってさらに改善することができる。これにより、多く
の句が最小数のキーワード以上によって分離されること
が保証され、音声認識エラーに対する免除となる。 探索中、句のいくつかの種類はキーワードの語いが延
長されない限り、分離されないことが明らかになる。こ
れろの句群または句“集団”(例えば、ビジネスレター
における日付け)は単一の単語または単語の従属ストリ
ングのみだけ異なる傾向があり、キーワードの副次的語
いの準備のために使用すべく自動的に得られる候補であ
る。(下記に詳細に示す)。 単一キーワードの認識は単語の順序および付加的意味
を考慮しないことは明らかである。様々な分離をそれら
の間に有するキーワードの2組(または他の倍数)のあ
るなしもまた単一キーワードの組の効率を改善すべく使
用される。これは、能力が認識語いを増大させずに改善
されるという音声認識上の利点を有する。テキストへの
応用においては、句読点、単語の一部、単語の組合せお
よび単語群の一部を含めるべくキーワードを一般化する
ことによってさらに改善される。例えば、“−ing*be
d"(*はどんな単語でも良い)は、“making the be
d"および“selling a bed"内に有する。 もし、これ以上の句の混乱が解明されるなら、対にな
ったキーワード(例えばwe**to)の使用はコンポーネ
ント単一単語の価値を高める。必ずしも隣接してなく異
なる数の他の単語によって分離される単語対の探索は回
数指定の準備と共に始まる。M個のキーワードに含まれ
る両方のコンポーネント単語を持つ単語対は、もしそれ
らが残りの全ての句混乱を解決するなら、順序リストか
ら作成される。単一キーワードおよび対キーワードの最
終リストは前回と同様にそれぞれ利点され、全体の句混
乱得点Eが計算される。 片方または両方のコンポーネントキーワードが現在の
キーワードリストにない、よりよい能力の単語対の探索
が始まる。次の単語対候補が回数指定の上方から取出さ
れキーワードリストに追加される。すでに存在しない追
加単語対の単一キーワードもまた追加され、それと等し
い数の最低能力の単一キーワードが削除される。これ
は、もしそれらのコンポーネント単語がもはや存在しな
いなら、他の単語対も削除される。Eの新しい値
(E′)が計算される。もし改善が得られ、E′<Eな
らキーワードリストの最も新しい変更が維持され、さも
なければリストは前の状態に再記憶される。さらに単語
対が回数指定から処理され、単一キーワード探索であっ
ても他のヒューリスティックスが候補となる単語対を提
供すべく使用される。いくつかのキーワードがそれ自身
よりもいくつかの単語群の中に加わることによって全体
の能力により多く寄与することがわかる。 この方法は、より大きいキーワード群(>2単語)へ
と延長するが発生頻度が減少するとき句混乱の解明に対
する寄与は句の大変大きなコーパスにおいてのみ重要で
ある。キーワードの探索における計算量はキーワードの
数および句の数と共に増大する。これは、最初に、混乱
または混乱に大変近い半組の句に関してアルゴリズムを
ランすることによって減少する。キーワードおよびそれ
らの得点は、より完全な組の句とともに作用するメイン
アルゴリズムに対して候補キーワードのより効率のよい
指定を提供する。 音声認識の応用において、キーワード組にないいくつ
かの単語は多くのスプリアスなキーワード認識を生成す
る。例えば、単語“I"の発生はキーワード“by"として
いつも認識される。しかしながら、もし、キーワード探
索が始まる前および続く句の識別において混乱された単
語群が類義語であると見なされた場合、実質的な句の分
離はこの問題による影響を受けない。さらに、そのよう
な全体の類義単語の頻度は分離された単語よりも必然的
に高いので、大量の句情報が通常それらの検出に関連し
ている。 キーワードは、高い頻度で起り、全体の単語よりもよ
り多くの句識別情報を持つキーワード部(例えば音素)
に対しても延長して使用される。さらに、連続的音声に
おけるある単語パーツの識別は、しばしば完全な単語よ
りも容易であり、連続的音声入力を受ける翻訳システム
において好まれる。この明細書を通して、単語“キーワ
ード”は簡潔さのために全キーワードおよびキーワード
の一部を表すのに使用される。句の多くの種類は年月
日、時間、価格、アイテム、名前または他の単語群の詳
細を含む従属句および節が互いに異なるのみである。音
声認識装置の語いは句を句の特定の種類または群に割当
てるのに十分であるが、従属的構造を分離すべく十分な
キーワードを保持するほど大きくはない。さらに、句ク
ラスおよび従属構造を分離するのに要する全語いはより
多くの単語を含み、容易に混乱する。このことは、たと
えば認識装置の容量が全語いを包含するほど十分であっ
ても能力は信頼性ある句および従属句識別を得るには低
すぎる。句の種類が決定されれば、その句の種類に特定
の従属単語列に予期される1組のキーワードを使用して
原発声または原発声の変形がバッファに記憶され、認識
プロセスが反復さされることは本発明による方法の利点
である。このようにして、認識装置は一度に多くの使用
者による単語混乱の可能性がある全語いに対処する必要
がない。第2認識プロセスの速度は原発声の速度によっ
て制限されず、原則的にリアルタイムよりもはるかに速
く実行され、目立つ遅れを必ずしも発生しない。認識の
反復は、必要な句およびその副構造を認識するのに必要
な回数実行される。すなわち、認識プロセスを“重ねあ
わせる”のが可能になり、句は多くの分離段階で特徴づ
けられ、各段階における認識子は異なる語いのキーワー
ドを使用する。 全てではないが、多くの従属単語列はソース言語にお
いて文脈上独立している。これは、従属単語列の位置が
あたかも幾つかの選択が可能であるかのように指定さ
れ、どの選択に対しても緊密な文脈上の従属をより少な
くしている。さらに、文脈上の重要性は、可能な従属列
の内部および外部の単語の間に従属関係があることを暗
示し、すなわち、キーワードがその列の内部の単語を使
用しないで全部の句を識別することは限界がある。これ
は、変化する日付けを含む句において例示され、日付け
それ自身以外に句に必要な単語の変化がほとんどない。
(そのような文脈独立が概して言語間で不変であり、慣
用句集の翻訳を無限に延長するためにそれを使用すると
言う推測を示威することは将来の研究課題である。) 本発明のこの特定された側面はさらに、テキストの翻
訳に用いられたとき大きな利点を有し、大きな辞書を捜
すことの計算コストを類似した階層の小さな辞書および
慣用句集を使用することによって大幅に減らすことが出
来る。いくつかの従属句は翻訳の必要がなく、この場
合、しばしば、これらの句の単語を自動的に認識するこ
とが可能でない。最も一般的な例は例えば、“Can I
speak to Mr. Smith please?"の固有名詞等のラ
ベルに言及する発声において起こる。以前のように、シ
ステムはラベル参照に相応するバッファの単語の場所と
共に句クラスを識別できる。翻訳中のそのようなラベル
参照単語の処理は、単に、目標言語の発声の適当な場所
における原音響信号の伝達である。合成された目標言語
の音声は原話者の音声に一致するのが望ましく、ある言
語パラメータは、そのような一致が出来るだけ遠くまで
設定される必要がある。 正しい句が第2の言語である目標言語において出力さ
れることを使用者が確証するように、システムは第1の
言語である入力言語のどの句が翻訳されるかを示す。こ
のことを可能にすべくシステムは入力言語の句の全てを
保持する記憶装置を有する。好ましくは、本システムに
おいては、通常、圧伸および非圧伸音声に必要なものに
比べて記憶容量への要件を大きく減らすので句はテキス
トとして、例えばASCIIコードの形で記憶される。音声
出力が必要な場合は、テキストは記憶装置から回収さ
れ、確認出力手段である音声変換器および音声合成器に
渡される。ASCIIコード化されたテキストの記憶におい
ては、1文字あたり1バイト必要であり、約1万の句が
記憶のメガバイトの半分と共に記憶される。すなわち、
約1万の句の翻訳を提供するシステムは約1メガバイト
の記憶容量を必要とし、これはハードディスクに容易に
供給される。対称に構成された2つの翻訳システムを使
用することによって双方向通信システムが可能である。
これは、各ユニットがユニットを操作している人の言語
の認識および合成単語のみを考慮すれば良い利点を持っ
ている。第2ユニットとの通信は句といくつかの従属句
の内容を特定するプロトコルによる。プロトコルは言語
から独立しており、目標言語を識別することなしにメッ
セージを送信可能にする。さらに、プロトコルは多くの
異なる言語を使用する人が単一ユニットの出力から同時
に翻訳を受けることを可能にする。 例 電話網に結合されたデモンストレーションシステムは
慣用表現集による方法の可能性を証明するのに使用され
てきた。デモンストレーションシステムはVotan音声認
識装置、Invox音声合成装置およびIBM PC XTコンピュ
ータを使用する。 Votan音声認識装置は電話網で64までの連続して話さ
れた単語を認識可能である。“yes"、“no"、“quit"お
よび“enter"などのシステムコントロールワードは60ワ
ードまでキーワードとして選択される。どのシステムコ
ントロールワードも入力句に含まれないので話された命
令よりも制御ボタンまたはキーを使用するのが好まし
い。 記憶される句は400の英語の句とそれと同じフランス
語の句とか成る。 英語の句は約1100の異なる単語を含む。これらの数を
文脈に挿入すべくビジネス表現からなる慣用表現集は概
して、この数の句を含む。 上記した原理を基礎としてキーワード抽出ソフトウエ
アを使用の後、60のキーワードが選択され、全ての句が
首尾よく分離される。400の句のうち、たった32の句が
単一の単語によって識別された(これらの32の句は16対
である)。 キーワードを認識すると同時にデモンストレーション
システムは適当な句にアクセスし、使用者によって口頭
で確認しテキストを介してフランス語の同等語を音声合
成装置に出力する。 テキストから音声への合成はこの発明においては本質
的ではない。あらかじめ録音されたまたはコード化され
た単語および句から目標言語の音声を合成することは可
能であり、利点ともなる。このことは、音声が使用者に
よって記録され、いくつかのうめこみ音声と音響的に一
致させ、テキストから音声への合成に必要な部分を除け
るという利点を有する。この方法は、例えばヒンズ−語
やアラビア語等、技術的にみて近い将来、使用可能なハ
ードウエアを作り出しそうもない重要な国の言語のテキ
ストから音声への合成に対する必要性を除去する。 音声から音声への翻訳の他に、本発明はもちろん、メ
ッセージを通常使用されるキーボードで入力し、テキス
トからテキスト、テキストから音声または、音声からテ
キストへの翻訳にも応用可能である。特に有用な応用は
オフィスオートメーションの分野にあり、音声によって
駆動された外国語テキスト製造装置が容易に履行され
る。そのような機械は、実質的に音声認識装置、ソフト
ウエア、および上記の制御システムを使用し、第2の言
語のテキストをプリンタまたはテレックスまたは他のテ
レコミュニケーションリンクに出力される。もちろん、
いくつかの言語の毎日のビジネス通信文を提供すること
は容易なことである。 本発明のシステムはデータリンクを介して動作可能な
結合された第1および第2ターミナルを具備し、第1タ
ーミナルは入力手段と特徴付け手段とを具備し、第2タ
ーミナルは記憶装置と出力手段とを具備し、第1ターミ
ナルはさらにデータリンクを介して第2ターミナルに送
信すべく句の集合体のどれが入力句に相応するかを示す
メッセージを生成する手段を具備することができる。
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 ステイア,マーチン・ジオージ
イギリス国 アイ・ピー8,4エス・イ
ー,サーフオーク,アイプスウイッチ,
オッフトン,クロバー・コッテイジ
(番地なし)
(56)参考文献 特開 昭60−200369(JP,A)
特公 昭57−21720(JP,B2)
(58)調査した分野(Int.Cl.6,DB名)
G06F 17/20 - 17/30
JICSTファイル(JOIS)
Claims (1)
- (57)【特許請求の範囲】 1.マルチワードの句を第1言語から第2言語に翻訳す
るシステムであって、 第1言語における入力句を受信する入力手段と、 第2言語における句の集合体を保持する記憶手段と、 前記入力手段に接続され、前記集合体のどの句が前記入
力句に対応するかを決定して、その句の出力を制御する
特徴付け手段と、 前記第2言語における前記決定された句を出力する出力
手段とを具備し、 前記特徴付け手段が、前記入力句の中に、所定の組のキ
ーワードあるいはキーワード部の少なくとも1つのキー
ワードあるいはキーワード部の存在を認識し、これら認
識されたキーワードあるいはキーワード部に従って、前
記集合体から対応する句を選択する手段を含み、かつ、
前記所定の組を構成する要素の数が前記集合体の句の数
よりも小さいことを特徴とするシステム。 2.前記特徴付け手段が、前記入力句が前記句の集合体
のどの句あるいは句の集合に対応するかを決定するため
に第1の組のキーワードを適用し、前記入力句が前記句
の集合のうち決定されない句に該当すると判断した場合
は、前記特徴付け手段は前記入力句が前記句の集合のど
の句に対応するかを決定するために第2の組のキーワー
ドを適用することを特徴とする請求の範囲1記載のシス
テム。 3.前記特徴付け手段が音声認識装置を具備することを
特徴とする請求の範囲1または2に記載のシステム。 4.前記入力手段が、話された入力を受信可能であり、
前記出力手段が発声された出力を提供することを特徴と
する請求の範囲1乃至3のいずれかに記載のシステム。 5.入力されたメッセージを前記入力手段に提供するキ
ーボードと、前記第2言語におけるテキスト出力を提供
する手段とをさらに具備することを特徴とする請求の範
囲1乃至3のいずれかに記載のシステム。 6.前記入力句の一部を翻訳しないで前記出力手段へ送
信して前記第2言語における句の一部として出力する手
段をさらに具備することを特徴とする請求の範囲1乃至
5のいずれかに記載のシステム。 7.前記システムが第1言語から複数の第2言語のいず
れかに翻訳するシステムであり、前記複数の第2言語の
それぞれのに関する句の集合体が供給されることを特徴
とする請求の範囲第1乃至6のいずれかに記載のシステ
ム。 8.前記集合体の各句が少なくとも1つのキーワード又
はキーワード部を含み、前記集合体の各句が独自に所定
のキーワード、あるいはキーワード部、あるいはそれら
の組み合わせを含むことを特徴とする請求の範囲1乃至
7のいずれかに記載のシステム。 9.前記第2言語の句の集合体に対応する前記第1の言
語の句の集合体を記憶する記憶装置と、前記第2言語で
出力するに先だってユーザによる確認を行なうために、
前記第1言語において決定された句を出力するための確
認出力手段を具備することを特徴とする請求の範囲1乃
至8のいずれかに記載のシステム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB8623839 | 1986-10-03 | ||
GB868623839A GB8623839D0 (en) | 1986-10-03 | 1986-10-03 | Language translsation system |
GB8710376 | 1987-05-01 | ||
GB878710376A GB8710376D0 (en) | 1986-10-03 | 1987-05-01 | Language translation system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01501977A JPH01501977A (ja) | 1989-07-06 |
JP2848458B2 true JP2848458B2 (ja) | 1999-01-20 |
Family
ID=26291375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62505852A Expired - Fee Related JP2848458B2 (ja) | 1986-10-03 | 1987-09-29 | 言語翻訳システム |
Country Status (9)
Country | Link |
---|---|
EP (1) | EP0262938B1 (ja) |
JP (1) | JP2848458B2 (ja) |
CN (1) | CN1029170C (ja) |
CA (1) | CA1294056C (ja) |
DE (1) | DE3788488T2 (ja) |
ES (1) | ES2047494T3 (ja) |
HK (1) | HK136196A (ja) |
RU (1) | RU2070734C1 (ja) |
WO (1) | WO1988002516A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6862566B2 (en) | 2000-03-10 | 2005-03-01 | Matushita Electric Industrial Co., Ltd. | Method and apparatus for converting an expression using key words |
Families Citing this family (182)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8817705D0 (en) * | 1988-07-25 | 1988-09-01 | British Telecomm | Optical communications system |
CA2115088A1 (en) * | 1993-02-08 | 1994-08-09 | David Michael Boyle | Multi-lingual voice response unit |
FR2713800B1 (fr) * | 1993-12-15 | 1996-03-15 | Jean Gachot | Procédé et dispositif pour transformer un premier message vocal dans une première langue, en un second message vocal prononcé dans une seconde langue prédéterminée. |
JP2965455B2 (ja) * | 1994-02-15 | 1999-10-18 | 富士ゼロックス株式会社 | 言語情報提供装置 |
US5799268A (en) * | 1994-09-28 | 1998-08-25 | Apple Computer, Inc. | Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like |
JP3385146B2 (ja) * | 1995-06-13 | 2003-03-10 | シャープ株式会社 | 会話文翻訳装置 |
EP0786132B1 (en) * | 1995-08-14 | 2000-04-26 | Koninklijke Philips Electronics N.V. | A method and device for preparing and using diphones for multilingual text-to-speech generating |
GR1002453B (el) * | 1995-10-20 | 1996-10-15 | Εξυπνη συσκευη για ανακτηση πολυγλωσσων κειμενων. | |
JPH09251462A (ja) * | 1996-03-18 | 1997-09-22 | Sharp Corp | 機械翻訳装置 |
US6161083A (en) * | 1996-05-02 | 2000-12-12 | Sony Corporation | Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation |
GB2314183A (en) * | 1996-06-14 | 1997-12-17 | Sharp Kk | Accessing a database |
GB9716690D0 (en) | 1997-08-06 | 1997-10-15 | British Broadcasting Corp | Spoken text display method and apparatus for use in generating television signals |
CN1111814C (zh) * | 1998-04-06 | 2003-06-18 | 刘莎 | 开放式全息模板式人机对话语言翻译方法及全息语义标注系统 |
US7020601B1 (en) * | 1998-05-04 | 2006-03-28 | Trados Incorporated | Method and apparatus for processing source information based on source placeable elements |
WO1999062002A1 (en) * | 1998-05-27 | 1999-12-02 | Master's Innovations Ltd Oy | A method and arrangement for translation of information |
JP4718687B2 (ja) | 1999-03-19 | 2011-07-06 | トラドス ゲゼルシャフト ミット ベシュレンクテル ハフツング | ワークフロー管理システム |
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
CN1411579A (zh) * | 2000-03-07 | 2003-04-16 | 欧伊朋公司 | 通过数码网络播放多语言语音的方法和设备 |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
FR2830351B1 (fr) * | 2001-10-03 | 2003-12-05 | Roger Louriou | Procede pour realiser un outil de traduction |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
US7536293B2 (en) * | 2003-02-24 | 2009-05-19 | Microsoft Corporation | Methods and systems for language translation |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8521506B2 (en) | 2006-09-21 | 2013-08-27 | Sdl Plc | Computer-implemented method, computer software and apparatus for use in a translation system |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US8706477B1 (en) | 2008-04-25 | 2014-04-22 | Softwin Srl Romania | Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US9262403B2 (en) | 2009-03-02 | 2016-02-16 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US8762131B1 (en) | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates |
US8762130B1 (en) | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
WO2012091608A1 (ru) * | 2010-12-31 | 2012-07-05 | Nizienko Yuri Konstantinovich | Электронная приемо-передающая система с функцией синхронного перевода устной речи с одного языка на другой |
US9128929B2 (en) | 2011-01-14 | 2015-09-08 | Sdl Language Technologies | Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US20120310642A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Automatically creating a mapping between text data and audio data |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
JP2016508007A (ja) | 2013-02-07 | 2016-03-10 | アップル インコーポレイテッド | デジタルアシスタントのためのボイストリガ |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
KR101759009B1 (ko) | 2013-03-15 | 2017-07-17 | 애플 인크. | 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것 |
CN105190607B (zh) | 2013-03-15 | 2018-11-30 | 苹果公司 | 通过智能数字助理的用户培训 |
CN112230878A (zh) | 2013-03-15 | 2021-01-15 | 苹果公司 | 对中断进行上下文相关处理 |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
JP6163266B2 (ja) | 2013-08-06 | 2017-07-12 | アップル インコーポレイテッド | リモート機器からの作動に基づくスマート応答の自動作動 |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
RU2585974C2 (ru) * | 2014-01-31 | 2016-06-10 | Владимир Александрович Елин | Способ обеспечения общения людей, говорящих на разных языках |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
RU2641222C2 (ru) * | 2016-09-26 | 2018-01-16 | Владимир Анатольевич Ефремов | Способ автоматического перевода устной речи с одного языка на другой и устройство для его реализации |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4706212A (en) * | 1971-08-31 | 1987-11-10 | Toma Peter P | Method using a programmed digital computer system for translation between natural languages |
DE8014297U1 (de) * | 1980-05-24 | 1982-03-18 | Joh. Vaillant Gmbh U. Co, 5630 Remscheid | Brennstoffbeheizbare waermequelle |
US4507750A (en) * | 1982-05-13 | 1985-03-26 | Texas Instruments Incorporated | Electronic apparatus from a host language |
JPS60200369A (ja) * | 1984-03-24 | 1985-10-09 | Mitsubishi Electric Corp | 機械翻訳装置 |
-
1987
- 1987-09-29 RU SU874355873A patent/RU2070734C1/ru active
- 1987-09-29 ES ES87308638T patent/ES2047494T3/es not_active Expired - Lifetime
- 1987-09-29 DE DE87308638T patent/DE3788488T2/de not_active Expired - Fee Related
- 1987-09-29 CA CA000548094A patent/CA1294056C/en not_active Expired - Fee Related
- 1987-09-29 EP EP87308638A patent/EP0262938B1/en not_active Expired - Lifetime
- 1987-09-29 JP JP62505852A patent/JP2848458B2/ja not_active Expired - Fee Related
- 1987-09-29 WO PCT/GB1987/000683 patent/WO1988002516A1/en unknown
- 1987-10-03 CN CN87106964A patent/CN1029170C/zh not_active Expired - Fee Related
-
1996
- 1996-07-25 HK HK136196A patent/HK136196A/xx not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6862566B2 (en) | 2000-03-10 | 2005-03-01 | Matushita Electric Industrial Co., Ltd. | Method and apparatus for converting an expression using key words |
Also Published As
Publication number | Publication date |
---|---|
WO1988002516A1 (en) | 1988-04-07 |
RU2070734C1 (ru) | 1996-12-20 |
DE3788488T2 (de) | 1994-05-11 |
CN1029170C (zh) | 1995-06-28 |
EP0262938B1 (en) | 1993-12-15 |
JPH01501977A (ja) | 1989-07-06 |
HK136196A (en) | 1996-08-02 |
DE3788488D1 (de) | 1994-01-27 |
CN87106964A (zh) | 1988-06-01 |
CA1294056C (en) | 1992-01-07 |
ES2047494T3 (es) | 1994-03-01 |
EP0262938A1 (en) | 1988-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2848458B2 (ja) | 言語翻訳システム | |
US5384701A (en) | Language translation system | |
US5765131A (en) | Language translation system and method | |
US6952665B1 (en) | Translating apparatus and method, and recording medium used therewith | |
US7047195B2 (en) | Speech translation device and computer readable medium | |
US6278968B1 (en) | Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system | |
US6374224B1 (en) | Method and apparatus for style control in natural language generation | |
US6282507B1 (en) | Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection | |
US6442524B1 (en) | Analyzing inflectional morphology in a spoken language translation system | |
US6243669B1 (en) | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation | |
US20020198713A1 (en) | Method and apparatus for perfoming spoken language translation | |
WO2000045374A9 (en) | A method and portable apparatus for performing spoken language translation | |
JPH0916602A (ja) | 翻訳装置および翻訳方法 | |
JP2008209717A (ja) | 入力された音声を処理する装置、方法およびプログラム | |
WO1999063456A1 (fr) | Dispositif de preparation de regles de conversion du langage, dispositif de conversion du langage et support d'enregistrement de programme | |
JP2000200273A (ja) | 発話意図認識装置 | |
Carlson et al. | Linguistic processing in the KTH multi-lingual text-to-speech system | |
Ronzhin et al. | Survey of russian speech recognition systems | |
Cerf-Danon et al. | 1.0 TANGORA-a large vocabulary speech recognition system for five languages. | |
JP3441400B2 (ja) | 言語変換規則作成装置、及びプログラム記録媒体 | |
CN115019787A (zh) | 一种交互式同音异义词消歧方法、系统、电子设备和存储介质 | |
JP2003162524A (ja) | 言語処理装置 | |
JPH07191687A (ja) | 自然言語処理装置及びその方法 | |
JP2001117583A (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
JPH0634175B2 (ja) | 文章読上げ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |