JP2848458B2

JP2848458B2 - 言語翻訳システム

Info

Publication number: JP2848458B2
Application number: JP62505852A
Authority: JP
Inventors: ステンテイフォード，フレドリック・ワーウィック・ミカエル; ステイア，マーチン・ジオージ
Original assignee: British Telecommunications PLC
Current assignee: British Telecommunications PLC
Priority date: 1986-10-03
Filing date: 1987-09-29
Publication date: 1999-01-20
Anticipated expiration: 2014-01-20
Also published as: WO1988002516A1; RU2070734C1; DE3788488T2; CN1029170C; EP0262938B1; JPH01501977A; HK136196A; DE3788488D1; CN87106964A; CA1294056C; ES2047494T3; EP0262938A1

Description

【発明の詳細な説明】本発明は句を第１言語から第２言語に翻訳するシステ
ムに関するがより詳細には第１言語の音声から第２言語
の音声を生成するシステムに限定されない。長い間、言語、特に音声を素早く自動的に翻訳する機
械が望まれていた。しかしながら計算能力、音声認識お
よび音声合成の最近の大きな進歩にもかかわらず、その
ような機械の出現は夢あるいはフィクションに過ぎな
い。テキストの自動翻訳に関する多くの研究がなされた。
２、３のかなり制限された応用（例えば、天気予報の翻
訳）は別として、自動的に正確な翻訳を行い人間の通訳
者にとってかわる製品は皆無である。音声翻訳における
問題は、音声認識、イントネーションの付加情報、アク
セントなどのエラーや、音声自身の不正確さによって倍
加される。不幸なことに、現在のテキスト言語翻訳パッケージは
多かれすくなかれ不完全であり、音声から音声への翻訳
システムの要件を満たしていない。多くのパッケージは
プロフェッショナルな翻訳者のための助けとして設計さ
れており、生成された出力は目標の言語に直される前に
プレエディットされねばならない。多くのパッケージは
メニュー駆動された相互作用式であり、時間のかかるバ
ッチ処理モードで動作するのでリアルタイムの音声動作
には不適当である。さらに、翻訳パッケージはインディ
オムや他の例外に対して誤りの多い出力を容易に発生す
るので信頼性がない。出力が正しく翻訳されたという保
証もない。また、現在のシステムは、CPUに対して集中
性を有するので実行するのに高価なものとなり、コスト
に敏感な応用に対しては不適当である。本発明は、これらの欠如および欠点を緩和する翻訳シ
ステムを提供することを求めるものである。本発明は、句を第１言語から第２言語に翻訳するシス
テムであり、第２言語の句の集合を保持する記憶装置
と、第１言語の句を受ける入力手段と、前記句の集合か
らの１つを含む句を第２言語で出力する出力手段と、前
記句の集合のどれが前記入力句に相応するかを決定する
特徴づけ手段と、出力手段を制御して前記入力句に相応
する前記集合からの句の出力を保証すべく前記特徴づけ
手段に応答する手段とを具備する。そのようなシステムは大変素早い翻訳を提供し、所要
時間は、入力句を識別／特徴づけし、第２言語の答えを
調べる時間である。さらに、本システムは、彼女／彼がシステムによって
正確に認識／理解されたという確認を使用者に提供すべ
く実行され、このことは特に音声翻訳システムにおいて
重要である。メッセージが正しく特徴づけされたことが使用者によ
って確認されれば、記憶された句の集合は予め生成され
た正確な翻訳のみからなるので翻訳の正確さは保証され
る。また、本システムはいくつかの第２言語に同時に素早
く翻訳することが可能であり、その場合必要となるのは
付加的なそれぞれの第２言語の句の集合を保持する付加
的記憶装置のみである。添附の図面を参照にして本発明の実施例が説明され
る。第１図は、本発明のシステムの主要素を示すブロック
ダイヤグラムである。本発明は、かなり少数のキーワードによって多数の別
個な句の意味上の要旨を特徴づけてとらえることが可能
であるという認識を基礎にしている。キーワードを適当
に選択することによって、現在の市場で入手可能な音声
認識装置を使用することが可能であるが、多くの組の句
を特徴づけかつ識別すべく有効な多くの組の句に含まれ
る単語よりもかなり少数の単語を認識できるのみであ
る。したがって、翻訳システムの能力は句と句を正しく認
識するキーワードの能力に依存する。句の分離が大きい
ほどシステムの認識エラーに対する許容度が大きくな
り、かつ話者自身によって引起こされた不一致に対する
許容度も大きくなる。キーワードの選択適当な探索手順は次の通りである。 1. 句に含まれる単語の発生回数に従って、特定のＮ個
の句に含まれるＫ個の単語のそれぞれを指定する。 2. 最も発生頻度の高いＭ個の単語を初期キーワードリ
ストとして選択する。（Ｍは音声認識装置の語いに含ま
れる単語の数である。 3. それぞれの句に各キーワードがあるかないかを決定
する。キーワードによって識別されない句の数（Ｅ）が
計数される。 4. ｉ＝１とする。 5. キーワードがリストから一時的に削除され、Ｅの新
しい値（Ｅ′）が計算される。 6. 得点Ｅ′−Ｅが一時的に削除されたキーワードに割
当てられる。これはキーワードの更新の後の能力の悪化
の目安となり、さらには全体能力に与える影響の目安と
なる。結果的に、この目安は、各キーワードが他の機能
を単に反復せずに出来るだけ多くの組の句の分離に寄与
することを保証するのに使用される。 7. 一時的に削除されたキーワードが交換され、Ｍ個の
キーワードのそれぞれに対してプロセスが反復される。 8. 最低の得点値の単語が現在のキーワードリストから
除去される。 9. Ｍ＋ｉ番目の最も頻度の高い単語が除去された単語
を交換するのに使用され、新しいＥが計算される。 10. もし、新しいＥが前のＥに対して改善された能力
を示した場合はｉが増加され、Ｍ＋ｉ＞Ｋでない限りプ
ロセスがステップ５から反復され、Ｍ＋ｉ＞Ｋのときプ
ロセスが停止する。他方、Ｍ＋ｉ番目の単語が拒絶され
る。ｉが増加され、Ｍ＋ｉ＞Ｋでない限りプロセスをス
テップ９から反復し、Ｍ＋ｉ＞Ｋのときステップ８で最
後に除去された単語が交換されてプロセスが停止する。最後のキーワードリストは、Ｍ個の単一なキーワード
の最適な組を含み、句の識別に最適である。最良のＭ個の単語からさらに反復すれば句の分離がさ
らに改善される。特に、priori言語学上の情報が利用可
能な時は回数指定以外のヒューリスティックスがステッ
プ１の一連の候補単語を提供すべく使用される。また、
発生リストの底部に向かうに従って単語は句の分離の助
けとならず、したがって、発生リストの例えば上方３分
の１または上方２分の１より多くを探索する価値はな
い。時々、多くの句が識別され、探索のかなり始めにおい
てＥが零にかなり近くなる場合がある。このような場合
は、１つ以上のキーワードが異なるときのみ句が識別さ
れたと見なされることを基礎にしてＥを計算することに
よってさらに改善することができる。これにより、多く
の句が最小数のキーワード以上によって分離されること
が保証され、音声認識エラーに対する免除となる。探索中、句のいくつかの種類はキーワードの語いが延
長されない限り、分離されないことが明らかになる。こ
れろの句群または句“集団”（例えば、ビジネスレター
における日付け）は単一の単語または単語の従属ストリ
ングのみだけ異なる傾向があり、キーワードの副次的語
いの準備のために使用すべく自動的に得られる候補であ
る。（下記に詳細に示す）。単一キーワードの認識は単語の順序および付加的意味
を考慮しないことは明らかである。様々な分離をそれら
の間に有するキーワードの２組（または他の倍数）のあ
るなしもまた単一キーワードの組の効率を改善すべく使
用される。これは、能力が認識語いを増大させずに改善
されるという音声認識上の利点を有する。テキストへの
応用においては、句読点、単語の一部、単語の組合せお
よび単語群の一部を含めるべくキーワードを一般化する
ことによってさらに改善される。例えば、“−ing＊be
d"（＊はどんな単語でも良い）は、“making the be
d"および“selling ａ bed"内に有する。もし、これ以上の句の混乱が解明されるなら、対にな
ったキーワード（例えばwe＊＊to）の使用はコンポーネ
ント単一単語の価値を高める。必ずしも隣接してなく異
なる数の他の単語によって分離される単語対の探索は回
数指定の準備と共に始まる。Ｍ個のキーワードに含まれ
る両方のコンポーネント単語を持つ単語対は、もしそれ
らが残りの全ての句混乱を解決するなら、順序リストか
ら作成される。単一キーワードおよび対キーワードの最
終リストは前回と同様にそれぞれ利点され、全体の句混
乱得点Ｅが計算される。片方または両方のコンポーネントキーワードが現在の
キーワードリストにない、よりよい能力の単語対の探索
が始まる。次の単語対候補が回数指定の上方から取出さ
れキーワードリストに追加される。すでに存在しない追
加単語対の単一キーワードもまた追加され、それと等し
い数の最低能力の単一キーワードが削除される。これ
は、もしそれらのコンポーネント単語がもはや存在しな
いなら、他の単語対も削除される。Ｅの新しい値
（Ｅ′）が計算される。もし改善が得られ、Ｅ′＜Ｅな
らキーワードリストの最も新しい変更が維持され、さも
なければリストは前の状態に再記憶される。さらに単語
対が回数指定から処理され、単一キーワード探索であっ
ても他のヒューリスティックスが候補となる単語対を提
供すべく使用される。いくつかのキーワードがそれ自身
よりもいくつかの単語群の中に加わることによって全体
の能力により多く寄与することがわかる。この方法は、より大きいキーワード群（＞２単語）へ
と延長するが発生頻度が減少するとき句混乱の解明に対
する寄与は句の大変大きなコーパスにおいてのみ重要で
ある。キーワードの探索における計算量はキーワードの
数および句の数と共に増大する。これは、最初に、混乱
または混乱に大変近い半組の句に関してアルゴリズムを
ランすることによって減少する。キーワードおよびそれ
らの得点は、より完全な組の句とともに作用するメイン
アルゴリズムに対して候補キーワードのより効率のよい
指定を提供する。音声認識の応用において、キーワード組にないいくつ
かの単語は多くのスプリアスなキーワード認識を生成す
る。例えば、単語“I"の発生はキーワード“by"として
いつも認識される。しかしながら、もし、キーワード探
索が始まる前および続く句の識別において混乱された単
語群が類義語であると見なされた場合、実質的な句の分
離はこの問題による影響を受けない。さらに、そのよう
な全体の類義単語の頻度は分離された単語よりも必然的
に高いので、大量の句情報が通常それらの検出に関連し
ている。キーワードは、高い頻度で起り、全体の単語よりもよ
り多くの句識別情報を持つキーワード部（例えば音素）
に対しても延長して使用される。さらに、連続的音声に
おけるある単語パーツの識別は、しばしば完全な単語よ
りも容易であり、連続的音声入力を受ける翻訳システム
において好まれる。この明細書を通して、単語“キーワ
ード”は簡潔さのために全キーワードおよびキーワード
の一部を表すのに使用される。句の多くの種類は年月
日、時間、価格、アイテム、名前または他の単語群の詳
細を含む従属句および節が互いに異なるのみである。音
声認識装置の語いは句を句の特定の種類または群に割当
てるのに十分であるが、従属的構造を分離すべく十分な
キーワードを保持するほど大きくはない。さらに、句ク
ラスおよび従属構造を分離するのに要する全語いはより
多くの単語を含み、容易に混乱する。このことは、たと
えば認識装置の容量が全語いを包含するほど十分であっ
ても能力は信頼性ある句および従属句識別を得るには低
すぎる。句の種類が決定されれば、その句の種類に特定
の従属単語列に予期される１組のキーワードを使用して
原発声または原発声の変形がバッファに記憶され、認識
プロセスが反復さされることは本発明による方法の利点
である。このようにして、認識装置は一度に多くの使用
者による単語混乱の可能性がある全語いに対処する必要
がない。第２認識プロセスの速度は原発声の速度によっ
て制限されず、原則的にリアルタイムよりもはるかに速
く実行され、目立つ遅れを必ずしも発生しない。認識の
反復は、必要な句およびその副構造を認識するのに必要
な回数実行される。すなわち、認識プロセスを“重ねあ
わせる”のが可能になり、句は多くの分離段階で特徴づ
けられ、各段階における認識子は異なる語いのキーワー
ドを使用する。全てではないが、多くの従属単語列はソース言語にお
いて文脈上独立している。これは、従属単語列の位置が
あたかも幾つかの選択が可能であるかのように指定さ
れ、どの選択に対しても緊密な文脈上の従属をより少な
くしている。さらに、文脈上の重要性は、可能な従属列
の内部および外部の単語の間に従属関係があることを暗
示し、すなわち、キーワードがその列の内部の単語を使
用しないで全部の句を識別することは限界がある。これ
は、変化する日付けを含む句において例示され、日付け
それ自身以外に句に必要な単語の変化がほとんどない。
（そのような文脈独立が概して言語間で不変であり、慣
用句集の翻訳を無限に延長するためにそれを使用すると
言う推測を示威することは将来の研究課題である。）本発明のこの特定された側面はさらに、テキストの翻
訳に用いられたとき大きな利点を有し、大きな辞書を捜
すことの計算コストを類似した階層の小さな辞書および
慣用句集を使用することによって大幅に減らすことが出
来る。いくつかの従属句は翻訳の必要がなく、この場
合、しばしば、これらの句の単語を自動的に認識するこ
とが可能でない。最も一般的な例は例えば、“Can Ｉ
speak to Mr. Smith please?"の固有名詞等のラ
ベルに言及する発声において起こる。以前のように、シ
ステムはラベル参照に相応するバッファの単語の場所と
共に句クラスを識別できる。翻訳中のそのようなラベル
参照単語の処理は、単に、目標言語の発声の適当な場所
における原音響信号の伝達である。合成された目標言語
の音声は原話者の音声に一致するのが望ましく、ある言
語パラメータは、そのような一致が出来るだけ遠くまで
設定される必要がある。正しい句が第２の言語である目標言語において出力さ
れることを使用者が確証するように、システムは第１の
言語である入力言語のどの句が翻訳されるかを示す。こ
のことを可能にすべくシステムは入力言語の句の全てを
保持する記憶装置を有する。好ましくは、本システムに
おいては、通常、圧伸および非圧伸音声に必要なものに
比べて記憶容量への要件を大きく減らすので句はテキス
トとして、例えばASCIIコードの形で記憶される。音声
出力が必要な場合は、テキストは記憶装置から回収さ
れ、確認出力手段である音声変換器および音声合成器に
渡される。ASCIIコード化されたテキストの記憶におい
ては、１文字あたり１バイト必要であり、約１万の句が
記憶のメガバイトの半分と共に記憶される。すなわち、
約１万の句の翻訳を提供するシステムは約１メガバイト
の記憶容量を必要とし、これはハードディスクに容易に
供給される。対称に構成された２つの翻訳システムを使
用することによって双方向通信システムが可能である。
これは、各ユニットがユニットを操作している人の言語
の認識および合成単語のみを考慮すれば良い利点を持っ
ている。第２ユニットとの通信は句といくつかの従属句
の内容を特定するプロトコルによる。プロトコルは言語
から独立しており、目標言語を識別することなしにメッ
セージを送信可能にする。さらに、プロトコルは多くの
異なる言語を使用する人が単一ユニットの出力から同時
に翻訳を受けることを可能にする。例電話網に結合されたデモンストレーションシステムは
慣用表現集による方法の可能性を証明するのに使用され
てきた。デモンストレーションシステムはVotan音声認
識装置、Invox音声合成装置およびIBM PC XTコンピュ
ータを使用する。 Votan音声認識装置は電話網で64までの連続して話さ
れた単語を認識可能である。“yes"、“no"、“quit"お
よび“enter"などのシステムコントロールワードは60ワ
ードまでキーワードとして選択される。どのシステムコ
ントロールワードも入力句に含まれないので話された命
令よりも制御ボタンまたはキーを使用するのが好まし
い。記憶される句は400の英語の句とそれと同じフランス
語の句とか成る。英語の句は約1100の異なる単語を含む。これらの数を
文脈に挿入すべくビジネス表現からなる慣用表現集は概
して、この数の句を含む。上記した原理を基礎としてキーワード抽出ソフトウエ
アを使用の後、60のキーワードが選択され、全ての句が
首尾よく分離される。400の句のうち、たった32の句が
単一の単語によって識別された（これらの32の句は16対
である）。キーワードを認識すると同時にデモンストレーション
システムは適当な句にアクセスし、使用者によって口頭
で確認しテキストを介してフランス語の同等語を音声合
成装置に出力する。テキストから音声への合成はこの発明においては本質
的ではない。あらかじめ録音されたまたはコード化され
た単語および句から目標言語の音声を合成することは可
能であり、利点ともなる。このことは、音声が使用者に
よって記録され、いくつかのうめこみ音声と音響的に一
致させ、テキストから音声への合成に必要な部分を除け
るという利点を有する。この方法は、例えばヒンズ−語
やアラビア語等、技術的にみて近い将来、使用可能なハ
ードウエアを作り出しそうもない重要な国の言語のテキ
ストから音声への合成に対する必要性を除去する。音声から音声への翻訳の他に、本発明はもちろん、メ
ッセージを通常使用されるキーボードで入力し、テキス
トからテキスト、テキストから音声または、音声からテ
キストへの翻訳にも応用可能である。特に有用な応用は
オフィスオートメーションの分野にあり、音声によって
駆動された外国語テキスト製造装置が容易に履行され
る。そのような機械は、実質的に音声認識装置、ソフト
ウエア、および上記の制御システムを使用し、第２の言
語のテキストをプリンタまたはテレックスまたは他のテ
レコミュニケーションリンクに出力される。もちろん、
いくつかの言語の毎日のビジネス通信文を提供すること
は容易なことである。本発明のシステムはデータリンクを介して動作可能な
結合された第１および第２ターミナルを具備し、第１タ
ーミナルは入力手段と特徴付け手段とを具備し、第２タ
ーミナルは記憶装置と出力手段とを具備し、第１ターミ
ナルはさらにデータリンクを介して第２ターミナルに送
信すべく句の集合体のどれが入力句に相応するかを示す
メッセージを生成する手段を具備することができる。

───────────────────────────────────────────────────── フロントページの続き (72)発明者ステイア，マーチン・ジオージイギリス国アイ・ピー８，４エス・イー，サーフオーク，アイプスウイッチ, オッフトン，クロバー・コッテイジ（番地なし) (56)参考文献特開昭60−200369（ＪＰ，Ａ) 特公昭57−21720（ＪＰ，Ｂ２) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06F 17/20 - 17/30 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】１．マルチワードの句を第１言語から第２言語に翻訳す
るシステムであって、第１言語における入力句を受信する入力手段と、第２言語における句の集合体を保持する記憶手段と、前記入力手段に接続され、前記集合体のどの句が前記入
力句に対応するかを決定して、その句の出力を制御する
特徴付け手段と、前記第２言語における前記決定された句を出力する出力
手段とを具備し、前記特徴付け手段が、前記入力句の中に、所定の組のキ
ーワードあるいはキーワード部の少なくとも１つのキー
ワードあるいはキーワード部の存在を認識し、これら認
識されたキーワードあるいはキーワード部に従って、前
記集合体から対応する句を選択する手段を含み、かつ、
前記所定の組を構成する要素の数が前記集合体の句の数
よりも小さいことを特徴とするシステム。２．前記特徴付け手段が、前記入力句が前記句の集合体
のどの句あるいは句の集合に対応するかを決定するため
に第１の組のキーワードを適用し、前記入力句が前記句
の集合のうち決定されない句に該当すると判断した場合
は、前記特徴付け手段は前記入力句が前記句の集合のど
の句に対応するかを決定するために第２の組のキーワー
ドを適用することを特徴とする請求の範囲１記載のシス
テム。３．前記特徴付け手段が音声認識装置を具備することを
特徴とする請求の範囲１または２に記載のシステム。４．前記入力手段が、話された入力を受信可能であり、
前記出力手段が発声された出力を提供することを特徴と
する請求の範囲１乃至３のいずれかに記載のシステム。５．入力されたメッセージを前記入力手段に提供するキ
ーボードと、前記第２言語におけるテキスト出力を提供
する手段とをさらに具備することを特徴とする請求の範
囲１乃至３のいずれかに記載のシステム。６．前記入力句の一部を翻訳しないで前記出力手段へ送
信して前記第２言語における句の一部として出力する手
段をさらに具備することを特徴とする請求の範囲１乃至
５のいずれかに記載のシステム。７．前記システムが第１言語から複数の第２言語のいず
れかに翻訳するシステムであり、前記複数の第２言語の
それぞれのに関する句の集合体が供給されることを特徴
とする請求の範囲第１乃至６のいずれかに記載のシステ
ム。８．前記集合体の各句が少なくとも１つのキーワード又
はキーワード部を含み、前記集合体の各句が独自に所定
のキーワード、あるいはキーワード部、あるいはそれら
の組み合わせを含むことを特徴とする請求の範囲１乃至
７のいずれかに記載のシステム。９．前記第２言語の句の集合体に対応する前記第１の言
語の句の集合体を記憶する記憶装置と、前記第２言語で
出力するに先だってユーザによる確認を行なうために、
前記第１言語において決定された句を出力するための確
認出力手段を具備することを特徴とする請求の範囲１乃
至８のいずれかに記載のシステム。