JP2007109233A

JP2007109233A - 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置

Info

Publication number: JP2007109233A
Application number: JP2006276947A
Authority: JP
Inventors: Haifen Wan; ワン・ハイフェン; Yuukin Guo; グオ・ユーキン
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2005-10-09
Filing date: 2006-10-10
Publication date: 2007-04-26
Anticipated expiration: 2026-10-10
Also published as: US7853444B2; CN100483399C; US20070124133A1; JP4886459B2; CN1945562A

Abstract

【課題】本発明は、構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置を提供する。
【解決手段】構文解析統計モデルは、単音節言語及び多重音節言語間の音訳に使用され、多重音節言語の副音節構文解析確率を含む。構文解析統計モデルを訓練する方法は、コーパスとして二カ国語固有人名リストを入力し、二カ国語固有人名リストは、多重音節言語の複数の固有人名及び単音節言語の対応する固有人名をそれぞれ含み、この方法は、構文解析の規則を用いて二カ国語固有人名リスト内の多重音節言語の複数の固有人名をそれぞれ副音節列に構文解析し、二カ国語固有人名リスト内の単音節言語の対応する固有人名に従って、構文解析が正確か否かを判断し、正確と決定された構文解析結果に基づき、構文解析統計モデルを訓練する。
【選択図】図１

Description

本発明は、情報処理技術に関連し、とりわけ、コンピュータを用いた音訳技術、及び音訳の際に用いられる音訳モデルや構文解析モデルを訓練する技術に関する。

いわゆる「音訳」とは、ある言語の単語を他の言語の類似した発音の単語に翻訳することを言う。例えば、音訳方法は固有人名を翻訳する時に頻繁に用いられる。以前は、通常、固有人名を翻訳するため、二カ国語の辞典が使用されてきた。そのような二カ国語の辞典（例えば、二ヶ国語固有人名辞典）は、言語学者や関連する分野の専門家により編集され、非常に高精度である。

しかしながら、如何に大きな二カ国語辞典であっても全ての語彙を網羅することはできない。そのため、求めている単語が辞典に見つからないと言う状況に頻繁に遭遇することがある。更に、時間や社会の発展と共に、継続的に新たな単語が生まれ、この状況を更に悪化させている。そのため、長い間、二カ国語間の自動音訳を実現させるための自動音訳方法及び装置が必要とされてきた。このような自動音訳技術はまた、機械翻訳、クロス言語情報検索及び情報抽出に対しても重要である。

既存の自動音訳技術は、例えば、非特許文献１に記述されている。この文献は、統計的な機械翻訳技術に基づく英語から中国語への音訳方法について説明しており、下記表１にその具体的な方法が示されている。

その方法とは、
（１）英語の単語をＣＭＵにより開発されたフェスティバル音声合成システムを用いて、発音を表す音系列に変換する。

（２）ＩＢＭ翻訳モデルを用いて、英語の音系列を漢字の発音を表すイニシャル及びファイナル系列に変換する。

（３）イニシャル及びファイナル系列を組み合わせて中国語のぴん音音節を形成する。

（４）再びＩＢＭ翻訳モデルを用いて、中国語のぴん音を漢字に変換する。

（５）ＣＭＵにより開発された言語モデルを用いて、漢字を組み合わせて中国語音訳された単語を形成する。

上述の自動音訳方法には、二つの問題点がある。即ち、
（１）英単語を発音系列に変換するためには、それを支援するための音声合成システムが必要であり、その既存の音声合成技術が未熟であることから、音訳中に更なるエラーが生じる。そして、辞典の大きさが制限されているため、発音辞典を用いて英単語発音をマークする方法は、辞典に載っていない単語をマークする問題を解決することができず、とりわけ、この問題は、音訳が必要とされる固有人名及び新たに出現した単語に対して顕著となる。

（２）英語は、多重音節言語（すなわち、一英単語は通常複数の音節を含む）である一方、中国語は、単音節言語（すなわち、漢字一文字が一音節）であり、英語の文字、音、音節また単語のいずれも中国語の自然単位である漢字に対応することができない。そのため、上記論文による方法は、英語から中国語音訳にのみ適切であり、中国語から英語音訳には適さない。
"Transliteration of Proper Names in Cross-Lingual Information Retrieval", Paola Virga and Sanjeev Khudanpur, Proceedings of 41st ACL Workshop on Multilingual and Mixed-language Named Entity Recognition, pp. 57-64, 2003。

従来技術における上記の問題を解決するために、本発明は、構文解析統計モデル及び音訳モデルを訓練する方法及び装置、また、単音節言語から多重音節言語、及び多重音節言語から単音節言語への音訳のための方法及び装置を提供する。

本発明の一実施形態によると、単音節言語と多重音節言語との間の音訳に用いられ、多重音節言語の副音節構文解析確率を含む、構文解析統計モデルを訓練する方法であって、多重音節言語の複数の固有人名及び単音節言語の対応する固有人名を含む二カ国語固有人名リストをコーパスとして入力するステップと、二カ国語固有人名リスト内の多重音節言語の複数の固有人名の各々を、構文解析の規則を用いて副音節列に構文解析するステップと、二カ国語固有人名リスト内の単音節言語の対応する固有人名に従って、構文解析が正確か否かを判断するステップと、正確と決定された構文解析結果に基づき、構文解析統計モデルを訓練するステップとを含む、構文解析統計モデル訓練方法を提供する。

本発明の別の実施形態によると、単音節言語及び多重音節言語間の音訳に使用される、多重音節言語の副音節構文解析確率を含む構文解析統計モデル及び単音節言語の音節と多重音節言語の副音節との翻訳関係及びそれらの翻訳確率をそれぞれ含む音訳モデルを訓練する方法であり、上述の構文解析統計モデル訓練を使用して、構文解析統計モデルを訓練するステップと、正確に構文解析されたと決定される多重音節言語の固有人名及び二カ国語固有人名リスト内の単音節言語の対応固有人名に基づいて音訳モデルを訓練するステップと、を含む、音訳モデル訓練方法を提供する。

本発明の別の実施形態によると、単音節言語から多重音節言語へ音訳する方法であって、音訳対象の単音節言語の単語に対応する音節列を取得ステップと、単音節言語の音節と多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルに従って、音節列中の各音節に対応する多重音節言語の少なくとも１つの副音節及びその翻訳確率を取得するステップと、多重音節言語の副音節構文解析確率を含む構文解析統計モデルに基づいて、音訳結果として音節系列に対応する最高確率を有する副音節列を探索するステップと、を含む、音訳方法を提供する。

本発明の別の実施形態によると、多重音節言語から単音節言語へ音訳する方法であって、副音節列に音訳する必要がある多重音節言語の単語を構文解析するステップと、単音節言語の音節と多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルに従って、副音節列中の各副音節に対応する単音節言語の少なくとも１つの音節及びその翻訳確率を取得するステップと、単音節言語の各音節に対応する文字を取得するステップと、単音節言語の文字隣接確率を含む言語モデルに基づいて、翻訳結果として副音節列に対応する最高確率を持つ文字列を探索するステップと、を含む、音訳方法を提供する。

本発明の別の実施形態によると、単音節言語及び多重音節言語間の音訳に用いられ、多重音節言語の副音節構文解析確率を含む、構文解析統計モデルを訓練する装置であって、多重音節言語の複数の固有人名及び単音節言語の対応する固有人名を含む二カ国語固有人名リストをコーパスとして入力するコーパス入力ユニットと、二カ国語固有人名リスト内の多重音節言語の複数の固有人名を、構文解析の規則を用いて副音節列に構文解析する規則構文解析ユニットと、二カ国語固有人名リスト内の単音節言語の対応する固有人名に従って、多重音節言語の固有人名の構文解析が正確か否かを判断する構文解析判断ユニットと、正確と決定された構文解析結果に基づいて、構文解析統計モデルを訓練する構文解析統計モデル訓練ユニットとを具備する、構文解析統計モデル訓練装置を提供する。

本発明の別の実施形態によると、単音節言語から多重音節言語へ音訳する装置であって、音訳対象の単音節言語の単語に対応する音節列を取得する音節列取得ユニットと、単音節言語の音節と多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルと、音節列取得ユニットにより取得された音節列中の各音節に対応する多重言語の少なくとも１つの副音節、及び音訳モデルを用いることによりその翻訳確率を取得する副音節訓練ユニットと、多重音節言語の副音節構文解析確率を含む構文解析統計モデルと、構文解析統計モデル、音節列中の各音節に対応する多重音節言語の少なくとも１つの副音節及びその翻訳確率に基づいて、音訳結果として音節列に対応する最高確率を持つ副音節列を探索する探索ユニットと、を具備する音訳装置を提供する。

次に、図面を参照しながら本発明の各種実施形態を詳細に説明する。

多重音節言語の単語の発音をマークすることで生じた従来技術における更なるエラーを避けるため、本発明では、音訳を行うにあたり、英単語のような多重音節言語の単語を直接使用する手法を採用している。この目的で、本発明では副音節の概念を提案している。英語のような多重音節言語において、副音節は英語の文字と音節の間に位置する単位であり、表２に示す通り、対応する中国語のような単音節言語における単語の音節の一つ一つに相当する。

本発明の自動音訳方法は、単音節言語の音節及び多重音節言語の副音節を基本単位として捉え、統計的モデルを使用することにより、双方向性音訳を実現する。本明細書では、本発明の実施形態を説明するにあたり、英語を多重音節言語の例として、また中国語を単音節言語の例として捉えている。本発明はまた、中国語−フランス語、中国語−ドイツ語、日本語−英語、日本語−ドイツ語等、他の単音節言語及び多重音節言語にも適用できることは注目に値する。

図１は、本発明の一実施形態による構文解析統計モデルの訓練方法を示すフローチャートである。本実施形態の方法により訓練された構文解析統計モデルは、後に他の実施形態と関連して説明される音訳方法及び装置において使用され、このモデルは多重音節言語の副音節構文解析確率を含む。

図１に示すように、最初にステップ１０５において二カ国語固有人名リストがコーパスとして入力され、二カ国語固有人名リストは、多重音節言語の複数の固有人名及び単音節言語の対応する固有人名をそれぞれ含む。具体的には、コーパスとして、例えば言語学者や関連する分野の専門家により編集された二カ国語固有人名辞典が使用される。表３は、英語−中国語二カ国語固有人名リストの例を示す。

次に、ステップ１１０では、構文解析規則を用いて二カ国語固有人名リストに記載された多重音節言語のそれぞれの複数の固有人名を副音節列に構文解析する。以下は、本実施形態で使用される構文解析規則の一部である。即ち、
//４文字を含む母音の構文解析
「augh」が単語中に発見された場合、副音節として構文解析される。
「ough」が単語中又は単語の語尾に発見された場合、副音節として構文解析される。
・・・・
//３文字を含む母音の構文解析
「ore」が単語の語尾に発見された場合、副音節として構文解析される。
・・・・
//２文字を含む母音の構文解析
「ai」が単語の始め又は単語中に発見された場合、副音節として構文解析される。
「ey」が単語の語尾に発見された場合、副音節として構文解析される。
・・・・
//母音字の構文解析
単語中の母音字「a」「e」「i」「o」「u」「y」は、副音節として構文解析される。
その他の規則
「sh」「th」「tch」「ph」「ch」及び「wh」はそれぞれ子音の単位として構文解析される。

母音字及びそのすぐ左の子音字は、一つの副音節に合成される。

・・・・
次に、ステップ１１５では、二カ国語固有人名リスト内の単音節言語の対応する固有人名に従って、構文解析が正確に行われたか否かの判断がされる。具体的に、本実施形態では、多重音節言語の固有人名から構文解析された副音節列中の副音節の数が、二カ国語固有人名リスト内の単音節言語の対応する固有人名中の音節の数と等しいか否かが判断され、等しい場合は、構文解析が正確に行われたと決定され、また、そうでない場合は、構文解析は正確に行われなかったものと決定される。それらの正確な構文解析結果は、正確な構文解析集合に集められ（ステップ１２０）、それらの不正確な構文解析結果は、不正確な構文解析集合に集められる（ステップ１３０）。

続いて、ステップ１２５では、構文解析統計モデルは正確な構文解析結果に基づいて訓練される。具体的に、本実施形態では、正確に構文解析された多重言語の固有人名から構文解析された副音節列中の副音節間の隣接関係に基づいて、隣接する副音節の各対の発生確率が計算され、その副音節対及びそれらの発生確率が構文解析統計モデルに記録される。表４は、その構文解析統計モデルの例を示す。

ここで、構文解析統計モデルにおいて、副音節対の発生確率を計算する方法はこの他にも数通りあることは注目に値する。例えば、本実施形態では、表４に示す比率は、副音節対の発生数をその副音節対中の第一副音節の合計発生数で割って得られたものを採用している。当然、その他のアプローチもあり、例えば、副音節対の発生数をその副音節対中の第二副音節の合計発生数で割ることにより得られた比率、或いは、副音節対の発生数をその副音節対中の第一及び第二副音節の合計発生数で割ることにより得られた比率等が挙げられる。

ステップ１２５までに、本実施形態の方法は構文解析統計モデルを得る（訓練する）ことができる。構文解析統計モデルは、コーパスから構文解析された多重音節言語の副音節間の隣接関係及びそれらの発生確率を記録する。

更に、ステップ１３５において、構文解析統計モデルを用いて、不正確な集合における多重音節言語の固有人名を再び構文解析することを望む場合、ステップ１４０の処理へと進む。またそうでなければステップ１４５に進み、処理が終了する。

ステップ１４０では、不正確な集合における多重音節言語の固有人名は、構文解析統計モデルに従って構文解析される。具体的には、多重音節言語の固有人名に対応する最高確率の副音節列が、構文解析統計モデルにおける各副音節対の発生確率に基づく探索アルゴリズムを用いて計算される。本実施形態では、探索はビタビアルゴリズムを用いて行われる。ビタビアルゴリズムの情報については、”Error bounds for convolutional codes and an asymptotically optimum decoding algorithm”, A.J. Viterbi, IEEE Trans. Inform. Theory, IT-13(2), pp. 260-269, 1967を参照する。

更に、例えば、Ａ*アルゴリズム、縦型探索及び横型探索等、その他の探索アルゴリズムも使用することができる。これらのアルゴリズムはまた組み合わせて使用することができる。

次に、ステップ１１５に戻り、構文解析統計モデルによる構文解析は正確か否かが判断され、正確な結果は正確な集合に追加され（ステップ１２０）、不正確な結果は不正確な集合に追加され（ステップ１３０）、ステップ１２５が繰り返される。

よって、本実施形態においては、不正確な集合を構文解析するため繰り返し構文解析モデルを使用することができ、それにより構文解析統計モデルの順応性を更に訓練することができる。

図２は、本発明の一実施形態による構文解析統計モデル及び音訳モデルを訓練する方法をフローチャートに示したものである。本実施形態は、図面を参照しながら下記に説明される。上記実施形態と同一のエレメントに関しては、図面や記述においても上記と同じ文字、数字で表示され、説明は適切に省略される。

図２で示されるように、本実施形態のステップ１０５から１４０は、図１に示す実施形態のステップと同様である。相違点としては、本実施形態においては、ステップ１３５における判断が「Ｎｏ」の場合、ステップ２０５の処理に進むことである。

ステップ２０５において、音訳モデルは、正確に構文解析されたと決定された多重音節言語の固有人名と二カ国語固有人名リスト中の単音節言語の対応する固有人名に基づいて訓練される。具体的には、各副音節/音節対の翻訳確率は、正確に構文解析されたと決定された多重音節言語の固有人名から構文解析された副音節列中の各副音節と単音節言語の対応する固有人名中の対応する音節との対応関係に基づいて計算される。そして各副音節/音節対及びその翻訳確率は、音訳モデル中に記録される。表５は、音訳モデルの例を示す。

上記で構文解析確率を計算した場合と同じように、音訳モデルにおいても、副音節/音節対の翻訳確率を計算する方法は数通りある。例えば、本実施形態においては、表５で示すように、副音節/音節対の発生数をその多重音節言語の副音節の合計発生数で割ることにより算出される比率を採用する。当然、その他の手法を用いることもできる。例えば、副音節/音節対の発生数をその多重音節言語の副音節及びその単音節言語の音節の合計発生数で割ることにより算出される比率の採用、或いは、副音節/音節対の発生数をその単音節言語の音節の合計発生数で割ることにより算出される比率の採用等である。

上記の説明から分かるように、本実施形態の方法では、二カ国語固有人名リストをコーパスとして使用することにより、構文解析統計モデル及び音訳モデルを同時に取得（訓練）することができる。構文解析統計モデルは、コーパスから構文解析された多重音節言語の副音節間の隣接関係、及びその確率を記録する。音訳モデルは、単音節言語の音節及びコーパスから構文解析された多重音節言語の副音節間の対応関係、及びそれらの確率（或いは、「翻訳関係」及び「翻訳確率」と称する）をそれぞれ記録する。

図３は、本発明の一実施形態による単音節言語から多重音節言語への音訳方法をフローチャートにしたものである。本実施形態は、図面を参照し、以下に説明される。上記実施形態と同一のエレメントについては、その説明は適宜に省略される。

図３に示すように、最初にステップ３０５では、音訳すべき単音節言語の単語に対応する音節列が取得される。本実施形態では、音訳すべき中国語の単語を対応する音節列に翻訳するために発音辞典（本実施形態では、即ち、漢字ぴん音辞典）が使用される。表６は、発音辞典の例を示す。

ここでは、音訳対象の中国語の単語を対応する音節列に翻訳するために発音辞典を必要としない場合もあることは注目に値する。例えば、音訳すべき単音節言語の単語が日本語のカタカナである場合、カタカナ系列は、音節列として直接使用できる。

次に、ステップ３１０において、音節列の各音節に対応する多重音節言語の少なくとも１つの副音節、及びその音訳確率が音訳モデルに従って取得される。音訳モデルに関するコンテンツは、上記実施形態で説明されているので、ここでは省略する。

次に、ステップ３１５では、音節列に対応する最高確率を持つ副音節列が、構文解析モデルに基づいて探索される。上記実施形態の探索プロセスと同様に、本実施形態では、構文解析モデルの各副音節対の発生確率及び上記音訳モデルから得られた音節/副音節対の翻訳確率に基づく探索アルゴリズムを用いて、単音節言語の単語に対応する最高確立を持つ副音節列が算出される。本実施形態において、探索はビタビアルゴリズムを用いて行われる。しかしながら、例えば、Ａ*アルゴリズム、縦型アルゴリズム及び横型アルゴリズム等、その他の探索アルゴリズムを使用することもできる。これらのアルゴリズムはまた組み合わせて使用することができる。

最後に、ステップ３２０では、多重音節言語の音訳結果として副音節列が出力される。

上記の説明から、単音節言語から多重音節言語への自動音訳は、本実施形態の単音節言語から多重音節言語への音訳方法を使用することにより効率的に実行できることが理解できる。また、音訳処理を遂行するに当たり、音声合成を必要としない為、信頼と精度が向上する。

更に、多重音節言語の「副音節」と単音節言語の「音節」との翻訳関係、及びそれらの翻訳確率が音訳モデルに記録されているため、本発明の自動音訳技術は、単音節言語から多重音節言語への自動音訳のみならず、多重音節言語から単音節言語への自動音訳をも実現可能とする。

図４は、本発明の一実施形態による多重音節言語から単音節言語への音訳方法をフローチャートにしたものである。本実施形態は、図面を参照して下記に説明される。上記実施形態と同一の部分に関しては、図面及び説明において同一の文字や数字が用いられ、説明は適宜に省略される。

図４に示す通り、最初にステップ４０５で、音訳を要する多重音節言語の単語が副音節列に構文解析される。具体的には、構文解析は、構文解析の規則或いは構文解析統計モデルを使用して行われる。上記実施形態で説明された説明に関しては、ここでは省略する。

次に、ステップ４１０において、副音節列の各副音節に対応する単音節言語の少なくとも１つの音節及びその翻訳確率が音訳モデルに従って取得される。

次に、ステップ４１５において、発音辞典を使用し、単音節言語の各音節に対応する文字が取得される。

次に、ステップ４２０において、副音節列に対応する確率が最も高い文字列が単音節言語の言語モデルに基づいて探索される。ここで、単音節言語の言語モデルは、上述した多重音節言語の構文解析統計モデルと類似し、そこには単音節言語の音節（又は文字）間の隣接関係及び確率が記録されている。表７は、言語モデルの例を示す。

上述の多重音節言語の構文解析モデルと同様に、単音節言語の言語モデルにおける音節対（文字対）の発生確率を計算する方法は数通りある。例えば、本実施形態では、文字対の発生数をその文字対における一番目の文字の合計発生数で割ることにより得られた比率を採用している。当然、その他の手法を用いることもでき、例えば、文字対の発生数をその文字対の二番目の文字の合計発生数で割ることにより得られる比率、また文字対の発生数をその文字対の一番目及び二番目の文字の合計発生数で割ることにより得られる比率を使用する等が挙げられる。

ステップ４２０において、多重音節言語の単語に対応する確率が最も高い文字列は、言語モデルにおける各文字対の発生確率及び上記音訳モデルから取得された各音節/副音節対の翻訳確率に基づく探索アルゴリズムを用いて計算される。上記実施形態の探索プロセスと同様に、本実施形態では探索はビタビアルゴリズムを用いて行われる。しかしながら、例えば、Ａ*アルゴリズム、縦型アルゴリズム及び横型アルゴリズム等、その他の探索アルゴリズムを使用することもでき、これらのアルゴリズムは組み合わせて使用することもできる。

最後に、ステップ４２５では、文字列は、単音節言語の音訳結果として出力される。

上記の説明から、多重音節言語から単音節言語への自動音訳は、本実施形態の多重音節言語から単音節言語への音訳方法を使用することにより効率的に実現できることが理解できる。また、音訳処理を遂行するのに、音声合成を必要としない為、信頼と精度が向上する。

図５は、本発明の別の実施形態に従った多重音節言語から単音節言語への音訳方法をフローチャートにしたものである。本実施形態は、図面を参照し、下記に説明される。上記実施形態と同一の部分に関しては、図面及び説明において同一の文字や数字が用いられ、説明は適宜に省略される。

図５に示すように、本実施形態の方法はステップ５０５から５１５において先の実施形態とは異なる。ステップ５０５では、多重音節言語の単語に対応する最高確率を持つ副音節列が、構文解析モデルに従って探索アルゴリズムを用いて計算される。

次に、ステップ５１０では、先のステップ５０５で計算された最高確率が、規定の閾値よりも高いか否かを判断する。確率が閾値よりも高い場合、ステップ４１０の処理に進み、以降の処理は図４に示した実施形態と同様である。確率が閾値よりも低い場合は、ステップ５１５のプロセスへと進む。

ステップ５１５では、構文解析の規則を用いて単語を構文解析し、その後、ステップ４１０以降のプロセスが実行される。

よって、本実施形態では、構文解析統計モデルを使用しても十分に信頼できる構文解析結果が得られない時は、構文解析の規則を用いて構文解析を行うことにより、構文解析統計モデルの不足分を補い、基本的な精度を確保する。

図６は、本発明の一実施形態による構文解析統計モデル及び音訳モデルを訓練する装置のブロック図である。本実施形態は、図面を参照し、以下に説明される。上記実施形態と同一の部分に関しては、説明は適宜に省略される。

図６に示すように、本実施形態の構文解析統計モデル及び音訳モデルを訓練する装置６００は、コーパスとして二カ国語固有人名リストを入力するコーパス入力ユニット６０１と、構文解析の規則を用いて、二カ国語固有人名リスト中の多重音節言語の固有人名を副音節列に構文解析する規則構文解析ユニット６０２と、二カ国語固有人名リスト中の対応する単音節言語の固有人名に従って、多重音節言語の固有人名の構文解析が正確か否かの判断をする構文解析判断ユニット６０３と、正確と判断された構文解析の結果に基づいて、構文解析統計モデルを訓練する構文解析統計モデル訓練ユニット６０４と、を含む。構文解析統計モデル訓練ユニット６０４は、正確と決定された多重音節言語の固有人名から構文解析された副音節列中の副音節間の隣接関係に基づいて、隣接副音節の各対の発生確率を計算するよう構成された、構文解析確率計算器６０４１を含む。これらの副音節対及び算出されたこれらの副音節対の発生確率は、構文解析統計モデル６０５に記録される。

図６に示すように、装置６００は、構文解析統計モデルを使用し、副音節列に不正確に構文解析されたと判断された多重音節言語の固有人名を構文解析するモデル構文解析ユニット６０６と、正確に構文解析されたと決定された多重音節言語の固有人名及び二カ国語固有人名リスト中の対応する単音節言語の固有人名に基づいて、音訳モデルを訓練する音訳モデル訓練ユニット６０７とを更に含む。モデル構文解析ユニット６０６は、多重音節言語の単語を構文解析した後に最も高い確率を持つ副音節列を、構文解析統計モデルに基づく探索アルゴリズムを用いて計算するよう構成された探索ユニット６０６１を含む。音訳モデル訓練ユニット６０７は、正確に構文解析されたと決定される多重音節言語の固有人名から構文解析された副音節列中のそれぞれの副音節及び対応する単音節言語の固有人名中の対応する音節の間の対応関係に基づいて、それぞれの副音節/音節対の翻訳確率を計算するよう構成された翻訳確率計算機６０７１を含む。これらの副音節/音節対及び計算された副音節/音節対の翻訳確率（発生確率）は、音訳モデル６０８に記録される。

構文解析統計モデル及び音訳モデルの構造、多重音節言語の単語の構文解析、及び探索方法等の詳細な説明は上述されているため、ここでは省略する。

本実施形態における構文解析統計モデル及び音訳モデルを訓練する装置６００、及びそれぞれの構成要素は、特殊な回路やチップにより構成可能、或いは、対応するプログラムを実行するコンピュータ（プロセッサ）により実施可能である。更に、本実施形態の構文解析統計モデル及び音訳モデルを訓練する装置６００は、図１及び２と関連して説明される実施形態における構文解析統計モデル及び／又は音訳モデルを訓練する方法を実用上実施できる。

図７は、本発明の一実施形態による単音節言語から多重音節言語に音訳する装置のブロック図である。本実施形態は、図面を参照し、下記に説明される。上記実施形態と同一のエレメントに関しては、説明は適宜に省略される。

図７に示すように、本実施形態における単音節言語から多重音節言語へ音訳をする装置７００は、音訳対象の単音節言語の単語に対応する音節列を取得する音節列取得ユニット７０１と、中国語ぴん音のような単音節言語の文字の発音を自身に記録する、発音辞典７０４と、単音節言語の音節と多重音節言語の副音節との翻訳関係、及びそれぞれの翻訳確率を含む、音訳モデル７０３と、音訳モデル７０３を使用し、音節列中の各音節に対応する多重言語の少なくとも一副音節、及びその翻訳確率を取得する、副音節翻訳ユニット７０２と、多重音節言語の副音節構文解析確率を含む、構文解析統計モデル７０６と、構文解析統計モデル７０６及び副音節翻訳ユニット７０２により取得された音節列中の各音節に対応する多重音節言語の少なくとも１つの副音節及びその翻訳確率を使用し、音訳結果として音節列取得ユニット７０１により取得された音節列に対応する最高確率を持つ副音節列を探索するよう構成された探索ユニット７０５とを含む。

構文解析統計モデル及び音訳モデルの構造、音節及び副音節の翻訳、及び探索方法等の詳細な説明は、上記になされているのでここでは省略する。

本実施形態における単音節言語から多重音節言語への音訳のための装置７００及びその各構成要素は、特殊な回路やチップにより構成され、或いは、対応するプログラムを実行するコンピュータ（プロセッサ）により実施される。更に、本実施形態における単音節言語から多重音節言語へ音訳する装置７００は、図３に関連して説明された実施形態における単音節言語から多重音節言語へ音訳する方法を実用上実施できる。

図８は、本発明の一実施形態による多重音節言語から単音節言語へ音訳する装置のブロック図である。本実施形態は、図面を参照し、以下説明する。上記実施形態と同一の部分に関しては、説明は適宜に省略される。

図８に示すように、本実施形態における多重音節言語から単音節言語へ音訳をする装置８００は、副音節列に音訳する必要がある多重音節言語の単語を構文解析する副音節構文解析ユニット８０１と、単音節言語の音節と多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率をそれぞれ含む音訳モデル８０３と、音訳モデル８０３を使用し、副音節構文解析ユニット８０１から構文解析された副音節列中の各副音節に対応する単音節言語の少なくとも１つの音節、及びその翻訳確率を取得する音節翻訳ユニット８０２と、単音節言語の各音節に対応する文字を取得する文字翻訳ユニット８０６と、単音節言語の文字隣接確率を含む言語モデル８０４と、言語モデル８０４及び音節翻訳ユニット８０２により取得された副音節列中の各副音節に対応する単音節言語の少なくとも１つの音節及びその翻訳確率を使用し、音訳結果として副音節列に対応する最高確率を持つ文字列を探索するよう構成された探索ユニット８０５とを含む。

副音節構文解析ユニット８０１は、多重音節言語の副音節構文解析確率を含む構文解析統計モデル８０１１と、構文解析統計モデルに基づく探索アルゴリズムを使用し、多重音節言語の単語に対応する確率が最も高い副音節列を計算するモデル構文解析ユニット８０１２と、構文解析の規則を使用し、多重音節言語の単語を副音節列に構文解析するよう構成された規則構文解析ユニット８０１３とを含む。

構文解析統計モデル、言語モデル及び音訳モデルの構造、多重音節言語の単語の構文解析、音節及び副音節の翻訳、及び探索方法等の詳細な説明は上述の通りであるため、ここでは省略する。

本実施形態における多重音節言語から単音節言語への音訳のための装置８００及びその各構成要素は、特殊な回路やチップにより構成され、或いは、対応するプログラムを実行するコンピュータ（プロセッサ）により実施される。更に、本実施形態の多重音節言語から単音節言語へ音訳する装置８００は、図４及び図５に関連して説明された実施形態における多重音節言語から単音節言語へ音訳する方法を実用上実施できる。

構文解析統計モデル及び音訳モデルを訓練する方法及び装置、及び単音節言語から多重音節言語及び多重音節言語から単音節言語へ音訳する方法及び装置がいくつかの模範的な実施形態を用いて詳細に説明されてきたが、これらの実施形態は全てを網羅するわけではなく、当業者においては、本発明の精神と範囲内で様々な変化や改良を加えることであろう。そのため、本発明はこれらの実施形態に制限されず、添付の請求項は本発明の範囲を単に定義付けするに過ぎない。

本発明の一実施形態による構文解析統計モデルを訓練する方法を示したフローチャートである。本発明の一実施形態による構文解析統計モデル及び音訳モデルを訓練する方法を示したフローチャートである。本発明の一実施形態による単音節言語から多重音節言語への音訳方法を示したフローチャートである。本発明の一実施形態による多重音節言語から単音節言語への音訳方法を示したフローチャートである。本発明の別の実施形態による多重音節言語から単音節言語への音訳方法を示したフローチャートである。本発明の一実施形態による構文解析統計モデル及び音訳モデルを訓練する装置を示したブロック図である。本発明の一実施形態による単音節言語から多重音節言語への音訳のための装置を示したブロック図である。本発明の一実施形態による多重音節言語から単音節言語への音訳のための装置を示したブロック図である。

Claims

単音節言語及び多重音節言語間の音訳に用いられ、前記多重音節言語の副音節構文解析確率を含む、構文解析統計モデルを訓練する方法であって、
前記多重音節言語の複数の固有人名及び前記単音節言語の対応する固有人名を含む二カ国語固有人名リストをコーパスとして入力するステップと、
前記二カ国語固有人名リスト内の多重音節言語の前記各複数の固有人名を、構文解析の規則を用いて副音節列に構文解析するステップと、
前記二カ国語固有人名リスト内の前記単音節言語の対応する固有人名に従って、前記構文解析が正確か否かを判断するステップと、
正確と決定された構文解析結果に基づき、前記構文解析統計モデルを訓練するステップとを含む、構文解析統計モデル訓練方法。
前記構文解析が正確か否かを判断するステップは、
前記多重音節言語の前記固有人名から構文解析された前記副音節列中の副音節の数が、前記二カ国語固有人名リスト内の単音節言語の前記対応固有人名の音節の数に等しいか否かを判断し、等しい場合は、構文解析を正確であると決定し、さもなければ、構文解析を不正確と決定することを含む、請求項１記載の構文解析統計モデル訓練方法。
前記構文解析統計モデルを使用し、不正確に構文解析されたと決定された多重音節言語の固有人名を再度構文解析するステップと、
前記判断及び訓練するステップを繰り返すステップと、を含む、請求項１又は２記載の構文解析統計モデル訓練方法。
前記構文解析統計モデルを訓練するステップは、
正確と決定された多重言語の前記固有人名から構文解析された副音節列中の副音節間の隣接関係に基づいて、隣接副音節各対の発生確率を計算するステップと、
前記構文解析統計モデルに前記各副音節対及びその発生確率を記録するステップと、を含む、請求項２記載の構文解析統計モデル訓練方法。
単音節言語及び多重音節言語間の音訳に使用される、前記多重音節言語の副音節構文解析確率を含む構文解析統計モデル及び前記単音節言語の音節と多重音節言語の副音節との翻訳関係及びそれらの翻訳確率をそれぞれ含む音訳モデルを訓練する方法であり、
請求項１乃至４のいずれか１つの方法を使用して、前記構文解析統計モデルを訓練するステップと、
正確に構文解析されたと決定される多重音節言語の固有人名及び前記二カ国語固有人名リスト内の単音節言語の前記対応固有人名に基づいて前記音訳モデルを訓練するステップと、を含む、音訳モデル訓練方法。
前記音訳モデル訓練ステップは、
正確に構文解析されたと決定される多重音節言語の前記固有人名から構文解析された前記副音節列中の各副音節と単音節言語の対応する固有人名との対応関係に基づいて、各副音節／音節対の翻訳確率を計算するステップと、
前記各副音節／音節対及びその翻訳確率を前記音訳モデルに記録するステップと、を含む、請求項５記載の構文解析統計モデル及び音訳モデルを訓練する方法。
単音節言語から多重音節言語へ音訳する方法であって、
音訳対象の前記単音節言語の単語に対応する音節列を取得ステップと、
前記単音節言語の音節と前記多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルに従って、前記音節列中の各音節に対応する前記多重音節言語の少なくとも１つの副音節及びその翻訳確率を取得するステップと、
前記多重音節言語の副音節構文解析確率を含む構文解析統計モデルに基づいて、音訳結果として前記音節系列に対応する最高確率を有する副音節列を探索するステップと、を含む、音訳方法。
前記単音節言語の単語に対応する音節列を取得する前記ステップは、
発音辞典を使用して前記単音節言語の単語に対応する音節列を取得するステップを含む、請求項７記載の単音節言語から多重音節言語へ音訳する方法。
前記音節列に対応する最高確率を有する副音節列を探索する前記ステップは、
前記音節列中の各音節に対応する前記多重音節言語の少なくとも１つの副音節及びその翻訳確率及び前記構文解析統計モデルにおける前記副音節構文解析確率に基づいて、最高確率を持つ副音節列を探索するため、探索アルゴリズムを用いて計算するステップを含む、請求項７記載の単音節言語から多重音節言語へ音訳をする方法。
前記探索アルゴリズムは、縦型探索、横型探索、Ａ*探索及びビタビアルゴリズムのいずれか一つ又は組み合わせである、請求項９に記載の単音節言語から多重音節言語へ音訳する方法。
多重音節言語から単音節言語へ音訳する方法であって、
副音節列に音訳する必要がある前記多重音節言語の単語を構文解析するステップと、
前記単音節言語の音節と前記多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルに従って、前記副音節列中の各副音節に対応する前記単音節言語の少なくとも１つの音節及びその翻訳確率を取得するステップと、
単音節言語の各前記音節に対応する文字を取得するステップと、
前記単音節言語の文字隣接確率を含む言語モデルに基づいて、翻訳結果として前記副音節列に対応する最高確率を持つ文字列を探索するステップと、を含む、音訳方法。
前記多重音節言語の単語を構文解析する前記ステップは、
前記多重音節言語の副音節構文解析確率を含む構文解析統計モデルに基づいて、前記多重音節言語の単語に対応する最高確率を有する副音節列を探し出すため探索アルゴリズムを使用して計算するステップを含む、請求項１１に記載の多重音節言語から単音節言語へ音訳する方法。
前記多重音節言語の単語を構文解析する前記ステップは、
前記最高確率が所定閾値よりも低い場合、構文解析規則を使用して多重音節言語の前記単語を構文解析するステップを含む、請求項１２に記載の多重音節言語から単音節言語へ音訳する方法。
単音節言語の前記各音節に対応する文字を取得する前記ステップは、
発音辞典を使用して単音節言語の前記各音節に対応する文字を取得するステップを含む、請求項１１に記載の多重音節言語から単音節言語へ音訳する方法。
前記副音節列に対応する最高確率を持つ文字列を探索する前記ステップは、
前記副音節列中の各副音節に対応する前記単音節言語の少なくとも一文字及びその翻訳確率並びに前記言語モデルにおける文字隣接確率に基づいて、最高確率を持つ文字列を探索するため、探索アルゴリズムを用いて計算するステップを含む、請求項１１に記載の多重音節言語から単音節言語へ音訳する方法。
前記探索アルゴリズムは、縦型探索、横型探索、Ａ*探索及びビタビアルゴリズムのいずれか一つ又は組み合わせである、請求項１１又は１５記載の多重音節言語から単音節言語へ音訳する方法。
単音節言語及び多重音節言語間の音訳に用いられ、前記多重音節言語の副音節構文解析確率を含む、構文解析統計モデルを訓練する装置であって、
前記多重音節言語の複数の固有人名及び前記単音節言語の対応する固有人名を含む二カ国語固有人名リストをコーパスとして入力するコーパス入力ユニットと、
前記二カ国語固有人名リスト内の多重音節言語の前記複数の固有人名を、構文解析の規則を用いて副音節列に構文解析する規則構文解析ユニットと、
前記二カ国語固有人名リスト内の前記単音節言語の対応する固有人名に従って、多重音節言語の前記固有人名の構文解析が正確か否かを判断する構文解析判断ユニットと、
正確と決定された構文解析結果に基づいて、前記構文解析統計モデルを訓練する構文解析統計モデル訓練ユニットとを具備する、構文解析統計モデル訓練装置。
前記構文解析判断ユニットは、前記多重音節言語の前記固有人名から構文解析された前記副音節列中の副音節の数と、前記二カ国語固有人名リスト内の単音節言語の対応する前記固有人名中の音節の数とが等しいか否かを判断し、等しい場合は、構文解析を正確であると決定し、さもなければ、構文解析を不正確と決定する、請求項１７に記載の構文解析統計モデル訓練装置。
前記構文解析統計モデルを使用し、不正確に構文解析されたと決定された多重音節言語の固有人名を再度構文解析するモデル構文解析ユニットを更に含む、
請求項１７又は１８記載の構文解析統計モデル訓練装置。
前記構文解析統計モデル訓練ユニットは、
正確と決定された多重音節言語の前記固有人名から構文解析された副音節列中の副音節間の隣接関係に基づいて、各隣接副音節対の発生確率を計算する構文解析確率計算機を更に含む、
請求項１７記載の構文解析統計モデル訓練装置。
正確に構文解析されたと決定される多重音節言語の固有人名、及び前記二カ国語固有人名リスト内の単音節言語の対応する固有人名に基づいて、音訳モデルを訓練する音訳モデル訓練ユニットを更に含み、前記音訳モデルは、単音節言語及び多重音節言語間の音訳に使用され、前記単音節言語の音節と前記多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む、
請求項１７乃至２１のいずれか１に記載の構文解析統計モデル訓練装置。
正確に構文解析されたと決定される多重音節言語の前記固有人名から構文解析された副音節列中の各副音節と単音節言語の対応する固有人名中の対応する音節との対応関係に基づいて、各副音節／音節対の翻訳確率を計算する翻訳確率計算機を更に含む、
請求項２１記載の構文解析統計モデル訓練装置。
単音節言語から多重音節言語へ音訳する装置であって、
音訳対象の前記単音節言語の単語に対応する音節列を取得する音節列取得ユニットと、
前記単音節言語の音節と前記多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルと、
前記音節列取得ユニットにより取得された前記音節列中の各音節に対応する前記多重言語の少なくとも１つの副音節、及び前記音訳モデルを用いることによりその翻訳確率を取得する副音節訓練ユニットと、
前記多重音節言語の副音節構文解析確率を含む構文解析統計モデルと、
前記構文解析統計モデル、前記音節列中の各音節に対応する前記多重音節言語の少なくとも１つの副音節及びその翻訳確率に基づいて、音訳結果として前記音節列に対応する最高確率を持つ副音節列を探索する探索ユニットと、を具備する音訳装置。
前記単音節言語の文字の発音を含む発音辞典を更に含み、
前記音節列取得ユニットは前記発音辞典に基づいて前記単音節言語の単語に対応する音節列を取得する、
請求項２３記載の単音節言語から多重音節言語へ音訳する装置。
前記探索ユニットは、前記音節列中の各音節に対応する前記多重音節言語の前記少なくとも１つの副音節及びその翻訳確率並びに前記構文解析統計モデルの副音節構文解析確率に基づいて、最高確率を持つ副音節列を見つけるため、探索アルゴリズムを用いて計算する、請求項２３記載の単音節言語から多重音節言語へ音訳する装置。
前記探索アルゴリズムは、縦型探索、横型探索、Ａ*探索及びビタビアルゴリズムのいずれか一つ又は組み合わせである、請求項２５記載の単音節言語から多重音節言語へ音訳する装置。
多重音節言語から単音節言語へ音訳する装置であって、
副音節列に音訳する必要がある前記多重音節言語の単語を構文解析する副音節構文解析ユニットと、
前記単音節言語の音節と前記多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルと、
前記音訳モデルに従って、前記副音節列中の各副音節に対応する前記単音節言語の少なくとも１との音節及びその翻訳確率を取得する音節翻訳ユニットと、
単音節言語の前記各音節に対応する文字を取得する文字翻訳ユニットと、
前記単音節言語の文字隣接確率を含む言語モデルと、
前記言語モデル、前記音節翻訳ユニットにより取得された前記副音節列中の各副音節に対応する前記単音節言語の少なくとも１つの音節及びその翻訳確率に基づいて、音訳結果として、前記副音節列に対応する最高確率を持つ文字列を探索する探索ユニットとを含む、音訳装置。
前記副音節構文解析ユニットは、
前記多重音節言語の副音節構文解析確率を含む構文解析統計モデルと、
前記構文解析統計モデルに基づいて、探索アルゴリズムを使用して多重音節言語の前記単語に対応する最高確率を持つ副音節列を見つけるために計算をするモデル構文解析ユニットと、を含む、
請求項２７記載の多重音節言語から単音節言語へ音訳する装置。
前記副音節構文解析ユニットは、
構文解析規則を用いて多重音節言語の前記単語を構文解析する規則構文解析ユニットを更に含む、
請求項２８記載の多重音節言語から単音節言語へ音訳する装置。
前記単音節言語の文字の発音を含む発音辞典を更に含む、
請求項２７記載の多重音節言語から単音節言語へ音訳する装置。
前記探索ユニットは、前記副音節列中の各副音節に対応する前記単音節言語の少なくとも１つの文字及びその翻訳確率並びに前記言語モデルの文字隣接確率に基づいて、最高確率を持つ文字列を見つけるため、探索アルゴリズムを用いて計算する、請求項２７記載の多重音節言語から単音節言語へ音訳する装置。
前記探索アルゴリズムは、縦型探索、横型探索、Ａ*探索及びビタビアルゴリズムのいずれか一つ又は組み合わせである、請求項２８又は３１記載の多重音節言語から単音節言語へ音訳する装置。