JP2007109233A - 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置 - Google Patents

音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置 Download PDF

Info

Publication number
JP2007109233A
JP2007109233A JP2006276947A JP2006276947A JP2007109233A JP 2007109233 A JP2007109233 A JP 2007109233A JP 2006276947 A JP2006276947 A JP 2006276947A JP 2006276947 A JP2006276947 A JP 2006276947A JP 2007109233 A JP2007109233 A JP 2007109233A
Authority
JP
Japan
Prior art keywords
syllable
language
parsing
subsyllable
transliteration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006276947A
Other languages
English (en)
Other versions
JP4886459B2 (ja
Inventor
Haifen Wan
ワン・ハイフェン
Yuukin Guo
グオ・ユーキン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of JP2007109233A publication Critical patent/JP2007109233A/ja
Application granted granted Critical
Publication of JP4886459B2 publication Critical patent/JP4886459B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models

Abstract

【課題】本発明は、構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置を提供する。
【解決手段】構文解析統計モデルは、単音節言語及び多重音節言語間の音訳に使用され、多重音節言語の副音節構文解析確率を含む。構文解析統計モデルを訓練する方法は、コーパスとして二カ国語固有人名リストを入力し、二カ国語固有人名リストは、多重音節言語の複数の固有人名及び単音節言語の対応する固有人名をそれぞれ含み、この方法は、構文解析の規則を用いて二カ国語固有人名リスト内の多重音節言語の複数の固有人名をそれぞれ副音節列に構文解析し、二カ国語固有人名リスト内の単音節言語の対応する固有人名に従って、構文解析が正確か否かを判断し、正確と決定された構文解析結果に基づき、構文解析統計モデルを訓練する。
【選択図】 図1

Description

本発明は、情報処理技術に関連し、とりわけ、コンピュータを用いた音訳技術、及び音訳の際に用いられる音訳モデルや構文解析モデルを訓練する技術に関する。
いわゆる「音訳」とは、ある言語の単語を他の言語の類似した発音の単語に翻訳することを言う。例えば、音訳方法は固有人名を翻訳する時に頻繁に用いられる。以前は、通常、固有人名を翻訳するため、二カ国語の辞典が使用されてきた。そのような二カ国語の辞典(例えば、二ヶ国語固有人名辞典)は、言語学者や関連する分野の専門家により編集され、非常に高精度である。
しかしながら、如何に大きな二カ国語辞典であっても全ての語彙を網羅することはできない。そのため、求めている単語が辞典に見つからないと言う状況に頻繁に遭遇することがある。更に、時間や社会の発展と共に、継続的に新たな単語が生まれ、この状況を更に悪化させている。そのため、長い間、二カ国語間の自動音訳を実現させるための自動音訳方法及び装置が必要とされてきた。このような自動音訳技術はまた、機械翻訳、クロス言語情報検索及び情報抽出に対しても重要である。
既存の自動音訳技術は、例えば、非特許文献1に記述されている。この文献は、統計的な機械翻訳技術に基づく英語から中国語への音訳方法について説明しており、下記表1にその具体的な方法が示されている。
その方法とは、
(1)英語の単語をCMUにより開発されたフェスティバル音声合成システムを用いて、発音を表す音系列に変換する。
(2)IBM翻訳モデルを用いて、英語の音系列を漢字の発音を表すイニシャル及びファイナル系列に変換する。
(3)イニシャル及びファイナル系列を組み合わせて中国語のぴん音音節を形成する。
(4)再びIBM翻訳モデルを用いて、中国語のぴん音を漢字に変換する。
(5)CMUにより開発された言語モデルを用いて、漢字を組み合わせて中国語音訳された単語を形成する。
Figure 2007109233
上述の自動音訳方法には、二つの問題点がある。即ち、
(1)英単語を発音系列に変換するためには、それを支援するための音声合成システムが必要であり、その既存の音声合成技術が未熟であることから、音訳中に更なるエラーが生じる。そして、辞典の大きさが制限されているため、発音辞典を用いて英単語発音をマークする方法は、辞典に載っていない単語をマークする問題を解決することができず、とりわけ、この問題は、音訳が必要とされる固有人名及び新たに出現した単語に対して顕著となる。
(2)英語は、多重音節言語(すなわち、一英単語は通常複数の音節を含む)である一方、中国語は、単音節言語(すなわち、漢字一文字が一音節)であり、英語の文字、音、音節また単語のいずれも中国語の自然単位である漢字に対応することができない。そのため、上記論文による方法は、英語から中国語音訳にのみ適切であり、中国語から英語音訳には適さない。
"Transliteration of Proper Names in Cross-Lingual Information Retrieval", Paola Virga and Sanjeev Khudanpur, Proceedings of 41st ACL Workshop on Multilingual and Mixed-language Named Entity Recognition, pp. 57-64, 2003。
従来技術における上記の問題を解決するために、本発明は、構文解析統計モデル及び音訳モデルを訓練する方法及び装置、また、単音節言語から多重音節言語、及び多重音節言語から単音節言語への音訳のための方法及び装置を提供する。
本発明の一実施形態によると、単音節言語と多重音節言語との間の音訳に用いられ、多重音節言語の副音節構文解析確率を含む、構文解析統計モデルを訓練する方法であって、多重音節言語の複数の固有人名及び単音節言語の対応する固有人名を含む二カ国語固有人名リストをコーパスとして入力するステップと、二カ国語固有人名リスト内の多重音節言語の複数の固有人名の各々を、構文解析の規則を用いて副音節列に構文解析するステップと、二カ国語固有人名リスト内の単音節言語の対応する固有人名に従って、構文解析が正確か否かを判断するステップと、正確と決定された構文解析結果に基づき、構文解析統計モデルを訓練するステップとを含む、構文解析統計モデル訓練方法を提供する。
本発明の別の実施形態によると、単音節言語及び多重音節言語間の音訳に使用される、多重音節言語の副音節構文解析確率を含む構文解析統計モデル及び単音節言語の音節と多重音節言語の副音節との翻訳関係及びそれらの翻訳確率をそれぞれ含む音訳モデルを訓練する方法であり、上述の構文解析統計モデル訓練を使用して、構文解析統計モデルを訓練するステップと、正確に構文解析されたと決定される多重音節言語の固有人名及び二カ国語固有人名リスト内の単音節言語の対応固有人名に基づいて音訳モデルを訓練するステップと、を含む、音訳モデル訓練方法を提供する。
本発明の別の実施形態によると、単音節言語から多重音節言語へ音訳する方法であって、音訳対象の単音節言語の単語に対応する音節列を取得ステップと、単音節言語の音節と多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルに従って、音節列中の各音節に対応する多重音節言語の少なくとも1つの副音節及びその翻訳確率を取得するステップと、多重音節言語の副音節構文解析確率を含む構文解析統計モデルに基づいて、音訳結果として音節系列に対応する最高確率を有する副音節列を探索するステップと、を含む、音訳方法を提供する。
本発明の別の実施形態によると、多重音節言語から単音節言語へ音訳する方法であって、副音節列に音訳する必要がある多重音節言語の単語を構文解析するステップと、単音節言語の音節と多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルに従って、副音節列中の各副音節に対応する単音節言語の少なくとも1つの音節及びその翻訳確率を取得するステップと、単音節言語の各音節に対応する文字を取得するステップと、単音節言語の文字隣接確率を含む言語モデルに基づいて、翻訳結果として副音節列に対応する最高確率を持つ文字列を探索するステップと、を含む、音訳方法を提供する。
本発明の別の実施形態によると、単音節言語及び多重音節言語間の音訳に用いられ、多重音節言語の副音節構文解析確率を含む、構文解析統計モデルを訓練する装置であって、多重音節言語の複数の固有人名及び単音節言語の対応する固有人名を含む二カ国語固有人名リストをコーパスとして入力するコーパス入力ユニットと、二カ国語固有人名リスト内の多重音節言語の複数の固有人名を、構文解析の規則を用いて副音節列に構文解析する規則構文解析ユニットと、二カ国語固有人名リスト内の単音節言語の対応する固有人名に従って、多重音節言語の固有人名の構文解析が正確か否かを判断する構文解析判断ユニットと、正確と決定された構文解析結果に基づいて、構文解析統計モデルを訓練する構文解析統計モデル訓練ユニットとを具備する、構文解析統計モデル訓練装置を提供する。
本発明の別の実施形態によると、単音節言語から多重音節言語へ音訳する装置であって、音訳対象の単音節言語の単語に対応する音節列を取得する音節列取得ユニットと、単音節言語の音節と多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルと、音節列取得ユニットにより取得された音節列中の各音節に対応する多重言語の少なくとも1つの副音節、及び音訳モデルを用いることによりその翻訳確率を取得する副音節訓練ユニットと、多重音節言語の副音節構文解析確率を含む構文解析統計モデルと、構文解析統計モデル、音節列中の各音節に対応する多重音節言語の少なくとも1つの副音節及びその翻訳確率に基づいて、音訳結果として音節列に対応する最高確率を持つ副音節列を探索する探索ユニットと、を具備する音訳装置を提供する。
次に、図面を参照しながら本発明の各種実施形態を詳細に説明する。
多重音節言語の単語の発音をマークすることで生じた従来技術における更なるエラーを避けるため、本発明では、音訳を行うにあたり、英単語のような多重音節言語の単語を直接使用する手法を採用している。この目的で、本発明では副音節の概念を提案している。英語のような多重音節言語において、副音節は英語の文字と音節の間に位置する単位であり、表2に示す通り、対応する中国語のような単音節言語における単語の音節の一つ一つに相当する。
Figure 2007109233
本発明の自動音訳方法は、単音節言語の音節及び多重音節言語の副音節を基本単位として捉え、統計的モデルを使用することにより、双方向性音訳を実現する。本明細書では、本発明の実施形態を説明するにあたり、英語を多重音節言語の例として、また中国語を単音節言語の例として捉えている。本発明はまた、中国語−フランス語、中国語−ドイツ語、日本語−英語、日本語−ドイツ語等、他の単音節言語及び多重音節言語にも適用できることは注目に値する。
図1は、本発明の一実施形態による構文解析統計モデルの訓練方法を示すフローチャートである。本実施形態の方法により訓練された構文解析統計モデルは、後に他の実施形態と関連して説明される音訳方法及び装置において使用され、このモデルは多重音節言語の副音節構文解析確率を含む。
図1に示すように、最初にステップ105において二カ国語固有人名リストがコーパスとして入力され、二カ国語固有人名リストは、多重音節言語の複数の固有人名及び単音節言語の対応する固有人名をそれぞれ含む。具体的には、コーパスとして、例えば言語学者や関連する分野の専門家により編集された二カ国語固有人名辞典が使用される。表3は、英語−中国語二カ国語固有人名リストの例を示す。
Figure 2007109233
次に、ステップ110では、構文解析規則を用いて二カ国語固有人名リストに記載された多重音節言語のそれぞれの複数の固有人名を副音節列に構文解析する。以下は、本実施形態で使用される構文解析規則の一部である。即ち、
//4文字を含む母音の構文解析
「augh」が単語中に発見された場合、副音節として構文解析される。
「ough」が単語中又は単語の語尾に発見された場合、副音節として構文解析される。
・・・・
//3文字を含む母音の構文解析
「ore」が単語の語尾に発見された場合、副音節として構文解析される。
・・・・
//2文字を含む母音の構文解析
「ai」が単語の始め又は単語中に発見された場合、副音節として構文解析される。
「ey」が単語の語尾に発見された場合、副音節として構文解析される。
・・・・
//母音字の構文解析
単語中の母音字「a」「e」「i」「o」「u」「y」は、副音節として構文解析される。
その他の規則
「sh」「th」「tch」「ph」「ch」及び「wh」はそれぞれ子音の単位として構文解析される。
母音字及びそのすぐ左の子音字は、一つの副音節に合成される。
・・・・
次に、ステップ115では、二カ国語固有人名リスト内の単音節言語の対応する固有人名に従って、構文解析が正確に行われたか否かの判断がされる。具体的に、本実施形態では、多重音節言語の固有人名から構文解析された副音節列中の副音節の数が、二カ国語固有人名リスト内の単音節言語の対応する固有人名中の音節の数と等しいか否かが判断され、等しい場合は、構文解析が正確に行われたと決定され、また、そうでない場合は、構文解析は正確に行われなかったものと決定される。それらの正確な構文解析結果は、正確な構文解析集合に集められ(ステップ120)、それらの不正確な構文解析結果は、不正確な構文解析集合に集められる(ステップ130)。
続いて、ステップ125では、構文解析統計モデルは正確な構文解析結果に基づいて訓練される。具体的に、本実施形態では、正確に構文解析された多重言語の固有人名から構文解析された副音節列中の副音節間の隣接関係に基づいて、隣接する副音節の各対の発生確率が計算され、その副音節対及びそれらの発生確率が構文解析統計モデルに記録される。表4は、その構文解析統計モデルの例を示す。
Figure 2007109233
ここで、構文解析統計モデルにおいて、副音節対の発生確率を計算する方法はこの他にも数通りあることは注目に値する。例えば、本実施形態では、表4に示す比率は、副音節対の発生数をその副音節対中の第一副音節の合計発生数で割って得られたものを採用している。当然、その他のアプローチもあり、例えば、副音節対の発生数をその副音節対中の第二副音節の合計発生数で割ることにより得られた比率、或いは、副音節対の発生数をその副音節対中の第一及び第二副音節の合計発生数で割ることにより得られた比率等が挙げられる。
ステップ125までに、本実施形態の方法は構文解析統計モデルを得る(訓練する)ことができる。構文解析統計モデルは、コーパスから構文解析された多重音節言語の副音節間の隣接関係及びそれらの発生確率を記録する。
更に、ステップ135において、構文解析統計モデルを用いて、不正確な集合における多重音節言語の固有人名を再び構文解析することを望む場合、ステップ140の処理へと進む。またそうでなければステップ145に進み、処理が終了する。
ステップ140では、不正確な集合における多重音節言語の固有人名は、構文解析統計モデルに従って構文解析される。具体的には、多重音節言語の固有人名に対応する最高確率の副音節列が、構文解析統計モデルにおける各副音節対の発生確率に基づく探索アルゴリズムを用いて計算される。本実施形態では、探索はビタビアルゴリズムを用いて行われる。ビタビアルゴリズムの情報については、”Error bounds for convolutional codes and an asymptotically optimum decoding algorithm”, A.J. Viterbi, IEEE Trans. Inform. Theory, IT-13(2), pp. 260-269, 1967を参照する。
更に、例えば、A*アルゴリズム、縦型探索及び横型探索等、その他の探索アルゴリズムも使用することができる。これらのアルゴリズムはまた組み合わせて使用することができる。
次に、ステップ115に戻り、構文解析統計モデルによる構文解析は正確か否かが判断され、正確な結果は正確な集合に追加され(ステップ120)、不正確な結果は不正確な集合に追加され(ステップ130)、ステップ125が繰り返される。
よって、本実施形態においては、不正確な集合を構文解析するため繰り返し構文解析モデルを使用することができ、それにより構文解析統計モデルの順応性を更に訓練することができる。
図2は、本発明の一実施形態による構文解析統計モデル及び音訳モデルを訓練する方法をフローチャートに示したものである。本実施形態は、図面を参照しながら下記に説明される。上記実施形態と同一のエレメントに関しては、図面や記述においても上記と同じ文字、数字で表示され、説明は適切に省略される。
図2で示されるように、本実施形態のステップ105から140は、図1に示す実施形態のステップと同様である。相違点としては、本実施形態においては、ステップ135における判断が「No」の場合、ステップ205の処理に進むことである。
ステップ205において、音訳モデルは、正確に構文解析されたと決定された多重音節言語の固有人名と二カ国語固有人名リスト中の単音節言語の対応する固有人名に基づいて訓練される。具体的には、各副音節/音節対の翻訳確率は、正確に構文解析されたと決定された多重音節言語の固有人名から構文解析された副音節列中の各副音節と単音節言語の対応する固有人名中の対応する音節との対応関係に基づいて計算される。そして各副音節/音節対及びその翻訳確率は、音訳モデル中に記録される。表5は、音訳モデルの例を示す。
Figure 2007109233
上記で構文解析確率を計算した場合と同じように、音訳モデルにおいても、副音節/音節対の翻訳確率を計算する方法は数通りある。例えば、本実施形態においては、表5で示すように、副音節/音節対の発生数をその多重音節言語の副音節の合計発生数で割ることにより算出される比率を採用する。当然、その他の手法を用いることもできる。例えば、副音節/音節対の発生数をその多重音節言語の副音節及びその単音節言語の音節の合計発生数で割ることにより算出される比率の採用、或いは、副音節/音節対の発生数をその単音節言語の音節の合計発生数で割ることにより算出される比率の採用等である。
上記の説明から分かるように、本実施形態の方法では、二カ国語固有人名リストをコーパスとして使用することにより、構文解析統計モデル及び音訳モデルを同時に取得(訓練)することができる。構文解析統計モデルは、コーパスから構文解析された多重音節言語の副音節間の隣接関係、及びその確率を記録する。音訳モデルは、単音節言語の音節及びコーパスから構文解析された多重音節言語の副音節間の対応関係、及びそれらの確率(或いは、「翻訳関係」及び「翻訳確率」と称する)をそれぞれ記録する。
図3は、本発明の一実施形態による単音節言語から多重音節言語への音訳方法をフローチャートにしたものである。本実施形態は、図面を参照し、以下に説明される。上記実施形態と同一のエレメントについては、その説明は適宜に省略される。
図3に示すように、最初にステップ305では、音訳すべき単音節言語の単語に対応する音節列が取得される。本実施形態では、音訳すべき中国語の単語を対応する音節列に翻訳するために発音辞典(本実施形態では、即ち、漢字ぴん音辞典)が使用される。表6は、発音辞典の例を示す。
Figure 2007109233
ここでは、音訳対象の中国語の単語を対応する音節列に翻訳するために発音辞典を必要としない場合もあることは注目に値する。例えば、音訳すべき単音節言語の単語が日本語のカタカナである場合、カタカナ系列は、音節列として直接使用できる。
次に、ステップ310において、音節列の各音節に対応する多重音節言語の少なくとも1つの副音節、及びその音訳確率が音訳モデルに従って取得される。音訳モデルに関するコンテンツは、上記実施形態で説明されているので、ここでは省略する。
次に、ステップ315では、音節列に対応する最高確率を持つ副音節列が、構文解析モデルに基づいて探索される。上記実施形態の探索プロセスと同様に、本実施形態では、構文解析モデルの各副音節対の発生確率及び上記音訳モデルから得られた音節/副音節対の翻訳確率に基づく探索アルゴリズムを用いて、単音節言語の単語に対応する最高確立を持つ副音節列が算出される。本実施形態において、探索はビタビアルゴリズムを用いて行われる。しかしながら、例えば、A*アルゴリズム、縦型アルゴリズム及び横型アルゴリズム等、その他の探索アルゴリズムを使用することもできる。これらのアルゴリズムはまた組み合わせて使用することができる。
最後に、ステップ320では、多重音節言語の音訳結果として副音節列が出力される。
上記の説明から、単音節言語から多重音節言語への自動音訳は、本実施形態の単音節言語から多重音節言語への音訳方法を使用することにより効率的に実行できることが理解できる。また、音訳処理を遂行するに当たり、音声合成を必要としない為、信頼と精度が向上する。
更に、多重音節言語の「副音節」と単音節言語の「音節」との翻訳関係、及びそれらの翻訳確率が音訳モデルに記録されているため、本発明の自動音訳技術は、単音節言語から多重音節言語への自動音訳のみならず、多重音節言語から単音節言語への自動音訳をも実現可能とする。
図4は、本発明の一実施形態による多重音節言語から単音節言語への音訳方法をフローチャートにしたものである。本実施形態は、図面を参照して下記に説明される。上記実施形態と同一の部分に関しては、図面及び説明において同一の文字や数字が用いられ、説明は適宜に省略される。
図4に示す通り、最初にステップ405で、音訳を要する多重音節言語の単語が副音節列に構文解析される。具体的には、構文解析は、構文解析の規則或いは構文解析統計モデルを使用して行われる。上記実施形態で説明された説明に関しては、ここでは省略する。
次に、ステップ410において、副音節列の各副音節に対応する単音節言語の少なくとも1つの音節及びその翻訳確率が音訳モデルに従って取得される。
次に、ステップ415において、発音辞典を使用し、単音節言語の各音節に対応する文字が取得される。
次に、ステップ420において、副音節列に対応する確率が最も高い文字列が単音節言語の言語モデルに基づいて探索される。ここで、単音節言語の言語モデルは、上述した多重音節言語の構文解析統計モデルと類似し、そこには単音節言語の音節(又は文字)間の隣接関係及び確率が記録されている。表7は、言語モデルの例を示す。
Figure 2007109233
上述の多重音節言語の構文解析モデルと同様に、単音節言語の言語モデルにおける音節対(文字対)の発生確率を計算する方法は数通りある。例えば、本実施形態では、文字対の発生数をその文字対における一番目の文字の合計発生数で割ることにより得られた比率を採用している。当然、その他の手法を用いることもでき、例えば、文字対の発生数をその文字対の二番目の文字の合計発生数で割ることにより得られる比率、また文字対の発生数をその文字対の一番目及び二番目の文字の合計発生数で割ることにより得られる比率を使用する等が挙げられる。
ステップ420において、多重音節言語の単語に対応する確率が最も高い文字列は、言語モデルにおける各文字対の発生確率及び上記音訳モデルから取得された各音節/副音節対の翻訳確率に基づく探索アルゴリズムを用いて計算される。上記実施形態の探索プロセスと同様に、本実施形態では探索はビタビアルゴリズムを用いて行われる。しかしながら、例えば、A*アルゴリズム、縦型アルゴリズム及び横型アルゴリズム等、その他の探索アルゴリズムを使用することもでき、これらのアルゴリズムは組み合わせて使用することもできる。
最後に、ステップ425では、文字列は、単音節言語の音訳結果として出力される。
上記の説明から、多重音節言語から単音節言語への自動音訳は、本実施形態の多重音節言語から単音節言語への音訳方法を使用することにより効率的に実現できることが理解できる。また、音訳処理を遂行するのに、音声合成を必要としない為、信頼と精度が向上する。
図5は、本発明の別の実施形態に従った多重音節言語から単音節言語への音訳方法をフローチャートにしたものである。本実施形態は、図面を参照し、下記に説明される。上記実施形態と同一の部分に関しては、図面及び説明において同一の文字や数字が用いられ、説明は適宜に省略される。
図5に示すように、本実施形態の方法はステップ505から515において先の実施形態とは異なる。ステップ505では、多重音節言語の単語に対応する最高確率を持つ副音節列が、構文解析モデルに従って探索アルゴリズムを用いて計算される。
次に、ステップ510では、先のステップ505で計算された最高確率が、規定の閾値よりも高いか否かを判断する。確率が閾値よりも高い場合、ステップ410の処理に進み、以降の処理は図4に示した実施形態と同様である。確率が閾値よりも低い場合は、ステップ515のプロセスへと進む。
ステップ515では、構文解析の規則を用いて単語を構文解析し、その後、ステップ410以降のプロセスが実行される。
よって、本実施形態では、構文解析統計モデルを使用しても十分に信頼できる構文解析結果が得られない時は、構文解析の規則を用いて構文解析を行うことにより、構文解析統計モデルの不足分を補い、基本的な精度を確保する。
図6は、本発明の一実施形態による構文解析統計モデル及び音訳モデルを訓練する装置のブロック図である。本実施形態は、図面を参照し、以下に説明される。上記実施形態と同一の部分に関しては、説明は適宜に省略される。
図6に示すように、本実施形態の構文解析統計モデル及び音訳モデルを訓練する装置600は、コーパスとして二カ国語固有人名リストを入力するコーパス入力ユニット601と、構文解析の規則を用いて、二カ国語固有人名リスト中の多重音節言語の固有人名を副音節列に構文解析する規則構文解析ユニット602と、二カ国語固有人名リスト中の対応する単音節言語の固有人名に従って、多重音節言語の固有人名の構文解析が正確か否かの判断をする構文解析判断ユニット603と、正確と判断された構文解析の結果に基づいて、構文解析統計モデルを訓練する構文解析統計モデル訓練ユニット604と、を含む。構文解析統計モデル訓練ユニット604は、正確と決定された多重音節言語の固有人名から構文解析された副音節列中の副音節間の隣接関係に基づいて、隣接副音節の各対の発生確率を計算するよう構成された、構文解析確率計算器6041を含む。これらの副音節対及び算出されたこれらの副音節対の発生確率は、構文解析統計モデル605に記録される。
図6に示すように、装置600は、構文解析統計モデルを使用し、副音節列に不正確に構文解析されたと判断された多重音節言語の固有人名を構文解析するモデル構文解析ユニット606と、正確に構文解析されたと決定された多重音節言語の固有人名及び二カ国語固有人名リスト中の対応する単音節言語の固有人名に基づいて、音訳モデルを訓練する音訳モデル訓練ユニット607とを更に含む。モデル構文解析ユニット606は、多重音節言語の単語を構文解析した後に最も高い確率を持つ副音節列を、構文解析統計モデルに基づく探索アルゴリズムを用いて計算するよう構成された探索ユニット6061を含む。音訳モデル訓練ユニット607は、正確に構文解析されたと決定される多重音節言語の固有人名から構文解析された副音節列中のそれぞれの副音節及び対応する単音節言語の固有人名中の対応する音節の間の対応関係に基づいて、それぞれの副音節/音節対の翻訳確率を計算するよう構成された翻訳確率計算機6071を含む。これらの副音節/音節対及び計算された副音節/音節対の翻訳確率(発生確率)は、音訳モデル608に記録される。
構文解析統計モデル及び音訳モデルの構造、多重音節言語の単語の構文解析、及び探索方法等の詳細な説明は上述されているため、ここでは省略する。
本実施形態における構文解析統計モデル及び音訳モデルを訓練する装置600、及びそれぞれの構成要素は、特殊な回路やチップにより構成可能、或いは、対応するプログラムを実行するコンピュータ(プロセッサ)により実施可能である。更に、本実施形態の構文解析統計モデル及び音訳モデルを訓練する装置600は、図1及び2と関連して説明される実施形態における構文解析統計モデル及び/又は音訳モデルを訓練する方法を実用上実施できる。
図7は、本発明の一実施形態による単音節言語から多重音節言語に音訳する装置のブロック図である。本実施形態は、図面を参照し、下記に説明される。上記実施形態と同一のエレメントに関しては、説明は適宜に省略される。
図7に示すように、本実施形態における単音節言語から多重音節言語へ音訳をする装置700は、音訳対象の単音節言語の単語に対応する音節列を取得する音節列取得ユニット701と、中国語ぴん音のような単音節言語の文字の発音を自身に記録する、発音辞典704と、単音節言語の音節と多重音節言語の副音節との翻訳関係、及びそれぞれの翻訳確率を含む、音訳モデル703と、音訳モデル703を使用し、音節列中の各音節に対応する多重言語の少なくとも一副音節、及びその翻訳確率を取得する、副音節翻訳ユニット702と、多重音節言語の副音節構文解析確率を含む、構文解析統計モデル706と、構文解析統計モデル706及び副音節翻訳ユニット702により取得された音節列中の各音節に対応する多重音節言語の少なくとも1つの副音節及びその翻訳確率を使用し、音訳結果として音節列取得ユニット701により取得された音節列に対応する最高確率を持つ副音節列を探索するよう構成された探索ユニット705とを含む。
構文解析統計モデル及び音訳モデルの構造、音節及び副音節の翻訳、及び探索方法等の詳細な説明は、上記になされているのでここでは省略する。
本実施形態における単音節言語から多重音節言語への音訳のための装置700及びその各構成要素は、特殊な回路やチップにより構成され、或いは、対応するプログラムを実行するコンピュータ(プロセッサ)により実施される。更に、本実施形態における単音節言語から多重音節言語へ音訳する装置700は、図3に関連して説明された実施形態における単音節言語から多重音節言語へ音訳する方法を実用上実施できる。
図8は、本発明の一実施形態による多重音節言語から単音節言語へ音訳する装置のブロック図である。本実施形態は、図面を参照し、以下説明する。上記実施形態と同一の部分に関しては、説明は適宜に省略される。
図8に示すように、本実施形態における多重音節言語から単音節言語へ音訳をする装置800は、副音節列に音訳する必要がある多重音節言語の単語を構文解析する副音節構文解析ユニット801と、単音節言語の音節と多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率をそれぞれ含む音訳モデル803と、音訳モデル803を使用し、副音節構文解析ユニット801から構文解析された副音節列中の各副音節に対応する単音節言語の少なくとも1つの音節、及びその翻訳確率を取得する音節翻訳ユニット802と、単音節言語の各音節に対応する文字を取得する文字翻訳ユニット806と、単音節言語の文字隣接確率を含む言語モデル804と、言語モデル804及び音節翻訳ユニット802により取得された副音節列中の各副音節に対応する単音節言語の少なくとも1つの音節及びその翻訳確率を使用し、音訳結果として副音節列に対応する最高確率を持つ文字列を探索するよう構成された探索ユニット805とを含む。
副音節構文解析ユニット801は、多重音節言語の副音節構文解析確率を含む構文解析統計モデル8011と、構文解析統計モデルに基づく探索アルゴリズムを使用し、多重音節言語の単語に対応する確率が最も高い副音節列を計算するモデル構文解析ユニット8012と、構文解析の規則を使用し、多重音節言語の単語を副音節列に構文解析するよう構成された規則構文解析ユニット8013とを含む。
構文解析統計モデル、言語モデル及び音訳モデルの構造、多重音節言語の単語の構文解析、音節及び副音節の翻訳、及び探索方法等の詳細な説明は上述の通りであるため、ここでは省略する。
本実施形態における多重音節言語から単音節言語への音訳のための装置800及びその各構成要素は、特殊な回路やチップにより構成され、或いは、対応するプログラムを実行するコンピュータ(プロセッサ)により実施される。更に、本実施形態の多重音節言語から単音節言語へ音訳する装置800は、図4及び図5に関連して説明された実施形態における多重音節言語から単音節言語へ音訳する方法を実用上実施できる。
構文解析統計モデル及び音訳モデルを訓練する方法及び装置、及び単音節言語から多重音節言語及び多重音節言語から単音節言語へ音訳する方法及び装置がいくつかの模範的な実施形態を用いて詳細に説明されてきたが、これらの実施形態は全てを網羅するわけではなく、当業者においては、本発明の精神と範囲内で様々な変化や改良を加えることであろう。そのため、本発明はこれらの実施形態に制限されず、添付の請求項は本発明の範囲を単に定義付けするに過ぎない。
本発明の一実施形態による構文解析統計モデルを訓練する方法を示したフローチャートである。 本発明の一実施形態による構文解析統計モデル及び音訳モデルを訓練する方法を示したフローチャートである。 本発明の一実施形態による単音節言語から多重音節言語への音訳方法を示したフローチャートである。 本発明の一実施形態による多重音節言語から単音節言語への音訳方法を示したフローチャートである。 本発明の別の実施形態による多重音節言語から単音節言語への音訳方法を示したフローチャートである。 本発明の一実施形態による構文解析統計モデル及び音訳モデルを訓練する装置を示したブロック図である。 本発明の一実施形態による単音節言語から多重音節言語への音訳のための装置を示したブロック図である。 本発明の一実施形態による多重音節言語から単音節言語への音訳のための装置を示したブロック図である。

Claims (32)

  1. 単音節言語及び多重音節言語間の音訳に用いられ、前記多重音節言語の副音節構文解析確率を含む、構文解析統計モデルを訓練する方法であって、
    前記多重音節言語の複数の固有人名及び前記単音節言語の対応する固有人名を含む二カ国語固有人名リストをコーパスとして入力するステップと、
    前記二カ国語固有人名リスト内の多重音節言語の前記各複数の固有人名を、構文解析の規則を用いて副音節列に構文解析するステップと、
    前記二カ国語固有人名リスト内の前記単音節言語の対応する固有人名に従って、前記構文解析が正確か否かを判断するステップと、
    正確と決定された構文解析結果に基づき、前記構文解析統計モデルを訓練するステップとを含む、構文解析統計モデル訓練方法。
  2. 前記構文解析が正確か否かを判断するステップは、
    前記多重音節言語の前記固有人名から構文解析された前記副音節列中の副音節の数が、前記二カ国語固有人名リスト内の単音節言語の前記対応固有人名の音節の数に等しいか否かを判断し、等しい場合は、構文解析を正確であると決定し、さもなければ、構文解析を不正確と決定することを含む、請求項1記載の構文解析統計モデル訓練方法。
  3. 前記構文解析統計モデルを使用し、不正確に構文解析されたと決定された多重音節言語の固有人名を再度構文解析するステップと、
    前記判断及び訓練するステップを繰り返すステップと、を含む、請求項1又は2記載の構文解析統計モデル訓練方法。
  4. 前記構文解析統計モデルを訓練するステップは、
    正確と決定された多重言語の前記固有人名から構文解析された副音節列中の副音節間の隣接関係に基づいて、隣接副音節各対の発生確率を計算するステップと、
    前記構文解析統計モデルに前記各副音節対及びその発生確率を記録するステップと、を含む、請求項2記載の構文解析統計モデル訓練方法。
  5. 単音節言語及び多重音節言語間の音訳に使用される、前記多重音節言語の副音節構文解析確率を含む構文解析統計モデル及び前記単音節言語の音節と多重音節言語の副音節との翻訳関係及びそれらの翻訳確率をそれぞれ含む音訳モデルを訓練する方法であり、
    請求項1乃至4のいずれか1つの方法を使用して、前記構文解析統計モデルを訓練するステップと、
    正確に構文解析されたと決定される多重音節言語の固有人名及び前記二カ国語固有人名リスト内の単音節言語の前記対応固有人名に基づいて前記音訳モデルを訓練するステップと、を含む、音訳モデル訓練方法。
  6. 前記音訳モデル訓練ステップは、
    正確に構文解析されたと決定される多重音節言語の前記固有人名から構文解析された前記副音節列中の各副音節と単音節言語の対応する固有人名との対応関係に基づいて、各副音節/音節対の翻訳確率を計算するステップと、
    前記各副音節/音節対及びその翻訳確率を前記音訳モデルに記録するステップと、を含む、請求項5記載の構文解析統計モデル及び音訳モデルを訓練する方法。
  7. 単音節言語から多重音節言語へ音訳する方法であって、
    音訳対象の前記単音節言語の単語に対応する音節列を取得ステップと、
    前記単音節言語の音節と前記多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルに従って、前記音節列中の各音節に対応する前記多重音節言語の少なくとも1つの副音節及びその翻訳確率を取得するステップと、
    前記多重音節言語の副音節構文解析確率を含む構文解析統計モデルに基づいて、音訳結果として前記音節系列に対応する最高確率を有する副音節列を探索するステップと、を含む、音訳方法。
  8. 前記単音節言語の単語に対応する音節列を取得する前記ステップは、
    発音辞典を使用して前記単音節言語の単語に対応する音節列を取得するステップを含む、請求項7記載の単音節言語から多重音節言語へ音訳する方法。
  9. 前記音節列に対応する最高確率を有する副音節列を探索する前記ステップは、
    前記音節列中の各音節に対応する前記多重音節言語の少なくとも1つの副音節及びその翻訳確率及び前記構文解析統計モデルにおける前記副音節構文解析確率に基づいて、最高確率を持つ副音節列を探索するため、探索アルゴリズムを用いて計算するステップを含む、請求項7記載の単音節言語から多重音節言語へ音訳をする方法。
  10. 前記探索アルゴリズムは、縦型探索、横型探索、A*探索及びビタビアルゴリズムのいずれか一つ又は組み合わせである、請求項9に記載の単音節言語から多重音節言語へ音訳する方法。
  11. 多重音節言語から単音節言語へ音訳する方法であって、
    副音節列に音訳する必要がある前記多重音節言語の単語を構文解析するステップと、
    前記単音節言語の音節と前記多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルに従って、前記副音節列中の各副音節に対応する前記単音節言語の少なくとも1つの音節及びその翻訳確率を取得するステップと、
    単音節言語の各前記音節に対応する文字を取得するステップと、
    前記単音節言語の文字隣接確率を含む言語モデルに基づいて、翻訳結果として前記副音節列に対応する最高確率を持つ文字列を探索するステップと、を含む、音訳方法。
  12. 前記多重音節言語の単語を構文解析する前記ステップは、
    前記多重音節言語の副音節構文解析確率を含む構文解析統計モデルに基づいて、前記多重音節言語の単語に対応する最高確率を有する副音節列を探し出すため探索アルゴリズムを使用して計算するステップを含む、請求項11に記載の多重音節言語から単音節言語へ音訳する方法。
  13. 前記多重音節言語の単語を構文解析する前記ステップは、
    前記最高確率が所定閾値よりも低い場合、構文解析規則を使用して多重音節言語の前記単語を構文解析するステップを含む、請求項12に記載の多重音節言語から単音節言語へ音訳する方法。
  14. 単音節言語の前記各音節に対応する文字を取得する前記ステップは、
    発音辞典を使用して単音節言語の前記各音節に対応する文字を取得するステップを含む、請求項11に記載の多重音節言語から単音節言語へ音訳する方法。
  15. 前記副音節列に対応する最高確率を持つ文字列を探索する前記ステップは、
    前記副音節列中の各副音節に対応する前記単音節言語の少なくとも一文字及びその翻訳確率並びに前記言語モデルにおける文字隣接確率に基づいて、最高確率を持つ文字列を探索するため、探索アルゴリズムを用いて計算するステップを含む、請求項11に記載の多重音節言語から単音節言語へ音訳する方法。
  16. 前記探索アルゴリズムは、縦型探索、横型探索、A*探索及びビタビアルゴリズムのいずれか一つ又は組み合わせである、請求項11又は15記載の多重音節言語から単音節言語へ音訳する方法。
  17. 単音節言語及び多重音節言語間の音訳に用いられ、前記多重音節言語の副音節構文解析確率を含む、構文解析統計モデルを訓練する装置であって、
    前記多重音節言語の複数の固有人名及び前記単音節言語の対応する固有人名を含む二カ国語固有人名リストをコーパスとして入力するコーパス入力ユニットと、
    前記二カ国語固有人名リスト内の多重音節言語の前記複数の固有人名を、構文解析の規則を用いて副音節列に構文解析する規則構文解析ユニットと、
    前記二カ国語固有人名リスト内の前記単音節言語の対応する固有人名に従って、多重音節言語の前記固有人名の構文解析が正確か否かを判断する構文解析判断ユニットと、
    正確と決定された構文解析結果に基づいて、前記構文解析統計モデルを訓練する構文解析統計モデル訓練ユニットとを具備する、構文解析統計モデル訓練装置。
  18. 前記構文解析判断ユニットは、前記多重音節言語の前記固有人名から構文解析された前記副音節列中の副音節の数と、前記二カ国語固有人名リスト内の単音節言語の対応する前記固有人名中の音節の数とが等しいか否かを判断し、等しい場合は、構文解析を正確であると決定し、さもなければ、構文解析を不正確と決定する、請求項17に記載の構文解析統計モデル訓練装置。
  19. 前記構文解析統計モデルを使用し、不正確に構文解析されたと決定された多重音節言語の固有人名を再度構文解析するモデル構文解析ユニットを更に含む、
    請求項17又は18記載の構文解析統計モデル訓練装置。
  20. 前記構文解析統計モデル訓練ユニットは、
    正確と決定された多重音節言語の前記固有人名から構文解析された副音節列中の副音節間の隣接関係に基づいて、各隣接副音節対の発生確率を計算する構文解析確率計算機を更に含む、
    請求項17記載の構文解析統計モデル訓練装置。
  21. 正確に構文解析されたと決定される多重音節言語の固有人名、及び前記二カ国語固有人名リスト内の単音節言語の対応する固有人名に基づいて、音訳モデルを訓練する音訳モデル訓練ユニットを更に含み、前記音訳モデルは、単音節言語及び多重音節言語間の音訳に使用され、前記単音節言語の音節と前記多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む、
    請求項17乃至21のいずれか1に記載の構文解析統計モデル訓練装置。
  22. 正確に構文解析されたと決定される多重音節言語の前記固有人名から構文解析された副音節列中の各副音節と単音節言語の対応する固有人名中の対応する音節との対応関係に基づいて、各副音節/音節対の翻訳確率を計算する翻訳確率計算機を更に含む、
    請求項21記載の構文解析統計モデル訓練装置。
  23. 単音節言語から多重音節言語へ音訳する装置であって、
    音訳対象の前記単音節言語の単語に対応する音節列を取得する音節列取得ユニットと、
    前記単音節言語の音節と前記多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルと、
    前記音節列取得ユニットにより取得された前記音節列中の各音節に対応する前記多重言語の少なくとも1つの副音節、及び前記音訳モデルを用いることによりその翻訳確率を取得する副音節訓練ユニットと、
    前記多重音節言語の副音節構文解析確率を含む構文解析統計モデルと、
    前記構文解析統計モデル、前記音節列中の各音節に対応する前記多重音節言語の少なくとも1つの副音節及びその翻訳確率に基づいて、音訳結果として前記音節列に対応する最高確率を持つ副音節列を探索する探索ユニットと、を具備する音訳装置。
  24. 前記単音節言語の文字の発音を含む発音辞典を更に含み、
    前記音節列取得ユニットは前記発音辞典に基づいて前記単音節言語の単語に対応する音節列を取得する、
    請求項23記載の単音節言語から多重音節言語へ音訳する装置。
  25. 前記探索ユニットは、前記音節列中の各音節に対応する前記多重音節言語の前記少なくとも1つの副音節及びその翻訳確率並びに前記構文解析統計モデルの副音節構文解析確率に基づいて、最高確率を持つ副音節列を見つけるため、探索アルゴリズムを用いて計算する、請求項23記載の単音節言語から多重音節言語へ音訳する装置。
  26. 前記探索アルゴリズムは、縦型探索、横型探索、A*探索及びビタビアルゴリズムのいずれか一つ又は組み合わせである、請求項25記載の単音節言語から多重音節言語へ音訳する装置。
  27. 多重音節言語から単音節言語へ音訳する装置であって、
    副音節列に音訳する必要がある前記多重音節言語の単語を構文解析する副音節構文解析ユニットと、
    前記単音節言語の音節と前記多重音節言語の副音節との翻訳関係、及びそれらの翻訳確率を含む音訳モデルと、
    前記音訳モデルに従って、前記副音節列中の各副音節に対応する前記単音節言語の少なくとも1との音節及びその翻訳確率を取得する音節翻訳ユニットと、
    単音節言語の前記各音節に対応する文字を取得する文字翻訳ユニットと、
    前記単音節言語の文字隣接確率を含む言語モデルと、
    前記言語モデル、前記音節翻訳ユニットにより取得された前記副音節列中の各副音節に対応する前記単音節言語の少なくとも1つの音節及びその翻訳確率に基づいて、音訳結果として、前記副音節列に対応する最高確率を持つ文字列を探索する探索ユニットとを含む、音訳装置。
  28. 前記副音節構文解析ユニットは、
    前記多重音節言語の副音節構文解析確率を含む構文解析統計モデルと、
    前記構文解析統計モデルに基づいて、探索アルゴリズムを使用して多重音節言語の前記単語に対応する最高確率を持つ副音節列を見つけるために計算をするモデル構文解析ユニットと、を含む、
    請求項27記載の多重音節言語から単音節言語へ音訳する装置。
  29. 前記副音節構文解析ユニットは、
    構文解析規則を用いて多重音節言語の前記単語を構文解析する規則構文解析ユニットを更に含む、
    請求項28記載の多重音節言語から単音節言語へ音訳する装置。
  30. 前記単音節言語の文字の発音を含む発音辞典を更に含む、
    請求項27記載の多重音節言語から単音節言語へ音訳する装置。
  31. 前記探索ユニットは、前記副音節列中の各副音節に対応する前記単音節言語の少なくとも1つの文字及びその翻訳確率並びに前記言語モデルの文字隣接確率に基づいて、最高確率を持つ文字列を見つけるため、探索アルゴリズムを用いて計算する、請求項27記載の多重音節言語から単音節言語へ音訳する装置。
  32. 前記探索アルゴリズムは、縦型探索、横型探索、A*探索及びビタビアルゴリズムのいずれか一つ又は組み合わせである、請求項28又は31記載の多重音節言語から単音節言語へ音訳する装置。
JP2006276947A 2005-10-09 2006-10-10 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置 Expired - Fee Related JP4886459B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200510108185.9 2005-10-09
CNB2005101081859A CN100483399C (zh) 2005-10-09 2005-10-09 训练音译模型、切分统计模型的方法和装置

Publications (2)

Publication Number Publication Date
JP2007109233A true JP2007109233A (ja) 2007-04-26
JP4886459B2 JP4886459B2 (ja) 2012-02-29

Family

ID=38035013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006276947A Expired - Fee Related JP4886459B2 (ja) 2005-10-09 2006-10-10 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置

Country Status (3)

Country Link
US (1) US7853444B2 (ja)
JP (1) JP4886459B2 (ja)
CN (1) CN100483399C (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009157888A (ja) * 2007-12-28 2009-07-16 National Institute Of Information & Communication Technology 音訳モデル作成装置、音訳装置、及びそれらのためのコンピュータプログラム
JP2011018330A (ja) * 2009-07-08 2011-01-27 Nhn Corp 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
JP2011034220A (ja) * 2009-07-30 2011-02-17 National Institute Of Information & Communication Technology 字訳装置、コンピュータプログラム及び記録媒体
JP2015191431A (ja) * 2014-03-28 2015-11-02 株式会社ゼンリンデータコム 外国語のカタカナ表現作成装置、外国語のカタカナ表現作成方法及び外国語のカタカナ表現作成プログラム

Families Citing this family (223)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20040243531A1 (en) 2003-04-28 2004-12-02 Dean Michael Anthony Methods and systems for representing, using and displaying time-varying information on the Semantic Web
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8041556B2 (en) * 2005-12-01 2011-10-18 International Business Machines Corporation Chinese to english translation tool
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8131536B2 (en) * 2007-01-12 2012-03-06 Raytheon Bbn Technologies Corp. Extraction-empowered machine translation
US8515728B2 (en) * 2007-03-29 2013-08-20 Microsoft Corporation Language translation of visual and audio input
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8740621B1 (en) * 2007-07-17 2014-06-03 Samuel Gordon Breidner Apparatus and system for learning a foreign language
US7983903B2 (en) * 2007-09-07 2011-07-19 Microsoft Corporation Mining bilingual dictionaries from monolingual web pages
US7890539B2 (en) * 2007-10-10 2011-02-15 Raytheon Bbn Technologies Corp. Semantic matching using predicate-argument structure
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8463597B2 (en) * 2008-05-11 2013-06-11 Research In Motion Limited Mobile electronic device and associated method enabling identification of previously entered data for transliteration of an input
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
CN101593173B (zh) * 2008-05-28 2011-08-10 中国科学院自动化研究所 一种汉英反向音译方法及装置
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US8275600B2 (en) * 2008-10-10 2012-09-25 Google Inc. Machine learning for transliteration
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8332205B2 (en) * 2009-01-09 2012-12-11 Microsoft Corporation Mining transliterations for out-of-vocabulary query terms
US20100204977A1 (en) * 2009-02-09 2010-08-12 Inventec Corporation Real-time translation system that automatically distinguishes multiple languages and the method thereof
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20110035210A1 (en) * 2009-08-10 2011-02-10 Benjamin Rosenfeld Conditional random fields (crf)-based relation extraction system
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
WO2011087391A1 (en) * 2010-01-18 2011-07-21 Google Inc. Automatic transliteration of a record in a first language to a word in a second language
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20110218796A1 (en) * 2010-03-05 2011-09-08 Microsoft Corporation Transliteration using indicator and hybrid generative features
CN102193643B (zh) * 2010-03-15 2014-07-02 北京搜狗科技发展有限公司 一种文字输入方法和具有翻译功能的输入法系统
CN102262450B (zh) * 2010-05-27 2015-12-09 北京搜狗科技发展有限公司 一种基于混输字符串进行字符转换的方法和装置
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8706472B2 (en) * 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9176936B2 (en) * 2012-09-28 2015-11-03 International Business Machines Corporation Transliteration pair matching
US9330402B2 (en) 2012-11-02 2016-05-03 Intuit Inc. Method and system for providing a payroll preparation platform with user contribution-based plug-ins
CN103810993B (zh) * 2012-11-14 2020-07-10 北京百度网讯科技有限公司 一种文本注音方法及装置
EP3809407A1 (en) 2013-02-07 2021-04-21 Apple Inc. Voice trigger for a digital assistant
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US9231898B2 (en) 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9600473B2 (en) * 2013-02-08 2017-03-21 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US20140244237A1 (en) * 2013-02-28 2014-08-28 Intuit Inc. Global product-survey
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
US9430227B2 (en) 2013-06-13 2016-08-30 Intuit Inc. Automatic customization of a software application
AU2014278595B2 (en) 2013-06-13 2017-04-06 Apple Inc. System and method for emergency calls initiated by voice command
CN104239289B (zh) * 2013-06-24 2017-08-29 富士通株式会社 音节划分方法和音节划分设备
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9922351B2 (en) 2013-08-29 2018-03-20 Intuit Inc. Location-based adaptation of financial management system
CN103593062B (zh) * 2013-11-08 2016-09-28 北京奇虎科技有限公司 一种数据检测方法及装置
CN104657343B (zh) * 2013-11-15 2017-10-10 富士通株式会社 识别音译名的方法及装置
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
CN103793364B (zh) * 2014-01-23 2018-09-07 北京百度网讯科技有限公司 对文本进行自动注音处理及显示的方法和装置
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9817808B2 (en) * 2014-09-29 2017-11-14 International Business Machines Corporation Translation using related term pairs
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9372848B2 (en) 2014-10-17 2016-06-21 Machine Zone, Inc. Systems and methods for language detection
US10162811B2 (en) 2014-10-17 2018-12-25 Mz Ip Holdings, Llc Systems and methods for language detection
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
EP3318979A4 (en) * 2015-06-30 2019-03-13 Rakuten, Inc. TRANSLITERATION PROCESSING DEVICE, TRANSLITERATION PROCESSING, TRANSLITERATION PROGRAM AND INFORMATION PROCESSING DEVICE
RU2632137C2 (ru) 2015-06-30 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер транскрипции лексической единицы из первого алфавита во второй алфавит
CN105244027B (zh) * 2015-08-31 2019-10-15 百度在线网络技术(北京)有限公司 生成谐音文本的方法和系统
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
KR102580904B1 (ko) 2016-09-26 2023-09-20 삼성전자주식회사 음성 신호를 번역하는 방법 및 그에 따른 전자 디바이스
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10769387B2 (en) 2017-09-21 2020-09-08 Mz Ip Holdings, Llc System and method for translating chat messages
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
CN108766414B (zh) * 2018-06-29 2021-01-15 北京百度网讯科技有限公司 用于语音翻译的方法、装置、设备和计算机可读存储介质
US11170183B2 (en) 2018-09-17 2021-11-09 International Business Machines Corporation Language entity identification
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11062621B2 (en) * 2018-12-26 2021-07-13 Paypal, Inc. Determining phonetic similarity using machine learning
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN111489742B (zh) * 2019-01-28 2023-06-27 北京猎户星空科技有限公司 声学模型训练方法、语音识别方法、装置及电子设备
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11829720B2 (en) 2020-09-01 2023-11-28 Apple Inc. Analysis and validation of language models
CN113688283B (zh) * 2021-08-27 2023-09-05 北京奇艺世纪科技有限公司 一种视频字幕匹配程度的确定方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001142877A (ja) * 1999-11-16 2001-05-25 Nippon Telegr & Teleph Corp <Ntt> アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体
JP2004206659A (ja) * 2002-11-07 2004-07-22 Nippon Telegr & Teleph Corp <Ntt> 読み情報決定方法及び装置及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5432948A (en) * 1993-04-26 1995-07-11 Taligent, Inc. Object-oriented rule-based text input transliteration system
US6810374B2 (en) * 2001-07-23 2004-10-26 Pilwon Kang Korean romanization system
US7610189B2 (en) * 2001-10-18 2009-10-27 Nuance Communications, Inc. Method and apparatus for efficient segmentation of compound words using probabilistic breakpoint traversal
US20070021956A1 (en) * 2005-07-19 2007-01-25 Yan Qu Method and apparatus for generating ideographic representations of letter based names

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001142877A (ja) * 1999-11-16 2001-05-25 Nippon Telegr & Teleph Corp <Ntt> アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体
JP2004206659A (ja) * 2002-11-07 2004-07-22 Nippon Telegr & Teleph Corp <Ntt> 読み情報決定方法及び装置及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009157888A (ja) * 2007-12-28 2009-07-16 National Institute Of Information & Communication Technology 音訳モデル作成装置、音訳装置、及びそれらのためのコンピュータプログラム
JP2011018330A (ja) * 2009-07-08 2011-01-27 Nhn Corp 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
JP2011034220A (ja) * 2009-07-30 2011-02-17 National Institute Of Information & Communication Technology 字訳装置、コンピュータプログラム及び記録媒体
JP2015191431A (ja) * 2014-03-28 2015-11-02 株式会社ゼンリンデータコム 外国語のカタカナ表現作成装置、外国語のカタカナ表現作成方法及び外国語のカタカナ表現作成プログラム

Also Published As

Publication number Publication date
US7853444B2 (en) 2010-12-14
CN100483399C (zh) 2009-04-29
US20070124133A1 (en) 2007-05-31
JP4886459B2 (ja) 2012-02-29
CN1945562A (zh) 2007-04-11

Similar Documents

Publication Publication Date Title
JP4886459B2 (ja) 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置
US8249856B2 (en) Machine translation
Fung et al. A technical word-and term-translation aid using noisy parallel corpora across language groups
JP2009140499A (ja) 二言語コーパスに基づくターゲット言語の語形変化モデルトレーニング方法及び装置、tlwi方法及び装置、ソース言語のテキストをターゲット言語に翻訳する翻訳方法及びシステム
Xu et al. Do we need Chinese word segmentation for statistical machine translation?
KR100911372B1 (ko) 통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법
JP2009151777A (ja) 音声言語パラレルコーパスのアライメント方法及び装置
KR101745349B1 (ko) 병렬 말뭉치의 구 정렬을 이용한 숙어 표현 인식 장치 및 그 방법
Parikh et al. Normalization and back-transliteration for code-switched data
Flickinger et al. ParDeepBank: Multiple parallel deep treebanking
KR20210035721A (ko) 다중-언어 코퍼스를 이용하여 기계번역 하는 방법 및 이를 구현한 시스템
Sajjad et al. Comparing two techniques for learning transliteration models using a parallel corpus
Kuparinen et al. Dialect-to-Standard Normalization: A Large-Scale Multilingual Evaluation
Kumar et al. Machine translation survey for Punjabi and Urdu languages
Lu et al. An automatic spelling correction method for classical mongolian
Mrinalini et al. Pause-based phrase extraction and effective OOV handling for low-resource machine translation systems
Visweswariah et al. Urdu and Hindi: Translation and sharing of linguistic resources
Kumar et al. Improving the performance of English-Tamil statistical machine translation system using source-side pre-processing
JP2006127405A (ja) バイリンガルパラレルテキストをアライメントする方法及びそのためのコンピュータで実行可能なプログラム
Tsarfaty et al. Word-Based or Morpheme-Based? Annotation Strategies for Modern Hebrew Clitics.
Davis Tajik-Farsi Persian Transliteration Using Statistical Machine Translation.
Khenglawt Machine translation and its approaches
JP4708682B2 (ja) 対訳単語対の学習方法、装置、及び、対訳単語対の学習プログラムを記録した記録媒体
Luo et al. Handling of Out-of-vocabulary Words in Japanese-English Machine Translation by Exploiting Parallel Corpus.
Wai et al. Automatic reordering rule generation and application of reordering rules in stochastic reordering model for English-Myanmar machine translation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111115

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111209

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141216

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141216

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees