JP4381425B2 - 二言語単語対応付けモデル訓練方法及び装置、二言語単語対応付け方法及び装置 - Google Patents

二言語単語対応付けモデル訓練方法及び装置、二言語単語対応付け方法及び装置 Download PDF

Info

Publication number
JP4381425B2
JP4381425B2 JP2007048881A JP2007048881A JP4381425B2 JP 4381425 B2 JP4381425 B2 JP 4381425B2 JP 2007048881 A JP2007048881 A JP 2007048881A JP 2007048881 A JP2007048881 A JP 2007048881A JP 4381425 B2 JP4381425 B2 JP 4381425B2
Authority
JP
Japan
Prior art keywords
word
bilingual
language
languages
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007048881A
Other languages
English (en)
Other versions
JP2007234023A (ja
Inventor
ワン・ハイフェン
リュー・ツァンイ
ウー・ファ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of JP2007234023A publication Critical patent/JP2007234023A/ja
Application granted granted Critical
Publication of JP4381425B2 publication Critical patent/JP4381425B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Description

本発明は、情報処理技術に関し、特に二言語単語対応付けの技術及び自然言語処理における統計的機械翻訳の技術に関する。
単語対応付けは自然言語処理に広く使用されている。既存の単語対応付け技術は、通常、二言語文対の対応する単語を対応付ける統計的単語対応付けモデルを用いている。統計的単語対応付けモデルは二言語文対の中の対応単語を決定するために使用される統計的情報を含む。
P. F. Brown, S. A. Della Pietra, V. J. Della Pietra and R. Mercer published in 1993,“The Mathematics of Statistical Machine Translation: Parameter Estimation” (Computational Linguistics, 19(2): 263-311)の論文において、統計的機械翻訳モデル及び統計的単語対応付けモデル並びに対応するパラメータ推定方法が記載されている。
統計的単語対応付けモデルはパラメータを訓練(トレーニング)するために充分に大きい二言語コーパスを必要とする。訓練のために充分大きなコーパスがない場合、得られたパラメータを用いて高品質で対応付け結果を得ることは不可能である。一部の言語であろうとも、利用可能な二言語コーパスがない。故に、二言語コーパスの量が統計的単語対応付けモデルの品質を限定し、統計的単語対応付けモデルの更なる適用に障害となる。
従来技術の上記問題を解決するために、本発明は、中間言語を用いて二言語単語対応付けモデルを訓練する方法及び装置並びに二言語単語対応付け方法及び装置を提供することを目的とする。
本発明の一態様によると、第1及び第2言語の二言語コーパスを用いて第1言語及び第2言語用二言語単語対応モデルを訓練すること、前記第2及び第3言語の二言語コーパスを用いて、前記第2言語及び第3言語用二言語単語対応モデルを訓練すること、前記第1及び第2言語用二言語単語対応モデル及び前記第2及び第3言語用二言語単語対応モデルに基づいて前記第1言語及び前記第3言語用二言語単語対応層モデルを推定すること、を含む二言語単語対応モデル訓練方法を提供する。
本発明の他の態様によると、上記二言語単語対応付けモデル訓練方法を使用することによって、前記第1及び第2言語の二言語コーパス及び前記第2及び第3言語の二言語コーパスに基づいて前記第1言語及び第3言語用二言語単語対応付けモデルを得ること、前記第1及び第3言語用二言語単語対応付けモデルを用いて前記第1及び第3言語の二言語対を単語対応付けすること、を含む二言語単語対応付け方法を提供する。
本発明の他の態様によると、第1及び第2言語の二言語コーパスを用いて、第1言語及び第2言語用二言語単語対応付けモデルを訓練するよう構成された第1訓練ユニットと、前記第2及び第3言語の二言語コーパスを用いて、前記第2言語及び第3言語用二言語単語対応付けモデルを訓練するよう構成される第2訓練ユニットと、前記第1及び第2言語用二言語単語対応付けモデル並びに前記第2及び第3言語用前記二言語単語対応付けモデルに基づいて、前記第1言語及び第3言語用二言語単語対応付けモデルを推定するよう構成されるモデル推定ユニットと、を具備する、二言語単語対応付けモデル訓練装置を提供する。
本発明の他の態様によると、上述の二言語単語対応付けモデル訓練装置によって前記第1及び第2言語の二言語コーパス並びに前記第2及び第3言語の二言語コーパスに基づいて第1言語及び第3言語用二言語単語対応モデルを得るように構成されるモデル取得ユニットと、前記第1及び第3言語用二言語単語対応付けモデルを用いて前記第1及び第3言語の二言語文対を単語対応付けするように構成された単語対応付けユニットと、を具備する、二言語単語対応付け装置を提供する。
次に、本発明の好適実施形態の詳細な説明を図面と関連して説明する。
図1は本発明の実施形態に従った二言語単語対応付けモデル(bilingual word alignment model)を訓練(トレーニング)する方法を示すフローチャートである。
図1に示すように、先ずステップ101では、第1及び第2言語間二言語コーパスが第1及び第2言語用二言語単語対応付けモデルを訓練するために使用される。この実施形態では、二言語単語対応付けモデルは単語翻訳サブモデル、位置歪み(position distortion)サブモデル及び単語増殖(word fertility)サブモデルを含む。
これらのサブモデルにおいて、単語翻訳サブモデルは一組の単語翻訳確率である。単語翻訳確率(word translation probability)p(ws|wt)が目標単語(target word)wtからソース単語(source word)wsへの翻訳確率(translation probability)である。
位置歪みサブモデルは一組の位置歪み確率である。位置歪み確率p(j|i,l,m)は目標言語の文におけるi番目の位置、ソース言語の文の長さmそして目標言語の文の長さlとしてソース言語の文におけるj番目の位置を選択する確率である。
単語増殖サブモデルは一組の単語増殖確率である。単語増殖確率p(φi|wt)はφiソース単語を対応付ける目標単語wtの確率である。
このステップにおいて、第1及び第2言語の二言語コーパスに基づいて統計的方法(statistical method)を用いて、二言語単語対応付けモデル、即ち単語翻訳サブモデル、位置歪みサブモデル及び第1及び第2言語用単語増殖サブモデルが訓練される。
次に、ステップ105では、第2及び第3言語の二言語コーパスが第2及び第3言語用二言語単語対応付けモデルを訓練するために使用される。ステップ101と同様に、このステップでも、第2及び第3言語の二言語コーパスに基づいて、統計的方法を用いて、二言語単語対応付けモデル、即ち、単語翻訳サブモデル、位置歪みサブモデル及び第2及び第3言語用単語増殖サブモデルが訓練される。
本実施形態では、第1及び第2言語間並びに第2及び第3言語間の大規模精密言語コーパス(large-scale accurate bilingual corpus)が利用できるが、第1及び第3言語間の二言語コーパスは不十分であると仮定する。故に、ステップ101及び105を通して、第1及び第2言語間並びに第2及び第3言語間の充分な二言語コーパスは第1及び第2言語に対して良好な品質並びに第2及び第3言語に対して良好な品質で二言語単語対応付けを得るために使用できる。
次に、ステップ110において、第1及び第2言語用二言語単語対応付けモデル並びに第2及び第3言語用二言語単語対応付けモデルに基づいて、第1及び第3言語用二言語単語対応付けモデルが推定される。
この実施形態では、次のステップを含めて、単語翻訳サブモデル、位置歪みサブモデル及び単語増殖サブモデルをそれぞれ推定することが必要である。即ち、
第1及び第2言語用単語翻訳サブモデル並びに第2及び第3言語用単語翻訳サブモデルに基づいて、第1及び第3言語用単語翻訳サブモデルを推定するステップと、
第1及び第2言語用位置歪みサブモデル並びに第2及び第3言語用位置歪みサブモデルに基づいて、第1及び第3言語用位置歪みサブモデルを推定するステップと、
第1及び第2言語用単語増殖サブモデル及び/又は第2及び第3言語用単語増殖サブモデル、第1及び第2言語用単語翻訳サブモデル及び/又は第2及び第3言語用単語翻訳サブモデルに基づいて、第1及び第3言語用単語増殖サブモデルを推定するステップとを含む。
次に、上記サブモデルの推定処理を詳細に説明する。
1)最初に、第1及び第3言語用単語翻訳サブモデルに関して、
Figure 0004381425
2)次に、第1及び第3言語用位置歪みサブモデルの推定に関しては、
Figure 0004381425
3)最後に、第1及び第3言語用単語増殖サブモデルの推定に関しては、
Figure 0004381425
上記から本実施形態の二言語単語対応付けモデルを訓練する方法は訓練用に充分なコーパスがないために高品質で単語対応付けモデルを得る方法がない問題を解決するために中間言語を使用できることは理解できる。例えば、通常、中国語と日本語のための統計的単語対応付けモデルの品質を制限する、中国語と日本語間の充分な二言語コーパスが存在しない。この実施形態の方法を用いることによって、英語のような大規模コーパスを持つ中間言語がこの問題を解決するために使用できる。中国語と日本語間の大規模二言語コーパス及び日本語と英語間の大規模コーパスが利用できるので、中国語と英語に対して高品質を持つ単語対応付けモデル及び日本語と英語に対して高品質を持つ単語対応付けモデルが得ることができ、更に中国語と日本語に対する単語対応付けモデルは中国語と英語に対する単語対応付けモデルと日本語と英語に対する単語対応付けモデルを用いて推定できる。
むろん、本発明は中国語、英語及び日本語の場合に限定されなく、任意の言語が先の実施形態の第1,第2及び第3言語として使用できる。しかし、通常、大規模コーパスを持つこれら国際語は英語、フランス語及びスペイン語のように考慮に値する。
同じ発明概念に基づいて、図2は本発明の実施形態に従った二言語単語対応付け方法を示すフローチャートである。次に、図と関連して、この実施形態を説明する。先の実施形態の部分と同じ部分は適宜省略する。
図2に示すように、先ず、ステップ101で、第1言語及び第2言語の二言語コーパスが第1及び第2言語用二言語単語対応付けモデルを訓練するために使用される。それから、ステップ105において、第2言語及び第3言語の二言語コーパスが第2及び第3言語用二言語単語対応付けモデルを訓練するために使用される。それから、ステップ110で、第1及び第2言語用二言語単語対応付けモデル及び第2及び第3言語用二言語単語対応付けモデルに基づいて、第1言語及び第3言語のための二言語単語対応付けモデルが推定される。
上記ステップ101,105及び110は図1に示される実施形態と基本的には同じであり、ここでは説明を繰り返さない。
次に、ステップ215で、第1及び第3言語用推定二言語単語対応付けモデルが第1及び第3言語の二言語文を単語対応付けのするために使用される。特定の対応付け方法は以下の通りである。
1.単語翻訳確率及び位置対応付け確率が対応付けシリーズA0を得るようにソース言語単語毎に最適単語対応付けを見つけるために使用される。
2.対応付けシリーズAiに基づいて、単語翻訳確率、位置歪みモデル及び単語増殖モデルが任意の2つの対応付けを切換える、又は1つの対応付けを変更することを試みてより良い対応付けシリーズAi+1を見つけるために使用される。
3.処理2はより良い対応付けシリーズが見つけられなくなるまで繰り返される。
ここで、当業者は任意の周知及び将来の探索アルゴリズムが最適対応付けシリーズを見つけるために使用できることを理解しているはずである。
上記からこの実施形態の二言語単語対応付け方法が訓練用の充分なコーパスがないことによる高品質の単語対応付けモデルを得る方法がないと言う問題を解決するために中間言語を使用できることが理解できる。故に、中国語及び英語のような少ないコーパスの二カ国言語に対しても正確な単語対応付けができる。
同じ発明概念に基づいて、図3は本発明の実施形態に従った二言語単語対応付けモデルを訓練する装置を示すブロック図である。次に、図面と関連して、この実施形態を説明する。先の実施形態と同じ部分については適宜説明を省略する。
図3に示すように、この実施形態の二言語単語対応付けモデルを訓練する装置300は第1及び第2言語の二言語コーパス301を用いて、第1言語及び第2言語用二言語単語対応付けモデルを訓練するように構成された第1訓練ユニット303と、第2及び第3言語の二言語コーパス302を用いて、第2言語及び第3言語用二言語単語対応付けモデルを訓練するように構成された第2訓練ユニット304と、第1訓練ユニット303によって訓練された第1及び第2言語用二言語単語対応付けモデル並びに第2訓練ユニット304によって訓練された第2及び第3言語用二言語単語対応付けモデルに基づいて、第1言語及び第3言語用二言語単語対応付けモデルを推定するように構成されたモデル推定ユニット305とを含む。
特に、第1訓練ユニット303によって訓練された第1及び第2言語用二言語単語対応付けモデル及び第2訓練ユニット304によって訓練された第2及び第3言語用二言語単語対応付けモデルは各々単語翻訳サブモデル、位置歪みサブモデル及び単語増殖サブモデルにより構成される。モデル推定ユニットは第1及び第2言語用単語翻訳サブモデル及び第2及び第3言語用単語翻訳サブモデルに基づいて、第1及び第3言語用単語翻訳サブモデルを推定するように構成される単語翻訳サブモデル推定ユニットと、第1及び第2言語用位置歪みサブモデル並びに第2及び第3言語用位置歪みサブモデルに基づいて、第1及び第3言語用位置歪みサブモデルを推定するように構成された位置歪みサブモデル推定ユニットと、第1及び第2言語用単語増殖サブモデル及び/又は第2及び第3言語用単語増殖サブモデル、第1及び第2言語用単語翻訳サブモデル及び/又は第2及び第3言語用単語翻訳サブモデルに基づいて、第1及び第3言語用単語増殖サブモデルを推定するように構成される単語増殖サブモデルとを含む。
Figure 0004381425
Figure 0004381425
Figure 0004381425
上記からこの実施形態の二言語単語対応付けモデルを訓練する装置は操作上図1に示された実施形態の二言語単語対応付けモデルを訓練する方法を実現できる。この実施形態を使用することによって、訓練用の充分なコーパスがないことにより高品質の単語対応付けモデルを得る方法がないと言う問題が中間言語を使用することによって解決できる。
ここで、実施形態の二言語単語対応付けモデルを訓練する装置300及びその構成要素は専用の回路又はチップによって構成でき、又は対応するプログラムを実行してコンピュータ(プロセッサ)によって実現できる。
同じ発明概念に基づいて、図4はこの発明の実施形態に従った二言語単語対応付け装置を示すブロック図である。次に、図と関連して、この実施形態を説明する。先の実施形態と同一部分は適宜説明を省略する。
図4に示すように、この実施形態の二言語単語対応付け装置400は図3にて説明された二言語単語対応付けモデルを訓練する装置と単語対応付けユニット406とによって構成される。単語対応付けユニット406は二言語単語対応付けモデルを訓練する装置300によって得られる第1及び第3言語用二言語単語対応付けモデルを用いて、第1及び第3言語の二言語文対を単語対応付けする。特定の単語対応付け方法は先の実施形態で説明されており、ここでは繰り返さない。
上記からこの実施形態の二言語単語対応付け装置400は操作上この発明の上記実施形態の二言語単語対応付け方法を実現できる。この実施形態の二言語単語対応付け装置を使用することによって、訓練に充分でないコーパスによって高品質の単語対応付けモデルを得る方法がない問題が中間言語を用いることによって解決できる。故に、中国語及び英語のような少ないコーパスを持つこれら二カ国言語でさえ、正確な単語対応付けが行える。
ここで、実施形態の二言語単語対応付け装置400及びその構成要素は専用回路又はチップによって構成でき、又は対応するプログラムを実施することによってコンピュータ(プロセッサ)によって実現できる。
二言語単語対応付け方法及び装置並びに本発明の二言語単語対応付けモデルを訓練する方法及び装置は幾つかの模範的な実施形態で詳細に説明したが、これら実施形態は包括的ではない。当業者は本発明の精神と範囲内で種々変更及び変形できる。故に、本発明はこれら実施形態に限定されなく、本発明の範囲は添付請求項によってのみ定義される。
本発明の実施形態に従った二言語単語対応付けモデルを訓練する方法を示すフローチャートである。 本発明の実施形態に従った二言語単語対応付け方法を示すフローチャートである。 本発明の実施形態に従った二言語単語対応付けモデルを訓練する装置を示すブロック図である。 本発明の実施形態に従った二言語単語対応付け装置を示すブロック図である。

Claims (4)

  1. 第1及び第2言語の二言語コーパスを用いて、前記第1言語及び第2言語用二言語単語対応付けモデルを訓練するよう構成される第1訓練ユニットと、
    前記第2及び第3言語の二言語コーパスを用いて、前記第2言語及び第3言語用二言語単語対応付けモデルを訓練するよう構成される第2訓練ユニットと、
    前記第1及び第2言語用二言語単語対応付けモデル及び前記第2及び第3言語用二言語単語対応付けモデルに基づいて、前記第1言語及び第3言語用二言語単語対応付けモデルを推定するよう構成されるモデル推定ユニットと、
    を具備し、
    前記第1及び第2言語用二言語単語対応付けモデル並びに前記第2及び第3言語用二言語単語対応付けモデルは各々単語翻訳サブモデル、位置歪みサブモデル及び単語増殖サブモデルからなり、
    前記モデル推定ユニットは、
    前記第1及び第2言語用前記単語翻訳サブモデル並びに前記第2及び第3言語用単語翻訳サブモデルに基づいて、前記第1及び第3言語用単語翻訳サブモデルを推定するよう構成される単語翻訳サブモデル推定ユニットと、
    前記第1及び第2言語用前記位置歪みサブモデル並びに前記第2及び第3言語用位置歪みサブモデルに基づいて、前記第1及び第3言語用位置歪みサブモデルを推定するよう構成される位置歪みサブモデル推定ユニットと、
    前記第1及び第2言語用単語増殖サブモデル及び/又は前記第2及び第3言語用単語増殖サブモデル、前記第1及び第2言語用単語翻訳サブモデル及び/又は前記第2及び第3言語用単語翻訳サブモデルに基づいて、前記第1及び第3言語用単語増殖サブモデルを推定するよう構成される単語増殖サブモデル推定ユニットと、
    を具備し、
    Figure 0004381425
    Figure 0004381425
    Figure 0004381425
  2. 請求項1に記載の二言語単語対応付けモデル訓練装置により前記第1及び第2言語の前記二言語コーパス並びに前記第2及び第3言語の二言語コーパスに基づいて第1言語及び第3言語用二言語単語対応モデルを得るように構成されるモデル取得ユニットと、
    前記第1及び第3言語用前記二言語単語対応付けモデルを用いて前記第1及び第3言語の二言語文対を単語対応付けするよう構成される単語対応付けユニットと、
    を具備する、二言語単語対応付け装置。
  3. 第1訓練ユニットが第1及び第2言語の二言語コーパスを用いて、前記第1言語及び第2言語用二言語単語対応付けモデルを訓練する第1ステップと、
    第2訓練ユニットが前記第2及び第3言語の二言語コーパスを用いて、前記第2言語及び第3言語用二言語単語対応付けモデルを訓練する第2ステップと、
    モデル推定ユニットが前記第1及び第2言語用二言語単語対応付けモデル及び前記第2及び第3言語用二言語単語対応付けモデルに基づいて、前記第1言語及び第3言語用二言語単語対応付けモデルを推定する第3ステップと、
    を含み、
    前記第1及び第2言語用二言語単語対応付けモデル並びに前記第2及び第3言語用二言語単語対応付けモデルは各々単語翻訳サブモデル、位置歪みサブモデル及び単語増殖サブモデルからなり、
    前記第3ステップは、
    前記第1及び第2言語用前記単語翻訳サブモデル並びに前記第2及び第3言語用単語翻訳サブモデルに基づいて、前記第1及び第3言語用単語翻訳サブモデルを推定する第1サブステップと、
    前記第1及び第2言語用前記位置歪みサブモデル並びに前記第2及び第3言語用位置歪みサブモデルに基づいて、前記第1及び第3言語用位置歪みサブモデルを推定する第2サブステップと、
    前記第1及び第2言語用単語増殖サブモデル及び/又は前記第2及び第3言語用単語増殖サブモデル、前記第1及び第2言語用単語翻訳サブモデル及び/又は前記第2及び第3言語用単語翻訳サブモデルに基づいて、前記第1及び第3言語用単語増殖サブモデルを推定する第3サブステップと、
    を含み、
    Figure 0004381425
    Figure 0004381425
    Figure 0004381425
  4. 請求項3に記載の二言語単語対応付けモデル訓練方法により前記第1及び第2言語の前記二言語コーパス並びに前記第2及び第3言語の二言語コーパスに基づいて第1言語及び第3言語用二言語単語対応モデルを取得するステップと、
    前記第1及び第3言語用前記二言語単語対応付けモデルを用いて前記第1及び第3言語の二言語文対を単語対応付けするステップと、
    を含む、二言語単語対応付け方法。
JP2007048881A 2006-02-28 2007-02-28 二言語単語対応付けモデル訓練方法及び装置、二言語単語対応付け方法及び装置 Expired - Fee Related JP4381425B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200610058067A CN101030196B (zh) 2006-02-28 2006-02-28 训练双语词对齐模型的方法和装置、双语词对齐方法和装置

Publications (2)

Publication Number Publication Date
JP2007234023A JP2007234023A (ja) 2007-09-13
JP4381425B2 true JP4381425B2 (ja) 2009-12-09

Family

ID=38445093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007048881A Expired - Fee Related JP4381425B2 (ja) 2006-02-28 2007-02-28 二言語単語対応付けモデル訓練方法及び装置、二言語単語対応付け方法及び装置

Country Status (3)

Country Link
US (1) US7844447B2 (ja)
JP (1) JP4381425B2 (ja)
CN (1) CN101030196B (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8185375B1 (en) * 2007-03-26 2012-05-22 Google Inc. Word alignment with bridge languages
CN101201820B (zh) * 2007-11-28 2010-06-02 北京金山软件有限公司 一种双语语料库过滤方法及系统
JP5008144B2 (ja) * 2008-02-13 2012-08-22 独立行政法人情報通信研究機構 対訳情報生成装置、対訳情報生成方法、及びプログラム
CN101667174A (zh) * 2008-09-01 2010-03-10 株式会社东芝 用于提高多语语料库中词对齐质量的方法及装置
US20120158398A1 (en) * 2010-12-17 2012-06-21 John Denero Combining Model-Based Aligner Using Dual Decomposition
CN102591857B (zh) * 2011-01-10 2015-06-24 富士通株式会社 一种平行语料资源获取方法及系统
US8838433B2 (en) 2011-02-08 2014-09-16 Microsoft Corporation Selection of domain-adapted translation subcorpora
US8903707B2 (en) * 2012-01-12 2014-12-02 International Business Machines Corporation Predicting pronouns of dropped pronoun style languages for natural language translation
CN104123274B (zh) * 2013-04-26 2018-06-12 富士通株式会社 评价中间语的词语的方法和装置以及机器翻译方法和设备
CN103577399B (zh) * 2013-11-05 2018-01-23 北京百度网讯科技有限公司 双语语料库的数据扩充方法和装置
CN103544147A (zh) * 2013-11-06 2014-01-29 北京百度网讯科技有限公司 训练翻译模型的方法和装置
CN103678565B (zh) * 2013-12-09 2017-02-15 国家计算机网络与信息安全管理中心 一种基于自引导方式的领域自适应句子对齐系统
CN105446958A (zh) * 2014-07-18 2016-03-30 富士通株式会社 词对齐方法和词对齐设备
US10713593B2 (en) * 2016-11-04 2020-07-14 Google Llc Implicit bridging of machine learning tasks
WO2023128170A1 (ko) * 2021-12-28 2023-07-06 삼성전자 주식회사 전자 장치, 전자 장치의 제어 방법 및 프로그램이 기록된 기록매체

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
GB2272091B (en) * 1992-10-30 1996-10-23 Canon Europa Nv Apparatus for use in aligning bilingual corpora
US6349276B1 (en) * 1998-10-29 2002-02-19 International Business Machines Corporation Multilingual information retrieval with a transfer corpus
US7318022B2 (en) * 2003-06-12 2008-01-08 Microsoft Corporation Method and apparatus for training a translation disambiguation classifier
CN1567297A (zh) * 2003-07-03 2005-01-19 中国科学院声学研究所 一种从双语语料库中自动抽取多词翻译等价单元的方法
US8666725B2 (en) * 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework

Also Published As

Publication number Publication date
US7844447B2 (en) 2010-11-30
US20070203690A1 (en) 2007-08-30
CN101030196A (zh) 2007-09-05
CN101030196B (zh) 2010-05-12
JP2007234023A (ja) 2007-09-13

Similar Documents

Publication Publication Date Title
JP4381425B2 (ja) 二言語単語対応付けモデル訓練方法及び装置、二言語単語対応付け方法及び装置
JP4331219B2 (ja) 二言語単語対応付けの方法および装置、二言語単語対応モデルを訓練する方法および装置
US8886514B2 (en) Means and a method for training a statistical machine translation system utilizing a posterior probability in an N-best translation list
CN107066455B (zh) 一种多语言智能预处理实时统计机器翻译系统
JP4886459B2 (ja) 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置
JPH08101837A (ja) 機械翻訳装置における翻訳規則学習方法
JP2005011358A5 (ja)
US20120010873A1 (en) Sentence translation apparatus and method
Meetei et al. WAT2019: English-Hindi translation on Hindi visual genome dataset
US9311299B1 (en) Weakly supervised part-of-speech tagging with coupled token and type constraints
CN110555213A (zh) 文本翻译模型的训练方法、文本翻译方法及装置
JP5060522B2 (ja) 多言語コーパスの単語アライメント品質を改善する方法及び装置
CN112016271A (zh) 语言风格转换模型的训练方法、文本处理方法以及装置
CN110728154B (zh) 一种半监督式通用神经机器翻译模型的构建方法
Afli et al. Integrating optical character recognition and machine translation of historical documents
KR20170008357A (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
Zhang Research on English machine translation system based on the internet
CN114519358A (zh) 翻译质量评估方法、装置、电子设备和存储介质
CN110147556B (zh) 一种多向神经网络翻译系统的构建方法
Mohaghegh et al. Improving Persian-English statistical machine translation: experiments in domain adaptation
Chen et al. A statistical method for translating Chinese into under-resourced minority languages
CN117094329B (zh) 一种用于解决语音歧义的语音翻译方法及装置
KR102653880B1 (ko) 번역 품질 평가 장치 및 방법
Mahata et al. Jumt at wmt2019 news translation task: a hybrid approach to machine translation for lithuanian to english
Kwong Phonological context approximation and homophone treatment for NEWS 2009 English-Chinese transliteration shared task

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090915

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131002

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees