JP2007328815A - 2カ国語コーパスからの変換マッピングの自動抽出プログラム - Google Patents
2カ国語コーパスからの変換マッピングの自動抽出プログラム Download PDFInfo
- Publication number
- JP2007328815A JP2007328815A JP2007211127A JP2007211127A JP2007328815A JP 2007328815 A JP2007328815 A JP 2007328815A JP 2007211127 A JP2007211127 A JP 2007211127A JP 2007211127 A JP2007211127 A JP 2007211127A JP 2007328815 A JP2007328815 A JP 2007328815A
- Authority
- JP
- Japan
- Prior art keywords
- node
- language
- nodes
- dependency structure
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】2カ国語コーパス取得される依存構造のノードを整列させるメソッド300は、第1の段階302が、該依存構造のノードを関連付けて仮の対応を形成する2段階アプローチを含む。次いで、段階304において、該依存構造のノードを仮の対応および/または構造的考察に応じて整列させる。整列した依存構造からマッピングを取得する。翻訳実行時により流暢な翻訳が取得できるように、ローカルコンテキストの種類および量の変化に応じてマッピングを拡大することが可能である。
【選択図】図4
Description
以下に、図1に示す汎用コンピュータ120を簡単に説明する。ただし、コンピュータ120は、好適なコンピューティング環境の一例にすぎず、本発明の用途および機能の範囲に関して制限を示唆することを意図するものではない。また、コンピュータ120は、そこに例示されたモジュールのいずれか1つまたは組合せに関連する依存性または要件を有するものと解釈されるべきではない。
本発明を詳細に説明する前に、論理形式について簡単に説明するのが有益であると思われる。論理形式およびシステム、ならびにそれらを生成するための方法についての十分かつ詳細な説明は、1999年10月12日に発行され、「METHOD AND SYSTEM FOR COMPUTING SEMANTIC LOGICAL FORMS FROM SYNTAX TREES」という名称の米国特許第5、966、686号(Heidorn他)に見いだすことができる。しかし、簡単にいうと、論理形式は、入力テキストに対する形態学的解析を行って、文法的関係で補われた従来の句構造解析をプロデュースすることによって生成される。テキスト入力における内容単語間のラベル付き依存性を記述するデータ構造である論理形式を導くために、構文解析にさらなる処理が施される。論理形式は、特定の構文変換(例えば能動/受動)を正規化するとともに、センテンス内照応形および長距離依存性を解決することができる。ここに示されるように、図3(A)の例では、論理形式の要素を直感的に理解するのに役立つグラフとして論理形式252を表すことができる。しかしながら、当業者ならわかるであろうが、論理形式は、コンピュータ可読媒体上に記憶されると、グラフを表すように簡単に理解することができなくなる。
LogicalNominative、LogicalComplement、LogicalAgent;
CoAgent、Beneficiary;
Modifier、Attribute、SentenceModifier;
PrepositionalRelationship;
Synonym、Equivalence、Apposition;
Hypernym、Classifier、SubClass;
Means、Purpose;
Operator、Modal、Aspect、DegreeModifier、Intensifier;
Focus、Topic;
Duration、Time;
Location、Property、Material、Manner、Measure、Color、Size;
Characteristic、Part;
Coordinate;
User、Possessor;
Source、Goal、Cause、Result;
およびDomainの如き方向性関連型によって接続される2つの単語から構成される。
図4は、2つの異なる言語からの少なくともセンテンスフラグメントの論理形式を関連付けるメソッド300を示す図であって、該論理形式は、親/子構造で構成されたノードを含む方法を示す図である。メソッド300は、論理形式のノードを関連付けて、ブロック302で指示される仮の対応を形成し、該仮の対応、および/またはブロック304で指示される構造的考察の少なくとも1つを除去することによって論理形式のノードを整列させる。
第1の言語と第2の言語の単語または論理形式の間のマッピングに関係する情報に加えて、ランタイム翻訳時に付加的な情報を記憶または使用することも可能である。該付加的な情報を使用して、マッピングの適切な集合を選択するとともに、どのマッピングを使用するかに関する対立、すなわち原始論理形式250に対して生成される原始論理形式252(またはその一部)が、変換マッピングデータベース218における変換マッピングの複数の原始側にマッチするときの対立(図2を参照)を解決することが可能である。
1.マッチさせる変換マッピングの大きさ。
2.トレーニングデータ内に変換マッピングが見いだされた頻度。
3.完全に整列した論理形式から変換マッピングを生成した頻度。
4.部分的に整列した論理形式から変換マッピングを生成した頻度。
5.一定の解析により得られた論理形式から変換マッピングを生成した頻度。
6.整列コンポーネントによって変換マッピングに割り当てられた整列スコア。
− en − direccion
− de − oficina
− en − direccion
Click hacer
Tobj −− * → Tobj −− clic
en −− *
(第1のケース)
Click elegir
Tobj −− * → Tobj −− *
(第2のケース)
適切なコンテキストにおいて、「click」の「select」への翻訳は、正当な変化であるといえる。しかし、場合によっては、それは、ある問題をもたらす。例えば、両変換の原始側が同一であるとして、ランタイム時に、入力論理形式がその原始側にマッチすれば、我々は、2つの異なる目的側の間で選択を行わなければならず、すなわちその入力を「hacer clic...」と翻訳すべきか、または「elegir..」と翻訳すべきかを判断しなければならない。(変換の原始側を差別化することによって顕在化するであろう)さらなるコンテキストが存在しないなかで、様々な頻度および評価尺度に基づいてそれらの選択を行う。
cambiar change
Tobj −− configuracion)→ Tobj −− setting
さらに、以下のような他のマッピングをマッチさせる場合は、
configuracion setting
mod − seguridad → Mod security
それら2つの組合せは(「configuration」に対して)重複するが、それらはともに「configuration」を「setting」に翻訳するため適合する。したがって、それらを組み合わせて、以下の変換LF(または目的LF)を生成することができる。
change
Tobj setting
Mod security
configuracion value
Mod − seguridad → Mod setting
「configuration」において先の2つのマッピングと重複するこのマッピングは、「configuration」を「setting」ではなく、「value」に翻訳するため適合しない。したがって、このマッピングを先の2つのマッピングと併合することができないため、この変換マッピングか先の2つのマッピングのいずれかを選択しなければならず、同時にその両方を選択することはできない。
140 処理装置
141 システムバス
150 システムメモリ
151 読取り専用メモリ(ROM)
152 ランダムアクセスメモリ(RAM)
153 基本入出力システム(BIOS)
154 オペレーティングシステム
155、165、195 アプリケーションプログラム
156、166 プログラムモジュール
157、167 プログラムデータ
160、170 インターフェース
161 ハードディスクドライブ
171 磁気ディスクドライブ
172 不揮発性磁気ディスク
175 光ディスクドライブ
176 不揮発性光ディスク
180 ユーザ入力インターフェース
182 キーボード
183 マイクロフォン
184 モニタ
185 ビデオインターフェース
186 プリンタ
187 スピーカ
190 アダプタ
191 LAN
192 モデム
193 WAN
194 リモートコンピュータ
200 システム
204、206 解析コンポーネント
208 統計的単語関連学習コンポーネント
210 論理形式整列コンポーネント
212 字句知識ベース構築コンポーネント
214 2カ国語辞書
216 辞書併合コンポーネント
220 更新2カ国語辞書
224 マッチングコンポーネント
226 変換コンポーネント
228 生成コンポーネント
230、250 原始センテンス
232、258 目的センテンス
234、252 原始論理形式
236、256 目的論理形式
238 単一単語翻訳対
240 複数単語対
242 変換マッピング
254 リンクされた論理形式
320 論理形式
322 英語の論理形式
323 仮の対応
350、352、354、356、358 マッピング
Claims (29)
- 第1の言語の文の単語を第2の言語の文の単語に整列するための、コンピュータにより実行されるプログラムであって、そこでは、前記第1の言語の文は、第1の依存構造のノードが該第1の言語の文の少なくとも1つの単語を含む第1の依存構造により表され、前記第2の言語の文は第2の依存構造のノードが該第2の言語の文の少なくとも1つの単語を含む第2の依存構造により表され、前記コンピュータが、
前記第1の依存構造ノードの1つおよび前記第2の依存構造のノードの1つを結合して複数の仮の対応を形成する手段と、
当該形成された仮の対応の各々の、前記第1の言語および前記第2の言語が、あらかじめ規則の形態で定められた共通の言語学的な要素を有するか否かを解析する手段と、
前記解析する手段の解析の結果に基づいて少なくとも1つの仮の対応を削除することにより、前記第1の言語の文の単語を前記第2の言語の文の単語に整列する手段と
して動作することを特徴とするプログラム。 - 前記複数の仮の対応を形成する手段は前記第1の言語の文の少なくとも1つの単語と前記第2の言語の文の少なくとも1つの単語の間の直接翻訳を含む仮の対応を形成することを特徴とする請求項1に記載のプログラム。
- 前記複数の仮の対応を形成する手段が、前記第1の言語の文の単語および前記第2の言語の文の単語の形態的ベースおよび派生語の翻訳を含む仮の対応を形成することを特徴とする請求項1に記載のプログラム。
- 前記関連付けて、仮の対応を形成する手段が、前記第1の言語の文の単語および前記第2の言語の文の単語の翻訳のベースおよび派生形式を含む仮の対応を形成することを特徴とする請求項1に記載のプログラム。
- 前記複数の仮の対応を形成する手段が、ノード間の仮の対応を形成し、前記ノードの1つが他のノードより多くの字句要素を含むことを特徴とする請求項1に記載のプログラム。
- 前記ノードの1つは一方の言語における単一単語で、前記他のノードは他方の言語における少なくとも2つの単語を含むことを特徴とする請求項5に記載のプログラム。
- 前記コンピュータが前記規則の集合の規則の各々を選択した順序を前記依存構造に適用する手段として動作することを特徴とする請求項1に記載のプログラム。
- 前記依存構造の各々は不整列ノードの集合を含み、整列ノードの集合が識別されるまで前記規則の各々を適用する手段が前記不整列ノードの集合に連続的に前記規則の集合の規則の各々を適用し、前記コンピュータが次いで前記整列ノードの集合のノードを前記不整列ノードの集合から除去する手段および、前記規則の集合の規則の各々を再び前記不整列ノードの集合に連続的に適用する手段として動作することを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、双方向に一意的な翻訳が存在する場合にノードの集合を整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、1つのノードが仮の対応を有する各依存構造からのノードである一対の親ノードを、各親ノードの各子ノードが既に他の親ノードの子に対して整列されている場合に互いに整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、1つのノードが各依存構造からのノードである一対の子ノードを、それらの間に仮の対応が存在し、かつ各子ノードの親ノードが他方の子の対応する親ノードに対して既に整列されている場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、1つのノードが各依存構造からのノードである一対のノードを、想定される前記ノードのそれぞれの親ノードが互いに整列され、それぞれの子ノードも互いに整列される場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、第1の動詞ノード、および一方の依存構造からの動詞ノードでない関連子ノードを他方の依存構造の第2の動詞ノードに対して、前記関連子ノードが前記第2の動詞ノードに対して既に整列され、前記第2の動詞ノードが整列親ノードを有さないか、あるいは前記第1の動詞ノードおよび前記第2の動詞ノードが互いに整列された関連子ノードを有する場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、1つのノードが同じ品詞を含む各依存構造からのノードである一対のノードを、不整列の兄弟ノードが存在せず、それぞれの親ノードが整列され、想定される該ノードの集合とそれぞれの親ノードの言語学的関係が同じである場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、1つのノードが同じ品詞を含む各依存構造からのノードである一対のノードを、それぞれの子ノードが互いに整列され、想定される前記ノードの集合とそれぞれの子ノードの言語学的関係が同じである場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、1つの依存構造の不整列ノードが、存在すればすべて整列されたそれぞれの親ノードと、存在すればすべて整列されたそれぞれの子ノードとを含む隣接ノードを有し、前記隣接ノードの1つが複合語を含むノードに対して整列された非複合語である場合に、前記複合語を含むノードに対して前記不整列ノードを整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、1つのノードが代名詞を含む各依存構造からのノードである一対のノードを、それぞれの親ノードが互いに整列され、いずれのノードも不整列の兄弟を有さない場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、1つのノードが名詞を含む各依存構造からのノードである一対のノードを、名詞を含むそれぞれの親ノードが互いに整列され、いずれのノードも不整列の兄弟を有さず、前記ノードの各々とそれぞれの親の言語学的関係が修飾関係または前置詞的関係を含む場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、一方の依存構造の第1の動詞ノードを他方の依存構造の第2の動詞ノードに対して、前記第1の動詞ノードが仮の対応を有さず、単一の関連子動詞ノードが既に前記第2の動詞ノードに対して整列されている場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、一方の依存構造の第1の動詞ノードおよび単一のそれぞれの親ノードを他方の依存構造の第2の動詞ノードに対して、前記第1の動詞ノードが仮の対応を有さず、前記単一の親動詞ノードが前記第2の動詞ノードに対して整列され、前記単一の親動詞ノードが前記第1の動詞ノード以外に不整列の動詞子ノードを有さず、第2の動詞ノードが不整列の動詞子ノードを有さない場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、一方の依存構造の代名詞を含む第1のノードを他方の依存構造の第2のノードに対して、前記第1のノードの親ノードが前記第2のノードに対して整列され、前記第2のノードが不整列の子ノードを有さない場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 前記規則の集合の1つの規則は、一方の依存構造の第1の動詞ノードおよびそれぞれの親ノードを他方の依存構造の第2の動詞ノードに対して、前記第1の動詞ノードが仮の対応を有さず、前記親動詞ノードが前記第2の動詞ノードに対して整列され、前記第1の動詞ノードと前記親動詞ノードの関係が様相関係を含む場合に整列させるための規則であることを特徴とする請求項7に記載のプログラム。
- 第1の言語の文の単語を第2の言語の文の単語に整列するための、コンピュータにより実行されるプログラムであって、そこでは、前記第1の言語の文は、第1の依存構造のノードが該第1の言語の文の少なくとも1つの単語を含む第1の言語の依存構造により表され、前記第2の言語の文は第2の依存構造のノードが該第2の言語の文の少なくとも1つの単語を含む第2の依存構造により表され、複数のノードが親/子構造に編成されており、前記コンピュータが、
前記依存構造のノードを規則の集合に応じて整列させる手段であって、親/子構造に関係なく最初に複数の規則を前記ノードに適用する手段として動作することを特徴とするプログラム。 - テキスト入力を第1の言語から第2の言語に翻訳する機械翻訳システムとしてのコンピュータにより実行されるプログラムであって、前記コンピュータが、
各々のマッピングが第1の言語の文の単語の第2の言語の文の単語に対する整列を示す複数のマッピングであって、そこでは前記第1の言語の文は、第1の依存構造のノードが該第1の言語の文の少なくとも1つの単語を含む第1の言語の依存構造により表され、前記第2の言語の文は第2の依存構造のノードが該第2の言語の文の少なくとも1つの単語を含む第2の言語の依存構造により表され、前記マッピングの少なくともいくつかは、いくつかの共通要素によってコンテキストが変化する前記第1の言語の依存構造と、いくつかの共通要素によってコンテキストが変化する前記第2の言語の依存構造とに対応する複数のマッピングのための記憶手段として動作することを特徴とするプログラム。 - 前記少なくとも1つのマッピングの前記第1の言語の依存構造および前記第2の言語の依存構造は言語の各々に2つの共通要素を有することを特徴とする請求項24に記載のプログラム。
- 前記少なくともいくつかのマッピングの前記第1の言語の依存構造および前記第2の言語の依存構造は、前記言語の各々に3つの共通要素を有することを特徴とする請求項24に記載のプログラム。
- 前記記憶手段は、前記第1の言語の各依存構造の大きさを示す情報を含むことを特徴とする請求項24に記載のプログラム。
- 前記記憶手段は、より大きな依存構造から発生する前記第1の言語の依存構造の完全整列の範囲を示す情報を含むことを特徴とする請求項24に記載のプログラム。
- 前記記憶手段は、前記第1の言語の依存構造がトレーニングデータの前記マッピング内に出現した頻度を示す情報を含むことを特徴とする請求項24に記載のプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29533801P | 2001-06-01 | 2001-06-01 | |
US09/899,554 US7734459B2 (en) | 2001-06-01 | 2001-07-05 | Automatic extraction of transfer mappings from bilingual corpora |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002162077A Division JP4494706B2 (ja) | 2001-06-01 | 2002-06-03 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009253218A Division JP5538820B2 (ja) | 2001-06-01 | 2009-11-04 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007328815A true JP2007328815A (ja) | 2007-12-20 |
Family
ID=26969061
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002162077A Expired - Fee Related JP4494706B2 (ja) | 2001-06-01 | 2002-06-03 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
JP2007211127A Pending JP2007328815A (ja) | 2001-06-01 | 2007-08-13 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
JP2009253218A Expired - Fee Related JP5538820B2 (ja) | 2001-06-01 | 2009-11-04 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002162077A Expired - Fee Related JP4494706B2 (ja) | 2001-06-01 | 2002-06-03 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009253218A Expired - Fee Related JP5538820B2 (ja) | 2001-06-01 | 2009-11-04 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
Country Status (3)
Country | Link |
---|---|
US (2) | US7734459B2 (ja) |
EP (1) | EP1262879B1 (ja) |
JP (3) | JP4494706B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130123037A (ko) * | 2012-05-02 | 2013-11-12 | 한국전자통신연구원 | 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법 |
Families Citing this family (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7024666B1 (en) * | 2002-01-28 | 2006-04-04 | Roy-G-Biv Corporation | Motion control systems and methods |
US6076051A (en) | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US20010032278A1 (en) | 1997-10-07 | 2001-10-18 | Brown Stephen J. | Remote generation and distribution of command programs for programmable devices |
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
US7904595B2 (en) | 2001-01-18 | 2011-03-08 | Sdl International America Incorporated | Globalization management system and method therefor |
US7050964B2 (en) | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
US7734459B2 (en) * | 2001-06-01 | 2010-06-08 | Microsoft Corporation | Automatic extraction of transfer mappings from bilingual corpora |
US7191115B2 (en) * | 2001-06-20 | 2007-03-13 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among words |
US20030074188A1 (en) * | 2001-10-12 | 2003-04-17 | Tohgo Murata | Method and apparatus for language instruction |
EP1306775A1 (en) * | 2001-10-29 | 2003-05-02 | BRITISH TELECOMMUNICATIONS public limited company | Machine translation |
JP3973549B2 (ja) * | 2002-12-19 | 2007-09-12 | 沖電気工業株式会社 | 対訳依存構造対応付け装置、方法及びプログラム、並びに、対訳依存構造対応付けプログラムを記録した記録媒体 |
US7356457B2 (en) * | 2003-02-28 | 2008-04-08 | Microsoft Corporation | Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words |
US8108534B2 (en) * | 2003-05-08 | 2012-01-31 | Jda Software Group, Inc. | Data integration system with programmatic source and target interfaces |
AU2004202391A1 (en) * | 2003-06-20 | 2005-01-13 | Microsoft Corporation | Adaptive machine translation |
US20060064503A1 (en) * | 2003-09-25 | 2006-03-23 | Brown David W | Data routing systems and methods |
US8027349B2 (en) | 2003-09-25 | 2011-09-27 | Roy-G-Biv Corporation | Database event driven motion systems |
US7689412B2 (en) * | 2003-12-05 | 2010-03-30 | Microsoft Corporation | Synonymous collocation extraction using translation information |
KR100561227B1 (ko) | 2003-12-19 | 2006-03-15 | 한국전자통신연구원 | 한-중 기계번역시스템의 용언구 패턴 자동 확장 및 검증장치 및 방법 |
JP3790825B2 (ja) * | 2004-01-30 | 2006-06-28 | 独立行政法人情報通信研究機構 | 他言語のテキスト生成装置 |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US7593843B2 (en) * | 2004-03-30 | 2009-09-22 | Microsoft Corporation | Statistical language model for logical form using transfer mappings |
JP4404211B2 (ja) | 2005-03-14 | 2010-01-27 | 富士ゼロックス株式会社 | マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム |
US20060282255A1 (en) * | 2005-06-14 | 2006-12-14 | Microsoft Corporation | Collocation translation from monolingual and available bilingual corpora |
US7680647B2 (en) * | 2005-06-21 | 2010-03-16 | Microsoft Corporation | Association-based bilingual word alignment |
US20070016397A1 (en) * | 2005-07-18 | 2007-01-18 | Microsoft Corporation | Collocation translation using monolingual corpora |
US7957953B2 (en) * | 2005-10-03 | 2011-06-07 | Microsoft Corporation | Weighted linear bilingual word alignment model |
US20070083357A1 (en) * | 2005-10-03 | 2007-04-12 | Moore Robert C | Weighted linear model |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US7725306B2 (en) * | 2006-06-28 | 2010-05-25 | Microsoft Corporation | Efficient phrase pair extraction from bilingual word alignments |
US7805289B2 (en) * | 2006-07-10 | 2010-09-28 | Microsoft Corporation | Aligning hierarchal and sequential document trees to identify parallel data |
JP5342760B2 (ja) * | 2007-09-03 | 2013-11-13 | 株式会社東芝 | 訳語学習のためのデータを作成する装置、方法、およびプログラム |
JP5374515B2 (ja) * | 2007-12-05 | 2013-12-25 | フェイスブック,インク. | ソーシャルネットワークにおけるコミュニティー翻訳 |
US8849650B2 (en) * | 2008-10-22 | 2014-09-30 | Sankhya Technologies Private Limited | System and method for automatically generating sentences of a language |
CN101996166B (zh) * | 2009-08-14 | 2015-08-05 | 张龙哺 | 双语句对模式化记录方法以及翻译方法和翻译系统 |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
CN101908042B (zh) * | 2010-08-09 | 2016-04-13 | 中国科学院自动化研究所 | 一种双语联合语义角色的标注方法 |
KR101356417B1 (ko) * | 2010-11-05 | 2014-01-28 | 고려대학교 산학협력단 | 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법 |
KR20120089502A (ko) * | 2010-12-09 | 2012-08-13 | 한국전자통신연구원 | 번역지식 서버 생성 방법 및 그 장치 |
US20120158398A1 (en) * | 2010-12-17 | 2012-06-21 | John Denero | Combining Model-Based Aligner Using Dual Decomposition |
US9547626B2 (en) | 2011-01-29 | 2017-01-17 | Sdl Plc | Systems, methods, and media for managing ambient adaptability of web applications and web services |
US10657540B2 (en) | 2011-01-29 | 2020-05-19 | Sdl Netherlands B.V. | Systems, methods, and media for web content management |
US10580015B2 (en) | 2011-02-25 | 2020-03-03 | Sdl Netherlands B.V. | Systems, methods, and media for executing and optimizing online marketing initiatives |
US10140320B2 (en) | 2011-02-28 | 2018-11-27 | Sdl Inc. | Systems, methods, and media for generating analytical data |
US9984054B2 (en) | 2011-08-24 | 2018-05-29 | Sdl Inc. | Web interface including the review and manipulation of a web document and utilizing permission based control |
US8903707B2 (en) | 2012-01-12 | 2014-12-02 | International Business Machines Corporation | Predicting pronouns of dropped pronoun style languages for natural language translation |
US9773270B2 (en) | 2012-05-11 | 2017-09-26 | Fredhopper B.V. | Method and system for recommending products based on a ranking cocktail |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9519639B2 (en) | 2012-06-08 | 2016-12-13 | Facebook, Inc. | Community translation of user-generated content |
US11386186B2 (en) | 2012-09-14 | 2022-07-12 | Sdl Netherlands B.V. | External content library connector systems and methods |
US10452740B2 (en) | 2012-09-14 | 2019-10-22 | Sdl Netherlands B.V. | External content libraries |
US11308528B2 (en) | 2012-09-14 | 2022-04-19 | Sdl Netherlands B.V. | Blueprinting of multimedia assets |
US9916306B2 (en) | 2012-10-19 | 2018-03-13 | Sdl Inc. | Statistical linguistic analysis of source content |
US9779087B2 (en) * | 2013-12-13 | 2017-10-03 | Google Inc. | Cross-lingual discriminative learning of sequence models with posterior regularization |
KR102396250B1 (ko) | 2015-07-31 | 2022-05-09 | 삼성전자주식회사 | 대역 어휘 결정 장치 및 방법 |
US10614167B2 (en) | 2015-10-30 | 2020-04-07 | Sdl Plc | Translation review workflow systems and methods |
JP2019082860A (ja) * | 2017-10-30 | 2019-05-30 | 富士通株式会社 | 生成プログラム、生成方法及び生成装置 |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
US11276391B2 (en) * | 2020-02-06 | 2022-03-15 | International Business Machines Corporation | Generation of matched corpus for language model training |
CN111476739B (zh) * | 2020-04-17 | 2023-04-18 | 宁波大学科学技术学院 | 水下图像增强方法、系统及存储介质 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4823306A (en) | 1987-08-14 | 1989-04-18 | International Business Machines Corporation | Text search system |
US4839853A (en) | 1988-09-15 | 1989-06-13 | Bell Communications Research, Inc. | Computer information retrieval using latent semantic structure |
NL8900587A (nl) | 1989-03-10 | 1990-10-01 | Bso Buro Voor Systeemontwikkel | Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst. |
JP3266246B2 (ja) * | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
EP0473864A1 (en) | 1990-09-04 | 1992-03-11 | International Business Machines Corporation | Method and apparatus for paraphrasing information contained in logical forms |
US5325298A (en) | 1990-11-07 | 1994-06-28 | Hnc, Inc. | Methods for generating or revising context vectors for a plurality of word stems |
US5278980A (en) | 1991-08-16 | 1994-01-11 | Xerox Corporation | Iterative technique for phrase query formation and an information retrieval system employing same |
US5377103A (en) | 1992-05-15 | 1994-12-27 | International Business Machines Corporation | Constrained natural language interface for a computer that employs a browse function |
US5592661A (en) | 1992-07-16 | 1997-01-07 | International Business Machines Corporation | Detection of independent changes via change identifiers in a versioned database management system |
JP2745370B2 (ja) * | 1993-02-23 | 1998-04-28 | 日本アイ・ビー・エム株式会社 | 機械翻訳方法及び機械翻訳装置 |
US5619709A (en) | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
GB9320404D0 (en) | 1993-10-04 | 1993-11-24 | Dixon Robert | Method & apparatus for data storage & retrieval |
US5873056A (en) | 1993-10-12 | 1999-02-16 | The Syracuse University | Natural language processing system for semantic vector representation which accounts for lexical ambiguity |
US5724594A (en) | 1994-02-10 | 1998-03-03 | Microsoft Corporation | Method and system for automatically identifying morphological information from a machine-readable dictionary |
US5675819A (en) | 1994-06-16 | 1997-10-07 | Xerox Corporation | Document information retrieval using global word co-occurrence patterns |
US5794050A (en) | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
JP2923552B2 (ja) | 1995-02-13 | 1999-07-26 | 富士通株式会社 | 組織活動データベースの構築方法,それに使用する分析シートの入力方法及び組織活動管理システム |
AU6849196A (en) | 1995-08-16 | 1997-03-19 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
JP3083742B2 (ja) | 1995-10-03 | 2000-09-04 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 表計算方法 |
SG49804A1 (en) * | 1996-03-20 | 1998-06-15 | Government Of Singapore Repres | Parsing and translating natural language sentences automatically |
US5995922A (en) | 1996-05-02 | 1999-11-30 | Microsoft Corporation | Identifying information related to an input word in an electronic dictionary |
US5884247A (en) | 1996-10-31 | 1999-03-16 | Dialect Corporation | Method and apparatus for automated language translation |
US6076051A (en) | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US6098033A (en) | 1997-07-31 | 2000-08-01 | Microsoft Corporation | Determining similarity between words |
US6243669B1 (en) * | 1999-01-29 | 2001-06-05 | Sony Corporation | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation |
WO2001086491A2 (en) * | 2000-05-11 | 2001-11-15 | University Of Southern California | Machine translation techniques |
US7050964B2 (en) | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
US7734459B2 (en) * | 2001-06-01 | 2010-06-08 | Microsoft Corporation | Automatic extraction of transfer mappings from bilingual corpora |
-
2001
- 2001-07-05 US US09/899,554 patent/US7734459B2/en not_active Expired - Fee Related
-
2002
- 2002-05-23 EP EP02011351.0A patent/EP1262879B1/en not_active Expired - Lifetime
- 2002-06-03 JP JP2002162077A patent/JP4494706B2/ja not_active Expired - Fee Related
-
2007
- 2007-08-13 JP JP2007211127A patent/JP2007328815A/ja active Pending
-
2009
- 2009-11-04 JP JP2009253218A patent/JP5538820B2/ja not_active Expired - Fee Related
-
2010
- 2010-05-04 US US12/773,328 patent/US8275605B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130123037A (ko) * | 2012-05-02 | 2013-11-12 | 한국전자통신연구원 | 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법 |
KR101694286B1 (ko) * | 2012-05-02 | 2017-01-09 | 한국전자통신연구원 | 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP5538820B2 (ja) | 2014-07-02 |
US8275605B2 (en) | 2012-09-25 |
US7734459B2 (en) | 2010-06-08 |
JP2003030185A (ja) | 2003-01-31 |
JP4494706B2 (ja) | 2010-06-30 |
EP1262879B1 (en) | 2018-07-25 |
JP2010027088A (ja) | 2010-02-04 |
EP1262879A1 (en) | 2002-12-04 |
US20030061023A1 (en) | 2003-03-27 |
US20100223049A1 (en) | 2010-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5538820B2 (ja) | 2カ国語コーパスからの変換マッピングの自動抽出プログラム | |
JP4714400B2 (ja) | スケーラブル機械翻訳システム | |
EP1308851B1 (en) | Method of calculating translation relationships among words of different languages | |
US7356457B2 (en) | Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words | |
JP4554273B2 (ja) | 機械トランスレータをトレーニングする方法およびそのシステム | |
AU2004201089B2 (en) | Syntax tree ordering for generating a sentence | |
US7529656B2 (en) | Translating method, translated sentence outputting method, recording medium, program, and computer device | |
US20070011132A1 (en) | Named entity translation | |
JP2003308320A (ja) | 文実現システム | |
JP2005507524A (ja) | 機械翻訳 | |
JP2005507525A (ja) | 機械翻訳 | |
Uematsu et al. | Integrating multiple dependency corpora for inducing wide-coverage Japanese CCG resources | |
JP2003016061A (ja) | 自動自然言語翻訳 | |
Srinivas et al. | An approach to robust partial parsing and evaluation metrics | |
US20050267735A1 (en) | Critiquing clitic pronoun ordering in french | |
JP2001503540A (ja) | アノテートされたテキストの自動翻訳 | |
KR950013129B1 (ko) | 기계번역장치 및 방법 | |
Vasuki et al. | English to Tamil machine translation system using parallel corpus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080304 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080604 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080609 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080904 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090703 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20090728 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090728 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091104 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20091106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20091106 |