JP2010027088A - 2カ国語コーパスからの変換マッピングの自動抽出プログラム - Google Patents
2カ国語コーパスからの変換マッピングの自動抽出プログラム Download PDFInfo
- Publication number
- JP2010027088A JP2010027088A JP2009253218A JP2009253218A JP2010027088A JP 2010027088 A JP2010027088 A JP 2010027088A JP 2009253218 A JP2009253218 A JP 2009253218A JP 2009253218 A JP2009253218 A JP 2009253218A JP 2010027088 A JP2010027088 A JP 2010027088A
- Authority
- JP
- Japan
- Prior art keywords
- node
- nodes
- computer
- language
- rules
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】2カ国語コーパス取得される依存構造のノードを整列させるメソッド300は、第1の段階302が、該依存構造のノードを関連付けて仮の対応を形成する2段階アプローチを含む。次いで、段階304において、該依存構造のノードを仮の対応および/または構造的考察に応じて整列させる。整列した依存構造からマッピングを取得する。翻訳実行時により流暢な翻訳が取得できるように、ローカルコンテキストの種類および量の変化に応じてマッピングを拡大することが可能である。
【選択図】図4
Description
以下に、図1に示す汎用コンピュータ120を簡単に説明する。ただし、コンピュータ120は、好適なコンピューティング環境の一例にすぎず、本発明の用途および機能の範囲に関して制限を示唆することを意図するものではない。また、コンピュータ120は、そこに例示されたモジュールのいずれか1つまたは組合せに関連する依存性または要件を有するものと解釈されるべきではない。
本発明を詳細に説明する前に、論理形式について簡単に説明するのが有益であると思われる。論理形式およびシステム、ならびにそれらを生成するための方法についての十分かつ詳細な説明は、1999年10月12日に発行され、「METHOD AND SYSTEM FOR COMPUTING SEMANTIC LOGICAL FORMS FROM SYNTAX TREES」という名称の米国特許第5、966、686号(Heidorn他)に見いだすことができる。しかし、簡単にいうと、論理形式は、入力テキストに対する形態学的解析を行って、文法的関係で補われた従来の句構造解析をプロデュースすることによって生成される。テキスト入力における内容単語間のラベル付き依存性を記述するデータ構造である論理形式を導くために、構文解析にさらなる処理が施される。論理形式は、特定の構文変換(例えば能動/受動)を正規化するとともに、センテンス内照応形および長距離依存性を解決することができる。ここに示されるように、図3(A)の例では、論理形式の要素を直感的に理解するのに役立つグラフとして論理形式252を表すことができる。しかしながら、当業者ならわかるであろうが、論理形式は、コンピュータ可読媒体上に記憶されると、グラフを表すように簡単に理解することができなくなる。
LogicalNominative、LogicalComplement、LogicalAgent;
CoAgent、Beneficiary;
Modifier、Attribute、SentenceModifier;
PrepositionalRelationship;
Synonym、Equivalence、Apposition;
Hypernym、Classifier、SubClass;
Means、Purpose;
Operator、Modal、Aspect、DegreeModifier、Intensifier;
Focus、Topic;
Duration、Time;
Location、Property、Material、Manner、Measure、Color、Size;
Characteristic、Part;
Coordinate;
User、Possessor;
Source、Goal、Cause、Result;
およびDomainの如き方向性関連型によって接続される2つの単語から構成される。
図4は、2つの異なる言語からの少なくともセンテンスフラグメントの論理形式を関連付けるメソッド300を示す図であって、該論理形式は、親/子構造で構成されたノードを含む方法を示す図である。メソッド300は、論理形式のノードを関連付けて、ブロック302で指示される仮の対応を形成し、該仮の対応、および/またはブロック304で指示される構造的考察の少なくとも1つを除去することによって論理形式のノードを整列させる。
第1の言語と第2の言語の単語または論理形式の間のマッピングに関係する情報に加えて、ランタイム翻訳時に付加的な情報を記憶または使用することも可能である。該付加的な情報を使用して、マッピングの適切な集合を選択するとともに、どのマッピングを使用するかに関する対立、すなわち原始論理形式250に対して生成される原始論理形式252(またはその一部)が、変換マッピングデータベース218における変換マッピングの複数の原始側にマッチするときの対立(図2を参照)を解決することが可能である。
1.マッチさせる変換マッピングの大きさ。
2.トレーニングデータ内に変換マッピングが見いだされた頻度。
3.完全に整列した論理形式から変換マッピングを生成した頻度。
4.部分的に整列した論理形式から変換マッピングを生成した頻度。
5.一定の解析により得られた論理形式から変換マッピングを生成した頻度。
6.整列コンポーネントによって変換マッピングに割り当てられた整列スコア。
− en − direccion
− de − oficina
− en − direccion
Click hacer
Tobj −− * → Tobj −− clic
en −− *
(第1のケース)
Click elegir
Tobj −− * → Tobj −− *
(第2のケース)
適切なコンテキストにおいて、「click」の「select」への翻訳は、正当な変化であるといえる。しかし、場合によっては、それは、ある問題をもたらす。例えば、両変換の原始側が同一であるとして、ランタイム時に、入力論理形式がその原始側にマッチすれば、我々は、2つの異なる目的側の間で選択を行わなければならず、すなわちその入力を「hacer clic...」と翻訳すべきか、または「elegir..」と翻訳すべきかを判断しなければならない。(変換の原始側を差別化することによって顕在化するであろう)さらなるコンテキストが存在しないなかで、様々な頻度および評価尺度に基づいてそれらの選択を行う。
cambiar change
Tobj −− configuracion)→ Tobj −− setting
さらに、以下のような他のマッピングをマッチさせる場合は、
configuracion setting
mod − seguridad → Mod security
それら2つの組合せは(「configuration」に対して)重複するが、それらはともに「configuration」を「setting」に翻訳するため適合する。したがって、それらを組み合わせて、以下の変換LF(または目的LF)を生成することができる。
change
Tobj setting
Mod security
configuracion value
Mod − seguridad → Mod setting
「configuration」において先の2つのマッピングと重複するこのマッピングは、「configuration」を「setting」ではなく、「value」に翻訳するため適合しない。したがって、このマッピングを先の2つのマッピングと併合することができないため、この変換マッピングか先の2つのマッピングのいずれかを選択しなければならず、同時にその両方を選択することはできない。
140 処理装置
141 システムバス
150 システムメモリ
151 読取り専用メモリ(ROM)
152 ランダムアクセスメモリ(RAM)
153 基本入出力システム(BIOS)
154 オペレーティングシステム
155、165、195 アプリケーションプログラム
156、166 プログラムモジュール
157、167 プログラムデータ
160、170 インターフェース
161 ハードディスクドライブ
171 磁気ディスクドライブ
172 不揮発性磁気ディスク
175 光ディスクドライブ
176 不揮発性光ディスク
180 ユーザ入力インターフェース
182 キーボード
183 マイクロフォン
184 モニタ
185 ビデオインターフェース
186 プリンタ
187 スピーカ
190 アダプタ
191 LAN
192 モデム
193 WAN
194 リモートコンピュータ
200 システム
204、206 解析コンポーネント
208 統計的単語関連学習コンポーネント
210 論理形式整列コンポーネント
212 字句知識ベース構築コンポーネント
214 2カ国語辞書
216 辞書併合コンポーネント
220 更新2カ国語辞書
224 マッチングコンポーネント
226 変換コンポーネント
228 生成コンポーネント
230、250 原始センテンス
232、258 目的センテンス
234、252 原始論理形式
236、256 目的論理形式
238 単一単語翻訳対
240 複数単語対
242 変換マッピング
254 リンクされた論理形式
320 論理形式
322 英語の論理形式
323 仮の対応
350、352、354、356、358 マッピング
Claims (28)
- 有形的なコンピュータ読み取り可能な記憶媒体上の2つの異なる言語から依存構造を関連付けるコンピュータ実装される方法であって、前記依存構造は階層的な親/子構造で構成された複数のノードを含み、前記ノードの1つは前記言語のうちの1つにおける単語であり、前記依存構造はデータ構造である、コンピュータ実装される方法であって、
前記依存構造のノードをコンピュータに関連付けて前記有形的な媒体上で仮の対応を形成するステップであって、前記仮の対応は、第1の言語のセンテンスの中の単語が第2の言語のセンテンスの中の単語と対応付けられたデータ構造であり、該関連付けるステップは、形態論に基づく翻訳結果および派生語の翻訳結果を含む仮の対応を形成することを含む、ステップと、
前記有形的な媒体上の前記仮の対応および構造的考察の少なくとも1つを、少なくとも1つの除去をすることに応じて、前記依存構造のノードを対応付けるステップであって、該対応付けるステップは、前記依存構造の前記階層的な親/子構造のトップノードまたはボトムノードのいずれかから始まることを必要としない、ステップと、
前記依存構造の対応付けを示す出力を前記コンピュータから提供するステップと
を備えることを特徴とするコンピュータ実装される方法。 - 前記関連付けるステップは、直接翻訳を含む仮の対応を形成することを含むことを特徴とする請求項1に記載のコンピュータ実装される方法。
- 前記関連付けるステップは、翻訳のベースおよび派生形式を含む仮の対応を形成することを含むことを特徴とする請求項1に記載のコンピュータ実装される方法。
- 前記関連付けるステップは、ノード間の仮の対応を形成することを含み、前記ノードの1つが他のノードより多くの字句要素を含むことを特徴とする請求項1に記載のコンピュータ実装される方法。
- 前記ノードの1つは前記言語のうちの1つの単一の単語であり、他のノードは他の言語の少なくとも2つの単語を含むことを特徴とする請求項4に記載のコンピュータ実装される方法。
- 構造的考察に従って対応付けするステップは、前記第1の言語と第2の言語との間の共通の言語学的な要素を示す規則の集合に従ってノードを対応付けすることを含み、該規則の集合の中の規則のそれぞれは、選択された順序で前記依存構造に適用されることを特徴とする請求項1に記載のコンピュータ実装される方法。
- 前記依存構造の各々は対応付けられていないノードの集合を含み、前記規則のそれぞれは、対応付けられたノードの集合が識別されるまで前記対応付けられていないノードの集合に連続的に適用され、次いで、前記対応付けられたノードの集合のノードが、前記対応付けられていないノードの集合から除去され、前記規則の集合の規則のそれぞれが再び前記対応付けられていないノードの集合に連続的に適用されることを特徴とする請求項5に記載のコンピュータ実装される方法。
- 有形的なコンピュータ読み取り可能な記憶媒体上の2つの異なる言語から依存構造を関連付けるコンピュータ実装される方法であって、前記依存構造は階層的な親/子構造で構成された複数のノードを含み、前記ノードの1つは前記言語のうちの1つにおける単語であり、前記依存構造はデータ構造である、コンピュータ実装される方法であって、
第1の言語と第2の言語との間の共通する言語学的な要素を示す少なくとも3つの異なる規則を含む規則の集合に従ってコンピュータを用いて前記依存構造のノードを前記有形的な媒体上の対応と対応付けるステップであって、前記依存構造は、対応付けられていないノードの集合を含み、前記規則のそれぞれが適用された後に、他の規則を適用する前に対応付けられていないノードの集合から対応付けられた任意のノードが除去され、該対応付けるステップは前記依存構造の前記階層的な親/子構造のトップノードまたはボトムノードのいずれかから開始する必要はなく、該対応付けすることは、ノードのトップダウン処理またはボトムアップ処理に基づかない、対応付けするステップと、
前記依存構造の対応付けを示す出力を前記コンピュータから提供するステップと
を備えることを特徴とするコンピュータ実装される方法。 - 前記規則の集合の規則のそれぞれは、選択された順序で前記依存構造に適用されることを特徴とする請求項8に記載のコンピュータ実装される方法。
- 後の規則の適用は、競合する対応付けの間を明瞭化するために使用される基準点としての前の規則の適用によって作成される対応付けを使用することを特徴とする請求項8に記載のコンピュータ実装される方法。
- 前記規則の集合は、前記対応付けられていないノードの集合に連続的に適用されることを特徴とする請求項9に記載のコンピュータ実装される方法。
- 有形的なコンピュータ読み取り可能な記憶媒体上の2つの異なる言語から依存構造を関連付けるコンピュータ実装される方法であって、前記依存構造は階層的な親/子構造で構成された複数のノードを含み、前記ノードの1つは前記言語のうちの1つにおける単語であり、前記依存構造はデータ構造である、コンピュータ実装される方法であって、
第1の言語と第2の言語との間の共通する言語学的な要素を示す少なくとも2つの異なる規則を含む規則の集合に従ってコンピュータを用いて前記依存構造のノードを前記有形的な媒体上の対応と対応付けるステップであって、対応付けられたノードは、前記親/子構造に基づいて決定され、該対応付けるステップは前記依存構造の前記階層的な親/子構造のトップノードまたはボトムノードのいずれかから開始する必要はなく、ノードの対応付けの順序は、言語的関係に基づいており、より少ない言語的関係を有するノードを対応付けるよりも、より多い言語的関係を有するノードを割り当てることから開始する、ステップと、
依存構造の対応付けを示す出力を前記コンピュータから提供するステップと
を備えることを特徴とするコンピュータ実装される方法。 - 前記依存構造は、対応付けられていないノードの集合を含み、前記規則のそれぞれが適用された後に、他の規則を適用する前に対応付けられていないノードの集合から対応付けられた任意のノードが除去されることを特徴とする請求項12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、双方向に一意的な翻訳が存在する場合にノードの集合を対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、各親ノードの各子ノードが既に他の親ノードの子に対応付けられている場合に、1つのノードが仮の対応を有する各依存構造からのノードである一対の親ノードを、互いに対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、1つのノードが各依存構造からのノードである一対の子ノードを、それらの間に仮の対応が存在し、かつ各子ノードの親ノードが他方の子の対応する親ノードに既に対応付けされている場合に対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、1つのノードが各依存構造からのノードである一対のノードを、想定される前記ノードのそれぞれの親ノードが互いに対応付けられ、それぞれの子ノードも互いに対応付けられる場合に対応付けられることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、第1の動詞ノード、および一方の依存構造からの動詞ノードでない関連子ノードを、他方の依存構造の第2の動詞ノードに対して、前記関連子ノードが前記第2の動詞ノードに既に対応付けられ、前記第2の動詞ノードが対応付けられた親ノードを有さないか、あるいは前記第1の動詞ノードおよび前記第2の動詞ノードが互いに対応付けられ関連子ノードを有する場合に、対応付けることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、1つのノードが同じ品詞を含む各依存構造からのノードである一対のノードを、対応付けられていない兄弟ノードが存在せず、それぞれの親ノードが対応付けられ、想定される該ノードの集合とそれぞれの親ノードの言語学的関係が同じである場合に、対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、1つのノードが同じ品詞を含む各依存構造からのノードである一対のノードを、それぞれの子ノードが互いに対応付けられ、想定される前記ノードの集合とそれぞれの子ノードの言語学的関係が同じである場合に、対応付けられることを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、1つの依存構造の対応付けられていないノードが、存在すればすべて対応付けられたそれぞれの親ノードと、存在すればすべて対応付けられたそれぞれの子ノードとを含む隣接ノードを有し、前記隣接ノードの1つが複合語を含むノードに対して対応付けられた非複合語である場合に、前記複合語を含むノードに対して前記対応付けられていないノードを対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、1つのノードが代名詞を含む各依存構造からのノードである一対のノードを、それぞれの親ノードが互いに対応付けられ、いずれのノードも対応付けられていない兄弟を有さない場合に、対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、1つのノードが名詞を含む各依存構造からのノードである一対のノードを、名詞を含むそれぞれの親ノードが互いに対応付けられ、いずれのノードも対応付けられていない兄弟を有さず、前記ノードの各々とそれぞれの親の言語学的関係が修飾関係または前置詞的関係を含む場合に、対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、一方の依存構造の第1の動詞ノードを他方の依存構造の第2の動詞ノードに対して、前記第1の動詞ノードが仮の対応を有さず、単一の関連子動詞ノードが既に前記第2の動詞ノードに対応付けされている場合に、対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、一方の依存構造の第1の動詞ノードおよび単一のそれぞれの親ノードを他方の依存構造の第2の動詞ノードに対して、前記第1の動詞ノードが仮の対応を有さず、前記単一の親動詞ノードが前記第2の動詞ノードに対して対応付けられ、前記単一の親動詞ノードが前記第1の動詞ノード以外に対応付けられていない動詞子ノードを有さず、第2の動詞ノードが対応付けられていない動詞子ノードを有さない場合に、対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、一方の依存構造の代名詞を含む第1のノードを他方の依存構造の第2のノードに対して、前記第1のノードの親ノードが前記第2のノードに対応付けされ、前記第2のノードが対応付けされていない子ノードを有さない場合に、対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 前記規則の集合の1つの規則は、一方の依存構造の第1の動詞ノードおよびそれぞれの親ノードを他方の依存構造の第2の動詞ノードに対して、前記第1の動詞ノードが仮の対応を有さず、前記親動詞ノードが前記第2の動詞ノードに対応付けられ、前記第1の動詞ノードと前記親動詞ノードの関係が様相関係を含む場合に、対応付けすることを含むことを特徴とする請求項5、8、または12に記載のコンピュータ実装される方法。
- 記憶手段と、処理装置と、前記記憶手段に記憶され前記処理装置によって実行されるプログラムとを有するコンピュータを備えた機械翻訳システムであって、前記記憶手段は、第1の言語の文の単語又は第1の言語の文の論理形式を第2の言語の文の単語又は論理形式に関連付けた2ヶ国語コーパスと、前記第1の言語と前記第2の言語の間の共通の言語学的な要素を示す複数の規則とを有し、
前記プログラムは、テキスト入力される第1の言語の文の単語をテキスト出力される第2の言語の文の単語に対応付けするための命令を有し、
前記第1の言語の文は、単語をノードとするノード間の依存関係を示すデータ構造であり、該第1の言語の文の少なくとも1つの単語を含む第1の依存構造により前記コンピュータにおいて表され、前記第2の言語の文は、単語をノードとするノード間の依存関係を示すデータ構造であり、該第2の言語の文の少なくとも1つの単語を含む第2の依存構造により前記コンピュータにおいて表され、
前記処理装置が、前記記憶手段から前記プログラムを読み出して実行するときに、該プログラムに含まれる対応付けするための対応付けコンポーネントが有する命令は、前記処理装置が、
前記テキスト入力される第1の言語の第1の依存構造のノードの1つと、前記テキスト入力される第1の言語を前記記憶手段に記憶された前記2ヶ国語コーパスを介して生成される第2の言語の前記第2の依存構造のすべてのノードを結合して、形態論に基づく翻訳結果および派生語の翻訳結果を含む複数の仮の対応を示すデータ構造を生成し、前記仮の対応を示すデータ構造は、前記第1の言語の文の単語と前記第2の言語の文の単語とを対応付けたデータ構造であり、
当該生成された複数の仮の対応のデータ構造の各々に関する、前記第1の言語および前記第2の言語における前記単語が、あらかじめ規則の形態で定められた前記共通の言語学的な要素を有するか否かを前記記憶手段に記憶された複数の規則の中の少なくとも1つの規則を適用することで解析し、
前記共通の言語学的な要素を有しないとの解析結果の場合に、当該規則に合致しない、少なくとも1つの仮の対応を示すデータ構造を削除することにより、前記第1の言語の文の単語を前記第2の言語の文の単語に対応付けする
ことを前記コンピュータに実行させる命令であることを特徴とする機械翻訳システム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29533801P | 2001-06-01 | 2001-06-01 | |
US60/295,338 | 2001-06-01 | ||
US09/899,554 US7734459B2 (en) | 2001-06-01 | 2001-07-05 | Automatic extraction of transfer mappings from bilingual corpora |
US09/899,554 | 2001-07-05 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007211127A Division JP2007328815A (ja) | 2001-06-01 | 2007-08-13 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010027088A true JP2010027088A (ja) | 2010-02-04 |
JP5538820B2 JP5538820B2 (ja) | 2014-07-02 |
Family
ID=26969061
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002162077A Expired - Fee Related JP4494706B2 (ja) | 2001-06-01 | 2002-06-03 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
JP2007211127A Pending JP2007328815A (ja) | 2001-06-01 | 2007-08-13 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
JP2009253218A Expired - Fee Related JP5538820B2 (ja) | 2001-06-01 | 2009-11-04 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002162077A Expired - Fee Related JP4494706B2 (ja) | 2001-06-01 | 2002-06-03 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
JP2007211127A Pending JP2007328815A (ja) | 2001-06-01 | 2007-08-13 | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
Country Status (3)
Country | Link |
---|---|
US (2) | US7734459B2 (ja) |
EP (1) | EP1262879B1 (ja) |
JP (3) | JP4494706B2 (ja) |
Families Citing this family (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7024666B1 (en) * | 2002-01-28 | 2006-04-04 | Roy-G-Biv Corporation | Motion control systems and methods |
US6076051A (en) | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US20010032278A1 (en) | 1997-10-07 | 2001-10-18 | Brown Stephen J. | Remote generation and distribution of command programs for programmable devices |
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
US7904595B2 (en) | 2001-01-18 | 2011-03-08 | Sdl International America Incorporated | Globalization management system and method therefor |
US7050964B2 (en) | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
US7734459B2 (en) | 2001-06-01 | 2010-06-08 | Microsoft Corporation | Automatic extraction of transfer mappings from bilingual corpora |
US7191115B2 (en) | 2001-06-20 | 2007-03-13 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among words |
US20030074188A1 (en) * | 2001-10-12 | 2003-04-17 | Tohgo Murata | Method and apparatus for language instruction |
EP1306775A1 (en) * | 2001-10-29 | 2003-05-02 | BRITISH TELECOMMUNICATIONS public limited company | Machine translation |
JP3973549B2 (ja) * | 2002-12-19 | 2007-09-12 | 沖電気工業株式会社 | 対訳依存構造対応付け装置、方法及びプログラム、並びに、対訳依存構造対応付けプログラムを記録した記録媒体 |
US7356457B2 (en) * | 2003-02-28 | 2008-04-08 | Microsoft Corporation | Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words |
US8108534B2 (en) * | 2003-05-08 | 2012-01-31 | Jda Software Group, Inc. | Data integration system with programmatic source and target interfaces |
AU2004202391A1 (en) * | 2003-06-20 | 2005-01-13 | Microsoft Corporation | Adaptive machine translation |
US8027349B2 (en) | 2003-09-25 | 2011-09-27 | Roy-G-Biv Corporation | Database event driven motion systems |
US20060064503A1 (en) * | 2003-09-25 | 2006-03-23 | Brown David W | Data routing systems and methods |
US7689412B2 (en) * | 2003-12-05 | 2010-03-30 | Microsoft Corporation | Synonymous collocation extraction using translation information |
KR100561227B1 (ko) | 2003-12-19 | 2006-03-15 | 한국전자통신연구원 | 한-중 기계번역시스템의 용언구 패턴 자동 확장 및 검증장치 및 방법 |
JP3790825B2 (ja) * | 2004-01-30 | 2006-06-28 | 独立行政法人情報通信研究機構 | 他言語のテキスト生成装置 |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US7593843B2 (en) * | 2004-03-30 | 2009-09-22 | Microsoft Corporation | Statistical language model for logical form using transfer mappings |
JP4404211B2 (ja) | 2005-03-14 | 2010-01-27 | 富士ゼロックス株式会社 | マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム |
US20060282255A1 (en) * | 2005-06-14 | 2006-12-14 | Microsoft Corporation | Collocation translation from monolingual and available bilingual corpora |
US7680647B2 (en) * | 2005-06-21 | 2010-03-16 | Microsoft Corporation | Association-based bilingual word alignment |
US20070016397A1 (en) * | 2005-07-18 | 2007-01-18 | Microsoft Corporation | Collocation translation using monolingual corpora |
US7957953B2 (en) * | 2005-10-03 | 2011-06-07 | Microsoft Corporation | Weighted linear bilingual word alignment model |
US20070083357A1 (en) * | 2005-10-03 | 2007-04-12 | Moore Robert C | Weighted linear model |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US7725306B2 (en) * | 2006-06-28 | 2010-05-25 | Microsoft Corporation | Efficient phrase pair extraction from bilingual word alignments |
US7805289B2 (en) * | 2006-07-10 | 2010-09-28 | Microsoft Corporation | Aligning hierarchal and sequential document trees to identify parallel data |
JP5342760B2 (ja) * | 2007-09-03 | 2013-11-13 | 株式会社東芝 | 訳語学習のためのデータを作成する装置、方法、およびプログラム |
AU2008333773B2 (en) | 2007-12-05 | 2013-09-26 | Facebook, Inc. | Community translation on a social network |
US8849650B2 (en) * | 2008-10-22 | 2014-09-30 | Sankhya Technologies Private Limited | System and method for automatically generating sentences of a language |
CN101996166B (zh) * | 2009-08-14 | 2015-08-05 | 张龙哺 | 双语句对模式化记录方法以及翻译方法和翻译系统 |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
CN101908042B (zh) * | 2010-08-09 | 2016-04-13 | 中国科学院自动化研究所 | 一种双语联合语义角色的标注方法 |
KR101356417B1 (ko) * | 2010-11-05 | 2014-01-28 | 고려대학교 산학협력단 | 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법 |
KR20120089502A (ko) * | 2010-12-09 | 2012-08-13 | 한국전자통신연구원 | 번역지식 서버 생성 방법 및 그 장치 |
US20120158398A1 (en) * | 2010-12-17 | 2012-06-21 | John Denero | Combining Model-Based Aligner Using Dual Decomposition |
US10657540B2 (en) | 2011-01-29 | 2020-05-19 | Sdl Netherlands B.V. | Systems, methods, and media for web content management |
US9547626B2 (en) | 2011-01-29 | 2017-01-17 | Sdl Plc | Systems, methods, and media for managing ambient adaptability of web applications and web services |
US10580015B2 (en) | 2011-02-25 | 2020-03-03 | Sdl Netherlands B.V. | Systems, methods, and media for executing and optimizing online marketing initiatives |
US10140320B2 (en) | 2011-02-28 | 2018-11-27 | Sdl Inc. | Systems, methods, and media for generating analytical data |
US9984054B2 (en) | 2011-08-24 | 2018-05-29 | Sdl Inc. | Web interface including the review and manipulation of a web document and utilizing permission based control |
US8903707B2 (en) | 2012-01-12 | 2014-12-02 | International Business Machines Corporation | Predicting pronouns of dropped pronoun style languages for natural language translation |
KR101694286B1 (ko) * | 2012-05-02 | 2017-01-09 | 한국전자통신연구원 | 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법 |
US9773270B2 (en) | 2012-05-11 | 2017-09-26 | Fredhopper B.V. | Method and system for recommending products based on a ranking cocktail |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9519639B2 (en) | 2012-06-08 | 2016-12-13 | Facebook, Inc. | Community translation of user-generated content |
US11308528B2 (en) | 2012-09-14 | 2022-04-19 | Sdl Netherlands B.V. | Blueprinting of multimedia assets |
US11386186B2 (en) | 2012-09-14 | 2022-07-12 | Sdl Netherlands B.V. | External content library connector systems and methods |
US10452740B2 (en) | 2012-09-14 | 2019-10-22 | Sdl Netherlands B.V. | External content libraries |
US9916306B2 (en) | 2012-10-19 | 2018-03-13 | Sdl Inc. | Statistical linguistic analysis of source content |
US9779087B2 (en) * | 2013-12-13 | 2017-10-03 | Google Inc. | Cross-lingual discriminative learning of sequence models with posterior regularization |
KR102396250B1 (ko) | 2015-07-31 | 2022-05-09 | 삼성전자주식회사 | 대역 어휘 결정 장치 및 방법 |
US10614167B2 (en) | 2015-10-30 | 2020-04-07 | Sdl Plc | Translation review workflow systems and methods |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
JP2019082860A (ja) * | 2017-10-30 | 2019-05-30 | 富士通株式会社 | 生成プログラム、生成方法及び生成装置 |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
US11276391B2 (en) * | 2020-02-06 | 2022-03-15 | International Business Machines Corporation | Generation of matched corpus for language model training |
CN111476739B (zh) * | 2020-04-17 | 2023-04-18 | 宁波大学科学技术学院 | 水下图像增强方法、系统及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4494706B2 (ja) * | 2001-06-01 | 2010-06-30 | マイクロソフト コーポレーション | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4823306A (en) | 1987-08-14 | 1989-04-18 | International Business Machines Corporation | Text search system |
US4839853A (en) | 1988-09-15 | 1989-06-13 | Bell Communications Research, Inc. | Computer information retrieval using latent semantic structure |
NL8900587A (nl) | 1989-03-10 | 1990-10-01 | Bso Buro Voor Systeemontwikkel | Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst. |
JP3266246B2 (ja) * | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
EP0473864A1 (en) | 1990-09-04 | 1992-03-11 | International Business Machines Corporation | Method and apparatus for paraphrasing information contained in logical forms |
US5325298A (en) | 1990-11-07 | 1994-06-28 | Hnc, Inc. | Methods for generating or revising context vectors for a plurality of word stems |
US5278980A (en) | 1991-08-16 | 1994-01-11 | Xerox Corporation | Iterative technique for phrase query formation and an information retrieval system employing same |
US5377103A (en) | 1992-05-15 | 1994-12-27 | International Business Machines Corporation | Constrained natural language interface for a computer that employs a browse function |
US5592661A (en) | 1992-07-16 | 1997-01-07 | International Business Machines Corporation | Detection of independent changes via change identifiers in a versioned database management system |
JP2745370B2 (ja) * | 1993-02-23 | 1998-04-28 | 日本アイ・ビー・エム株式会社 | 機械翻訳方法及び機械翻訳装置 |
US5619709A (en) | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
GB9320404D0 (en) | 1993-10-04 | 1993-11-24 | Dixon Robert | Method & apparatus for data storage & retrieval |
US5873056A (en) | 1993-10-12 | 1999-02-16 | The Syracuse University | Natural language processing system for semantic vector representation which accounts for lexical ambiguity |
US5724594A (en) | 1994-02-10 | 1998-03-03 | Microsoft Corporation | Method and system for automatically identifying morphological information from a machine-readable dictionary |
US5675819A (en) | 1994-06-16 | 1997-10-07 | Xerox Corporation | Document information retrieval using global word co-occurrence patterns |
US5794050A (en) | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
JP2923552B2 (ja) | 1995-02-13 | 1999-07-26 | 富士通株式会社 | 組織活動データベースの構築方法,それに使用する分析シートの入力方法及び組織活動管理システム |
AU6849196A (en) | 1995-08-16 | 1997-03-19 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
JP3083742B2 (ja) | 1995-10-03 | 2000-09-04 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 表計算方法 |
SG49804A1 (en) * | 1996-03-20 | 1998-06-15 | Government Of Singapore Repres | Parsing and translating natural language sentences automatically |
US5995922A (en) | 1996-05-02 | 1999-11-30 | Microsoft Corporation | Identifying information related to an input word in an electronic dictionary |
US5884247A (en) | 1996-10-31 | 1999-03-16 | Dialect Corporation | Method and apparatus for automated language translation |
US6076051A (en) | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US6098033A (en) | 1997-07-31 | 2000-08-01 | Microsoft Corporation | Determining similarity between words |
US6243669B1 (en) * | 1999-01-29 | 2001-06-05 | Sony Corporation | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation |
WO2001086489A2 (en) * | 2000-05-11 | 2001-11-15 | University Of Southern California | Discourse parsing and summarization |
US7050964B2 (en) | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
-
2001
- 2001-07-05 US US09/899,554 patent/US7734459B2/en not_active Expired - Fee Related
-
2002
- 2002-05-23 EP EP02011351.0A patent/EP1262879B1/en not_active Expired - Lifetime
- 2002-06-03 JP JP2002162077A patent/JP4494706B2/ja not_active Expired - Fee Related
-
2007
- 2007-08-13 JP JP2007211127A patent/JP2007328815A/ja active Pending
-
2009
- 2009-11-04 JP JP2009253218A patent/JP5538820B2/ja not_active Expired - Fee Related
-
2010
- 2010-05-04 US US12/773,328 patent/US8275605B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4494706B2 (ja) * | 2001-06-01 | 2010-06-30 | マイクロソフト コーポレーション | 2カ国語コーパスからの変換マッピングの自動抽出プログラム |
Non-Patent Citations (2)
Title |
---|
CSNG199800428009; 北村 美穂子,外1名: '対訳コーパスを利用した翻訳規則の自動獲得' 情報処理学会論文誌 第37巻,第6号, 19960615, P.1030-1040, 社団法人情報処理学会 * |
JPN6012023232; 北村 美穂子,外1名: '対訳コーパスを利用した翻訳規則の自動獲得' 情報処理学会論文誌 第37巻,第6号, 19960615, P.1030-1040, 社団法人情報処理学会 * |
Also Published As
Publication number | Publication date |
---|---|
EP1262879A1 (en) | 2002-12-04 |
JP2003030185A (ja) | 2003-01-31 |
US20030061023A1 (en) | 2003-03-27 |
JP5538820B2 (ja) | 2014-07-02 |
JP2007328815A (ja) | 2007-12-20 |
US8275605B2 (en) | 2012-09-25 |
EP1262879B1 (en) | 2018-07-25 |
US7734459B2 (en) | 2010-06-08 |
US20100223049A1 (en) | 2010-09-02 |
JP4494706B2 (ja) | 2010-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5538820B2 (ja) | 2カ国語コーパスからの変換マッピングの自動抽出プログラム | |
JP4714400B2 (ja) | スケーラブル機械翻訳システム | |
EP1308851B1 (en) | Method of calculating translation relationships among words of different languages | |
US7356457B2 (en) | Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words | |
AU2004201089B2 (en) | Syntax tree ordering for generating a sentence | |
Collins | Head-driven statistical models for natural language parsing | |
JP4554273B2 (ja) | 機械トランスレータをトレーニングする方法およびそのシステム | |
US7529656B2 (en) | Translating method, translated sentence outputting method, recording medium, program, and computer device | |
US20070011132A1 (en) | Named entity translation | |
JP2003308320A (ja) | 文実現システム | |
JP2005507524A (ja) | 機械翻訳 | |
JP2005507525A (ja) | 機械翻訳 | |
JP2006164293A (ja) | 自動自然言語翻訳 | |
Dang | Investigations into the role of lexical semantics in word sense disambiguation | |
KR950013129B1 (ko) | 기계번역장치 및 방법 | |
JP2001503540A (ja) | アノテートされたテキストの自動翻訳 | |
JP7302267B2 (ja) | 検索プログラム、検索方法及び検索装置 | |
Vasuki et al. | English to Tamil machine translation system using parallel corpus | |
Sarkar | Combining labeled and unlabeled data in statistical natural language parsing | |
Swain et al. | Morphological analyser based on finite state transducer: a case study for Oriya language | |
Alansary | Part-of-Speech Tagging and Disambiguation for Arabic Language Understanding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120813 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130222 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20130314 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20130314 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130522 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20130618 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130918 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20131003 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131008 |
|
RD15 | Notification of revocation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7435 Effective date: 20131008 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131022 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140218 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5538820 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140430 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |