JP4945086B2 - 論理形式のための統計的言語モデル - Google Patents
論理形式のための統計的言語モデル Download PDFInfo
- Publication number
- JP4945086B2 JP4945086B2 JP2005098366A JP2005098366A JP4945086B2 JP 4945086 B2 JP4945086 B2 JP 4945086B2 JP 2005098366 A JP2005098366 A JP 2005098366A JP 2005098366 A JP2005098366 A JP 2005098366A JP 4945086 B2 JP4945086 B2 JP 4945086B2
- Authority
- JP
- Japan
- Prior art keywords
- mapping
- transfer
- score
- node
- mappings
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Description
ソートすることから開始する。次に、ソートされたリストをトップ・ダウン方式で走査し、ソース言語論理形式をカバーする、最初に見つかった適合するマッピングのセットを選択する。この発見的システム(heuristic system)は、入力マッピングの可能な組合せをすべて調べるわけではなく、単純に、ソース言語LFを完全にカバーする最初のマッピングのセットを選択するに過ぎない。
2.The balls were hit by Lucy.(ボールがルーシーによって打たれた。)
上記のセンテンスでは、以下のトライ・グラムが以下の頻度で出現する。
<P> <P> John 1 <P> <P> The 1
<P> John hit 1 <P> The balls 1
John hit the 1 the balls were 1
hit the ball 1 balls were hit 1
the ball <POST> 1 were hit by 1
hit by Lucy 1
by Lucy <POST> 1
ここで、<P>は、センテンスの先頭における仮想記号(imaginary token)で、文頭コンテクストを示し、<POST>は、文末の仮想記号である。両方の事例で事象(ボールを打つこと)は同じであるにもかかわらず、上記の各トライ・グラムは1回しか出現しないことに注目されたい。
本発明について詳細に説明する前に、論理形式について概説すれば有益であろう。論理形式およびシステムとその生成方法の詳細な説明は、特許文献1に記載されている。簡単に言えば、論理形式は、文法的な複数の関係で補強された従来の句構造解析を生成する、入力テキストに対しての形態素解析(morphological analysis)を実行することによって、生成される。統語解析は、テキスト入力内の内容語間のラベル付き依存関係を記述するデータ構造である論理形式を得るためにさらに処理される。
1.John hit the ball.
2.The balls were hit by Lucy.
表層文字列ベースの3グラム・モデルでは、以下のような回数となる。
<P> <P> John 1 <P> <P> The 1
<P> John hit 1 <P> The balls 1
John hit the 1 the balls were 1
hit the ball 1 balls were hit 1
the ball <POST> 1 were hit by 1
hit by Lucy 1
by Lucy <POST> 1
両方のセンテンスで事象(ボールを打つこと)は同じであるにもかかわらず、これらの各トライ・グラムは1回しか出現しないことに注目されたい。
John hit the ball.
Decl1
|_____NP1 ____NOUN1 "John"
|_____VERB1 "hit"
|_____NP2 ____DETP1 _____ADJ* "the"
| |____NOUN2 "ball"
|_____CHAR1 "."
The balls were hit by Lucy.
Decl1
|_____NP1_____DETP1_____ADJ1* "the"
| |_____NOUN1 "balls"
|_____AUX1 ___VERB1 "were"
|_____VERB2* "hit"
|_____PP1 ____PP2_______PREP1* "by"
| |_____NOUN2* "Lucy"
|_____CHAR1 "."
この場合も、ボールを打つことが別個の2つのバケットに分かれており(能動態の規則セットと受動態の規則セット)、したがってシステムは有用な一般化を学習することができないことに注目されたい。
図5は、本発明の一実施形態による機械翻訳システム500のアーキテクチャの一例を示すブロック図である。システム500は、解析部504および506、統計的語彙連合学習部(statistical word association learning component)508、論理形式アライメント部510、語彙知識ベース(lexical knowledge base)(LKB)構築部512、二言語対訳辞書514、連合リスト(association list)520、およびトランスファ・マッピング・データベース518を備える。翻訳実行時、システム500は、解析部522と、検索部524と、デコード部554と、トランスファ部526と、生成部528とを使用する。
以下の説明に関しては、当業者であれば、依存グラフ、論理形式、意味構造、意味関係、および意味表現は、すべて、実行時に入力される入力論理形式に関するものであり、入力論理形式を記述するものであることが、認識されよう。さらに、当業者であれば、トランスファ・マッピングまたはマッピングは、トレーニング時に形成されたマッピングを指すことが、認識されよう。
一実施形態によると、目的言語モデルは、一連のn−1個の先行ノードおよび関係が与えられた場合の目的言語依存グラフにおけるノードの確率を示すnグラム・モデルである。図6に、目的言語依存グラフの例600を示す。これは、トランスファ・マッピング・データベース518内の目的言語側上に見出すことができる。図6で、ノードA、B、C、およびDは語形を収容する。ノードB、C、およびDは子ノードであり、ノードAは親ノードまたはルート・ノードである。ノードR1およびR2は、意味関係ノードである。
110 コンピュータ
120 処理装置
121 システム・バス
130 システム・メモリ
134 オペレーティング・システム
135 アプリケーション・プログラム
136 その他のプログラム・モジュール
137 プログラム・データ
140 取外し不能不揮発性メモリ・インターフェース
141 ハードディスク・ドライブ
144 オペレーティング・システム
145 アプリケーション・プログラム
146 その他のプログラム・モジュール
147 プログラム・データ
150 取外し可能不揮発性メモリ・インターフェース
151 磁気ディスク・ドライブ
152 磁気ディスク
155 光ディスク・ドライブ
156 光ディスク
160 ユーザ入力インターフェース
161 ポインティング・デバイス
162 キーボード
163 マイクロフォン
170 ネットワーク・インターフェース
171 ローカル・エリア・ネットワーク
172 モデム
173 ワイド・エリア・ネットワーク
180 リモートコンピュータ
185 リモート・アプリケーション・プログラム
190 ビデオ・インターフェース
191 モニタ
195 出力周辺装置インターフェース
196 プリンタ
197 スピーカ
200 モバイル装置
202 プロセッサ
204 メモリ
208 通信インターフェース
214 アプリケーション・プログラム
216 オブジェクト・ストア
300、400 依存グラフ(論理形式)
500 機械翻訳システム
504 解析
506 解析
508 統計語彙連合学習
510 LFアライメント
512 LKB構築
514 二言語対訳辞書
518 トランスファ・マッピング・データベース
520 連合リスト
522 解析
524 検索
526 翻訳
528 生成
530 ソース言語センテンス
532 目的言語センテンス
534 ソース言語LF
536 目的言語LF
538 語対
542 LFトランスファ・マッピング
550 ソース言語テキスト
552 ソース言語LF
554 デコード
556 目的言語LF
558 目的言語テキスト
600 目的言語依存グラフ(論理形式)の例
700 入力LF
800、900,1000 トランスファ・マッピング
1100 入力LF
1200 トランスファ・マッピング
1400 ソース言語LF
1500、1600,1700,1800,1900,2000,2100 トランスファ・マッピング
Claims (14)
- 入力意味構造をデコードして出力意味構造を生成する方法であって、該方法は、プロセッサによって実行され、
前記方法は、
第1の言語の入力単語列に関連する前記入力意味構造の少なくとも一部分をカバーするトランスファ・マッピングのセットを提供するステップであって、各トランスファ・マッピングは、前記入力意味構造の少なくとも1つのノードを記述する第1の論理形式および前記出力意味構造の少なくとも1つのノードを記述する第2の論理形式を有する、ステップと、
統計モデルを使用して前記入力意味構造の少なくとも1つの選択ノードをカバーする前記トランスファ・マッピングのセットのそれぞれのトランスファ・マッピングのスコアを計算するステップであって、前記それぞれのトランスファ・マッピングのスコアを計算するステップは、複数のモデルの別々のスコアを計算することと、前記別々のスコアを結合して前記入力意味構造の選択ノードを記述する前記トランスファ・マッピングのそれぞれのスコアを決定することとを含み、前記別々のスコアを結合することは、各スコアに重みを乗じて重み付きモデル・スコアを形成することと、前記重み付きモデル・スコアを合計して前記入力意味構造の選択ノードを記述する前記トランスファ・マッピングのそれぞれのスコアを決定することとをさらに含み、該それぞれのトランスファ・マッピングのスコアを計算するステップは、該トランスファ・マッピングによってカバーされていない該選択ノードの各子ノードについての最高スコアのマッピングのスコアを該トランスファ・マッピングのスコアと結合することを含む、ステップと、
前記少なくとも1つの選択ノードをカバーする前記トランスファ・マッピングのセットの内の最高スコアのトランスファ・マッピングを選択するステップと、
前記選択された最高スコアのトランスファ・マッピングを使用して、第2の言語の出力単語列に関連する前記出力意味構造を構築するステップと
を含むことを特徴とする方法。 - 前記複数のモデルは、トランスファ・マッピングの前記第2の論理形式が与えられた場合の前記トランスファ・マッピングの第1の論理形式の確率を提供するチャネル・モデルを含むことを特徴とする請求項1に記載の方法。
- 前記チャネル・モデルを使用してスコアを計算することは、トランスファ・マッピング間で重複するノードの数に基づいてチャネル・モデル・スコアを正規化することをさらに含むことを特徴とする請求項2に記載の方法。
- 前記複数のモデルは、トランスファ・マッピングにおけるノード削除の確率を提供するファティリティ・モデルを含むことを特徴とする請求項1に記載の方法。
- 前記複数のモデルは、前記出力意味構造中にノードのセットが出現する確率を提供する目的言語モデルを含むことを特徴とする請求項1に記載の方法。
- 前記入力意味構造の選択ノードを記述する前記トランスファ・マッピングのそれぞれのサイズ・スコアを計算するステップであって、該サイズ・スコアはそれぞれのトランスファ・マッピングの前記第1の論理形式のノードの数に基づくスコアである、ステップと、
前記サイズ・スコアを前記複数のモデルの別々の前記スコアと結合して、前記入力意味構造の選択ノードを記述するそれぞれのトランスファ・マッピングのスコアを決定するステップと
をさらに含むことを特徴とする請求項1に記載の方法。 - 前記入力意味構造の選択ノードを記述する前記トランスファ・マッピングのそれぞれのランク・スコアを計算するステップであって、該ランク・スコアは前記入力意味構造と各トランスファ・マッピングの前記第1の論理形式とで適合する二項素性の数に基づくスコアである、ステップと、
前記ランク・スコアを前記複数のモデルの別々の前記スコアと結合して前記入力意味構造の選択ノードを記述する前記トランスファ・マッピングのそれぞれのスコアを決定するステップと
をさらに含むことを特徴とする請求項1に記載の方法。 - 前記トランスファ・マッピングのセットを提供するステップは、ルート・トランスファ・マッピングおよびサブツリーを含む、木構造および複数階層のネストされたサブツリーとして配列されたトランスファ・マッピングのセットを提供するステップをさらに含み、各サブツリーはルート・トランスファ・マッピングを含み、前記トランスファ・マッピングのセット内の各トランスファ・マッピングは前記木構造およびサブツリーのうちの少なくとも1つにおいてルート・トランスファ・マッピングとして出現することを特徴とする請求項1に記載の方法。
- 第1の言語の入力を第2の言語の出力に翻訳する機械翻訳システムであって、
前記機械翻訳システムは、
プロセッサと、
システムコンポーネントを実行するように前記プロセッサを構成するコンピュータ実行可能命令を格納するコンピュータ読み取り可能な記憶媒体と
を備え、
前記システムコンポーネントは、
前記第1の言語の入力を入力意味表現に構文解析するパーサと、
トランスファ・マッピングのセットを検出するように構成された検索部であって、各トランスファ・マッピングが前記入力意味表現の一部に対応する第1の論理形式を含む、検索部と、
前記入力意味表現の選択部分に対応する前記トランスファ・マッピングのセットのそれぞれのトランスファ・マッピングのスコアを計算し、前記入力意味表現の選択部分に対応する前記トランスファ・マッピングのいずれが最高スコアを有するかを選択するように構成されたデコード部であって、前記それぞれのトランスファ・マッピングのスコアを計算することは、複数の統計モデルの別々のスコアを計算することと、前記別々のスコアを結合して前記入力意味表現の選択部分に対応する前記トランスファ・マッピングのそれぞれのスコアを決定することとを含み、前記別々のスコアを結合することは、各スコアに重みを乗じて重み付きモデル・スコアを形成することと、前記重み付きモデル・スコアを合計して前記入力意味表現の選択部分に対応する前記トランスファ・マッピングのそれぞれのスコアを決定することとをさらに含み、該それぞれのトランスファ・マッピングのスコアを計算することは、該トランスファ・マッピングによってカバーされていない選択ノードの各子ノードについての最高スコアのマッピングのスコアを該トランスファ・マッピングのスコアと結合することを含む、デコード部と、
選択された前記トランスファ・マッピングに基づいて前記第2の言語の出力を生成するように構成された生成部と
を含むことを特徴とする機械翻訳システム。 - 前記第2の言語の出力は出力意味表現を含み、前記複数の統計モデルは、前記出力意味表現内にノードのシーケンスが出現する確率を提供する目的言語モデルを含むことを特徴とする請求項9に記載の機械翻訳システム。
- 前記複数の統計モデルは、前記トランスファ・マッピングの第2の論理形式の意味ノードのセットが与えられた場合のトランスファ・マッピングの第1の論理形式における意味ノードのセットの確率を提供するチャネル・モデルを含むことを特徴とする請求項9に記載の機械翻訳システム。
- 前記複数の統計モデルは、前記トランスファ・マッピングにおけるノード削除の確率を提供するファティリティ・モデルを含むことを特徴とする請求項9に記載の機械翻訳システム。
- 前記デコード部は、各トランスファ・マッピングの第1の論理形式のノードの数に基づくサイズ・スコアを使用して、当該トランスファ・マッピングのスコアを計算することを特徴とする請求項9に記載の機械翻訳システム。
- 前記デコード部は、前記第1の言語の入力と各トランスファ・マッピングの第1の論理形式との間で適合する二項素性の数に基づくランク・スコアを使用して当該トランスファ・マッピングのスコアを計算することを特徴とする請求項9に記載の機械翻訳システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/813,208 | 2004-03-30 | ||
US10/813,208 US7593843B2 (en) | 2004-03-30 | 2004-03-30 | Statistical language model for logical form using transfer mappings |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005285129A JP2005285129A (ja) | 2005-10-13 |
JP4945086B2 true JP4945086B2 (ja) | 2012-06-06 |
Family
ID=34887697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005098366A Expired - Fee Related JP4945086B2 (ja) | 2004-03-30 | 2005-03-30 | 論理形式のための統計的言語モデル |
Country Status (6)
Country | Link |
---|---|
US (1) | US7593843B2 (ja) |
EP (1) | EP1582997B1 (ja) |
JP (1) | JP4945086B2 (ja) |
KR (1) | KR101122850B1 (ja) |
CN (1) | CN1677388B (ja) |
ES (1) | ES2416359T3 (ja) |
Families Citing this family (103)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8214196B2 (en) | 2001-07-03 | 2012-07-03 | University Of Southern California | Syntax-based statistical translation model |
WO2004001623A2 (en) | 2002-03-26 | 2003-12-31 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
DE112005002534T5 (de) * | 2004-10-12 | 2007-11-08 | University Of Southern California, Los Angeles | Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US20070010989A1 (en) * | 2005-07-07 | 2007-01-11 | International Business Machines Corporation | Decoding procedure for statistical machine translation |
US10983695B2 (en) * | 2005-10-24 | 2021-04-20 | Kinoma, Inc. | Focus management system |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
CN101030197A (zh) * | 2006-02-28 | 2007-09-05 | 株式会社东芝 | 双语词对齐方法和装置、训练双语词对齐模型的方法和装置 |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US7827028B2 (en) * | 2006-04-07 | 2010-11-02 | Basis Technology Corporation | Method and system of machine translation |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US9471562B2 (en) * | 2006-10-10 | 2016-10-18 | Abbyy Infopoisk Llc | Method and system for analyzing and translating various languages with use of semantic hierarchy |
US8433556B2 (en) * | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8185375B1 (en) * | 2007-03-26 | 2012-05-22 | Google Inc. | Word alignment with bridge languages |
US8326598B1 (en) | 2007-03-26 | 2012-12-04 | Google Inc. | Consensus translations from multiple machine translation systems |
US8332207B2 (en) * | 2007-03-26 | 2012-12-11 | Google Inc. | Large language models in machine translation |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US8639509B2 (en) * | 2007-07-27 | 2014-01-28 | Robert Bosch Gmbh | Method and system for computing or determining confidence scores for parse trees at all levels |
US8180624B2 (en) * | 2007-09-05 | 2012-05-15 | Microsoft Corporation | Fast beam-search decoding for phrasal statistical machine translation |
JP5239307B2 (ja) * | 2007-11-20 | 2013-07-17 | 富士ゼロックス株式会社 | 翻訳装置及び翻訳プログラム |
US8209164B2 (en) * | 2007-11-21 | 2012-06-26 | University Of Washington | Use of lexical translations for facilitating searches |
US8849665B2 (en) * | 2008-01-30 | 2014-09-30 | At&T Intellectual Property I, L.P. | System and method of providing machine translation from a source language to a target language |
US8615388B2 (en) * | 2008-03-28 | 2013-12-24 | Microsoft Corporation | Intra-language statistical machine translation |
US8682660B1 (en) * | 2008-05-21 | 2014-03-25 | Resolvity, Inc. | Method and system for post-processing speech recognition results |
JP5288371B2 (ja) * | 2008-06-03 | 2013-09-11 | 独立行政法人情報通信研究機構 | 統計的機械翻訳装置 |
WO2010046902A1 (en) * | 2008-10-22 | 2010-04-29 | Sankhya Technologies Private Limited | System and method for automatically generating sentences of a language |
US9798720B2 (en) * | 2008-10-24 | 2017-10-24 | Ebay Inc. | Hybrid machine translation |
US8185373B1 (en) * | 2009-05-05 | 2012-05-22 | The United States Of America As Represented By The Director, National Security Agency, The | Method of assessing language translation and interpretation |
US20100299132A1 (en) * | 2009-05-22 | 2010-11-25 | Microsoft Corporation | Mining phrase pairs from an unstructured resource |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US9069755B2 (en) * | 2010-03-11 | 2015-06-30 | Microsoft Technology Licensing, Llc | N-gram model smoothing with independently controllable parameters |
US8972930B2 (en) | 2010-06-04 | 2015-03-03 | Microsoft Corporation | Generating text manipulation programs using input-output examples |
US20110307240A1 (en) * | 2010-06-10 | 2011-12-15 | Microsoft Corporation | Data modeling of multilingual taxonomical hierarchies |
US9613115B2 (en) | 2010-07-12 | 2017-04-04 | Microsoft Technology Licensing, Llc | Generating programs based on input-output examples using converter modules |
KR101762866B1 (ko) * | 2010-11-05 | 2017-08-16 | 에스케이플래닛 주식회사 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
US8407041B2 (en) * | 2010-12-01 | 2013-03-26 | Microsoft Corporation | Integrative and discriminative technique for spoken utterance translation |
US8600730B2 (en) * | 2011-02-08 | 2013-12-03 | Microsoft Corporation | Language segmentation of multilingual texts |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8260615B1 (en) * | 2011-04-25 | 2012-09-04 | Google Inc. | Cross-lingual initialization of language models |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
KR101870729B1 (ko) * | 2011-09-01 | 2018-07-20 | 삼성전자주식회사 | 휴대용 단말기의 번역 트리구조를 이용한 번역장치 및 방법 |
CN103000052A (zh) * | 2011-09-16 | 2013-03-27 | 上海先先信息科技有限公司 | 人机互动的口语对话系统及其实现方法 |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9552335B2 (en) | 2012-06-04 | 2017-01-24 | Microsoft Technology Licensing, Llc | Expedited techniques for generating string manipulation programs |
CN102968409B (zh) * | 2012-11-23 | 2015-09-09 | 海信集团有限公司 | 智能人机交互语义分析方法及交互系统 |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9786269B2 (en) * | 2013-03-14 | 2017-10-10 | Google Inc. | Language modeling of complete language sequences |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
CN103810999B (zh) * | 2014-02-27 | 2016-10-19 | 清华大学 | 基于分布式神经网络的语言模型训练方法及其系统 |
US9569526B2 (en) | 2014-02-28 | 2017-02-14 | Ebay Inc. | Automatic machine translation using user feedback |
US9530161B2 (en) | 2014-02-28 | 2016-12-27 | Ebay Inc. | Automatic extraction of multilingual dictionary items from non-parallel, multilingual, semi-structured data |
US9881006B2 (en) | 2014-02-28 | 2018-01-30 | Paypal, Inc. | Methods for automatic generation of parallel corpora |
US9940658B2 (en) | 2014-02-28 | 2018-04-10 | Paypal, Inc. | Cross border transaction machine translation |
GB201405025D0 (en) | 2014-03-20 | 2014-05-07 | Gould Tech Solutions Ltd | Apparatus and method for content handling |
US9740687B2 (en) | 2014-06-11 | 2017-08-22 | Facebook, Inc. | Classifying languages for objects and entities |
CN105279552B (zh) * | 2014-06-18 | 2018-06-22 | 清华大学 | 一种基于字的神经网络的训练方法和装置 |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9864744B2 (en) | 2014-12-03 | 2018-01-09 | Facebook, Inc. | Mining multi-lingual data |
US9830386B2 (en) | 2014-12-30 | 2017-11-28 | Facebook, Inc. | Determining trending topics in social media |
US10067936B2 (en) | 2014-12-30 | 2018-09-04 | Facebook, Inc. | Machine translation output reranking |
US9830404B2 (en) | 2014-12-30 | 2017-11-28 | Facebook, Inc. | Analyzing language dependency structures |
US9477652B2 (en) | 2015-02-13 | 2016-10-25 | Facebook, Inc. | Machine learning dialect identification |
CN106372053B (zh) * | 2015-07-22 | 2020-04-28 | 华为技术有限公司 | 句法分析的方法和装置 |
CN106372054B (zh) * | 2015-07-24 | 2020-10-09 | 中兴通讯股份有限公司 | 一种多语言语义解析的方法和装置 |
US9734142B2 (en) | 2015-09-22 | 2017-08-15 | Facebook, Inc. | Universal translation |
US9990361B2 (en) * | 2015-10-08 | 2018-06-05 | Facebook, Inc. | Language independent representations |
US10586168B2 (en) | 2015-10-08 | 2020-03-10 | Facebook, Inc. | Deep translations |
US10133738B2 (en) | 2015-12-14 | 2018-11-20 | Facebook, Inc. | Translation confidence scores |
US9734143B2 (en) | 2015-12-17 | 2017-08-15 | Facebook, Inc. | Multi-media context language processing |
US9747283B2 (en) | 2015-12-28 | 2017-08-29 | Facebook, Inc. | Predicting future translations |
US10002125B2 (en) | 2015-12-28 | 2018-06-19 | Facebook, Inc. | Language model personalization |
US9805029B2 (en) | 2015-12-28 | 2017-10-31 | Facebook, Inc. | Predicting future translations |
US10902221B1 (en) | 2016-06-30 | 2021-01-26 | Facebook, Inc. | Social hash for language models |
US10902215B1 (en) | 2016-06-30 | 2021-01-26 | Facebook, Inc. | Social hash for language models |
US10235336B1 (en) * | 2016-09-14 | 2019-03-19 | Compellon Incorporated | Prescriptive analytics platform and polarity analysis engine |
US11256710B2 (en) | 2016-10-20 | 2022-02-22 | Microsoft Technology Licensing, Llc | String transformation sub-program suggestion |
US11620304B2 (en) | 2016-10-20 | 2023-04-04 | Microsoft Technology Licensing, Llc | Example management for string transformation |
US10846298B2 (en) | 2016-10-28 | 2020-11-24 | Microsoft Technology Licensing, Llc | Record profiling for dataset sampling |
WO2018093904A1 (en) | 2016-11-17 | 2018-05-24 | Goldman Sachs & Co. LLC | System and method for coupled detection of syntax and semantics for natural language understanding and generation |
US10282415B2 (en) | 2016-11-29 | 2019-05-07 | Ebay Inc. | Language identification for text strings |
US10180935B2 (en) | 2016-12-30 | 2019-01-15 | Facebook, Inc. | Identifying multiple languages in a content item |
US10318634B2 (en) * | 2017-01-02 | 2019-06-11 | International Business Machines Corporation | Enhancing QA system cognition with improved lexical simplification using multilingual resources |
US10318633B2 (en) * | 2017-01-02 | 2019-06-11 | International Business Machines Corporation | Using multilingual lexical resources to improve lexical simplification |
CN106897268B (zh) * | 2017-02-28 | 2020-06-02 | 科大讯飞股份有限公司 | 文本语义理解方法、装置和系统 |
US20190065462A1 (en) * | 2017-08-31 | 2019-02-28 | EMR.AI Inc. | Automated medical report formatting system |
US10380249B2 (en) | 2017-10-02 | 2019-08-13 | Facebook, Inc. | Predicting future trending topics |
US10671353B2 (en) | 2018-01-31 | 2020-06-02 | Microsoft Technology Licensing, Llc | Programming-by-example using disjunctive programs |
US11068758B1 (en) | 2019-08-14 | 2021-07-20 | Compellon Incorporated | Polarity semantics engine analytics platform |
CN111090460B (zh) * | 2019-10-12 | 2021-05-04 | 浙江大学 | 一种基于最近邻算法的代码变更日志自动生成方法 |
CN114333830A (zh) * | 2020-09-30 | 2022-04-12 | 中兴通讯股份有限公司 | 同声传译模型的训练方法、同声传译方法、设备和存储介质 |
US20240062021A1 (en) * | 2022-08-22 | 2024-02-22 | Oracle International Corporation | Calibrating confidence scores of a machine learning model trained as a natural language interface |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US547745A (en) * | 1895-10-08 | Shend | ||
JPS58201175A (ja) * | 1982-05-20 | 1983-11-22 | Kokusai Denshin Denwa Co Ltd <Kdd> | 機械翻訳方式 |
JP2814634B2 (ja) * | 1989-12-29 | 1998-10-27 | 松下電器産業株式会社 | 機械翻訳装置 |
US5329446A (en) * | 1990-01-19 | 1994-07-12 | Sharp Kabushiki Kaisha | Translation machine |
US5289375A (en) * | 1990-01-22 | 1994-02-22 | Sharp Kabushiki Kaisha | Translation machine |
US5418717A (en) * | 1990-08-27 | 1995-05-23 | Su; Keh-Yih | Multiple score language processing system |
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
JP2968151B2 (ja) * | 1993-06-17 | 1999-10-25 | シャープ株式会社 | 機械翻訳装置 |
GB2295470A (en) * | 1994-11-28 | 1996-05-29 | Sharp Kk | Machine translation system |
US5643088A (en) * | 1995-05-31 | 1997-07-01 | Interactive Network, Inc. | Game of skill or chance playable by remote participants in conjunction with a common game event including inserted interactive advertising |
US6769128B1 (en) * | 1995-06-07 | 2004-07-27 | United Video Properties, Inc. | Electronic television program guide schedule system and method with data feed access |
US6233545B1 (en) * | 1997-05-01 | 2001-05-15 | William E. Datig | Universal machine translator of arbitrary languages utilizing epistemic moments |
US6804825B1 (en) * | 1998-11-30 | 2004-10-12 | Microsoft Corporation | Video on demand methods and systems |
US6330530B1 (en) * | 1999-10-18 | 2001-12-11 | Sony Corporation | Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures |
US6942574B1 (en) * | 2000-09-19 | 2005-09-13 | Igt | Method and apparatus for providing entertainment content on a gaming machine |
US7734459B2 (en) * | 2001-06-01 | 2010-06-08 | Microsoft Corporation | Automatic extraction of transfer mappings from bilingual corpora |
US7050964B2 (en) * | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases |
WO2005002697A1 (en) * | 2003-06-29 | 2005-01-13 | Nds Limited | Interactive inter-channel game |
US7580080B2 (en) * | 2005-11-22 | 2009-08-25 | Gateway, Inc. | Automatic launch of picture-in-picture during commercials |
-
2004
- 2004-03-30 US US10/813,208 patent/US7593843B2/en not_active Expired - Fee Related
-
2005
- 2005-03-23 EP EP05102340.6A patent/EP1582997B1/en not_active Not-in-force
- 2005-03-23 ES ES05102340T patent/ES2416359T3/es active Active
- 2005-03-30 CN CN200510056232XA patent/CN1677388B/zh not_active Expired - Fee Related
- 2005-03-30 JP JP2005098366A patent/JP4945086B2/ja not_active Expired - Fee Related
- 2005-03-30 KR KR1020050026439A patent/KR101122850B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
CN1677388B (zh) | 2011-02-02 |
US7593843B2 (en) | 2009-09-22 |
US20050228640A1 (en) | 2005-10-13 |
ES2416359T3 (es) | 2013-07-31 |
JP2005285129A (ja) | 2005-10-13 |
KR20060045349A (ko) | 2006-05-17 |
EP1582997A3 (en) | 2008-08-20 |
KR101122850B1 (ko) | 2012-04-19 |
CN1677388A (zh) | 2005-10-05 |
EP1582997A2 (en) | 2005-10-05 |
EP1582997B1 (en) | 2013-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4945086B2 (ja) | 論理形式のための統計的言語モデル | |
JP4694121B2 (ja) | 句の間の翻訳関係を学習するための統計的な方法および装置 | |
KR101084786B1 (ko) | 트리 서열화 컴포넌트를 저장하는 컴퓨터 판독가능 기록매체 | |
US7493251B2 (en) | Using source-channel models for word segmentation | |
US7050964B2 (en) | Scaleable machine translation system | |
JP4993762B2 (ja) | 用例ベースの機械翻訳システム | |
US7266491B2 (en) | Statistically driven sentence realizing method and apparatus | |
US6990439B2 (en) | Method and apparatus for performing machine translation using a unified language model and translation model | |
US8185377B2 (en) | Diagnostic evaluation of machine translators | |
KR101120798B1 (ko) | 텍스트로부터 세만틱 구조들을 식별하기 위한 방법 및장치 | |
KR101130457B1 (ko) | 트리렛 번역쌍 추출 | |
US20060282255A1 (en) | Collocation translation from monolingual and available bilingual corpora | |
JP5497048B2 (ja) | コンパラブルコーパスを使用する固有表現の翻字 | |
US20080208566A1 (en) | Automated word-form transformation and part of speech tag assignment | |
EP3598321A1 (en) | Method for parsing natural language text with constituent construction links | |
US8224642B2 (en) | Automated identification of documents as not belonging to any language | |
US10810368B2 (en) | Method for parsing natural language text with constituent construction links | |
US20070016397A1 (en) | Collocation translation using monolingual corpora |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110316 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110809 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111208 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20111209 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20111209 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120228 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120305 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4945086 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150309 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |