JP2005285129A - 論理形式のための統計的言語モデル - Google Patents
論理形式のための統計的言語モデル Download PDFInfo
- Publication number
- JP2005285129A JP2005285129A JP2005098366A JP2005098366A JP2005285129A JP 2005285129 A JP2005285129 A JP 2005285129A JP 2005098366 A JP2005098366 A JP 2005098366A JP 2005098366 A JP2005098366 A JP 2005098366A JP 2005285129 A JP2005285129 A JP 2005285129A
- Authority
- JP
- Japan
- Prior art keywords
- score
- mapping
- transfer
- transfer mapping
- target language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】 複数のトランスファ・マッピングから成るセットを設ける。統計モデルを使用して、複数のトランスファ・マッピングから成るセット内の少なくとも1つのトランスファ・マッピングのスコアを計算する。このスコアに基づいて少なくとも1つのトランスファ・マッピングを選択し、出力意味構造の構築に使用する。
【選択図】 図13
Description
ソートすることから開始する。次に、ソートされたリストをトップ・ダウン方式で走査し、ソース言語論理形式をカバーする、最初に見つかった適合するマッピングのセットを選択する。この発見的システム(heuristic system)は、入力マッピングの可能な組合せをすべて調べるわけではなく、単純に、ソース言語LFを完全にカバーする最初のマッピングのセットを選択するに過ぎない。
2.The balls were hit by Lucy.(ボールがルーシーによって打たれた。)
上記のセンテンスでは、以下のトライ・グラムが以下の頻度で出現する。
<P> <P> John 1 <P> <P> The 1
<P> John hit 1 <P> The balls 1
John hit the 1 the balls were 1
hit the ball 1 balls were hit 1
the ball <POST> 1 were hit by 1
hit by Lucy 1
by Lucy <POST> 1
ここで、<P>は、センテンスの先頭における仮想記号(imaginary token)で、文頭コンテクストを示し、<POST>は、文末の仮想記号である。両方の事例で事象(ボールを打つこと)は同じであるにもかかわらず、上記の各トライ・グラムは1回しか出現しないことに注目されたい。
本発明について詳細に説明する前に、論理形式について概説すれば有益であろう。論理形式およびシステムとその生成方法の詳細な説明は、特許文献1に記載されている。簡単に言えば、論理形式は、文法的な複数の関係で補強された従来の句構造解析を生成する、入力テキストに対しての形態素解析(morphological analysis)を実行することによって、生成される。統語解析は、テキスト入力内の内容語間のラベル付き依存関係を記述するデータ構造である論理形式を得るためにさらに処理される。
1.John hit the ball.
2.The balls were hit by Lucy.
表層文字列ベースの3グラム・モデルでは、以下のような回数となる。
<P> <P> John 1 <P> <P> The 1
<P> John hit 1 <P> The balls 1
John hit the 1 the balls were 1
hit the ball 1 balls were hit 1
the ball <POST> 1 were hit by 1
hit by Lucy 1
by Lucy <POST> 1
両方のセンテンスで事象(ボールを打つこと)は同じであるにもかかわらず、これらの各トライ・グラムは1回しか出現しないことに注目されたい。
John hit the ball.
Decl1
|_____NP1 ____NOUN1 "John"
|_____VERB1 "hit"
|_____NP2 ____DETP1 _____ADJ* "the"
| |____NOUN2 "ball"
|_____CHAR1 "."
The balls were hit by Lucy.
Decl1
|_____NP1_____DETP1_____ADJ1* "the"
| |_____NOUN1 "balls"
|_____AUX1 ___VERB1 "were"
|_____VERB2* "hit"
|_____PP1 ____PP2_______PREP1* "by"
| |_____NOUN2* "Lucy"
|_____CHAR1 "."
この場合も、ボールを打つことが別個の2つのバケットに分かれており(能動態の規則セットと受動態の規則セット)、したがってシステムは有用な一般化を学習することができないことに注目されたい。
図5は、本発明の一実施形態による機械翻訳システム500のアーキテクチャの一例を示すブロック図である。システム500は、解析部504および506、統計的語彙連合学習部(statistical word association learning component)508、論理形式アライメント部510、語彙知識ベース(lexical knowledge base)(LKB)構築部512、二言語対訳辞書514、連合リスト(association list)520、およびトランスファ・マッピング・データベース518を備える。翻訳実行時、システム500は、解析部522と、検索部524と、デコード部554と、トランスファ部526と、生成部528とを使用する。
以下の説明に関しては、当業者であれば、依存グラフ、論理形式、意味構造、意味関係、および意味表現は、すべて、実行時に入力される入力論理形式に関するものであり、入力論理形式を記述するものであることが、認識されよう。さらに、当業者であれば、トランスファ・マッピングまたはマッピングは、トレーニング時に形成されたマッピングを指すことが、認識されよう。
一実施形態によると、目的言語モデルは、一連のn−1個の先行ノードおよび関係が与えられた場合の目的言語依存グラフにおけるノードの確率を示すnグラム・モデルである。図6に、目的言語依存グラフの例600を示す。これは、トランスファ・マッピング・データベース518内の目的言語側上に見出すことができる。図6で、ノードA、B、C、およびDは語形を収容する。ノードB、C、およびDは子ノードであり、ノードAは親ノードまたはルート・ノードである。ノードR1およびR2は、意味関係ノードである。
110 コンピュータ
120 処理装置
121 システム・バス
130 システム・メモリ
134 オペレーティング・システム
135 アプリケーション・プログラム
136 その他のプログラム・モジュール
137 プログラム・データ
140 取外し不能不揮発性メモリ・インターフェース
141 ハードディスク・ドライブ
144 オペレーティング・システム
145 アプリケーション・プログラム
146 その他のプログラム・モジュール
147 プログラム・データ
150 取外し可能不揮発性メモリ・インターフェース
151 磁気ディスク・ドライブ
152 磁気ディスク
155 光ディスク・ドライブ
156 光ディスク
160 ユーザ入力インターフェース
161 ポインティング・デバイス
162 キーボード
163 マイクロフォン
170 ネットワーク・インターフェース
171 ローカル・エリア・ネットワーク
172 モデム
173 ワイド・エリア・ネットワーク
180 リモートコンピュータ
185 リモート・アプリケーション・プログラム
190 ビデオ・インターフェース
191 モニタ
195 出力周辺装置インターフェース
196 プリンタ
197 スピーカ
200 モバイル装置
202 プロセッサ
204 メモリ
208 通信インターフェース
214 アプリケーション・プログラム
216 オブジェクト・ストア
300、400 依存グラフ(論理形式)
500 機械翻訳システム
504 解析
506 解析
508 統計語彙連合学習
510 LFアライメント
512 LKB構築
514 二言語対訳辞書
518 トランスファ・マッピング・データベース
520 連合リスト
522 解析
524 検索
526 翻訳
528 生成
530 ソース言語センテンス
532 目的言語センテンス
534 ソース言語LF
536 目的言語LF
538 語対
542 LFトランスファ・マッピング
550 ソース言語テキスト
552 ソース言語LF
554 デコード
556 目的言語LF
558 目的言語テキスト
600 目的言語依存グラフ(論理形式)の例
700 入力LF
800、900,1000 トランスファ・マッピング
1100 入力LF
1200 トランスファ・マッピング
1400 ソース言語LF
1500、1600,1700,1800,1900,2000,2100 トランスファ・マッピング
Claims (38)
- 入力意味構造をデコードして出力意味構造を生成する方法であって、
トランスファ・マッピングのセットを提供すること、
統計モデルを使用してトランスファ・マッピングの前記セット内の少なくとも1つのトランスファ・マッピングのスコアを計算すること、
前記スコアに基づいて少なくとも1つのトランスファ・マッピングを選択すること、および
選択された前記トランスファ・マッピングを使用して、前記出力意味構造を構築すること
を備えることを特徴とする方法。 - トランスファ・マッピングのセットを提供することは、各トランスファ・マッピングが、前記入力意味構造のノードを記述する入力意味側を有するとともに、前記出力意味構造のノードを記述する出力意味側を有する、トランスファ・マッピングのセットを提供することを備えることを特徴とする請求項1に記載の方法。
- 少なくも1つのトランスファ・マッピングのスコアを計算することは、前記出力意味構造内にノードのセットが出現する確率を提供する目的言語モデルを使用してスコアを計算することを備えることを特徴とする請求項1に記載の方法。
- 少なくとも1つのトランスファ・マッピングのスコアを計算することは、前記トランスファ・マッピングの前記出力意味側が与えられた場合の前記トランスファ・マッピングの入力意味側の確率を提供するチャネル・モデルを使用して、スコアを計算することを備えることを特徴とする請求項2に記載の方法。
- 前記チャネル・モデルを使用してスコアを計算することは、トランスファ・マッピング間で重複するノードの数に基づいてチャネル・モデル・スコアを正規化することを備えることを特徴とする請求項4に記載の方法。
- 少なくとも1つのトランスファ・マッピングのスコアを計算することは、トランスファ・マッピングにおけるノード削除の確率を提供するファティリティ(fertility)モデルを使用してスコアを計算することを備えることを特徴とする請求項2に記載の方法。
- 少なくとも1つのトランスファ・マッピングのスコアを計算することは、前記トランスファ・マッピングの前記入力意味側におけるノードの数に基づいてサイズ・スコアを計算することを備えることを特徴とする請求項2に記載の方法。
- 少なくとも1つのトランスファ・マッピングのスコアを計算することは、前記入力意味構造と、前記トランスファ・マッピングの前記入力意味側とで適合する二項素性の数に基づくランク・スコアを計算することを備えること特徴とする請求項2に記載の方法。
- トランスファ・マッピングの前記セット内の少なくとも1つのトランスファ・マッピングのスコアを計算することは、
複数のモデルの別々のスコアを計算すること、および
別々の前記スコアを結合して前記トランスファ・マッピングの前記スコアを決定すること
を備えることを特徴とする請求項2に記載の方法。 - 前記複数のモデルは、トランスファ・マッピングの前記出力意味側が与えられた場合の前記トランスファ・マッピングの入力意味側の確率を提供するチャネル・モデルを備えることを特徴とする請求項9に記載の方法。
- 前記複数のモデルは、トランスファ・マッピングにおけるノード削除の確率を提供するファティリティ・モデルを備えることを特徴とする請求項9に記載の方法。
- 前記複数のモデルは、前記出力意味構造中にノードのセットが出現する確率を提供する目的言語モデルを備えることを特徴とする請求項9に記載の方法。
- 前記トランスファ・マッピングの前記入力意味側のノードの数に基づく、前記トランスファ・マッピングのサイズ・スコアを計算すること、および
前記サイズ・スコアを前記複数のモデルの別々の前記スコアと結合して、前記トランスファ・マッピングの前記スコアを決定すること
をさらに備えることを特徴とする請求項9に記載の方法。 - 前記入力意味構造と前記トランスファ・マッピングの前記入力意味側とで適合する二項素性の数に基づく、前記トランスファ・マッピングのランク・スコアを計算すること、および
前記ランク・スコアを前記複数のモデルの別々の前記スコアと結合して前記トランスファ・マッピングの前記スコアを決定すること
をさらに備えることを特徴とする請求項9に記載の方法。 - 前記スコアを結合することは、
各スコアに重みを乗じて重み付きモデル・スコアを形成すること、および
前記重み付きモデル・スコアを合計して各トランスファ・マッピングの前記スコアを決定すること
を備えることを特徴とする請求項9に記載の方法。 - トランスファ・マッピングのセットを提供することは、ルート・トランスファ・マッピングと、ルート・トランスファ・マッピングを含むサブツリーとを備える木構造として配列されたトランスファ・マッピングのセットを提供することを備え、トランスファ・マッピングの前記セット内の各トランスファ・マッピングは前記木構造およびサブツリーのうちの少なくとも1つにおいてルート・トランスファ・マッピングとして出現することを特徴とする請求項2に記載の方法。
- トランスファ・マッピングのセットを木構造として提供することは、ネストされた複数のサブツリーの複数の階層を提供することを特徴とする請求項16に記載の方法。
- 少なくとも1つのトランスファ・マッピングのスコアを計算することは、
サブツリーのスコアの計算が、再帰的に前記サブツリーの前記複数のサブツリーのスコアを決定すること、前記サブツリーの前記複数のルート・トランスファ・マッピングのスコアを計算すること、および前記サブツリーの前記サブツリーの前記スコアを前記サブツリーの前記ルート・トランスファ・マッピングの前記スコアに結合すること、を備える、ネストされたサブツリーの各階層のスコアを再帰的に計算すること、
前記ルート・トランスファ・マッピングのスコアを計算すること、および
各サブツリーの前記スコアを前記ルート・トランスファ・マッピングの前記スコアに結合すること、
を備える各ステップを通して、トランスファ・マッピングのツリーのスコアを計算すること
を備えることを特徴とする請求項17に記載の方法。 - ルート・トランスファ・マッピングのスコアを計算することは、前記ルート・トランスファ・マッピングの前記入力意味側におけるノードの数に基づく、前記ルート・トランスファ・マッピングのサイズ・スコアを計算することを備えることを特徴とする請求項18に記載の方法。
- サブツリーの前記スコアをルート・トランスファ・マッピングの前記スコアに結合することは、前記サブツリーのサイズ・スコアを前記ルート・トランスファ・マッピングの前記サイズ・スコアと共に平均することによって前記サブツリーの前記サイズ・スコアを前記ルート・トランスファ・マッピングの前記サイズ・スコアに結合することを備えることを特徴とする請求項18に記載の方法。
- ルート・トランスファ・マッピングのスコアを計算することは、前記入力意味構造と前記ルート・トランスファ・マッピングの前記入力意味側との適合する二項素性の数に基づいて前記ルート・トランスファ・マッピングのランク・スコアを計算することを備えることを特徴とする請求項18に記載の方法。
- サブツリーの前記スコアをルート・トランスファ・マッピングの前記スコアに結合することは、前記サブツリーのランク・スコアを前記ルート・トランスファ・マッピングの前記ランク・スコアと共に平均することによって前記サブツリーの前記ランク・スコアを前記ルート・トランスファ・マッピングの前記ランク・スコアと結合することを備えることを特徴とする請求項21に記載の方法。
- 第1の言語の入力を第2の言語の出力に翻訳する機械翻訳システムであって、
前記入力を入力意味表現に構文解析するパーサ、
各トランスファ・マッピングが前記入力意味表現の一部に対応する、トランスファ・マッピングのセットを検出するように構成された検索部、
複数のトランスファ・マッピングのスコアを決定し、決定した前記スコアに基づいて少なくとも1つのトランスファ・マッピングを選択するように構成されたデコード部、および
選択された前記トランスファ・マッピングに基づいて前記出力を生成するように構成された生成部
を備えることを特徴とする機械翻訳システム。 - 前記デコード部は、複数の統計モデルを使用して各トランスファ・マッピングのスコアを決定することを特徴とする請求項23に記載の機械翻訳システム。
- 前記出力は出力意味表現を含み、前記複数の統計モデルは、前記出力意味表現内にノードのシーケンスが出現する確率を提供する目的言語モデルを備えることを特徴とする請求項24に記載の機械翻訳システム。
- 前記複数の統計モデルは、前記トランスファ・マッピングの出力側の意味ノードのセットが与えられた場合のトランスファ・マッピングの入力側における意味ノードのセットの確率を提供するチャネル・モデルを備えることを特徴とする請求項24に記載の機械翻訳システム。
- 前記複数の統計モデルは、前記トランスファ・マッピングにおけるノード削除の確率を提供するファティリティ・モデルを備えることを特徴とする請求項24に記載の機械翻訳システム。
- 前記デコード部は、各トランスファ・マッピングの入力側のノードの数に基づくサイズ・スコアを使用して、当該トランスファ・マッピングのスコアを決定することを特徴とする請求項24に記載の機械翻訳システム。
- 前記デコード部は、前記入力と各トランスファ・マッピングの入力側との間で適合する二項素性の数に基づくランク・スコアを使用して当該トランスファ・マッピングのスコアを決定することを特徴とする請求項24に記載の機械翻訳システム。
- 単語列のスコアを決定するコンピュータ実装方法であって、
前記単語列に関する複数のノードを有する意味構造を計算すること、および
前記意味構造内のノードのシーケンスの確率を提供する目的言語モデルを使用して前記単語列のスコアを決定すること
を備えることを特徴とするコンピュータ実装方法。 - 複数のノードを有する意味構造を提供することは、複数の単語ノードと、単語間の意味関係を記述する少なくとも1つの関係ノードとを有する意味構造を提供することを備えることを特徴とする請求項30に記載のコンピュータ実装方法。
- 単語ノードを提供することは、見出し語(lemma)の単語ノードを提供することを備えることを特徴とする請求項30に記載のコンピュータ実装方法。
- 目的言語モデルを使用して前記単語列のスコアを決定することは、機械翻訳において前記目的言語モデルを使用して前記単語列のスコアを決定することを備えることを特徴とする請求項30に記載のコンピュータ実装方法。
- 目的言語モデルを使用して前記単語列のスコアを決定することは、音声認識において前記目的言語モデルを使用して前記単語列のスコアを決定することを備えることを特徴とする請求項30に記載のコンピュータ実装方法。
- 目的言語モデルを使用して前記単語列のスコアを決定することは、光学式文字認識において前記目的言語モデルを使用して前記単語列のスコアを決定することを備えることを特徴とする請求項30に記載のコンピュータ実装方法。
- 目的言語モデルを使用して前記単語列のスコアを決定することは、文法チェックにおいて前記目的言語モデルを使用して前記単語列のスコアを決定することを備えることを特徴とする請求項30に記載のコンピュータ実装方法。
- 目的言語モデルを使用して前記単語列のスコアを決定することは、手書き文字認識において前記目的言語モデルを使用して前記単語列のスコアを決定することを備えることを特徴とする請求項30に記載のコンピュータ実装方法。
- 目的言語モデルを使用して前記単語列のスコアを決定することは、情報抽出において前記目的言語モデルを使用して前記単語列のスコアを決定することを備えることを特徴とする請求項30に記載のコンピュータ実装方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/813,208 US7593843B2 (en) | 2004-03-30 | 2004-03-30 | Statistical language model for logical form using transfer mappings |
US10/813,208 | 2004-03-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005285129A true JP2005285129A (ja) | 2005-10-13 |
JP4945086B2 JP4945086B2 (ja) | 2012-06-06 |
Family
ID=34887697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005098366A Expired - Fee Related JP4945086B2 (ja) | 2004-03-30 | 2005-03-30 | 論理形式のための統計的言語モデル |
Country Status (6)
Country | Link |
---|---|
US (1) | US7593843B2 (ja) |
EP (1) | EP1582997B1 (ja) |
JP (1) | JP4945086B2 (ja) |
KR (1) | KR101122850B1 (ja) |
CN (1) | CN1677388B (ja) |
ES (1) | ES2416359T3 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009533728A (ja) * | 2006-04-07 | 2009-09-17 | ベイシス テクノロジー コーポレイション | 機械翻訳の方法およびシステム |
JP2009294747A (ja) * | 2008-06-03 | 2009-12-17 | National Institute Of Information & Communication Technology | 統計的機械翻訳装置 |
JP2012527701A (ja) * | 2009-05-22 | 2012-11-08 | マイクロソフト コーポレーション | 構造化されていないリソースからの句対のマイニング |
Families Citing this family (100)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003005166A2 (en) | 2001-07-03 | 2003-01-16 | University Of Southern California | A syntax-based statistical translation model |
US7620538B2 (en) | 2002-03-26 | 2009-11-17 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
JP5452868B2 (ja) * | 2004-10-12 | 2014-03-26 | ユニヴァーシティー オブ サザン カリフォルニア | トレーニングおよび復号のためにストリングからツリーへの変換を使うテキスト‐テキスト・アプリケーションのためのトレーニング |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US20070010989A1 (en) * | 2005-07-07 | 2007-01-11 | International Business Machines Corporation | Decoding procedure for statistical machine translation |
US10983695B2 (en) * | 2005-10-24 | 2021-04-20 | Kinoma, Inc. | Focus management system |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
CN101030197A (zh) * | 2006-02-28 | 2007-09-05 | 株式会社东芝 | 双语词对齐方法和装置、训练双语词对齐模型的方法和装置 |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US9471562B2 (en) * | 2006-10-10 | 2016-10-18 | Abbyy Infopoisk Llc | Method and system for analyzing and translating various languages with use of semantic hierarchy |
US8433556B2 (en) * | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8185375B1 (en) * | 2007-03-26 | 2012-05-22 | Google Inc. | Word alignment with bridge languages |
US8332207B2 (en) * | 2007-03-26 | 2012-12-11 | Google Inc. | Large language models in machine translation |
US8326598B1 (en) * | 2007-03-26 | 2012-12-04 | Google Inc. | Consensus translations from multiple machine translation systems |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US8639509B2 (en) * | 2007-07-27 | 2014-01-28 | Robert Bosch Gmbh | Method and system for computing or determining confidence scores for parse trees at all levels |
US8180624B2 (en) * | 2007-09-05 | 2012-05-15 | Microsoft Corporation | Fast beam-search decoding for phrasal statistical machine translation |
JP5239307B2 (ja) * | 2007-11-20 | 2013-07-17 | 富士ゼロックス株式会社 | 翻訳装置及び翻訳プログラム |
US8209164B2 (en) * | 2007-11-21 | 2012-06-26 | University Of Washington | Use of lexical translations for facilitating searches |
US8849665B2 (en) * | 2008-01-30 | 2014-09-30 | At&T Intellectual Property I, L.P. | System and method of providing machine translation from a source language to a target language |
US8615388B2 (en) * | 2008-03-28 | 2013-12-24 | Microsoft Corporation | Intra-language statistical machine translation |
US8682660B1 (en) * | 2008-05-21 | 2014-03-25 | Resolvity, Inc. | Method and system for post-processing speech recognition results |
US8849650B2 (en) * | 2008-10-22 | 2014-09-30 | Sankhya Technologies Private Limited | System and method for automatically generating sentences of a language |
WO2010046782A2 (en) * | 2008-10-24 | 2010-04-29 | App Tek | Hybrid machine translation |
US8185373B1 (en) * | 2009-05-05 | 2012-05-22 | The United States Of America As Represented By The Director, National Security Agency, The | Method of assessing language translation and interpretation |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US9069755B2 (en) * | 2010-03-11 | 2015-06-30 | Microsoft Technology Licensing, Llc | N-gram model smoothing with independently controllable parameters |
US8972930B2 (en) | 2010-06-04 | 2015-03-03 | Microsoft Corporation | Generating text manipulation programs using input-output examples |
US20110307240A1 (en) * | 2010-06-10 | 2011-12-15 | Microsoft Corporation | Data modeling of multilingual taxonomical hierarchies |
US9613115B2 (en) | 2010-07-12 | 2017-04-04 | Microsoft Technology Licensing, Llc | Generating programs based on input-output examples using converter modules |
KR101762866B1 (ko) * | 2010-11-05 | 2017-08-16 | 에스케이플래닛 주식회사 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
US8407041B2 (en) * | 2010-12-01 | 2013-03-26 | Microsoft Corporation | Integrative and discriminative technique for spoken utterance translation |
US8600730B2 (en) * | 2011-02-08 | 2013-12-03 | Microsoft Corporation | Language segmentation of multilingual texts |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8260615B1 (en) * | 2011-04-25 | 2012-09-04 | Google Inc. | Cross-lingual initialization of language models |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
KR101870729B1 (ko) * | 2011-09-01 | 2018-07-20 | 삼성전자주식회사 | 휴대용 단말기의 번역 트리구조를 이용한 번역장치 및 방법 |
CN103000052A (zh) * | 2011-09-16 | 2013-03-27 | 上海先先信息科技有限公司 | 人机互动的口语对话系统及其实现方法 |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9552335B2 (en) | 2012-06-04 | 2017-01-24 | Microsoft Technology Licensing, Llc | Expedited techniques for generating string manipulation programs |
CN102968409B (zh) * | 2012-11-23 | 2015-09-09 | 海信集团有限公司 | 智能人机交互语义分析方法及交互系统 |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9786269B2 (en) * | 2013-03-14 | 2017-10-10 | Google Inc. | Language modeling of complete language sequences |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
CN103810999B (zh) * | 2014-02-27 | 2016-10-19 | 清华大学 | 基于分布式神经网络的语言模型训练方法及其系统 |
US9530161B2 (en) | 2014-02-28 | 2016-12-27 | Ebay Inc. | Automatic extraction of multilingual dictionary items from non-parallel, multilingual, semi-structured data |
US9569526B2 (en) | 2014-02-28 | 2017-02-14 | Ebay Inc. | Automatic machine translation using user feedback |
US9940658B2 (en) | 2014-02-28 | 2018-04-10 | Paypal, Inc. | Cross border transaction machine translation |
US9881006B2 (en) | 2014-02-28 | 2018-01-30 | Paypal, Inc. | Methods for automatic generation of parallel corpora |
GB201405025D0 (en) | 2014-03-20 | 2014-05-07 | Gould Tech Solutions Ltd | Apparatus and method for content handling |
US9740687B2 (en) | 2014-06-11 | 2017-08-22 | Facebook, Inc. | Classifying languages for objects and entities |
CN105279552B (zh) * | 2014-06-18 | 2018-06-22 | 清华大学 | 一种基于字的神经网络的训练方法和装置 |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9864744B2 (en) | 2014-12-03 | 2018-01-09 | Facebook, Inc. | Mining multi-lingual data |
US9830404B2 (en) | 2014-12-30 | 2017-11-28 | Facebook, Inc. | Analyzing language dependency structures |
US9830386B2 (en) | 2014-12-30 | 2017-11-28 | Facebook, Inc. | Determining trending topics in social media |
US10067936B2 (en) | 2014-12-30 | 2018-09-04 | Facebook, Inc. | Machine translation output reranking |
US9477652B2 (en) | 2015-02-13 | 2016-10-25 | Facebook, Inc. | Machine learning dialect identification |
CN106372053B (zh) * | 2015-07-22 | 2020-04-28 | 华为技术有限公司 | 句法分析的方法和装置 |
CN106372054B (zh) * | 2015-07-24 | 2020-10-09 | 中兴通讯股份有限公司 | 一种多语言语义解析的方法和装置 |
US9734142B2 (en) * | 2015-09-22 | 2017-08-15 | Facebook, Inc. | Universal translation |
US10586168B2 (en) | 2015-10-08 | 2020-03-10 | Facebook, Inc. | Deep translations |
US9990361B2 (en) * | 2015-10-08 | 2018-06-05 | Facebook, Inc. | Language independent representations |
US10133738B2 (en) | 2015-12-14 | 2018-11-20 | Facebook, Inc. | Translation confidence scores |
US9734143B2 (en) | 2015-12-17 | 2017-08-15 | Facebook, Inc. | Multi-media context language processing |
US9747283B2 (en) | 2015-12-28 | 2017-08-29 | Facebook, Inc. | Predicting future translations |
US10002125B2 (en) | 2015-12-28 | 2018-06-19 | Facebook, Inc. | Language model personalization |
US9805029B2 (en) | 2015-12-28 | 2017-10-31 | Facebook, Inc. | Predicting future translations |
US10902215B1 (en) | 2016-06-30 | 2021-01-26 | Facebook, Inc. | Social hash for language models |
US10902221B1 (en) | 2016-06-30 | 2021-01-26 | Facebook, Inc. | Social hash for language models |
US10235336B1 (en) * | 2016-09-14 | 2019-03-19 | Compellon Incorporated | Prescriptive analytics platform and polarity analysis engine |
US11256710B2 (en) | 2016-10-20 | 2022-02-22 | Microsoft Technology Licensing, Llc | String transformation sub-program suggestion |
US11620304B2 (en) | 2016-10-20 | 2023-04-04 | Microsoft Technology Licensing, Llc | Example management for string transformation |
US10846298B2 (en) | 2016-10-28 | 2020-11-24 | Microsoft Technology Licensing, Llc | Record profiling for dataset sampling |
US10402499B2 (en) * | 2016-11-17 | 2019-09-03 | Goldman Sachs & Co. LLC | System and method for coupled detection of syntax and semantics for natural language understanding and generation |
US10282415B2 (en) | 2016-11-29 | 2019-05-07 | Ebay Inc. | Language identification for text strings |
US10180935B2 (en) | 2016-12-30 | 2019-01-15 | Facebook, Inc. | Identifying multiple languages in a content item |
US10318634B2 (en) * | 2017-01-02 | 2019-06-11 | International Business Machines Corporation | Enhancing QA system cognition with improved lexical simplification using multilingual resources |
US10318633B2 (en) * | 2017-01-02 | 2019-06-11 | International Business Machines Corporation | Using multilingual lexical resources to improve lexical simplification |
CN106897268B (zh) * | 2017-02-28 | 2020-06-02 | 科大讯飞股份有限公司 | 文本语义理解方法、装置和系统 |
US20190065462A1 (en) * | 2017-08-31 | 2019-02-28 | EMR.AI Inc. | Automated medical report formatting system |
US10380249B2 (en) | 2017-10-02 | 2019-08-13 | Facebook, Inc. | Predicting future trending topics |
US10671353B2 (en) | 2018-01-31 | 2020-06-02 | Microsoft Technology Licensing, Llc | Programming-by-example using disjunctive programs |
US11068758B1 (en) | 2019-08-14 | 2021-07-20 | Compellon Incorporated | Polarity semantics engine analytics platform |
CN111090460B (zh) * | 2019-10-12 | 2021-05-04 | 浙江大学 | 一种基于最近邻算法的代码变更日志自动生成方法 |
CN114333830A (zh) * | 2020-09-30 | 2022-04-12 | 中兴通讯股份有限公司 | 同声传译模型的训练方法、同声传译方法、设备和存储介质 |
US20240062021A1 (en) * | 2022-08-22 | 2024-02-22 | Oracle International Corporation | Calibrating confidence scores of a machine learning model trained as a natural language interface |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030023422A1 (en) * | 2001-06-01 | 2003-01-30 | Menezes Arul A. | Scaleable machine translation system |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US547745A (en) * | 1895-10-08 | Shend | ||
JPS58201175A (ja) * | 1982-05-20 | 1983-11-22 | Kokusai Denshin Denwa Co Ltd <Kdd> | 機械翻訳方式 |
JP2814634B2 (ja) * | 1989-12-29 | 1998-10-27 | 松下電器産業株式会社 | 機械翻訳装置 |
US5329446A (en) * | 1990-01-19 | 1994-07-12 | Sharp Kabushiki Kaisha | Translation machine |
US5289375A (en) * | 1990-01-22 | 1994-02-22 | Sharp Kabushiki Kaisha | Translation machine |
US5418717A (en) * | 1990-08-27 | 1995-05-23 | Su; Keh-Yih | Multiple score language processing system |
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
JP2968151B2 (ja) * | 1993-06-17 | 1999-10-25 | シャープ株式会社 | 機械翻訳装置 |
GB2295470A (en) * | 1994-11-28 | 1996-05-29 | Sharp Kk | Machine translation system |
US5643088A (en) * | 1995-05-31 | 1997-07-01 | Interactive Network, Inc. | Game of skill or chance playable by remote participants in conjunction with a common game event including inserted interactive advertising |
US6769128B1 (en) * | 1995-06-07 | 2004-07-27 | United Video Properties, Inc. | Electronic television program guide schedule system and method with data feed access |
US6233545B1 (en) * | 1997-05-01 | 2001-05-15 | William E. Datig | Universal machine translator of arbitrary languages utilizing epistemic moments |
US6804825B1 (en) * | 1998-11-30 | 2004-10-12 | Microsoft Corporation | Video on demand methods and systems |
US6330530B1 (en) * | 1999-10-18 | 2001-12-11 | Sony Corporation | Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures |
US6942574B1 (en) * | 2000-09-19 | 2005-09-13 | Igt | Method and apparatus for providing entertainment content on a gaming machine |
US7734459B2 (en) * | 2001-06-01 | 2010-06-08 | Microsoft Corporation | Automatic extraction of transfer mappings from bilingual corpora |
US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases |
WO2005002697A1 (en) * | 2003-06-29 | 2005-01-13 | Nds Limited | Interactive inter-channel game |
US7580080B2 (en) * | 2005-11-22 | 2009-08-25 | Gateway, Inc. | Automatic launch of picture-in-picture during commercials |
-
2004
- 2004-03-30 US US10/813,208 patent/US7593843B2/en not_active Expired - Fee Related
-
2005
- 2005-03-23 EP EP05102340.6A patent/EP1582997B1/en not_active Not-in-force
- 2005-03-23 ES ES05102340T patent/ES2416359T3/es active Active
- 2005-03-30 JP JP2005098366A patent/JP4945086B2/ja not_active Expired - Fee Related
- 2005-03-30 KR KR1020050026439A patent/KR101122850B1/ko active IP Right Grant
- 2005-03-30 CN CN200510056232XA patent/CN1677388B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030023422A1 (en) * | 2001-06-01 | 2003-01-30 | Menezes Arul A. | Scaleable machine translation system |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009533728A (ja) * | 2006-04-07 | 2009-09-17 | ベイシス テクノロジー コーポレイション | 機械翻訳の方法およびシステム |
JP2009294747A (ja) * | 2008-06-03 | 2009-12-17 | National Institute Of Information & Communication Technology | 統計的機械翻訳装置 |
JP2012527701A (ja) * | 2009-05-22 | 2012-11-08 | マイクロソフト コーポレーション | 構造化されていないリソースからの句対のマイニング |
Also Published As
Publication number | Publication date |
---|---|
KR20060045349A (ko) | 2006-05-17 |
JP4945086B2 (ja) | 2012-06-06 |
US20050228640A1 (en) | 2005-10-13 |
EP1582997A3 (en) | 2008-08-20 |
ES2416359T3 (es) | 2013-07-31 |
US7593843B2 (en) | 2009-09-22 |
CN1677388A (zh) | 2005-10-05 |
KR101122850B1 (ko) | 2012-04-19 |
EP1582997A2 (en) | 2005-10-05 |
CN1677388B (zh) | 2011-02-02 |
EP1582997B1 (en) | 2013-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4945086B2 (ja) | 論理形式のための統計的言語モデル | |
JP4694121B2 (ja) | 句の間の翻訳関係を学習するための統計的な方法および装置 | |
US7493251B2 (en) | Using source-channel models for word segmentation | |
US7050964B2 (en) | Scaleable machine translation system | |
KR101084786B1 (ko) | 트리 서열화 컴포넌트를 저장하는 컴퓨터 판독가능 기록매체 | |
US7266491B2 (en) | Statistically driven sentence realizing method and apparatus | |
US6990439B2 (en) | Method and apparatus for performing machine translation using a unified language model and translation model | |
JP4993762B2 (ja) | 用例ベースの機械翻訳システム | |
KR101120798B1 (ko) | 텍스트로부터 세만틱 구조들을 식별하기 위한 방법 및장치 | |
US8185377B2 (en) | Diagnostic evaluation of machine translators | |
US20060282255A1 (en) | Collocation translation from monolingual and available bilingual corpora | |
KR101130457B1 (ko) | 트리렛 번역쌍 추출 | |
US20080208566A1 (en) | Automated word-form transformation and part of speech tag assignment | |
EP3598321A1 (en) | Method for parsing natural language text with constituent construction links | |
US10810368B2 (en) | Method for parsing natural language text with constituent construction links | |
US20070016397A1 (en) | Collocation translation using monolingual corpora |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110316 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110809 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111208 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20111209 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20111209 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120228 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120305 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4945086 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150309 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |