JP5774751B2 - ツリーレット翻訳対の抽出 - Google Patents
ツリーレット翻訳対の抽出 Download PDFInfo
- Publication number
- JP5774751B2 JP5774751B2 JP2014102432A JP2014102432A JP5774751B2 JP 5774751 B2 JP5774751 B2 JP 5774751B2 JP 2014102432 A JP2014102432 A JP 2014102432A JP 2014102432 A JP2014102432 A JP 2014102432A JP 5774751 B2 JP5774751 B2 JP 5774751B2
- Authority
- JP
- Japan
- Prior art keywords
- target language
- dependency
- language
- word
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
Description
一実施形態では、デコーダは、動的プログラミングを使用して実施される。別の実施形態では、デコーダは、A*検索を使用して実施される。
原言語の依存関係の構文解析が生成され、目標言語の単語の区分が行われると、原言語の依存関係構文解析を目標言語の語分割の隣に配置して、図2の単語に区分された対訳コーパス256を形成する。したがって、図4Aまたは4Bの表現の1つが、図4Cに示す表現に関連付けられる。
(1)一対多の並置:目標言語のすべての別個の集合TiおよびTkについて、
(a)TjとTjのすべての単語が、原単語skおよびslと並置される
(b)skおよびslには他の目標単語は並置されない
(c)tiは、Tiの代表要素である。
(d)tjは、Tjの代表要素であり、skからslへの依存関係がある場合のみ、tiからtjへの依存を生成し、Tiの中の各tkについて、tk!=tiであればtkからtiへの依存を生成し、Tjの中の各tmについて、tm!=tjであれば、tmからtjへの依存を作成する。
以下の場合にP(pos=+1)
当該の単語=corbeille
親の単語=vider
当該単語と並置された単語=bin
当該単語の親と並置された単語=empty
当該単語と並置された原単語の位置=+1
当該単語と並置された単語の品詞(POS)=名詞
当該単語の親と並置された単語のPOS=動詞
式4
スコア=λ1log(チャンネルモデルの確率)+
λ2log(順序モデルの確率)+
λ3log(一致モデルの確率)+
λ4log(目標言語モデルの確率)
1.一致するツリーレット翻訳対の大域リストの中で考慮すべき次のツリーレット翻訳の位置。
2.その候補の中ですでに選択されているツリーレット翻訳のセット。
3.その候補によってカバーされる入力ノードの表現。
4.各モデルに従った各候補のスコアの実際の推定部分と楽観的な推定部分。
〔態様1〕
原言語のテキスト断片を目標言語のテキスト断片に変換する機械翻訳システムであって、
前記原言語のテキスト断片中の構文的依存関係を表す原言語の依存関係ツリーと、前記原言語の依存関係ツリーの少なくとも一部分とそれぞれが一致する複数の一致ツリーレット翻訳対とを入力として受け取るように構成されたデコーダであって、前記原言語の依存関係ツリーと前記一致ツリーレット翻訳対に基づき、前記一致ツリーレット翻訳対の目標言語部分の様々な組合せに統計モデルの対数線形の組合せでスコアをつけることにより、前記目標言語のテキスト断片を表す目標言語の依存関係ツリーを生成するように構成されたデコーダ
を備えることを特徴とするシステム。
〔態様2〕
前記デコーダは、複数の異なる大きさを有する一致ツリーレット翻訳対を使用して、前記目標言語の依存関係ツリーを生成するように構成されることを特徴とする態様1に記載の機械翻訳システム。
〔態様3〕
前記デコーダは、複数の異なる形状を有する一致ツリーレット翻訳対を使用して、前記目標言語の依存関係ツリーを生成するように構成されることを特徴とする態様1に記載の機械翻訳システム。
〔態様4〕
前記デコーダは、複数の異なる分岐構成を有する一致ツリーレット翻訳対を使用して、前記目標言語の依存関係ツリーを生成するように構成されることを特徴とする態様3に記載の機械翻訳システム。
〔態様5〕
前記統計モデルは、前記目標言語の依存関係ツリーの所与のレベルにおける複数のノードの順序を統計的に予測する順序モデルを含むことを特徴とする態様1に記載の機械翻訳システム。
〔態様6〕
前記統計モデルはチャンネルモデルを含むことを特徴とする態様5に記載の機械翻訳システム。
〔態様7〕
前記統計モデルは、主要ノードを考慮して、前記目標言語の依存関係ツリー中の1つまたは複数の依存ノードを統計的に予測する一致モデルを含むことを特徴とする態様6に記載の機械翻訳システム。
〔態様8〕
複数のツリーレット翻訳対を記憶するツリーレット翻訳対データベースと、
前記ツリーレット翻訳対データベースから前記一致ツリーレット翻訳対を抽出するように構成されるツリーレット翻訳対一致コンポーネントと
をさらに備えることを特徴とする態様1に記載の機械翻訳システム。
〔態様9〕
前記デコーダは、重複するツリーレット翻訳対を翻訳の仮定として考慮することを特徴とする態様1に記載の機械翻訳システム。
〔態様10〕
前記統計モデルは、重みで重みを付けられ、前記重みは、最大BLEUトレーニングを使用して生成されるスコアの移動平均を使用して生成されることを特徴とする態様1に記載の機械翻訳システム。
〔態様11〕
原言語のテキスト断片を目標言語のテキスト断片に変換する方法であって、
前記原言語のテキスト断片中の構文的依存関係を表す原言語の依存関係ツリーと、前記原言語の依存関係ツリーの少なくとも一部分とそれぞれが一致する複数の一致ツリーレット翻訳対とを入力として受け取るステップと、
前記一致ツリーレット翻訳対の目標言語部分の様々な組合せに統計モデルの対数線形の組合せでスコアをつけるステップと、
前記原言語の依存関係ツリー、前記一致ツリーレット翻訳対、および前記スコアに基づいて、前記目標言語のテキスト断片を表す目標言語の依存関係ツリーを生成するステップと
を備えることを特徴とする方法。
〔態様12〕
スコア付けは、前記統計モデルによって生成されるスコアにモデルの重みで重みをつけることを含み、前記モデルの重みは、
前記モデルの重みの様々な値で翻訳品質を測定する翻訳の測定基準の値を計算することにより、複数の連続的な最適化動作を行うステップと、
前記翻訳の測定基準の値の移動平均に基づいて、前記モデルの重みの値を選択するステップと
を含むトレーニング方法中に生成されることを特徴とする態様11に記載の方法。
〔態様13〕
コンピュータによって実行されると、
複数のツリーレット翻訳対の目標言語部分の様々な組合せに、統計モデルの対数線形の組合せでスコアをつけるステップであって、前記複数のツリーレット翻訳対はそれぞれ、原言語のテキスト断片を表す原言語の依存関係ツリーの少なくとも一部分と一致するステップと、
前記原言語の依存関係ツリー、前記複数のツリーレット翻訳対、および前記スコアに基づいて、前記原言語のテキスト断片の前記目標言語への翻訳である目標言語のテキスト断片を表す目標言語の依存関係ツリーを生成するステップと
を含むステップを前記コンピュータに行わせるコンピュータ可読命令を格納したことを特徴とするコンピュータ可読媒体。
〔態様14〕
目標言語の依存構造を生成するシステムであって、
原言語のトレーニングデータテキスト断片を表す原言語の依存構造中の語彙項目が、それに対応する、前記原言語のテキスト断片の翻訳であるトレーニングデータ目標言語テキスト断片の語彙項目と並置された並置済みの構造を得るように構成されたコーパス処理システムと、
前記原言語の依存構造の語彙項目から前記目標言語のテキスト断片の前記語彙項目に依存関係を投射して、前記目標言語の依存構造を得るように構成された依存関係投射コンポーネントと
を備えることを特徴とするシステム。
〔態様15〕
それぞれが、原言語のテキスト断片とそれに対応する目標言語のテキスト断片とを含む、複数の対訳テキスト断片の対を有するトレーニングデータコーパス
をさらに備えることを特徴とする態様14に記載のシステム。
〔態様16〕
前記依存関係投射コンポーネントは、前記目標言語の依存構造が前記目標言語のテキスト断片を正しく表すかどうかを判定し、正しく表さない場合は、前記目標言語のテキスト断片を正しく表すように前記目標言語の依存構造を調整するように構成されることを特徴とする態様14に記載のシステム。
〔態様17〕
前記依存関係投射コンポーネントは、前記目標言語の依存構造を読み取って目標言語のテキスト文字列を生成し、前記目標言語のテキスト文字列中の前記語彙項目が、前記目標言語のテキスト断片に現われる順序と異なる順序であるかどうかを判定することにより、前記目標言語の依存構造が前記目標言語のテキスト断片を正しく表すかどうかを判定するように構成されることを特徴とする態様16に記載のシステム。
〔態様18〕
前記依存関係投射コンポーネントは、前記目標言語の依存構造から読み取られる前記目標言語のテキスト文字列の語彙項目が、前記目標言語のテキスト断片に現われる順序と同じ順序になるまで、前記目標言語の依存構造を配列し直すことにより、前記目標言語の依存構造を調整するように構成されることを特徴とする態様17に記載のシステム。
〔態様19〕
前記目標言語の依存構造は、目標言語の依存関係ツリーを含み、前記依存関係投射コンポーネントは、前記目標言語の依存関係ツリー中で順序が正しくないノードを特定し、語彙項目が前記目標言語のテキスト断片に現われる順序と同じ順序である目標言語文字列をもたらす前記目標言語の依存関係ツリー中で最も低いレベルに前記特定されたノードを再結合することにより、再配列するように構成されることを特徴とする態様18に記載のシステム。
〔態様20〕
前記コーパス処理システムは、
前記原言語のテキスト断片を構文解析して、原言語の依存構造を得るように構成されたパーサと、
前記目標言語のテキスト断片を語彙項目に区分するように構成されたセグメンタと、
前記原言語の依存構造の語彙項目を前記目標言語のテキスト断片の語彙項目と並置するように構成された並置コンポーネントと
を備えることを特徴とする態様14に記載のシステム。
〔態様21〕
目標言語の依存構造を生成するコンピュータによって実行される方法であって、
それぞれが、原言語のテキスト断片とそれに対応する目標言語のテキスト断片とを含む、複数の対訳テキスト断片の対を有するトレーニングデータコーパスにアクセスするステップと、
原言語のテキスト断片に基づいて生成された原言語の依存構造中の語彙項目が、それに対応する目標言語のテキスト断片中の語彙項目と並置された並置済みの構造を得るステップと、
前記原言語の依存構造中の語彙項目から前記目標言語のテキスト断片の語彙項目に依存関係を投射して、前記目標言語の依存構造を得るステップと
を備えることを特徴とする方法。
〔態様22〕
前記投射するステップは、
前記原言語の依存構造中の語彙項目が前記目標言語のテキスト断片の語彙項目と並置されない場合は、前記原言語の依存構造中の前記並置されない語彙項目から前記目標言語のテキスト断片に依存関係を投射しないことを含むことを特徴とする態様21に記載の方法。
〔態様23〕
前記原言語の依存構造の依存関係は、前記原言語の依存構造中の第1の原語彙項目と第2の原語彙項目との間にあり、前記第1および第2の原語彙項目は、それぞれ前記目標言語のテキスト断片の第1および第2の目標語彙項目と並置され、投射するステップは、
前記第1の原語彙項目と前記第2の原語彙項目との間の前記依存関係を前記第1の目標語彙項目と第2の目標語彙項目に割り当てることを含むことを特徴とする態様21に記載の方法。
〔態様24〕
前記原言語の依存構造中の語彙項目は、前記目標言語のテキスト断片の複数の語彙項目と並置され、投射するステップは、
前記目標言語の依存構造中で前記複数の語彙項目の親ノードを特定するステップと、
前記目標言語のテキスト断片中の前記複数の語彙項目のうち一番右にある語彙項目を特定するステップと、
前記一番右にある語彙項目を前記親ノードからの依存要素として割り当てるステップと、
前記目標言語のテキスト断片中の前記複数の語彙項目の残りを前記一番右にある語彙項目からの依存要素として割り当てるステップと
を含むことを特徴とする態様21に記載の方法。
〔態様25〕
前記目標言語のテキスト断片中の並置されない語彙項目は、前記原言語の依存構造中の語彙項目と並置されず、投射するステップは、
前記目標言語のテキスト断片中で前記並置されない語彙項目のすぐ隣に位置する語彙項目を特定するステップと、
前記並置されない語彙項目を前記特定された語彙項目からの依存要素として割り当てるステップと
を含むことを特徴とする態様21に記載の方法。
〔態様26〕
特定するステップは、
前記目標言語のテキスト断片中の前記並置されない語彙項目の前後にある目標言語の語彙項目の集合の中で、前記目標言語の依存構造において最も低い1つの語彙項目を特定するステップと、
前記特定された語彙項目からの依存要素として前記並置されない語彙項目を割り当てるステップと
を含むことを特徴とする態様25に記載の方法。
〔態様27〕
前記原言語の依存構造中の複数の語彙項目が、前記目標言語のテキスト断片中の1つの語彙項目と並置され、投射するステップは、
前記原言語の依存構造中の複数の語彙項目の中で、前記原言語の依存構造において最も高い語彙項目を特定するステップと、
前記目標言語のテキスト断片中の前記1つの語彙項目に、前記原言語の依存構造中の前記複数の項目のうち前記特定された項目に関連付けられた依存関係を割り当てるステップと
を含むことを特徴とする態様21に記載の方法。
〔態様28〕
原言語の入力を目標言語の出力に変換する機械翻訳システムで使用するツリーレット翻訳対を特定する方法であって、
並置された、対訳構文依存関係構造の対からなるコーパスにアクセスするステップであって、各対は、語彙項目を表すノードを有する原言語の依存構造を含み、前記ノードは、目標言語の依存構造中の語彙項目を表すノードと並置されるステップと、
個々の原ノードと前記原言語の依存構造中で接続された原ノードの組合せを、語彙項目を特定する可能な原ツリーレットとして列挙し、前記目標言語の依存構造中で、前記列挙されたノードおよび接続されたノードの組合せと並置された対応する依存関係を、前記可能な原ツリーレットに対応する可能な目標ツリーレットとして列挙するステップと、
前記可能な原ツリーレットおよび可能な目標ツリーレットから、適切な形式のツリーレット翻訳対を抽出するステップと、
前記ツリーレット翻訳対をデータストアに記憶するステップと
を備えることを特徴とする方法。
〔態様29〕
親ノードの各子ノードは、前記親ノードの他の子ノードと接続されるものとみなされることを特徴とする態様28に記載の方法。
〔態様30〕
前記原言語の依存構造はそれぞれ、原言語のテキスト断片を表し、列挙するステップは、
それら接続された部分が前記原言語のテキスト断片中で隣接しない単語の集合を表すかどうかに関係なく、前記原言語の依存構造の接続された部分を列挙するステップを含むことを特徴とする態様28に記載の方法。
〔態様31〕
前記原言語の依存構造は、原言語の依存関係ツリーを含み、列挙するステップは、
前記原言語の依存関係ツリーで非線形の分岐を表すノードの接続されたセットを列挙するステップ
を含むことを特徴とする態様28に記載の方法。
〔態様32〕
適切な形式のツリーレット翻訳対を抽出するステップは、
前記可能な原ツリーレット中の前記語彙項目が前記可能な目標ツリーレット中の語彙項目と並置され、前記可能な目標ツリーレット中の前記語彙項目が前記可能な原ツリーレットの語彙項目とのみ並置される場合のみ、前記可能な原ツリーレットとそれに対応する可能な目標ツリーレットを適切な形式のツリーレット翻訳対として抽出するステップを備えることを特徴とする態様28に記載の方法。
〔態様33〕
原言語の入力を目標言語の出力に変換する機械翻訳システムで使用するツリーレット翻訳対をトレーニングデータから特定するシステムであって、
並置された、対訳構文依存関係構造の対からなるコーパスにアクセスするように構成されたツリーレット対エクストラクタであって、各対は、語彙項目を表すノードを有する原言語の依存構造を含み、前記ノードは、目標言語の依存構造中の語彙項目を表すノードと並置されるエクストラクタを備え、
前記ツリーレット対エクストラクタはさらに、前記原言語の依存構造の接続された部分である原ノードの集合を可能な原ツリーレットとして列挙するように構成されることを特徴とするシステム。
〔態様34〕
コンピュータによって実行されると、前記コンピュータに、原言語の入力を目標言語の出力に変換する機械翻訳システムで使用するツリーレット翻訳対を特定する方法を行わせるコンピュータ可読命令を記憶するコンピュータ可読媒体であって、前記方法は、
並置された、対訳構文依存関係構造の対からなるコーパスにアクセスするステップであって、各対は、語彙項目を表すノードを有する原言語の依存構造を含み、前記ノードは、目標言語の依存構造中の語彙項目を表すノードと並置されるステップと、
前記原言語の依存構造中の原ノードの接続された集合を可能な原ツリーレットとして列挙するステップと、
前記可能な原ツリーレットとそれに対応する目標言語の依存構造の並置された部分から、適切な形式のツリーレット翻訳対を抽出するステップと
を備えることを特徴とするコンピュータ可読媒体。
〔態様35〕
機械翻訳システムで使用するデータ構造であって、
各対が、原テキスト断片に基づく原言語の構文依存構造の接続された部分を含む原言語部分と、前記原言語部分の語彙項目と並置された語彙項目および構文上の依存関係を有する目標言語部分とを有する、複数のツリーレット翻訳対を備え、前記原言語部分は、共通の親ノードに従属する、前記原言語の構文依存構造からの複数の子ノードを含むことを特徴とするデータ構造。
〔態様36〕
原言語の依存構造、および前記原言語の依存構造のノードと目標言語の依存構造のノードとの並置を考慮して、前記目標言語の依存構造の順序付けにスコアを割り当てる方法であって、
原言語のテキスト断片を表す原言語の依存構造と目標言語の依存構造とを受け取るステップと、
前記目標言語の依存構造中で親ノードに直接従属する依存ノードの順序にスコアを割り当てるステップと
を備えることを特徴とする方法。
〔態様37〕
前記目標言語の依存構造は、複数の親ノードを含み、前記依存ノードの順序にスコアを割り当てるステップは、
前記目標言語の依存構造中で前記複数の親ノードそれぞれに直接従属する依存ノードの順序にスコアを割り当てるステップ
を備えることを特徴とする態様36に記載の方法。
〔態様38〕
前記目標言語の依存構造は、複数のレベルを有する目標言語の依存関係ツリーを含み、スコアを割り当てるステップは、
前記複数レベルを有する目標言語の依存関係ツリーの他のレベルのノードの順序に関係なく、前記複数レベルを有する目標言語の依存関係ツリーの各レベルの依存ノードの順序にスコアを割り当てるステップと、
各レベルの前記スコアをともに組み合わせて、前記目標言語の依存構造全体の順序付けのスコアを割り当てるステップと
を含むことを特徴とする態様36に記載の方法。
〔態様39〕
各レベルの依存ノードの順序にスコアを割り当てるステップは、
前記目標言語の依存関係ツリーの各レベルで、順に、各ノードにスコアを割り当てるステップと、
各ノードに割り当てられた前記スコアを組み合わせて各レベルにスコアを割り当てるステップと
を含むことを特徴とする態様38に記載の方法。
〔態様40〕
各ノードにスコアを割り当てるステップは、
前記親ノードに対して位置のオフセットを有する各ノードの確率を計算するステップ
を含むことを特徴とする態様39に記載の方法。
〔態様41〕
前記原言語の依存構造は、前記目標言語の依存関係ツリーの前記ノードと並置されたノードを有し、各ノードのスコアを割り当てるステップは、
前記目標言語の依存関係ノード中の選択されたノードと並置された前記原言語の依存構造中のノードが、前記原言語の依存構造でその親ノードの前置修飾語または後置修飾語であった場合に、前記目標言語の依存関係ツリー中の前記選択されたノードが切り替わって、前記目標言語の依存構造中でその親ノードの前置修飾語または後置修飾語になる確率を計算するステップ
を含むことを特徴とする態様39に記載の方法。
〔態様42〕
各ノードにスコアを割り当てるステップは、
前記選択されたノードが、前記目標言語の依存関係ツリーの同じレベルにある他のノードに対してその親ノードに所与の近さを有する確率を計算するステップ
を含むことを特徴とする態様41に記載の方法。
〔態様43〕
各ノードにスコアを割り当てるステップは、
前記目標言語の依存関係ツリー中の選択されたノードが、前記目標言語の依存関係ツリーの同じレベルにある他のノードそれぞれに対して順序の位置を変え、前記選択されたノードと同じ修飾語関係を前記親ノードに対して有するべきかどうかを示すスコアを割り当てるステップ
を含むことを特徴とする態様41に記載の方法。
〔態様44〕
前記目標言語の依存構造の順序に割り当てられる前記スコアは、
前記依存ノードおよび前記親ノードに対応する目標単語、前記目標単語と並置された原単語、前記原言語の依存構造における前記原単語の位置、および前記原単語と目標単語それぞれの品詞、
を含む特性のセットの少なくとも一部を含む複数の特性に基づくことを特徴とする態様36に記載の方法。
〔態様45〕
並置された、対訳依存関係構造からなるコーパスに基づいて、依存ノードの順序にスコアを割り当てることを学習するステップをさらに備え、スコアを割り当てることを学習するステップは、
前記コーパス中の順序付けられた目標言語の依存構造から特性のセットを集めるステップと、
前記特性のセットに機械学習技術を使用して、原言語の依存構造、および前記原言語の依存構造と目標言語の依存構造間の並置を考慮して、目標言語の依存構造の順序付けにスコアを割り当てるためのモデルを作成するステップと
を含むことを特徴とする態様36に記載の方法。
〔態様46〕
原言語の依存構造、および原言語の依存構造のノードと前記目標言語の依存構造のノードとの間の並置を考慮して、目標言語依存構造の順序付けにスコアを割り当てるためのモデルであって、
前記原言語の依存構造の複数の原ノード、および前記原言語の依存構造のノードと前記目標言語の依存ノードとの間の並置を考慮して、前記目標言語の依存構造中の親ノードに従属する子ノードの順序にスコアを割り当てるように構成された順序モデル
を備えることを特徴とするモデル。
〔態様47〕
モデルをトレーニングする方法であって、
並置された、対訳の原言語の依存構造と目標言語の依存構造からなるコーパスにアクセスするステップと、
前記コーパス中の特性のセットに基づいて、機械学習システムで目標言語の依存構造のノードの順序付けにスコアを割り当てるように前記モデルをトレーニングするステップと
を備えることを特徴とする方法。
130 システムメモリ
134 オペレーティングシステム
135 アプリケーションプログラム
136 他のプログラムモジュール
137 プログラムデータ
140 取り外し不能、不揮発性メモリインターフェース
144 オペレーティングシステム
145 アプリケーションプログラム
146 他のプログラムモジュール
147 プログラムデータ
150 取り外し可能、不揮発性メモリインターフェース
160 ユーザ入力インターフェース
161 ポインティングデバイス
162 キーボード
163 マイクロフォン
170 ネットワークインターフェース
171 ローカルエリアネットワーク
172 モデム
173 ワイドエリアネットワーク
180 リモートコンピュータ
185 リモートアプリケーションプログラム
190 ビデオインターフェース
191 モニタ
195 出力周辺インターフェース
196 プリンタ
197 スピーカ
202 文並置された大きな対訳コーパス
204 ツリーレット翻訳対データベース
206 順序モデル
208 一致モデル
210 翻訳確率テーブル
212 目標言語モデル
214 原言語依存関係構文解析コンポーネント
216 目標言語語分割コンポーネント
218 教師なし語並置コンポーネント
220 依存関係ツリー投射コンポーネント
222 目標言語モデルトレーニングコンポーネント
224 ツリーレット対エクストラクタ
226 順序モデルトレーニングコンポーネント
228 一致モデルトレーニングコンポーネント
256 語分割された対訳コーパス
258 語並置された対訳コーパス
262 原言語依存関係ツリー
400 語並置された、対訳依存関係ツリーコーパス
602 モデルの重み
604 ツリーレット翻訳対一致コンポーネント
606 原言語依存関係構文解析コンポーネント
608 デコーダ
610 入力文
614 原言語の依存関係ツリー
618 ツリーレット翻訳対
621 上位N個の翻訳
Claims (13)
- 目標言語の依存構造を生成するコンピュータシステムであって、前記コンピュータシステムに記憶されたコンピュータ可読命令が前記コンピュータシステムの処理装置によって実行されると、
原言語のトレーニングデータテキスト断片を表す原言語の依存構造中の語彙項目が、それに対応する、前記原言語のテキスト断片の翻訳であるトレーニングデータ目標言語テキスト断片の語彙項目と並置された並置済みの構造を得るように構成されたコーパス処理システムと、
前記原言語の依存構造の語彙項目から前記目標言語のテキスト断片の前記語彙項目に依存関係を投射して、前記目標言語の依存構造を得るように構成された依存関係投射コンポーネントと
を備え、
前記目標言語の依存構造は、目標言語の依存関係ツリーを含み、
前記依存関係投射コンポーネントは、前記目標言語の依存関係ツリー中で順序が正しくないノードを特定し、語彙項目が前記目標言語のテキスト断片に現われる順序と同じ順序である目標言語文字列をもたらす前記目標言語の依存関係ツリー中で最も低いレベルに前記特定されたノードを再結合することにより、前記目標言語の依存構造を再調整するように構成される、
ことを特徴とするシステム。 - それぞれが、原言語のテキスト断片とそれに対応する目標言語のテキスト断片とを含む、複数の対訳テキスト断片の対を有するトレーニングデータコーパス
をさらに備えることを特徴とする請求項1に記載のシステム。 - 前記依存関係投射コンポーネントは、前記目標言語の依存構造が前記目標言語のテキスト断片を正しく表すかどうかを判定し、正しく表さない場合は、前記目標言語のテキスト断片を正しく表すように前記目標言語の依存構造を調整するように構成されることを特徴とする請求項1に記載のシステム。
- 前記依存関係投射コンポーネントは、前記目標言語の依存構造を読み取って目標言語のテキスト文字列を生成し、前記目標言語のテキスト文字列中の前記語彙項目が、前記目標言語のテキスト断片に現われる順序と異なる順序であるかどうかを判定することにより、前記目標言語の依存構造が前記目標言語のテキスト断片を正しく表すかどうかを判定するように構成されることを特徴とする請求項3に記載のシステム。
- 前記依存関係投射コンポーネントは、前記目標言語の依存構造から読み取られる前記目標言語のテキスト文字列の語彙項目が、前記目標言語のテキスト断片に現われる順序と同じ順序になるまで、前記目標言語の依存構造を配列し直すことにより、前記目標言語の依存構造を調整するように構成されることを特徴とする請求項4に記載のシステム。
- 前記コーパス処理システムは、
前記原言語のテキスト断片を構文解析して、原言語の依存構造を得るように構成されたパーサと、
前記目標言語のテキスト断片を語彙項目に区分するように構成されたセグメンタと、
前記原言語の依存構造の語彙項目を前記目標言語のテキスト断片の語彙項目と並置するように構成された並置コンポーネントと
を備えることを特徴とする請求項1に記載のシステム。 - 目標言語の依存構造を生成する方法であって、前記方法は、コンピュータに記憶されたコンピュータ可読命令が前記コンピュータの処理装置によって実行されることによって実施され、
それぞれが、原言語のテキスト断片とそれに対応する目標言語のテキスト断片とを含む、複数の対訳テキスト断片の対を有するトレーニングデータコーパスにアクセスするステップと、
原言語のテキスト断片に基づいて生成された原言語の依存構造中の語彙項目が、それに対応する目標言語のテキスト断片中の語彙項目と並置された並置済みの構造を得るステップと、
前記原言語の依存構造中の語彙項目から前記目標言語のテキスト断片の語彙項目に依存関係を投射して、前記目標言語の依存構造を得るステップと
を備え、
前記目標言語の依存構造は、目標言語の依存関係ツリーを含み、
前記依存関係投射コンポーネントは、前記目標言語の依存関係ツリー中で順序が正しくないノードを特定し、語彙項目が前記目標言語のテキスト断片に現われる順序と同じ順序である目標言語文字列をもたらす前記目標言語の依存関係ツリー中で最も低いレベルに前記特定されたノードを再結合することにより、前記目標言語の依存構造を再調整するように構成される、
ことを特徴とする方法。 - 前記投射するステップは、
前記原言語の依存構造中の語彙項目が前記目標言語のテキスト断片の語彙項目と並置されない場合は、前記原言語の依存構造中の前記並置されない語彙項目から前記目標言語のテキスト断片に依存関係を投射しないことを含むことを特徴とする請求項7に記載の方法。 - 前記原言語の依存構造の依存関係は、前記原言語の依存構造中の第1の原語彙項目と第2の原語彙項目との間にあり、前記第1および第2の原語彙項目は、それぞれ前記目標言語のテキスト断片の第1および第2の目標語彙項目と並置され、投射するステップは、
前記第1の原語彙項目と前記第2の原語彙項目との間の前記依存関係を前記第1の目標語彙項目と第2の目標語彙項目に割り当てることを含むことを特徴とする請求項7に記載の方法。 - 前記原言語の依存構造中の語彙項目は、前記目標言語のテキスト断片の複数の語彙項目と並置され、投射するステップは、
前記目標言語の依存構造中で前記複数の語彙項目の親ノードを特定するステップと、
前記目標言語のテキスト断片中の前記複数の語彙項目のうち一番右にある語彙項目を特定するステップと、
前記一番右にある語彙項目を前記親ノードからの依存要素として割り当てるステップと、
前記目標言語のテキスト断片中の前記複数の語彙項目の残りを前記一番右にある語彙項目からの依存要素として割り当てるステップと
を含むことを特徴とする請求項7に記載の方法。 - 前記目標言語のテキスト断片中の並置されない語彙項目は、前記原言語の依存構造中の語彙項目と並置されず、投射するステップは、
前記目標言語のテキスト断片中で前記並置されない語彙項目のすぐ隣に位置する語彙項目を特定するステップと、
前記並置されない語彙項目を前記特定された語彙項目からの依存要素として割り当てるステップと
を含むことを特徴とする請求項7に記載の方法。 - 特定するステップは、
前記目標言語のテキスト断片中の前記並置されない語彙項目の前後にある目標言語の語彙項目の集合の中で、前記目標言語の依存構造において最も低い1つの語彙項目を特定するステップと、
前記特定された語彙項目からの依存要素として前記並置されない語彙項目を割り当てるステップと
を含むことを特徴とする請求項11に記載の方法。 - 前記原言語の依存構造中の複数の語彙項目が、前記目標言語のテキスト断片中の1つの語彙項目と並置され、投射するステップは、
前記原言語の依存構造中の複数の語彙項目の中で、前記原言語の依存構造において最も高い語彙項目を特定するステップと、
前記目標言語のテキスト断片中の前記1つの語彙項目に、前記原言語の依存構造中の前記複数の項目のうち前記特定された項目に関連付けられた依存関係を割り当てるステップと
を含むことを特徴とする請求項7に記載の方法。
Applications Claiming Priority (10)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62548904P | 2004-11-04 | 2004-11-04 | |
US60/625,489 | 2004-11-04 | ||
US11/014,108 US7200550B2 (en) | 2004-11-04 | 2004-12-16 | Projecting dependencies to generate target language dependency structure |
US11/014,152 | 2004-12-16 | ||
US11/014,503 US7698124B2 (en) | 2004-11-04 | 2004-12-16 | Machine translation system incorporating syntactic dependency treelets into a statistical framework |
US11/014,492 US7577562B2 (en) | 2004-11-04 | 2004-12-16 | Extracting treelet translation pairs |
US11/014,152 US7505894B2 (en) | 2004-11-04 | 2004-12-16 | Order model for dependency structure |
US11/014,108 | 2004-12-16 | ||
US11/014,492 | 2004-12-16 | ||
US11/014,503 | 2004-12-16 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005299176A Division JP5586817B2 (ja) | 2004-11-04 | 2005-10-13 | ツリーレット翻訳対の抽出 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014142975A JP2014142975A (ja) | 2014-08-07 |
JP5774751B2 true JP5774751B2 (ja) | 2015-09-09 |
Family
ID=36751429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014102432A Expired - Fee Related JP5774751B2 (ja) | 2004-11-04 | 2014-05-16 | ツリーレット翻訳対の抽出 |
Country Status (3)
Country | Link |
---|---|
US (5) | US7698124B2 (ja) |
JP (1) | JP5774751B2 (ja) |
CN (1) | CN1770107B (ja) |
Families Citing this family (319)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4718687B2 (ja) * | 1999-03-19 | 2011-07-06 | トラドス ゲゼルシャフト ミット ベシュレンクテル ハフツング | ワークフロー管理システム |
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
FR2825496B1 (fr) * | 2001-06-01 | 2003-08-15 | Synomia | Procede et systeme d'analyse syntaxique large de corpus, notamment de corpus specialises |
AU2002316581A1 (en) | 2001-07-03 | 2003-01-21 | University Of Southern California | A syntax-based statistical translation model |
EP1306775A1 (en) * | 2001-10-29 | 2003-05-02 | BRITISH TELECOMMUNICATIONS public limited company | Machine translation |
WO2004001623A2 (en) | 2002-03-26 | 2003-12-31 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
EP1349079A1 (en) * | 2002-03-28 | 2003-10-01 | BRITISH TELECOMMUNICATIONS public limited company | Machine translation |
US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US8296127B2 (en) * | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
GB0406619D0 (en) * | 2004-03-24 | 2004-04-28 | British Telecomm | Induction of grammar rules |
US8666725B2 (en) * | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
US7765520B2 (en) * | 2004-05-21 | 2010-07-27 | Bea Systems, Inc. | System and method for managing cross project dependencies at development time |
DE112005002534T5 (de) | 2004-10-12 | 2007-11-08 | University Of Southern California, Los Angeles | Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet |
US7698124B2 (en) * | 2004-11-04 | 2010-04-13 | Microsoft Corporaiton | Machine translation system incorporating syntactic dependency treelets into a statistical framework |
CA2525729A1 (en) * | 2004-11-08 | 2006-05-08 | At&T Corp. | System and method for compiling rules created by machine learning program |
US8719244B1 (en) | 2005-03-23 | 2014-05-06 | Google Inc. | Methods and systems for retrieval of information items and associated sentence fragments |
US7937396B1 (en) * | 2005-03-23 | 2011-05-03 | Google Inc. | Methods and systems for identifying paraphrases from an index of information items and associated sentence fragments |
US20060245654A1 (en) * | 2005-04-29 | 2006-11-02 | Microsoft Corporation | Utilizing grammatical parsing for structured layout analysis |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US8249344B2 (en) * | 2005-07-01 | 2012-08-21 | Microsoft Corporation | Grammatical parsing of document visual structures |
US7664629B2 (en) * | 2005-07-19 | 2010-02-16 | Xerox Corporation | Second language writing advisor |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7937265B1 (en) | 2005-09-27 | 2011-05-03 | Google Inc. | Paraphrase acquisition |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
JP4058071B2 (ja) * | 2005-11-22 | 2008-03-05 | 株式会社東芝 | 用例翻訳装置、用例翻訳方法および用例翻訳プログラム |
JP4961755B2 (ja) * | 2006-01-23 | 2012-06-27 | 富士ゼロックス株式会社 | 単語アライメント装置、単語アライメント方法、単語アライメントプログラム |
US8509563B2 (en) * | 2006-02-02 | 2013-08-13 | Microsoft Corporation | Generation of documents from images |
JP2007233486A (ja) * | 2006-02-27 | 2007-09-13 | Fujitsu Ltd | 翻訳者支援プログラム,翻訳者支援装置及び翻訳者支援方法 |
US7451120B1 (en) * | 2006-03-20 | 2008-11-11 | Google Inc. | Detecting novel document content |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US8209162B2 (en) * | 2006-05-01 | 2012-06-26 | Microsoft Corporation | Machine translation split between front end and back end processors |
US9020804B2 (en) * | 2006-05-10 | 2015-04-28 | Xerox Corporation | Method for aligning sentences at the word level enforcing selective contiguity constraints |
US8898052B2 (en) * | 2006-05-22 | 2014-11-25 | Facebook, Inc. | Systems and methods for training statistical speech translation systems from speech utilizing a universal speech recognizer |
US8244730B2 (en) * | 2006-05-30 | 2012-08-14 | Honda Motor Co., Ltd. | Learning syntactic patterns for automatic discovery of causal relations from text |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8521506B2 (en) | 2006-09-21 | 2013-08-27 | Sdl Plc | Computer-implemented method, computer software and apparatus for use in a translation system |
JP4481972B2 (ja) * | 2006-09-28 | 2010-06-16 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム |
US7814045B2 (en) * | 2006-10-04 | 2010-10-12 | Sap Ag | Semantical partitioning of data |
US9495358B2 (en) | 2006-10-10 | 2016-11-15 | Abbyy Infopoisk Llc | Cross-language text clustering |
US9069750B2 (en) | 2006-10-10 | 2015-06-30 | Abbyy Infopoisk Llc | Method and system for semantic searching of natural language texts |
US9471562B2 (en) | 2006-10-10 | 2016-10-18 | Abbyy Infopoisk Llc | Method and system for analyzing and translating various languages with use of semantic hierarchy |
US9075864B2 (en) | 2006-10-10 | 2015-07-07 | Abbyy Infopoisk Llc | Method and system for semantic searching using syntactic and semantic analysis |
US9588958B2 (en) | 2006-10-10 | 2017-03-07 | Abbyy Infopoisk Llc | Cross-language text classification |
US9892111B2 (en) | 2006-10-10 | 2018-02-13 | Abbyy Production Llc | Method and device to estimate similarity between documents having multiple segments |
US8892423B1 (en) | 2006-10-10 | 2014-11-18 | Abbyy Infopoisk Llc | Method and system to automatically create content for dictionaries |
US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
US8145473B2 (en) | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
US8195447B2 (en) | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9098489B2 (en) | 2006-10-10 | 2015-08-04 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US9053090B2 (en) | 2006-10-10 | 2015-06-09 | Abbyy Infopoisk Llc | Translating texts between languages |
US9645993B2 (en) | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US8433556B2 (en) * | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8065307B2 (en) * | 2006-12-20 | 2011-11-22 | Microsoft Corporation | Parsing, analysis and scoring of document content |
US20080162117A1 (en) * | 2006-12-28 | 2008-07-03 | Srinivas Bangalore | Discriminative training of models for sequence classification |
JP4997966B2 (ja) * | 2006-12-28 | 2012-08-15 | 富士通株式会社 | 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法 |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US20080221870A1 (en) * | 2007-03-08 | 2008-09-11 | Yahoo! Inc. | System and method for revising natural language parse trees |
US8788258B1 (en) | 2007-03-15 | 2014-07-22 | At&T Intellectual Property Ii, L.P. | Machine translation using global lexical selection and sentence reconstruction |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
US8326598B1 (en) | 2007-03-26 | 2012-12-04 | Google Inc. | Consensus translations from multiple machine translation systems |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US9779079B2 (en) * | 2007-06-01 | 2017-10-03 | Xerox Corporation | Authoring system |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US7983898B2 (en) * | 2007-06-08 | 2011-07-19 | Microsoft Corporation | Generating a phrase translation model by iteratively estimating phrase translation probabilities |
US8452585B2 (en) * | 2007-06-21 | 2013-05-28 | Microsoft Corporation | Discriminative syntactic word order model for machine translation |
US20090234635A1 (en) * | 2007-06-29 | 2009-09-17 | Vipul Bhatt | Voice Entry Controller operative with one or more Translation Resources |
US8639509B2 (en) * | 2007-07-27 | 2014-01-28 | Robert Bosch Gmbh | Method and system for computing or determining confidence scores for parse trees at all levels |
US20090030861A1 (en) * | 2007-07-27 | 2009-01-29 | Paul Almond Ltd | Probabilistic Prediction Based Artificial Intelligence Planning System |
US8548791B2 (en) * | 2007-08-29 | 2013-10-01 | Microsoft Corporation | Validation of the consistency of automatic terminology translation |
JP5342760B2 (ja) * | 2007-09-03 | 2013-11-13 | 株式会社東芝 | 訳語学習のためのデータを作成する装置、方法、およびプログラム |
US8180624B2 (en) * | 2007-09-05 | 2012-05-15 | Microsoft Corporation | Fast beam-search decoding for phrasal statistical machine translation |
US8046211B2 (en) | 2007-10-23 | 2011-10-25 | Microsoft Corporation | Technologies for statistical machine translation based on generated reordering knowledge |
US8375073B1 (en) | 2007-11-12 | 2013-02-12 | Google Inc. | Identification and ranking of news stories of interest |
JP5239307B2 (ja) * | 2007-11-20 | 2013-07-17 | 富士ゼロックス株式会社 | 翻訳装置及び翻訳プログラム |
US8209164B2 (en) * | 2007-11-21 | 2012-06-26 | University Of Washington | Use of lexical translations for facilitating searches |
CN101452446A (zh) * | 2007-12-07 | 2009-06-10 | 株式会社东芝 | 目标语言单词变形的方法及装置 |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US7996379B1 (en) | 2008-02-01 | 2011-08-09 | Google Inc. | Document ranking using word relationships |
US8615388B2 (en) * | 2008-03-28 | 2013-12-24 | Microsoft Corporation | Intra-language statistical machine translation |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US8706477B1 (en) * | 2008-04-25 | 2014-04-22 | Softwin Srl Romania | Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20090326916A1 (en) * | 2008-06-27 | 2009-12-31 | Microsoft Corporation | Unsupervised chinese word segmentation for statistical machine translation |
US20100017293A1 (en) * | 2008-07-17 | 2010-01-21 | Language Weaver, Inc. | System, method, and computer program for providing multilingual text advertisments |
US20100023315A1 (en) * | 2008-07-25 | 2010-01-28 | Microsoft Corporation | Random walk restarts in minimum error rate training |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
US9176952B2 (en) * | 2008-09-25 | 2015-11-03 | Microsoft Technology Licensing, Llc | Computerized statistical machine translation with phrasal decoder |
US8583418B2 (en) * | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8374881B2 (en) * | 2008-11-26 | 2013-02-12 | At&T Intellectual Property I, L.P. | System and method for enriching spoken language translation with dialog acts |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8996488B2 (en) * | 2008-12-17 | 2015-03-31 | At&T Intellectual Property I, L.P. | Methods, systems and computer program products for obtaining geographical coordinates from a textually identified location |
US9262403B2 (en) | 2009-03-02 | 2016-02-16 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
GB2468278A (en) * | 2009-03-02 | 2010-09-08 | Sdl Plc | Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation |
US20100228538A1 (en) * | 2009-03-03 | 2010-09-09 | Yamada John A | Computational linguistic systems and methods |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US20100299132A1 (en) * | 2009-05-22 | 2010-11-25 | Microsoft Corporation | Mining phrase pairs from an unstructured resource |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US8762131B1 (en) | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates |
US8762130B1 (en) | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
EP4318463A3 (en) | 2009-12-23 | 2024-02-28 | Google LLC | Multi-modal input on an electronic device |
US11416214B2 (en) | 2009-12-23 | 2022-08-16 | Google Llc | Multi-modal input on an electronic device |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US8285633B2 (en) * | 2010-03-29 | 2012-10-09 | Tarlow Maier J | System and method for direct client access for management of securities transactions |
US8265923B2 (en) * | 2010-05-11 | 2012-09-11 | Xerox Corporation | Statistical machine translation employing efficient parameter training |
US9767095B2 (en) | 2010-05-21 | 2017-09-19 | Western Standard Publishing Company, Inc. | Apparatus, system, and method for computer aided translation |
US9201871B2 (en) | 2010-06-11 | 2015-12-01 | Microsoft Technology Licensing, Llc | Joint optimization for machine translation system combination |
US20120010870A1 (en) * | 2010-07-09 | 2012-01-12 | Vladimir Selegey | Electronic dictionary and dictionary writing system |
KR101794274B1 (ko) * | 2010-07-13 | 2017-11-06 | 에스케이플래닛 주식회사 | 계층적 구문 기반의 통계적 기계 번역에서의 번역규칙 필터링과 목적단어 생성을 위한 방법 및 장치 |
CN102375809A (zh) * | 2010-08-04 | 2012-03-14 | 英业达股份有限公司 | 以输入的第一语言即时输出第二语言的系统及其方法 |
US8326600B2 (en) * | 2010-08-11 | 2012-12-04 | Google Inc. | Evaluating and modifying transliteration rules |
TW201214158A (en) * | 2010-09-21 | 2012-04-01 | Inventec Corp | System and method for using first language input to instantly output second language |
US8560477B1 (en) * | 2010-10-08 | 2013-10-15 | Google Inc. | Graph-based semi-supervised learning of structured tagging models |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US8352245B1 (en) | 2010-12-30 | 2013-01-08 | Google Inc. | Adjusting language models |
JP5747508B2 (ja) * | 2011-01-05 | 2015-07-15 | 富士ゼロックス株式会社 | 対訳情報検索装置、翻訳装置及びプログラム |
US9128929B2 (en) | 2011-01-14 | 2015-09-08 | Sdl Language Technologies | Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself |
US8296142B2 (en) | 2011-01-21 | 2012-10-23 | Google Inc. | Speech recognition using dock context |
US10140320B2 (en) | 2011-02-28 | 2018-11-27 | Sdl Inc. | Systems, methods, and media for generating analytical data |
JP5697202B2 (ja) * | 2011-03-08 | 2015-04-08 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 用語の対応を見出す方法、プログラム及びシステム |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
CN102117270B (zh) * | 2011-03-29 | 2016-01-20 | 中国科学院自动化研究所 | 一种基于模糊树到精确树的统计机器翻译方法 |
US8983995B2 (en) | 2011-04-15 | 2015-03-17 | Microsoft Corporation | Interactive semantic query suggestion for content search |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
CN102254323B (zh) * | 2011-06-10 | 2013-02-27 | 西安电子科技大学 | 基于treelet融合和水平集分割的遥感图像变化检测 |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US9201862B2 (en) * | 2011-06-16 | 2015-12-01 | Asociacion Instituto Tecnologico De Informatica | Method for symbolic correction in human-machine interfaces |
US8635233B2 (en) * | 2011-06-27 | 2014-01-21 | Microsoft Corporation | Techniques to automatically build a language dependency graph for localizable resources |
US8725496B2 (en) | 2011-07-26 | 2014-05-13 | International Business Machines Corporation | Customization of a natural language processing engine |
KR20130014106A (ko) * | 2011-07-29 | 2013-02-07 | 한국전자통신연구원 | 다중 번역 엔진을 사용한 번역 장치 및 방법 |
US9984054B2 (en) | 2011-08-24 | 2018-05-29 | Sdl Inc. | Web interface including the review and manipulation of a web document and utilizing permission based control |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8914277B1 (en) * | 2011-09-20 | 2014-12-16 | Nuance Communications, Inc. | Speech and language translation of an utterance |
US8886679B2 (en) * | 2011-10-11 | 2014-11-11 | Hewlett-Packard Development Company, L.P. | Mining web applications |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8935151B1 (en) | 2011-12-07 | 2015-01-13 | Google Inc. | Multi-source transfer of delexicalized dependency parsers |
US20150161109A1 (en) * | 2012-01-13 | 2015-06-11 | Google Inc. | Reordering words for machine translation |
CN104160396B (zh) * | 2012-03-01 | 2017-06-16 | 国际商业机器公司 | 在字符串集之中查找最佳匹配字符串的方法和系统 |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
CN102708098B (zh) * | 2012-05-30 | 2015-02-04 | 中国科学院自动化研究所 | 一种基于依存连贯性约束的双语词语自动对齐方法 |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US10810368B2 (en) * | 2012-07-10 | 2020-10-20 | Robert D. New | Method for parsing natural language text with constituent construction links |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
CN102945231B (zh) * | 2012-10-19 | 2015-03-11 | 中国科学院计算技术研究所 | 一种面向增量式翻译的结构化语言模型构建方法及系统 |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
CN103150329A (zh) * | 2013-01-06 | 2013-06-12 | 清华大学 | 双语文本的词语对齐方法及装置 |
BR112015018905B1 (pt) | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144949A2 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
KR101749009B1 (ko) | 2013-08-06 | 2017-06-19 | 애플 인크. | 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화 |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
US9842592B2 (en) | 2014-02-12 | 2017-12-12 | Google Inc. | Language models using non-linguistic context |
US9412365B2 (en) | 2014-03-24 | 2016-08-09 | Google Inc. | Enhanced maximum entropy models |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
CN106471570B (zh) | 2014-05-30 | 2019-10-01 | 苹果公司 | 多命令单一话语输入方法 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9740687B2 (en) | 2014-06-11 | 2017-08-22 | Facebook, Inc. | Classifying languages for objects and entities |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
CN104239290B (zh) * | 2014-08-08 | 2017-02-15 | 中国科学院计算技术研究所 | 基于依存树的统计机器翻译方法及系统 |
US9524293B2 (en) * | 2014-08-15 | 2016-12-20 | Google Inc. | Techniques for automatically swapping languages and/or content for machine translation |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9805028B1 (en) * | 2014-09-17 | 2017-10-31 | Google Inc. | Translating terms using numeric representations |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9442922B2 (en) * | 2014-11-18 | 2016-09-13 | Xerox Corporation | System and method for incrementally updating a reordering model for a statistical machine translation system |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9864744B2 (en) | 2014-12-03 | 2018-01-09 | Facebook, Inc. | Mining multi-lingual data |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9830386B2 (en) | 2014-12-30 | 2017-11-28 | Facebook, Inc. | Determining trending topics in social media |
US9830404B2 (en) | 2014-12-30 | 2017-11-28 | Facebook, Inc. | Analyzing language dependency structures |
US10067936B2 (en) | 2014-12-30 | 2018-09-04 | Facebook, Inc. | Machine translation output reranking |
JP6607482B2 (ja) * | 2015-02-02 | 2019-11-20 | 国立研究開発法人情報通信研究機構 | 構文解析装置、学習装置、機械翻訳装置、およびプログラム |
US9477652B2 (en) | 2015-02-13 | 2016-10-25 | Facebook, Inc. | Machine learning dialect identification |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
JP2016177341A (ja) * | 2015-03-18 | 2016-10-06 | 株式会社エヌ・ティ・ティ・データ | 対訳文生成装置、翻訳装置、対訳文生成方法、及びプログラム |
US10134394B2 (en) | 2015-03-20 | 2018-11-20 | Google Llc | Speech recognition using log-linear model |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
CN106372053B (zh) * | 2015-07-22 | 2020-04-28 | 华为技术有限公司 | 句法分析的方法和装置 |
CN106484681B (zh) | 2015-08-25 | 2019-07-09 | 阿里巴巴集团控股有限公司 | 一种生成候选译文的方法、装置及电子设备 |
CN106484682B (zh) | 2015-08-25 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 基于统计的机器翻译方法、装置及电子设备 |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
KR102407630B1 (ko) * | 2015-09-08 | 2022-06-10 | 삼성전자주식회사 | 서버, 사용자 단말 및 이들의 제어 방법. |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9734142B2 (en) | 2015-09-22 | 2017-08-15 | Facebook, Inc. | Universal translation |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10133738B2 (en) | 2015-12-14 | 2018-11-20 | Facebook, Inc. | Translation confidence scores |
US9734143B2 (en) | 2015-12-17 | 2017-08-15 | Facebook, Inc. | Multi-media context language processing |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US9747283B2 (en) | 2015-12-28 | 2017-08-29 | Facebook, Inc. | Predicting future translations |
US9805029B2 (en) | 2015-12-28 | 2017-10-31 | Facebook, Inc. | Predicting future translations |
US10002125B2 (en) | 2015-12-28 | 2018-06-19 | Facebook, Inc. | Language model personalization |
US9898460B2 (en) * | 2016-01-26 | 2018-02-20 | International Business Machines Corporation | Generation of a natural language resource using a parallel corpus |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9978367B2 (en) | 2016-03-16 | 2018-05-22 | Google Llc | Determining dialog states for language models |
CN107291701B (zh) * | 2016-04-01 | 2020-12-01 | 阿里巴巴集团控股有限公司 | 一种机器语言生成方法及装置 |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10902221B1 (en) | 2016-06-30 | 2021-01-26 | Facebook, Inc. | Social hash for language models |
US9922029B1 (en) * | 2016-06-30 | 2018-03-20 | Facebook, Inc. | User feedback for low-confidence translations |
US10902215B1 (en) | 2016-06-30 | 2021-01-26 | Facebook, Inc. | Social hash for language models |
US10832664B2 (en) | 2016-08-19 | 2020-11-10 | Google Llc | Automated speech recognition using language models that selectively use domain-specific model components |
US10319019B2 (en) * | 2016-09-14 | 2019-06-11 | Ebay Inc. | Method, medium, and system for detecting cross-lingual comparable listings for machine translation using image similarity |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10185763B2 (en) * | 2016-11-30 | 2019-01-22 | Facebook, Inc. | Syntactic models for parsing search queries on online social networks |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
CN106649288B (zh) * | 2016-12-12 | 2020-06-23 | 北京百度网讯科技有限公司 | 基于人工智能的翻译方法和装置 |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10180935B2 (en) | 2016-12-30 | 2019-01-15 | Facebook, Inc. | Identifying multiple languages in a content item |
US10311860B2 (en) | 2017-02-14 | 2019-06-04 | Google Llc | Language model biasing system |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10789208B2 (en) * | 2017-08-02 | 2020-09-29 | Sap Se | Dependency mapping in a database environment |
CN107590138B (zh) * | 2017-08-18 | 2020-01-31 | 浙江大学 | 一种基于词性注意力机制的神经机器翻译方法 |
CN107800683A (zh) * | 2017-09-08 | 2018-03-13 | 微梦创科网络科技(中国)有限公司 | 一种挖掘恶意ip的方法及装置 |
CN107659562A (zh) * | 2017-09-08 | 2018-02-02 | 微梦创科网络科技(中国)有限公司 | 一种挖掘恶意登录账号的方法及装置 |
US10380249B2 (en) | 2017-10-02 | 2019-08-13 | Facebook, Inc. | Predicting future trending topics |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
CN109190115B (zh) * | 2018-08-14 | 2023-05-26 | 重庆邂智科技有限公司 | 一种文本匹配方法、装置、服务器及存储介质 |
US11120224B2 (en) * | 2018-09-14 | 2021-09-14 | International Business Machines Corporation | Efficient translating of social media posts |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
US11113481B2 (en) * | 2019-05-02 | 2021-09-07 | Google Llc | Adapting automated assistants for use with multiple languages |
CN110807334B (zh) * | 2019-10-29 | 2023-07-21 | 网易有道信息技术(北京)有限公司 | 文本处理方法、装置、介质和计算设备 |
US11797781B2 (en) | 2020-08-06 | 2023-10-24 | International Business Machines Corporation | Syntax-based multi-layer language translation |
US11747970B2 (en) | 2021-09-23 | 2023-09-05 | International Business Machines Corporation | Interactive graphical display of multiple overlapping hypotheses or document versions |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2794919B2 (ja) * | 1990-09-03 | 1998-09-10 | 日本電気株式会社 | 機械翻訳装置 |
JP2745370B2 (ja) * | 1993-02-23 | 1998-04-28 | 日本アイ・ビー・エム株式会社 | 機械翻訳方法及び機械翻訳装置 |
US5966686A (en) * | 1996-06-28 | 1999-10-12 | Microsoft Corporation | Method and system for computing semantic logical forms from syntax trees |
US7050964B2 (en) * | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
AU2002316581A1 (en) | 2001-07-03 | 2003-01-21 | University Of Southern California | A syntax-based statistical translation model |
US7526424B2 (en) * | 2002-03-20 | 2009-04-28 | Microsoft Corporation | Sentence realization model for a natural language generation system |
EP1351158A1 (en) | 2002-03-28 | 2003-10-08 | BRITISH TELECOMMUNICATIONS public limited company | Machine translation |
JP3973549B2 (ja) * | 2002-12-19 | 2007-09-12 | 沖電気工業株式会社 | 対訳依存構造対応付け装置、方法及びプログラム、並びに、対訳依存構造対応付けプログラムを記録した記録媒体 |
US7698124B2 (en) | 2004-11-04 | 2010-04-13 | Microsoft Corporaiton | Machine translation system incorporating syntactic dependency treelets into a statistical framework |
-
2004
- 2004-12-16 US US11/014,503 patent/US7698124B2/en not_active Expired - Fee Related
- 2004-12-16 US US11/014,492 patent/US7577562B2/en not_active Expired - Fee Related
- 2004-12-16 US US11/014,152 patent/US7505894B2/en not_active Expired - Fee Related
- 2004-12-16 US US11/014,108 patent/US7200550B2/en active Active
-
2005
- 2005-09-29 CN CN2005101089827A patent/CN1770107B/zh not_active Expired - Fee Related
-
2009
- 2009-07-08 US US12/499,379 patent/US8082143B2/en not_active Expired - Fee Related
-
2014
- 2014-05-16 JP JP2014102432A patent/JP5774751B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8082143B2 (en) | 2011-12-20 |
JP2014142975A (ja) | 2014-08-07 |
US7577562B2 (en) | 2009-08-18 |
CN1770107A (zh) | 2006-05-10 |
US7505894B2 (en) | 2009-03-17 |
US20090271177A1 (en) | 2009-10-29 |
US20060095248A1 (en) | 2006-05-04 |
US20060111891A1 (en) | 2006-05-25 |
US7200550B2 (en) | 2007-04-03 |
US20060111892A1 (en) | 2006-05-25 |
CN1770107B (zh) | 2012-10-10 |
US20060111896A1 (en) | 2006-05-25 |
US7698124B2 (en) | 2010-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5774751B2 (ja) | ツリーレット翻訳対の抽出 | |
JP5586817B2 (ja) | ツリーレット翻訳対の抽出 | |
US7536295B2 (en) | Machine translation using non-contiguous fragments of text | |
US8600728B2 (en) | Training for a text-to-text application which uses string to tree conversion for training and decoding | |
JP4993762B2 (ja) | 用例ベースの機械翻訳システム | |
CA2408819C (en) | Machine translation techniques | |
US8249856B2 (en) | Machine translation | |
US20070265825A1 (en) | Machine translation using elastic chunks | |
De Gispert et al. | Hierarchical phrase-based translation with weighted finite-state transducers and shallow-n grammars | |
Mondal et al. | Machine translation and its evaluation: a study | |
Foster | Text prediction for translators | |
JP5734917B2 (ja) | 並べ替えモデル学習装置、方法、及びプログラム、並びに翻訳装置、方法、及びプログラム | |
Costa-jussà | An overview of the phrase-based statistical machine translation techniques | |
JP4829702B2 (ja) | 機械翻訳装置、機械翻訳方法、および生成規則作成装置、生成規則作成方法、ならびにそれらのプログラムおよび記録媒体 | |
JP5544518B2 (ja) | 機械翻訳装置、機械翻訳方法、およびそのプログラム | |
DeNeefe | Tree-adjoining machine translation | |
Quirk et al. | Dependency tree translation: Syntactically informed phrasal smt | |
Jawaid | Statistical Machine Translation between Languages with Significant Word Order Differences | |
Clemente | Architecture and modeling for n-gram-based statistical machine translation | |
Siahbani | Left-to-Right Hierarchical Phrase-based Machine Translation | |
Och | Statistical Machine Translation: Foundations and Recent Advances Tutorial at MT Summit 2005 Phuket, Thailand | |
Jawaid | Statistical Machine Translation between Languages with |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140516 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150518 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20150523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5774751 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |