JP2018026127A - 翻訳方法、翻訳装置及びコンピュータプログラム - Google Patents
翻訳方法、翻訳装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2018026127A JP2018026127A JP2017148956A JP2017148956A JP2018026127A JP 2018026127 A JP2018026127 A JP 2018026127A JP 2017148956 A JP2017148956 A JP 2017148956A JP 2017148956 A JP2017148956 A JP 2017148956A JP 2018026127 A JP2018026127 A JP 2018026127A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- sentence
- language
- candidate
- different
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Neurology (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】翻訳方法、装置、およびプログラムは、1つ以上のプロセッサを用いて、第1言語のソース文章に対して並列に複数の異なる翻訳過程を行う。特徴ベクトルそれぞれを生成するために、前記複数の翻訳過程のうち二以上の各翻訳過程で前記ソース文章を符号化する、又は、前記複数の各翻訳過程で前記ソース文章及び前記ソース文章の変形を符号化するステップと、第2言語の複数の候補文章それぞれを生成するために前記特徴ベクトルそれぞれを復号化するステップと、前記第2言語の複数の候補文章それぞれから前記第2言語の最終文章を選択するステップとを含む。
【選択図】図2
Description
前記1つ以上のプロセッサのうち少なくとも1つでデコーダを変更又は変化させるステップとをさらに含み得る。
1110:翻訳プロセッサ
1111:受信部
1113:エンコーダ
1115:デコーダ
1130:プロセッサ
1150:メモリ
1170:送受信インターフェース
Claims (40)
- 1つ以上のプロセッサを用いて、第1言語のソース文章に対して並列に複数の異なる翻訳過程で翻訳を行うステップを含む翻訳方法であって、
前記翻訳を行うステップは、
複数の特徴ベクトルを生成するために、前記複数の翻訳過程のうち二以上の翻訳過程で前記ソース文章を符号化する、又は、前記複数の翻訳過程のうち1つ以上の翻訳過程で前記ソース文章及び前記ソース文章の変形を符号化するステップと、
第2言語の複数の候補文章を生成するために前記特徴ベクトルそれぞれを復号化するステップと、
前記第2言語の複数の候補文章それぞれから前記第2言語の最終文章を選択するステップと、
を含む、翻訳方法。 - 前記複数の異なる翻訳過程は、
異なるグラフィックプロセッサユニット(GPUs)によって実現され、前記グラフィックプロセッサユニットそれぞれは翻訳エンコーダ及び翻訳デコーダを含み、
前記異なる翻訳過程を行うために前記ソース文章は、前記グラフィックプロセッサユニットのうち少なくとも2つのグラフィックプロセッサユニット又は少なくとも1つのグラフィックプロセッサユニットに入力され、前記ソース文章の変形は、異なる少なくとも1つのグラフィックプロセッサユニットに入力される、請求項1に記載の翻訳方法。 - 前記複数の異なる翻訳過程は、翻訳システムの前記1つ以上のプロセッサによって実現され、
前記1つ以上のプロセッサそれぞれは、前記翻訳システムの複数のエンコーダのうちの1つ以上の翻訳エンコーダを含み、前記翻訳システムの複数のデコーダのうちの1つ以上の翻訳デコーダを含み、
前記翻訳方法は、前記ソース文章を前記複数のエンコーダのうち少なくとも2つのエンコーダに並列に入力するステップをさらに含む、請求項1又は2に記載の翻訳方法。 - 前記ソース文章の変形を前記複数のエンコーダのうち少なくとも1つのエンコーダに入力するステップと、
前記複数の異なる翻訳過程を行うために前記複数のデコーダのうち少なくとも1つのデコーダを変形するステップと、
をさらに含む、請求項3に記載の翻訳方法。 - 前記第1言語に関する情報に基づいて前記ソース文章の単語順序を変更することによって前記ソース文章の変形を生成するステップと、
前記第1言語に関する情報に基づいて前記ソース文章に含まれた単語を同義語に交替するステップと、
前記複数のエンコーダのうち前記少なくとも1つのエンコーダに前記ソース文章の変形を入力するステップと、
をさらに含む、請求項4に記載の翻訳方法。 - 前記少なくとも1つのエンコーダそれぞれに適用される対応する活性関数又は対応するパラメータ値それぞれに対応してノイズをそれぞれ適用することで、前記複数のエンコーダのうち前記少なくとも1つのエンコーダの変更を行うステップと、
前記少なくとも1つのデコーダそれぞれに適用される対応する活性関数又は対応するパラメータ値それぞれに対応してノイズをそれぞれ適用することで、前記複数のデコーダのうち前記少なくとも1つのデコーダの変更を行うステップと、
をさらに含む、請求項4に記載の翻訳方法。 - 前記複数の異なる翻訳過程を行うために、前記1つ以上のプロセッサのうち少なくとも1つでエンコーダを変更又は変化させるステップと、
前記1つ以上のプロセッサのうち少なくとも1つでデコーダを変更又は変化させるステップと、
をさらに含む、請求項3に記載の翻訳方法。 - 前記エンコーダを、前記エンコーダの学習に用いられた学習初期値、学習セット、及び学習順序と異なる学習初期値、学習セット、及び学習順序のうち少なくとも1つによって学習された異なるエンコーダと交替することによって前記エンコーダの変更又は変化を行うステップと、
前記デコーダを、前記デコーダの学習に用いられた学習初期値、学習セット、及び学習順序と異なる学習初期値、学習セット、及び学習順序のうち少なくとも1つによって学習された異なるデコーダと交替することによって前記デコーダの変更又は変化を行うステップと、
のうち少なくとも1つをさらに含む、請求項7に記載の翻訳方法。 - 前記候補文章それぞれの生成は、ビームサーチアルゴリズムそれぞれを用いて各翻訳過程で予め設定された個数の候補文章を生成することを含む、請求項1ないし8のうち何れか一項に記載の翻訳方法。
- 前記ビームサーチアルゴリズムそれぞれは、n−ベストビームサーチアルゴリズムよりも低い複雑度を有するm−ベストビームサーチアルゴリズムである(n>m)、請求項9に記載の翻訳方法。
- 前記第2言語の最終文章を選択するステップは、
前記第2言語の複数の候補文章それぞれのスコアを算出するステップと、
前記第2言語の複数の候補文章のうち最も高いスコアを有する1つの候補文章を前記第2言語の前記最終文章として選択するステップと、
を含む、請求項1ないし10のうち何れか一項に記載の翻訳方法。 - 前記第2言語の複数の候補文章それぞれのスコアを算出するステップは、前記各翻訳過程から前記第2言語の1つの候補文章のスコアそれぞれを算出するステップを含む、請求項11に記載の翻訳方法。
- 前記第2言語の前記最終文章を選択するステップは、
リスコアリングモデルそれぞれを用いて前記各翻訳過程で前記第2言語に対応する候補文章それぞれに対応するスコアを算出するステップと、
1つ以上の対応する候補文章それぞれに対応するスコアの統計値を用いて、前記各翻訳過程から前記1つ以上の対応する候補文章に対応するスコアを再算出するステップと、
前記第2言語の最終文章として、前記再算出されたスコアのうち最も高いスコアを有する対応する1つ以上の候補文章のうちの1つを選択するステップと、
を含む、請求項1ないし10のうち何れか一項に記載の翻訳方法。 - 請求項1ないし13のうち何れか一項に記載の翻訳方法を翻訳装置のコンピュータに実行させるコンピュータプログラム。
- 第1言語のソース文章に対して並列に複数の異なる翻訳過程(前記異なる翻訳過程は特徴ベクトルそれぞれを生成するために、前記複数の翻訳過程のうち二以上の各翻訳過程で前記ソース文章を符号化する、又は、前記複数の各翻訳過程で前記ソース文章及び前記ソース文章の変形を符号化し、第2言語の複数の候補文章それぞれを生成するために前記特徴ベクトルそれぞれを復号化することを含む)を行うために構成される、1つ以上のプロセッサのうち少なくとも1つのプロセッサと、
前記第2言語の複数の候補文章それぞれから前記第2言語の最終文章を選択するように構成された、前記1つ以上のプロセッサのうち出力プロセッサと、
を含む、翻訳装置。 - 前記少なくとも1つのプロセッサは、前記ソース文章に対応する符号化を行って特徴ベクトルを生成する少なくとも1つのエンコーダ、及び前記特徴ベクトルに対応する復号化を行って前記ソース文章に対して前記第2言語の複数の候補文章を生成する少なくとも1つのデコーダを含む、請求項15に記載の翻訳装置。
- 前記翻訳装置は、複数の異なる各翻訳過程を行うための異なるグラフィックプロセッサユニット(GPUs)を含み、前記グラフィックプロセッサユニットそれぞれは翻訳エンコーダ及び翻訳デコーダを含み、
前記翻訳装置は、前記異なる翻訳過程を行うために前記ソース文章を少なくとも2つのグラフィックプロセッサユニット又は少なくとも1つのグラフィックプロセッサユニットに入力し、前記ソース文章の変化を異なる少なくとも1つのグラフィックプロセッサユニットに入力する、請求項15又は16に記載の翻訳装置。 - 前記複数の異なる翻訳過程は、翻訳システムの前記1つ以上のプロセッサのうち前記少なくとも1つのプロセッサによって実現され、
前記少なくとも1つのプロセッサは、前記翻訳システムの複数のエンコーダのうちの1つ以上の翻訳エンコーダ及び前記翻訳システムの複数のデコーダのうちの1つ以上の翻訳デコーダを含み、
前記翻訳装置は、前記ソース文章を前記複数のエンコーダのうち少なくとも2つのエンコーダに並列に入力する、請求項15ないし17のうち何れか一項に記載の翻訳装置。 - 前記出力プロセッサは、前記複数のエンコーダのうち少なくとも1つのエンコーダの変化を実現するために前記ソース文章の変化を生成し、前記翻訳過程のうち少なくとも1つで前記ソース文章の生成された変化に対する符号化を実現できるように構成され、
前記複数の異なる翻訳過程を実行するために、前記複数のデコーダのうち少なくとも1つのデコーダの変化を実現できるように構成される、請求項18に記載の翻訳装置。 - 前記1つ以上のプロセッサのうち1つのプロセッサは、前記複数のエンコーダのうち少なくとも1つのエンコーダの変化を実現するために前記ソース文章の変化を生成し、前記翻訳過程のうち少なくとも1つで前記ソース文章の前記生成された変化に対する符号化を実現できるように構成され、
前記複数の異なる翻訳過程の実行のために、前記複数のデコーダのうち少なくとも1つのデコーダの変化を実現できるように構成される、請求項18に記載の翻訳装置。 - 前記1つのプロセッサは、前記ソース文章の変化を生成し、前記翻訳過程のうち少なくとも1つで前記ソース文章の生成された変化を符号化するように構成され、
前記ソース文章の変化を生成するために、前記1つのプロセッサは、前記第1言語に関する情報に基づいて前記ソース文章のワード順序を変更する動作、及び前記第1言語に関する情報に基づいて前記ソース文章に含まれたワードを同義語に交替する動作のうち少なくとも1つを行うように構成される、請求項20に記載の翻訳装置。 - 前記1つのプロセッサは、
前記複数のエンコーダのうち少なくとも1つのエンコーダの変化を実現し、前記複数のデコーダのうち少なくとも1つのデコーダの変化を実現するために、
前記少なくとも1つのエンコーダそれぞれに適用される対応する活性関数又は対応するパラメータ値それぞれに対応してノイズをそれぞれ適用することで、前記複数のエンコーダのうち少なくとも1つのエンコーダを変更する動作と、
前記少なくとも1つのデコーダそれぞれに適用される対応する活性関数又は対応するパラメータ値それぞれに対応してノイズをそれぞれ適用することで、前記複数のデコーダのうち少なくとも1つのデコーダを変更する動作のうち少なくとも1つを対応して行うように構成される、請求項20に記載の翻訳装置。 - 前記複数の異なる翻訳過程は、前記1つ以上のプロセッサのうち複数の翻訳プロセッサによって実現され、
前記複数の翻訳プロセッサそれぞれは翻訳エンコーダ及び翻訳デコーダを含み、
前記異なる翻訳過程を実現するために、前記1つ以上のプロセッサのうち1つのプロセッサは、前記1つの翻訳エンコーダを、前記少なくとも1つの翻訳エンコーダの学習に用いられた学習初期値、学習セット、及び学習順序と異なる学習初期値、学習セット、及び学習順序によって学習された異なるエンコーダと交替することで、前記複数の翻訳プロセッサの翻訳エンコーダのうち1つの翻訳エンコーダの変更又は変化を実現できるように構成され、
前記1つの翻訳デコーダを、前記少なくとも1つの翻訳デコーダの学習に用いられた学習初期値、学習セット、及び学習順序と異なる学習初期値、学習セット、及び学習順序によって学習された異なるデコーダと交替することで、前記複数の翻訳プロセッサの翻訳デコーダのうち1つの翻訳デコーダの変更又は変化を実現できるように構成される、請求項15に記載の翻訳装置。 - 前記複数の候補文章それぞれの生成は、ビームサーチアルゴリズムそれぞれを用いて各翻訳過程で予め設定された個数の候補文章の生成を含む、請求項15ないし23のうち何れか一項に記載の翻訳装置。
- 前記ビームサーチアルゴリズムそれぞれは、n−ベストビームサーチアルゴリズムよりも低い複雑度を有するm−ベストビーム探索アルゴリズムである(n>m)、請求項24に記載の翻訳装置。
- 前記出力プロセッサは、
前記第2言語の複数の候補文章のスコアそれぞれを算出し、
前記第2言語の複数の候補文章のうち最も高いスコアを有する1つの候補文章を前記第2言語の前記最終文章として選択する、請求項15ないし25のうち何れか一項に記載の翻訳装置。 - 前記出力プロセッサは、前記第2言語の複数の候補文章のスコアそれぞれを算出するために、前記各翻訳過程から前記第2言語の1つの候補文章のスコアそれぞれを算出する、請求項26に記載の翻訳装置。
- 前記第2言語の前記最終文章を選択するために、前記出力プロセッサは、
リスコアリングモデルそれぞれを用いて前記各翻訳過程で前記第2言語に対応する候補文章それぞれに対応するスコアを算出し、
1つ以上の対応する候補文章それぞれに対応するスコアの統計値を用いて、前記各翻訳過程から前記1つ以上の対応する候補文章に対応するスコアを再算出し、
前記第2言語の最終文章として、前記再算出されたスコアのうち最も高い値を有する対応する1つ以上の候補文章のうちの1つを選択するように構成される、請求項15ないし25のうち何れか一項に記載の翻訳装置。 - 前記翻訳装置は、前記翻訳装置の複数のメモリのうちの1つ以上のメモリをさらに含み、
前記1つ以上のメモリは、前記異なる翻訳過程からの結果それぞれ及び前記複数の候補文章それぞれから複数の候補文章それぞれを格納する、又は、候補文章を選択する、請求項15に記載の翻訳装置。 - 前記複数のメモリのうち少なくとも1つのメモリをさらに含み、
前記少なくとも1つのメモリは、1つ以上のプロセッサによって実行される場合、前記1つ以上のプロセッサが前記複数の異なる翻訳過程及び前記最終文章の選択を行うように構成される命令を格納する非一時的コンピュータで読み出し可能な記録媒体である、請求項29に記載の翻訳装置。 - 前記複数の異なる翻訳過程を行うように構成された前記少なくとも1つのプロセッサと前記最終文章を選択するように構成された前記出力プロセッサは、前記1つ以上のプロセッサのうち同一のプロセッサである、請求項15ないし30のうち何れか一項に記載の翻訳装置。
- 翻訳方法において、
ソース文章に対して複数の異なる翻訳過程を並列に行うステップ(前記複数の異なる翻訳過程は、対応する翻訳符号化過程、対応する翻訳復号化過程、及び前記対応する符号化過程が前記ソース文章又は前記ソース文章の変形を符号化するか否かのうちの1つ以上に対して互いに異なる)と、
前記複数の異なる翻訳過程からの結果それぞれから決定された最も高い順位の候補文章に基づいて前記ソース文章の翻訳結果を出力するステップと、
を含む、翻訳方法。 - 前記複数の異なる翻訳過程のうち少なくとも1つの翻訳復号化過程は、候補文章を決定するためにm−ベストビームサーチアルゴリズムを実現し、
前記m−ベストビームサーチアルゴリズムは、n−ベストビームサーチアルゴリズムに比べて複雑度が低いビームサーチアルゴリズムであり、n>mである、請求項32に記載の翻訳方法。 - 請求項32又は33に記載の翻訳方法を翻訳装置のコンピュータに実行させるコンピュータプログラム。
- ソース文章に対する第1符号化及び第1復号化、前記ソース文章に対する異なる符号化、及び/又は前記ソース文章に対する異なる復号化、前記ソース文章の1つ以上の変化に対する第1符号化及び第1復号化、及び/又は前記ソース文章の1つ以上の変化に対する異なる符号化及び/又は復号化を含む、前記ソース文章に対する複数の翻訳過程を並列に行うステップ(前記複数の各翻訳過程は、前記各翻訳過程から候補リストを生成するために翻訳符号化過程及び翻訳復号化過程のそれぞれを含む)と、
前記候補リストそれぞれから候補文章の順位を決定するステップと、
前記順位に基づいて決定された最も高い順位の候補文章に基づいて前記ソース文章の翻訳結果を出力するステップと、
を含み、
前記翻訳復号化過程それぞれは、前記複数の各翻訳過程のための前記候補リストを生成するためにn−ベストビームサーチアルゴリズムを実現する、翻訳方法。 - 請求項35に記載の翻訳方法を翻訳装置のコンピュータに実行させるコンピュータプログラム。
- ソース文章に対する第1符号化及び第1復号化、前記ソース文章に対する異なる符号化、及び/又は前記ソース文章に対する異なる復号化、前記ソース文章の1つ以上の変化に対する第1符号化及び第1復号化、及び/又は前記ソース文章の1つ以上の変化に対する異なる符号化及び/又は復号化を含む、前記ソース文章に対する複数の翻訳過程を並列に行うステップ(前記複数の各翻訳過程は前記各翻訳過程から候補リストを生成するために、翻訳符号化過程及び翻訳復号化過程それぞれを含む)と、
前記候補リストそれぞれから候補文章を順位を決定するステップと、
前記順位に基づいて決定された最も高い順位の候補文章に基づいて前記ソース文章の翻訳結果を出力するステップと、
を含み、
前記1つ以上の翻訳復号化過程は、対応する候補リストを生成するためにn−ベストビームサーチアルゴリズムに比べて低い複雑度を有するビームサーチアルゴリズムであるm−ベストビームサーチアルゴリズムを実現し、n>mである、翻訳方法。 - 前記候補文章の順位を決定するステップは、前記候補リストそれぞれにリスコアリングモデルそれぞれを適用するステップを含み、
前記最も高い順位の候補文章を発見するために、前記適用されたリスコアリングモデルそれぞれからの結果それぞれに基づいて、全ての候補文章よりも少ない数の候補文章に対する候補リストそれぞれが選択的に順位が再設定される、請求項37に記載の翻訳方法。 - 前記1つ以上の翻訳復号化過程は、対応する候補リストを生成するために前記n−ベストビームサーチアルゴリズムを選択的に実現する、請求項37に記載の翻訳方法。
- 請求項37ないし39のうち何れか一項に記載の翻訳方法を翻訳装置のコンピュータに実行させるコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2016-0101726 | 2016-08-10 | ||
KR1020160101726A KR102565275B1 (ko) | 2016-08-10 | 2016-08-10 | 병렬 처리에 기초한 번역 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018026127A true JP2018026127A (ja) | 2018-02-15 |
JP7066349B2 JP7066349B2 (ja) | 2022-05-13 |
Family
ID=59298315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017148956A Active JP7066349B2 (ja) | 2016-08-10 | 2017-08-01 | 翻訳方法、翻訳装置及びコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US10902216B2 (ja) |
EP (1) | EP3282368A1 (ja) |
JP (1) | JP7066349B2 (ja) |
KR (1) | KR102565275B1 (ja) |
CN (1) | CN107729324A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020064624A (ja) * | 2018-10-16 | 2020-04-23 | 株式会社リコー | サブワード単位の分割方法、装置及びコンピュータ読み取り可能な記憶媒体 |
JP2021099797A (ja) * | 2019-12-20 | 2021-07-01 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 構文線形性に基づく言語変換方法および装置 |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10706351B2 (en) * | 2016-08-30 | 2020-07-07 | American Software Safety Reliability Company | Recurrent encoder and decoder |
JP6705506B2 (ja) * | 2016-10-04 | 2020-06-03 | 富士通株式会社 | 学習プログラム、情報処理装置および学習方法 |
WO2018083670A1 (en) * | 2016-11-04 | 2018-05-11 | Deepmind Technologies Limited | Sequence transduction neural networks |
JP6897168B2 (ja) * | 2017-03-06 | 2021-06-30 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
KR102509822B1 (ko) * | 2017-09-25 | 2023-03-14 | 삼성전자주식회사 | 문장 생성 방법 및 장치 |
CN108509411B (zh) * | 2017-10-10 | 2021-05-11 | 腾讯科技(深圳)有限公司 | 语义分析方法和装置 |
CN110472251B (zh) | 2018-05-10 | 2023-05-30 | 腾讯科技(深圳)有限公司 | 翻译模型训练的方法、语句翻译的方法、设备及存储介质 |
KR20200023664A (ko) * | 2018-08-14 | 2020-03-06 | 삼성전자주식회사 | 응답 추론 방법 및 장치 |
US20200090035A1 (en) * | 2018-09-19 | 2020-03-19 | International Business Machines Corporation | Encoder-decoder memory-augmented neural network architectures |
US11151334B2 (en) * | 2018-09-26 | 2021-10-19 | Huawei Technologies Co., Ltd. | Systems and methods for multilingual text generation field |
US11880748B2 (en) * | 2018-10-19 | 2024-01-23 | Sony Corporation | Information processing apparatus, information processing method, and information processing program |
RU2699396C1 (ru) * | 2018-11-19 | 2019-09-05 | Общество С Ограниченной Ответственностью "Инвек" | Нейронная сеть для интерпретирования предложений на естественном языке |
US11043214B1 (en) * | 2018-11-29 | 2021-06-22 | Amazon Technologies, Inc. | Speech recognition using dialog history |
US10963652B2 (en) * | 2018-12-11 | 2021-03-30 | Salesforce.Com, Inc. | Structured text translation |
CN111742364A (zh) * | 2018-12-14 | 2020-10-02 | 谷歌有限责任公司 | 用于联网系统的基于语音的接口 |
KR102545666B1 (ko) * | 2018-12-18 | 2023-06-21 | 삼성전자주식회사 | 페르소나에 기반하여 문장을 제공하는 방법 및 이를 지원하는 전자 장치 |
KR20200075615A (ko) | 2018-12-18 | 2020-06-26 | 삼성전자주식회사 | 기계 번역 방법 및 장치 |
CN111368558B (zh) * | 2018-12-25 | 2024-01-02 | Tcl科技集团股份有限公司 | 基于神经网络的实时翻译方法、智能终端及存储介质 |
CN115455988A (zh) * | 2018-12-29 | 2022-12-09 | 苏州七星天专利运营管理有限责任公司 | 一种高风险语句的处理方法和系统 |
CN109710953B (zh) * | 2018-12-29 | 2023-04-11 | 成都金山互动娱乐科技有限公司 | 一种翻译方法及装置、计算设备、存储介质和芯片 |
CN111476039B (zh) * | 2019-01-04 | 2023-06-30 | 深圳永德利科技股份有限公司 | 智能车载系统的即时语言翻译方法及相关产品 |
US11106873B2 (en) * | 2019-01-22 | 2021-08-31 | Sap Se | Context-based translation retrieval via multilingual space |
CN110162604B (zh) * | 2019-01-24 | 2023-09-12 | 腾讯科技(深圳)有限公司 | 语句生成方法、装置、设备及存储介质 |
CN111783435A (zh) * | 2019-03-18 | 2020-10-16 | 株式会社理光 | 共享词汇的选择方法、装置及存储介质 |
US20210209315A1 (en) * | 2019-03-29 | 2021-07-08 | Google Llc | Direct Speech-to-Speech Translation via Machine Learning |
CN110175335B (zh) * | 2019-05-08 | 2023-05-09 | 北京百度网讯科技有限公司 | 翻译模型的训练方法和装置 |
US11507760B2 (en) * | 2019-06-07 | 2022-11-22 | Semiconductor Energy Laboratory Co., Ltd. | Machine translation method, machine translation system, program, and non-transitory computer-readable storage medium |
CN110245363A (zh) * | 2019-06-24 | 2019-09-17 | 付金龙 | 翻译方法、翻译系统及使用该系统的翻译机 |
CN110457673B (zh) * | 2019-06-25 | 2023-12-19 | 北京奇艺世纪科技有限公司 | 一种自然语言转换为手语的方法及装置 |
CN110489762B (zh) * | 2019-06-26 | 2023-07-04 | 中译语通科技股份有限公司 | 基于神经网络机器翻译的术语翻译方法、存储介质和装置 |
KR20210037307A (ko) * | 2019-09-27 | 2021-04-06 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
CN112825109B (zh) * | 2019-11-20 | 2024-02-23 | 南京贝湾信息科技有限公司 | 一种句子对齐方法及计算设备 |
CN111753556B (zh) * | 2020-06-24 | 2022-01-04 | 掌阅科技股份有限公司 | 双语对照阅读的方法、终端及计算机存储介质 |
KR20220055954A (ko) * | 2020-10-27 | 2022-05-04 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN112257467B (zh) * | 2020-11-03 | 2023-06-30 | 沈阳雅译网络技术有限公司 | 一种面向gpu设备的神经机器翻译系统解码加速方法 |
US11769019B1 (en) * | 2020-11-19 | 2023-09-26 | Amazon Technologies, Inc. | Machine translation with adapted neural networks |
CN112686028B (zh) * | 2020-12-25 | 2021-09-03 | 掌阅科技股份有限公司 | 基于相似词的文本翻译方法、计算设备及计算机存储介质 |
WO2024106689A1 (ko) * | 2022-11-16 | 2024-05-23 | 삼성전자주식회사 | 전자 장치 및 기계 번역 방법 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004038406A (ja) * | 2002-07-01 | 2004-02-05 | Advanced Telecommunication Research Institute International | 複数個の翻訳結果から最良訳を選択する方法、最良訳を選択するための回帰木データを生成する方法、最良訳選択型の機械翻訳プログラム、回帰木生成プログラム、および回帰木データを記憶した記憶媒体 |
JP2005071291A (ja) * | 2003-08-28 | 2005-03-17 | Advanced Telecommunication Research Institute International | 換言装置及びコンピュータプログラム、文の対を準備する方法、及びリンクされたサブツリーを準備する方法 |
JP2007004730A (ja) * | 2005-06-27 | 2007-01-11 | Toshiba Corp | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
US20110131032A1 (en) * | 2009-12-02 | 2011-06-02 | Electronics And Telecommunications Research Institute | Hybrid translation apparatus and method thereof |
JP2012159969A (ja) * | 2011-01-31 | 2012-08-23 | Nec Corp | 機械翻訳装置、方法およびプログラム |
US20150356401A1 (en) * | 2014-06-06 | 2015-12-10 | Google Inc. | Generating representations of input sequences using neural networks |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2376335B (en) * | 2001-06-28 | 2003-07-23 | Vox Generation Ltd | Address recognition using an automatic speech recogniser |
AUPR956901A0 (en) | 2001-12-17 | 2002-01-24 | Jayaratne, Neville | Real time translator |
EP2527990B1 (en) | 2006-02-17 | 2020-01-15 | Google LLC | Using distributed models for machine translation |
CA2661535A1 (en) | 2006-08-18 | 2008-02-21 | National Research Council Of Canada | Means and method for training a statistical machine translation system |
US7881928B2 (en) * | 2006-09-01 | 2011-02-01 | International Business Machines Corporation | Enhanced linguistic transformation |
US8798988B1 (en) * | 2006-10-24 | 2014-08-05 | Google Inc. | Identifying related terms in different languages |
US8326598B1 (en) | 2007-03-26 | 2012-12-04 | Google Inc. | Consensus translations from multiple machine translation systems |
US8180624B2 (en) | 2007-09-05 | 2012-05-15 | Microsoft Corporation | Fast beam-search decoding for phrasal statistical machine translation |
US8150677B2 (en) | 2008-06-26 | 2012-04-03 | Microsoft Corporation | Machine translation using language order templates |
US8744834B2 (en) | 2008-07-03 | 2014-06-03 | Google Inc. | Optimizing parameters for machine translation |
KR100961717B1 (ko) | 2008-09-16 | 2010-06-10 | 한국전자통신연구원 | 병렬 코퍼스를 이용한 기계번역 오류 탐지 방법 및 장치 |
US8279861B2 (en) * | 2009-12-08 | 2012-10-02 | International Business Machines Corporation | Real-time VoIP communications using n-Way selective language processing |
US8914401B2 (en) | 2009-12-30 | 2014-12-16 | At&T Intellectual Property I, L.P. | System and method for an N-best list interface |
FI125823B (en) * | 2011-11-03 | 2016-02-29 | Rex Partners Oy | A measure of the quality of machine translation |
US8527276B1 (en) | 2012-10-25 | 2013-09-03 | Google Inc. | Speech synthesis using deep neural networks |
US8996352B2 (en) * | 2013-02-08 | 2015-03-31 | Machine Zone, Inc. | Systems and methods for correcting translations in multi-user multi-lingual communications |
JP6595979B2 (ja) * | 2013-03-15 | 2019-10-23 | ザ ダン アンド ブラッドストリート コーポレーション | 多言語ビジネスの指標のキュレーション及び翻字統合 |
US9858272B2 (en) * | 2014-02-16 | 2018-01-02 | International Business Machines Corporation | Context enriched application text translation |
KR101864361B1 (ko) | 2014-04-08 | 2018-06-04 | 네이버 주식회사 | 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템 |
US9652453B2 (en) * | 2014-04-14 | 2017-05-16 | Xerox Corporation | Estimation of parameters for machine translation without in-domain parallel data |
WO2016065327A1 (en) * | 2014-10-24 | 2016-04-28 | Google Inc. | Neural machine translation systems with rare word processing |
US9697201B2 (en) * | 2014-11-24 | 2017-07-04 | Microsoft Technology Licensing, Llc | Adapting machine translation data using damaging channel model |
KR101675092B1 (ko) | 2015-02-11 | 2016-11-10 | 김종우 | 잠재 고객에 대한 프로모션 제공 시스템, 방법 및 그 방법을 실행시키기 위한 컴퓨터로 읽을 수 있는 프로그램이 저장된 기록매체 |
-
2016
- 2016-08-10 KR KR1020160101726A patent/KR102565275B1/ko active IP Right Grant
-
2017
- 2017-03-06 US US15/450,333 patent/US10902216B2/en active Active
- 2017-05-17 CN CN201710347966.6A patent/CN107729324A/zh active Pending
- 2017-07-06 EP EP17180037.8A patent/EP3282368A1/en not_active Ceased
- 2017-08-01 JP JP2017148956A patent/JP7066349B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004038406A (ja) * | 2002-07-01 | 2004-02-05 | Advanced Telecommunication Research Institute International | 複数個の翻訳結果から最良訳を選択する方法、最良訳を選択するための回帰木データを生成する方法、最良訳選択型の機械翻訳プログラム、回帰木生成プログラム、および回帰木データを記憶した記憶媒体 |
JP2005071291A (ja) * | 2003-08-28 | 2005-03-17 | Advanced Telecommunication Research Institute International | 換言装置及びコンピュータプログラム、文の対を準備する方法、及びリンクされたサブツリーを準備する方法 |
JP2007004730A (ja) * | 2005-06-27 | 2007-01-11 | Toshiba Corp | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
US20110131032A1 (en) * | 2009-12-02 | 2011-06-02 | Electronics And Telecommunications Research Institute | Hybrid translation apparatus and method thereof |
JP2012159969A (ja) * | 2011-01-31 | 2012-08-23 | Nec Corp | 機械翻訳装置、方法およびプログラム |
US20150356401A1 (en) * | 2014-06-06 | 2015-12-10 | Google Inc. | Generating representations of input sequences using neural networks |
Non-Patent Citations (2)
Title |
---|
CHO, KYUNGHYUN ET.AL.: "On the Properties of Neural Machine Translation: Encoder-Decoder Approaches", [ONLINE], JPN6021030127, 7 October 2014 (2014-10-07), pages 1 - 9, ISSN: 0004564446 * |
SJTSKEVER, HYA ET.AL.: "Sequence to Sequence Learning with Neural Networks", [OLINE], JPN6021030126, 14 December 2014 (2014-12-14), pages 1 - 9, ISSN: 0004564447 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020064624A (ja) * | 2018-10-16 | 2020-04-23 | 株式会社リコー | サブワード単位の分割方法、装置及びコンピュータ読み取り可能な記憶媒体 |
JP2021099797A (ja) * | 2019-12-20 | 2021-07-01 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 構文線形性に基づく言語変換方法および装置 |
US11409968B2 (en) | 2019-12-20 | 2022-08-09 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Language conversion method and apparatus based on syntactic linearity, and non-transitory computer-readable storage medium |
JP7121106B2 (ja) | 2019-12-20 | 2022-08-17 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 構文線形性に基づく言語変換方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
EP3282368A1 (en) | 2018-02-14 |
KR20180017622A (ko) | 2018-02-21 |
US10902216B2 (en) | 2021-01-26 |
JP7066349B2 (ja) | 2022-05-13 |
KR102565275B1 (ko) | 2023-08-09 |
US20180046618A1 (en) | 2018-02-15 |
CN107729324A (zh) | 2018-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7066349B2 (ja) | 翻訳方法、翻訳装置及びコンピュータプログラム | |
JP6923332B2 (ja) | 自動通訳方法及び装置 | |
JP6802005B2 (ja) | 音声認識装置、音声認識方法及び音声認識システム | |
US11373049B2 (en) | Cross-lingual classification using multilingual neural machine translation | |
JP7170920B2 (ja) | トリガードアテンションを用いたエンドツーエンド音声認識のためのシステムおよび方法 | |
JP7051919B2 (ja) | ストリーミングアテンションモデルに基づく音声認識復号化方法、装置、機器及びコンピュータ可読記憶媒体 | |
JP2016110082A (ja) | 言語モデル学習方法及び装置、音声認識方法及び装置 | |
JP7351018B2 (ja) | エンド・ツー・エンド音声認識における固有名詞認識 | |
JP2024019405A (ja) | 2パスエンドツーエンド音声認識 | |
JP2023545988A (ja) | トランスフォーマトランスデューサ:ストリーミング音声認識と非ストリーミング音声認識を統合する1つのモデル | |
US20230368796A1 (en) | Speech processing | |
JP2023175029A (ja) | アテンションベースのジョイント音響およびテキストのオンデバイス・エンド・ツー・エンドモデル | |
US11626107B1 (en) | Natural language processing | |
CN117043856A (zh) | 高效流式非递归设备上的端到端模型 | |
US11393454B1 (en) | Goal-oriented dialog generation using dialog template, API, and entity data | |
JP2024512606A (ja) | 自己アライメントを用いたストリーミングasrモデル遅延の短縮 | |
US11804225B1 (en) | Dialog management system | |
KR20230156795A (ko) | 단어 분할 규칙화 | |
KR20240022598A (ko) | 셀프 지도 스피치 사전 트레이닝에서 텍스트 삽입하기 | |
JP2022064779A (ja) | 学習装置、予測装置、学習方法および学習プログラム | |
CN117316139A (zh) | 训练语音合成模型及语音合成的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200715 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210803 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7066349 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |