JP2023509405A - 翻訳方法、装置、電子機器及びコンピュータプログラム - Google Patents
翻訳方法、装置、電子機器及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2023509405A JP2023509405A JP2022539180A JP2022539180A JP2023509405A JP 2023509405 A JP2023509405 A JP 2023509405A JP 2022539180 A JP2022539180 A JP 2022539180A JP 2022539180 A JP2022539180 A JP 2022539180A JP 2023509405 A JP2023509405 A JP 2023509405A
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- translation
- sub
- translated
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 498
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000004590 computer program Methods 0.000 title claims description 9
- 238000012549 training Methods 0.000 claims description 52
- 238000012217 deletion Methods 0.000 claims description 21
- 230000037430 deletion Effects 0.000 claims description 21
- 238000003062 neural network model Methods 0.000 claims description 15
- 238000012937 correction Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 2
- 230000014616 translation Effects 0.000 description 417
- 230000008569 process Effects 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 14
- 238000013473 artificial intelligence Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
Description
本願は、2020年05月25日に中国特許庁に提出され、出願番号が202010450957.1であり、出願の名称が「翻訳方法、装置、電子機器及びコンピュータ可読記憶媒体」である中国特許出願の優先権を主張する。
本出願は、言語翻訳処理技術分野に関し、具体的には、本出願は、翻訳方法、装置、電子機器及びコンピュータ可読記憶媒体に関する。
翻訳対象文句を取得するステップと、
予め設定された数に基づき、前記翻訳対象文句を区分し、前記予め設定された数のサブ文句を獲得するステップと、
各サブ文句をそれぞれ翻訳し、各サブ文句に対応する翻訳結果を獲得するステップと、
意味に基づいて各サブ文句に対応する翻訳結果を融合させ、前記翻訳対象文句に対応するターゲット翻訳文句を獲得するステップと、を含む。
翻訳対象文句を取得するための翻訳対象文句取得モジュールと、
予め設定された数に基づき、前記翻訳対象文句を区分し、前記予め設定された数のサブ文句を獲得するためのサブ文句決定モジュールと、
各サブ文句をそれぞれ翻訳し、各サブ文句に対応する翻訳結果を獲得するための翻訳モジュールと、
意味に基づいて各サブ文句に対応する翻訳結果を融合させ、前記翻訳対象文句に対応するターゲット翻訳文句を獲得するためのターゲット翻訳文句決定モジュールと、を含む。
予め設定された数と翻訳対象文句の文句の長さに基づき、各サブ文句における第一の設定割合を満たす第一のサブ文句の文句の長さを第一の長さに設置し、各サブ文句における第二の設定割合を満たす第二のサブ文句の文句の長さを第二の長さに設置することによって各サブ文句に対応する文句の長さを決定してもよい。
候補翻訳単語セットから各サブ文句に対応する翻訳結果を獲得するステップを含む。
候補翻訳単語セットから該サブ文句における各単語に対応する候補翻訳単語を決定し、
決定された各候補翻訳単語と翻訳終了識別子に基づき、該サブ文句に対応する文句の長さを決定することによって決定されたものである。
候補翻訳単語セットから各サブ文句に対応する翻訳結果を獲得するステップは、
いずれか一つのサブ文句に対して、候補翻訳単語セットから該サブ文句における各翻訳対象単語に対応する候補翻訳単語を決定するステップと、
候補翻訳単語が翻訳開始識別子である場合、該サブ文句に対する翻訳を開始するステップと、
候補翻訳単語が翻訳開始識別子でなく、且つ翻訳終了識別子でない場合、候補翻訳単語が翻訳終了識別子であるまで該サブ文句を翻訳し続け、該サブ文句に対する翻訳を終了し、該サブ文句に対応する翻訳結果を獲得するステップと、を含む。
各サブ文句をそれぞれ翻訳し、各サブ文句に対応する初歩的な翻訳結果を獲得するステップと、
各初歩的な翻訳結果のうちのいずれか一つの初歩的な翻訳結果に翻訳エラーがある場合、翻訳エラーがある初歩的な翻訳結果に対してエラー修正を行い、修正後の初歩的な翻訳結果と他の未修正の初歩的な翻訳結果に基づき、各サブ文句に対応する翻訳結果を獲得するステップとを含む。
いずれか一つのサブ文句に対して、該サブ文句に対応する初歩的な翻訳結果における各単語に基づき、該サブ文句に翻訳エラーがあるか否かを決定するステップ、
及び/又は、
各サブ文句のうちのいずれか二つの隣接するサブ文句に対して、前記二つの隣接するサブ文句のうちの一番目のサブ文句に対応する初歩的な翻訳結果における最後の単語と前記二つの隣接するサブ文句のうちの二番目のサブ文句に対応する初歩的な翻訳結果における一番目の単語に基づき、前記二つの隣接するサブ文句に前記翻訳エラーがあるか否かを決定するステップをさらに含む。
漏れ単語を翻訳するステップを含み、
翻訳エラーが重複翻訳単語を含む場合、翻訳エラーがある初歩的な翻訳結果に対してエラー修正を行うステップは、
翻訳エラーがある初歩的な翻訳結果から、重複翻訳単語を削除するステップを含む。
翻訳エラーがある初歩的な翻訳結果から、削除識別子に対応する重複翻訳単語を削除するステップを含む。
各トレーニングサンプルを取得し、前記トレーニングサンプルにはサンプルの翻訳対象文句と前記サンプルの翻訳対象文句に対応するサンプル翻訳文句とが含まれ、前記サンプル翻訳文句にはサンプルサブ文句数に応じて前記サンプル翻訳文句を区分して獲得された各サブサンプル文句が含まれ、各サブサンプル文句にタグが付帯されており、前記タグは、前記サブサンプル文句に対応するサンプルの翻訳対象文句の翻訳タグ結果を特徴づけていること、
各トレーニングサンプルに基づき、初期ニューラルネットワークモデルの損失関数が収束されるまで前記初期ニューラルネットワークモデルをトレーニングし、トレーニング終了時の初期ニューラルネットワークモデルを前記翻訳モデルとすることによってトレーニングして獲得されたものである。
サンプル翻訳文句をサンプルサブ文句数よりも小さい第一の数のサブ文句に分割すること、
第一の数のサブ文句のうちの少なくとも一つのサブ文句を対応し、重複翻訳単語として決定すること、
重複翻訳単語をサンプル翻訳文句に插入し、重複翻訳単語を含むサンプル翻訳文句を獲得することによって決定されて得られたものである。
離散型確率分布、サンプル翻訳文句の文句の長さ、サンプルサブ文句数及び分割方式に基づき、分割方式に対応する選択概率を決定することであって、ランダム分割方式と均一等分分割方式の二種類の分割方式があってもよいこと、
分割方式に対応する選択概率とサンプル翻訳文句の文句の長さに基づき、各サブサンプル文句のサンプル長さを決定することによって決定されたものである。
(1)
(2)
(3)
(1)
(2)
(3)
翻訳対象文句取得モジュール210は、翻訳対象文句を取得するために用いられ、
サブ文句決定モジュール220は、予め設定された数に基づき、翻訳対象文句を区分し、予め設定された数のサブ文句を獲得するために用いられ、
翻訳モジュール230は、各サブ文句をそれぞれ翻訳し、各サブ文句に対応する翻訳結果を獲得するために用いられ、
ターゲット翻訳文句決定モジュール240は、意味に基づいて各サブ文句に対応する翻訳結果を融合させ、翻訳対象文句に対応するターゲット翻訳文句を獲得するために用いられる。
予め設定された数と翻訳対象文句の文句の長さに基づき、各サブ文句における第一の設定割合を満たす第一のサブ文句の文句の長さを第一の長さに設置し、各サブ文句における第二の設定割合を満たす第二のサブ文句の文句の長さを第二の長さに設置することをさらに含み、
ここで、第一の設定割合と第二の設定割合の和は、1である。
候補翻訳単語セットから各サブ文句に対応する翻訳結果を獲得するために用いられる。
候補翻訳単語セットから該サブ文句における各単語に対応する候補翻訳単語を決定すること、
決定した各候補翻訳単語と翻訳終了識別子に基づき、該サブ文句に対応する文句の長さを決定することによって決定されたものである。
いずれか一つのサブ文句に対して、候補翻訳単語セットから該サブ文句における各翻訳対象単語に対応する候補翻訳単語を決定すること、
候補翻訳単語が翻訳開始識別子である場合、該サブ文句に対する翻訳を開始すること、
候補翻訳単語が翻訳開始識別子でなく、且つ翻訳終了識別子でない場合、候補翻訳単語が翻訳終了識別子であるまで該サブ文句を翻訳し続け、該サブ文句に対する翻訳を終了し、該サブ文句に対応する翻訳結果を獲得することに用いられる。
各サブ文句をそれぞれ翻訳し、各サブ文句に対応する初歩的な翻訳結果を獲得すること、
各初歩的な翻訳結果のうちのいずれか一つの初歩的な翻訳結果に翻訳エラーがある場合、翻訳エラーがある初歩的な翻訳結果に対してエラー修正を行い、修正後の初歩的な翻訳結果と他の未修正の初歩的な翻訳結果に基づき、各サブ文句に対応する翻訳結果を獲得することに用いられる。
及び/又は、
翻訳エラー決定モジュールは、各サブ文句のうちのいずれか二つの隣接するサブ文句に対して、前記二つの隣接するサブ文句のうちの一番目のサブ文句に対応する初歩的な翻訳結果における最後の単語と前記二つの隣接するサブ文句のうちの二番目のサブ文句に対応する初歩的な翻訳結果における一番目の単語に基づき、前記二つの隣接するサブ文句に前記翻訳エラーがあるか否かを決定するために用いられる。
翻訳エラーがある初歩的な翻訳結果から、重複翻訳単語を削除するために用いられる。
翻訳エラーがある初歩的な翻訳結果から、削除識別子に対応する重複翻訳単語を削除するために用いられる。
各トレーニングサンプルを取得し、前記トレーニングサンプルにはサンプルの翻訳対象文句と前記サンプルの翻訳対象文句に対応するサンプル翻訳文句とが含まれ、前記サンプル翻訳文句にはサンプルサブ文句数に応じて前記サンプル翻訳文句を区分して得た各サブサンプル文句が含まれ、各サブサンプル文句にタグが付帯されており、前記タグは、前記サブサンプル文句に対応するサンプルの翻訳対象文句の翻訳タグ結果を特徴づけていること、
各トレーニングサンプルに基づき、初期ニューラルネットワークモデルの損失関数が収束されるまで前記初期ニューラルネットワークモデルをトレーニングし、トレーニング終了時の初期ニューラルネットワークモデルを前記翻訳モデルとすることによってトレーニングして得たものである。
離散型確率分布、前記サンプル翻訳文句の文句の長さ、前記サンプルサブ文句数と分割方式に基づき、前記分割方式に対応する選択概率を決定すること、
前記分割方式に対応する選択概率と前記サンプル翻訳文句の文句の長さに基づき、各サブサンプル文句のサンプル長さを決定することによって決定されたものである。
サンプル翻訳文句をサンプルサブ文句数よりも小さい第一の数のサブ文句に分割すること、
第一の数のサブ文句のうちの少なくとも一つのサブ文句を、重複翻訳単語として決定すること、
重複翻訳単語をサンプル翻訳文句に插入し、重複翻訳単語を含むサンプル翻訳文句を獲得することによって決定されて得られたものである。
Claims (19)
- 電子機器により実行される翻訳方法であって、
翻訳対象文句を取得するステップと、
予め設定された数に基づき、前記翻訳対象文句を区分し、前記予め設定された数のサブ文句を獲得するステップと、
各サブ文句をそれぞれ翻訳し、各サブ文句に対応する翻訳結果を獲得するステップと、
意味に基づいて各サブ文句に対応する翻訳結果を融合させ、前記翻訳対象文句に対応するターゲット翻訳文句を獲得するステップとを含む、ことを特徴とする翻訳方法。 - 各サブ文句のうちの少なくとも二つのサブ文句に対応する文句の長さは異なり、前記文句の長さは、該当するサブ文句に含まれる単語の数を特徴づけている、請求項1に記載の方法。
- 前記予め設定された数と前記翻訳対象文句の文句の長さに基づき、各サブ文句における第一の設定割合を満たす第一のサブ文句の文句の長さを第一の長さに設置するステップと、各サブ文句における第二の設定割合を満たす第二のサブ文句の文句の長さを第二の長さに設置するステップとをさらに含み、
前記第一の設定割合と前記第二の設定割合の和は、1である、請求項2に記載の方法。 - 各サブ文句をそれぞれ翻訳し、各サブ文句に対応する翻訳結果を獲得する前記ステップは、
候補翻訳単語セットから各サブ文句に対応する翻訳結果を獲得するステップを含む、請求項1から3のいずれか1項に記載の方法。 - 前記候補翻訳単語セットには翻訳終了識別子が含まれ、前記方法は、
いずれか一つのサブ文句に対して、
前記候補翻訳単語セットから該サブ文句における各単語に対応する候補翻訳単語を決定し、
決定された各候補翻訳単語と前記翻訳終了識別子に基づき、該サブ文句に対応する文句の長さを決定することによって該サブ文句に対応する文句の長さを決定することをさらに含む、請求項4に記載の方法。 - 前記候補翻訳単語セットには翻訳開始識別子と翻訳終了識別子とが含まれ、
候補翻訳単語セットから各サブ文句に対応する翻訳結果を獲得する前記ステップは、
いずれか一つのサブ文句に対して、前記候補翻訳単語セットから該サブ文句における各翻訳対象単語に対応する候補翻訳単語を決定するステップと、
前記候補翻訳単語が前記翻訳開始識別子である場合、該サブ文句に対する翻訳を開始するステップと、
前記候補翻訳単語が前記翻訳開始識別子でなく、且つ前記翻訳終了識別子でない場合、前記候補翻訳単語が前記翻訳終了識別子であるまで該サブ文句を翻訳し続け、該サブ文句に対する翻訳を終了し、該サブ文句に対応する翻訳結果を獲得するステップと、を含む、請求項4に記載の方法。 - 各サブ文句をそれぞれ翻訳し、各サブ文句に対応する翻訳結果を獲得する前記ステップは、
各サブ文句をそれぞれ翻訳し、各サブ文句に対応する初歩的な翻訳結果を獲得するステップと、
各初歩的な翻訳結果のうちのいずれか一つの初歩的な翻訳結果に翻訳エラーがある場合、翻訳エラーがある初歩的な翻訳結果に対してエラー修正を行い、修正後の初歩的な翻訳結果と他の未修正の初歩的な翻訳結果に基づき、各サブ文句に対応する翻訳結果を獲得するステップと、を含む、請求項1から3のいずれか1項に記載の方法。 - 前記翻訳エラーは、漏れ単語又は重複翻訳単語のうちの少なくとも一つを含み、前記方法は、
いずれか一つのサブ文句に対して、該サブ文句に対応する初歩的な翻訳結果における各単語に基づき、該サブ文句に前記翻訳エラーがあるか否かを決定するステップをさらに含む、請求項7に記載の方法。 - 前記翻訳エラーは、漏れ単語又は重複翻訳単語のうちの少なくとも一つを含み、前記方法は、
各サブ文句のうちのいずれか二つの隣接するサブ文句に対して、前記二つの隣接するサブ文句のうちの一番目のサブ文句に対応する初歩的な翻訳結果における最後の単語と前記二つの隣接するサブ文句のうちの二番目のサブ文句に対応する初歩的な翻訳結果における一番目の単語に基づき、前記二つの隣接するサブ文句に前記翻訳エラーがあるか否かを決定するステップをさらに含む、請求項7に記載の方法。 - 前記翻訳エラーが漏れ単語を含む場合、翻訳エラーがある初歩的な翻訳結果に対してエラー修正を行う前記ステップは、
前記漏れ単語を翻訳するステップを含む、請求項7に記載の方法。 - 前記翻訳エラーが重複翻訳単語を含む場合、翻訳エラーがある初歩的な翻訳結果に対してエラー修正を行う前記ステップは、
前記翻訳エラーがある初歩的な翻訳結果から、前記重複翻訳単語を削除するステップを含む、請求項7に記載の方法。 - 各サブ文句に対応する翻訳結果は、候補翻訳単語セットから決定されたものであり、前記候補翻訳単語セットには削除識別子が含まれ、前記削除識別子は、対応するサブ文句の翻訳結果が重複翻訳単語であることを標識するために用いられ、
前記翻訳エラーがある初歩的な翻訳結果から、前記重複翻訳単語を削除する前記ステップは、
前記翻訳エラーがある初歩的な翻訳結果から、前記削除識別子に対応する重複翻訳単語を削除するステップを含む、請求項11に記載の方法。 - 予め設定された数に基づき、前記翻訳対象文句を区分し、前記予め設定された数のサブ文句を獲得する前記ステップ、及び各サブ文句をそれぞれ翻訳し、各サブ文句に対応する翻訳結果を獲得する前記ステップは、翻訳モデルによって獲得されたものである、請求項1から3のいずれか1項に記載の方法。
- 各トレーニングサンプルを取得し、前記トレーニングサンプルにはサンプルの翻訳対象文句と前記サンプルの翻訳対象文句に対応するサンプル翻訳文句とが含まれ、前記サンプル翻訳文句にはサンプルサブ文句数に応じて前記サンプル翻訳文句を区分して獲得された各サブサンプル文句が含まれ、各サブサンプル文句にタグが付帯されており、前記タグは、前記サブサンプル文句に対応するサンプルの翻訳対象文句の翻訳タグ結果を特徴づけていることと、
各トレーニングサンプルに基づき、初期ニューラルネットワークモデルの損失関数が収束されるまで前記初期ニューラルネットワークモデルをトレーニングし、トレーニング終了時の初期ニューラルネットワークモデルを前記翻訳モデルとすることとによってトレーニングされて前記翻訳モデルを獲得するステップをさらに含む、請求項13に記載の方法。 - いずれか一つのトレーニングサンプルに対して、
離散型確率分布、前記サンプル翻訳文句の文句の長さ、前記サンプルサブ文句数及び分割方式に基づき、前記分割方式に対応する選択概率を決定し、
前記分割方式に対応する選択概率と前記サンプル翻訳文句の文句の長さに基づき、各サブサンプル文句のサンプル長さを決定することによって該トレーニングサンプルにおける各サブサンプル文句のサンプル長さを決定するステップをさらに含む、請求項14に記載の方法。 - いずれか一つのトレーニングサンプルは、前記トレーニングサンプルに、重複翻訳単語を含むサンプル翻訳文句がさらに含まれ、前記方法は、
前記サンプル翻訳文句を前記サンプルサブ文句数よりも小さい第一の数のサブ文句に分割すること、
前記第一の数のサブ文句のうちの少なくとも一つのサブ文句を、前記重複翻訳単語として決定すること、
前記重複翻訳単語を前記サンプル翻訳文句に插入し、前記重複翻訳単語を含むサンプル翻訳文句を獲得することによって前記重複翻訳単語を含むサンプル翻訳文句を決定することをさらに含む、請求項14に記載の方法。 - 翻訳装置であって、
翻訳対象文句を取得するための翻訳対象文句取得モジュールと、
予め設定された数に基づき、前記翻訳対象文句を区分し、前記予め設定された数のサブ文句を獲得するためのサブ文句決定モジュールと、
各サブ文句をそれぞれ翻訳し、各サブ文句に対応する翻訳結果を獲得するための翻訳モジュールと、
意味に基づいて各サブ文句に対応する翻訳結果を融合させ、前記翻訳対象文句に対応するターゲット翻訳文句を獲得するためのターゲット翻訳文句決定モジュールと、を含む、ことを特徴とする翻訳装置。 - メモリとプロセッサとを含む電子機器であって、
前記メモリには、コンピュータプログラムが記憶されており、
前記プロセッサは、前記コンピュータプログラムを実行して請求項1から16のいずれか1項に記載の方法を実現する、ことを特徴とする電子機器。 - コンピュータプログラムであって、前記コンピュータプログラムがプロセッサにより実行されると、請求項1から16のいずれか1項に記載の方法を実現する、ことを特徴とするコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010450957.1A CN111611811B (zh) | 2020-05-25 | 2020-05-25 | 翻译方法、装置、电子设备及计算机可读存储介质 |
CN202010450957.1 | 2020-05-25 | ||
PCT/CN2021/091997 WO2021238604A1 (zh) | 2020-05-25 | 2021-05-07 | 翻译方法、装置、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023509405A true JP2023509405A (ja) | 2023-03-08 |
JP7457125B2 JP7457125B2 (ja) | 2024-03-27 |
Family
ID=72203018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022539180A Active JP7457125B2 (ja) | 2020-05-25 | 2021-05-07 | 翻訳方法、装置、電子機器及びコンピュータプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220222447A1 (ja) |
JP (1) | JP7457125B2 (ja) |
CN (1) | CN111611811B (ja) |
WO (1) | WO2021238604A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111611811B (zh) * | 2020-05-25 | 2023-01-13 | 腾讯科技(深圳)有限公司 | 翻译方法、装置、电子设备及计算机可读存储介质 |
CN112052693B (zh) * | 2020-09-15 | 2024-07-05 | 科大讯飞股份有限公司 | 机器翻译效果评测方法、装置、设备及存储介质 |
CN112735417B (zh) * | 2020-12-29 | 2024-04-26 | 中国科学技术大学 | 语音翻译方法、电子设备、计算机可读存储介质 |
CN112784613A (zh) * | 2021-01-29 | 2021-05-11 | 语联网(武汉)信息技术有限公司 | 文档批量翻译方法、装置、电子设备及存储介质 |
CN114330311A (zh) * | 2021-12-30 | 2022-04-12 | 安徽听见科技有限公司 | 一种翻译方法、装置、电子设备和计算机可读存储介质 |
US11704507B1 (en) * | 2022-10-31 | 2023-07-18 | Kudo, Inc. | Systems and methods for automatic speech translation |
CN116882423B (zh) * | 2023-09-06 | 2023-11-17 | 中国科学院自动化研究所 | 文本翻译方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102467498A (zh) * | 2010-11-18 | 2012-05-23 | 阿里巴巴集团控股有限公司 | 翻译方法及装置 |
JP2015069359A (ja) * | 2013-09-27 | 2015-04-13 | 日本放送協会 | 翻訳装置及び翻訳プログラム |
CN105912533A (zh) * | 2016-04-12 | 2016-08-31 | 苏州大学 | 面向神经机器翻译的长句切分方法及装置 |
US20170031901A1 (en) * | 2015-07-30 | 2017-02-02 | Alibaba Group Holding Limited | Method and Device for Machine Translation |
CN110334360A (zh) * | 2019-07-08 | 2019-10-15 | 腾讯科技(深圳)有限公司 | 机器翻译方法及装置、电子设备及存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6161083A (en) * | 1996-05-02 | 2000-12-12 | Sony Corporation | Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation |
JP4050950B2 (ja) * | 2002-07-26 | 2008-02-20 | 富士通株式会社 | 対訳候補表示装置および対訳候補表示プログラム |
US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases |
JP5011751B2 (ja) * | 2006-02-27 | 2012-08-29 | 富士通株式会社 | 訳語情報出力処理プログラム,処理方法および処理装置 |
CN101458681A (zh) * | 2007-12-10 | 2009-06-17 | 株式会社东芝 | 语音翻译方法和语音翻译装置 |
US8914277B1 (en) * | 2011-09-20 | 2014-12-16 | Nuance Communications, Inc. | Speech and language translation of an utterance |
CN104750687B (zh) * | 2013-12-25 | 2018-03-20 | 株式会社东芝 | 改进双语语料库的方法及装置、机器翻译方法及装置 |
CN105320650B (zh) * | 2014-07-31 | 2019-03-26 | 崔晓光 | 一种基于语料匹配和语法分析的机器翻译方法及其系统 |
CN108153743B (zh) * | 2018-01-23 | 2021-12-17 | 甲骨易(北京)语言科技股份有限公司 | 基于相似度的智能离线翻译机 |
CN108874791B (zh) * | 2018-07-06 | 2022-05-24 | 北京联合大学 | 一种基于最小语义块的语义分析与汉英调序方法及系统 |
CN109408833A (zh) * | 2018-10-30 | 2019-03-01 | 科大讯飞股份有限公司 | 一种翻译方法、装置、设备及可读存储介质 |
US10872208B2 (en) * | 2018-12-20 | 2020-12-22 | Rakuten, Inc. | Sentence conversion system, sentence conversion method, and information storage medium |
CN110298045B (zh) * | 2019-05-31 | 2023-03-24 | 北京百度网讯科技有限公司 | 机器翻译方法、装置、设备及存储介质 |
CN110852117B (zh) * | 2019-11-08 | 2023-02-24 | 沈阳雅译网络技术有限公司 | 一种提升神经机器翻译效果的有效数据增强方法 |
CN111611811B (zh) * | 2020-05-25 | 2023-01-13 | 腾讯科技(深圳)有限公司 | 翻译方法、装置、电子设备及计算机可读存储介质 |
-
2020
- 2020-05-25 CN CN202010450957.1A patent/CN111611811B/zh active Active
-
2021
- 2021-05-07 JP JP2022539180A patent/JP7457125B2/ja active Active
- 2021-05-07 WO PCT/CN2021/091997 patent/WO2021238604A1/zh active Application Filing
-
2022
- 2022-03-31 US US17/710,933 patent/US20220222447A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102467498A (zh) * | 2010-11-18 | 2012-05-23 | 阿里巴巴集团控股有限公司 | 翻译方法及装置 |
JP2015069359A (ja) * | 2013-09-27 | 2015-04-13 | 日本放送協会 | 翻訳装置及び翻訳プログラム |
US20170031901A1 (en) * | 2015-07-30 | 2017-02-02 | Alibaba Group Holding Limited | Method and Device for Machine Translation |
CN105912533A (zh) * | 2016-04-12 | 2016-08-31 | 苏州大学 | 面向神经机器翻译的长句切分方法及装置 |
CN110334360A (zh) * | 2019-07-08 | 2019-10-15 | 腾讯科技(深圳)有限公司 | 机器翻译方法及装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP7457125B2 (ja) | 2024-03-27 |
CN111611811B (zh) | 2023-01-13 |
CN111611811A (zh) | 2020-09-01 |
WO2021238604A1 (zh) | 2021-12-02 |
US20220222447A1 (en) | 2022-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023509405A (ja) | 翻訳方法、装置、電子機器及びコンピュータプログラム | |
US10997503B2 (en) | Computationally efficient neural network architecture search | |
CN110363810B (zh) | 建立图像检测模型的方法、装置、设备和计算机存储介质 | |
CN110705214B (zh) | 一种自动编码方法及装置 | |
WO2022218186A1 (zh) | 个性化知识图谱的生成方法、装置及计算机设备 | |
CN109635197B (zh) | 搜索方法、装置、电子设备及存储介质 | |
WO2022153722A1 (en) | Systems and methods for semi-supervised extraction of text classification information | |
CN113408268B (zh) | 槽位填充方法、装置、设备及存储介质 | |
CN113870395A (zh) | 动画视频生成方法、装置、设备及存储介质 | |
CN113656547B (zh) | 文本匹配方法、装置、设备及存储介质 | |
CN114547267A (zh) | 智能问答模型的生成方法、装置、计算设备和存储介质 | |
CN115309910B (zh) | 语篇要素和要素关系联合抽取方法、知识图谱构建方法 | |
CN110929532B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN115222443A (zh) | 客户群体划分方法、装置、设备及存储介质 | |
CN113591881A (zh) | 基于模型融合的意图识别方法、装置、电子设备及介质 | |
CN109902309B (zh) | 翻译方法、装置、设备和存储介质 | |
CN113420545B (zh) | 摘要生成方法、装置、设备及存储介质 | |
CN114936564A (zh) | 一种基于对齐变分自编码的多语言语义匹配方法及系统 | |
US20220300836A1 (en) | Machine Learning Techniques for Generating Visualization Recommendations | |
CN114942749A (zh) | 审批系统开发方法、装置、设备及存储介质 | |
CN113486680A (zh) | 文本翻译方法、装置、设备及存储介质 | |
JP2022041800A (ja) | 多言語文埋め込みのためのシステム及び方法 | |
CN113705692A (zh) | 基于人工智能的情感分类方法、装置、电子设备及介质 | |
KR20210067294A (ko) | 자동 번역 장치 및 그 방법 | |
CN111815631B (zh) | 模型生成方法、装置、设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7457125 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |