JP2023073951A

JP2023073951A - 翻訳方法、モデル訓練方法、装置、電子デバイス及び記憶媒体

Info

Publication number: JP2023073951A
Application number: JP2022116365A
Authority: JP
Inventors: ジャン、ルイキン; Ruiqing Zhang; ワン、シヤン; Xiyang Wang; リウ、フイ; Hui Liu; ヘ、ジョンジュン; Zhongjun He; リ、ジ; Zhi Li; ウ、フア; Hua Wu
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-11-16
Filing date: 2022-07-21
Publication date: 2023-05-26
Anticipated expiration: 2042-07-21
Also published as: CN114239608B; JP7472421B2; CN114239608A; US20230153543A1

Abstract

【課題】翻訳の正確性を効果的に向上させる翻訳方法、モデル訓練方法、装置、電子デバイス及び記憶媒体を提供する。【解決手段】方法は、翻訳すべき特定文と予め訓練された重み付けモデルとに基づいて、予め訓練された少なくとも２つの翻訳モデルのそれぞれが前記特定文を翻訳することに対応する重みを取得し、各前記翻訳モデルが前記特定文を翻訳する重みに基づいて、前記少なくとも２つの翻訳モデルを用いて前記特定文を翻訳する。【選択図】図２

Description

本開示は、コンピュータ技術の分野に関し、具体的には、機械学習及び情報処理のような人工知能技術の分野に関し、特に、翻訳方法、モデル訓練方法、装置、電子デバイス、及び記憶媒体に関する。

翻訳は非常に技術的で専門性の高い仕事である。従来技術では、翻訳は専門の翻訳者に依頼されている。

近年の人工知能の発展により、人工知能による翻訳モデルは翻訳の効率を飛躍的に向上させることができるようになった。翻訳モデルはニューラルネットワークモデルを用いて実現することができる。使用時には、人工で注釈された訓練データを用いて翻訳モデルに教師あり訓練を行うことができる。使用時には、翻訳すべき文を翻訳モデルに入力する。当該翻訳モデルは翻訳された文を出力可能とする。

本発明は、翻訳方法、モデル訓練方法、装置、電子デバイス及び記憶媒体を提供する。

本開示の一態様によれば、翻訳すべき特定文と予め訓練された重み付けモデルとに基づいて、予め訓練された少なくとも２つの翻訳モデルのそれぞれが前記特定文を翻訳することに対応する重みを取得し、各前記翻訳モデルが前記特定文を翻訳する重みに基づいて、前記少なくとも２つの翻訳モデルを用いて前記特定文を翻訳することを含む翻訳方法が提供される。

本開示の別の態様によれば、訓練文を収集し、前記訓練文と、予め訓練された少なくとも２つの翻訳モデルと、予め設定されたランダム重み分配器とに基づいて重み付けモデルを訓練することを含むモデル訓練方法が提供される。

本開示の別の態様によれば、翻訳すべき特定文と予め訓練された重み付けモデルとに基づいて、予め訓練された少なくとも２つの翻訳モデルのそれぞれが前記特定文を翻訳することに対応する重みを取得する重み取得モジュールと、各前記翻訳モデルが前記特定文を翻訳する重みに基づいて、前記少なくとも２つの翻訳モデルを用いて前記特定文を翻訳する翻訳モジュールとを備える翻訳装置が提供される。

本開示の別の態様によれば、訓練文を収集する収集モジュールと、前記訓練文、予め訓練された少なくとも２つの翻訳モデル、及び予め設定されたランダム重み分配器に基づいて、重み付けモデルを訓練する訓練モジュールとを備えるモデル訓練装置が提供される。

本開示の別の態様によれば、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信可能に接続されたメモリとを備え、前記メモリに前記少なくとも１つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも１つのプロセッサにより実行されると、前記少なくとも１つのプロセッサに上述した態様及び可能な実現方式のいずれか一つを実行させる電子デバイスが提供される。

本開示の別の態様によれば、コンピュータに上述した態様及び可能な実現方式のいずれか一つを実行させるためのコンピュータコマンドを格納した非一時的なコンピュータ可読記憶媒体が提供される。

本開示の別の態様によれば、プロセッサにより実行されると、上述した態様及び可能な実現方式のいずれか一つを実現するコンピュータプログラムを含むコンピュータプログラム製品が提供される。

本開示の技術によれば、翻訳の精度を効果的に向上させることができる。

理解すべきなのは、本セクションで説明される内容は、本開示の実施形態の重要な又は肝心な特徴を標識することでもなく、本開示の範囲を制限することでもない。本開示の他の特徴は、以下の明細書により容易に理解されるであろう。

図面は、本技術案をより良く理解するためのものであり、本願に制限されない。図面において、
本開示により提供される機械翻訳の概略図である。本開示による第１実施形態の概略図である。本開示による第２実施形態の概略図である。本実施形態により提供される翻訳方法の構成図である。本開示による第３実施形態の概略図である。本開示による第４実施形態の概略図である。本実施形態により提供されるモデル訓練方法の構成図である。本実施形態により提供される重み付けモデルの原理図である。本開示による第５実施形態の概略図である。本開示による第６実施形態の概略図である。本開示の実施形態に係る上述した方法を実施するための電子デバイスのブロック図である。

以下、図面に基づいて、本出願の例示的な実施例を説明する。理解を容易にするために、本出願の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本出願の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。

明らかに、記載された実施形態は、本開示の一部の実施形態であり、全ての実施形態ではない。本開示の実施形態に基づいて、当業者が創造的な労働をしていないという前提の下で得た他のすべての実施形態は、本開示の保護の範囲に属する。

説明すべきなのは、本開示の実施形態に係る端末装置は、携帯電話、携帯情報端末（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ、ＰＤＡ）、無線ハンドヘルドデバイス、タブレット（ＴａｂｌｅｔＣｏｍｐｕｔｅｒ）などのスマートデバイスを含むことができるが、これらに限定されない。表示装置は、パーソナルコンピュータ、テレビ等の表示機能を有する装置を含むことができるが、これらに限定されない。

さらに、本明細書における用語「及び／又は」は、単に関連オブジェクトを記述する関連関係であり、３つの関係が存在し得ると意味する。例えば、Ａ及び／又はＢは、Ａが単独で存在し、ＡとＢが同時に存在し、Ｂが単独で存在するという三つの状況を意味することができる。また、本明細書における文字「／」は、一般的に前後の関連オブジェクトが「又は」の関係にあることを意味する。

機械翻訳（ＭａｃｈｉｎｅＴｒａｎｓｌａｔｉｏｎ：ＭＴ）モデルのタスクは、ｎ個の文字を含むソース言語文

を入力とし、Ｘに対応する翻訳結果

を出力とするように記述することができる。ｙ_ｉはターゲット側で翻訳されたｉ番目の単語を表し、ニューラルネットワークモデルではｉ番目のｔｏｋｅｎとも呼ぶことができる。

自己回帰の推論方式は、次のように表すことができる。

すなわち、ターゲット翻訳結果におけるｔ番目の単語の生成は、ソース言語文Ｘと、ターゲット側でそのｔ番目の単語の前に生成されたｔ－１個の単語に依存する。

ＭＴモデルの翻訳効果を向上させるためには、複数のＭＴモデルを訓練し、モデル統合（ｅｎｓｅｍｂｌｅ）によってデバイス全体の翻訳効果を実現することが一般的である。

図１は本開示により提供される機械翻訳の概略図である。図１に示すように、翻訳装置に３つの翻訳モデルＭＴ１、ＭＴ２、ＭＴ３が含まれているとする。ＭＴ１、ＭＴ２、ＭＴ３のそれぞれによる単独の翻訳結果は不正確であるが、モデル統合により正しい翻訳結果を生成することができる。図１に示すように、ソース言語文「ｗｈｅｎｅｖｅｒｄｉｄｙｏｕｆｉｎｄｔｉｍｅｔｏｄｏａｌｌｔｈａｔｃｏｏｋｉｎｇ？」について、ＭＴ１的翻訳結果は「貴方はいつ時間がある？これらの食事を作りましょう」であり、ＭＴ２的翻訳結果は「貴方はいつ時間を作ってすべての料理を作るか？」であり、ＭＴ３的翻訳結果は「貴方はいつこれらの時間を探してこれらの食事を作るか？」である。一方、モデルによりｅｎｓｅｍｂｌｅされた翻訳結果は、「貴方はいつ時間を作ってこれらの料理を作るか？」である。比較すればわかるように、モデル統合後の翻訳結果の方が正確である。

同一の翻訳アーキテクチャにおける異なるモデルであってもよいし、異なる翻訳アーキテクチャに属してもよいＫ個のＭＴモデルが翻訳装置に統合されていると仮定する。このうち、翻訳アーキテクチャは、循環ニューラルネットワーク（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ；ＲＮＮ）、畳み込みニューラルネットワーク（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋｓ；ＣＮＮ）、又はＴｒａｎｓｆｏｒｍｅｒネットワークであって良い。

モデル推論の際には、Ｋ個のモデルを同時にグラフィックスプロセッサ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ；ＧＰＵ）にロードする。翻訳過程では、ｔ番目の目標語のような目標語が生成されるたびに、次の式（２）を用いてＫ個のモデルの推論確率の平均を計算し、推論確率の平均が最大となる単語を当該位置の目標語とする。

以上のように、翻訳装置において各ＭＴモデルが統合された場合、各ＭＴモデル確率は同じであり、上記式（２）に示すように１／Ｋである。これは、短いｑｕｅｒｙに適したモデルがあったり、長いｑｕｅｒｙに適したモデルがあったりするモデル間の差異が無視されており、それぞれのモデルが得意とする翻訳分野が異なる可能性もあるため、当該統合方式により翻訳装置の翻訳結果が不正確なままになる可能性がある。

図２は本開示による第１実施形態の概略図である。図２に示すように、本実施形態は、ＭＴの翻訳装置に適用可能な翻訳方法を提供し、具体的には、以下のステップを含むことができる。

Ｓ１０１において、翻訳すべき特定文と予め訓練された重み付けモデルとに基づいて、予め訓練された少なくとも２つの翻訳モデルのそれぞれが特定文を翻訳することに対応する重みを取得する。

Ｓ１０２において、各翻訳モデルが特定文を翻訳する重みに基づいて、少なくとも２つの翻訳モデルを用いて特定文を翻訳する。

本実施形態の翻訳方法が適用される翻訳装置のアーキテクチャには、少なくとも２つの翻訳モデル及び１つの重み付けモデルが含まれていてもよい。このうち、翻訳モデルの数は、実際のニーズに基づいて設定することができ、２つ、３つ、その他の数とすることができる。

異なる文を翻訳する場合、重み付けモデルは、少なくとも２つの翻訳モデルの各々に異なる重みを与える。すなわち、重み付けモデルが具体的にどのように各翻訳モデルに重みを配置するかは、翻訳すべき文を参照する必要がある。

例えば、本開示の一実施形態では、重み付けモデルは、長い文の翻訳に強い利点を有する幾つかの翻訳モデルに高い重みを与える一方、長い文の翻訳にあまり得意でない幾つかの翻訳モデルに低い重みを与えることができる。これは、各翻訳モデルはあらかじめ訓練されているからである。

さらに、例えば、本開示の一実施形態では、各翻訳モデルは、翻訳の得意分野が異なる場合がある。重み付けモデルは、得意分野の文の翻訳である場合に当該翻訳モデルに高い重みを与える一方、あまり得意でない分野の翻訳である場合に当該翻訳モデルに低い重みを与えることができる。

具体的に使用する場合には、翻訳すべき特定文を予め訓練された重み付けモデルに入力する。当該重み付けモデルは、翻訳すべき特定文に基づいて、少なくとも２つの翻訳モデルのそれぞれが当該特定文を翻訳する重みを出力することができる。具体的には、重み付けモデルの出力は、各翻訳モデルの対応する重みを含む１つの重みベクトルとすることができる。そして、各翻訳モデルが特定文を翻訳する重みに基づいて、少なくとも２つの翻訳モデルを用いて特定文を翻訳することができる。

本実施形態の翻訳方法は、前記技術案を採用することにより、重み付けモデルに基づいて、少なくとも２つの翻訳モデルのそれぞれに対して特定文を翻訳する重みを設定することができ、更に少なくとも２つの翻訳モデルに設定された重みに基づいて特定文を翻訳させることができる。重みが異なるため、特定文の翻訳に有利な翻訳モデルの方は翻訳結果に与える影響が大きくなり、さらに、翻訳の正確性を向上させることができる。

図３は本開示による第２実施形態の概略図である。図３に示すように、本実施形態の翻訳方法は、上述した図２に示す実施形態の技術構成に加えて、本開示の技術案をさらに詳細に説明する。図３に示すように、本実施形態の翻訳方法は、具体的には、以下のステップを含むことができる。

Ｓ３０１において、翻訳すべき特定文と予め訓練された重み付けモデルとに基づいて、予め訓練された少なくとも２つの翻訳モデルのそれぞれが特定文を翻訳することに対応する重みを取得する。

Ｓ３０２において、各翻訳モデルが特定文を翻訳する重みに基づいて、少なくとも２つの翻訳モデルが特定文を翻訳する過程で生成される各位置の目標語を取得する。

本実施形態では、少なくとも２つの翻訳モデルは、特定文を翻訳する際に、前からの順番で目標語について一つずつ生成する。いずれかの位置ｋにおける目標語を決定するプロセスについて、少なくとも２つの翻訳モデルのそれぞれにより当該ｋ番目の位置における１つ、２つ又はそれ以上の候補語が最初に生成されて良い。ここで、各候補語は辞書におけるいずれかの単語であってもよい。次に、少なくとも２つの翻訳モデルが当該特定文を翻訳する重みを合わせて当該ｋ番目の位置における目標語が決定される。

例えば、各位置に対応する目標語の生成方式は、具体的には次のような手順で実現することができる。

（１）各位置について、少なくとも２つの翻訳モデルのそれぞれが特定文を翻訳する過程で予測される当該位置における複数の候補語と各候補語に対応する確率を取得する。

例えば、ｋ番目の位置について、各翻訳モデルは、当該位置に出現しうる辞書におけるいずれか１つ、２つ又はそれ以上の候補語と、各候補語に対応する確率を予測して出力することができる。本実施形態では、各翻訳モデルが予測する各位置の複数の候補語の数は、１つ、２つ、又はそれ以上であっても良く、ここでは限定されない。

また、異なる翻訳モデルが予測した同一位置の複数の候補語の間には交差があってもよいが、完全に同一でなくてもよい。例えば、１番目の翻訳モデルによって予測されるｋ番目の位置の候補語は、「ある」で確率が０．８であっても良く、「する」で確率が０．２であっても良く、その他の確率が小さいものは省略してもよい。すなわち、本実施形態では、各翻訳モデルが予測する各位置の候補語について、確率が予め設定された確率閾値より大きい候補語のみを考慮し、確率が小さい候補については考慮しないようにしてもよい。ここで、当該予め設定された確率閾値は、実際の経験に基づいて選択することができ、０．１、０．０５、又は他の確率値として良い。

あるいは、各翻訳モデルが予測する各位置の候補語について、確率が上位Ｎ個の候補語のみを考慮してもよい。すなわち、確率の大小にかかわらず、当該翻訳モデルが予測する当該位置の候補語として上位Ｎ個の候補語を取る。

（２）当該位置における各候補語について、少なくとも２つの翻訳モデルのそれぞれの翻訳時に予測される候補語に対応する確率と、各翻訳モデルが特定文を翻訳する重みとに基づいて、候補語の位置における推論確率を計算する。

例えば、当該位置における各候補語について、候補語の位置における推論確率として、各翻訳モデルの翻訳時に予測される候補語に対応する確率と、対応する翻訳モデルが特定文を翻訳する重みの積の和を取ることができ、具体的に次式（３）で表される。

この式は、少なくとも２つの翻訳モデルの数をＫとし、ここで、ｗ_ｋは当該重み付けモデルがｋ番目の翻訳モデルに与える重みを表す。

（３）当該位置にある複数の候補語のそれぞれの当該位置における推論確率に基づいて、当該位置の目標語を決定する。

例えば、当該位置の複数の候補語の中から推論確率が最も高い候補語をその位置の目標語として取得する。

本実施形態の上述方式によれば、各位置の目標語を正確に決定することができる。

Ｓ３０３において、各位置の目標語を、前から後の順にスプライシングして特定文の翻訳を生成する。

すべての位置の目標語が得られた後、各位置の目標語を前から順にスプライシングすることは、特定文の翻訳である。

本実施形態のステップＳ３０２～Ｓ３０３は、上述した図１に示した実施形態のステップＳ１０２の一実施形態である。当該実施形態において、特定文に対する各翻訳モデルの重みが、各位置の目標語の生成に直接に影響する。オプションとして、実際の応用において、各翻訳モデルの特定文に対する重みは、特定文全体の翻訳に直接に影響を与えることも可能であるが、ここでは限定しない。

例えば、図４は、本実施形態が提供する翻訳方法の構成図である。図４に示すように、翻訳装置にＭＴ_１、ＭＴ_２とＭＴ_３という３つの翻訳モデルが統合されていることを例とし、ｐ（θ｜ｘ）は重み付けモデルである。ｐ（θ｜ｘ）は、ソース言語文ｘに応じてこれら３つの翻訳モデルの重みベクトルθ_１を与えることができる。図４に示すようにθ_１は（０．５，０．２，０．３）とし、最終的に得られる翻訳結果は

として表現することができる。したがって、各翻訳モデルは推論の際に、差異化の重みに基づいて推論を行うことができ、翻訳の正確性を効果的に向上することができる。

本実施形態の翻訳方法は、上述した技術案を採用することにより、各翻訳モデルが特定文を翻訳する重みを十分に利用し、特定文の翻訳における各位置の目標語をより正確に生成し、さらに特定文の翻訳を生成することができ、翻訳の正確性を効果的に向上させることができる。

図５は本開示による第３実施形態の概略図である、図５に示すように、本実施形態は、モデル訓練装置に適用可能なモデル訓練方法を提供し、具体的に以下のステップを含むことができる。

Ｓ５０１において、訓練文を収集する。

Ｓ５０２において、訓練文と、予め訓練された少なくとも２つの翻訳モデルと、予め設定されたランダム重み分配器とに基づいて、重み付けモデルを訓練する。

本実施形態の訓練文は、翻訳すべき文のいずれかである。

本実施形態の重み付けモデルは、予め訓練された少なくとも２つの翻訳モデルに対して訓練文を翻訳する重みを設定するために使用される。ランダム重み付け分配器は、少なくとも２つの翻訳モデルに対して訓練文を翻訳する重みをランダムに設定する。ランダム重み分配器と訓練文とに基づいて、重み付けモデルの訓練を実現することができる。

本実施形態のモデル訓練方法は、重み付けモデルが少なくとも２つの翻訳モデルに対して重みを正確かつ合理的に設定することができるように、重み付けモデルを訓練することを実現することができる。

図６は本発明による第４実施形態の概略図である。図６に示すように、本実施形態のモデル訓練方法は、上述した図５に示す実施形態の技術案に加えて、本開示の技術案をさらに詳細に説明する。図６に示すように、本実施形態のモデル訓練方法は、具体的に以下のステップを含むことができる。

Ｓ６０１において、複数の訓練文を収集する。

Ｓ６０２において、複数の訓練文の中から１つの訓練文を選択し、重み付けモデルの訓練の開始を準備する。

具体的には、一つの訓練文を順番に選択しても良く、一つの訓練文をランダムに選択しても良い。

Ｓ６０３において、重み付けモデルに基づいて、少なくとも２つの翻訳モデルにより訓練文を翻訳して得られた第１翻訳結果を取得する。

例えば、具体的には、まず重み付けモデルを使用して少なくとも２つの翻訳モデルに訓練文を翻訳するための第１重みを設定し、次に少なくとも２つの翻訳モデルの第１重みに基づいて、複数の翻訳を用いて訓練文を翻訳して第１翻訳結果を得てよい。

ここで、重み付けモデルが少なくとも２つの翻訳モデルに設定した訓練文を翻訳する第１重みは、各翻訳モデルに対応する重みを含む１つのベクトルとしてベクトル形式をとることができる。ここで、少なくとも２つの翻訳モデルの第１重みに基づいて複数の翻訳を用いて訓練文を翻訳して第１翻訳結果を得るプロセスは、上述した図３に示された実施形態の方法を参照することができるため、ここでは説明しない。

Ｓ５０４において、ランダム重み分配器に基づいて、少なくとも２つの翻訳モデルが訓練文を翻訳して得られた第２翻訳結果を取得する。

同様に、まずランダム重み分配器を使用して少なくとも２つの翻訳モデルに訓練文を翻訳するための第２重み付けを設定し、次に少なくとも２つの翻訳モデルの第２重みに基づいて、複数の翻訳を用いて訓練文を翻訳して第２翻訳結果を得て良い。

本実施形態のランダム重み分配器は、少なくとも２つの翻訳モデルに対して、訓練文を翻訳する重みをランダムに分配することに適している。この第２重みの表現方式は、第１重みと同じである。同様に、少なくとも２つの翻訳モデルの第２重みに基づいて、複数の翻訳を用いて訓練文を翻訳して第２翻訳結果を得るプロセスも、上述した図３に示す実施形態の方式を参照することができるため、ここでは説明しない。

Ｓ６０５において、第１翻訳結果の品質スコアと第２翻訳結果の品質スコアをそれぞれ取得する。

本実施形態では、第１翻訳結果の品質スコアと第２翻訳結果の品質スコアは、ニューラルネットワークに基づいて構築されたスコアモデルを用いて実現することができる。例えば、スコアモデルに２つの翻訳結果と訓練文を入力し、当該スコアモデルによりこれら２つの翻訳結果の品質の高さを評価することができる。この場合に、スコアモデルは、具体的な点数を与えても良く、具体的な点数を与えずに２つの翻訳結果の品質の高さだけを与えてもよい。例えば、区別できるように高い翻訳結果に１、低い翻訳結果に０を与えれば良い。

あるいは、本開示の一実施形態では、第１翻訳結果及び第２翻訳結果をプロの翻訳者に提示してもよい。プロの翻訳者により第１翻訳結果の品質スコアと第２翻訳結果の品質スコアが与えられる。同様に、真のスコアではなく、二つの翻訳結果の品質の高さだけを与えれば良い。

Ｓ６０６において、第２翻訳結果の品質スコアが第１翻訳結果の品質スコアよりも高いか否かを検出し、肯定の場合にステップＳ６０７を実行し、否定の場合にステップＳ６０８を実行する。

Ｓ６０７において、ランダム重み分配器が訓練文に基づいて少なくとも２つの翻訳モデルに重みを割り当てた結果を重み付けモデルに学習させ、ステップＳ６０２に戻り、次の訓練文を取得して訓練を継続する。

第２翻訳結果の品質スコアが第１翻訳結果の品質スコアよりも高い場合には、ランダム重み分配器により割り当てられた重みがより合理的であり、より正確な翻訳結果を得ることができることを意味する。この場合には、ランダム重み分配器がこの訓練文に基づいて少なくとも２つの翻訳モデルに割り当てられた重みの結果を学習するように、重み付けモデルを制御することができる。具体的に、学習過程で、重み付けモデルのパラメータを調整することにより、訓練文に基づいて少なくとも２つの翻訳モデルに重みを設定する際に、重み付けモデルにランダム重み分配器が今回設定した重みを設定させ、更にランダム重み分配器の今回の重みの設定を学習させることができる。

Ｓ６０８において、予め設定された回数の連続した訓練において、第２翻訳結果の品質スコアが常に第１翻訳結果の品質スコア以下であるか否かを検出し、肯定の場合に訓練を終了し、重み付けモデルのパラメータを決定し、否定の場合に、ステップＳ６０２に戻り、次の訓練文を取得して訓練を継続する。

当該ステップＳ６０８は訓練終了条件である。ここで、予め設定された回数は、実際のシーンに応じて設定することができ、例えば、１０、２０、３０、５０、その他の回数とすることができる。具体的には、上記のように訓練を重ねていくことで、予め設定された回数の連続した訓練において、第２翻訳結果の品質スコアが第１翻訳結果の品質スコアよりも常に高くない場合には、重み付けモデルが少なくとも２つの翻訳モデルに設定した重みがより合理的であり、より高いスコアが得られることを意味し、この場合に重み付けモデルが訓練済みであると考えられる。

例えば、図７は、本実施形態が提供するモデル訓練方法の構成図である。図７に示すように、本実施形態のアーキテクチャでは、図４と同様に、３つの機械翻訳モデルＭＴ_１、ＭＴ_２とＭＴ_３を翻訳装置に統合したことを例とし、ｐ（θ｜ｘ）は重み付けモデルである。第１重みθ_１は（０．５，０．２，０．３）であり、第１翻訳結果は

である。Ｒａｎｄｏｍはランダム重み分配器θ_２を表し、この例では、ランダム重み分配器が３つの翻訳モデルに割り当てる第２重みθ_２は、θ_２＝（０．１，０．７，０．２）として表すことができる。第２重みθ_２に基づいて、３つの機械翻訳モデルにより翻訳された第２翻訳結果は、

として表すことができ、ｓｃｏｒｅ１は第１翻訳結果の品質スコアを表し、ｓｃｏｒｅ２は第２翻訳結果の品質スコアを表す。

図８は本実施形態で提供される重み付けモデルの概略図である。図８に示すように、ソース言語文「ｗｈｅｎｅｖｅｒｄｉｄｙｏｕｆｉｎｄｔｉｍｅｔｏｄｏａｌｌｔｈａｔｃｏｏｋｉｎｇ？」を例として、重み付けモデルの実現原理を説明する。本実施形態の重み付けモデルｐ（θ｜ｘ）は、エンコーダ（ｅｎｃｏｄｅｒ）でｘを符号化してｎ＊ｄの符号化結果を得る分類モデルであってよい。本実施形態のｄ次元は、１２８、２５６、５１２等の次元を選択することができる。次に符号化結果を系列次元ごとに平均してｄ次元の文表現を得、このｄ次元ベクトルを全連結層でＫクラス分類し、ｓｏｆｔｍａｘ層でＫ個のＭＴモデルの重みθに対応するＫクラス分類の確率を求める。たとえば、図７に示す翻訳装置に対して、重み付けモデルｐ（θ｜ｘ）により割り当てられた第１重みは（０．５，０．２，０．３）である。第２翻訳結果の品質スコアｓｃｏｒｅ２が第１翻訳結果の品質スコアｓｃｏｒｅ１よりも高い場合、ｓｃｏｒｅ２に対応する重みを教師情報として重み付けモデルを学習させる。ここで、損失関数はＬ２回帰ｌｏｓｓを採用することができ、即ち、重み付けモデルの出力をｓｃｏｒｅ２に対応するθ_２に当てはめることができる。

本実施形態のモデル訓練方法は、前記方法を採用することにより、ランダム重み分配器によって割り当てられた重みに対応する翻訳結果の品質がより高い場合に、重み付けモデルがランダム重み分配器によって割り当てられた重みを十分に学習することができ、さらに、重み付けモデルが翻訳装置に統合された翻訳モデルに対してより正確に重みを配置することができ、さらに、少なくとも２つの翻訳モデルを統合した翻訳装置の翻訳の正確性をさらに向上させることができる。

図９は本開示による第５実施形態の概略図である。図９に示すように、本実施形態は、翻訳すべき特定文と予め訓練された重み付けモデルとに基づいて、予め訓練された少なくとも２つの翻訳モデルのそれぞれが特定文を翻訳することに対応する重みを取得する重み取得モジュール９００１と、各翻訳モデルが特定文を翻訳する重みに基づいて、少なくとも２つの翻訳モデルを用いて特定文を翻訳する翻訳モジュール９０２とを備える翻訳装置９００を提供する。

本実施形態の翻訳装置９００は、上記モジュールを用いて翻訳を実現する実現原理及び技術的効果は、上記関連の方法実施例の実現と同様である。詳細は上記関連の方法実施例の記載を参照することができ、ここでは詳しく説明しない。

さらにオプションとして、本開示の一実施形態では、翻訳モジュール９０２は、各翻訳モデルが特定文を翻訳する重みに基づいて少なくとも２つの翻訳モデルが特定文を翻訳する過程で生成される各位置の目標語を取得し、各位置の目標語を、前から後の順にスプライシングして特定文の翻訳を生成する。

さらにオプションとして、本開示の一実施形態では、翻訳モジュール９０２は、各位置について、少なくとも２つの翻訳モデルのそれぞれが特定文を翻訳する過程において、予測された位置における複数の候補語と、各候補語に対応する確率とを取得し、位置における各候補語について、少なくとも２つの翻訳モデルのそれぞれが翻訳した場合に予測される候補語に対応する確率と、各翻訳モデルが特定文を翻訳する重みとに基づいて、候補語の位置における推論確率を計算し、位置における複数の候補語のうち、各候補語の位置における推論確率に基づいて、位置の目標語を決定する。

さらにオプションとして、本開示の一実施形態では、翻訳モジュール９０２は、位置における各候補語について、各翻訳モデルが翻訳した場合に予測される候補語に対応する確率と、対応する翻訳モデルが特定文を翻訳する重みとの積の和を、候補語の位置における推論確率とする。

図１０は本開示による第６実施形態の概略図である。図１０に示すように、本実施形態は、訓練文を取得する取得モジュール１００１と、訓練文と、予め訓練された少なくとも２つの翻訳モデルと、予め設定されたランダム重み分配器とに基づいて、重み付けモデルを訓練する訓練モジュール１００２とを備えるモデル訓練装置１０００を提供する。

本実施形態のモデル訓練装置１０００は、上記モジュールを用いて翻訳を実現する実現原理及び技術的効果は、上記関連の方法実施形態の実現と同様である。詳細は上記関連の方法実施形態の記載を参照することができるため、ここでは詳しく説明しない。

さらにオプションとして、本開示の一実施形態では、訓練モジュール１００２は、重み付けモデルに基づいて、少なくとも２つの翻訳モデルで訓練文を翻訳して得られた第１翻訳結果を取得し、ランダム重み分配器に基づいて、少なくとも２つの翻訳モデルで訓練文を翻訳して得られた第２翻訳結果を取得し、第１翻訳結果の品質スコアと第２翻訳結果の品質スコアとをそれぞれ取得し、第２翻訳結果の品質スコアが第１翻訳結果の品質スコアよりも高いか否かを検出し、肯定の場合に、ランダム重み分配器が訓練文に基づいて少なくとも２つの翻訳モデルに重みを割り当てた結果を、重み付けモデルに学習させる。

さらにオプションとして、本開示の一実施形態では、訓練モジュール１００２は、重み付けモデルを使用して、訓練文を翻訳する第１重みを少なくとも２つの翻訳モデルに設定し、少なくとも２つの翻訳モデルの第１重みに基づいて複数の翻訳を用いて訓練文を翻訳して第１翻訳結果を得る。

さらにオプションとして、本開示の一実施形態では、訓練モジュール１００２は、ランダム重み分配器を使用して、少なくとも２つの翻訳モデルに訓練文を翻訳する第２重みを設定し、少なくとも２つの翻訳モデルの第２重みに基づいて複数の翻訳を用いて訓練文を翻訳して第２翻訳結果を得る。

本開示の技術案において、関わるユーザの個人情報の取得、記憶及び応用等は、いずれも関連法律法規の規定に適合しており、公序良俗に反するものではない。

本開示の実施形態によれば、本開示は更に、電子デバイス、可読記憶媒体、及びコンピュータプログラム製品を提供する。

図１１は、本開示の実施形態を実施可能な例示的な電子デバイス１１００の概略的なブロック図を示した。電子デバイスは、ラップトップ、デスクトップコンピュータ、ワークベンチ、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータのような、様々な形態のデジタルコンピュータを表す。電子デバイスは更に、ＰＤＡ、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すことができる。本明細書に示す構成要素、それらの接続及び関係、ならびにそれらの機能は、単なる一例であり、本明細書に記載及び／又は要求された本開示の実現を制限することではない。

図１１に示すように、デバイス１１００は、読み取り専用メモリ（ＲＯＭ）１１０２に記憶されたコンピュータプログラム、又は記憶手段１１０８からランダムアクセスメモリ（ＲＡＭ）１１０３にロードされたコンピュータプログラムに従って、様々な適切な動作及び処理を実行することができる演算手段１１０１を含む。ＲＡＭ１１０３には、デバイス１１００の動作に必要な各種のプログラムやデータが記憶されてもよい。演算手段１１０１、ＲＯＭ１１０２及びＲＡＭ１１０３は、バス１１０４を介して接続されている。入出力（Ｉ／Ｏ）インターフェース１１０５もバス１１０４に接続されている。

例えばキーボード、マウス等の入力手段１１０６と、例えば様々なタイプのディスプレイ、スピーカ等の出力手段１１０７と、例えば磁気ディスク、光ディスク等の記憶手段１１０８と、例えばネットワークカード、モデム、無線通信トランシーバなどの通信手段１１０９を含むデバイス１１００の複数の構成要素は、Ｉ／Ｏインターフェース１１０５に接続される。通信手段１１０９は、デバイス１１００が例えばインターネットのコンピュータネットワーク及び／又は様々な電気通信ネットワークを介して他のデバイスと情報／データを交換することを可能にする。

演算手段１１０１は、処理能力及び演算能力を有する様々な汎用及び／又は専用の処理コンポーネントであってよい。演算手段１１０１のいくつかの例は、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、様々な専用の人工知能（ＡＩ）演算チップ、機械学習モデルアルゴリズムを実行する様々な演算ユニット、デジタル信号プロセッサ（ＤＳＰ）、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。演算手段１１０１は、上述した様々な方法及び処理、例えば本開示の前記方法を実行する。例えば、幾つかの実施形態では、本開示の前記方法は、例えば記憶手段１１０８のような機械可読媒体に物理的に組み込まれたコンピュータソフトウェアプログラムとして実装されてもよい。幾つかの実施形態では、コンピュータプログラムの一部又は全部は、ＲＯＭ１１０２及び／又は通信手段１１０９を介してデバイス１１００にロード及び／又はインストールすることができる。コンピュータプログラムがＲＡＭ１１０３にロードされ、演算手段１１０１により実行されると、前記本開示の上記方法の１つ又は複数のステップを実行することができる。代替的に、他の実施形態では、演算手段１１０１は、本開示の前記方法を実行するように、他の任意の適切な方法で（例えば、ファームウェアを介する）構成されてもよい。

本明細書で前述したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、専用集積回路（ＡＳＩＣ）、専用標準製品（ＡＳＳＰ）、システムオンチップシステム（ＳＯＣ）、ロードプログラマブル論理デバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はこれらの組み合わせにおいて実装されてもよい。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施されることを含んで良い。当該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び／又は解釈することができる。当該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであって、記憶システム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、当該記憶システム、当該少なくとも１つの入力装置、及び当該少なくとも１つの出力装置にデータ及び命令を転送することができる。

本開示の方法を実施するためのプログラムコードは、１つ又は複数のプログラミング言語の任意の組み合わせを用いて記述することができる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供することにより、プログラムコードがプロセッサ又はコントローラにより実行されると、フローチャート及び／又はブロック図に指定された機能／動作を実行するようにすることができる。プログラムコードは、全てがマシン上で実行されても良く、一部がマシン上で実行されても良く、スタンドアロンパッケージとして一部的にマシン上で実行され且つ一部的にリモートマシン上で実行され、或いは全てがリモートマシン又はサーバ上で実行されても良い。

本開示の文脈では、機械可読媒体は、有形の媒体であって、命令実行システム、装置又はデバイスにより使用され、或いは命令実行システム、装置又はデバイスと合わせて使用されるプログラムを含むか記憶することができる。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってよい。機械可読媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体的なシステム、装置又はデバイス、あるいはこれらの任意の適切な組み合わせを含んで良いが、これらに限定されない。機械可読記憶媒体のより具体的な例は、１つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、携帯型コンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、光学記憶装置、磁気記憶装置、又はこれらの任意の適切な組み合わせを含む。

ユーザとのインタラクションを提供するために、本明細書に記載されたシステム及び技術は、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、ユーザにより入力をコンピュータに提供するキーボード及びポインティングデバイス（例えば、マウス又はトラックボール）と備えるコンピュータ上に実施されてよい。他の種類の装置は、ユーザとのインタラクションを提供するためにも使用され得る。例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であって良く、ユーザからの入力を任意の形式（音入力、音声入力、又は触覚入力を含む）で受信して良い。

本明細書に記載されたシステム及び技術は、バックエンド構成要素を含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェア構成要素を含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンド構成要素を含むコンピューティングシステム（例えば、グラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータであり、ユーザは、当該グラフィカルユーザインターフェースもしくは当該ウェブブラウザを通じて本明細書で説明されるシステムと技術の実施形態とインタラクションすることができる）、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク（「ＬＡＮ」）、ワイド・エリア・ネットワーク（「ＷＡＮ」）、インターネットワークを含む。

コンピュータシステムは、クライアントとサーバーを含み得る。クライアントとサーバーは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバとの関係は、相応するコンピュータ上で実行され、互いにクライアント－サーバの関係を有するコンピュータプログラムによって生じる。サーバはクラウドサーバであっても良く、分散システムのサーバであっても良く、ブロックチェーンを組み合わせたサーバであってもよい。

以上で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本出願に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本出願で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。

上記の具体的な実施形態は本出願の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本出願の精神及び原則の範囲内で行われる修正、同等の置換、改善は、何れも本出願の保護範囲内に含まれるべきである。

Claims

翻訳すべき特定文と予め訓練された重み付けモデルとに基づいて、予め訓練された少なくとも２つの翻訳モデルのそれぞれが前記特定文を翻訳することに対応する重みを取得することと、
各前記翻訳モデルが前記特定文を翻訳する重みに基づいて、前記少なくとも２つの翻訳モデルを用いて前記特定文を翻訳することと、を含む、
翻訳方法。
各前記翻訳モデルが前記特定文を翻訳する重みに基づいて、前記少なくとも２つの翻訳モデルを用いて前記特定文を翻訳することは、
各前記翻訳モデルが前記特定文を翻訳する重みに基づいて前記少なくとも２つの翻訳モデルが前記特定文を翻訳する過程で生成された各位置の目標語を取得し、
前記各位置の目標語を前から後の順にスプライシングして前記特定文の翻訳を生成する、
ことを含む請求項１に記載の翻訳方法。
各前記翻訳モデルが前記特定文を翻訳する重みに基づいて、前記少なくとも２つの翻訳モデルが前記特定文を翻訳する過程で生成される各位置の目標語を取得することは、
前記各位置について、前記少なくとも２つの翻訳モデルのそれぞれが前記特定文を翻訳する過程において、予測された位置における複数の候補語と、各前記複数の候補語に対応する確率とを取得し、
前記位置における各前記複数の候補語について、前記少なくとも２つの翻訳モデルのそれぞれが翻訳する場合に予測される前記複数の候補語に対応する前記確率と、各前記翻訳モデルが前記特定文を翻訳する重みとに基づいて、前記複数の候補語の前記位置における推論確率を計算し、
前記位置における前記複数の候補語のそれぞれの前記位置における推論確率に基づいて、前記位置の目標語を決定する、
ことを含む請求項２に記載の翻訳方法。
前記各位置における各前記複数の候補語について、前記少なくとも２つの翻訳モデルのそれぞれが翻訳する場合に予測される前記複数の候補語に対応する前記確率と、各前記翻訳モデルが前記特定文を翻訳する重みとに基づいて、前記複数の候補語の前記各位置における推論確率を計算することは、
前記各位置における各前記複数の候補語について、各前記翻訳モデルが翻訳する場合に予測される前記複数の候補語に対応する前記確率と、対応する前記翻訳モデルが前記特定文を翻訳する重みとの積の和を前記複数の候補語の前記各位置における推論確率とする、
ことを含む請求項３に記載の翻訳方法。
モデル訓練方法であって、
訓練文を収集することと、
前記訓練文、予め訓練された少なくとも２つの翻訳モデル、及び予め設定されたランダム重み分配器とに基づいて重み付けモデルを訓練することと、を含む、
方法。
前記訓練文と、予め訓練された少なくとも２つの翻訳モデルと、予め設定されたランダム重み分配器とに基づいて、重み付けモデルを訓練することは、
前記重み付けモデルに基づいて、前記少なくとも２つの翻訳モデルで前記訓練文を翻訳して得られた第１翻訳結果を取得し、
前記ランダム重み分配器に基づいて、前記少なくとも２つの翻訳モデルで前記訓練文を翻訳して得られた第２翻訳結果を取得し、
前記第１翻訳結果の品質スコア及び前記第２翻訳結果の品質スコアをそれぞれ取得し、
前記第２翻訳結果の品質スコアが前記第１翻訳結果の品質スコアよりも高いか否かを検出し、
肯定の場合に、前記ランダム重み分配器が前記訓練文に基づいて前記少なくとも２つの翻訳モデルに重みを割り当てた結果を、前記重み付けモデルに学習させる、
ことを含む請求項５に記載のモデル訓練方法。
前記重み付けモデルに基づいて前記少なくとも２つの翻訳モデルで前記訓練文を翻訳して得られた第１翻訳結果を取得することは、
前記重み付けモデルを使用して、前記少なくとも２つの翻訳モデルに前記訓練文を翻訳する第１重みを設定し、
前記少なくとも２つの翻訳モデルの第１重みに基づいて、複数の翻訳を用いて前記訓練文を翻訳して前記第１翻訳結果を得る、
ことを含む請求項６に記載のモデル訓練方法。
前記ランダム重み分配器に基づいて、前記少なくとも２つの翻訳モデルで前記訓練文を翻訳して得られた第２翻訳結果を取得することは、
前記ランダム重み分配器を使用して、前記少なくとも２つの翻訳モデルに前記訓練文を翻訳する第２重みを設定し、
前記少なくとも２つの翻訳モデルの第２重みに基づいて、複数の翻訳を用いて前記訓練文を翻訳して前記第２翻訳結果を得る、
ことを含む請求項６に記載のモデル訓練方法。
翻訳すべき特定文と予め訓練された重み付けモデルとに基づいて、予め訓練された少なくとも２つの翻訳モデルのそれぞれが前記特定文を翻訳することに対応する重みを取得する重み取得モジュールと、
各前記翻訳モデルが前記特定文を翻訳する重みに基づいて、前記少なくとも２つの翻訳モデルを用いて前記特定文を翻訳する翻訳モジュールと、
を備える翻訳装置。
前記翻訳モジュールは、
各前記翻訳モデルが前記特定文を翻訳する重みに基づいて、前記少なくとも２つの翻訳モデルが前記特定文を翻訳する過程で生成された各位置の目標語を取得し、
前記各位置の目標語を、前から後の順にスプライシングして前記特定文の翻訳を生成する、
請求項９に記載の翻訳装置。
前記翻訳モジュールは、
前記各位置について、前記少なくとも２つの翻訳モデルのそれぞれが前記特定文を翻訳する過程において、予測された位置における複数の候補語と、各前記複数の候補語に対応する確率とを取得し、
前記位置における各前記複数の候補語について、前記少なくとも２つの翻訳モデルのそれぞれが翻訳する場合に予測される前記複数の候補語に対応する前記確率と、各前記翻訳モデルが前記特定文を翻訳する重みとに基づいて、前記複数の候補語の前記位置における推論確率を計算し、
前記位置における前記複数の候補語のそれぞれの前記位置における推論確率に基づいて、前記位置の目標語を決定する、
請求項１０に記載の翻訳装置。
前記翻訳モジュールは、
前記各位置における各前記複数の候補語について、各前記翻訳モデルが翻訳する場合に予測される前記複数の候補語に対応する前記確率と、対応する前記翻訳モデルが前記特定文を翻訳する重みとの積の和を、前記複数の候補語の前記位置における推論確率とする、
請求項１１に記載の翻訳装置。
モデル訓練装置であって、
訓練文を収集する収集モジュールと、
前記訓練文、予め訓練された少なくとも２つの翻訳モデル、及び予め設定されたランダム重み分配器に基づいて、重み付けモデルを訓練する訓練モジュールと、
を備えるモデル訓練装置。
前記訓練モジュールは、
前記重み付けモデルに基づいて、前記少なくとも２つの翻訳モデルで前記訓練文を翻訳して得られた第１翻訳結果を取得し、
前記ランダム重み分配器に基づいて、前記少なくとも２つの翻訳モデルで前記訓練文を翻訳して得られた第２翻訳結果を取得し、
前記第１翻訳結果の品質スコア及び前記第２翻訳結果の品質スコアをそれぞれ取得し、
前記第２翻訳結果の品質スコアが前記第１翻訳結果の品質スコアよりも高いか否かを検出し、
肯定の場合に、前記ランダム重み分配器が前記訓練文に基づいて前記少なくとも２つの翻訳モデルに重みを割り当てた結果を、前記重み付けモデルに学習させる、
請求項１３に記載のモデル訓練装置。
前記訓練モジュールは、
前記重み付けモデルを使用して、前記少なくとも２つの翻訳モデルに前記訓練文を翻訳する第１重みを設定し、
前記少なくとも２つの翻訳モデルの第１重みに基づいて、複数の翻訳を用いて前記訓練文を翻訳して前記第１翻訳結果を得る、
請求項１４に記載のモデル訓練装置。
前記訓練モジュールは、
前記ランダム重み分配器を使用して、前記少なくとも２つの翻訳モデルに前記訓練文を翻訳する第２重みを設定し、
前記少なくとも２つの翻訳モデルの第２重みに基づいて、複数の翻訳を用いて前記訓練文を翻訳して前記第２翻訳結果を得る、
請求項１４に記載のモデル訓練装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されたメモリとを備え、
前記メモリに前記少なくとも１つのプロセッサにより実行可能なコマンドを記憶しており、前記コマンドが前記少なくとも１つのプロセッサにより実行されると、前記少なくとも１つのプロセッサに請求項１～４のいずれか１項に記載の翻訳方法、又は５～８のいずれか１項に記載のモデル訓練方法を実行させる電子デバイス。
コンピュータに請求項１～４のいずれか１項に記載の翻訳方法又は５～８のいずれか１項に記載のモデル訓練方法を実行させるためのコンピュータコマンドを記憶する非一時的なコンピュータ可読記憶媒体。
プロセッサにより実行されると、請求項１～４のいずれか１項に記載の翻訳方法又は５～８のいずれか１項に記載のモデル訓練方法を実現するコンピュータプログラム。