WO2022264232A1

WO2022264232A1 - 学習装置、対訳文出力装置、学習方法、対訳文出力方法およびプログラム

Info

Publication number: WO2022264232A1
Application number: PCT/JP2021/022581
Authority: WO
Inventors: 敏鈴木; 昌明永田
Original assignee: 日本電信電話株式会社
Priority date: 2021-06-14
Filing date: 2021-06-14
Publication date: 2022-12-22
Also published as: JPWO2022264232A1

Abstract

言語モデルのパラメータを更新するための学習装置であって、前記言語モデルに基づいて、第一言語のコーパスを圧縮した第一圧縮ベクトルを生成する第一言語圧縮ベクトル生成部と、前記第一圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新する第一パラメータ更新部と、前記言語モデルに基づいて、第二言語のコーパスを圧縮した第二圧縮ベクトルを生成する第二言語圧縮ベクトル生成部と、前記第二圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新する第二パラメータ更新部と、それぞれ意味が同じテキストから生成された前記第一圧縮ベクトルと前記第二圧縮ベクトルの類似度を算出する類似度算出部と、前記類似度に基づいて、言語モデルのパラメータを更新する第三パラメータ更新部と、を備える学習装置である。

Description

学習装置、対訳文出力装置、学習方法、対訳文出力方法およびプログラム

　本発明は、学習装置、対訳文出力装置、学習方法、対訳文出力方法およびプログラムに関する。

　自然言語処理による自動翻訳を、対訳データを用いて実現する技術が知られている。例えば、日英翻訳であれば、日本語文書と英語文書との対応を大量に学習させることで翻訳精度を上げる方法が知られている。

　非特許文献１には、意味が類似する文を類似度の高いベクトルへと写像する技術が開示されている。

Nils Reimers，SentenceTransformers Documentation，［ｏｎｌｉｎｅ］，インターネット＜ＵＲＬ：https://www.sbert.net/index.html＞

　上記の従来技術において利用できる対訳データは、類似したテキストの集合、或いは、対訳テキストのペアの集合であるが、テキスト同士の対応付けが明確でないものも多く、それらに関しては利用を諦めるか、あるいは人手で対応付けを行うなどが必要である。そのため、利用しやすい対訳データを大量に準備することが難しいという問題がある。

　開示の技術は、対訳データによらずに、異なる言語間で意味の近いテキストを出力することを目的とする。

　開示の技術は、言語モデルのパラメータを更新するための学習装置であって、前記言語モデルに基づいて、第一言語のコーパスを圧縮した第一圧縮ベクトルを生成する第一言語圧縮ベクトル生成部と、前記第一圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新する第一パラメータ更新部と、前記言語モデルに基づいて、第二言語のコーパスを圧縮した第二圧縮ベクトルを生成する第二言語圧縮ベクトル生成部と、前記第二圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新する第二パラメータ更新部と、それぞれ意味が同じテキストから生成された前記第一圧縮ベクトルと前記第二圧縮ベクトルの類似度を算出する類似度算出部と、前記類似度に基づいて、言語モデルのパラメータを更新する第三パラメータ更新部と、を備える学習装置である。

　対訳データによらずに、異なる言語間で意味の近いテキストを出力することができる。

学習装置の機能構成図である。言語モデルの一例を示す第一の図である。言語モデルの一例を示す第二の図である。言語モデルの一例を示す第三の図である。学習処理の流れの一例を示すフローチャートである。対訳文出力装置の機能構成図である。対訳文出力処理における言語モデルの使用方法について説明するための図である。対訳文出力処理の流れの一例を示すフローチャートである。コンピュータのハードウェア構成例を示す図である。

　以下、図面を参照して本発明の実施の形態（本実施の形態）を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。

　（本実施の形態の概要）
　本実施の形態に係る学習装置は、二つの言語のそれぞれのテキストを一つの意味空間上にベクトルとして圧縮変換する学習と、二つの言語の対訳コーパスを用いて同じ意味の文を入力とした場合に、各言語の圧縮ベクトルを一致或いは近傍に集める学習と、を行って、言語モデルのパラメータを更新する。また、本実施の形態に係る対訳文出力装置は、学習装置によって更新されたパラメータを適用した言語モデルに基づいて対訳文を出力する。なお、対訳文とは、入力された第一言語のテキストに対応する第二言語のテキストであって、単語、フレーズ、文章、段落等を含む。

　（学習装置の機能構成例）
　図１は、学習装置の機能構成図である。学習装置１０は、モデル記憶部１１と、第一言語コーパス取得部１２と、第一言語圧縮ベクトル生成部１３と、第一パラメータ更新部１４と、第二言語コーパス取得部１５と、第二言語圧縮ベクトル生成部１６と、第二パラメータ更新部１７と、類似度算出部１８と、第三パラメータ更新部１９と、を備える。

　モデル記憶部１１は、言語モデル１００を記憶する。言語モデル１００は、第一言語（例えば日本語）と第二言語（例えば英語）のそれぞれのテキストを圧縮または復元するオートエンコーダであって、中間層に入力されたテキストに対応する圧縮ベクトルを生成するように学習される。

　第一言語コーパス取得部１２は、第一言語コーパス８０を取得する。第一言語コーパス８０は、例えば日本語を第一言語とする場合、日本語のテキストを構造化して集積された単言語のコーパスである。

　第一言語圧縮ベクトル生成部１３は、言語モデル１００に基づいて第一言語のコーパスを圧縮して、圧縮ベクトル（第一圧縮ベクトル）を生成する。

　第一パラメータ更新部１４は、第一言語コーパス８０を使用して、生成された圧縮ベクトルがコーパスに対応する意味となるように学習することによって、言語モデル１００のモデルパラメータを更新する。

　第二言語コーパス取得部１５は、第二言語コーパス８１を取得する。第二言語コーパス８１は、例えば英語を第二言語とする場合、英語のテキストを構造化して集積された単言語のコーパスである。

　第二言語圧縮ベクトル生成部１６は、言語モデル１００に基づいて第二言語のコーパスを圧縮して、圧縮ベクトル（第二圧縮ベクトル）を生成する。

　第二パラメータ更新部１７は、第二言語コーパス８１を使用して、生成された圧縮ベクトルがコーパスに対応する意味となるように学習することによって、言語モデル１００のモデルパラメータを更新する。

　類似度算出部１８は、第一言語コーパス８０から生成された圧縮ベクトル（第一圧縮ベクトル）と、第二言語コーパス８１から生成された圧縮ベクトル（第二圧縮ベクトル）が、同じ意味のテキストから生成された場合に、これらの圧縮ベクトルの類似度を算出する。類似度は、例えば圧縮ベクトル間のノルムまたはｃｏｓｉｎｅ距離等である。なお、類似度算出部１８は、同じ意味のテキストから生成されたか否かを、対訳コーパス等に基づいて判定する。また、第一言語圧縮ベクトル生成部１３および第二言語圧縮ベクトル生成部１６は、類似度の算出の対象となる第一言語の圧縮ベクトル（第一圧縮ベクトル）と第二言語の圧縮ベクトル（第二圧縮ベクトル）とを、第一言語コーパス８０または第二言語コーパス８１ではなく対訳コーパスを圧縮して生成しても良い。

　第三パラメータ更新部１９は、同じ意味のテキストから生成される圧縮ベクトルの類似度を最大化するように、言語モデル１００のモデルパラメータを更新する。

　（言語モデルの構成例）
　図２は、言語モデルの構成例を示す第一の図である。図２に示す言語モデル１００は、（１）第一言語のオートエンコーダに相当するエンコーダ１０１、中間層１０２およびデコーダ１０３と、（２）第二言語のオートエンコーダに相当するエンコーダ１０４、中間層１０５およびデコーダ１０６と、を含む。また、（３）第三パラメータ更新部１９による処理の対象は、第一言語の圧縮ベクトルの生成に関わるエンコーダ１０１および中間層１０２と、第二言語の圧縮ベクトルの生成に関わるエンコーダ１０４および中間層１０５である。

　エンコーダ１０１，１０４およびデコーダ１０３，１０６は、それぞれＴｒａｎｓｆｏｒｍｅｒｓ／Ｂｅｒｔ等（参考文献［１］）の既存の言語モデルを適用しても良い。

　図２に示す言語モデルの形態は、圧縮ベクトル同士の類似度としてｃｏｓｉｎｅ距離を適用する場合などに使用でき、２つの言語の意味空間が完全な一致ではなく、緩やかに対応する場合にも用いることができる形態である。

　図３は、言語モデルの構成例を示す第二の図である。図３に示す言語モデル１００は、（１）第一言語のオートエンコーダに相当するエンコーダ１０１、中間層１０２およびデコーダ１０３と、（２）第二言語のオートエンコーダに相当するエンコーダ１０４、中間層１０２およびデコーダ１０６と、を含む。すなわち、言語モデル１００が備える中間層は、第一言語と第二言語で共通の中間層１０２となっている。また、（３）第三パラメータ更新部１９による処理の対象は、第一言語の圧縮ベクトルの生成に関わるエンコーダ１０１および中間層１０２と、第二言語の圧縮ベクトルの生成に関わるエンコーダ１０４および中間層１０２である。

　図３に示す言語モデルの形態は、図２に示す言語モデルの形態とほぼ同等であるが、２つの言語の意味空間が完全に一致する場合に用いることができる。

　図４は、言語モデルの構成例を示す第三の図である。図４に示す言語モデル１００は、（１）第一言語のオートエンコーダに相当するエンコーダ１０１、中間層１０２およびデコーダ１０３と、（２）第二言語のオートエンコーダに相当するエンコーダ１０１、中間層１０２およびデコーダ１０６と、を含む。すなわち、言語モデル１００が備えるエンコーダおよび中間層は、第一言語と第二言語で共通のエンコーダ１０１および中間層１０２となっている。また、（３）第三パラメータ更新部１９による処理の対象は、第一言語および第二言語の圧縮ベクトルの生成に関わるエンコーダ１０１および中間層１０２である。

　図４に示す言語モデルの形態は、例えば、図２に示す言語モデルの（３）にＳｅｎｔｅｎｃｅ－Ｂｅｒｔ（非特許文献１）の多言語モデルを適用した場合のモデルであり、適用するモデル内に二つのエンコーダの機能を既に含んでいる場合に適用できる形式的な形態である。図４に示す言語モデルの形態は、実質的には図２または図３に示す言語モデルの形態と同等である。

　同様に、二つのデコーダの機能を一つのデコーダに包含する場合には、形式的に一つのデコーダにより表現することもできる。

　（学習装置の動作例）
　次に、学習装置１０の動作例について、図面を参照して説明する。学習装置１０は、ユーザの操作等を受けて、または定期的に、学習処理を開始する。

　図５は、学習処理の流れの一例を示すフローチャートである。第一言語コーパス取得部１２は、第一言語のコーパスを取得する（ステップＳ１１）。次に、第一言語圧縮ベクトル生成部１３は、第一言語のコーパスの圧縮ベクトルを生成する（ステップＳ１２）。続いて、第一パラメータ更新部１４は、第一言語のコーパスの圧縮ベクトルに基づいて、言語モデルのパラメータを更新する（ステップＳ１３）。

　ステップＳ１１からステップＳ１３までの処理は、第一言語のオートエンコーダを学習するための第一の学習に相当する。

　また、第二言語コーパス取得部１５は、第二言語のコーパスを取得する（ステップＳ１４）。次に、第二言語圧縮ベクトル生成部１６は、第二言語のコーパスの圧縮ベクトルを生成する（ステップＳ１５）。続いて、第二パラメータ更新部１７は、第二言語のコーパスの圧縮ベクトルに基づいて、言語モデルのパラメータを更新する（ステップＳ１６）。

　ステップＳ１４からステップＳ１６までの処理は、第二言語のオートエンコーダを学習するための第二の学習に相当する。

　続いて、類似度算出部１８は、第一言語のコーパスの圧縮ベクトルと、第二言語のコーパスの圧縮ベクトルとの類似度を算出する（ステップＳ１７）。算出される類似度は、例えば圧縮ベクトル間のノルムまたはｃｏｓｉｎｅ距離等である。

　そして、第三パラメータ更新部１９は、類似度に基づいて、言語モデルのパラメータを更新する（ステップＳ１８）。例えば、第三パラメータ更新部１９は、意味が共通する圧縮ベクトル間のノルムまたはｃｏｓｉｎｅ距離を最小化するように、言語モデルのパラメータを更新する。

　ステップＳ１７からステップＳ１８までの処理は、類似度を最大化（ノルムまたはｃｏｓｉｎｅ距離を最小化）するための第三の学習に相当する。

　このようにして、本実施の形態に係る学習装置１０は、３つの学習（パラメータ更新）処理を組み合わせることによって、第一言語および第二言語のそれぞれのテキストを一つの意味空間上にベクトルとして圧縮変換することが可能となり、意味が同じテキストであれば、同等の圧縮ベクトルを得られるように学習することができる。

　また、第三の学習のみでは過学習が起こる可能性が高いが、第一、第二の学習を組み合わせることにより、汎化の学習効果が得られ、過学習が抑制されることが期待できる。

　なお、学習装置１０は、学習の組み合わせ方としては、それぞれを一定回数毎に順番に学習を繰り返しても良いし、一定期間の学習誤差を全てプールし、バッチ処理として重みの更新を行っても良い。

　（対訳文出力装置の機能構成）
　図６は、対訳文出力装置の機能構成図である。対訳文出力装置２０は、モデル記憶部２１と、第一言語テキスト取得部２２と、第一言語圧縮ベクトル生成部２３と、第二言語対訳文候補取得部２４と、第二言語圧縮ベクトル生成部２５と、類似度算出部２６と、対訳文選択部２７と、出力部２８と、を備える。

　モデル記憶部２１は、言語モデル２００を記憶する。言語モデル２００は、学習装置１０によってパラメータを更新された学習済みの言語モデルである。

　第一言語テキスト取得部２２は、第一言語テキスト９０を取得する。第一言語テキスト９０は、例えば日本語を第一言語として対訳文を出力する場合、対訳の対象となる日本語のテキストである。

　第一言語圧縮ベクトル生成部２３は、言語モデル２００に基づいて第一言語のテキストを圧縮して、圧縮ベクトル（第一圧縮ベクトル）を生成する。

　第二言語対訳文候補取得部２４は、第二言語対訳文候補９１を取得する。第二言語対訳文候補９１は、例えば英語を第二言語とする場合、第一言語の一例である日本語の対訳の候補となる英語のテキストの集合である。

　第二言語圧縮ベクトル生成部２５は、言語モデル２００に基づいて第二言語の対訳文候補を圧縮して、圧縮ベクトル（第二圧縮ベクトル）を生成する。

　類似度算出部２６は、第一言語のテキストから生成された圧縮ベクトル（第一圧縮ベクトル）と、第二言語の複数の対訳文候補から生成されたそれぞれの圧縮ベクトル（第二圧縮ベクトル）との類似度を算出する。類似度の算出方法は、学習装置１０の類似度算出部１８と同様である。

　対訳文選択部２７は、複数の対訳文の候補から、類似度に基づいて対訳文を選択する。具体的には、類似度が圧縮ベクトルのｃｏｓｉｎｅ距離である場合、対訳文選択部２７は、対訳文候補から生成された複数の圧縮ベクトルのうち、ｃｏｓｉｎｅ距離が最小となる圧縮ベクトルの生成元の対訳文を選択する。

　出力部２８は、選択された対訳文を出力する。具体的には、出力部２８は、対訳文を示す情報を他の装置等に送信するか、または表示装置等に表示する。

　（対訳文出力処理における言語モデル）
　図７は、対訳文出力処理における言語モデルの使用方法について説明するための図である。図７に示す言語モデル２００は、図２に示した言語モデル１００を対訳文の出力処理に適用したものである。

　言語モデル２００は、（１）第一言語のテキストの圧縮ベクトルの生成に関するエンコーダ２０１および中間層２０２と、（２）第二言語の対訳文候補の圧縮ベクトルの生成に関するエンコーダ２０３および中間層２０４と、（３）類似度の算出に関する中間層２０５と、（４）算出された類似度を示す情報を記憶する記憶部２０６と、を含む。

　（対訳文出力装置の動作例）
　次に、対訳文出力装置２０の動作例について、図面を参照して説明する。対訳文出力装置２０は、ユーザの操作等を受けて、または定期的に、対訳文出力処理を開始する。

　図８は、対訳文出力処理の流れの一例を示すフローチャートである。第一言語テキスト取得部２２は、第一言語テキストを取得する（ステップＳ２１）。次に、第一言語圧縮ベクトル生成部２３は、第一言語テキストの圧縮ベクトルを生成する（ステップＳ２２）。

　続いて、第二言語対訳文候補取得部２４は、第二言語の対訳文の候補を取得する（ステップＳ２３）。第二言語圧縮ベクトル生成部２５は、第二言語の対訳文の候補の圧縮ベクトルを生成する（ステップＳ２４）。

　次に、類似度算出部２６は、第一言語テキストの圧縮ベクトルと、第二言語の対訳文の候補の圧縮ベクトルとの類似度を算出する（ステップＳ２５）。対訳文選択部２７は、類似度に基づいて対訳文を選択する（ステップＳ２６）。

　そして、出力部２８は、選択された対訳文を出力する（ステップＳ２７）。

　（本実施の形態に係るハードウェア構成例）
　学習装置１０および対訳文出力装置２０は、例えば、コンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。なお、この「コンピュータ」は、物理マシンであってもよいし、クラウド上の仮想マシンであってもよい。仮想マシンを使用する場合、ここで説明する「ハードウェア」は仮想的なハードウェアである。

　上記プログラムは、コンピュータが読み取り可能な記録媒体（可搬メモリ等）に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メール等、ネットワークを通して提供することも可能である。

　図９は、上記コンピュータのハードウェア構成例を示す図である。図９のコンピュータは、それぞれバスＢで相互に接続されているドライブ装置１０００、補助記憶装置１００２、メモリ装置１００３、ＣＰＵ１００４、インタフェース装置１００５、表示装置１００６、入力装置１００７、出力装置１００８等を有する。

　当該コンピュータでの処理を実現するプログラムは、例えば、ＣＤ－ＲＯＭ又はメモリカード等の記録媒体１００１によって提供される。プログラムを記憶した記録媒体１００１がドライブ装置１０００にセットされると、プログラムが記録媒体１００１からドライブ装置１０００を介して補助記憶装置１００２にインストールされる。但し、プログラムのインストールは必ずしも記録媒体１００１より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置１００２は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。

　メモリ装置１００３は、プログラムの起動指示があった場合に、補助記憶装置１００２からプログラムを読み出して格納する。ＣＰＵ１００４は、メモリ装置１００３に格納されたプログラムに従って、当該装置に係る機能を実現する。インタフェース装置１００５は、ネットワークに接続するためのインタフェースとして用いられる。表示装置１００６はプログラムによるＧＵＩ（Ｇｒａｐｈｉｃａｌ　Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ）等を表示する。入力装置１００７はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。出力装置１００８は演算結果を出力する。なお、上記コンピュータは、ＣＰＵ１００４の代わりにＧＰＵ（Graphics Processing Unit）またはＴＰＵ（Tensor processing unit）を備えていても良く、ＣＰＵ１００４に加えて、ＧＰＵまたはＴＰＵを備えていても良い。その場合、例えばニューラルネットワーク等の特殊な演算が必要な処理をＧＰＵまたはＴＰＵが実行し、その他の処理をＣＰＵ１００４が実行する、というように処理を分担して実行しても良い。

　（本実施の形態の効果）
　本実施の形態に係る学習装置１０によれば、３つの学習（パラメータ更新）処理を組み合わせることによって、第一言語および第二言語のそれぞれのテキストを一つの意味空間上にベクトルとして圧縮変換することが可能となり、意味が同じテキストであれば、同等の圧縮ベクトルを得られるように学習する。

　近年ではインターネット等を介して膨大な数の単言語のコーパスが提供されているため、単言語のコーパスの収集は比較的容易である。したがって、入手しやすい単言語のコーパスを利用することによって、大量の学習データを利用でき、圧縮次元における意味空間の滑らかさを実現させることができる。

　このようにして学習された言語モデルを利用することによって、対訳文出力装置２０は、異なる言語間で意味の近い文を発見することが容易になり、精度の高い対訳文を選択して出力することができる。

　（参考文献）
　［１］：The Hugging Face Team，Transformers，［ｏｎｌｉｎｅ］，インターネット＜ＵＲＬ：https://huggingface.co/transformers/index.html＞

　（実施の形態のまとめ）
　本明細書には、少なくとも下記の各項に記載した学習装置、対訳文出力装置、学習方法、対訳文出力方法およびプログラムが記載されている。
（第１項）
　言語モデルのパラメータを更新するための学習装置であって、
　前記言語モデルに基づいて、第一言語のコーパスを圧縮した第一圧縮ベクトルを生成する第一言語圧縮ベクトル生成部と、
　前記第一圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新する第一パラメータ更新部と、
　前記言語モデルに基づいて、第二言語のコーパスを圧縮した第二圧縮ベクトルを生成する第二言語圧縮ベクトル生成部と、
　前記第二圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新する第二パラメータ更新部と、
　それぞれ意味が同じテキストから生成された前記第一圧縮ベクトルと前記第二圧縮ベクトルの類似度を算出する類似度算出部と、
　前記類似度に基づいて、言語モデルのパラメータを更新する第三パラメータ更新部と、を備える、
　学習装置。
（第２項）
　前記類似度算出部は、前記第一圧縮ベクトルと前記第二圧縮ベクトルとのノルムまたはｃｏｓｉｎｅ距離を、前記類似度として算出し、
　前記第三パラメータ更新部は、前記ノルムまたは前記ｃｏｓｉｎｅ距離を最小化するように前記パラメータを更新する、
　第１項に記載の学習装置。
（第３項）
　前記言語モデルは、第一言語の圧縮ベクトルを中間層に生成するエンコーダと、第二言語の圧縮ベクトルを中間層に生成するエンコーダと、を含むオートエンコーダである、
　第１項または第２項に記載の学習装置。
（第４項）
　第一言語のテキストの第二言語の対訳文を出力するための対訳文出力装置であって、
　前記第一言語のテキストを圧縮して第一圧縮ベクトルを生成する第一言語圧縮ベクトル生成部と、
　前記第二言語の複数の対訳文候補を圧縮して第二圧縮ベクトルを生成する第二言語圧縮ベクトル生成部と、
　前記第一圧縮ベクトルと、それぞれの前記第二圧縮ベクトルとの類似度を算出する類似度算出部と、
　前記類似度に基づいて対訳文候補から対訳文を選択する対訳文選択部と、
　選択された前記対訳文を出力する出力部と、を備える、
　対訳文出力装置。
（第５項）
　言語モデルのパラメータを更新するための学習装置が実行する学習方法であって、
　前記言語モデルに基づいて、第一言語のコーパスを圧縮した第一圧縮ベクトルを生成するステップと、
　前記第一圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新するステップと、
　前記言語モデルに基づいて、第二言語のコーパスを圧縮した第二圧縮ベクトルを生成するステップと、
　前記第二圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新するステップと、
　それぞれ意味が同じテキストから生成された前記第一圧縮ベクトルと前記第二圧縮ベクトルの類似度を算出するステップと、
　前記類似度に基づいて、言語モデルのパラメータを更新するステップと、を備える、
　学習方法。
（第６項）
　第一言語のテキストの第二言語の対訳文を出力するための対訳文出力装置が実行する対訳文出力方法であって、
　前記第一言語のテキストを圧縮して第一圧縮ベクトルを生成するステップと、
　前記第二言語の複数の対訳文候補を圧縮して第二圧縮ベクトルを生成するステップと、
　前記第一圧縮ベクトルと、それぞれの前記第二圧縮ベクトルとの類似度を算出するステップと、
　前記類似度に基づいて対訳文候補から対訳文を選択するステップと、
　選択された前記対訳文を出力するステップと、を備える、
　対訳文出力方法。
（第７項）
　コンピュータを、第１項から第３項のいずれか１項に記載の学習装置における各部として機能させるためのプログラム、または、コンピュータを、第４項に記載の対訳文出力装置における各部として機能させるためのプログラム。

　以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。

１０　学習装置
１１　モデル記憶部
１２　第一言語コーパス取得部
１３　第一言語圧縮ベクトル生成部
１４　第一パラメータ更新部
１５　第二言語コーパス取得部
１６　第二言語圧縮ベクトル生成部
１７　第二パラメータ更新部
１８　類似度算出部
１９　第三パラメータ更新部
２０　対訳文出力装置
２１　モデル記憶部
２２　第一言語テキスト取得部
２３　第一言語圧縮ベクトル生成部
２４　第二言語対訳文候補取得部
２５　第二言語圧縮ベクトル生成部
２６　類似度算出部
２７　対訳文選択部
２８　出力部
８０　第一言語コーパス
８１　第二言語コーパス
９０　第一言語テキスト
９１　第二言語対訳文候補
１００　言語モデル
２００　言語モデル
１０００　ドライブ装置
１００１　記録媒体
１００２　補助記憶装置
１００３　メモリ装置
１００４　ＣＰＵ
１００５　インタフェース装置
１００６　表示装置
１００７　入力装置
１００８　出力装置

Claims

　言語モデルのパラメータを更新するための学習装置であって、
　前記言語モデルに基づいて、第一言語のコーパスを圧縮した第一圧縮ベクトルを生成する第一言語圧縮ベクトル生成部と、
　前記第一圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新する第一パラメータ更新部と、
　前記言語モデルに基づいて、第二言語のコーパスを圧縮した第二圧縮ベクトルを生成する第二言語圧縮ベクトル生成部と、
　前記第二圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新する第二パラメータ更新部と、
　それぞれ意味が同じテキストから生成された前記第一圧縮ベクトルと前記第二圧縮ベクトルの類似度を算出する類似度算出部と、
　前記類似度に基づいて、言語モデルのパラメータを更新する第三パラメータ更新部と、を備える、
　学習装置。
　前記類似度算出部は、前記第一圧縮ベクトルと前記第二圧縮ベクトルとのノルムまたはｃｏｓｉｎｅ距離を、前記類似度として算出し、
　前記第三パラメータ更新部は、前記ノルムまたは前記ｃｏｓｉｎｅ距離を最小化するように前記パラメータを更新する、
　請求項１に記載の学習装置。
　前記言語モデルは、第一言語の圧縮ベクトルを中間層に生成するエンコーダと、第二言語の圧縮ベクトルを中間層に生成するエンコーダと、を含むオートエンコーダである、
　請求項１または２に記載の学習装置。
　第一言語のテキストの第二言語の対訳文を出力するための対訳文出力装置であって、
　前記第一言語のテキストを圧縮して第一圧縮ベクトルを生成する第一言語圧縮ベクトル生成部と、
　前記第二言語の複数の対訳文候補を圧縮して第二圧縮ベクトルを生成する第二言語圧縮ベクトル生成部と、
　前記第一圧縮ベクトルと、それぞれの前記第二圧縮ベクトルとの類似度を算出する類似度算出部と、
　前記類似度に基づいて対訳文候補から対訳文を選択する対訳文選択部と、
　選択された前記対訳文を出力する出力部と、を備える、
　対訳文出力装置。
　言語モデルのパラメータを更新するための学習装置が実行する学習方法であって、
　前記言語モデルに基づいて、第一言語のコーパスを圧縮した第一圧縮ベクトルを生成するステップと、
　前記第一圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新するステップと、
　前記言語モデルに基づいて、第二言語のコーパスを圧縮した第二圧縮ベクトルを生成するステップと、
　前記第二圧縮ベクトルに基づいて、前記言語モデルのパラメータを更新するステップと、
　それぞれ意味が同じテキストから生成された前記第一圧縮ベクトルと前記第二圧縮ベクトルの類似度を算出するステップと、
　前記類似度に基づいて、言語モデルのパラメータを更新するステップと、を備える、
　学習方法。
　第一言語のテキストの第二言語の対訳文を出力するための対訳文出力装置が実行する対訳文出力方法であって、
　前記第一言語のテキストを圧縮して第一圧縮ベクトルを生成するステップと、
　前記第二言語の複数の対訳文候補を圧縮して第二圧縮ベクトルを生成するステップと、
　前記第一圧縮ベクトルと、それぞれの前記第二圧縮ベクトルとの類似度を算出するステップと、
　前記類似度に基づいて対訳文候補から対訳文を選択するステップと、
　選択された前記対訳文を出力するステップと、を備える、
　対訳文出力方法。
　コンピュータを、請求項１から３のいずれか１項に記載の学習装置における各部として機能させるためのプログラム、または、コンピュータを、請求項４に記載の対訳文出力装置における各部として機能させるためのプログラム。