JP2007034621A - Translation apparatus and translation method - Google Patents
Translation apparatus and translation method Download PDFInfo
- Publication number
- JP2007034621A JP2007034621A JP2005216035A JP2005216035A JP2007034621A JP 2007034621 A JP2007034621 A JP 2007034621A JP 2005216035 A JP2005216035 A JP 2005216035A JP 2005216035 A JP2005216035 A JP 2005216035A JP 2007034621 A JP2007034621 A JP 2007034621A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- language
- document data
- evaluation
- engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
本発明は、第1言語から第2言語に翻訳を行うことができる複数の翻訳エンジンの中から選択された翻訳エンジンを用いて翻訳を行う翻訳装置及び翻訳方法に関する。 The present invention relates to a translation apparatus and a translation method for performing translation using a translation engine selected from a plurality of translation engines capable of performing translation from a first language to a second language.
翻訳装置に関する技術として、自然言語の文に対する翻訳結果の確信度を算出し、この値によって後編集の対象となる訳文の提示順序を制御して後編集作業を効率化するもの(例えば、特許文献1参照。)や、訳語候補の確実性を識別可能に表示することにより、翻訳結果の検証を容易に行わせるため、翻訳文の評価を計算機で行い、機械翻訳文の質を自動的かつ客観的に評価するもの(例えば特許文献2参照。)がある。
ところで、一つの翻訳エンジンのみを用いて翻訳を行う場合は、高い翻訳精度で翻訳を行うものであるほど翻訳時間がかかることになる。しかしながら、ユーザーの要求は、例えば多少の翻訳精度の低下は許して翻訳の速度を求める等、多様であり、翻訳精度の高い一つの翻訳エンジンのみを用いている場合には、このような多様な要求には対応できない。このため、複数の翻訳エンジンを準備し、その中から選択した翻訳エンジンで翻訳を行うことを考えたが、最適な翻訳エンジンを選択することが難しいという問題があった。上記した特許文献2に記載の技術を利用して翻訳文の評価を計算機で行い機械翻訳文の質を自動的かつ客観的に評価して最適な翻訳エンジンを見つけることも可能ではある。しかし、特許文献2に記載された技術では、翻訳文の評価を計算機で行うため、画一的な評価となってしまい、柔軟性がないという問題があった。 By the way, when performing translation using only one translation engine, it takes longer to translate as the translation is performed with higher translation accuracy. However, the user's requirements are diverse, for example, the translation speed is allowed to allow a slight decrease in translation accuracy. If only one translation engine with high translation accuracy is used, such a variety of requests are required. Cannot respond to requests. For this reason, a plurality of translation engines are prepared and the translation engine selected from among them is considered for translation. However, there is a problem that it is difficult to select an optimal translation engine. It is also possible to find an optimum translation engine by automatically and objectively evaluating the quality of a machine translation sentence by evaluating the translation sentence with a computer using the technique described in Patent Document 2 described above. However, the technique described in Patent Document 2 has a problem that since the translation is evaluated by a computer, the evaluation is uniform and there is no flexibility.
本発明はこのような課題に鑑みてなされたものであり、その目的は、複数の翻訳エンジンを準備し、その中から選択した翻訳エンジンで翻訳を行わせる際に、柔軟性に富んだ選択ができる翻訳装置及び翻訳方法を提供することである。 The present invention has been made in view of such problems. The purpose of the present invention is to prepare a plurality of translation engines, and to perform a translation using a translation engine selected from the plurality of translation engines. A translation apparatus and a translation method that can be used.
上述の目的を達成するため、本発明は、第1言語の文書データ及び該文書データに関する利用環境情報を入力する翻訳元文書情報入力手段と、第1言語を第2言語に翻訳することができる複数の翻訳エンジンと、前記翻訳エンジン毎に利用環境情報に対応した評価値を記憶した記憶手段と、前記翻訳元文書情報入力手段で入力した前記利用環境情報と、前記記憶手段の記憶内容とを参照し、予め決められたルールに基づいて前記複数の翻訳エンジンの中から1の翻訳エンジンを選択し該翻訳エンジンによって前記文書データを翻訳させる翻訳制御手段と、該翻訳制御手段で選択された翻訳エンジンで翻訳した前記第2言語の文書データを出力する翻訳結果出力手段と、備えたことを特徴とする翻訳装置を提供する。 In order to achieve the above object, the present invention can translate source document information input means for inputting document data in the first language and usage environment information related to the document data, and can translate the first language into the second language. A plurality of translation engines; storage means storing evaluation values corresponding to use environment information for each translation engine; use environment information input by the translation source document information input means; and storage contents of the storage means. A translation control means for referring to and selecting one translation engine from the plurality of translation engines based on a predetermined rule and translating the document data by the translation engine; and the translation selected by the translation control means There is provided a translation apparatus comprising translation result output means for outputting document data of the second language translated by an engine.
これにより、翻訳元文書情報入力手段が、ユーザー端末機から第1言語の文書データ及び該文書データに関する利用環境情報を入力すると、翻訳制御手段が、入力された利用環境情報から記憶手段の記憶内容を参照し、予め決められたルールに基づいて複数の翻訳エンジンの中から1の翻訳エンジンを選択し、この翻訳エンジンで、入力された第1言語の文書データを第2言語に翻訳させることになり、翻訳結果返信手段が、翻訳した第2言語の文書データを出力する。これにより、ユーザーは、翻訳文を得ることができる。 Thus, when the translation source document information input means inputs the document data in the first language and the usage environment information related to the document data from the user terminal, the translation control means stores the stored contents of the storage means from the input usage environment information. , One translation engine is selected from a plurality of translation engines based on a predetermined rule, and the input document data of the first language is translated into the second language by this translation engine. Thus, the translation result reply means outputs the translated document data in the second language. Thereby, the user can obtain a translation.
この場合、前記翻訳元文書情報入力手段で入力した前記第1言語の文書データを前記複数の翻訳エンジンそれぞれで前記第2言語に翻訳させる評価用翻訳制御手段と、前記翻訳元文書情報入力手段で入力した前記第1言語の文書データ、該文書データに関する前記利用環境情報及び該文書データを前記複数の翻訳エンジンそれぞれで翻訳した前記第2言語の文書データを、評価者が使用する評価者端末機に送信する評価用送信手段と、前記評価者端末機からの評価情報を受信する評価情報受信手段と、前記評価情報受信手段で受信した前記評価情報に基づいて前記記憶手段の記憶内容を更新する更新手段と、を備えてもよい。 In this case, the translation control unit for evaluation for translating the document data of the first language input by the source document information input unit into the second language by each of the plurality of translation engines, and the source document information input unit The evaluator terminal that the evaluator uses the input document data of the first language, the usage environment information related to the document data, and the document data of the second language obtained by translating the document data by each of the plurality of translation engines. The evaluation information transmitting means for transmitting to the evaluation information, the evaluation information receiving means for receiving the evaluation information from the evaluator terminal, and the storage contents of the storage means are updated based on the evaluation information received by the evaluation information receiving means. Updating means.
これにより、評価用翻訳制御手段が、翻訳元文書情報入力手段で入力した第1言語の文書データを複数の翻訳エンジンそれぞれで第2言語に翻訳させることになり、評価用送信手段が、これらの第2言語の文書データを、その基になった第1言語の文書データ及び利用環境情報とともに、評価者端末機に送信する。すると、評価者が、これらを総合的に見て各翻訳エンジンを評価し、その評価情報を出力する。これを評価情報受信手段で受け取り、この評価情報に基づいて更新手段が記憶手段の記憶内容を必要に応じて更新する。次にユーザー端末機から第1言語の文書データ及び該文書データに関する利用環境情報を受信すると、翻訳制御手段は、入力された利用環境情報から、必要に応じて更新された記憶手段の記憶内容に基づいて複数の翻訳エンジンの中から1の翻訳エンジンを選択することになる。つまり、評価者の評価結果が次の翻訳時の翻訳エンジン選択に反映されることになるため、画一的にならずに、柔軟性に富んだ選択ができることになる。 Thus, the evaluation translation control means translates the document data of the first language input by the translation source document information input means into the second language by each of the plurality of translation engines, and the evaluation transmission means The document data in the second language is transmitted to the evaluator terminal together with the document data in the first language that is the basis and the usage environment information. Then, the evaluator comprehensively looks at these and evaluates each translation engine, and outputs the evaluation information. This is received by the evaluation information receiving means, and based on this evaluation information, the updating means updates the storage contents of the storage means as necessary. Next, when the document data in the first language and the usage environment information related to the document data are received from the user terminal, the translation control unit converts the input usage environment information into the storage contents of the storage unit updated as necessary. Based on this, one translation engine is selected from a plurality of translation engines. In other words, the evaluation result of the evaluator is reflected in the selection of the translation engine at the time of the next translation, so that the selection can be made with great flexibility without being uniform.
また、この場合、前記評価用送信手段は、前記翻訳元文書情報入力手段で受信した前記利用環境情報に基づいて最適な評価者端末機を選択し、該評価者端末機に、前記翻訳元文書情報入力手段で入力した前記第1言語の文書データ、該文書データに関する前記利用環境情報及び該文書データを前記複数の翻訳エンジンそれぞれで翻訳した前記第2言語の文書データを送信するようにしても良い。 In this case, the evaluation transmission unit selects an optimal evaluator terminal based on the usage environment information received by the translation source document information input unit, and the translation source document is sent to the evaluator terminal. The first language document data input by the information input means, the usage environment information relating to the document data, and the second language document data obtained by translating the document data by each of the plurality of translation engines may be transmitted. good.
これにより、評価用送信手段が、翻訳元文書情報入力手段で入力した利用環境情報に基づいて最適な評価者端末機を選択して送信を行うため、最適な評価者に評価してもらうことができる。したがって、翻訳エンジン選択が信頼性の高いものになる。 As a result, the evaluation transmitting means selects and transmits the optimum evaluator terminal based on the usage environment information input by the translation source document information input means. it can. Therefore, the translation engine selection is reliable.
また、本発明は、ユーザーが使用するユーザー端末機から第1言語の文書データ及び該文書データに関する利用環境情報を入力する翻訳元文書情報入力ステップと、前記翻訳エンジン毎に利用環境情報に対応した評価値を記憶手段に記憶する記憶ステップと、第1言語を第2言語に翻訳することができる複数の翻訳エンジンのうち、前記翻訳元文書情報入力ステップで入力した前記利用環境情報と、前記記憶手段の記憶内容とを参照し、予め決められたルールに基づいて前記複数の翻訳エンジンの中から1の翻訳エンジンを選択し該翻訳エンジンによって前記文書データを翻訳させる翻訳制御ステップと、該翻訳制御ステップで選択された翻訳エンジンで翻訳した前記第2言語の文書データを出力する翻訳結果出力ステップと、を備えたことを特徴とする翻訳方法としても提供可能である。 Further, the present invention corresponds to a translation source document information input step for inputting document data in a first language and usage environment information related to the document data from a user terminal used by the user, and the usage environment information for each translation engine. A storage step of storing the evaluation value in the storage means; the use environment information input in the source document information input step among the plurality of translation engines capable of translating the first language into the second language; and the storage A translation control step of referring to the stored contents of the means, selecting one translation engine from the plurality of translation engines based on a predetermined rule, and translating the document data by the translation engine, and the translation control A translation result output step of outputting the second language document data translated by the translation engine selected in the step It is provided as a translational wherein.
この場合、前記翻訳元文書情報入力ステップで入力した前記第1言語の文書データを前記複数の翻訳エンジンそれぞれで前記第2言語に翻訳させる評価用翻訳制御ステップと、前記翻訳元文書情報入力ステップで入力した前記第1言語の文書データ、該文書データに関する前記利用環境情報及び該文書データを前記複数の翻訳エンジンそれぞれで翻訳した前記第2言語の文書データを、評価者が使用する評価者端末機に送信する評価用送信ステップと、前記評価者端末機からの評価情報を受信する評価情報受信ステップと、前記評価情報受信ステップで受信した前記評価情報に基づいて前記記憶手段の記憶内容を更新する更新ステップと、を備えるようにしても良い。 In this case, an evaluation translation control step of translating the document data of the first language input in the source document information input step into the second language by each of the plurality of translation engines, and in the source document information input step The evaluator terminal that the evaluator uses the input document data of the first language, the usage environment information related to the document data, and the document data of the second language obtained by translating the document data by each of the plurality of translation engines. The content of the storage means is updated based on the evaluation information received in the evaluation information received step, the evaluation information receiving step for receiving evaluation information from the evaluator terminal, and the evaluation information receiving step. And an update step.
次に、発明を実施するための最良の形態としての実施形態について説明する。
本実施形態に係る翻訳装置11は、図1に示すように、ユーザーが使用するパーソナルコンピュータからなる複数のユーザー端末機12にインターネット等のネットワークを介して接続されるもので、評価者が使用するパーソナルコンピュータからなる複数の評価者端末機14にも同様にネットワーク(ネットワークは何れも図示せず)を介して接続されている。
Next, an embodiment as the best mode for carrying out the invention will be described.
As shown in FIG. 1, the
本実施形態に係る翻訳装置11は、第1言語(例えば英語)をこれとは異なる第2言語(例えば日本語)に翻訳するもので、図2に示す構成となっており、ネットワークを介して複数のユーザー端末機12に接続され、各ユーザー端末機12から翻訳の原文である第1言語の文書データ及びこの文書データに関する利用環境情報を受信する原文・利用環境受信部(翻訳元文書情報入力手段)21と、第1言語を第2言語に翻訳することができる複数、具体的には四つの翻訳エンジン1,2,3,4と、翻訳エンジン1〜4のそれぞれに対して設けられた翻訳エンジン用辞書部1A,2A,3A,4Aとを有している。
The
また、翻訳装置11は、原文・利用環境受信部21で受信した第1言語の文書データを複数の翻訳エンジン1〜4のうちの適宜選択された翻訳エンジンで第2言語に翻訳させる翻訳管理部(翻訳制御手段,翻訳結果返信手段,評価用翻訳制御手段)25と、原文・利用環境受信部21で受信した利用環境情報から、評価データベース(記憶手段)26の記憶内容等に基づいて複数の翻訳エンジン1〜4の中から1の翻訳エンジンを選択する翻訳エンジン選択部(翻訳制御手段)27とを有している。
The
上記した翻訳管理部25は、翻訳エンジン1〜4の中から翻訳エンジン選択部27で選択されたもので翻訳した第2言語の文書データを、その原文を送信してきたユーザー端末機12に返信する。また、翻訳管理部25は、原文・利用環境受信部21で受信した第1言語の文書データを複数の翻訳エンジン1〜4それぞれで第2言語に翻訳させる。
The
翻訳装置11は、複数の翻訳エンジン1〜4それぞれで翻訳した、これらの第2言語の文書データを、その原文である第1言語の文書データ及びこの文書データに関する利用環境情報とともに、評価者が使用する評価者端末機14に送信する評価用送信部(評価用送信手段)30と、任意の時間に評価者端末機14から出力される評価情報等を受信する評価情報受信部(評価情報受信手段)31と、評価情報受信部31で受信した評価情報に基づいて評価データベース26の記憶内容を更新する翻訳エンジン選択更新部(更新手段)32とを有している。つまり、複数の翻訳エンジン1〜4それぞれで翻訳した第2言語の文書データを、その原文である第1言語の文書データ及びこの文書データに関する利用環境情報とともに、評価用送信部30が評価者端末機14に送信すると、評価者が評価者端末機14を用いてそれぞれの翻訳エンジン1〜4の翻訳結果を評価して評価情報を翻訳装置11の評価情報受信部31に送信することになる。
The
また、翻訳装置11は、評価情報受信部31で評価者端末機14から受信した評価者による辞書情報で翻訳エンジン1〜4の翻訳エンジン用辞書部1A〜4Aのデータを更新する翻訳エンジン辞書更新部33を有している。つまり、評価者端末機14では、評価者が各翻訳エンジン1〜4の翻訳結果を評価し評価情報を入力することになるが、このときに、各翻訳エンジン1〜4で翻訳できない第1言語の語句があった場合に、評価者がこの第1言語の語句の第2言語への翻訳語を知っている場合に評価情報受信部31に送信する。すると、翻訳エンジン辞書更新部33がこの語句を翻訳できなかった翻訳エンジン1〜4の翻訳エンジン用辞書部1A〜4Aのデータをこの第1言語の語句と第2言語とを対応させて更新する。また、評価者端末機14では、評価者が各翻訳エンジン1〜4の翻訳結果を入力する際に、各翻訳エンジン1〜4で翻訳できない文章があった場合に、評価者がこの第1言語の文章の第2言語への翻訳文を自ら作成して評価情報受信部31に送信し、評価情報受信部31が、これを翻訳管理部25に出力して、翻訳管理部25がこの翻訳文をユーザー端末機12に返信可能となっている。
Moreover, the
ここで、評価用送信部30は、原文・利用環境受信部21で受信した利用環境情報に基づいて最適な評価者端末機14を一つ又は複数選択し、選択した評価者端末機14に、この利用環境情報とともに、原文・利用環境受信部21で受信した第1言語の文書データ及びこの第1言語の文書データを複数の翻訳エンジン1〜4それぞれで翻訳した第2言語の文書データを送信する。
Here, the
次に、本実施形態の翻訳装置を用いた翻訳方法を、図3〜図8に示す具体例を参照しつつ説明する。 Next, a translation method using the translation apparatus of this embodiment will be described with reference to specific examples shown in FIGS.
まず、翻訳装置11は、ユーザーが使用する所定のユーザー端末機12から、翻訳対象文である第1言語の文書データ及び該文書データに関する利用環境情報を原文・利用環境受信部21で受信する(翻訳元文書情報入力ステップ)。ここで、ユーザー端末機12がネットワークを介して本翻訳装置11と通信する状態にあって、本翻訳装置11に翻訳を依頼する作業時において、ユーザー端末機12において利用環境情報が入力される。この利用環境情報は、例えば、ユーザーが翻訳対象文をどのような目的で利用するのか、現在どのような状況なのか、どういう分野の文書であるのか、どれくらいの時間内に翻訳結果がほしいのか、求める翻訳精度はどれくらいであるのか等である。
First, the
次に、翻訳装置11は、原文・利用環境受信部21において、受信した利用環境状況のデータを数値化つまりベクトル化する。例えば、図3にX1で示すように、「A cherry tree seems to bloom in New York.How is that?」の翻訳対象文の文書データとともに、利用環境情報として、文書の種類がコミュニケーション文書であり、利用目的がプライベート利用であり、カテゴリとして季節文、あいさつ文が含まれ、翻訳時間30秒以内であり、求める翻訳精度80%であると、例えば、図3にX2で示すように、それぞれを変数とした利用環境ベクトルを作成する。この場合、文書種類を示す変数1がコミュニケーション文書が選択されたことを示す0となり、利用目的を示す変数2がプライベート利用であることを示す1となり、カテゴリを示す変数3が季節文を示す0となり、もう一つのカテゴリを示す変数4があいさつ文を示す2となり、翻訳時間を示す変数5が30秒以内を示す30であり、求める翻訳精度を示す変数6が80%を示す80となる。受信した利用環境状況がこのような6つの変数を持ったベクトルで表される。
Next, the
また、原文・利用環境受信部21において、受信した翻訳対象文の文書データを、利用環境状況のデータの一部として数値化つまりベクトル化しても良い。この場合、受信した翻訳対象文の文書データからtf.tf・idf等をベクトル成分に用いた文書ベクトルを作成する。上記した翻訳対象文である場合、例えば、図3にX3で示すように、「tree」を示す変数22が1となり、「York」を示す変数131が1となり、「New」を示す変数240が1となり、「cherry」を示す変数579が1となり、「that」を示す変数1300が1となり、「bloom」を示す変数2200が1となったベクトルで表すことになる。
Further, the original text / usage
次に、翻訳装置11は、搭載された第1言語を第2言語に翻訳することができる複数の翻訳エンジン1〜4のうち、上記した翻訳元文書情報入力ステップで受信した利用環境情報から翻訳管理部25が、翻訳エンジン選択部27に対して、評価データベース26の記憶内容(後述する)に基づいて1の翻訳エンジンを選択させる(翻訳エンジン選択ステップ)。翻訳エンジン選択部27では、上記した利用環境ベクトル等を入力して、翻訳エンジン選択ルールに従って翻訳エンジン1〜4のうちのいずれか一つを最適として選択する。そして、翻訳管理部25は、翻訳エンジン選択部27で選択された翻訳エンジン1〜4のうちのいずれか最適な一つへと翻訳元文書情報入力ステップで受信した第1言語の翻訳対象文を送り、翻訳を行わせて第2言語に翻訳させて、翻訳結果と翻訳時間とを受け取る(翻訳ステップ)。次に、翻訳管理部25は、受け取った翻訳結果と翻訳時間とをユーザー端末機12に返信する(翻訳結果返信ステップ)。
Next, the
ここで、翻訳エンジン選択部27の上記した翻訳エンジン選択ルールとしては、各翻訳エンジン1〜4のそれぞれに対して適正度を出す評価器1B〜4Bを作成し、各評価器1B〜4Bの評価値を比較して翻訳エンジン1〜4の中から最適な一つを選択するルール(以下、全翻訳エンジン評価ルール)と、翻訳エンジン1〜4の中の最適な一つを選択する翻訳エンジン評価器36により、翻訳エンジン1〜4の中から最適な一つを選択するルール(以下、最適翻訳エンジン選択ルール)とのうちのいずれか一方のルールを採用する。
Here, as the above-described translation engine selection rule of the translation
全翻訳エンジン評価ルールでは、利用環境ベクトルを翻訳エンジン選択部27に入力し、入力された利用環境ベクトルの各変数に対し例えば適宜の重み付けを行って適正度を予め設定されたマップ等にしたがって割り出す評価器1B〜4Bを各翻訳エンジン1〜4毎に用意しておき、翻訳エンジン選択部27が一の翻訳エンジン1用の評価器1Bで利用環境ベクトルを入力してこの翻訳エンジン1の適正度を出し、同様に、その他の各翻訳エンジン2〜3についても各評価器2B〜4Bでそれぞれ適正度を出す。そして、翻訳管理部25が最も適正度が高い翻訳エンジンに翻訳を行わせる。なお、利用環境ベクトルに換えて文書ベクトルを入力したり、利用環境ベクトルと文書ベクトルとを合わせて入力したりすることも可能であり、これらの場合、それぞれを入力として適正度を出力することになる。
In the all translation engine evaluation rules, the usage environment vector is input to the translation
図4に示すように、例えば、翻訳エンジン1〜4がある場合に、上記した変数1が0、変数2が1、変数3が0、変数4が2、変数5が30、変数6が80の利用環境ベクトルを翻訳エンジン1用の評価器1Bに入力すると、この評価器1Bは翻訳エンジン1の適正度60を出力し、同じ利用環境ベクトルを翻訳エンジン2用の評価器2Bに入力すると、この評価器2Bは翻訳エンジン2の適正度75を出力し、同じ利用環境ベクトルを翻訳エンジン3用の評価器3Bに入力すると、この評価器3Bは翻訳エンジン3の適正度40を出力し、同じ利用環境ベクトルを翻訳エンジン4用の評価器4Bに入力すると、この評価器4Bは翻訳エンジン4の適正度50を出力する。そして、翻訳エンジン1の適正度が二位、翻訳エンジン2の適正度が一位、翻訳エンジン3の適正度が四位、翻訳エンジン4の適正度が三位であることから、翻訳管理部25は、翻訳エンジン2の「ニューヨークでは桜が咲きそうです。そちらはいかがですか?」という翻訳結果を翻訳時間とともに対応するユーザー端末機12に返信する。
As shown in FIG. 4, for example, when there are translation engines 1 to 4, the above variable 1 is 0, variable 2 is 1,
最適翻訳エンジン選択ルールでは、利用環境ベクトルを翻訳エンジン選択部27に入力し、入力された利用環境ベクトルの各変数に対し例えば適宜の重み付けを行って予め設定されたマップ等にしたがって最適な翻訳エンジンを割り出す翻訳エンジン評価器36を用意しておき、翻訳エンジン選択部27が利用環境ベクトルを翻訳エンジン評価器36に入力して翻訳エンジン1〜4から最適なものを選択し、翻訳管理部25がこの最も適正度が高い翻訳エンジンで翻訳を行わせる。図5に示すように、例えば、上記した変数1が0、変数2が1、変数3が0、変数4が2、変数5が30、変数6が80の利用環境ベクトルを翻訳エンジン評価器36に入力すると、翻訳エンジン評価器36は、翻訳エンジン1〜4から最適な翻訳エンジンの識別番号を選択結果として出力する。
In the optimum translation engine selection rule, the use environment vector is input to the translation
上述した翻訳エンジン選択ステップ、翻訳ステップ及び翻訳結果返信ステップの翻訳プロセスとは別に、翻訳管理部25は、翻訳元文書情報入力ステップで受信した上記した翻訳対象文の文書データを複数の翻訳エンジン1〜4それぞれで第2言語に翻訳させる(評価用翻訳ステップ)。そして、翻訳管理部25は、評価用送信部30によって、翻訳対象文の文書データ、この文書データに関する利用環境情報及びこの文書データを評価用翻訳ステップで複数の翻訳エンジン1〜4それぞれで翻訳した翻訳結果である第2言語の文書データと、それぞれで翻訳した翻訳時間とをまとめて、評価者が使用する評価者端末機14に送信させる(評価用送信ステップ)。このとき、評価用送信部30は、翻訳対象文とともに受信した利用環境情報に基づいて最適な評価者端末機14を一つ又は複数選択し、選択した評価者端末機14に送信する。つまり、評価用送信部30は、利用環境ベクトルの各属性(得意な分野)等を用いて評価者を予めグループ分けしておき、評価に最適な評価者が使用する評価者端末機14群を選択して送信を行うのである。具体的に、上記した翻訳対象文に対して、例えば、図6にY1で示すように、翻訳エンジン1の翻訳結果である「桜はニューヨークで咲いているようです。咲きそうです。そちらはどうですか?」及びその翻訳時間の0.8秒と、翻訳エンジン2の翻訳結果である「ニューヨークでは桜が咲きそうです。そちらはいかがですか?」及びその翻訳時間の0.3秒と、翻訳エンジン3で翻訳が不可であったことを示す「翻訳不可」と、翻訳エンジン4の翻訳結果である「桜は新しいヨークでは咲きそうです。それはどうですか?」及びその翻訳時間の0.2秒とを、図6にY2で示すように、利用環境情報である文書の種類がコミュニケーション文書であり、利用目的がプライベート利用であり、カテゴリとして季節文、あいさつ文が含まれ、翻訳時間30秒以内であり、求める翻訳精度80%であることとを選択された評価者の評価者端末機14に送信する。
Apart from the translation process of the translation engine selection step, the translation step, and the translation result reply step described above, the
評価者は、翻訳装置11から受信した各翻訳エンジン1〜4の翻訳結果を評価者端末機14を用いて評価する。
The evaluator evaluates the translation result of each translation engine 1 to 4 received from the
上述した翻訳エンジン選択ルールとして、全翻訳エンジン評価ルールが採用された場合に、評価者は、各翻訳エンジン1〜4それぞれに対して、翻訳精度と、翻訳精度及び利用環境を考慮した適正度とを決めて各適正度を評価者端末機14から翻訳装置11の評価情報受信部31に出力する。例えば、図6にY3で示すように、翻訳エンジン1の翻訳結果が翻訳精度80及び適正度60であり、翻訳エンジン2の翻訳結果が翻訳精度90及び適正度80であり、翻訳エンジン3の翻訳結果が翻訳精度0及び適正度0であり、翻訳エンジン4の翻訳結果が翻訳精度50及び適正度60であることを翻訳装置11に出力する。
When all the translation engine evaluation rules are adopted as the translation engine selection rules described above, the evaluator determines the translation accuracy and the appropriateness considering the translation accuracy and the usage environment for each of the translation engines 1 to 4. The appropriateness is output from the
また、上述した翻訳エンジン選択ルールとして、最適翻訳エンジン選択ルールが採用された場合に、評価者は、各翻訳エンジン1〜4のうち最も適しているものを選択決定し選択結果を評価者端末機14から翻訳装置11の評価情報受信部31に出力する。例えば、図6にY4で示すように、最適な翻訳エンジンとしての翻訳エンジン2を翻訳装置11に出力する。なお、評価者は、例えばすべての翻訳エンジン1〜4の翻訳結果が適正でないと判断した場合には、任意で自ら翻訳文を作成して評価者端末機14から翻訳装置11に出力することも可能である。この場合、翻訳装置11は評価情報受信部31で受信したこの評価者作成の翻訳文をも翻訳管理部25がユーザー端末機12に返信することになる。例えば、図6にY5で示すように、「ニューヨークでは桜が咲きそうです。そちらはいかがですか?」の翻訳文をユーザー端末機12に返信する。
Further, when the optimum translation engine selection rule is adopted as the translation engine selection rule described above, the evaluator selects and determines the most suitable one of the translation engines 1 to 4 and determines the selection result as the evaluator terminal. 14 to the
翻訳装置11では、評価情報受信部31で受信した評価者の評価結果を翻訳エンジン選択更新部32が評価データベース26に蓄積することで評価データベース26の記憶内容を更新する。
In the
翻訳エンジン選択ルールとして、全翻訳エンジン評価ルールが採用された場合には、図7にZ1で示すように、次に同じ利用環境ベクトルが入力されると、翻訳エンジン選択更新部32が、翻訳エンジン選択部27の全翻訳エンジン1〜4に対して作成された各評価器1B〜4Bに、利用環境ベクトルに加えて評価データベース26に記憶された評価者のつけた図7にZ2で示す翻訳精度及び適正度を入力することになり、各評価器1B〜4Bは、この評価者のつけた翻訳精度及び適正度を例えば別途の重み付けをして加えることで各翻訳エンジン1〜4の適正度を割り出す。例えば、図7にZ3で示すように、変数1が0、変数2が1、変数3が0、変数4が2、変数5が30、変数6が80の利用環境ベクトルと、評価された翻訳エンジン1の適正度を示す変数7の60とを翻訳エンジン1用の評価器1Bに入力することになる。同様にして、同じ利用環境ベクトルと、評価された翻訳エンジン2の適正度を示す変数7の80とを翻訳エンジン2用の評価器2Bに入力し、同じ利用環境ベクトルと、評価された翻訳エンジン3の適正度を示す変数7の0とを翻訳エンジン3用の評価器3Bに入力し、同じ利用環境ベクトルと、評価された翻訳エンジン4の適正度を示す変数7の60とを翻訳エンジン4用の評価器4Bに入力することになる。そして、各評価器1B〜4Bが入力データに基づいて各翻訳エンジン1〜4の適正度を割り出す。このような評価者の評価値に基づく機械学習によって評価器1B〜4Bを更新する。
When all the translation engine evaluation rules are adopted as the translation engine selection rules, when the same use environment vector is input next, as shown by Z1 in FIG. The evaluators 1B to 4B created for all the translation engines 1 to 4 of the
また、最適翻訳エンジン選択ルールが採用された場合には、図8にW1で示すように、次に同じ利用環境ベクトルが入力されると、翻訳エンジン選択更新部32が、翻訳エンジン選択部27の翻訳エンジン評価器36に、利用環境ベクトルに加えて評価データベース26に記憶された評価者のつけた図8にW2で示す最適な翻訳エンジンの識別を入力することになり、翻訳エンジン評価器36は、この評価者のつけた最適な翻訳エンジンの識別を例えば別途の重み付けをして加えることで最適な翻訳エンジンを割り出す。例えば、図8にW3で示すように、変数1が0、変数2が1、変数3が0、変数4が2、変数5が30の利用環境ベクトルと、最適と評価されたものを示す変数6の翻訳エンジン2を示す2とを翻訳エンジン評価器36に入力することになる。そして、翻訳エンジン評価器36が入力データに基づいて最適な翻訳エンジンを割り出す。このような評価者の評価値に基づく機械学習によって翻訳エンジン評価器36を更新する。
When the optimum translation engine selection rule is adopted, when the same use environment vector is input next, as shown by W1 in FIG. 8, the translation engine
以上に述べたように、本実施形態によれば、原文・利用環境受信部21が、ユーザー端末機12から第1言語の文書データ及び該文書データに関する利用環境情報を受信すると、翻訳管理部25が、受信した利用環境情報から評価データベース26の記憶内容および予め定められたルールに基づいて複数の翻訳エンジン1〜4の中から最適な翻訳エンジンを選択しこの翻訳エンジンで、受信した第1言語の文書データを第2言語に翻訳させることになり、翻訳した第2言語の文書データをユーザー端末機12に返信する。これにより、ユーザー端末機12で翻訳文を受け取ることができる。
その一方で、翻訳管理部25が原文・利用環境受信部21で受信した第1言語の文書データを複数の翻訳エンジン1〜4それぞれで第2言語に翻訳させることになり、評価用送信部30が、これらの第2言語の文書データを、そのもとになった第1言語の文書データ及び利用環境情報とともに、評価者端末機14に送信する。すると、評価者が、これらを総合的に見て各翻訳エンジン1〜4を評価し、その評価情報を出力する。これを評価情報受信部31で受け取り、この評価情報に基づいて翻訳エンジン選択更新部32が評価データベース26の記憶内容を必要に応じて更新する。すると、次にユーザー端末機12から第1言語の文書データ及び該文書データに関する利用環境情報を受信すると、翻訳管理部25は、受信した利用環境情報から、必要に応じて更新された評価データベース26の記憶内容に基づいて複数の翻訳エンジン1〜4の中から1の翻訳エンジンを選択することになる。つまり、評価者の評価結果が、次の翻訳時の翻訳エンジン1〜4の中から最適なものの選択に反映されることになるため、画一的にならずに、柔軟性に富んだ選択ができることになる。
As described above, according to the present embodiment, when the original text / usage
On the other hand, the
また、評価用送信部30は、原文・利用環境受信部21で受信した利用環境情報に基づいて最適な評価者端末機14を選択して評価用の送信を行うため、最適な評価者に評価してもらうことができる。したがって、翻訳エンジン1〜4のうちの最適なものの選択が信頼性の高いものになる。
Further, the
なお、翻訳エンジン辞書更新部33は、翻訳エンジン1〜4のうちの評価者の評価が最も高かった翻訳エンジンの翻訳文を用いてその翻訳エンジン以外の翻訳エンジンの辞書を更新するようにしても良い。
The translation engine
また、図9に示すように、翻訳管理部25にカスタマイズデータ用のカスタマイズデータベース40を設けても良い。このようにすれば、全ての翻訳エンジン1〜4の翻訳結果を翻訳管理部25に一時的に記憶して翻訳文をユーザー側に提供した時点で翻訳結果を解放するのではなく、ユーザー指定の記憶時間、記憶容量にしたがって全ての翻訳エンジン1〜4の翻訳結果及び評価者作成の翻訳文を随時記憶するようにできる。これらの翻訳結果は、翻訳エンジン1〜4の中の最適なものによる翻訳結果をユーザーに送信後、ユーザーが次の順位の翻訳結果を求める場合、さらに次の順位の翻訳結果を求める場合に翻訳結果を提供可能となる。ユーザーの要求によっては、翻訳エンジン1〜4及び評価者の指定をすることもできる。記憶された翻訳文はユーザーの操作によって解放することもできる。
Further, as shown in FIG. 9, the
また、以下のようなユーザーのカスタマイズ機能を追加することも可能である。各翻訳エンジン1〜4のパラメータ、翻訳選択手法のパラメータ、ユーザーが使用した翻訳文に対する評価データ等をカスタマイズデータに記憶し、定期的にユーザーに提供する。ユーザーは、翻訳利用時に翻訳装置11にカスタマイズデータを送信する。データから翻訳エンジン1〜4が更新され、ユーザーの翻訳履歴を反映した翻訳環境によって翻訳エンジン選択部27が生成される。これにより、ユーザーにカスタマイズされた翻訳結果と一般的な翻訳結果の両方を取得することができる。
In addition, the following user customization functions can be added. The parameters of each translation engine 1 to 4, the parameters of the translation selection method, the evaluation data for the translation used by the user are stored in the customized data, and are provided to the user periodically. The user transmits customization data to the
さらに、ユーザー端末12内に翻訳装置11を内蔵した場合であっても、本発明は適用可能である。この場合、翻訳装置11の原文・利用環境受信部21が、直接ユーザーからの操作を受けて原文・利用環境情報が入力される入力部として機能することになる。
Furthermore, the present invention is applicable even when the
1〜4…翻訳エンジン、11…翻訳装置、12…ユーザー端末機、14…評価者端末機、21…原文・利用環境受信部(翻訳元文書情報入力手段)、25…辞書管理部(翻訳制御手段、翻訳結果返信手段、評価用翻訳制御手段)、26…評価データベース(記憶手段)、27…翻訳エンジン選択部(翻訳制御手段)、30…評価用送信部(評価用送信手段)、31…評価情報受信部(評価情報受信手段)、32…翻訳エンジン選択更新部(更新手段)。 DESCRIPTION OF SYMBOLS 1-4 ... Translation engine, 11 ... Translation apparatus, 12 ... User terminal, 14 ... Evaluator terminal, 21 ... Original text / use environment receiving part (translation source document information input means), 25 ... Dictionary management part (translation control) Means, translation result reply means, evaluation translation control means), 26 ... evaluation database (storage means), 27 ... translation engine selection section (translation control means), 30 ... evaluation transmission section (evaluation transmission means), 31 ... Evaluation information receiver (evaluation information receiver), 32... Translation engine selection updater (updater).
Claims (5)
第1言語を第2言語に翻訳することができる複数の翻訳エンジンと、
前記翻訳エンジン毎に利用環境情報に対応した評価値を記憶した記憶手段と、
前記翻訳元文書情報入力手段で入力した前記利用環境情報と、前記記憶手段の記憶内容とを参照し、予め決められたルールに基づいて前記複数の翻訳エンジンの中から1の翻訳エンジンを選択し該翻訳エンジンによって前記文書データを翻訳させる翻訳制御手段と、
該翻訳制御手段で選択された翻訳エンジンで翻訳した前記第2言語の文書データを出力する翻訳結果出力手段と、を備えた
ことを特徴とする翻訳装置。 Translation source document information input means for inputting document data in the first language and usage environment information related to the document data;
A plurality of translation engines capable of translating the first language into the second language;
Storage means for storing an evaluation value corresponding to use environment information for each translation engine;
With reference to the usage environment information input by the translation source document information input means and the storage contents of the storage means, one translation engine is selected from the plurality of translation engines based on a predetermined rule. Translation control means for translating the document data by the translation engine;
Translation apparatus comprising: translation result output means for outputting the document data of the second language translated by the translation engine selected by the translation control means.
前記翻訳元文書情報入力手段で入力した前記第1言語の文書データ、該文書データに関する前記利用環境情報及び該文書データを前記複数の翻訳エンジンそれぞれで翻訳した前記第2言語の文書データを、評価者が使用する評価者端末機に送信する評価用送信手段と、
前記評価者端末機からの評価情報を受信する評価情報受信手段と、
前記評価情報受信手段で受信した前記評価情報に基づいて前記記憶手段の記憶内容を更新する更新手段と、を備えた
ことを特徴とする請求項1記載の翻訳装置。 Translation control means for evaluation for translating the document data of the first language input by the translation source document information input means into the second language by each of the plurality of translation engines;
The first language document data input by the translation source document information input means, the usage environment information related to the document data, and the second language document data obtained by translating the document data by each of the plurality of translation engines are evaluated. Transmitting means for evaluation to be transmitted to the evaluator terminal used by the person,
Evaluation information receiving means for receiving evaluation information from the evaluator terminal;
The translation apparatus according to claim 1, further comprising: an updating unit that updates a storage content of the storage unit based on the evaluation information received by the evaluation information receiving unit.
ことを特徴とする請求項2記載の翻訳装置。 The evaluation transmission means selects an optimal evaluator terminal based on the usage environment information received by the translation source document information input means, and inputs to the evaluator terminal by the translation source document information input means. 3. The second language document data, the usage environment information related to the document data, and the second language document data obtained by translating the document data by the plurality of translation engines, respectively, are transmitted. Translation device.
前記翻訳エンジン毎に利用環境情報に対応した評価値を記憶手段に記憶する記憶ステップと、
第1言語を第2言語に翻訳することができる複数の翻訳エンジンのうち、前記翻訳元文書情報入力ステップで入力した前記利用環境情報と、前記記憶手段の記憶内容とを参照し、予め決められたルールに基づいて前記複数の翻訳エンジンの中から1の翻訳エンジンを選択し該翻訳エンジンによって前記文書データを翻訳させる翻訳制御ステップと、
該翻訳制御ステップで選択された翻訳エンジンで翻訳した前記第2言語の文書データを出力する翻訳結果出力ステップと、を備えた
ことを特徴とする翻訳方法。 A translation source document information input step of inputting document data in the first language and usage environment information related to the document data from a user terminal used by the user;
A storage step of storing an evaluation value corresponding to use environment information for each translation engine in a storage unit;
Of the plurality of translation engines capable of translating the first language into the second language, the use environment information input in the translation source document information input step and the storage contents of the storage means are referred to and determined in advance. A translation control step of selecting one translation engine from the plurality of translation engines based on the rule and translating the document data by the translation engine;
A translation result output step of outputting the second language document data translated by the translation engine selected in the translation control step.
前記翻訳元文書情報入力ステップで入力した前記第1言語の文書データ、該文書データに関する前記利用環境情報及び該文書データを前記複数の翻訳エンジンそれぞれで翻訳した前記第2言語の文書データを、評価者が使用する評価者端末機に送信する評価用送信ステップと、
前記評価者端末機からの評価情報を受信する評価情報受信ステップと、
前記評価情報受信ステップで受信した前記評価情報に基づいて前記記憶手段の記憶内容を更新する更新ステップと、を備えた
ことを特徴とする請求項4記載の翻訳方法。 A translation control step for evaluation for translating the document data of the first language input in the translation source document information input step into the second language by each of the plurality of translation engines;
The first language document data input in the translation source document information input step, the usage environment information related to the document data, and the second language document data obtained by translating the document data by each of the plurality of translation engines are evaluated. A transmission step for evaluation to be transmitted to the evaluator terminal used by the person,
An evaluation information receiving step for receiving evaluation information from the evaluator terminal;
The translation method according to claim 4, further comprising an update step of updating the storage content of the storage unit based on the evaluation information received in the evaluation information receiving step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005216035A JP2007034621A (en) | 2005-07-26 | 2005-07-26 | Translation apparatus and translation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005216035A JP2007034621A (en) | 2005-07-26 | 2005-07-26 | Translation apparatus and translation method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007034621A true JP2007034621A (en) | 2007-02-08 |
Family
ID=37793813
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005216035A Pending JP2007034621A (en) | 2005-07-26 | 2005-07-26 | Translation apparatus and translation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007034621A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013190975A (en) * | 2012-03-13 | 2013-09-26 | Yahoo Japan Corp | Translation control device, translation control method and translation control program |
JP2018022269A (en) * | 2016-08-02 | 2018-02-08 | 国立研究開発法人情報通信研究機構 | Automatic translation system, automatic translation method, and program |
JP2018207339A (en) * | 2017-06-06 | 2018-12-27 | 池上通信機株式会社 | Monitor system for broadcasting |
CN110991194A (en) * | 2019-11-27 | 2020-04-10 | 语联网(武汉)信息技术有限公司 | Engine optimization method based on OpenKiwi evolution and translation system |
CN110991193A (en) * | 2019-11-27 | 2020-04-10 | 语联网(武汉)信息技术有限公司 | Translation matrix model selection system based on OpenKiwi |
-
2005
- 2005-07-26 JP JP2005216035A patent/JP2007034621A/en active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013190975A (en) * | 2012-03-13 | 2013-09-26 | Yahoo Japan Corp | Translation control device, translation control method and translation control program |
JP2018022269A (en) * | 2016-08-02 | 2018-02-08 | 国立研究開発法人情報通信研究機構 | Automatic translation system, automatic translation method, and program |
JP2018207339A (en) * | 2017-06-06 | 2018-12-27 | 池上通信機株式会社 | Monitor system for broadcasting |
CN110991194A (en) * | 2019-11-27 | 2020-04-10 | 语联网(武汉)信息技术有限公司 | Engine optimization method based on OpenKiwi evolution and translation system |
CN110991193A (en) * | 2019-11-27 | 2020-04-10 | 语联网(武汉)信息技术有限公司 | Translation matrix model selection system based on OpenKiwi |
CN110991194B (en) * | 2019-11-27 | 2023-05-16 | 语联网(武汉)信息技术有限公司 | Engine optimization method and translation system based on OpenKiwi evolution |
CN110991193B (en) * | 2019-11-27 | 2023-06-09 | 语联网(武汉)信息技术有限公司 | OpenKiwi-based translation matrix model selection system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110008316B (en) | Relay chat robot linked to multiple chat robots | |
CN110321413B (en) | Session framework | |
US8655644B2 (en) | Language translation in an environment associated with a virtual application | |
CN109635094B (en) | Method and device for generating answer | |
CN110874403B (en) | Question answering system, question answering processing method, and question answering integration system | |
KR20190080599A (en) | Method and server for providing semi-automatic communication using chatbot and consultant | |
US20210049210A1 (en) | Information provision device, information provision method, and program | |
KR20200137601A (en) | Apparatus and method for processing of question and answer using chatbot | |
CN110391918A (en) | Utilize communication channel recommender system, method and the computer-readable medium of machine learning | |
JP2007034621A (en) | Translation apparatus and translation method | |
EP3486842A1 (en) | Template generation for a conversational agent | |
EP1288793A1 (en) | Translation text management system | |
US11063887B2 (en) | Information processing apparatus, user terminal apparatus, and control method | |
US9058090B1 (en) | Collaborative information sharing in a virtual world | |
CN111967599A (en) | Method and device for training model, electronic equipment and readable storage medium | |
JPWO2018134878A1 (en) | Multilingual communication system and multilingual communication providing method | |
Nicklas et al. | Adding high-level reasoning to efficient low-level context management: A hybrid approach | |
KR20020010226A (en) | Internet Anything Response System | |
JP4824043B2 (en) | Knowledge structure construction method of natural language dialogue agent, automatic response creation method and automatic response creation apparatus using knowledge structure | |
JP2019003666A (en) | Multi-language communication system and multi-language communication provision method | |
JPH1051483A (en) | Matching method and device for electronic mail | |
JP2020027549A (en) | Argument analyzer and program | |
JP4773774B2 (en) | Network service system, service guidance device, user device, service guidance method, program, and information storage medium | |
JP4494901B2 (en) | Resource search method and resource search system | |
JP5084760B2 (en) | Scenario development support apparatus and scenario development support method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110412 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110613 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111220 |