JP2015121992A - Translation device, translation model learning device, method, and program - Google Patents

Translation device, translation model learning device, method, and program Download PDF

Info

Publication number
JP2015121992A
JP2015121992A JP2013266046A JP2013266046A JP2015121992A JP 2015121992 A JP2015121992 A JP 2015121992A JP 2013266046 A JP2013266046 A JP 2013266046A JP 2013266046 A JP2013266046 A JP 2013266046A JP 2015121992 A JP2015121992 A JP 2015121992A
Authority
JP
Japan
Prior art keywords
learning
sentence
word
translation
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013266046A
Other languages
Japanese (ja)
Other versions
JP5973986B2 (en
Inventor
仙 吉田
Sen Yoshida
吉田  仙
孝文 引地
Takafumi Hikichi
孝文 引地
太一 片山
Taichi Katayama
太一 片山
鈴木 潤
Jun Suzuki
潤 鈴木
克仁 須藤
Katsuto Sudo
克仁 須藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013266046A priority Critical patent/JP5973986B2/en
Publication of JP2015121992A publication Critical patent/JP2015121992A/en
Application granted granted Critical
Publication of JP5973986B2 publication Critical patent/JP5973986B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To translate with good accuracy even when a word not desired to be translated is included in a sentence.SOLUTION: A virtual word replacement unit 52 replaces a word not desired to be translated included in an inputted original language sentence with a virtual word, and allows a virtual word holding unit 54 to hold a combination of the virtual word, the word not desired to be translated and character position information of the virtual word. A translation processing unit 58 generates a translation sentence in a target language with respect to the original language sentence in which the character position information in the original language sentence is added, based on the original language sentence acquired by the replacement by the virtual word replacement unit 52 and a translation model learned in advance. A virtual word restoration unit 60 replaces the virtual word included in the generated translation sentence in the target language with the word not desired to be translated, based on the held combination of the virtual word, the word not desired to be translated and the character position information of the virtual word and the character position information added to the translation sentence in the target language generated by the translation processing unit 58.

Description

本発明は、翻訳装置、翻訳モデル学習装置、方法、及びプログラムに関する。   The present invention relates to a translation device, a translation model learning device, a method, and a program.

従来は、原言語の翻訳したくない語については、翻訳したくない語、凍結単語、解凍単語という3つの組の照合表を用意し、翻訳する前に、翻訳したくない語を凍結単語に変換し、翻訳した後に、凍結単語を解凍単語に変換するという方式や新しい辞書を用意するという方式があった(例えば非特許文献1参照)。   Conventionally, for words that you do not want to translate in the source language, prepare three sets of collation tables: words that you do not want to translate, frozen words, and decompressed words. After conversion and translation, there are a method of converting a frozen word into a decompressed word and a method of preparing a new dictionary (for example, see Non-Patent Document 1).

岡田 昌也、佐藤 理史、「大規模訳語候補集合を利用した専門用語翻訳」、2010、The 24th Annual Conference of the Japanese Society for Artificial Intelligence.Masaya Okada, Satoshi Sato, `` Terminology translation using large candidate set '', 2010, The 24th Annual Conference of the Japanese Society for Artificial Intelligence.

しかし、数式や化学式や国名等を単純に翻訳したくないとき、すべての組み合わせを照合表に加える、辞書化するというのは不可能である。   However, if you do not want to simply translate mathematical formulas, chemical formulas, country names, etc., it is impossible to add all combinations to the collation table and create a dictionary.

そこで、パターン等を用いて数式や化学式、国名等の箇所を特定し、各種同一の仮想単語に置き換えるという手法が考えられるが、同じ文に単純に翻訳したくないものが複数出現した場合や、同カテゴリのものが複数存在する場合には、それらの単語は同じ仮想単語で置換されるため、それらを元に戻すことが困難である。   Therefore, it is conceivable to identify places such as mathematical formulas, chemical formulas, country names, etc. using patterns, etc., and replace them with various identical virtual words, but if there are multiple things that you do not want to simply translate into the same sentence, When there are a plurality of items of the same category, those words are replaced with the same virtual word, and it is difficult to restore them.

本発明は、上記の事情に鑑みてなされたもので、翻訳したくない語が文に含まれる場合であっても、精度よく翻訳することができる翻訳装置、翻訳モデル学習装置、方法、及びプログラムを提供することを目的とする。   The present invention has been made in view of the above circumstances, and a translation device, a translation model learning device, a method, and a program that can accurately translate even if a sentence includes a word that is not desired to be translated The purpose is to provide.

上記目的を達成するために、本発明の翻訳装置は、入力された原言語の文を目的言語の文へ翻訳する翻訳装置であって、前記入力された原言語の文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせを、仮想単語保持部に保持させる仮想単語置換部と、前記仮想単語置換部による置き換えによって得られた前記原言語の文と、原言語の文を目的言語の文へ翻訳するための予め学習された翻訳モデルとに基づいて、前記原言語の文における位置情報が付与された、前記原言語の文に対する前記目的言語の翻訳文を生成する翻訳処理部と、前記仮想単語保持部によって保持された前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせ、及び前記翻訳処理部によって生成された前記目的言語の翻訳文に付与された前記位置情報に基づいて、前記翻訳処理部によって生成された前記目的言語の翻訳文に含まれる前記仮想単語を、前記翻訳したくない語に置き換える仮想単語復元部と、を含んで構成される。   In order to achieve the above object, a translation apparatus according to the present invention is a translation apparatus that translates an input source language sentence into a target language sentence, and is intended to translate the input source language sentence. A virtual word predetermined for a category to which the word that does not want to be translated belongs, and a combination of the virtual word, the word that is not desired to be translated, and the position information of the virtual word, A virtual word replacement unit to be stored in the storage unit, the source language sentence obtained by the replacement by the virtual word replacement unit, and a pre-learned translation model for translating the source language sentence into a target language sentence; A translation processing unit for generating a translation sentence of the target language for the sentence of the source language, to which position information in the sentence of the source language is given, and the virtual held by the virtual word holding unit Based on the combination of the word, the word that the user does not want to translate and the position information of the virtual word, and the position information given to the translated sentence of the target language generated by the translation processing section, the translation processing section A virtual word restoration unit that replaces the virtual word contained in the generated translation of the target language with the word that is not desired to be translated.

本発明の翻訳方法は、仮想単語置換部、翻訳処理部、及び仮想単語復元部を含み、入力された原言語の文を目的言語の文へ翻訳する翻訳装置における翻訳方法であって、前記仮想単語置換部が、前記入力された原言語の文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせを、仮想単語保持部に保持させるステップと、前記翻訳処理部が、前記仮想単語置換部による置き換えによって得られた前記原言語の文と、原言語の文を目的言語の文へ翻訳するための予め学習された翻訳モデルとに基づいて、前記原言語の文における位置情報が付与された、前記原言語の文に対する前記目的言語の翻訳文を生成するステップと、前記仮想単語復元部が、前記仮想単語保持部によって保持された前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせ、及び前記翻訳処理部によって生成された前記目的言語の翻訳文に付与された前記位置情報に基づいて、前記翻訳処理部によって生成された前記目的言語の翻訳文に含まれる前記仮想単語を、前記翻訳したくない語に置き換えるステップと、を含んで構成される。   The translation method according to the present invention is a translation method in a translation apparatus that includes a virtual word replacement unit, a translation processing unit, and a virtual word restoration unit, and translates an input source language sentence into a target language sentence. The word replacement unit replaces a word that is not desired to be translated included in the input source language sentence with a virtual word that is predetermined for a category to which the word that does not want to be translated belongs, and the virtual word and the A step of causing a virtual word holding unit to hold a combination of a word that is not to be translated and position information of the virtual word; and a sentence in the source language obtained by the translation processing unit being replaced by the virtual word replacing unit The target language for the sentence in the source language, to which position information in the sentence in the source language is given based on a previously learned translation model for translating the sentence in the source language into a sentence in the target language Generating a translated sentence, a combination of the virtual word held by the virtual word holding unit, the word not to be translated and the position information of the virtual word, and the translation process A word that the virtual word included in the translation of the target language generated by the translation processing unit is not to be translated based on the position information given to the translation of the target language generated by the unit And a step of replacing.

また、本発明の翻訳モデル学習装置は、原言語の文を目的言語の文へ翻訳するための翻訳モデルを学習する翻訳モデル学習装置であって、前記原言語の学習用文と前記原言語の学習用文に対する翻訳文である目的言語の学習用文との複数のペアである学習データを受け付ける学習用入力部と、前記学習データの前記複数のペアの各々について、前記ペアの前記原言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記ペアの前記目的言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換える学習用仮想単語置換部と、前記学習用仮想単語置換部による置き換えによって得られた前記原言語の学習用文と前記目的言語の学習用文との複数のペアに基づいて、前記翻訳モデルを学習する学習処理部と、を含んで構成される。   The translation model learning device of the present invention is a translation model learning device that learns a translation model for translating a source language sentence into a target language sentence, the source language learning sentence and the source language learning sentence. A learning input unit that receives learning data that is a plurality of pairs with a learning sentence of a target language that is a translated sentence for the learning sentence, and for each of the plurality of pairs of the learning data, the source language of the pair A word that is not desired to be translated included in the learning sentence is replaced with a virtual word that is predetermined for the category to which the word that is not desired to be translated, and a translation that is included in the learning sentence of the target language of the pair is translated. The learning virtual word replacement unit that replaces a word that the user does not want to replace with a virtual word predetermined for the category to which the word that the user does not want to translate belongs, and is obtained by replacement by the learning virtual word replacement unit. The on the basis of the plurality of pairs of the learning sentence of the source language learning sentence of the target language, and contains a learning processing unit that learns the translation model.

本発明の翻訳モデル学習方法は、学習用入力部、学習用仮想単語置換部、及び学習処理部を含み、原言語の文を目的言語の文へ翻訳するための翻訳モデルを学習する翻訳モデル学習装置における翻訳モデル学習方法であって、前記学習用入力部が、前記原言語の学習用文と前記原言語の学習用文に対する翻訳文である目的言語の学習用文との複数のペアである学習データを受け付けるステップと、前記学習用仮想単語置換部が、前記学習データの前記複数のペアの各々について、前記ペアの前記原言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記ペアの前記目的言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えるステップと、前記学習処理部が、前記学習用仮想単語置換部による置き換えによって得られた前記原言語の学習用文と前記目的言語の学習用文との複数のペアに基づいて、前記翻訳モデルを学習するステップと、を含んで構成される。   The translation model learning method of the present invention includes a learning input unit, a learning virtual word replacement unit, and a learning processing unit, and learns a translation model for translating a source language sentence into a target language sentence. In the translation model learning method in the apparatus, the learning input unit is a plurality of pairs of a learning sentence in the source language and a learning sentence in a target language that is a translation sentence for the learning sentence in the source language. A step of receiving learning data, and the virtual word replacement unit for learning, for each of the plurality of pairs of the learning data, translates a word that is not desired to be included in the source language learning sentence of the pair Replace with a virtual word predetermined for the category to which the word you do not want to belong, and the word you do not want to translate included in the target language learning sentence of the pair belongs to the word you do not want to translate A step of substituting a predetermined virtual word for a category, and the learning processing unit includes a learning sentence in the source language and a learning sentence in the target language obtained by the replacement by the virtual word replacement unit for learning. Learning the translation model based on the plurality of pairs.

また、翻訳モデル学習装置及び翻訳モデル学習方法における学習処理部は、前記学習用仮想単語置換部による置き換えによって得られた前記原言語の学習用文と前記目的言語の学習用文との複数のペア、又は前記原言語の学習用文の句と前記原言語の学習用文の句に対する翻訳である目的言語の学習用文の句との複数のペアの各々について、前記仮想単語の数が一致しないペアを除去し、前記翻訳モデルを学習するようにすることができる。   In the translation model learning device and the translation model learning method, the learning processing unit includes a plurality of pairs of the source language learning sentence and the target language learning sentence obtained by the replacement by the learning virtual word replacement unit. Or the number of the virtual words does not match for each of a plurality of pairs of the learning sentence phrase of the source language and the learning sentence phrase of the target language that is a translation of the learning sentence phrase of the source language Pairs can be removed to learn the translation model.

また、本発明のプログラムは、コンピュータを、上記の翻訳装置、又は上記の翻訳モデル学習装置の各部として機能させるためのプログラムである。   Moreover, the program of this invention is a program for functioning a computer as each part of said translation apparatus or said translation model learning apparatus.

以上説明したように、本発明の翻訳装置、方法、及びプログラムによれば、入力された原言語の文に含まれる翻訳したくない語を、仮想単語に置き換えると共に、仮想単語と翻訳したくない語と仮想単語の位置情報との組み合わせを保持させ、置き換えによって得られた原言語の文と、予め学習された翻訳モデルとに基づいて、原言語の文における位置情報が付与された、原言語の文に対する目的言語の翻訳文を生成し、保持された仮想単語と翻訳したくない語と仮想単語の位置情報との組み合わせ、及び生成された目的言語の翻訳文に付与された位置情報に基づいて、目的言語の翻訳文に含まれる仮想単語を、翻訳したくない語に置き換えることにより、翻訳したくない語が文に含まれる場合であっても、精度よく翻訳することができる、という効果が得られる。   As described above, according to the translation apparatus, method, and program of the present invention, a word that is not desired to be translated included in an input source language sentence is replaced with a virtual word and is not desired to be translated into a virtual word. A source language in which position information in a source language sentence is given based on a sentence in the source language obtained by replacement and a translation model learned in advance, while retaining a combination of words and virtual word position information A translation of the target language for the sentence of the sentence, based on the combination of the stored virtual word, the word that the user does not want to translate and the position information of the virtual word, and the position information given to the generated translation of the target language By replacing the virtual word included in the target language translation with a word that you do not want to translate, even if the sentence contains a word that you do not want to translate, It says the effect can be obtained.

また、本発明の翻訳モデル学習装置、方法、及びプログラムによれば、原言語の学習用文と当該原言語の学習用文に対する翻訳文である目的言語の学習用文との複数のペアの各々について、当該ペアの原言語の学習用文に含まれる翻訳したくない語を、仮想単語に置き換えると共に、当該ペアの目的言語の学習用文に含まれる翻訳したくない語を、仮想単語に置き換え、置き換えによって得られた原言語の学習用文と目的言語の学習用文との複数のペアに基づいて、翻訳モデルを学習することにより、翻訳したくない語が文に含まれる場合であっても、精度よく文を翻訳するための翻訳モデルを得ることができる、という効果が得られる。   Further, according to the translation model learning device, method, and program of the present invention, each of a plurality of pairs of a source language learning sentence and a target language learning sentence that is a translation sentence for the source language learning sentence For words, replace the words you do not want to translate in the source language learning sentence of the pair with virtual words, and replace the words you do not want to translate in the target language learning sentence of the pair with virtual words. The sentence contains words that you do not want to translate by learning a translation model based on multiple pairs of source language learning sentences and target language learning sentences obtained by replacement. In addition, there is an effect that a translation model for translating a sentence with high accuracy can be obtained.

本実施の形態に係る翻訳モデル学習装置の機能的な構成例を示すブロック図である。It is a block diagram which shows the functional structural example of the translation model learning apparatus which concerns on this Embodiment. 原言語の学習用文に含まれる翻訳したくない語を、仮想単語に置き換える処理の一例を示す図である。It is a figure which shows an example of the process which replaces the word which does not want to translate contained in the learning sentence of a source language with a virtual word. 本実施の形態に係る翻訳装置の機能的な構成例を示すブロック図である。It is a block diagram which shows the functional structural example of the translation apparatus which concerns on this Embodiment. 翻訳対象の原言語の入力文に含まれる翻訳したくない語を、仮想単語に置き換える処理の一例を示す図である。It is a figure which shows an example of the process which replaces the word which does not want to translate contained in the input sentence of the source language of translation object with a virtual word. 翻訳したくない語が仮想単語に置き換えられた原言語の入力文を、目的言語の文に翻訳した処理結果の一例を示す図である。It is a figure which shows an example of the processing result which translated the input sentence of the source language by which the word which it does not want to translate was replaced by the virtual word into the sentence of the target language. 翻訳された目的言語の文内の仮想単語を、翻訳したくない語に置き換える処理の一例を示す図である。It is a figure which shows an example of the process which replaces the virtual word in the sentence of the translated target language with the word which does not want to translate. 本発明の実施の形態における翻訳モデルの学習処理の内容を示すフローチャートである。It is a flowchart which shows the content of the learning process of the translation model in embodiment of this invention. 本発明の実施の形態における翻訳処理の内容を示すフローチャートである。It is a flowchart which shows the content of the translation process in embodiment of this invention.

<概要>
まず、本発明の実施の形態の概要について説明する。
本実施の形態では、翻訳処理において、原言語の翻訳したくない語(数式、化学式、国名等)を事前に仮想単語に置き換え、翻訳後、翻訳結果に付随する原言語の文字位置情報に基づいて、置き換えられた仮想単語を翻訳したくない語に戻す。
<Overview>
First, an outline of an embodiment of the present invention will be described.
In the present embodiment, in the translation process, words (formulas, chemical formulas, country names, etc.) that the source language is not to be translated are replaced with virtual words in advance, and after translation, based on the source language character position information accompanying the translation result. Return the replaced virtual word to the word you do not want to translate.

以下、図面を参照して、本発明の実施の形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

<翻訳モデル学習装置のシステム構成>
図1は、本発明の実施の形態に係る翻訳モデル学習装置100を示すブロック図である。翻訳モデル学習装置100は、原言語の文を目的言語の文へ翻訳するための翻訳モデルを学習する。この翻訳モデル学習装置100は、CPUと、RAMと、後述する学習処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
<System configuration of translation model learning device>
FIG. 1 is a block diagram showing a translation model learning device 100 according to an embodiment of the present invention. The translation model learning device 100 learns a translation model for translating a source language sentence into a target language sentence. This translation model learning device 100 is configured by a computer including a CPU, a RAM, and a ROM that stores a program for executing a learning processing routine described later, and is functionally configured as follows. Yes.

本実施の形態に係る翻訳モデル学習装置100は、図1に示すように、学習用入力部10と、学習用演算部20と、翻訳モデルデータベース30とを備えている。   As shown in FIG. 1, translation model learning apparatus 100 according to the present embodiment includes learning input unit 10, learning calculation unit 20, and translation model database 30.

学習用入力部10は、学習データを受け付ける。学習データは、原言語の学習用文と当該原言語の学習用文に対する翻訳文である目的言語の学習用文との複数のペアである。   The learning input unit 10 receives learning data. The learning data is a plurality of pairs of a learning sentence in the source language and a learning sentence in the target language that is a translation sentence for the learning sentence in the source language.

学習用演算部20は、学習用入力部10によって受け付けた学習データに基づいて、翻訳モデルを学習する。学習用演算部20は、学習データベース22と、学習用仮想単語置換部24と、学習処理部26とを備えている。   The learning calculation unit 20 learns the translation model based on the learning data received by the learning input unit 10. The learning calculation unit 20 includes a learning database 22, a learning virtual word replacement unit 24, and a learning processing unit 26.

学習データベース22には、学習用入力部10によって受け付けた学習データが格納される。   The learning database 22 stores learning data received by the learning input unit 10.

学習用仮想単語置換部24は、学習データベース22に格納された学習データの複数のペアの各々について、当該ペアの原言語の学習用文に含まれる翻訳したくない語を、当該翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換える。
そして、学習用仮想単語置換部24は、学習データベース22に格納された学習データの複数のペアの各々について、当該ペアの目的言語の学習用文に含まれる翻訳したくない語を、当該翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換える。
For each of a plurality of pairs of learning data stored in the learning database 22, the learning virtual word replacement unit 24 does not want to translate a word that is not to be translated included in the source language learning sentence of the pair. Replace with a virtual word predetermined for the category to which the word belongs.
Then, the learning virtual word replacement unit 24 translates, for each of the plurality of pairs of learning data stored in the learning database 22, a word that is not to be translated included in the learning sentence in the target language of the pair. Replace with a virtual word that is predetermined for the category to which the word you do not want to belong.

ここで、翻訳したくない語とは、例えば、数式、化学式、国名等のように、原言語の文を目的言語の文へ翻訳する際に、翻訳処理を必要としない語である。また、翻訳したくない語が属するカテゴリとは、数式、化学式、国名等のように、翻訳したくない語の種類を示すものである。例えば、翻訳したくない語が数式であれば(スウシキ)へ置換され、翻訳したくない語が化学式であれば(ケミストリ)へ置換される。   Here, the word which does not want to translate is a word which does not require a translation process when translating the sentence of a source language into the sentence of a target language like a numerical formula, a chemical formula, a country name etc., for example. A category to which a word that is not desired to be translated indicates a type of word that is not desired to be translated, such as a mathematical formula, a chemical formula, or a country name. For example, if the word that you do not want to translate is a mathematical formula, it is replaced with (Suisuki), and if the word you do not want to translate is a chemical formula, it is replaced with (Chemistry).

具体的には、学習用仮想単語置換部24は、原言語の学習用文及び目的言語の学習用文に含まれる翻訳したくない語(数式や化学式等)を、当該翻訳したくない語を表す予め定められた正規表現を用いて抽出し、抽出された翻訳したくない語を、当該正規表現が表す語のカテゴリに応じて当該正規表現に対して事前に決められた仮想単語に変換する。例えば、翻訳したくない語が化学式である場合には、元素記号及び数字を用いて表される正規表現を用いればよい。また、翻訳したくない語が数式である場合には、数字、アルファベット、及び演算記号を用いて表される正規表現を用いればよい。なお、正規表現以外の手法により、翻訳したくない語を抽出してもよい。   Specifically, the learning virtual word replacement unit 24 selects words (formulas, chemical formulas, and the like) that are not to be translated in the learning sentence in the source language and the learning sentence in the target language. Extract using a regular expression that represents and extract the word that you do not want to translate into a virtual word that is predetermined for the regular expression according to the category of the word that the regular expression represents . For example, when a word that is not desired to be translated is a chemical formula, a regular expression expressed using element symbols and numbers may be used. In addition, when a word that is not desired to be translated is a mathematical expression, a regular expression expressed using numbers, alphabets, and operation symbols may be used. Note that words that are not to be translated may be extracted by a technique other than regular expression.

例えば、英語から日本語への翻訳では、図2に示すように、原言語の学習用文として「the chemical formula for water is H2O」が入力された場合、学習用仮想単語置換部24は、化学式(H2O)を抽出して仮想単語(ケミストリ)に変換し、学習処理部26に出力する。そして、後述する学習処理部26によって、化学式が(ケミストリ)に変換された文に対する翻訳モデルが作成される。 For example, in the translation from English to Japanese, as shown in FIG. 2, when “the chemical formula for water is H 2 O” is input as the source language learning sentence, the learning virtual word replacement unit 24 The chemical formula (H 2 O) is extracted, converted into a virtual word (chemistry), and output to the learning processing unit 26. Then, a translation model for the sentence in which the chemical formula is converted to (Chemistry) is created by the learning processing unit 26 described later.

学習処理部26は、学習用仮想単語置換部24による置き換えによって得られた原言語の学習用文と目的言語の学習用文との複数のペアに基づいて、原言語の文を目的言語の文へ翻訳するための翻訳モデルを学習する。翻訳モデルの一例としては、統計翻訳モデルを用いることができる。   The learning processing unit 26 converts the source language sentence into the target language sentence based on a plurality of pairs of the source language learning sentence and the target language learning sentence obtained by the replacement by the learning virtual word replacement unit 24. Learn translation models for translating to As an example of a translation model, a statistical translation model can be used.

学習処理部26は、基本的には、翻訳ソフトの学習処理を利用して、翻訳モデルを学習する。また、後述する翻訳装置200の翻訳処理部58において仮想単語の数が増減する(原言語の文の句と、当該原言語の文の句の翻訳に対応する目的言語の文の句とで、仮想単語の数が同じでない)と、仮想単語から翻訳したくない語への正確な復元ができなくなるため、学習処理部26において、仮想単語の数が増減するような翻訳規則の生成を抑制する、もしくはそのような規則を除去する処理を行う。   The learning processing unit 26 basically learns a translation model using a translation software learning process. In addition, the number of virtual words is increased or decreased in a translation processing unit 58 of the translation apparatus 200 described later (in a source language sentence phrase and a target language sentence phrase corresponding to the translation of the source language sentence phrase, If the number of virtual words is not the same), it is impossible to accurately restore the virtual word to a word that you do not want to translate. Therefore, the learning processing unit 26 suppresses the generation of translation rules that increase or decrease the number of virtual words. Or a process for removing such a rule.

例えば、学習用仮想単語置換部24による置き換えによって得られた原言語の学習用文の句と当該原言語の学習用文の句に対する翻訳である目的言語の学習用文の句との複数のペアの各々について、仮想単語の数が一致しないペアを除去し、除去した結果得られる文のペアに基づいて、翻訳モデルを学習する。   For example, a plurality of pairs of phrases in the learning sentence in the source language obtained by the replacement by the learning virtual word replacement unit 24 and phrases in the learning sentence in the target language that is a translation of the phrase in the learning sentence in the source language For each of the above, a pair in which the number of virtual words does not match is removed, and a translation model is learned based on a sentence pair obtained as a result of the removal.

翻訳モデルデータベース30には、学習処理部26によって学習された翻訳モデルが格納される。   The translation model database 30 stores the translation model learned by the learning processing unit 26.

<翻訳装置のシステム構成>
図3は、本発明の実施の形態に係る翻訳装置200を示すブロック図である。翻訳装置200は、入力された原言語の文を目的言語の文へ翻訳する。この翻訳装置200は、CPUと、RAMと、後述する翻訳処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
<System configuration of translation device>
FIG. 3 is a block diagram showing translation apparatus 200 according to the embodiment of the present invention. The translation apparatus 200 translates the input source language sentence into a target language sentence. This translation apparatus 200 is configured by a computer including a CPU, a RAM, and a ROM that stores a program for executing a translation processing routine described later, and is functionally configured as follows.

本実施の形態に係る翻訳装置200は、図3に示すように、入力部40と、演算部50と、出力部70とを備えている。   As shown in FIG. 3, translation apparatus 200 according to the present embodiment includes input unit 40, calculation unit 50, and output unit 70.

入力部40は、翻訳対象である原言語の文の入力を受け付ける。   The input unit 40 receives an input of a source language sentence to be translated.

演算部50は、入力部40によって受け付けた入力された原言語の文を翻訳する。演算部50は、仮想単語置換部52と、仮想単語保持部54と、翻訳モデルデータベース56と、翻訳処理部58と、仮想単語復元部60とを備えている。   The computing unit 50 translates the input source language sentence received by the input unit 40. The calculation unit 50 includes a virtual word replacement unit 52, a virtual word holding unit 54, a translation model database 56, a translation processing unit 58, and a virtual word restoration unit 60.

仮想単語置換部52は、入力部40によって受け付けた原言語の文に含まれる翻訳したくない語を、学習用仮想単語置換部24と同様に、当該翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換える。そして、仮想単語置換部52は、当該仮想単語と当該翻訳したくない語と当該仮想単語の文字位置情報との組み合わせを、後述する仮想単語保持部54に保持させる。   The virtual word replacement unit 52 applies a word that is not to be translated included in the source language sentence received by the input unit 40 to a category to which the word that is not to be translated belongs, as in the learning virtual word replacement unit 24. Replace with a predetermined virtual word. Then, the virtual word replacement unit 52 causes the virtual word holding unit 54 described later to hold a combination of the virtual word, the word that the user does not want to translate and the character position information of the virtual word.

仮想単語保持部54は、仮想単語と、当該仮想単語に置き換えられた翻訳したくない語と、当該仮想単語の文字位置情報との組み合わせの各々を保持する。   The virtual word holding unit 54 holds each combination of a virtual word, a word that is replaced by the virtual word and that is not to be translated, and character position information of the virtual word.

翻訳モデルデータベース56には、上記翻訳モデル学習装置100の翻訳モデルデータベース30に格納されている翻訳モデルと同じ翻訳モデルが格納されている。   In the translation model database 56, the same translation model as the translation model stored in the translation model database 30 of the translation model learning apparatus 100 is stored.

翻訳処理部58は、仮想単語置換部52による置き換えによって得られた原言語の文と、翻訳モデルデータベース56に格納された翻訳モデルとに基づいて、当該原言語の文に対する目的言語の翻訳文を生成する。生成された目的言語の翻訳文には、形態素毎に、原言語の文における対応する形態素の文字位置情報が付与されている。   Based on the source language sentence obtained by the replacement by the virtual word replacement unit 52 and the translation model stored in the translation model database 56, the translation processing unit 58 translates the target language translation sentence for the source language sentence. Generate. Character position information of the corresponding morpheme in the source language sentence is assigned to the generated target language translation sentence for each morpheme.

具体的には、翻訳処理部58は、機械翻訳の処理を行う。仮想単語は、翻訳処理部58において未知語として扱われ、目的言語の翻訳文にそのまま出力される。そして、翻訳処理部58による翻訳結果として、目的言語の文に対して、形態素毎に原言語の文の文字位置情報を付随したものを、出力する。   Specifically, the translation processing unit 58 performs machine translation processing. The virtual word is handled as an unknown word in the translation processing unit 58 and is output as it is as a translated sentence in the target language. Then, as a translation result by the translation processing unit 58, a sentence in which the text position information of the sentence in the source language is attached for each morpheme is output with respect to the sentence in the target language.

仮想単語復元部60は、仮想単語保持部54によって保持された、仮想単語と、当該仮想単語に置き換えられた翻訳したくない語と、当該仮想単語の文字位置情報との組み合わせ、及び翻訳処理部58によって生成された目的言語の翻訳文に付与された文字位置情報に基づいて、翻訳処理部58によって生成された目的言語の翻訳文に含まれる仮想単語を、置換前の翻訳したくない語に置き換える。   The virtual word restoration unit 60 includes a combination of a virtual word held by the virtual word holding unit 54, a word that is replaced with the virtual word and is not to be translated, and character position information of the virtual word, and a translation processing unit. Based on the character position information given to the translated sentence of the target language generated by 58, the virtual word included in the translated sentence of the target language generated by the translation processing unit 58 is changed to a word that is not to be translated before replacement. replace.

具体的には、仮想単語復元部60は、仮想単語保持部54に格納されている仮想単語を一つずつ取出し、文字位置情報に基づいて、取り出した仮想単語の文字位置と目的言語文が持つ原言語の文字位置とがマッチした単語(仮想単語)を置換前の翻訳したくない語に置き換えることにより、復元する。   Specifically, the virtual word restoration unit 60 extracts the virtual words stored in the virtual word holding unit 54 one by one, and the character position and the target language sentence of the extracted virtual word have based on the character position information. Restoration is performed by replacing a word (virtual word) that matches the character position of the source language with a word that is not to be translated before replacement.

出力部70は、仮想単語復元部60によって得られた目的言語の文を出力する。   The output unit 70 outputs the target language sentence obtained by the virtual word restoration unit 60.

上記各部での処理を、図4〜図6を参照して具体的に説明する。   The processing in each of the above parts will be specifically described with reference to FIGS.

例えば、英語から日本語への翻訳において、原言語の文として「I add NaOH to mixture of Fe(OH)3 and Al(OH)3」が入力され、化学式を仮想単語(ケミストリ)に置換し翻訳する場合を例に説明する。 For example, in the translation from English to Japanese, “I add NaOH to mixture of Fe (OH) 3 and Al (OH) 3 ” is input as a sentence in the source language, and the chemical formula is replaced with a virtual word (chemistry) and translated. An example of this will be described.

(1)まず、仮想単語置換部52によって、図4に示すように、正規表現を用いて、翻訳したくない語である化学式の部分を、合致した正規表現に対して予め定められた仮想単語(ケミストリ)に置換する。そして、仮想単語置換部52は、図4に示すように、仮想単語(ケミストリ)、元の化学式、化学式の文字位置情報の組み合わせを、仮想単語保持部54に記憶させる。置換後の文字列は「I add ケミストリ to mixture of ケミストリ and ケミストリ」となる。 (1) First, as shown in FIG. 4, the virtual word replacement unit 52 uses a regular expression to convert a part of a chemical formula that is a word that is not desired to be translated into a virtual word that is predetermined for the matched regular expression. Replace with (Chemistry). Then, as illustrated in FIG. 4, the virtual word replacement unit 52 causes the virtual word holding unit 54 to store a combination of the virtual word (chemistry), the original chemical formula, and the character position information of the chemical formula. The replacement string is “I add chemistry to mixture of chemistry and chemistry”.

(2)次に、翻訳処理部58によって、図5に示すように、置換後の文字列「I add ケミストリ to mixture of ケミストリ and ケミストリ」を翻訳し、翻訳文「私は、ケミストリをケミストリとケミストリの混合物に加える」と、翻訳文の形態素毎に付与された原言語の文における文字位置情報とを出力する。なお、図5、6では、翻訳文の句毎に、当該句に含まれる形態素の文字位置情報を付与した場合を示している。 (2) Next, as shown in FIG. 5, the translated character string “I add chemistry to mixture of chemistry and chemistry” is translated by the translation processing unit 58, and the translated sentence “I am chemistry and chemistry and chemistry. And the character position information in the source language sentence assigned to each morpheme of the translation sentence is output. 5 and 6 show a case where character position information of morphemes included in the phrase is given to each phrase of the translated sentence.

(3)次に、仮想単語復元部60が、図6に示すように、仮想単語保持部54からデータを一つずつ取り出し、翻訳文から、取り出したデータの文字位置と一致する文字位置情報が付与された仮想単語を検索し、検索された仮想単語を、取り出したデータの化学式に戻す。そして、図6に示すように、翻訳文「私は、ケミストリをケミストリとケミストリの混合物に加える」と入力された文章が仮想単語復元部60によって「私は、NaOHをFe(OH)3とAl(OH)3の混合物に加える」と復元され、出力される。 (3) Next, as shown in FIG. 6, the virtual word restoration unit 60 extracts data one by one from the virtual word holding unit 54, and character position information that matches the character position of the extracted data is obtained from the translated sentence. The assigned virtual word is searched, and the searched virtual word is returned to the chemical formula of the extracted data. Then, as shown in FIG. 6, the translated sentence “I add chemistry to the mixture of chemistry and chemistry” is inputted by the virtual word restoration unit 60, “I added NaOH to Fe (OH) 3 and Al. Is added to the mixture of (OH) 3 "and output.

<翻訳モデル学習装置の作用>
次に、本実施の形態に係る翻訳モデル学習装置100の作用について説明する。まず、原言語の学習用文と当該原言語の学習用文に対する翻訳文である目的言語の学習用文との複数のペアである学習データが、翻訳モデル学習装置100に入力されると、学習用入力部10によって学習データを受け付ける。そして、学習用入力部10によって学習データが学習データベース22に格納されると、翻訳モデル学習装置100によって、図7に示す学習処理ルーチンが実行される。
<Operation of translation model learning device>
Next, the operation of translation model learning apparatus 100 according to the present embodiment will be described. First, when learning data that is a plurality of pairs of a source language learning sentence and a target language learning sentence that is a translation sentence for the source language learning sentence is input to the translation model learning device 100, learning is performed. Learning data is received by the input unit 10. Then, when the learning data is stored in the learning database 22 by the learning input unit 10, the learning process routine shown in FIG.

まず、ステップS100において、学習用演算部20によって、学習データベース22に格納された学習データのうち、1つのペアを設定する。   First, in step S100, the learning computation unit 20 sets one pair of learning data stored in the learning database 22.

ステップS102において、学習用仮想単語置換部24によって、上記ステップS100で設定されたペアの原言語の学習用文に含まれる翻訳したくない語を、当該翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換える。   In step S102, the learning virtual word replacement unit 24 adds a word that is not to be translated included in the paired source language learning sentence set in step S100 to a category to which the word that is not to be translated belongs. Replace with a predetermined virtual word.

そして、ステップS104において、学習用仮想単語置換部24によって、上記ステップS100で設定されたペアの目的言語の学習用文に含まれる翻訳したくない語を、当該翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換える。   In step S104, the learning virtual word replacement unit 24 converts a word that is not to be translated included in the learning sentence of the target language of the pair set in step S100 into a category to which the word that is not to be translated belongs. On the other hand, it is replaced with a predetermined virtual word.

ステップS106において、学習処理部26によって、上記ステップS102での置き換えによって得られた原言語の学習用文と、上記ステップS102での置き換えによって得られた目的言語の学習用文とをデータとしてメモリ(図示省略)に記憶する。   In step S106, the learning processing unit 26 stores, as data, the learning sentence in the source language obtained by the replacement in step S102 and the learning sentence in the target language obtained by the replacement in step S102. (Not shown).

ステップS108において、学習用演算部20によって、学習データベース22に格納された学習データのうち、全てのペアについて上記ステップS100〜S106の処理を実行したか否かを判定する。全てのペアについて上記ステップS100〜S106の処理を実行した場合には、ステップS109へ進む。一方、上記ステップS100〜S106の処理を実行していないペアが存在する場合には、ステップS100へ戻る。   In step S <b> 108, the learning calculation unit 20 determines whether or not the processing in steps S <b> 100 to S <b> 106 has been executed for all pairs in the learning data stored in the learning database 22. If the processes in steps S100 to S106 have been executed for all pairs, the process proceeds to step S109. On the other hand, if there is a pair that has not executed the processes of steps S100 to S106, the process returns to step S100.

ステップS109において、上記ステップS106でメモリ(図示省略)に記憶された全てのデータから、原言語の学習用文の句と当該原言語の学習用文の句に対する翻訳である目的言語の学習用文の句との複数のペアの各々について、仮想単語の数が一致しないペアを除去する。   In step S109, from all the data stored in the memory (not shown) in step S106, the learning sentence in the target language, which is a translation of the source language learning sentence phrase and the source language learning sentence phrase. For each of a plurality of pairs with the phrase, a pair in which the number of virtual words does not match is removed.

ステップS110において、上記ステップS106でメモリ(図示省略)に記憶されたデータから、上記ステップS109による除去の結果として得られる学習用文のペアの各々に基づいて、原言語の文を目的言語の文へ翻訳するための翻訳モデルを学習する。   In step S110, the source language sentence is converted to the target language sentence based on each of the learning sentence pairs obtained as a result of the removal in step S109 from the data stored in the memory (not shown) in step S106. Learn translation models for translating to

ステップS112において、学習用演算部20によって、上記ステップS110で学習された翻訳モデルを翻訳モデルデータベース30に格納する。   In step S <b> 112, the translation model learned in step S <b> 110 is stored in the translation model database 30 by the learning calculation unit 20.

<翻訳装置の作用>
次に、本実施の形態に係る翻訳装置200の作用について説明する。まず、翻訳モデル学習装置100の翻訳モデルデータベース30に格納されている翻訳モデルが、翻訳装置200に入力されると、翻訳モデルデータベース56に格納される。そして、翻訳対象である原言語の文が翻訳装置200に入力されると、翻訳装置200によって、図8に示す翻訳処理ルーチンが実行される。
<Operation of translation device>
Next, the operation of translation apparatus 200 according to the present embodiment will be described. First, when a translation model stored in the translation model database 30 of the translation model learning device 100 is input to the translation device 200, the translation model is stored in the translation model database 56. When a source language sentence to be translated is input to the translation apparatus 200, the translation apparatus 200 executes a translation processing routine shown in FIG.

まず、ステップS200において、入力部40によって、翻訳対象である原言語の文の入力を受け付ける。   First, in step S200, the input unit 40 receives an input of a source language sentence to be translated.

ステップS202において、仮想単語置換部52によって、上記ステップS200で受け付けた原言語の文に含まれる翻訳したくない語を、当該翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換える。   In step S202, the virtual word replacement unit 52 converts a word that is not desired to be included in the source language sentence received in step S200 to a virtual word that is predetermined for the category to which the word that is not desired to be translated belongs. replace.

ステップS204において、仮想単語置換部52によって、上記ステップS202で置き換えられた仮想単語の各々について、当該仮想単語と当該翻訳したくない語と当該仮想単語の文字位置情報との組み合わせを、仮想単語保持部54に保持させる。   In step S204, for each of the virtual words replaced in step S202 by the virtual word replacement unit 52, a combination of the virtual word, the word that the user does not want to translate and the character position information of the virtual word is stored in the virtual word. Held by the unit 54.

ステップS206において、翻訳処理部58によって、上記ステップS202での置き換えによって得られた原言語の文と、翻訳モデルデータベース56に格納された翻訳モデルとに基づいて、当該原言語の文における文字位置情報が付与された、当該原言語の文に対する目的言語の翻訳文を生成する。   In step S206, based on the source language sentence obtained by the replacement in step S202 by the translation processing unit 58 and the translation model stored in the translation model database 56, the character position information in the source language sentence. A translation of the target language is generated for the sentence of the source language to which is given.

ステップS208において、仮想単語復元部60によって、上記ステップS204で保持された仮想単語と翻訳したくない語と当該仮想単語の文字位置情報との組み合わせ、及び上記ステップS206で生成された当該目的言語の翻訳文に付与された文字位置情報に基づいて、上記ステップS206で生成された目的言語の翻訳文に含まれる仮想単語を、置換前の翻訳したくない語に置き換える。   In step S208, the virtual word restoration unit 60 combines the virtual word held in step S204 with the word not desired to be translated and the character position information of the virtual word, and the target language generated in step S206. Based on the character position information given to the translated sentence, the virtual word included in the translated sentence of the target language generated in step S206 is replaced with a word that is not desired to be translated before the replacement.

ステップS210において、出力部70は、仮想単語復元部60によって得られた目的言語の文を出力して、翻訳処理ルーチンを終了する。   In step S210, the output unit 70 outputs the target language sentence obtained by the virtual word restoration unit 60 and ends the translation processing routine.

以上説明したように、本実施の形態に係る翻訳モデル学習装置によれば、原言語の学習用文と当該原言語の学習用文に対する翻訳文である目的言語の学習用文との複数のペアの各々について、当該ペアの原言語の学習用文に含まれる翻訳したくない語を、仮想単語に置き換えると共に、当該ペアの目的言語の学習用文に含まれる翻訳したくない語を、仮想単語に置き換え、置き換えによって得られた原言語の学習用文と目的言語の学習用文との複数のペアに基づいて、翻訳モデルを学習することにより、翻訳したくない語が文に含まれる場合であっても、精度よく文を翻訳するための翻訳モデルを得ることができる。   As described above, according to the translation model learning apparatus according to the present embodiment, a plurality of pairs of a source language learning sentence and a target language learning sentence that is a translation sentence for the source language learning sentence. For each of the above, a word that is not to be translated included in the learning sentence in the source language of the pair is replaced with a virtual word, and a word that is not to be translated included in the learning sentence in the target language of the pair is replaced with the virtual word. If the sentence contains words that you do not want to translate by learning a translation model based on multiple pairs of source language learning sentences and target language learning sentences Even if it exists, the translation model for translating a sentence accurately can be obtained.

また、本実施の形態に係る翻訳装置によれば、入力された原言語の文に含まれる翻訳したくない語を、仮想単語に置き換えると共に、仮想単語と翻訳したくない語と仮想単語の文字位置情報との組み合わせを保持させ、置き換えによって得られた原言語の文と、予め学習された翻訳モデルとに基づいて、原言語の文における文字位置情報が付与された、原言語の文に対する目的言語の翻訳文を生成し、保持された仮想単語と翻訳したくない語と仮想単語の文字位置情報との組み合わせ、及び生成された目的言語の翻訳文に付与された文字位置情報に基づいて、目的言語の翻訳文に含まれる仮想単語を、翻訳したくない語に置き換えることにより、翻訳したくない語が文に含まれる場合であっても、精度よく翻訳することができる。   Further, according to the translation apparatus according to the present embodiment, a word that is not desired to be translated included in the input source language sentence is replaced with a virtual word, and a word that is not desired to be translated with a virtual word and characters of the virtual word Purpose for the source language sentence that has the character position information in the source language sentence based on the source language sentence obtained by the replacement and the translation model learned in advance. Based on the character position information given to the generated translation of the target language, and the combination of the virtual word that is not translated and the character position information of the virtual word that is generated and the translation of the language is generated, By replacing the virtual word included in the translated sentence of the target language with a word that is not desired to be translated, even if the sentence includes a word that is not desired to be translated, the sentence can be accurately translated.

また、表現パターンが膨大にある数式や化学式、国名等を、仮想単語に置き換えて、翻訳し、文字位置追跡機能を用いて復元することにより、数式や化学式、国名等が出現する文章でも翻訳精度を落とすことなく翻訳することができるようになる。   In addition, by replacing mathematical expressions, chemical formulas, country names, etc. that have a large number of expression patterns with virtual words, translating them, and restoring them using the character position tracking function, translation accuracy can be improved even for sentences in which mathematical expressions, chemical formulas, country names, etc. appear. You will be able to translate without dropping

また、学習処理時に、翻訳したくない語を仮想単語に置き換え学習させることで、数式や化学式、国名等のデータスパースネス問題を回避することができる。例えば、化学式「NaOH」という語は、一般的な文章ではほとんど出現しないため、学習データの量が十分に得られないが、化学式「NaOH」「Fe(OH)3」「Al(OH)3」などを「ケミストリ」に置き換えることによって、学習するためのデータ量が増えるため、データスパースネス問題を回避することができる。 In addition, data sparseness problems such as mathematical formulas, chemical formulas, and country names can be avoided by learning by replacing words that are not desired to be translated with virtual words during the learning process. For example, the word “NaOH” hardly appears in general sentences, so the amount of learning data cannot be obtained sufficiently, but the chemical formula “NaOH” “Fe (OH) 3 ” “Al (OH) 3 ” By replacing “etc.” with “chemistry”, the amount of data to learn increases, so the data sparseness problem can be avoided.

また、翻訳処理部58が出力する翻訳結果に付随する文字位置情報を用いて、複数ある仮想単語を区別して正しく元に戻すことが可能となる。   In addition, it is possible to distinguish and correctly restore a plurality of virtual words using the character position information accompanying the translation result output by the translation processing unit 58.

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   Note that the present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.

例えば、上記実施の形態では、翻訳モデル学習装置100と翻訳装置200とを別々の装置として構成する場合を例に説明したが、翻訳モデル学習装置100と翻訳装置200とを1つの装置として構成してもよい。   For example, in the above embodiment, the case where the translation model learning device 100 and the translation device 200 are configured as separate devices has been described as an example. However, the translation model learning device 100 and the translation device 200 are configured as one device. May be.

上述の翻訳モデル学習装置100では、学習データベース22、及び翻訳モデルデータベース30を備えている場合について説明したが、例えば学習データベース22、及び翻訳モデルデータベース30の少なくとも1つが翻訳モデル学習装置100の外部装置に設けられ、翻訳モデル学習装置100は、外部装置と通信手段を用いて通信することにより、学習データベース22、及び翻訳モデルデータベース30の少なくとも1つを参照するようにしてもよい。   In the translation model learning apparatus 100 described above, the case where the learning database 22 and the translation model database 30 are provided has been described. For example, at least one of the learning database 22 and the translation model database 30 is an external device of the translation model learning apparatus 100. The translation model learning device 100 may refer to at least one of the learning database 22 and the translation model database 30 by communicating with an external device using a communication unit.

また、上述の翻訳モデル学習装置100では、学習用仮想単語置換部24は、学習データの複数のペアの各々について、当該ペアの原言語の学習用文に含まれる翻訳したくない語を、当該翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換え、当該ペアの目的言語の学習用文に含まれる翻訳したくない語を、当該翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換える場合を例に説明したが、これに限定されるものではない。例えば、学習データの一部のペアの各々について、当該ペアの原言語の学習用文と目的言語の学習用文とに含まれる翻訳したくない語が、人手によって予め仮想単語に置き換えられていてもよい。原言語の学習用文と目的言語の学習用文とに含まれる翻訳したくない語が、人手によって予め仮想単語に置き換えられているペアについては、学習用仮想単語置換部24の処理は省略される。   Further, in the translation model learning device 100 described above, the learning virtual word replacement unit 24 calculates, for each of the plurality of pairs of learning data, the word that is not included in the source language learning sentence of the pair, Replace with a virtual word that is predetermined for the category to which the word that you do not want to translate belongs, and replace the word that you do not want to translate in the target language learning sentence of the pair with respect to the category that the word you do not want to translate However, the present invention is not limited to this. For example, for each of some pairs of learning data, words that you do not want to translate included in the source language learning sentence and target language learning sentence of the pair are replaced by virtual words in advance by hand. Also good. The processing of the learning virtual word replacement unit 24 is omitted for pairs in which words that are not desired to be translated included in the source language learning sentence and the target language learning sentence are manually replaced with virtual words in advance. The

また、翻訳処理部58による翻訳結果には、文字位置情報が付与されている場合を例に説明したが、これに限定されるものではなく、形態素や単語を単位とした位置情報が付与されていてもよい。   Further, the translation result by the translation processing unit 58 has been described by taking the case where the character position information is given as an example. May be.

また、学習処理部26は、学習用仮想単語置換部24による置き換えによって得られた原言語の学習用文と目的言語の学習用文との複数のペアから、原言語の学習用文に含まれる仮想単語の数と、目的言語の学習用文に含まれる仮想単語の数とが一致しないペアを除去し、除去されなかったペアの各々に基づいて、翻訳モデルを学習するようにしてもよい。   Further, the learning processing unit 26 is included in the source language learning sentence from a plurality of pairs of the source language learning sentence and the target language learning sentence obtained by the replacement by the learning virtual word replacement unit 24. Pairs in which the number of virtual words and the number of virtual words included in the target language learning sentence do not match may be removed, and the translation model may be learned based on each pair that has not been removed.

また、上述の翻訳装置200についても、仮想単語保持部54、及び翻訳モデルデータベース56を備えている場合について説明したが、例えば仮想単語保持部54、及び翻訳モデルデータベース56の少なくとも1つが翻訳装置200の外部装置に設けられ、翻訳装置200は、外部装置と通信手段を用いて通信することにより、仮想単語保持部54、及び翻訳モデルデータベース56の少なくとも1つを参照するようにしてもよい。   In addition, the above-described translation device 200 has been described with respect to the case where the virtual word holding unit 54 and the translation model database 56 are provided. For example, at least one of the virtual word holding unit 54 and the translation model database 56 is the translation device 200. The translation device 200 may refer to at least one of the virtual word holding unit 54 and the translation model database 56 by communicating with the external device using a communication unit.

また、上述の翻訳モデル学習装置100及び翻訳装置200は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。   Moreover, although the translation model learning apparatus 100 and the translation apparatus 200 described above have a computer system inside, if the “computer system” uses a WWW system, a homepage providing environment (or display) Environment).

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体、例えばCD−ROMやメモリーカード等に格納して提供することも可能である。   Further, in the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium such as a CD-ROM or a memory card. It is.

10 学習用入力部
20 学習用演算部
22 学習データベース
24 学習用仮想単語置換部
26 学習処理部
30 翻訳モデルデータベース
40 入力部
50 演算部
52 仮想単語置換部
54 仮想単語保持部
56 翻訳モデルデータベース
58 翻訳処理部
60 仮想単語復元部
70 出力部
100 翻訳モデル学習装置
200 翻訳装置
10 Learning Input Unit 20 Learning Computing Unit 22 Learning Database 24 Learning Virtual Word Replacement Unit 26 Learning Processing Unit 30 Translation Model Database 40 Input Unit 50 Computing Unit 52 Virtual Word Replacement Unit 54 Virtual Word Holding Unit 56 Translation Model Database 58 Translation Processing unit 60 Virtual word restoration unit 70 Output unit 100 Translation model learning device 200 Translation device

上記目的を達成するために、本発明の翻訳装置は、入力された原言語の文を目的言語の文へ翻訳する翻訳装置であって、前記入力された原言語の文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせを、仮想単語保持部に保持させる仮想単語置換部と、前記仮想単語置換部による置き換えによって得られた前記原言語の文であって、かつ前記原言語の文に含まれる形態素の各々に位置情報が付与されている前記原言語の文と、原言語の文を目的言語の文へ翻訳するための予め学習された翻訳モデルとに基づいて、前記原言語の文に対する前記目的言語の翻訳文であって、前記原言語の文に含まれる形態素の各々に付与された前記位置情報が、前記目的言語の翻訳文の対応する形態素の各々に付与された、前記目的言語の翻訳文を生成する翻訳処理部と、前記仮想単語保持部によって保持された前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせ、及び前記翻訳処理部によって生成された前記目的言語の翻訳文に付与された前記位置情報に基づいて、前記翻訳処理部によって生成された前記目的言語の翻訳文に含まれる前記仮想単語を、前記翻訳したくない語に置き換える仮想単語復元部と、を含んで構成される。 In order to achieve the above object, a translation apparatus according to the present invention is a translation apparatus that translates an input source language sentence into a target language sentence, and is intended to translate the input source language sentence. A virtual word predetermined for a category to which the word that does not want to be translated belongs, and a combination of the virtual word, the word that is not desired to be translated, and the position information of the virtual word, Position information is given to each of the morphemes included in the source language sentence that is obtained by the replacement by the virtual word replacement section and the virtual word replacement section to be held in the holding section , and is included in the source language sentence wherein the sentence of the original language are based sentences of the source language to a pre-learned translation model to translate into sentences in the target language, a the translation in the target language for a statement before Kihara language, In the source language The location information given to each of the morphemes included in the said given to each of the corresponding morphemes in the target language translation, a translation processing unit for generating a translation of the target language, the virtual word holding Based on the combination of the virtual word held by the unit, the word that the user does not want to translate and the position information of the virtual word, and the position information given to the translated sentence of the target language generated by the translation processing unit A virtual word restoration unit that replaces the virtual word included in the translation of the target language generated by the translation processing unit with the word that is not to be translated.

本発明の翻訳方法は、仮想単語置換部、翻訳処理部、及び仮想単語復元部を含み、入力された原言語の文を目的言語の文へ翻訳する翻訳装置における翻訳方法であって、前記仮想単語置換部が、前記入力された原言語の文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせを、仮想単語保持部に保持させるステップと、前記翻訳処理部が、前記仮想単語置換部による置き換えによって得られた前記原言語の文であって、かつ前記原言語の文に含まれる形態素の各々に位置情報が付与されている前記原言語の文と、原言語の文を目的言語の文へ翻訳するための予め学習された翻訳モデルとに基づいて、前記原言語の文に対する前記目的言語の翻訳文であって、前記原言語の文に含まれる形態素の各々に付与された前記位置情報が、前記目的言語の翻訳文の対応する形態素の各々に付与された、前記目的言語の翻訳文を生成するステップと、前記仮想単語復元部が、前記仮想単語保持部によって保持された前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせ、及び前記翻訳処理部によって生成された前記目的言語の翻訳文に付与された前記位置情報に基づいて、前記翻訳処理部によって生成された前記目的言語の翻訳文に含まれる前記仮想単語を、前記翻訳したくない語に置き換えるステップと、を含んで構成される。 The translation method according to the present invention is a translation method in a translation apparatus that includes a virtual word replacement unit, a translation processing unit, and a virtual word restoration unit, and translates an input source language sentence into a target language sentence. The word replacement unit replaces a word that is not desired to be translated included in the input source language sentence with a virtual word that is predetermined for a category to which the word that does not want to be translated belongs, and the virtual word and the A step of holding a combination of a word that the user does not want to translate and the position information of the virtual word in a virtual word holding unit, and the translation processing unit is a sentence in the source language obtained by replacement by the virtual word replacement unit there are, and the a sentence of the source language location information to each morpheme is assigned included in the sentence of the source language, the source language previously learned translation model for a sentence translated into sentences in the target language of Based on previous said a translation in the target language for the sentence of Kihara language, the location information given to each of the morphemes included in statement of the original language, the corresponding of the target language translation A step of generating a translation of the target language assigned to each of the morphemes, and the virtual word restoring unit, the virtual word held by the virtual word holding unit, the word not to be translated, and the virtual word Based on the position information given to the translated sentence of the target language generated by the translation processing unit, and the translation of the target language generated by the translation processing unit Replacing the virtual word with the word that is not desired to be translated.

また、本発明の翻訳モデル学習装置は、本発明の翻訳装置で用いられる、前記原言語の文を目的言語の文へ翻訳するための翻訳モデルを学習する翻訳モデル学習装置であって、前記原言語の学習用文と前記原言語の学習用文に対する翻訳文である目的言語の学習用文との複数のペアである学習データを受け付ける学習用入力部と、前記学習データの前記複数のペアの各々について、前記ペアの前記原言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記ペアの前記目的言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換える学習用仮想単語置換部と、前記学習用仮想単語置換部による置き換えによって得られた前記原言語の学習用文と前記目的言語の学習用文との複数のペアに基づいて、前記翻訳モデルを学習する学習処理部と、を含んで構成される。 The translation model learning device of the present invention is a translation model learning device that learns a translation model for translating the source language sentence into a target language sentence used in the translation device of the present invention. A learning input unit for receiving learning data that is a plurality of pairs of a learning sentence of a language and a learning sentence of a target language that is a translation sentence for the learning sentence of the source language; and a plurality of pairs of the learning data For each, replace the word that is not desired to be translated included in the source language learning sentence of the pair with a virtual word that is predetermined for the category to which the word that does not want to be translated belongs, and the purpose of the pair A learning virtual word replacement unit that replaces a word that is not desired to be translated included in a language learning sentence with a virtual word that is predetermined for a category to which the word that does not want to be translated belongs, and the learning virtual A learning processing unit for learning the translation model based on a plurality of pairs of the learning sentence for the source language and the learning sentence for the target language obtained by the replacement by the word replacement unit. .

本発明の翻訳モデル学習方法は、本発明の翻訳方法で用いられる、学習用入力部、学習用仮想単語置換部、及び学習処理部を含み、前記原言語の文を目的言語の文へ翻訳するための翻訳モデルを学習する翻訳モデル学習装置における翻訳モデル学習方法であって、前記学習用入力部が、前記原言語の学習用文と前記原言語の学習用文に対する翻訳文である目的言語の学習用文との複数のペアである学習データを受け付けるステップと、前記学習用仮想単語置換部が、前記学習データの前記複数のペアの各々について、前記ペアの前記原言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記ペアの前記目的言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えるステップと、前記学習処理部が、前記学習用仮想単語置換部による置き換えによって得られた前記原言語の学習用文と前記目的言語の学習用文との複数のペアに基づいて、前記翻訳モデルを学習するステップと、を含んで構成される。 Translation model learning method of the present invention is used in the translation process of the present invention, the learning input unit, a virtual word replacement unit for learning, and includes a learning section, translating the sentence of the source language to the sentence in the target language A translation model learning method in a translation model learning device for learning a translation model for the target language, wherein the learning input unit is a translation sentence for the source language learning sentence and the source language learning sentence. Receiving learning data that is a plurality of pairs with a learning sentence; and the learning virtual word replacement unit includes each of the plurality of pairs of learning data in the learning sentence of the source language of the pair The words that you do not want to translate are replaced with virtual words that are predetermined for the category to which the words you do not want to translate, and you do not want to translate in the target language learning sentence of the pair Replacing a virtual word predetermined for a category to which the word that is not to be translated belongs, and the learning processing unit is for learning the source language obtained by the replacement by the learning virtual word replacement unit Learning the translation model based on a plurality of pairs of a sentence and a learning sentence of the target language.

また、本発明の第1のプログラムは、コンピュータを、上記の翻訳装置の各部として機能させるためのプログラムである。また、本発明の第2のプログラムは、コンピュータを、上記の翻訳モデル学習装置の各部として機能させるためのプログラムである。 The first program of the present invention, a computer, a program to function as each section of the translation equipment. The second program of the present invention is a program for causing a computer to function as each part of the translation model learning device.

Claims (6)

入力された原言語の文を目的言語の文へ翻訳する翻訳装置であって、
前記入力された原言語の文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせを、仮想単語保持部に保持させる仮想単語置換部と、
前記仮想単語置換部による置き換えによって得られた前記原言語の文と、原言語の文を目的言語の文へ翻訳するための予め学習された翻訳モデルとに基づいて、前記原言語の文における位置情報が付与された、前記原言語の文に対する前記目的言語の翻訳文を生成する翻訳処理部と、
前記仮想単語保持部によって保持された前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせ、及び前記翻訳処理部によって生成された前記目的言語の翻訳文に付与された前記位置情報に基づいて、前記翻訳処理部によって生成された前記目的言語の翻訳文に含まれる前記仮想単語を、前記翻訳したくない語に置き換える仮想単語復元部と、
を含む翻訳装置。
A translation device that translates input source language sentences into target language sentences,
A word that is not desired to be translated included in the input source language sentence is replaced with a virtual word that is predetermined for a category to which the word that is not desired to be translated belongs, and the word that is not desired to be translated with the virtual word. A virtual word replacement unit that causes the virtual word holding unit to hold a combination of the virtual word position information and the virtual word position information;
The position in the source language sentence based on the source language sentence obtained by the replacement by the virtual word replacement unit and a pre-learned translation model for translating the source language sentence into the target language sentence A translation processing unit for generating a translation of the target language for the sentence of the source language to which the information is given;
A combination of the virtual word held by the virtual word holding unit, the word that the user does not want to translate and the position information of the virtual word, and the translation given to the translation of the target language generated by the translation processing unit A virtual word restoration unit that replaces the virtual word included in the translation of the target language generated by the translation processing unit with the word that the user does not want to translate, based on position information;
Translation device including
原言語の文を目的言語の文へ翻訳するための翻訳モデルを学習する翻訳モデル学習装置であって、
前記原言語の学習用文と前記原言語の学習用文に対する翻訳文である目的言語の学習用文との複数のペアである学習データを受け付ける学習用入力部と、
前記学習データの前記複数のペアの各々について、前記ペアの前記原言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記ペアの前記目的言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換える学習用仮想単語置換部と、
前記学習用仮想単語置換部による置き換えによって得られた前記原言語の学習用文と前記目的言語の学習用文との複数のペアに基づいて、前記翻訳モデルを学習する学習処理部と、
を含む翻訳モデル学習装置。
A translation model learning device for learning a translation model for translating a sentence in a source language into a sentence in a target language,
A learning input unit for receiving learning data that is a plurality of pairs of a learning sentence in the source language and a learning sentence in a target language that is a translation sentence for the learning sentence in the source language;
For each of the plurality of pairs of the learning data, a word that is not to be translated included in the source language learning sentence of the pair is a virtual word that is predetermined for a category to which the word that does not want to translate belongs. And a learning virtual word replacement unit that replaces a word that is not desired to be translated included in the learning sentence of the target language of the pair with a virtual word that is predetermined for a category to which the word that does not want to be translated belongs. When,
A learning processing unit for learning the translation model based on a plurality of pairs of the source language learning sentence and the target language learning sentence obtained by the replacement by the learning virtual word replacement unit;
Translation model learning device including
前記学習処理部は、前記学習用仮想単語置換部による置き換えによって得られた前記原言語の学習用文と前記目的言語の学習用文との複数のペア、又は前記原言語の学習用文の句と前記原言語の学習用文の句に対する翻訳である目的言語の学習用文の句との複数のペアの各々について、前記仮想単語の数が一致しないペアを除去し、前記翻訳モデルを学習する請求項2記載の翻訳モデル学習装置。   The learning processing unit includes a plurality of pairs of the source language learning sentence and the target language learning sentence obtained by the replacement by the learning virtual word replacement part, or phrases of the source language learning sentence And learning the translation model for each of a plurality of pairs of a target language learning sentence phrase that is a translation of the source language learning sentence phrase and removing the pair whose virtual word number does not match The translation model learning device according to claim 2. 仮想単語置換部、翻訳処理部、及び仮想単語復元部を含み、入力された原言語の文を目的言語の文へ翻訳する翻訳装置における翻訳方法であって、
前記仮想単語置換部が、前記入力された原言語の文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせを、仮想単語保持部に保持させるステップと、
前記翻訳処理部が、前記仮想単語置換部による置き換えによって得られた前記原言語の文と、原言語の文を目的言語の文へ翻訳するための予め学習された翻訳モデルとに基づいて、前記原言語の文における位置情報が付与された、前記原言語の文に対する前記目的言語の翻訳文を生成するステップと、
前記仮想単語復元部が、前記仮想単語保持部によって保持された前記仮想単語と前記翻訳したくない語と前記仮想単語の位置情報との組み合わせ、及び前記翻訳処理部によって生成された前記目的言語の翻訳文に付与された前記位置情報に基づいて、前記翻訳処理部によって生成された前記目的言語の翻訳文に含まれる前記仮想単語を、前記翻訳したくない語に置き換えるステップと、
を含む翻訳方法。
A translation method in a translation apparatus that includes a virtual word replacement unit, a translation processing unit, and a virtual word restoration unit, and translates an input source language sentence into a target language sentence,
The virtual word replacement unit replaces a word not desired to be translated included in the input source language sentence with a virtual word predetermined for a category to which the word not desired to be translated belongs, and the virtual word And a step of holding a combination of the word not desired to be translated and the position information of the virtual word in the virtual word holding unit;
The translation processing unit is based on the source language sentence obtained by the replacement by the virtual word replacement unit, and a previously learned translation model for translating the source language sentence into a target language sentence, Generating a translated sentence of the target language for the sentence of the source language, provided with position information in the sentence of the source language;
The virtual word restoration unit includes a combination of the virtual word held by the virtual word holding unit, the word that the user does not want to translate and the position information of the virtual word, and the target language generated by the translation processing unit. Replacing the virtual word included in the translation of the target language generated by the translation processing unit with the word that the user does not want to translate based on the positional information given to the translation;
Translation method including
学習用入力部、学習用仮想単語置換部、及び学習処理部を含み、原言語の文を目的言語の文へ翻訳するための翻訳モデルを学習する翻訳モデル学習装置における翻訳モデル学習方法であって、
前記学習用入力部が、前記原言語の学習用文と前記原言語の学習用文に対する翻訳文である目的言語の学習用文との複数のペアである学習データを受け付けるステップと、
前記学習用仮想単語置換部が、前記学習データの前記複数のペアの各々について、前記ペアの前記原言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えると共に、前記ペアの前記目的言語の学習用文に含まれる翻訳したくない語を、前記翻訳したくない語が属するカテゴリに対して予め定められた仮想単語に置き換えるステップと、
前記学習処理部が、前記学習用仮想単語置換部による置き換えによって得られた前記原言語の学習用文と前記目的言語の学習用文との複数のペアに基づいて、前記翻訳モデルを学習するステップと、
を含む翻訳モデル学習方法。
A translation model learning method in a translation model learning apparatus that includes a learning input unit, a learning virtual word replacement unit, and a learning processing unit, and that learns a translation model for translating a source language sentence into a target language sentence. ,
The learning input unit accepting learning data that is a plurality of pairs of a learning sentence in the source language and a learning sentence in a target language that is a translation sentence for the learning sentence in the source language;
The learning virtual word replacement unit includes, for each of the plurality of pairs of the learning data, a word that is not to be translated included in the source language learning sentence of the pair, to which the word that does not want to be translated belongs. Is replaced with a predetermined virtual word, and a word that is not to be translated included in the learning sentence of the target language of the pair is preliminarily determined for a category to which the word that is not to be translated belongs. Replacing with words,
The learning processing unit learning the translation model based on a plurality of pairs of the source language learning sentence and the target language learning sentence obtained by the replacement by the learning virtual word replacement part. When,
Translation model learning method including
コンピュータを、請求項1記載の翻訳装置、又は請求項2もしくは3記載の翻訳モデル学習装置の各部として機能させるためのプログラム。   The program for functioning a computer as each part of the translation apparatus of Claim 1, or the translation model learning apparatus of Claim 2 or 3.
JP2013266046A 2013-12-24 2013-12-24 Translation system, method, and program Active JP5973986B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013266046A JP5973986B2 (en) 2013-12-24 2013-12-24 Translation system, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013266046A JP5973986B2 (en) 2013-12-24 2013-12-24 Translation system, method, and program

Publications (2)

Publication Number Publication Date
JP2015121992A true JP2015121992A (en) 2015-07-02
JP5973986B2 JP5973986B2 (en) 2016-08-23

Family

ID=53533539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013266046A Active JP5973986B2 (en) 2013-12-24 2013-12-24 Translation system, method, and program

Country Status (1)

Country Link
JP (1) JP5973986B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018120584A (en) * 2017-01-26 2018-08-02 三星電子株式会社Samsung Electronics Co.,Ltd. Translation method, translation apparatus, and translation system
JP2018190287A (en) * 2017-05-10 2018-11-29 日本特許翻訳株式会社 Machine translation device and program
JP2019082987A (en) * 2017-10-30 2019-05-30 パナソニックIpマネジメント株式会社 Method for processing information, information processor, and program
WO2020246175A1 (en) * 2019-06-04 2020-12-10 パナソニックIpマネジメント株式会社 Translation device
JP2021026590A (en) * 2019-08-07 2021-02-22 株式会社椿知財サービス Translation device, program for controlling translation device, and translation evaluation method using translation device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018120584A (en) * 2017-01-26 2018-08-02 三星電子株式会社Samsung Electronics Co.,Ltd. Translation method, translation apparatus, and translation system
JP7111464B2 (en) 2017-01-26 2022-08-02 三星電子株式会社 Translation method, translation device and translation system
US11409967B2 (en) 2017-01-26 2022-08-09 Samsung Electronics Co., Ltd. Translation method and apparatus, and translation system
US11954452B2 (en) 2017-01-26 2024-04-09 Samsung Electronics Co., Ltd. Translation method and apparatus, and translation system
JP2018190287A (en) * 2017-05-10 2018-11-29 日本特許翻訳株式会社 Machine translation device and program
JP2019082987A (en) * 2017-10-30 2019-05-30 パナソニックIpマネジメント株式会社 Method for processing information, information processor, and program
JP7133784B2 (en) 2017-10-30 2022-09-09 パナソニックIpマネジメント株式会社 Information processing method, information processing device and program
WO2020246175A1 (en) * 2019-06-04 2020-12-10 パナソニックIpマネジメント株式会社 Translation device
JP2021026590A (en) * 2019-08-07 2021-02-22 株式会社椿知財サービス Translation device, program for controlling translation device, and translation evaluation method using translation device

Also Published As

Publication number Publication date
JP5973986B2 (en) 2016-08-23

Similar Documents

Publication Publication Date Title
Wolf et al. Joint word2vec Networks for Bilingual Semantic Representations.
JP4961755B2 (en) Word alignment device, word alignment method, word alignment program
JP5973986B2 (en) Translation system, method, and program
Buck Black box features for the WMT 2012 quality estimation shared task
Gómez-Adorno et al. Improving feature representation based on a neural network for author profiling in social media texts
KR20130018205A (en) Method for disambiguating multiple readings in language conversion
Garg et al. Rule based Hindi part of speech tagger
JP2007156545A (en) Symbol string conversion method, word translation method, its device, its program and recording medium
JP6145059B2 (en) Model learning device, morphological analysis device, and method
Hamdi et al. Automatically building a Tunisian lexicon for deverbal nouns
JP2020106880A (en) Information processing apparatus, model generation method and program
JP2017010274A (en) Associating device and program
Das et al. English to Indian languages machine transliteration system at NEWS 2010
Sumanathilaka et al. Swa-bhasha: Romanized sinhala to sinhala reverse transliteration using a hybrid approach
JP5833087B2 (en) Character string processing apparatus, method, and program
Lehal et al. Sangam: A Perso-Arabic to Indic script machine transliteration model
Vijaya et al. English to tamil transliteration using weka
JP6564709B2 (en) Sentence rewriting device, method, and program
Unlee et al. Thai to Isarn dialect machine translation using rule-based and example-based
Gupta et al. Knowledge representation of grammatical constructs of sanskrit language using rule based sanskrit language to english language machine translation
Singvongsa et al. Lao-Thai machine translation using statistical model
Wu et al. Binary-class and Multi-class Chinese Textural Entailment System Description in NTCIR-9 RITE.
JP2016189154A (en) Translation method, device, and program
CN113822053A (en) Grammar error detection method and device, electronic equipment and storage medium
JP2006024114A (en) Mechanical translation device and mechanical translation computer program

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150421

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150519

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150730

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20150806

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20151002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160715

R150 Certificate of patent or registration of utility model

Ref document number: 5973986

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150