JP6160438B2 - Machine translation apparatus, machine translation program, and machine translation method - Google Patents

Machine translation apparatus, machine translation program, and machine translation method Download PDF

Info

Publication number
JP6160438B2
JP6160438B2 JP2013219656A JP2013219656A JP6160438B2 JP 6160438 B2 JP6160438 B2 JP 6160438B2 JP 2013219656 A JP2013219656 A JP 2013219656A JP 2013219656 A JP2013219656 A JP 2013219656A JP 6160438 B2 JP6160438 B2 JP 6160438B2
Authority
JP
Japan
Prior art keywords
language
translation
sentence
unknown word
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013219656A
Other languages
Japanese (ja)
Other versions
JP2015082204A (en
Inventor
友樹 長瀬
友樹 長瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013219656A priority Critical patent/JP6160438B2/en
Publication of JP2015082204A publication Critical patent/JP2015082204A/en
Application granted granted Critical
Publication of JP6160438B2 publication Critical patent/JP6160438B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、第一言語の文章を第二言語の文章へ機械翻訳する機械翻訳装置、機械翻訳プログラム及び機械翻訳方法に関する。   The present invention relates to a machine translation device, a machine translation program, and a machine translation method that machine translate a sentence in a first language into a sentence in a second language.

従来、翻訳対象の第一言語の文章をこれとは異なる翻訳目的の第二言語の文章へ翻訳する機械翻訳装置や機械翻訳ソフトが知られている。これらの機械翻訳装置や機械翻訳ソフトは、第一言語と第二言語の対訳辞書を用いて、第一言語の文章を第二言語の文章へ翻訳している。   2. Description of the Related Art Conventionally, machine translation devices and machine translation software that translate a sentence in a first language to be translated into a sentence in a second language different from the translation target are known. These machine translation devices and machine translation software translate a sentence in the first language into a sentence in the second language using a bilingual dictionary of the first language and the second language.

ところが、対訳辞書に十分な数の単語が登録されていない場合、第一言語の解析工程において未知語(未登録語)の発生頻度が高まり、全体として高い翻訳精度を得ることができない。よって、機械翻訳の翻訳品質を向上させるためには、対訳辞書を充実させる必要がある。未登録語を無くすことを目的として、機械翻訳を適用しようとする分野の文書から未登録語を抽出する技術が多数開示されている。例えば、日本語テキストのひらがな部分に未登録語が含まれると、ひらがな一文字が単語として切り出されることに着眼して、ひらがな未知語を単語の単位で抽出する技術が開示されている(例えば、特許文献1参照。)。   However, if a sufficient number of words are not registered in the bilingual dictionary, the frequency of occurrence of unknown words (unregistered words) increases in the first language analysis step, and high translation accuracy cannot be obtained as a whole. Therefore, in order to improve the translation quality of machine translation, it is necessary to enrich the bilingual dictionary. Many techniques for extracting unregistered words from documents in the field to which machine translation is applied have been disclosed for the purpose of eliminating unregistered words. For example, a technique is disclosed in which hiragana unknown words are extracted in units of words, focusing on the fact that a single hiragana character is extracted as a word when an unregistered word is included in the hiragana part of Japanese text (for example, patents). Reference 1).

しかしながら、未知語抽出技術によって未知語を多数切り出すことができたとしても、それだけで機械翻訳の精度を上げることはできない。例えば、日本語から英語の機械翻訳の場合では、未知語抽出技術で切り出された未知語のリスト(日本語)それぞれについて、人間によって訳語(英語)を登録していかなければならない。この訳語を登録する作業には日本語と英語の両方の言語に流暢であるだけでなく、しばしば当該分野の専門知識が必要とされ、人材確保の点からも工数の点からもコストが高くついてしまう。また、対訳辞書の整備は言語対毎に必要であり、多言語間の対訳辞書の整備作業にはさらに多大な工数が必要とされる。   However, even if many unknown words can be extracted by the unknown word extraction technique, the accuracy of machine translation alone cannot be improved. For example, in the case of machine translation from Japanese to English, a translation (English) must be registered by a human for each unknown word list (Japanese) extracted by the unknown word extraction technique. The task of registering this translation is not only fluent in both Japanese and English, but often requires specialized knowledge in the field, which is expensive in terms of manpower and man-hours. End up. In addition, the maintenance of a bilingual dictionary is required for each language pair, and the work for maintaining a bilingual bilingual dictionary requires much more man-hours.

また、人手による対訳辞書の整備を軽減して未知語による訳文品質低下を抑えるための技術として、第一言語と第三言語の対訳辞書を用いて第一言語と第二言語の対訳辞書を拡充する技術が開示されている(例えば、特許文献2参照。)。   In addition, as a technology to reduce the quality of translations caused by unknown words by reducing the manual translation dictionary, the first and second language bilingual dictionaries have been expanded using the first and third language bilingual dictionaries. The technique to do is disclosed (for example, refer patent document 2).

図1は、第一言語と第三言語の対訳辞書を用いて第一言語と第二言語の対訳辞書を拡充する技術を説明するための図である。   FIG. 1 is a diagram for explaining a technique for expanding a bilingual dictionary for a first language and a second language using a bilingual dictionary for a first language and a third language.

図1において、第一言語(日本語)と第二言語(中国語)の対訳辞書(日中辞書)には、日本語「低下」−中国語「降低」のみが存在する。そして、第一言語と第三言語(英語)の対訳辞書(日英辞書)には、日本語「低下」−英語「drop」、日本語「降下」−「drop」、日本語「低落」−「drop」、日本語「ドロップ」−「drop」が存在する。このような場合、「低下」から日英辞書を用いて「drop」を検索し、さらに「drop」から「降下」、「低落」、「ドロップ」を検索することで、「低下」の同義語を求める。このようにして検索した同義語「降下」、「低落」、「ドロップ」を中国語「降低」に対応付けて登録することによって、日中辞書には含まれていなかった「降下」−「降低」を補うことができる。このように対訳辞書が拡充されることにより、第一言語(日本語)から第二言語(中国語)への翻訳が不可能であった「降下」を「降低」と翻訳することが可能となる。   In FIG. 1, there are only Japanese “decline” -Chinese “fall” in the bilingual dictionary (Japanese-Chinese dictionary) of the first language (Japanese) and the second language (Chinese). The bilingual dictionary (Japanese-English dictionary) of the first language and the third language (English) includes Japanese “drop” —English “drop”, Japanese “drop” — “drop”, Japanese “low drop” — "Drop", Japanese "drop"-"drop" exists. In such a case, search for “drop” using a Japanese-English dictionary from “drop”, and then search for “drop”, “low drop”, and “drop” from “drop”. Ask for. By registering the retrieved synonyms “fall”, “fall”, and “drop” in association with Chinese “fall”, “descent” − “fall” that was not included in the daytime dictionary. Can be supplemented. By expanding the bilingual dictionary in this way, it is possible to translate “descent”, which was impossible to translate from the first language (Japanese) into the second language (Chinese), as “falling down” Become.

特開平1−220067号公報JP-A-1-220067 特開2007−26420号公報JP 2007-26420 A

しかしながら、第一言語と第三言語の対訳辞書を用いて第一言語と第二言語の対訳辞書を拡充しようとしても、第一言語と第三言語の対訳辞書において、対訳が1つしか存在しない場合又は1つも存在しない場合には、第一言語と第二言語の対訳辞書を拡充することができず、全体として高い翻訳精度を得ることができない。   However, even if you try to expand the bilingual dictionary for the first and second languages using the bilingual dictionary for the first and third languages, there is only one bilingual translation in the bilingual dictionary for the first and third languages. In some cases or in the case where none exists, the bilingual dictionary of the first language and the second language cannot be expanded, and high translation accuracy cannot be obtained as a whole.

1つの側面では、本発明は、第一言語と第三言語の対訳辞書において、対訳が1つしか存在しない場合又は1つも存在しない場合であっても、全体として高い翻訳精度を得ることが可能な機械翻訳装置、機械翻訳プログラム及び機械翻訳方法を提供することを目的とする。   In one aspect, the present invention can obtain high translation accuracy as a whole even when there is only one or no parallel translation in the bilingual dictionary of the first language and the third language. An object of the present invention is to provide a machine translation apparatus, a machine translation program, and a machine translation method.

本発明は、上記課題を解決するため、下記のような構成を採用した。
1つの案では、機械翻訳装置は、翻訳対象の第一言語の文章を入力する入力手段と、前記第一言語の少なくとも1つの表現に対して少なくとも1つの第二言語の表現が対応付けて登録されている第一言語第二言語対訳辞書と、前記入力手段で入力された前記第一言語の文章を形態素解析し、前記第一言語第二言語対訳辞書を参照して、前記第一言語とは異なる翻訳目的の第二言語の文章に翻訳する第一言語第二言語翻訳手段と、前記第一言語第二言語翻訳手段による翻訳結果と形態素解析結果に基づいて、前記第一言語第二言語対訳辞書に前記第二言語の表現が登録されていない未知語を認識する未知語認識手段と、前記第一言語の少なくとも1つの表現に対して前記第一言語及び前記第二言語とは異なる少なくとも1つの第三言語の表現が対応付けて登録されている第一言語第三言語対訳辞書と、前記入力手段で入力された前記第一言語の文章を形態素解析し、前記第一言語第三言語対訳辞書を参照して、前記第三言語の文章に翻訳する第一言語第三言語翻訳手段と、前記第一言語第三言語翻訳手段によって翻訳された前記第三言語の文章のうち、前記未知語認識手段によって認識された未知語に対応する第三言語を切り出す未知語第三言語切り出し手段と、前記未知語第三言語切り出し手段によって切り出された前記第三言語を複数の形態素に分割する第三言語形態素解析手段と、前記第一言語第三言語対訳辞書を参照して、前記分割された形態素に対応する前記第一言語の単語を検索する第三言語第一言語辞書引き手段と、前記第三言語第一言語辞書引き手段を用いて、前記分割された複数の形態素に対応する前記第一言語の複数の単語を組み合わせることにより、前記未知語認識手段によって認識した前記未知語の代替表記を生成する代替表記生成手段と、前記入力手段で入力された前記第一言語の文章のうち、前記未知語認識手段によって認識した未知語を、前記代替表記生成手段によって生成された前記代替表記に置き換えることにより、前記入力された前記第一言語の文章を修正する入力文修正手段とを備え、前記第一言語第二言語翻訳手段は、前記入力文修正手段によって修正された第一言語の文章を第二言語の文章に翻訳することを特徴とする。
The present invention employs the following configuration in order to solve the above problems.
In one proposal, the machine translation device registers an input unit for inputting a sentence in a first language to be translated and at least one second language expression in association with at least one expression in the first language. Morphological analysis of the first language second language parallel translation dictionary and the first language text input by the input means, and referring to the first language second language parallel translation dictionary, the first language Is a first language second language translation means for translating into a second language sentence for different translation purposes, and the first language second language based on the translation result and the morphological analysis result by the first language second language translation means. An unknown word recognizing means for recognizing an unknown word in which the expression of the second language is not registered in the bilingual dictionary; and at least one expression of the first language is different from the first language and the second language One third language expression Correspondingly registered first language third language bilingual dictionary and morphological analysis of the first language sentence input by the input means, referring to the first language third language bilingual dictionary, A first language third language translation means for translating into a third language sentence, and an unknown word recognized by the unknown word recognition means among the third language sentences translated by the first language third language translation means An unknown word third language cutout means for cutting out a third language corresponding to a word; a third language morpheme analysis means for dividing the third language cut out by the unknown word third language cutout means into a plurality of morphemes; A third language first language dictionary lookup means for searching for a word in the first language corresponding to the divided morpheme with reference to a first language third language parallel translation dictionary; and the third language first language dictionary lookup. Using means An alternative notation generating means for generating an alternative notation of the unknown word recognized by the unknown word recognizing means by combining a plurality of words of the first language corresponding to the plurality of divided morphemes, and input by the input means Of the inputted sentences in the first language, the unknown words recognized by the unknown word recognition unit are replaced with the alternative notation generated by the alternative notation generation unit, whereby the inputted first language sentence The first language second language translation means translates the first language sentence corrected by the input sentence correction means into a second language sentence. .

本発明によれば、対訳辞書に登録されていないために対訳できない未知語の代替表記を作成することにより、機械翻訳品質が大きく向上する、という効果を奏する。   According to the present invention, by creating an alternative notation for an unknown word that cannot be translated because it is not registered in the bilingual dictionary, the machine translation quality is greatly improved.

第一言語と第三言語の対訳辞書を用いて第一言語と第二言語の対訳辞書を拡充する技術を説明するための図である。It is a figure for demonstrating the technique which expands the bilingual dictionary of a 1st language and a 2nd language using the bilingual dictionary of a 1st language and a 3rd language. 機械翻訳処理の概要を説明するための図である。It is a figure for demonstrating the outline | summary of a machine translation process. 第1の実施の形態の機械翻訳装置1の構成を示す図である。It is a figure which shows the structure of the machine translation apparatus 1 of 1st Embodiment. 第一言語第二言語対訳辞書13の例を示す図である。It is a figure which shows the example of the 1st language 2nd language parallel translation dictionary. 第一言語第三言語対訳辞書16の例を示す図である。It is a figure which shows the example of the 1st language 3rd language parallel translation dictionary. 未知語第三言語切り出し処理の流れを示すフローチャートである。It is a flowchart which shows the flow of an unknown word 3rd language extraction process. 機械翻訳処理(その1)の動作例を説明するための図である。It is a figure for demonstrating the operation example of a machine translation process (the 1). 未知語リスト800の例を示す図である。6 is a diagram illustrating an example of an unknown word list 800. FIG. 第一言語形態素リスト900の例を示す図である。It is a figure which shows the example of the 1st language morpheme list. 代替表記生成処理の流れを示すフローチャートである。It is a flowchart which shows the flow of an alternative description production | generation process. 入力文修正処理の流れを示すフローチャートである。It is a flowchart which shows the flow of an input sentence correction process. 機械翻訳処理(その2)の動作例を説明するための図である。It is a figure for demonstrating the operation example of a machine translation process (the 2). 第一言語形態素リスト1300の例を示す図である。It is a figure which shows the example of the 1st language morpheme list | wrist 1300. FIG. 第2の実施の形態の機械翻訳装置2の構成を示す図である。It is a figure which shows the structure of the machine translation apparatus 2 of 2nd Embodiment. 第3の実施の形態の機械翻訳装置3の構成を示す図である。It is a figure which shows the structure of the machine translation apparatus 3 of 3rd Embodiment. 第4の実施の形態の構成を示す図である。It is a figure which shows the structure of 4th Embodiment. 第5の実施の形態の構成を示す図である。It is a figure which shows the structure of 5th Embodiment. 第6の実施の形態の機械翻訳装置4の構成を示す図である。It is a figure which shows the structure of the machine translation apparatus 4 of 6th Embodiment.

以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。
図2乃至図13を用いて、第1の実施の形態を説明する。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
The first embodiment will be described with reference to FIGS.

まず、図2を用いて本実施の形態における機械翻訳処理の概要を説明する。
図2は、機械翻訳処理の概要を説明するための図である。
First, the outline of the machine translation process in the present embodiment will be described with reference to FIG.
FIG. 2 is a diagram for explaining the outline of the machine translation process.

図2に示す例は、翻訳対象の第一言語、例えば日本語の文章中に「オブジェクトオリエンテッド」という単語が含まれる場合を示している。そして、この第一言語とは異なる翻訳目的の第二言語、例えば中国語の文章へ翻訳する際、対訳辞書中に日本語の「オブジェクトオリエンテッド」に対応する中国語が登録されていないことがある。   The example shown in FIG. 2 shows a case where the word “object oriented” is included in a first language to be translated, for example, a Japanese sentence. And when translating into a second language for translation purposes different from the first language, for example, a Chinese sentence, Chinese corresponding to “Object Oriented” in Japanese may not be registered in the bilingual dictionary. is there.

このような場合、本実施の形態における機械翻訳処理は、第一言語及び第二言語とは異なる第三言語、例えば英語への翻訳を実行する。すると、日本語「オブジェクトオリエンテッド」に対応する英語「object oriented」が検索される。そして、英語「object oriented」を「object」と「oriented」の2単語に分割する。   In such a case, the machine translation process in the present embodiment executes translation into a third language, for example, English, which is different from the first language and the second language. Then, English “object oriented” corresponding to Japanese “object oriented” is searched. Then, the English “object oriented” is divided into two words “object” and “oriented”.

次に、英日の対訳辞書を用いて、これら分割した「object」及び「oriented」に対応する日本語を検索する。例えば、英語「object」に対応する日本語は、「対象」「物体」「目的」の3つが検索される。また、英語「oriented」に対しては日本語「指向の」が検索される。   Next, using the English-Japanese bilingual dictionary, the Japanese corresponding to the divided “object” and “oriented” is searched. For example, as for Japanese corresponding to English “object”, three of “object”, “object”, and “purpose” are searched. Also, Japanese “oriented” is searched for English “oriented”.

次に、日中の対訳辞書を用いて、これら検索された日本語「対象」「物体」「目的」及び「指向の」に対応する中国語を検索する。その結果、日本語「対象」に対応する中国語

Figure 0006160438
が検索され、日本語「指向の」に対応する中国語「面向的」が検索される。なお、日本語「物体」「目的」に対応する中国語は、日中の対訳辞書に登録されておらず、検索されない。 Next, using the bilingual bilingual dictionary, the Chinese corresponding to the searched Japanese “object”, “object”, “purpose” and “oriented” is searched. As a result, the Chinese corresponding to the Japanese "subject"
Figure 0006160438
Is searched, and Chinese “face-to-face” corresponding to Japanese “oriented” is searched. Note that Chinese corresponding to Japanese “object” and “purpose” is not registered in the bilingual dictionary during the day and is not searched.

そして、日本語「対象」に対応する中国語

Figure 0006160438
と、日本語「指向の」に対応する中国語「面向的」を組み合わせて、日本語「オブジェクトオリエンテッド」に対応する中国語として、
Figure 0006160438
が出力される。 And Chinese corresponding to Japanese "subject"
Figure 0006160438
And Chinese corresponding to Japanese “Object Oriented”, combined with Chinese “face oriented” corresponding to Japanese “Oriented”,
Figure 0006160438
Is output.

図3は、第1の実施の形態の機械翻訳装置1の構成を示す図である。図4は、第一言語第二言語対訳辞書13の例を示す図である。図5は、第一言語第三言語対訳辞書16の例を示す図である。   FIG. 3 is a diagram illustrating a configuration of the machine translation apparatus 1 according to the first embodiment. FIG. 4 is a diagram illustrating an example of the first language / second language parallel translation dictionary 13. FIG. 5 is a diagram illustrating an example of the first language / third language parallel translation dictionary 16.

図3において、機械翻訳装置1は、入力部11、第一言語第二言語翻訳部12、第一言語第二言語対訳辞書13、未知語認識部14、第一言語第三言語翻訳部15、第一言語第三言語対訳辞書16、第三言語形態素解析部17、未知語第三言語切り出し部18、第三言語第一言語辞書引き部19、代替表記生成部20、入力文修正部21、及び出力部22を備える。   In FIG. 3, the machine translation device 1 includes an input unit 11, a first language / second language translation unit 12, a first language / second language parallel translation dictionary 13, an unknown word recognition unit 14, a first language / third language translation unit 15, A first language third language parallel translation dictionary 16, a third language morphological analysis unit 17, an unknown word third language segmentation unit 18, a third language first language dictionary lookup unit 19, an alternative notation generation unit 20, an input sentence correction unit 21, And an output unit 22.

入力部11は、翻訳対象の第一言語(例えば、日本語。以下、単に「日」と表記することもある。)の文章を入力する。   The input unit 11 inputs a sentence in a first language to be translated (for example, Japanese. Hereinafter, sometimes simply referred to as “day”).

第一言語第二言語翻訳部12は、入力部11で入力された第一言語(日)の文章を、形態素解析し、図4に示すような第一言語第二言語対訳辞書13を参照して、第一言語とは異なる翻訳目的の第二言語(例えば、中国語。以下、単に「中」と表記することもある。)の文章に翻訳する。   The first language / second language translation unit 12 performs morphological analysis on the sentence of the first language (day) input by the input unit 11, and refers to the first language / second language parallel translation dictionary 13 as shown in FIG. Thus, it is translated into a sentence in a second language (for example, Chinese. Hereinafter, it may be simply referred to as “middle”) for translation purposes different from the first language.

第一言語第二言語対訳辞書13は、第一言語(日)の少なくとも1つの表現に対して、少なくとも1つの第二言語(中)の表現が対応付けて登録されている。   In the first language / second language parallel translation dictionary 13, at least one expression of the second language (medium) is registered in association with at least one expression of the first language (day).

未知語認識部14は、第一言語第二言語翻訳部12によって実行された翻訳結果と形態素解析の結果に基づいて、第一言語第二言語対訳辞書13に第二言語(中)の表現が登録されていない第一言語(日)の表現を「未知語」として認識する。   Based on the translation result executed by the first language / second language translation unit 12 and the result of the morphological analysis, the unknown word recognition unit 14 stores the representation of the second language (medium) in the first language / second language parallel translation dictionary 13. Recognize unregistered first language (Japanese) expressions as "unknown words".

第一言語第三言語翻訳部15は、入力部11で入力された第一言語(日)の文章を、形態素解析し、図5に示すような第一言語第三言語対訳辞書16を参照して、第一言語(日)及び第二言語(中)とは異なる第三言語(例えば、英語。以下、単に「英」と表記することもある。)の文章に翻訳する。   The first language / third language translation unit 15 performs morphological analysis on the sentence of the first language (day) input by the input unit 11, and refers to the first language / third language parallel translation dictionary 16 as shown in FIG. Thus, the sentence is translated into a sentence in a third language (for example, English. Hereinafter, it may be simply referred to as “English”) different from the first language (Japanese) and the second language (middle).

第一言語第三言語対訳辞書16は、第一言語(日)の少なくとも1つの表現に対して、第一言語(日)及び第二言語(中)とは異なる少なくとも1つの第三言語(英)の表現が対応付けて登録されている。   The first-language third-language bilingual dictionary 16 has at least one third language (English) different from the first language (day) and the second language (medium) for at least one expression of the first language (day). ) Is registered in association with each other.

第三言語形態素解析部17は、第三言語(英)の文章を複数の形態素に分割する。
未知語第三言語切り出し部18は、第一言語第三言語翻訳部15によって翻訳された第三言語(英)の文章のうち、未知語認識部14によって認識された未知語に対応する第三言語(英)を切り出す。そして、未知語第三言語切り出し部18は、第三言語形態素解析部17を用いて、切り出した第三言語(英)を複数の形態素に分割する。
The third language morpheme analyzer 17 divides the third language (English) sentence into a plurality of morphemes.
The unknown language third language cutout unit 18 corresponds to an unknown word recognized by the unknown word recognition unit 14 among the sentences of the third language (English) translated by the first language third language translation unit 15. Cut out the language (English). Then, the unknown language third language extraction unit 18 divides the extracted third language (English) into a plurality of morphemes using the third language morpheme analysis unit 17.

第三言語第一言語辞書引き部19は、第一言語第三言語対訳辞書16を参照して、分割された第三言語(英)の形態素に対応する第一言語(日)の単語を検索する。   The third language first language dictionary lookup unit 19 refers to the first language third language parallel translation dictionary 16 and searches for words in the first language (day) corresponding to the divided third language (English) morphemes. To do.

代替表記生成部20は、第三言語第一言語辞書引き部19を用いて、未知語第三言語切り出し部18によって分割された複数の形態素、すなわち第三言語(英)の複数の単語それぞれに対応する第一言語(日)の単語を検索する。そして、代替表記生成部20は、検索された複数の単語を組み合わせることにより、未知語認識部14によって認識した未知語の代替表記を生成する。   The alternative notation generation unit 20 uses the third language first language dictionary lookup unit 19 to each of a plurality of morphemes divided by the unknown language third language extraction unit 18, that is, a plurality of words in the third language (English). Search for words in the corresponding first language (day). And the alternative notation production | generation part 20 produces | generates the alternative notation of the unknown word recognized by the unknown word recognition part 14 by combining the searched several word.

入力文修正部21は、入力部11で入力された第一言語(日)の文章のうち、未知語認識部14によって認識した未知語を、代替表記生成部20によって生成された代替表記に置き換えることにより、入力された第一言語(日)の文章を修正する。   The input sentence correction unit 21 replaces the unknown word recognized by the unknown word recognition unit 14 with the alternative notation generated by the alternative notation generation unit 20 in the sentence of the first language (day) input by the input unit 11. Thus, the input sentence of the first language (day) is corrected.

出力部22は、入力文修正部21によって修正された第一言語(日)の文章を出力する。出力された修正後の第一言語(日)の文章は、第一言語第二言語翻訳部12によって、より精度の高い翻訳が可能となる。   The output unit 22 outputs the sentence in the first language (day) corrected by the input sentence correction unit 21. The corrected first language (Japanese) sentence that has been output can be translated with higher accuracy by the first language / second language translation unit 12.

なお、上記では、翻訳対象の第一言語を日本語、翻訳目標の第二言語を中国語、そして、第三言語を英語の場合について説明したが、第一言語、第二言語及び第三言語の組み合わせに制約はない。   In the above description, the first language to be translated is Japanese, the second language to be translated is Chinese, and the third language is English. However, the first language, the second language, and the third language are described. There are no restrictions on the combinations.

未知語は、例えば、固有名詞、専門用語、普通名詞などに分類される。機械、道具、アプリケーションソフトなどの使用マニュアルなどの技術文書は、専門用語の未知語が多い。手紙など一般文では固有名詞や普通名詞の未知語が多い。また、日本語では新しい外来語をカタカナにする習慣があり、辞書に登録されていなければそのカタカナ語が未知語である。広義には複合語も未知語の一種である。例えば、「機械翻訳」は1単語であるが、「機械」と「翻訳」の単語があれば意味の通る訳文がつくれる。   Unknown words are classified into proper nouns, technical terms, common nouns, and the like. Technical documents such as manuals for machines, tools, application software, etc. have many unknown terms. In general sentences such as letters, there are many unknown words such as proper nouns and common nouns. Also, in Japanese, there is a custom of making a new foreign word katakana, and if it is not registered in the dictionary, that katakana is an unknown word. In a broad sense, compound words are a kind of unknown word. For example, “machine translation” is one word, but if there are the words “machine” and “translation”, a meaningful translation can be made.

図6乃至図13を用いて、機械翻訳装置1が実行する機械翻訳処理を詳細に説明する。機械翻訳処理は、後述する「未知語第三言語切り出し処理」「代替表記生成処理」「入力文修正処理」を含む。   The machine translation process executed by the machine translation apparatus 1 will be described in detail with reference to FIGS. The machine translation process includes an “unknown word third language extraction process”, “alternative notation generation process”, and “input sentence correction process” which will be described later.

図6は、未知語第三言語切り出し処理の流れを示すフローチャートである。図7は、機械翻訳処理(その1)の動作例を説明するための図である。図8は、未知語リスト800の例を示す図である。図9は、第一言語形態素リスト900の例を示す図である。   FIG. 6 is a flowchart showing the flow of unknown word third language extraction processing. FIG. 7 is a diagram for explaining an operation example of machine translation processing (part 1). FIG. 8 is a diagram illustrating an example of the unknown word list 800. FIG. 9 is a diagram illustrating an example of the first language morpheme list 900.

図6のステップS601において、入力部11によって入力された第一言語(日)の文章、例えば、図7の原文701「彼はオブジェクトオリエンテッドランゲージを勉強している。」を、第一言語第二言語翻訳部12が翻訳する。翻訳結果は、日中翻訳文702

Figure 0006160438
となる。また、翻訳の過程で実行される形態素解析の結果として、原文形態素703「/彼/は/オブジェクトオリエンテッド/ランゲージ/を/勉強/し/て/いる/。/」を取得する。 In step S601 of FIG. 6, the sentence in the first language (day) input by the input unit 11, for example, the original sentence 701 in FIG. 7, “He is studying object-oriented language” The bilingual translation unit 12 translates. The translation result is a Japanese-Chinese translation 702
Figure 0006160438
It becomes. Also, as a result of the morphological analysis executed in the translation process, the original text morpheme 703 “/ hi / ha / object-oriented / language /// study / do / de ///” is acquired.

ステップS602において、未知語認識部14が、翻訳した日中翻訳文702

Figure 0006160438
と、取得した原文形態素703「/彼/は/オブジェクトオリエンテッド/ランゲージ/を/勉強/し/て/いる/。/」に基づいて、第一言語第二言語対訳辞書13に登録されていない第一言語(日)の表現、未知語704「オブジェクトオリエンテッド」を「未知語」として認識する。そして、認識した未知語を、図8に示すような未知語リスト800に作成する。 In step S602, the unknown word recognition unit 14 translates the Japanese-Chinese translation 702.
Figure 0006160438
And is not registered in the first language bilingual bilingual dictionary 13 based on the acquired original text morpheme 703 “/ he / ha / object oriented / language /// study / do / te / is /./”. The expression of the first language (day), the unknown word 704 “object oriented” is recognized as “unknown word”. Then, the recognized unknown word is created in an unknown word list 800 as shown in FIG.

ステップS603において、ステップS601で第一言語を第二言語に翻訳した文章と同一の第一言語(日)の文章を、第一言語第三言語翻訳部15で翻訳し、形態素解析結果を取得する。すなわち、入力部11によって入力された第一言語(日)の文章、原文701「彼はオブジェクトオリエンテッドランゲージを勉強している。」を、第一言語第三言語翻訳部15が翻訳する。翻訳結果は、日英翻訳文705「He is studying object oriented language.」となる。また、翻訳の過程で実行される形態素解析の結果として、原文形態素703「/彼/は/オブジェクトオリエンテッド/ランゲージ/を/勉強/し/て/いる/。/」を取得する。   In step S603, the first language third language translation unit 15 translates a sentence in the same first language (day) as the sentence in which the first language is translated into the second language in step S601, and obtains a morphological analysis result. . In other words, the first language third language translation unit 15 translates the sentence 701 “he is studying object-oriented language”, which is the first language (day) sentence input by the input unit 11. The translation result is a Japanese-English translation 705 “He is studying object oriented language.” Also, as a result of the morphological analysis executed in the translation process, the original text morpheme 703 “/ hi / ha / object-oriented / language /// study / do / de ///” is acquired.

ステップS604において、ステップS601で第一言語第二言語翻訳部12が実行した形態素解析の結果、原文形態素703「/彼/は/オブジェクトオリエンテッド/ランゲージ/を/勉強/し/て/いる/。/」に基づいて、図9に示すような第一言語形態素リスト900を作成する。   In step S604, as a result of the morphological analysis performed by the first language / second language translation unit 12 in step S601, the original morpheme 703 “/ he / has / object-oriented / language // study / do / do / is /. The first language morpheme list 900 as shown in FIG. 9 is created based on “/”.

そして、未知語リスト800に登録された未知語を順にステップS606以降の処理の対象とするため、ステップS605において、ステップS602で作成した未知語リスト800の終わりか否かを判断する。   Then, in order to make the unknown words registered in the unknown word list 800 the target of processing in step S606 and subsequent steps, in step S605, it is determined whether or not the end of the unknown word list 800 created in step S602.

未知語リスト800の終わりであると判断された場合(ステップS605:Yes)、未知語第三言語切り出し処理を終了する。他方、未知語リスト800の終わりでないと判断された場合(ステップS605:No)、未知語リスト800に登録されている順に、ステップS606以降を繰り返す。   If it is determined that the end of the unknown word list 800 is reached (step S605: Yes), the unknown word third language extraction process is terminated. On the other hand, when it is determined that it is not the end of the unknown word list 800 (step S605: No), step S606 and subsequent steps are repeated in the order registered in the unknown word list 800.

ステップS606において、ステップS604で作成した第一言語形態素リスト900の終わりか否かを判断する。この判断ステップは、第一言語形態素リスト900に登録された第一言語形態素を順にステップS607以降の処理の対象とするためである。   In step S606, it is determined whether or not the end of the first language morpheme list 900 created in step S604. This determination step is for the first language morphemes registered in the first language morpheme list 900 to be sequentially processed in step S607 and subsequent steps.

第一言語形態素リスト900の終わりであると判断された場合(ステップS606:Yes)、ステップS605に戻り、未知語リスト800に登録された次の未知語をステップS606以降の処理の対象とする。他方、第一言語形態素リスト900の終わりでないと判断された場合(ステップS606:No)、第一言語形態素リスト900に登録されている順に、ステップS607以降を繰り返す。   When it is determined that the end of the first language morpheme list 900 is reached (step S606: Yes), the process returns to step S605, and the next unknown word registered in the unknown word list 800 is set as an object of processing from step S606. On the other hand, when it is determined that it is not the end of the first language morpheme list 900 (step S606: No), step S607 and subsequent steps are repeated in the order registered in the first language morpheme list 900.

ステップS607において、未知語リスト800の未知語と、第一言語形態素リスト900の第一言語形態素が同一か否かを判断する。   In step S607, it is determined whether or not the unknown word in the unknown word list 800 and the first language morpheme in the first language morpheme list 900 are the same.

同一でないと判断された場合(ステップS607:No)、ステップS608に進む。
ステップS608において、未知語が第一言語形態素に包含されているか否かを判断し、包含されていないと判断された場合(ステップS608:No)、第一言語形態素リスト900中の次の第一言語形態素を処理対象としてステップS606に戻る。すなわち、同一でもなく(ステップS607:No)、包含されてもいない(ステップS608:)ということは、未知語と第一言語形態素が全く異なる場合である。他方、ステップS608で、包含されていると判断された場合(ステップS608:Yes)、図12を用いて後述するステップS610に進む。
When it is determined that they are not identical (step S607: No), the process proceeds to step S608.
In step S608, it is determined whether or not the unknown word is included in the first language morpheme. If it is determined that the unknown word is not included (step S608: No), the next first in the first language morpheme list 900 is determined. The process returns to step S606 with the language morpheme as a processing target. That is, they are not the same (step S607: No) and are not included (step S608 :) when the unknown word and the first language morpheme are completely different. On the other hand, if it is determined in step S608 that it is included (step S608: Yes), the process proceeds to step S610 described later with reference to FIG.

他方、ステップS607で、同一であると判断された場合(ステップS607:Yes)、ステップS609において、第一言語形態素に対応する第三言語表記を未知語に対応する第三言語表記として、第三言語表記リストに格納する。そして、第一言語形態素リスト900に登録された次の第一言語形態素をステップS605以降の処理の対象とする。   On the other hand, if it is determined in step S607 that they are the same (step S607: Yes), in step S609, the third language notation corresponding to the first language morpheme is set as the third language notation corresponding to the unknown word. Store in language notation list. Then, the next first language morpheme registered in the first language morpheme list 900 is set as an object of the processing after step S605.

ここで、以上のステップS605乃至ステップS609の流れを、より具体的に説明する。   Here, the flow of the above steps S605 to S609 will be described more specifically.

ステップS605では、未知語リスト800の終わりか否かを判断する。未知語リスト800には、図8に示すように、1個の未知語704「オブジェクトオリエンテッド」が格納されている。最初のステップS605では、未知語リスト800の1番目の未知語704「オブジェクトオリエンテッド」が処理の対象となっている。未知語リスト800の終わりではないと判断される。よって、ステップS606へ進む(ステップS605:No)。   In step S605, it is determined whether or not the end of the unknown word list 800. In the unknown word list 800, as shown in FIG. 8, one unknown word 704 "object oriented" is stored. In the first step S605, the first unknown word 704 “object-oriented” in the unknown word list 800 is a processing target. It is determined that it is not the end of the unknown word list 800. Therefore, it progresses to step S606 (step S605: No).

ステップS606では、第一言語形態素リスト900の終わりか否かを判断する。第一言語形態素リスト900には、図9に示すように、10個の第一言語形態素901「彼」、902「は」、706「オブジェクトオリエンテッド」、903「ランゲージ」、904「を」、905「勉強」、906「し」、907「て」、908「いる」、909「。」が格納されている。最初のステップS606では、第一言語形態素リスト900の1番目の第一言語形態素901「彼」が処理の対象となっている。第一言語形態素リスト900の終わりではないと判断される。よって、ステップS607へ進む(ステップS606:No)。   In step S606, it is determined whether or not the first language morpheme list 900 is over. The first language morpheme list 900 includes ten first language morphemes 901 “hi”, 902 “ha”, 706 “object oriented”, 903 “language”, 904 “ 905 “study”, 906 “shi”, 907 “te”, 908 “is”, and 909 “.” Are stored. In the first step S606, the first first language morpheme 901 “hi” in the first language morpheme list 900 is the object of processing. It is determined that it is not the end of the first language morpheme list 900. Therefore, it progresses to step S607 (step S606: No).

ステップS607では、未知語リスト800の未知語704「オブジェクトオリエンテッド」と、第一言語形態素リスト900の第一言語形態素901「彼」が同一か否かを判断する。同一表記ではないので、ステップS608へ進む(ステップS607:No)。   In step S607, it is determined whether the unknown word 704 “object-oriented” in the unknown word list 800 and the first language morpheme 901 “hi” in the first language morpheme list 900 are the same. Since it is not the same notation, it progresses to step S608 (step S607: No).

ステップS608では、未知語704「オブジェクトオリエンテッド」が第一言語形態素901「彼」に包含されているか否かを判断する。包含されていないので、第一言語形態素リスト900中の次の第一言語形態素902「は」を処理対象としてステップS606に戻る。   In step S608, it is determined whether or not the unknown word 704 “object oriented” is included in the first language morpheme 901 “he”. Since it is not included, the next first language morpheme 902 “ha” in the first language morpheme list 900 is processed, and the process returns to step S606.

第一言語形態素901「彼」と同様に、第一言語形態素902「は」についてステップS606以降の処理を実行する。そして、第一言語形態素リスト900中の3番目の未知語形態素706「オブジェクトオリエンテッド」を処理対象としてステップS606に戻る。   Similarly to the first language morpheme 901 “he”, the processes in and after step S606 are executed for the first language morpheme 902 “ha”. Then, the third unknown word morpheme 706 “object-oriented” in the first language morpheme list 900 is processed, and the process returns to step S606.

同様に、ステップS606からステップ607へ進む。
ステップS607では、未知語リスト800の未知語704「オブジェクトオリエンテッド」と、第一言語形態素リスト900の未知語形態素706「オブジェクトオリエンテッド」が同一であるので、ステップS609へ進む(ステップS607:Yes)。
Similarly, the process proceeds from step S606 to step 607.
In step S607, since the unknown word 704 “object-oriented” in the unknown word list 800 and the unknown word morpheme 706 “object-oriented” in the first language morpheme list 900 are the same, the process proceeds to step S609 (step S607: Yes). ).

ステップS609では、未知語第三言語切り出し部18が、第一言語第三言語翻訳部15によって翻訳された日英翻訳文705「He is studying object oriented language.」のうち、未知語認識部14によって認識された未知語704「オブジェクトオリエンテッド」に対応する未知語対応英語707「object oriented」を切り出す。そして、未知語形態素706「オブジェクトオリエンテッド」に対応する第三言語表記を、未知語704「オブジェクトオリエンテッド」に対応する未知語対応英語707「object oriented」とする。この未知語対応英語707「object oriented」は、第三言語表記リストに格納される。この時点で、第三言語表記リストには、1つの未知語対応英語707「object oriented」が格納される。   In step S <b> 609, the unknown word third language extraction unit 18 performs the unknown word recognition unit 14 of the Japanese-English translation 705 “He is studying object oriented language.” Translated by the first language third language translation unit 15. The unknown word corresponding English 707 “object oriented” corresponding to the recognized unknown word 704 “object oriented” is extracted. Then, the third language notation corresponding to the unknown word morpheme 706 “object oriented” is defined as an unknown word corresponding English 707 “object oriented” corresponding to the unknown word 704 “object oriented”. This unknown word corresponding English 707 “object oriented” is stored in the third language notation list. At this time, one unknown word corresponding English 707 “object oriented” is stored in the third language notation list.

そして、ステップS606に戻り、第一言語形態素903「ランゲージ」、904「を」、905「勉強」、906「し」、907「て」、908「いる」、909「。」について、同様にステップS606以降の処理を実行する。第一言語形態素909「。」について、同様の処理を実行した後、ステップS606に戻ると、第一言語形態素リスト900の終わりであると判断される。よって、ステップS605へ戻る(ステップS606:Yes)。   Then, the process returns to step S606, and the same steps are performed for the first language morpheme 903 “language”, 904 “on”, 905 “study”, 906 “do”, 907 “te”, 908 “is”, and 909 “.”. The processing after S606 is executed. After performing the same processing for the first language morpheme 909 “.”, When returning to step S606, it is determined that the first language morpheme list 900 is the end. Therefore, the process returns to step S605 (step S606: Yes).

そして、ステップS605では、未知語リスト800に登録されているレコードは、未知語704「オブジェクトオリエンテッド」のみであるので、未知語リスト800の終わりであると判断される(ステップS605:Yes)。よって、未知語第三言語切り出し処理は終了する。なお、ステップS610及びステップS611については、図12を用いて後述する。   In step S605, since the record registered in the unknown word list 800 is only the unknown word 704 “object oriented”, it is determined that the record is the end of the unknown word list 800 (step S605: Yes). Therefore, the unknown word third language extraction process ends. Steps S610 and S611 will be described later with reference to FIG.

図10は、代替表記生成処理の流れを示すフローチャートである。
第三言語表記リストに登録された第三言語表記を順にステップS1002以降の処理の対象とするため、ステップS1001において、未知語に対応する第三言語表記リストの終わりか否かを判断する。未知語に対応する第三言語表記リストは、図6のステップS609で作成されたものである。例えば、図6の説明に用いた上述の例では、第三言語表記リストには、1つの未知語対応英語707「object oriented」が格納されている。
FIG. 10 is a flowchart showing the flow of the alternative notation generation process.
In order to make the third language notation registered in the third language notation list the target of processing in step S1002 and subsequent steps in order, in step S1001, it is determined whether or not the end of the third language notation list corresponding to the unknown word. The third language notation list corresponding to the unknown word is created in step S609 in FIG. For example, in the above example used for the description of FIG. 6, one unknown word-corresponding English 707 “object oriented” is stored in the third language notation list.

第三言語表記リストの終わりであると判断された場合(ステップS1001:Yes)、代替表記生成処理を終了する。他方、第三言語表記リストの終わりでないと判断された場合(ステップS1001:No)、ステップS1002において、第三言語表記に対応する未知語を第三言語表記リストから順に取得する。図7に示した例では、未知語対応英語707「object oriented」に対応する未知語704「オブジェクトオリエンテッド」を取得する。   If it is determined that the third language notation list is over (step S1001: Yes), the alternative notation generation process is terminated. On the other hand, if it is determined that it is not the end of the third language notation list (step S1001: No), in step S1002, unknown words corresponding to the third language notation are sequentially acquired from the third language notation list. In the example illustrated in FIG. 7, the unknown word 704 “object oriented” corresponding to the unknown word corresponding English 707 “object oriented” is acquired.

ステップS1003において、第三言語形態素解析部17を用いて、第三言語表記を複数の形態素に分割し、第三言語表記形態素リストを作成する。図7に示した例では、未知語対応英語707「object oriented」を未知語対応英語形態素708「/object/oriented/」に分割し、2つの第三言語形態素「object」と「oriented」が第三言語表記形態素リストに格納される。   In step S1003, the third language morpheme analyzer 17 is used to divide the third language notation into a plurality of morphemes and create a third language notation morpheme list. In the example shown in FIG. 7, the unknown word correspondence English 707 “object oriented” is divided into the unknown word correspondence English morpheme 708 “/ object / oriented /”, and the two third language morphemes “object” and “oriented” are the first. Stored in the trilingual morpheme list.

第三言語表記形態素リストに登録された第三言語形態素を順にステップS1005以降の処理の対象とするため、ステップS1004において、ステップS1003で作成した第三言語表記形態素リストの終わりか否かを判断する。   In order to make the third language morpheme registered in the third language notation morpheme list the target of processing in step S1005 and subsequent steps in order, in step S1004, it is determined whether or not the end of the third language notation morpheme list created in step S1003. .

第三言語表記形態素リストの終わりであると判断された場合(ステップS1004:Yes)、後述するステップS1010に進む。他方、第三言語表記形態素リストの終わりでないと判断された場合(ステップS1004:No)、ステップS1005において、各形態素に分割された第三言語の単語で第一言語第三言語対訳辞書16を検索し、検索された第一言語表記で第一言語表記リストを作成する。第一言語表記リストは、第一言語第三言語対訳辞書16に登録されている順番、通常は頻度順にしたがって作成される。図7に示した例では、第三言語形態素「object」で第一言語第三言語対訳辞書16を検索し、検索された第一言語表記である英語形態素対応日本語709「対象,物体,目的」で第一言語表記リストが作成される。   If it is determined that the third language notation morpheme list is over (step S1004: YES), the process proceeds to step S1010 described later. On the other hand, when it is determined that it is not the end of the third language notation morpheme list (step S1004: No), in step S1005, the first language third language bilingual dictionary 16 is searched with words of the third language divided into each morpheme. Then, a first language notation list is created with the searched first language notation. The first language notation list is created in the order registered in the first language third language parallel translation dictionary 16, usually in the order of frequency. In the example shown in FIG. 7, the first language third language parallel translation dictionary 16 is searched with the third language morpheme “object”, and the English morpheme-corresponding Japanese 709 “object, object, purpose” which is the searched first language notation. The first language expression list is created.

第一言語表記リストに登録された第一言語表記を順にステップS1007以降の処理の対象とするため、ステップS1006において、ステップS1005で作成した第一言語表記リストの終わりか否かを判断する。   In order to make the first language notation registered in the first language notation list the target of processing in step S1007 and subsequent steps in order, in step S1006, it is determined whether or not the end of the first language notation list created in step S1005.

第一言語表記リストの終わりであると判断された場合(ステップS1006:Yes)、ステップS1004に戻る。他方、第一言語表記リストの終わりでないと判断された場合(ステップS1006:No)、ステップS1007において、第一言語表記で第一言語第二言語対訳辞書13を検索し、検索された第二言語表記で第二言語表記リストを作成する。図7に示した例では、英語形態素対応日本語709「対象,物体,目的」で検索し、検索された

Figure 0006160438
で第二言語表記リストを作成する。 If it is determined that the first language notation list is over (step S1006: YES), the process returns to step S1004. On the other hand, when it is determined that it is not the end of the first language notation list (step S1006: No), in step S1007, the first language second language parallel translation dictionary 13 is searched with the first language notation, and the searched second language. Create a second language notation list with notation. In the example shown in FIG. 7, a search is performed using Japanese 709 “object, object, purpose” corresponding to English morpheme.
Figure 0006160438
To create a second language list.

第二言語表記リストに登録された第二言語表記を順にステップS1009の処理対象とするため、ステップS1008において、第二言語表記リストが空リストか否かを判断する。   In order to make the second language notation registered in the second language notation list the processing target of step S1009 in order, it is determined in step S1008 whether or not the second language notation list is an empty list.

空リストであると判断された場合(ステップS1008:Yes)、ステップS1006に戻り、空リストでないと判断された場合(ステップS1008:No)、ステップS1009において、第一言語表記を代替語バッファに追加し、ステップS1004に戻る。図7に示した例では、第二言語表記リストの最初には、

Figure 0006160438
が格納されているので、空リストではない。そして、代替語バッファには、
Figure 0006160438
に対応する第一言語表記「対象」を追加する。 If it is determined that the list is an empty list (step S1008: Yes), the process returns to step S1006. If it is determined that the list is not an empty list (step S1008: No), the first language notation is added to the alternative word buffer in step S1009. Then, the process returns to step S1004. In the example shown in FIG. 7, at the beginning of the second language notation list,
Figure 0006160438
Is stored, so it is not an empty list. And in the alternative word buffer,
Figure 0006160438
The first language notation “object” corresponding to is added.

そして、2度目のステップS1004において、第三言語表記形態素リストの終わりでないと判断され(ステップS1004:No)、2度目のステップS1005において、第三言語形態素「oriented」で第一言語第三言語対訳辞書16を検索し、検索された第一言語表記である英語形態素対応日本語710「指向の」で第一言語表記リストが作成される。   Then, in the second step S1004, it is determined that it is not the end of the third language notation morpheme list (step S1004: No), and in the second step S1005, the third language morpheme “oriented” is used as the first language third language parallel translation. The dictionary 16 is searched, and a first language notation list is created with English morpheme-corresponding Japanese 710 “oriented” which is the searched first language notation.

2度目のステップS1006において、第一言語表記リストの終わりでないと判断され(ステップS1006:No)、2度目のステップS1007において、第一言語表記で第一言語第二言語対訳辞書13を検索し、検索された第二言語表記で第二言語表記リストを作成する。図7に示した例では、英語形態素対応日本語710「指向の」で検索し、検索された「面向的」で第二言語表記リストを作成する。   In the second step S1006, it is determined that it is not the end of the first language notation list (step S1006: No), and in the second step S1007, the first language second language parallel translation dictionary 13 is searched with the first language notation, A second language notation list is created with the retrieved second language notation. In the example shown in FIG. 7, the English morpheme-compatible Japanese 710 “oriented” is searched, and the searched “face-to-face” second language notation list is created.

2度目のステップS1008において、第二言語表記リストの最初には、「面向的」が格納されているので、空リストではない。そして、代替語バッファには、「面向的」に対応する第一言語表記「指向の」を追加する。この時点(2度目のステップS1009)で、代替語バッファには、「対象指向の」が格納されている。   In the second step S1008, “face-to-face” is stored at the beginning of the second language notation list, so it is not an empty list. Then, the first language notation “oriented” corresponding to “face-to-face” is added to the alternative word buffer. At this point (second time step S1009), “subject oriented” is stored in the alternative word buffer.

そして、3度目のステップS1004では、第三言語表記形態素リストの終わりであると判断され(ステップS1004:Yes)、ステップS1010において、ステップS1002で取得した未知語の代替表記として、ステップS1009で追加された代替語バッファ中の第一言語表記を、表記置換えテーブルに出力する。図7に示した例では、未知語704「オブジェクトオリエンテッド」の代替表記として、代替語バッファ中の代替表記711「対象指向の」を、表記置換えテーブルに出力する。   In step S1004 for the third time, it is determined that the third language notation morpheme list is over (step S1004: Yes), and in step S1010, it is added in step S1009 as an alternative notation for the unknown word acquired in step S1002. The first language notation in the alternative word buffer is output to the notation replacement table. In the example illustrated in FIG. 7, the alternative notation 711 “object-oriented” in the alternative word buffer is output to the notation replacement table as the alternative notation of the unknown word 704 “object oriented”.

ステップS1011において、代替語バッファをクリアしてステップS1001に戻る。   In step S1011, the substitute word buffer is cleared, and the process returns to step S1001.

図11は、入力文修正処理の流れを示すフローチャートである。
図10のステップS1010で作成された表記置換えテーブルに登録された代替表記を順にステップS1102以降の処理の対象とするため、ステップS1101において、表記置換えテーブルの終わりか否かを判断する。
FIG. 11 is a flowchart showing the flow of input sentence correction processing.
Since the alternative notations registered in the notation replacement table created in step S1010 of FIG. 10 are to be processed sequentially in step S1102 and subsequent steps, in step S1101, it is determined whether or not the end of the notation replacement table.

表記置換えテーブルの終わりであると判断された場合(ステップS1101:Yes)、入力文修正処理を終了する。他方、表記置換えテーブルの終わりでないと判断された場合(ステップS1101:No)、ステップS1102において、置換え元表記である未知語で入力部11によって入力された第一言語(日)の文章を検索する。図7に示した例では、未知語704「オブジェクトオリエンテッド」で原文701「彼はオブジェクトオリエンテッドランゲージを勉強している。」を検索する。   When it is determined that the end of the notation replacement table is reached (step S1101: Yes), the input sentence correction process is terminated. On the other hand, if it is determined that it is not the end of the notation replacement table (step S1101: No), in step S1102, a sentence in the first language (day) input by the input unit 11 with an unknown word that is a replacement source notation is searched. . In the example shown in FIG. 7, the unknown word 704 “object-oriented” is searched for the original text 701 “he is studying object-oriented language”.

ステップS1103において、ヒットした表記部分を代替表記で置換する。図7に示した例では、原文701「彼はオブジェクトオリエンテッドランゲージを勉強している。」のうち、未知語704「オブジェクトオリエンテッド」に対応する部分を、代替表記711「対象指向の」で置換する。置換した結果は、修正後原文712「彼は対象指向のランゲージを勉強している。」となる。   In step S1103, the hit notation is replaced with an alternative notation. In the example shown in FIG. 7, the portion corresponding to the unknown word 704 “object-oriented” in the original text 701 “he is studying object-oriented language” is represented by the alternative notation 711 “object-oriented”. Replace. The result of the replacement is the corrected original text 712 “He is studying object-oriented language”.

以上の図6、図10及び図11で説明したような処理を実行すると、原文701「彼はオブジェクトオリエンテッドランゲージを勉強している。」は、修正後原文712「彼は対象指向のランゲージを勉強している。」と修正される。そして、第一言語第三言語翻訳部15が、この修正後の修正後原文712「彼は対象指向のランゲージを勉強している。」を翻訳すると、修正後日中翻訳文713

Figure 0006160438
と翻訳される。 When the processes described in FIGS. 6, 10, and 11 are executed, the original text 701 “He is studying the object-oriented language.” I am studying. " Then, when the first language / third language translation unit 15 translates the corrected original sentence 712 “he is studying the object-oriented language”, the corrected Japanese / Chinese translation sentence 713 is obtained.
Figure 0006160438
Is translated.

次に、図6、図12及び図13を用いて、図6のステップS610及びステップS611に進む場合の例を説明する。   Next, an example in the case of proceeding to step S610 and step S611 in FIG. 6 will be described using FIG. 6, FIG. 12, and FIG.

図6のステップS601において、図12の原文701「彼はオブジェクトオリエンテッドランゲージを勉強している。」を、第一言語第二言語翻訳部12が翻訳する。翻訳結果は、日中翻訳文702

Figure 0006160438
となる。また、翻訳の過程で実行される形態素解析の結果として、原文形態素1201「/彼/は/オブジェクトオリエンテッドランゲージ/を/勉強/し/て/いる/。/」を取得する。図7に示した原文形態素703「/彼/は/オブジェクトオリエンテッド/ランゲージ/を/勉強/し/て/いる/。/」とは、「オブジェクトオリエンテッドランゲージ」を1つの形態素と判断するか2つの形態素と判断するかの違いである。この違いは、第一言語第三言語翻訳部15の処理能力に起因する。 In step S601 in FIG. 6, the first language / second language translation unit 12 translates the original text 701 in FIG. 12, “He is studying the object-oriented language”. The translation result is a Japanese-Chinese translation 702
Figure 0006160438
It becomes. In addition, as a result of the morphological analysis executed in the translation process, the original morpheme 1201 “/ hi / ha / object-oriented language /// study / do ////” is acquired. The textual morpheme 703 “/ he / ha / object-oriented / language /// study / do / do / is /” shown in FIG. 7 is “object-oriented language” determined as one morpheme? This is the difference between judging two morphemes. This difference is caused by the processing capability of the first language / third language translation unit 15.

ステップS602において、未知語認識部14が、翻訳した日中翻訳文702

Figure 0006160438
と、取得した原文形態素1201「/彼/は/オブジェクトオリエンテッドランゲージ/を/勉強/し/て/いる/。/」に基づいて、第一言語第二言語対訳辞書13に登録されていない第一言語(日)の表現、未知語704「オブジェクトオリエンテッド」を「未知語」として認識する。そして、認識した未知語を、図8に示すような未知語リスト800に作成する。 In step S602, the unknown word recognition unit 14 translates the Japanese-Chinese translation 702.
Figure 0006160438
Based on the acquired original morpheme 1201 “/ he / ha / object-oriented language /// study / do / do / is /./”, it is not registered in the first language / bilingual bilingual dictionary 13. Recognize an unknown word 704 "object oriented" as an "unknown word" in one language (day). Then, the recognized unknown word is created in an unknown word list 800 as shown in FIG.

ステップS603において、ステップS601で第一言語を第二言語に翻訳した文章と同一の第一言語(日)の文章を、第一言語第三言語翻訳部15で翻訳し、形態素解析結果を取得する。すなわち、入力部11によって入力された第一言語(日)の文章、原文701「彼はオブジェクトオリエンテッドランゲージを勉強している。」を、第一言語第三言語翻訳部15が翻訳する。翻訳結果は、日英翻訳文705「He is studying object oriented language.」となる。また、翻訳の過程で実行される形態素解析の結果として、原文形態素1201「/彼/は/オブジェクトオリエンテッドランゲージ/を/勉強/し/て/いる/。/」を取得する。   In step S603, the first language third language translation unit 15 translates a sentence in the same first language (day) as the sentence in which the first language is translated into the second language in step S601, and obtains a morphological analysis result. . In other words, the first language third language translation unit 15 translates the sentence 701 “he is studying object-oriented language”, which is the first language (day) sentence input by the input unit 11. The translation result is a Japanese-English translation 705 “He is studying object oriented language.” In addition, as a result of the morphological analysis executed in the translation process, the original morpheme 1201 “/ hi / ha / object-oriented language /// study / do ////” is acquired.

ステップS604において、ステップS601で第一言語第二言語翻訳部12が実行した形態素解析の結果、原文形態素1201「/彼/は/オブジェクトオリエンテッドランゲージ/を/勉強/し/て/いる/。/」に基づいて、図13に示すような第一言語形態素リスト1300を作成する。   In step S604, as a result of the morphological analysis performed by the first language / second language translation unit 12 in step S601, the original morpheme 1201 “/ he / has / object-oriented language // study / do / do / is /./ The first language morpheme list 1300 as shown in FIG.

そして、未知語リスト800に登録された未知語を順にステップS606以降の処理の対象とするため、ステップS605において、未知語リスト800の終わりか否かを判断する。未知語リスト800には、図8に示すように、1個の未知語704「オブジェクトオリエンテッド」が格納されている。最初のステップS605において、未知語リスト800の1番目の未知語704「オブジェクトオリエンテッド」が処理の対象となっている。未知語リスト800の終わりではないと判断される。よって、ステップS606へ進む(ステップS605:No)。   Then, in order to make the unknown words registered in the unknown word list 800 the target of processing in step S606 and subsequent steps, in step S605, it is determined whether or not the end of the unknown word list 800 is reached. In the unknown word list 800, as shown in FIG. 8, one unknown word 704 "object oriented" is stored. In the first step S605, the first unknown word 704 “object-oriented” in the unknown word list 800 is a processing target. It is determined that it is not the end of the unknown word list 800. Therefore, it progresses to step S606 (step S605: No).

ステップS606において、第一言語形態素リスト1300の終わりか否かを判断する。第一言語形態素リスト1300には、図13に示すように、9個の第一言語形態素1301「彼」、1302「は」、1202「オブジェクトオリエンテッドランゲージ」、1303「を」、1304「勉強」、1305「し」、1306「て」、1307「いる」、1308「。」が格納されている。最初のステップS606において、第一言語形態素リスト1300の1番目の第一言語形態素1301「彼」が処理の対象となっている。第一言語形態素リスト1300の終わりではないと判断される。よって、ステップS607へ進む(ステップS606:No)。   In step S606, it is determined whether the first language morpheme list 1300 is over. In the first language morpheme list 1300, as shown in FIG. 13, nine first language morphemes 1301 "he", 1302 "ha", 1202 "object-oriented language", 1303 "on", and 1304 "study" 1305 “do”, 1306 “te”, 1307 “is”, and 1308 “.” Are stored. In the first step S606, the first first language morpheme 1301 “hi” in the first language morpheme list 1300 is the target of processing. It is determined that it is not the end of the first language morpheme list 1300. Therefore, it progresses to step S607 (step S606: No).

ステップS607において、未知語リスト800の未知語704「オブジェクトオリエンテッド」と、第一言語形態素リスト1300の第一言語形態素1301「彼」が同一か否かを判断する。同一表記ではないので、ステップS608へ進む(ステップS607:No)。   In step S607, it is determined whether the unknown word 704 “object-oriented” in the unknown word list 800 and the first language morpheme 1301 “he” in the first language morpheme list 1300 are the same. Since it is not the same notation, it progresses to step S608 (step S607: No).

ステップS608において、未知語704「オブジェクトオリエンテッド」が第一言語形態素1301「彼」に包含されているか否かを判断する。包含されていないので、第一言語形態素リスト1300中の次の第一言語形態素1302「は」を処理対象としてステップS606に戻る。   In step S608, it is determined whether or not the unknown word 704 “object oriented” is included in the first language morpheme 1301 “he”. Since it is not included, the next first language morpheme 1302 “ha” in the first language morpheme list 1300 is processed, and the process returns to step S606.

第一言語形態素1301「彼」と同様に、第一言語形態素1302「は」についてステップS606以降の処理を実行する。そして、第一言語形態素リスト1300中の3番目の未知語形態素1202「オブジェクトオリエンテッドランゲージ」を処理対象としてステップS606に戻る。   Similar to the first language morpheme 1301 “he”, the process from step S606 onward is executed for the first language morpheme 1302 “ha”. Then, the third unknown word morpheme 1202 “object-oriented language” in the first language morpheme list 1300 is processed, and the process returns to step S606.

同様に、ステップS606からステップ607へ進む。
ステップS607において、未知語リスト800の未知語704「オブジェクトオリエンテッド」と、第一言語形態素リスト1300の未知語形態素1202「オブジェクトオリエンテッドランゲージ」は同一でないので、ステップS608へ進む(ステップS607:No)。
Similarly, the process proceeds from step S606 to step 607.
In step S607, since the unknown word 704 “object-oriented” in the unknown word list 800 and the unknown word morpheme 1202 “object-oriented language” in the first language morpheme list 1300 are not the same, the process proceeds to step S608 (step S607: No). ).

ステップS608において、未知語が形態素に包含されているか否かを判断する。未知語704「オブジェクトオリエンテッド」は、未知語形態素1202「オブジェクトオリエンテッドランゲージ」に包含されている。すなわち、未知語704「オブジェクトオリエンテッド」と未知語形態素1202「オブジェクトオリエンテッドランゲージ」が同一ではなく(ステップS607:No)、未知語704「オブジェクトオリエンテッド」が未知語形態素1202「オブジェクトオリエンテッドランゲージ」に包含されているので(ステップS608:Yes)、ステップS610において、包含部分以外で対応する第三言語(英)を検索する。包含されているのは「オブジェクトオリエンテッド」であるので、包含部分以外は「ランゲージ」であり、対応する第三言語(英)「language」が検索される。   In step S608, it is determined whether the unknown word is included in the morpheme. The unknown word 704 “object-oriented” is included in the unknown word morpheme 1202 “object-oriented language”. That is, unknown word 704 “object-oriented” and unknown word morpheme 1202 “object-oriented language” are not identical (step S607: No), and unknown word 704 “object-oriented” is unknown word morpheme 1202 “object-oriented language”. (Step S608: Yes), in step S610, the corresponding third language (English) other than the included portion is searched. Since “Object Oriented” is included, “Language” is included except for the included portion, and the corresponding third language (English) “language” is searched.

ステップS611において、未知語形態素1202「オブジェクトオリエンテッドランゲージ」に対応する未知語形態素対応英語1203「object oriented language」から、ステップS610で検索した検索部分の第三言語(英)「language」を除去し、残りの未知語対応英語1204「object oriented」を未知語704「オブジェクトオリエンテッド」に対応する第三言語表記とする。この未知語対応英語1204「object oriented」は、第三言語表記リストに格納される。この時点で、第三言語表記リストには、1つの未知語対応英語1204「object oriented」が格納される。   In step S611, the third language (English) “language” of the search part searched in step S610 is removed from the unknown word morpheme-corresponding English 1203 “object oriented language” corresponding to the unknown word morpheme 1202 “object-oriented language”. The remaining unknown word corresponding English 1204 “object oriented” is set as a third language notation corresponding to the unknown word 704 “object oriented”. This unknown word corresponding English 1204 “object oriented” is stored in the third language notation list. At this time, one unknown word corresponding English 1204 “object oriented” is stored in the third language notation list.

そして、ステップS606に戻り、第一言語形態素1303「を」、1304「勉強」、1305「し」、1306「て」、1307「いる」、1308「。」について、同様にステップS606以降の処理を実行する。第一言語形態素1308「。」について、同様の処理を実行した後、ステップS606に戻ると、第一言語形態素リスト1300の終わりであると判断される。よって、ステップS605へ戻る(ステップS606:Yes)。   Then, the process returns to step S606, and the processes in and after step S606 are similarly performed for the first language morpheme 1303 “to”, 1304 “study”, 1305 “do”, 1306 “te”, 1307 “is”, and 1308 “.”. Run. After the same processing is executed for the first language morpheme 1308 “.”, When the process returns to step S606, it is determined that the first language morpheme list 1300 is over. Therefore, the process returns to step S605 (step S606: Yes).

そして、ステップS605では、未知語リスト800に登録されているレコードは、未知語704「オブジェクトオリエンテッド」のみであるので、未知語リスト800の終わりであると判断される(ステップS605:Yes)。よって、未知語第三言語切り出し処理は終了する。   In step S605, since the record registered in the unknown word list 800 is only the unknown word 704 “object oriented”, it is determined that the record is the end of the unknown word list 800 (step S605: Yes). Therefore, the unknown word third language extraction process ends.

機械翻訳にとって未知語の存在は翻訳品質を著しく低下させる主要因である。特に、辞書登録語数の少ないマイナー言語間の翻訳システムでの未知語の問題は深刻である。上記機械翻訳処理により、未知語の発生頻度を低減することが可能となり、機械翻訳品質が大きく向上する。   The presence of unknown words for machine translation is a major factor that significantly degrades translation quality. In particular, the problem of unknown words in a translation system between minor languages with a small number of dictionary registration words is serious. The machine translation process makes it possible to reduce the occurrence frequency of unknown words, greatly improving machine translation quality.

次に、図14を用いて、第2の実施の形態を説明する。
図14は、第2の実施の形態の機械翻訳装置2の構成を示す図である。
Next, a second embodiment will be described with reference to FIG.
FIG. 14 is a diagram illustrating a configuration of the machine translation apparatus 2 according to the second embodiment.

図14において、機械翻訳装置2は、第1の実施の形態における機械翻訳装置1が備える入力部11、第一言語第二言語翻訳部12、第一言語第二言語対訳辞書13、未知語認識部14、第一言語第三言語翻訳部15、第一言語第三言語対訳辞書16、第三言語形態素解析部17、未知語第三言語切り出し部18、第三言語第一言語辞書引き部19、代替表記生成部20、入力文修正部21、及び出力部22に加え、候補ランキング部141を備える。   In FIG. 14, the machine translation device 2 includes an input unit 11, a first language / second language translation unit 12, a first language / second language parallel translation dictionary 13, and an unknown word recognition that are included in the machine translation device 1 according to the first embodiment. Unit 14, first language third language translation unit 15, first language third language parallel translation dictionary 16, third language morpheme analysis unit 17, unknown language third language segmentation unit 18, third language first language dictionary lookup unit 19 In addition to the alternative notation generation unit 20, the input sentence correction unit 21, and the output unit 22, a candidate ranking unit 141 is provided.

候補ランキング部141は、代替表記生成部20が生成した未知語の代替表記を、所定の優先度にしたがってランク付けする。例えば、使用頻度の高い代替表記の優先度を高くし、使用頻度の低い代替表記の優先度を低くする。また、インターネットなどの外部ネットワークを介して接続されるワールドワイドウェブ(World Wide Web)等の大規模コーパスを代替表記で検索し、そのヒット件数でランク付けを行ってもよい。   The candidate ranking unit 141 ranks alternative representations of unknown words generated by the alternative representation generation unit 20 according to a predetermined priority. For example, the priority of the alternative notation with high use frequency is increased, and the priority of the alternative notation with low use frequency is decreased. Alternatively, a large-scale corpus such as the World Wide Web connected via an external network such as the Internet may be searched using alternative notation, and ranked by the number of hits.

そして、入力文修正部21は、入力部11で入力された第一言語(日)の文章のうち、未知語認識部14によって認識した未知語を、候補ランキング部141によってランク付けされた代替表記のうち優先度の高い代替表記に置き換えることにより、入力された第一言語(日)の文章を修正する。   Then, the input sentence correction unit 21 substitutes the unknown words recognized by the unknown word recognition unit 14 among the sentences of the first language (day) input by the input unit 11 by the candidate ranking unit 141. The sentence of the input first language (day) is corrected by replacing it with an alternative notation having a high priority.

これにより、代替表記生成部20が生成した代替表記の候補が、滅多に読み書きしない表現になる場合であっても、珍しい表現よりも日常的に多用される表現が優先され、翻訳結果も一般語に近くなることで翻訳品質が高まる。   As a result, even if the alternative notation candidate generated by the alternative notation generation unit 20 is an expression that is rarely read and written, an expression that is frequently used daily is given priority over an unusual expression, and the translation result is also a general term. Translation quality increases by being close to.

次に、図15を用いて、第3の実施の形態を説明する。
図15は、第3の実施の形態の機械翻訳装置3の構成を示す図である。
Next, a third embodiment will be described with reference to FIG.
FIG. 15 is a diagram illustrating a configuration of the machine translation apparatus 3 according to the third embodiment.

図15において、機械翻訳装置3は、入力部11、第一言語第二言語翻訳部12、第一言語第二言語対訳辞書13、未知語認識部14、複数の第一言語第三言語翻訳部15A乃至15C、複数の第一言語第三言語対訳辞書16A乃至16C、複数の第三言語形態素解析部17A乃至17C、未知語第三言語切り出し部18、複数の第三言語第一言語辞書引き部19A乃至19C、代替表記生成部20、入力文修正部21、及び出力部22備える。   In FIG. 15, the machine translation device 3 includes an input unit 11, a first language second language translation unit 12, a first language second language parallel translation dictionary 13, an unknown word recognition unit 14, and a plurality of first language third language translation units. 15A to 15C, a plurality of first language third language parallel translation dictionaries 16A to 16C, a plurality of third language morpheme analyzers 17A to 17C, an unknown word third language segmentation unit 18, and a plurality of third language first language dictionary lookup units 19A to 19C, an alternative notation generation unit 20, an input sentence correction unit 21, and an output unit 22.

入力部11、第一言語第二言語翻訳部12、第一言語第二言語対訳辞書13、未知語認識部14、未知語第三言語切り出し部18、代替表記生成部20、入力文修正部21、及び出力部22は、第1の実施の形態における機械翻訳装置1が備える入力部11等と同様である。   Input unit 11, first language second language translation unit 12, first language second language parallel translation dictionary 13, unknown word recognition unit 14, unknown word third language segmentation unit 18, alternative notation generation unit 20, input sentence correction unit 21 The output unit 22 is the same as the input unit 11 and the like included in the machine translation apparatus 1 according to the first embodiment.

複数の第一言語第三言語翻訳部15A乃至15Cは、入力部11で入力された第一言語(日)の文章を、形態素解析し、第一言語第三言語対訳辞書16A乃至16Cの何れかを参照して、第一言語(日)及び第二言語(中)とは異なる第三言語(英)の文章に翻訳するが、形態素解析の手法又は翻訳の手法がそれぞれ異なる。   The plurality of first language / third language translation units 15A to 15C perform morphological analysis on the sentence of the first language (day) input by the input unit 11, and select one of the first language / third language parallel translation dictionaries 16A to 16C. Referring to FIG. 4, translation is made into a sentence in a third language (English) different from the first language (Japanese) and the second language (middle), but the morphological analysis method or the translation method is different.

複数の第一言語第三言語対訳辞書16A乃至16Cは、第一言語(日)の少なくとも1つの表現に対して、少なくとも1つの第三言語(英)の表現が対応付けて登録されているが、コンテンツがそれぞれ異なる。   In the plurality of first language third language parallel translation dictionaries 16A to 16C, at least one expression of the third language (English) is registered in association with at least one expression of the first language (Japanese). , Content is different.

複数の第三言語形態素解析部17A乃至17Cは、第三言語(英)の文章を複数の形態素に分割するが、形態素解析の手法がそれぞれ異なる。   The plurality of third language morpheme analyzers 17A to 17C divide the third language (English) sentence into a plurality of morphemes, but the morpheme analysis methods are different.

複数の第三言語第一言語辞書引き部19A乃至19Cは、第一言語第三言語対訳辞書16A乃至16Cの何れかを参照して、第三言語(英)の単語に対応する第一言語(日)の単語を検索するが、翻訳の手法がそれぞれ異なる。   The plurality of third language first language dictionary lookup units 19A to 19C refer to any one of the first language third language parallel translation dictionaries 16A to 16C, and correspond to the first language (English) corresponding to the word of the third language (English) ( Japanese), but the translation method is different.

これにより、未知語の発生頻度を更に低減することが可能となり、機械翻訳品質が更に大きく向上する。   As a result, the occurrence frequency of unknown words can be further reduced, and the quality of machine translation is greatly improved.

次に、図16を用いて、第4の実施の形態を説明する。
図16は、第4の実施の形態の構成を示す図である。
Next, a fourth embodiment will be described with reference to FIG.
FIG. 16 is a diagram illustrating the configuration of the fourth embodiment.

図16において、機械翻訳装置1は、インターネット等の通信ネットワーク1600を介して端末装置1601A及び端末装置1601Bと接続されている。   In FIG. 16, the machine translation device 1 is connected to a terminal device 1601A and a terminal device 1601B via a communication network 1600 such as the Internet.

このように構成されることにより、翻訳対象の第一言語の文章は、通信ネットワーク1600を介した端末装置1601A又は端末装置1601Bから、機械翻訳装置1が備える入力部11に入力される。そして、機械翻訳装置1が備える第一言語第二言語翻訳部12によって翻訳された第二言語の文章は、通信ネットワーク1600を介して端末装置1601A又は端末装置1601Bに出力される。   With this configuration, the sentence in the first language to be translated is input from the terminal device 1601A or the terminal device 1601B via the communication network 1600 to the input unit 11 included in the machine translation device 1. Then, the text in the second language translated by the first language / second language translation unit 12 included in the machine translation device 1 is output to the terminal device 1601A or the terminal device 1601B via the communication network 1600.

これにより、インターネット等の通信ネットワーク1600を介して、誰でも機械翻訳装置1を使用することができる。   Thereby, anyone can use the machine translation apparatus 1 via the communication network 1600 such as the Internet.

なお、機械翻訳装置1の代わりに、機械翻訳装置2又は機械翻訳装置3が、インターネット等の通信ネットワーク1600を介して端末装置1601A及び端末装置1601Bと接続されている構成でもよい。   Instead of the machine translation device 1, the machine translation device 2 or the machine translation device 3 may be connected to the terminal device 1601A and the terminal device 1601B via a communication network 1600 such as the Internet.

次に、図17を用いて、第5の実施の形態を説明する。
図17は、第5の実施の形態の構成を示す図である。
Next, a fifth embodiment will be described with reference to FIG.
FIG. 17 is a diagram illustrating the configuration of the fifth embodiment.

図17において、機械翻訳装置1が備える第一言語第二言語翻訳部12、第一言語第二言語対訳辞書13、第一言語第三言語翻訳部15、第一言語第三言語対訳辞書16、第三言語形態素解析部17、又は第三言語第一言語辞書引き部19は、インターネット等の通信ネットワーク1600を介して外部から組み込まれる。   In FIG. 17, the first language / second language translation unit 12, the first language / second language parallel translation dictionary 13, the first language / third language translation unit 15, the first language / third language parallel translation dictionary 16, and the machine translation device 1 are provided. The third language morpheme analysis unit 17 or the third language first language dictionary lookup unit 19 is incorporated from the outside via a communication network 1600 such as the Internet.

次に、図18を用いて、第6の実施の形態を説明する。
図18は、第6の実施の形態の機械翻訳装置4の構成を示す図である。
Next, a sixth embodiment will be described with reference to FIG.
FIG. 18 is a diagram illustrating a configuration of the machine translation apparatus 4 according to the sixth embodiment.

図18において、機械翻訳装置4は、内部で備える第一言語第二言語翻訳部12、第一言語第二言語対訳辞書13、第一言語第三言語翻訳部15、第一言語第三言語対訳辞書16、第三言語形態素解析部17、又は第三言語第一言語辞書引き部19の代わりに、インターネット等の通信ネットワーク1600で接続された外部に設置されているものを使用する。   18, the machine translation device 4 includes a first language / second language translation unit 12, a first language / second language parallel translation dictionary 13, a first language / third language translation unit 15, and a first language / third language parallel translation. Instead of the dictionary 16, the third language morpheme analysis unit 17, or the third language first language dictionary lookup unit 19, an external one connected by a communication network 1600 such as the Internet is used.

以上、本発明の実施の形態を説明してきたが、上述の機械翻訳装置1、2、3、4は、通常の情報処理装置(コンピュータ)を使用して実現することができる。すなわち、機械翻訳装置1、2、3、4は、CPU、RAMやROM等のメモリ、入力装置、出力装置、外部記録装置、媒体駆動装置、及びネットワーク接続装置を備える。また、これらはバスにより互いに接続されている。   Although the embodiments of the present invention have been described above, the above-described machine translation apparatuses 1, 2, 3, and 4 can be realized using a normal information processing apparatus (computer). That is, the machine translation devices 1, 2, 3, and 4 include a CPU, a memory such as a RAM and a ROM, an input device, an output device, an external recording device, a medium driving device, and a network connection device. These are connected to each other by a bus.

メモリは、機械翻訳装置1、2、3、4に用いられるプログラム及びデータを格納する。CPUは、メモリを利用してプログラムを実行することにより、上述の機械翻訳処理を実行する。   The memory stores programs and data used for the machine translation apparatuses 1, 2, 3, and 4. The CPU executes the above-described machine translation process by executing the program using the memory.

入力装置は、例えば、キーボード、ポインティングデバイス等であり、ユーザからの指示や情報の入力に用いられる。出力装置は、例えば、表示装置、プリンタ、スピーカ等であり、ユーザへの問い合わせや処理結果の出力に用いられる。   The input device is, for example, a keyboard, a pointing device, or the like, and is used for inputting instructions and information from the user. The output device is, for example, a display device, a printer, a speaker, or the like, and is used for outputting an inquiry to a user and a processing result.

外部記録装置は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。この外部記録装置には、ハードディスクドライブも含まれる。機械翻訳装置1、2、3、4は、この外部記録装置にプログラム及びデータを格納しておき、それらをメモリにロードして使用することができる。   The external recording device is, for example, a magnetic disk device, an optical disk device, a magneto-optical disk device, a tape device, or the like. The external recording device also includes a hard disk drive. The machine translation apparatuses 1, 2, 3, and 4 can store programs and data in the external recording apparatus and use them by loading them into a memory.

媒体駆動装置は、可搬型記録媒体を駆動し、その記録内容にアクセスする。可搬型記録媒体は、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等である。この可搬型記録媒体には、CD−ROM(Compact Disk Read Only Memory)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリ等も含まれる。ユーザは、この可搬型記録媒体にプログラム及びデータを格納しておき、それらをメモリにロードして使用することができる。   The medium driving device drives a portable recording medium and accesses the recorded contents. The portable recording medium is a memory device, a flexible disk, an optical disk, a magneto-optical disk, or the like. The portable recording medium includes a CD-ROM (Compact Disk Read Only Memory), a DVD (Digital Versatile Disk), a USB (Universal Serial Bus) memory, and the like. The user can store the program and data in this portable recording medium and load them into the memory for use.

このように、機械翻訳処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体には、メモリ、外部記録装置、及び可搬型記録媒体のような、物理的な(非一時的な)記録媒体が含まれる。   As described above, the computer-readable recording medium for storing the program and data used in the machine translation process includes physical (non-temporary) recording such as a memory, an external recording device, and a portable recording medium. Media included.

ネットワーク接続装置は、LAN(Local Area Network)等の有線または無線の通信ネットワークに接続され、通信に伴うデータ変換を行う通信インタフェースである。機械翻訳装置1、2、3、4は、プログラム及びデータを外部の装置からネットワーク接続装置を介して受け取り、それらをメモリにロードして使用することができる。   The network connection device is a communication interface that is connected to a wired or wireless communication network such as a LAN (Local Area Network) and performs data conversion accompanying communication. The machine translation devices 1, 2, 3, 4 can receive programs and data from an external device via a network connection device, and use them by loading them into a memory.

例えば、外部記録装置に格納したプログラムやデータは、機械翻訳装置1、2、3、4のメモリにロードされる。また、ネットワーク接続装置を介して接続可能な外部装置は、プログラムやデータを搬送する搬送信号を生成し、通信ネットワーク上の任意の伝送媒体を介して機械翻訳装置1、2、3、4に送信する。   For example, programs and data stored in the external recording device are loaded into the memories of the machine translation devices 1, 2, 3, and 4. In addition, an external device that can be connected via a network connection device generates a carrier signal for carrying a program or data, and transmits it to a machine translation device 1, 2, 3, 4 via any transmission medium on the communication network. To do.

開示した実施の形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができる。   Although the disclosed embodiments and their advantages have been described in detail, those skilled in the art can make various modifications, additions and omissions without departing from the scope of the present invention as explicitly set forth in the claims.

1、2、3、4 機械翻訳装置
11 入力部
12 第一言語第二言語翻訳部
13 第一言語第二言語対訳辞書
14 未知語認識部
15、15A、15B、15C 第一言語第三言語翻訳部
16、16A、16B、16C 第一言語第三言語対訳辞書
17、17A、17B、17C 第三言語形態素解析部
18 未知語第三言語切り出し部
19、19A、19B、19C 第三言語第一言語辞書引き部
20 代替表記生成部
21 入力文修正部
22 出力部
141 候補ランキング部
701 原文
702 日中翻訳文
703、1201 原文形態素
704 未知語
705 日英翻訳文
706、1202 未知語形態素
707、1204 未知語対応英語
708 未知語対応英語形態素
709、710 英語形態素対応日本語
711 代替表記
712 修正後原文
713 修正後日中翻訳文
800 未知語リスト
900、1300 第一言語形態素リスト
901、902、903、904、905、906、907、908、909、1301、1302、1303、1304、1305、1306、1307、1308 第一言語形態素
1203 未知語形態素対応英語
1600 通信ネットワーク
1601A、1601B 端末装置
1, 2, 3, 4 Machine translation device 11 Input unit 12 First language second language translation unit 13 First language second language parallel translation dictionary 14 Unknown word recognition unit 15, 15A, 15B, 15C First language third language translation Part 16, 16A, 16B, 16C First language third language parallel translation dictionary 17, 17A, 17B, 17C Third language morphological analysis part 18 Unknown word third language extraction part 19, 19A, 19B, 19C Third language first language Dictionary lookup unit 20 Alternative notation generation unit 21 Input sentence correction unit 22 Output unit 141 Candidate ranking part 701 Original sentence 702 Japanese-Chinese translation 703, 1201 Original sentence morpheme 704 Unknown word 705 Japanese-English translation sentence 706, 1202 Unknown word morpheme 707, 1204 Unknown English corresponding to word 708 English morpheme corresponding to unknown word 709, 710 Japanese corresponding to English morpheme 711 Alternative notation 712 Modified original text 13 Modified Japanese-Chinese translation 800 Unknown word list 900, 1300 First language morpheme list 901, 902, 903, 904, 905, 906, 907, 908, 909, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308 1st language morpheme 1203 English for unknown word morpheme 1600 Communication network 1601A, 1601B Terminal device

Claims (8)

翻訳対象の第一言語の文章を入力する入力手段と、
前記第一言語の少なくとも1つの表現に対して少なくとも1つの第二言語の表現が対応付けて登録されている第一言語第二言語対訳辞書と、
前記入力手段で入力された前記第一言語の文章を形態素解析し、前記第一言語第二言語対訳辞書を参照して、前記第一言語とは異なる翻訳目的の第二言語の文章に翻訳する第一言語第二言語翻訳手段と、
前記第一言語第二言語翻訳手段による翻訳結果と形態素解析結果に基づいて、前記第一言語第二言語対訳辞書に前記第二言語の表現が登録されていない未知語を認識する未知語認識手段と、
前記第一言語の少なくとも1つの表現に対して前記第一言語及び前記第二言語とは異なる少なくとも1つの第三言語の表現が対応付けて登録されている第一言語第三言語対訳辞書と、
前記入力手段で入力された前記第一言語の文章を形態素解析し、前記第一言語第三言語対訳辞書を参照して、前記第三言語の文章に翻訳する第一言語第三言語翻訳手段と、
前記第一言語第三言語翻訳手段によって翻訳された前記第三言語の文章のうち、前記未知語認識手段によって認識された未知語に対応する第三言語を切り出す未知語第三言語切り出し手段と、
前記未知語第三言語切り出し手段によって切り出された前記第三言語を複数の形態素に分割する第三言語形態素解析手段と、
前記第一言語第三言語対訳辞書を参照して、前記分割された形態素に対応する前記第一言語の単語を検索する第三言語第一言語辞書引き手段と、
前記第三言語第一言語辞書引き手段を用いて、前記分割された複数の形態素に対応する前記第一言語の複数の単語を組み合わせることにより、前記未知語認識手段によって認識した前記未知語の代替表記を生成する代替表記生成手段と、
前記入力手段で入力された前記第一言語の文章のうち、前記未知語認識手段によって認識した未知語を、前記代替表記生成手段によって生成した前記代替表記に置き換えることにより、前記入力された前記第一言語の文章を修正する入力文修正手段と、
を備え、
前記第一言語第二言語翻訳手段は、前記入力文修正手段によって修正された第一言語の文章を第二言語の文章に翻訳することを特徴とする機械翻訳装置。
An input means for inputting a sentence in the first language to be translated;
A first-language second-language bilingual dictionary in which at least one second-language expression is registered in association with at least one expression of the first language;
Morphological analysis is performed on the sentence in the first language input by the input means, and the sentence is translated into a sentence in a second language for translation purposes different from the first language by referring to the first language / second language parallel translation dictionary. A first language second language translation means;
An unknown word recognizing means for recognizing an unknown word in which the representation of the second language is not registered in the first language bilingual bilingual dictionary based on the translation result and the morphological analysis result by the first language second language translating means When,
A first language third language bilingual dictionary in which at least one third language expression different from the first language and the second language is registered in association with at least one expression of the first language;
A first language and third language translation means for performing morphological analysis on the sentence of the first language input by the input means, and referring to the first language and third language parallel translation dictionary to translate the sentence into the third language; ,
Of the sentence in the third language translated by the first language and third language translation means, an unknown word third language cutting means for cutting out a third language corresponding to the unknown word recognized by the unknown word recognition means;
Third language morpheme analyzing means for dividing the third language extracted by the unknown word third language extracting means into a plurality of morphemes;
A third language first language dictionary lookup means for searching for words in the first language corresponding to the divided morphemes with reference to the first language third language parallel translation dictionary;
Substitution of the unknown word recognized by the unknown word recognition means by combining a plurality of words of the first language corresponding to the plurality of divided morphemes using the third language first language dictionary lookup means An alternative notation generation means for generating a notation;
Of the sentences in the first language input by the input unit, the unknown word recognized by the unknown word recognition unit is replaced with the alternative notation generated by the alternative notation generation unit, whereby the input first An input sentence correcting means for correcting sentences in one language;
With
The machine translation apparatus characterized in that the first language / second language translation means translates the text in the first language corrected by the input sentence correction means into a text in the second language.
前記代替表記生成手段が生成した前記未知語の代替表記を、所定の優先度にしたがってランク付けする候補ランキング手段、を備え、
前記入力文修正手段は、前記入力手段によって入力された前記第一言語の文章のうち、前記未知語認識手段によって認識した前記未知語を、前記候補ランキング手段によってランク付けされた代替表記のうち優先度の高い代替表記に置き換えることにより、前記入力手段によって入力された第一言語の文章を修正することを特徴とする請求項1に記載の機械翻訳装置。
Candidate ranking means for ranking the alternative notation of the unknown word generated by the alternative notation generating means according to a predetermined priority,
The input sentence correction means has priority among the alternative notations ranked by the candidate ranking means for the unknown words recognized by the unknown word recognition means among the sentences in the first language input by the input means. The machine translation apparatus according to claim 1, wherein the sentence in the first language input by the input unit is corrected by replacing it with an alternative notation having a high degree.
前記第一言語第三言語対訳辞書は、複数の辞書で構成されていることを特徴とする請求項1又は2に記載の機械翻訳装置。   The machine translation apparatus according to claim 1 or 2, wherein the first language / third language parallel translation dictionary includes a plurality of dictionaries. 通信ネットワークを介した端末装置から、前記第一言語の文章を前記入力手段に入力し、
前記第一言語第二言語翻訳手段によって翻訳された前記第二言語の文章を、前記通信ネットワークを介して前記端末装置に出力する、
ことを特徴とする請求項1乃至3の何れか1項に記載の機械翻訳装置。
From the terminal device via the communication network, input the sentence in the first language into the input means,
Outputting the sentence in the second language translated by the first language / second language translation means to the terminal device via the communication network;
The machine translation apparatus according to claim 1, wherein the machine translation apparatus is a machine translation apparatus.
前記第一言語第二言語翻訳手段、前記第一言語第二言語対訳辞書、前記第一言語第三言語翻訳手段、前記第一言語第三言語対訳辞書、前記第三言語形態素解析手段、又は前記第三言語第一言語辞書引き手段は、通信ネットワークを介して外部から組み込まれることを特徴とする請求項1乃至4の何れか1項に記載の機械翻訳装置。   The first language second language translation means, the first language second language parallel translation dictionary, the first language third language translation means, the first language third language parallel translation dictionary, the third language morpheme analysis means, or the The machine translation apparatus according to any one of claims 1 to 4, wherein the third language first language dictionary lookup unit is incorporated from outside via a communication network. 前記第一言語第二言語翻訳手段、前記第一言語第二言語対訳辞書、前記第一言語第三言語翻訳手段、前記第一言語第三言語対訳辞書、前記第三言語形態素解析手段、又は前記第三言語第一言語辞書引き手段は、通信ネットワークで接続された外部に設置されていることを特徴とする請求項1乃至4の何れか1項に記載の機械翻訳装置。   The first language second language translation means, the first language second language parallel translation dictionary, the first language third language translation means, the first language third language parallel translation dictionary, the third language morpheme analysis means, or the The machine translation device according to any one of claims 1 to 4, wherein the third language first language dictionary lookup unit is installed outside connected by a communication network. 機械翻訳装置のコンピュータに、
翻訳対象の第一言語の文章を入力させ、
前記入力された前記第一言語の文章を形態素解析し、前記第一言語の少なくとも1つの表現に対して少なくとも1つの第二言語の表現が対応付けて登録されている第一言語第二言語対訳辞書を参照して、前記第一言語とは異なる翻訳目的の第二言語の文章に翻訳させ、
前記第一言語から前記第二言語翻訳への翻訳結果と形態素解析結果に基づいて、前記第一言語第二言語対訳辞書に前記第二言語の表現が登録されていない未知語を認識させ、
前記入力された前記第一言語の文章を形態素解析し、前記第一言語の少なくとも1つの表現に対して前記第一言語及び前記第二言語とは異なる少なくとも1つの第三言語の表現が対応付けて登録されている第一言語第三言語対訳辞書を参照して、前記第三言語の文章に翻訳させ、
前記第一言語から前記第三言語への翻訳によって翻訳された前記第三言語の文章のうち、前記認識された未知語に対応する第三言語を切り出させ、
前記切り出された前記第三言語を複数の形態素に分割させ、
前記第一言語第三言語対訳辞書を参照して、前記分割された形態素に対応する前記第一言語の単語を検索させ、
前記分割された複数の形態素に対応する前記第一言語の複数の単語を組み合わせることにより、前記認識した前記未知語の代替表記を生成させ、
前記入力された前記第一言語の文章のうち、前記認識した未知語を前記生成した前記代替表記に置き換えることにより、前記入力された前記第一言語の文章を修正させ、
前記修正された第一言語の文章を第二言語の文章に翻訳させる、
ことを特徴とする機械翻訳プログラム。
In the machine translation device computer,
Input the first language sentence to be translated,
A morphological analysis is performed on the input sentence in the first language, and at least one second language expression is registered in association with at least one expression in the first language. Refer to the dictionary and translate it into a second language sentence for translation purposes different from the first language,
Based on the translation result and the morphological analysis result from the first language to the second language translation, the unknown language in which the second language expression is not registered in the first language second language parallel translation dictionary is recognized,
Morphological analysis is performed on the inputted sentence in the first language, and at least one third language expression different from the first language and the second language is associated with at least one expression in the first language. Refer to the registered first language third language parallel translation dictionary, and translate it into the third language sentence,
Of the sentences in the third language translated by translation from the first language to the third language, the third language corresponding to the recognized unknown word is cut out,
Dividing the extracted third language into a plurality of morphemes;
With reference to the first language third language parallel dictionary, the words of the first language corresponding to the divided morphemes are searched,
By combining a plurality of words in the first language corresponding to the plurality of divided morphemes, generating an alternative notation of the recognized unknown word,
Of the inputted sentence in the first language, by replacing the recognized unknown word with the generated alternative notation, to correct the inputted sentence in the first language,
Translating the modified first language sentence into a second language sentence;
A machine translation program characterized by that.
機械翻訳方法において、
機械翻訳装置が、
翻訳対象の第一言語の文章を入力し、
前記入力された前記第一言語の文章を形態素解析し、前記第一言語の少なくとも1つの表現に対して少なくとも1つの第二言語の表現が対応付けて登録されている第一言語第二言語対訳辞書を参照して、前記第一言語とは異なる翻訳目的の第二言語の文章に翻訳し、
前記第一言語から前記第二言語翻訳への翻訳結果と形態素解析結果に基づいて、前記第一言語第二言語対訳辞書に前記第二言語の表現が登録されていない未知語を認識し、
前記入力された前記第一言語の文章を形態素解析し、前記第一言語の少なくとも1つの表現に対して前記第一言語及び前記第二言語とは異なる少なくとも1つの第三言語の表現が対応付けて登録されている第一言語第三言語対訳辞書を参照して、前記第三言語の文章に翻訳し、
前記第一言語から前記第三言語への翻訳によって翻訳された前記第三言語の文章のうち、前記認識された未知語に対応する第三言語を切り出し、
前記切り出された前記第三言語を複数の形態素に分割し、
前記第一言語第三言語対訳辞書を参照して、前記分割された形態素に対応する前記第一言語の単語を検索し、
前記分割された複数の形態素に対応する前記第一言語の複数の単語を組み合わせることにより、前記認識した前記未知語の代替表記を生成し、
前記入力された前記第一言語の文章のうち、前記認識した未知語を前記生成した前記代替表記に置き換えることにより、前記入力された前記第一言語の文章を修正し、
前記修正された第一言語の文章を第二言語の文章に翻訳する、
ことを特徴とする機械翻訳方法。
In the machine translation method,
Machine translation device
Enter the first language text to be translated,
A morphological analysis is performed on the input sentence in the first language, and at least one second language expression is registered in association with at least one expression in the first language. Refer to the dictionary and translate it into a second language sentence for translation purposes different from the first language,
Based on the translation result from the first language to the second language translation and the morphological analysis result, an unknown word in which the expression of the second language is not registered in the first language bilingual bilingual dictionary is recognized.
Morphological analysis is performed on the inputted sentence in the first language, and at least one third language expression different from the first language and the second language is associated with at least one expression in the first language. Referring to the first language third language parallel translation dictionary registered in the
Of the third language sentence translated by translation from the first language to the third language, cut out a third language corresponding to the recognized unknown word,
Dividing the extracted third language into a plurality of morphemes;
Referencing the first language third language parallel dictionary and searching for words in the first language corresponding to the divided morphemes,
Generating an alternative notation of the recognized unknown word by combining a plurality of words of the first language corresponding to the plurality of divided morphemes;
Of the inputted sentence in the first language, by replacing the recognized unknown word with the generated alternative notation, to correct the inputted sentence in the first language,
Translating the modified first language sentence into a second language sentence;
A machine translation method characterized by the above.
JP2013219656A 2013-10-22 2013-10-22 Machine translation apparatus, machine translation program, and machine translation method Active JP6160438B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013219656A JP6160438B2 (en) 2013-10-22 2013-10-22 Machine translation apparatus, machine translation program, and machine translation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013219656A JP6160438B2 (en) 2013-10-22 2013-10-22 Machine translation apparatus, machine translation program, and machine translation method

Publications (2)

Publication Number Publication Date
JP2015082204A JP2015082204A (en) 2015-04-27
JP6160438B2 true JP6160438B2 (en) 2017-07-12

Family

ID=53012774

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013219656A Active JP6160438B2 (en) 2013-10-22 2013-10-22 Machine translation apparatus, machine translation program, and machine translation method

Country Status (1)

Country Link
JP (1) JP6160438B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10846487B2 (en) 2018-01-26 2020-11-24 Samsung Electronics Co., Ltd. Machine translation method and apparatus

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5981616B1 (en) * 2015-07-28 2016-08-31 株式会社富士通ビー・エス・シー Cooking content providing method, information processing apparatus and cooking content providing program
CN105069000A (en) * 2015-08-24 2015-11-18 中译语通科技(北京)有限公司 Interactive prediction input method
WO2020255553A1 (en) * 2019-06-17 2020-12-24 株式会社Nttドコモ Generation device and normalization model

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018350A (en) * 2003-06-25 2005-01-20 Toshiba Corp Translation processing system, translation processing method and program
JP4886244B2 (en) * 2005-08-19 2012-02-29 株式会社東芝 Machine translation apparatus and machine translation program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10846487B2 (en) 2018-01-26 2020-11-24 Samsung Electronics Co., Ltd. Machine translation method and apparatus

Also Published As

Publication number Publication date
JP2015082204A (en) 2015-04-27

Similar Documents

Publication Publication Date Title
JP5235344B2 (en) Apparatus, method and program for machine translation
WO2005059771A1 (en) Translation judgment device, method, and program
JP2007241764A (en) Syntax analysis program, syntax analysis method, syntax analysis device, and computer readable recording medium recorded with syntax analysis program
JP5007977B2 (en) Machine translation apparatus, machine translation method, and program
JP6160438B2 (en) Machine translation apparatus, machine translation program, and machine translation method
CN100454294C (en) Apparatus and method for translating Japanese into Chinese and computer program product
JP2018055670A (en) Similar sentence generation method, similar sentence generation program, similar sentence generation apparatus, and similar sentence generation system
JP2006338261A (en) Translation device, translation method and translation program
JP2009205357A (en) Device, method and program for determining parts-of-speech in chinese,
Jamro Sindhi language processing: A survey
JP2017151553A (en) Machine translation device, machine translation method, and program
JP2009157888A (en) Transliteration model generation device, transliteration apparatus, and computer program therefor
JP2010086143A (en) Machine translation system and machine translation program
JP4845921B2 (en) Machine translation apparatus, machine translation program, and machine translation method
JP5302784B2 (en) Machine translation method and system
JP4643183B2 (en) Translation apparatus and translation program
WO2009144890A1 (en) Pre-translation rephrasing rule generating system
JP2016189154A (en) Translation method, device, and program
JP2006024114A (en) Mechanical translation device and mechanical translation computer program
JP2007004446A (en) Machine translation apparatus, its method, and program
JP5909123B2 (en) Machine translation apparatus, machine translation method and program
JP5039114B2 (en) Machine translation apparatus and program
JP3982726B2 (en) Translation knowledge learning device and machine translation device
JP4881399B2 (en) Bilingual information creation device, machine translation device, and program
US20130080144A1 (en) Machine translation apparatus, a method and a non-transitory computer readable medium thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160705

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170529

R150 Certificate of patent or registration of utility model

Ref document number: 6160438

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150