JP4488010B2 - Machine translation device, translation method thereof, and storage medium recording the machine translation program - Google Patents

Machine translation device, translation method thereof, and storage medium recording the machine translation program Download PDF

Info

Publication number
JP4488010B2
JP4488010B2 JP2007035937A JP2007035937A JP4488010B2 JP 4488010 B2 JP4488010 B2 JP 4488010B2 JP 2007035937 A JP2007035937 A JP 2007035937A JP 2007035937 A JP2007035937 A JP 2007035937A JP 4488010 B2 JP4488010 B2 JP 4488010B2
Authority
JP
Japan
Prior art keywords
sentence
language
function word
target language
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007035937A
Other languages
Japanese (ja)
Other versions
JP2007157175A (en
Inventor
真一 安藤
潔 山端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007035937A priority Critical patent/JP4488010B2/en
Publication of JP2007157175A publication Critical patent/JP2007157175A/en
Application granted granted Critical
Publication of JP4488010B2 publication Critical patent/JP4488010B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、文章を自動的に翻訳する機械翻訳に関し、特に用例を用いて翻訳する機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体に関する。   The present invention relates to machine translation that automatically translates sentences, and more particularly, to a machine translation apparatus that translates using an example, a translation method thereof, and a storage medium that records the machine translation program.

一般に機械翻訳装置による自然言語の翻訳処理は、まず入力された原言語の文章の解析処理を行い、次にこの解析結果を翻訳先の言語である目的言語への変換処理を行い、最後に目的言語の文章を正しく生成する生成処理を行うことで翻訳実行している。   In general, translation processing of natural language by machine translation equipment first analyzes the input source language sentences, then converts the analysis results to the target language, which is the translation destination language, and finally the target language. Translation is performed by performing a generation process that correctly generates language sentences.

また、機械翻訳装置による翻訳処理は、単語情報や文法規則、言語変換規則等の様々な複雑で大規模な言語知識や翻訳知識を利用することが必要であるため、翻訳システムの構築作業には多大なコストが必要である。   Also, translation processing by machine translation devices requires the use of various complex and large-scale language knowledge and translation knowledge such as word information, grammar rules, and language conversion rules. A huge cost is necessary.

特に、慣用的な要因が強い言語現象は、一般化が困難であり、翻訳システムの構築のコストのより多くの部分を占めていた。   In particular, linguistic phenomena with strong idiomatic factors were difficult to generalize and accounted for more of the cost of building translation systems.

こうした慣用的な要因が強い言語現象の一例として、名詞句の翻訳がある。これを英日翻訳を例に説明する。   An example of a language phenomenon with such idiomatic factors is the translation of noun phrases. This will be explained using English-Japanese translation as an example.

英語の名詞連続部分の日本語訳は、同様に名詞の連続として訳した方がよい場合と、名詞間を連結する機能語を挿入して訳した方がよい場合とがある。   The Japanese translation of the English noun sequence may be translated as a series of nouns, or it may be translated by inserting function words that connect the nouns.

例えば英文“a baseball game”の日本語訳は、各単語“baseball”と“game”を日本語に訳した名詞を英文と同様に連続して並べて「野球試合」としては不適切である。「野球」と「試合」の両名詞の間に、連結機能語として格助詞「の」を名詞間に挿入して「野球の試合」と翻訳されることが求められる。   For example, a Japanese translation of the English sentence “a baseball game” is inappropriate as a “baseball game” in which nouns obtained by translating the words “baseball” and “game” into Japanese are arranged in succession similarly to the English sentence. Between the nouns “baseball” and “game”, it is required to translate the word “baseball game” by inserting the case particle “no” between the nouns as a connected function word.

逆に英文“a baseball player”の日本語訳は、「野球の選手」とも言えなくはないが「野球選手」と訳す方が自然である。   Conversely, the Japanese translation of the English sentence “a baseball player” is not necessarily “baseball player”, but it is natural to translate it as “baseball player”.

また、英文“Tokyo Station”の日本語訳は、「東京の駅」としては不適切であり、格助詞「の」を名詞間に挿入することなく「東京駅」と翻訳されることが求められる。   Also, the Japanese translation of the English text “Tokyo Station” is inappropriate as “Tokyo Station” and is required to be translated as “Tokyo Station” without inserting the case particle “no” between nouns. .

これらをいずれの形で訳せば良いかは、各単語の組み合わせに対する慣用的な要因が大きく、自動的に十分に訳し分けができるだけの翻訳知識を構築することはコスト的に非常に困難であった。   Which form should be translated depends largely on the idiomatic factors for each word combination, and it was very difficult to build translation knowledge that could be automatically translated and separated. .

このような翻訳知識の構築コストを低減することを目的として、従来から大量に集めた用例を翻訳知識として利用する手法が提案されている。   For the purpose of reducing the construction cost of such translation knowledge, a method of using a large amount of examples collected as translation knowledge has been proposed.

例えば特許文献1(特開平03−276367号公報)に開示された機械翻訳方法では、対訳用例を用いて原言語の解析結果を目的言語の構造に変換する手法が提案されている(以下、第1の従来例という)。   For example, in the machine translation method disclosed in Patent Document 1 (Japanese Patent Laid-Open No. 03-276367), a method for converting the analysis result of the source language into the structure of the target language using a parallel translation example has been proposed (hereinafter referred to as “No. 1”). 1).

この手法では通常の翻訳処理と同様に、まず入力文を解析して依存構造を導出する。そして得られた依存構造と用例とを比較し、原言語の構造が似ている用例を抽出する。さらにここで得られた用例の対訳関係に従って入力文の依存構造を目的言語の依存構造に変換し翻訳処理を進める。   In this method, as in normal translation processing, the input sentence is first analyzed to derive the dependency structure. Then, the obtained dependency structure is compared with the examples, and examples having similar source language structures are extracted. Further, the dependency structure of the input sentence is converted into the dependency structure of the target language in accordance with the parallel translation relationship of the example obtained here, and the translation process proceeds.

このように構築がより容易な用例を変換知識の代わりに利用することで、低コストで高品質な翻訳装置を実現することを目指している。   By using an example that is easier to construct in this way instead of conversion knowledge, we aim to realize a high-quality translation apparatus at a low cost.

また特許文献2(特開平11−259482号公報)に開示された機械翻訳方式では、対訳用例を用いて原言語の形態素列を直接、目的言語の形態素列に変換する手法を提案している(以下、第2の従来例という)。   In addition, the machine translation system disclosed in Patent Document 2 (Japanese Patent Laid-Open No. 11-259482) proposes a method of directly converting a source language morpheme string into a target language morpheme string using a bilingual example ( Hereinafter, it is referred to as a second conventional example).

ここでは翻訳対象を複合名詞に限り、形態素列の対応関係を保持した用例を用いる。第1の従来例では用例を適用するために入力文の依存構造解析が必要であるのに対して、この手法では依存構造解析を行わなくても用例が適用でき、翻訳処理が行えることを特徴としている。   Here, the translation object is limited to the compound noun, and an example in which the correspondence relationship of the morpheme string is maintained is used. In the first conventional example, the dependency structure analysis of the input sentence is necessary to apply the example, whereas in this method, the example can be applied without performing the dependency structure analysis, and the translation process can be performed. It is said.

これにより、より低コストで高品質な翻訳装置を実現することを目指している。   As a result, the aim is to realize a high-quality translation device at a lower cost.

しかし、第1の従来例においても第2の従来例においても、知識として利用する用例には、その内部構造として要素間の対訳関係が与えられている必要がある。   However, in both the first conventional example and the second conventional example, an example used as knowledge needs to be given a bilingual relationship between elements as its internal structure.

すなわち、第1の従来例で用いる用例には、対訳関係にある2つの言語の依存関係に対してノード毎の対応関係を付与する必要があり、また第2の従来例で用いる用例には、対訳関係にある2つの言語の形態素列に対して形態素毎の対応関係を付与する必要がある。   That is, in the example used in the first conventional example, it is necessary to provide a correspondence for each node with respect to the dependency relationship between two languages in a parallel translation relationship, and in the example used in the second conventional example, It is necessary to assign a correspondence relationship for each morpheme to the morpheme strings of the two languages in the bilingual relationship.

このように用例の作成にはこれら要素の間の対応付け作業を伴うため、用例の作成には依然として高いコストが必要であった。   As described above, since the creation of the example involves an associating operation between these elements, the creation of the example still requires a high cost.

このため、高品質な翻訳結果を出力するために非常に大きなコストが必要となり、現実には高品質な翻訳結果を得ることは難しかった。
特開平03−276367号公報 特開平11−259482号公報
For this reason, a very large cost is required to output a high-quality translation result, and in reality it was difficult to obtain a high-quality translation result.
Japanese Patent Laid-Open No. 03-276367 JP-A-11-259592

第1の従来例や第2の従来例では翻訳処理に利用する用例は対訳用例であり、その内部の要素間の対応付けを行わなければならないため、高品質な翻訳処理が行えるだけの大量の対訳の用例を集めるには依然として多くのコストが必要で、現実に十分な用例を収集することは困難であった。   In the first conventional example and the second conventional example, the example used for the translation process is an example for bilingual translation, and it is necessary to associate elements inside the translation process, so that a large amount of high-quality translation process can be performed. Collecting bilingual examples still requires a lot of cost, and it was difficult to collect practically sufficient examples.

この問題は、名詞句等の句の部分において、特定の連結機能語を挿入すべきか否かの判定を伴う翻訳処理等においても同様であり、適切な判定のために必要とする用例データを蓄積するには、手作業による膨大なコストを必要とした。   This problem also applies to translation processing that involves determining whether or not a specific connected function word should be inserted in a phrase such as a noun phrase, and accumulates example data necessary for appropriate determination. To do so, it required a huge amount of manual costs.

このため、対訳関係の設定処理を必要としない翻訳先の言語のみの用例データを参照して適切な翻訳を実行する翻訳装置、またこの用例データを翻訳先の言語の文章データを基に自動的に編集し生成する翻訳装置が求められていた。   For this reason, a translation device that performs appropriate translation by referring to example data only in the translation destination language that does not require parallel translation relationship setting processing, and automatically uses this example data based on sentence data in the translation destination language. There is a need for a translation device that can be edited and generated.

本発明の第1の目的は、連結機能語の用例データを参照し文章中の各句を適切に翻訳することで、自然な翻訳結果を出力する機械翻訳装置を提供することである。   A first object of the present invention is to provide a machine translation device that outputs a natural translation result by appropriately translating each phrase in a sentence with reference to example data of connected function words.

本発明の第2の目的は、原言語から目的言語への対訳用例を用いるのではなく、目的言語のみの用例データを参照する方式の械翻訳装置を提供することである。   A second object of the present invention is to provide a machine translation apparatus that refers to example data only in a target language, rather than using an example in parallel translation from a source language to a target language.

本発明の第3の目的は、単に目的言語の文章データを入力するのみで、こうした用例データを自動的に編集生成する機械翻訳装置を提供することである。   A third object of the present invention is to provide a machine translation apparatus that automatically edits and generates such example data simply by inputting text data in a target language.

本発明の第4の目的は、入力された目的言語の文章データから、文章句に連接機能語を含む用例と含まない用例の双方の情報を検出し、連接機能語の使用の適否を適切に判定した用例データを自動的に編集生成し、かつこの適切な判定による用例データに基づく翻訳を実行する機械翻訳装置を提供することである。   The fourth object of the present invention is to detect information on both the examples including and not including the concatenation function word in the sentence phrase from the text data of the input target language, and appropriately determine whether or not the concatenation function word is used. It is an object of the present invention to provide a machine translation device that automatically edits and generates determined example data and executes translation based on the example data based on this appropriate determination.

上記目的を達成するため本発明の機械翻訳装置は、翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳装置において、目的言語の指定された種類の文章句の単語データと、各前記文章句内における指定された連結機能語の適否に関する情報とを示す用例データを記録した用例データベースと、目的言語の文章中における連結機能語の使用の適否を、前記用例データベースを参照して判断し、前記文章中の適切な位置に連結機能語を設定し、連結機能語の使用を適切に修正した文章を生成する目的言語生成手段を備えることを特徴とする。   In order to achieve the above object, a machine translation device of the present invention is a machine translation device that translates a source language sentence that is a translation source language into a target language that is a translation destination language. An example database that records example data indicating word data of a sentence phrase and information on the suitability of a designated connected function word in each of the sentence phrases, and the suitability of the use of the connected function word in the target language sentence. Judging by referring to the example database, it is provided with a target language generating means for generating a sentence in which a connection function word is set at an appropriate position in the sentence and the use of the connection function word is appropriately corrected. .

本発明の機械翻訳装置は、翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳装置において、入力された翻訳対象の文章である原言語文を解析する原言語解析手段と、前記原言語解析手段の解析に基づき、前記原言語文の各単語と文章構造を、翻訳先の言語である目的言語の単語と文章構造に変換したデータである変換データを生成する言語変換手段と、目的言語の指定された種類の文章句の単語データと、各前記文章句内における指定された連結機能語の適否に関する情報とを示す用例データを記録し参照する用例データベースと、前記変換データ中における連結機能語の使用の適否を、前記用例データベースを参照して判断し、前記変換データ中の適切な位置に連結機能語を設定し、翻訳結果の文章である目的言語文を生成する目的言語生成手段を備えることを特徴とする。   The machine translation apparatus of the present invention analyzes a source language sentence that is an input translation target sentence in a machine translation apparatus that translates a source language sentence that is a source language into a target language that is a destination language. Source language analysis means, and conversion data that is data obtained by converting each word and sentence structure of the source language sentence into a target language word and sentence structure as a translation destination language based on the analysis of the source language analysis means Example of recording and referring to example data indicating language conversion means for generating a word, word data of a sentence phrase of a specified type in a target language, and information on suitability of a designated connected function word in each sentence phrase Judgment whether or not the connection function word is used in the database and the conversion data is determined with reference to the example database, and the connection function word is set at an appropriate position in the conversion data. Characterized in that it comprises a target language generating means for generating a target language sentence that.

本発明の機械翻訳装置は、前記目的言語生成手段は、目的言語の文章の構造を解析して、文章中の前記指定された種類の文章句の部分を処理対象の句として検出する対象句同定手段と、前記用例データベースに記録された前記用例データを参照し、前記処理対象の句に対し、適切な場合に適切な個所に適切な連結機能語を挿入する連結機能語挿入手段と、前記連結機能語挿入手段の挿入処理と、前記対象句同定手段の解析結果に従い、目的言語の文章を生成する目的言語文生成手段を備えることを特徴とする。   In the machine translation apparatus according to the present invention, the target language generation means analyzes the structure of the sentence in the target language, and detects the phrase of the specified type of sentence phrase in the sentence as a phrase to be processed. Means, a connected function word inserting means for referring to the example data recorded in the example database, and inserting an appropriate connected function word at an appropriate place in an appropriate case for the phrase to be processed, and the connected According to the present invention, there is provided a target language sentence generation means for generating a sentence in the target language according to the insertion processing of the function word insertion means and the analysis result of the target phrase identification means.

本発明の機械翻訳装置は、入力された目的言語の文章データを基に、前記用例データベースに記録する用例データを自動的に編集し登録する用例データベース作成手段を備えることを特徴とする。   The machine translation apparatus of the present invention is characterized by comprising example database creation means for automatically editing and registering example data recorded in the example database based on text data in the input target language.

本発明の機械翻訳装置は、前記用例データベース作成手段は、前記入力された目的言語の文章データを解析し、解析データを形態素列として出力する形態素解析手段と、前記形態素列から、前記指定された種類の文章句のデータを構成要素列として抽出する対象句構成要素抽出手段と、前記構成要素列から、前記指定された連結機能語を含む用例である正用例を検出する正用例抽出手段と、前記正用例抽出手段が検出する前記正用例に係る前記用例データを生成し前記用例データベースに登録する用例登録手段を備えることを特徴とする。   In the machine translation apparatus of the present invention, the example database creation unit analyzes the input sentence data in the target language, and outputs the analysis data as a morpheme string, and the specified morpheme string A target phrase component extraction means for extracting data of types of text phrases as a component string; a correct example extraction means for detecting a correct example that is an example including the specified connected function word from the component string; It is characterized by comprising example registration means for generating the example data related to the legitimate example detected by the legitimate example extracting means and registering it in the example database.

本発明の機械翻訳装置は、前記用例データベース作成手段は、前記構成要素列から、前記指定された連結機能語を含まない用例である負用例を検出する負用例抽出手段を備え、前記用例登録手段は、前記負用例抽出手段が検出する前記負用例に係る前記用例データを生成し前記用例データベースに登録を行い、前記用例データベース作成手段は、登録された前記用例データにおける前記正用例と前記負用例の情報を基に、当該文章句内における前記指定された連結機能語の使用の適否を判定し、この適否の判定結果を前記用例データベースに登録する用例調整手段を備えることを特徴とする。   In the machine translation apparatus of the present invention, the example database creation unit includes a negative example extraction unit that detects a negative example that is an example that does not include the designated connected function word from the component element sequence, and the example registration unit Generates the example data related to the negative example detected by the negative example extraction unit and registers it in the example database, and the example database creation unit includes the positive example and the negative example in the registered example data. On the basis of the above information, there is provided an example adjusting means for determining whether or not the specified connected function word is used in the sentence phrase and registering the determination result of the suitability in the example database.

本発明の機械翻訳装置は、前記用例データベースにおける各前記用例データは、前記文章句の前方の語句のデータと、後方の語句のデータと、前記前方の語句と前記後方の語句の間に前記指定された連結機能語を挿入することの適否を示すデータから成ることを特徴とする。   In the machine translation device of the present invention, each of the example data in the example database includes the designation of data in front of the phrase, data in the phrase behind, the phrase between the phrase in front and the phrase behind. It is characterized by comprising data indicating the suitability of inserting the connected function word.

本発明の機械翻訳装置は、前記用例データベースにおける各前記用例データは、前記文章句の前方の語句のデータと、後方の語句のデータと、前記前方の語句と前記後方の語句の間に前記指定された連結機能語を備える正用例を前記正用例抽出手段が検出した回数を示すデータと、前記指定された連結機能語を備えない負用例を前記負用例抽出手段が検出した回数を示すデータと、前記前方の語句と前記後方の語句の間に前記指定された連結機能語を挿入することの適否を示すデータから成ることを特徴とする。   In the machine translation device of the present invention, each of the example data in the example database includes the designation of data in front of the phrase, data in the phrase behind, the phrase between the phrase in front and the phrase behind. Data indicating the number of times that the positive example extraction means detects the correct example including the connected function word, and data indicating the number of times the negative example extraction means detects the negative example that does not include the designated connection function word; , Comprising data indicating the suitability of inserting the designated connected function word between the preceding word and the following word.

本発明の機械翻訳装置は、前記用例調整手段は、正用例を前記正用例抽出手段が検出した回数が、負用例を前記負用例抽出手段が検出した回数よりも多い場合には、当該用例データの前記前方の語句と前記後方の語句の間に前記指定された連結機能語を挿入するものと判定し、そうでない場合には、当該用例データの前記前方の語句と前記後方の語句の間に前記指定された連結機能語を挿入しないものと判定することを特徴とする。   In the machine translation device of the present invention, the example adjustment unit is configured such that when the number of times the positive example extraction unit detects the right example is larger than the number of times the negative example is detected by the negative example extraction unit, the example data It is determined that the designated connected function word is inserted between the preceding word and the following word, and if not, between the preceding word and the following word in the example data. It is determined that the designated connected function word is not inserted.

本発明の機械翻訳装置は、前記形態素解析手段は、前記入力された目的言語の文章データから、前記文章データを構成する単語を識別し、各前記単語の品詞を判定し、この単語とその品詞の情報を形態素列として出力する手段を備えることを特徴とする。   In the machine translation apparatus according to the present invention, the morpheme analyzing means identifies words constituting the sentence data from the inputted sentence data of the target language, determines a part of speech of each word, and the word and its part of speech. Means for outputting the above information as a morpheme string.

本発明の機械翻訳装置は、前記指定された種類の文章句の一つを名詞句とし、前記対象句構成要素抽出手段は、前記形態素列中の名詞である単語の連続する個所を名詞句と認識し、これを構成要素列として抽出する手段を備えることを特徴とする。   The machine translation device of the present invention uses one of the specified types of sentence phrases as a noun phrase, and the target phrase component extraction means uses a noun phrase as a continuous part of words that are nouns in the morpheme string. It has a means for recognizing and extracting it as a component string.

本発明の機械翻訳装置は、前記目的言語を日本語とし、前記指定された連結機能語の一つを、格助詞の「の」とすることを特徴とする。   The machine translation apparatus of the present invention is characterized in that the target language is Japanese, and one of the designated connected function words is the case particle "no".

本発明の機械翻訳方法は、翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳方法において、目的言語の指定された種類の文章句の単語データと、各前記文章句内における指定された連結機能語の適否に関する情報とを示す用例データをデータベースに記録し参照する用例参照ステップと、目的言語の文章中における連結機能語の使用の適否を、前記用例参照ステップが参照する前記用例データを基に判断し、前記文章中の適切な位置に連結機能語を設定し、連結機能語の使用を適切に修正した文章を生成する目的言語生成ステップを備えることを特徴とする。   The machine translation method of the present invention is a machine translation method for translating a source language sentence, which is a source language, into a target language, which is a destination language. , An example reference step for recording and referring to an example data indicating information regarding the suitability of a designated connected function word in each sentence phrase, and the suitability of the use of a connected function word in a sentence in a target language. A target language generating step for determining based on the example data referred to in the example reference step, setting a connected function word at an appropriate position in the sentence, and generating a sentence in which use of the connected function word is appropriately corrected; It is characterized by that.

本発明の機械翻訳方法は、翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳方法において、入力された翻訳対象の文章である原言語文を解析する原言語解析ステップと、前記原言語解析ステップによる解析に基づき、前記原言語文の各単語と文章構造を、翻訳先の言語である目的言語の単語と文章構造に変換したデータである変換データを生成する言語変換ステップと、目的言語の指定された種類の文章句の単語データと、各前記文章句内における指定された連結機能語の適否に関する情報とを示す用例データをデータベースに記録し参照する用例参照ステップと、前記変換データ中における連結機能語の使用の適否を、前記用例参照ステップが参照する前記用例データを基に判断し、前記変換データ中の適切な位置に連結機能語を設定し、翻訳結果の文章である目的言語文を生成する目的言語生成ステップを備えることを特徴とする。   The machine translation method of the present invention analyzes a source language sentence that is an input translation target sentence in a machine translation method that translates a source language sentence that is a source language into a target language that is a destination language. Source language analysis step and conversion data which is data obtained by converting each word and sentence structure of the source language sentence into a target language word and sentence structure as a translation destination language based on the analysis by the source language analysis step Record in the database and refer to the example data indicating the language conversion step for generating the word data of the specified phrase in the target language, and information on the suitability of the specified connected function word in each sentence phrase Determining whether or not to use the connected function word in the conversion data based on the example data referred to by the example reference step; Set the connecting function words in position, characterized in that it comprises a target language generation step of generating a target language sentence is a sentence translation result.

本発明の機械翻訳方法は、前記目的言語生成ステップは、目的言語の文章の構造を解析して、文章中の前記指定された種類の文章句の部分を処理対象の句として検出する対象句同定ステップと、前記用例参照ステップが参照する前記用例データを基に、前記処理対象の句に対し、適切な場合に適切な個所に適切な連結機能語を挿入する連結機能語挿入ステップと、前記連結機能語挿入ステップによる挿入処理と、前記対象句同定ステップによる解析結果に従い、目的言語の文章を生成する目的言語文生成ステップを備えることを特徴とする。   In the machine translation method of the present invention, the target language generation step analyzes the structure of the sentence in the target language, and detects the phrase of the specified type of sentence phrase in the sentence as a phrase to be processed. A link function word insertion step that inserts an appropriate link function word at an appropriate location, if appropriate, for the phrase to be processed based on the example data referred to by the example reference step, and the link A target language sentence generation step of generating a sentence in the target language according to the insertion processing by the function word insertion step and the analysis result by the target phrase identification step is provided.

本発明の機械翻訳方法は、入力された目的言語の文章データを基に、前記用例参照ステップが参照する前記データベースに対し、自動的に新たな用例データを編集し登録し更新する用例データベース作成ステップを備えることを特徴とする。   The machine translation method according to the present invention includes an example database creation step for automatically editing, registering and updating new example data with respect to the database referred to by the example reference step, based on sentence data in an input target language. It is characterized by providing.

本発明の機械翻訳方法は、前記用例データベース作成ステップは、前記入力された目的言語の文章データを解析し、解析データを形態素列として出力する形態素解析ステップと、前記形態素列から、前記指定された種類の文章句のデータを構成要素列として抽出する対象句構成要素抽出ステップと、前記構成要素列から、前記指定された連結機能語を含む用例である正用例を検出する正用例抽出ステップと、前記正用例抽出ステップが検出する前記正用例に係る前記用例データを生成し、前記用例参照ステップが参照する前記データベースに登録する用例登録ステップを備えることを特徴とする。   In the machine translation method of the present invention, the example database creation step analyzes the input sentence data in the target language and outputs the analysis data as a morpheme string; A target phrase constituent element extracting step for extracting data of types of sentence phrases as a constituent element string; a correct example extracting step for detecting a correct example that is an example including the specified connected function word from the constituent element string; An example registration step of generating the example data relating to the example for use detected by the example for extracting the example for use and registering in the database referred to by the step for reference to the example is provided.

本発明の機械翻訳方法は、前記用例データベース作成ステップは、前記構成要素列から、前記指定された連結機能語を含まない用例である負用例を検出する負用例抽出ステップを備え、前記用例登録ステップは、前記負用例抽出ステップが検出する前記負用例に係る前記用例データを生成し、前記用例参照ステップが参照する前記データベースに登録を行い、前記用例データベース作成ステップは、登録された前記用例データにおける前記正用例と前記負用例の情報を基に、当該文章句内における前記指定された連結機能語の使用の適否を判定し、この適否の判定結果を前記用例参照ステップが参照する前記データベースに登録する用例調整ステップを備えることを特徴とする。   In the machine translation method of the present invention, the example database creation step includes a negative example extraction step for detecting a negative example that is an example that does not include the specified connected function word from the component element sequence, and the example registration step Generates the example data related to the negative example detected by the negative example extraction step, registers the database in the database referred to by the example reference step, and the example database creation step Based on the information on the positive example and the negative example, the propriety of use of the designated connected function word in the sentence is determined, and the determination result of the propriety is registered in the database referred to by the example reference step. An example adjustment step is provided.

本発明の機械翻訳プログラムを記録した記憶媒体は、翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳プログラムを記録した記憶媒体において、目的言語の指定された種類の文章句の単語データと、各前記文章句内における指定された連結機能語の適否に関する情報とを示す用例データをデータベースに記録し参照する用例参照ステップと、目的言語の文章中における連結機能語の使用の適否を、前記用例参照ステップが参照する前記用例データを基に判断し、前記文章中の適切な位置に連結機能語を設定し、連結機能語の使用を適切に修正した文章を生成する目的言語生成ステップを備えることを特徴とする。   A storage medium on which the machine translation program of the present invention is recorded is a storage medium on which a machine translation program for translating a sentence in a source language that is a translation source language into a target language that is a translation destination language. An example reference step for recording and referring to a database of example data indicating the word data of the type of sentence phrase and information on the suitability of the designated connected function word in each sentence phrase, and in the sentence of the target language Appropriateness of use of the connection function word was determined based on the example data referred to by the example reference step, the connection function word was set at an appropriate position in the sentence, and the use of the connection function word was appropriately corrected. A target language generation step for generating a sentence is provided.

本発明の機械翻訳プログラムを記録した記憶媒体は、翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳プログラムを記録した記憶媒体において、入力された翻訳対象の文章である原言語文を解析する原言語解析ステップと、前記原言語解析ステップによる解析に基づき、前記原言語文の各単語と文章構造を、翻訳先の言語である目的言語の単語と文章構造に変換したデータである変換データを生成する言語変換ステップと、目的言語の指定された種類の文章句の単語データと、各前記文章句内における指定された連結機能語の適否に関する情報とを示す用例データをデータベースに記録し参照する用例参照ステップと、前記変換データ中における連結機能語の使用の適否を、前記用例参照ステップが参照する前記用例データを基に判断し、前記変換データ中の適切な位置に連結機能語を設定し、翻訳結果の文章である目的言語文を生成する目的言語生成ステップを備えることを特徴とする。   The storage medium recording the machine translation program of the present invention is a translation medium inputted with the machine translation program for translating a sentence in the source language as a source language into a target language as a destination language. A source language analysis step for analyzing a source language sentence that is a target sentence, and each word and sentence structure of the source language sentence based on an analysis by the source language analysis step, and a target language word that is a translation destination language A language conversion step for generating conversion data which is data converted into a sentence structure, word data of a specified type of sentence phrase in the target language, and information on the suitability of the designated connected function word in each of the sentence phrases; The example reference step refers to the example reference step for recording and referring to the example data indicating the above and the suitability of the use of the connected function word in the converted data. The example data is determined based on that, the set of coupled function words in the appropriate position in the conversion data, characterized in that it comprises a target language generation step of generating a target language sentence is a sentence translation result.

本発明の機械翻訳プログラムを記録した記憶媒体は、前記目的言語生成ステップは、目的言語の文章の構造を解析して、文章中の前記指定された種類の文章句の部分を処理対象の句として検出する対象句同定ステップと、前記用例参照ステップが参照する前記用例データを基に、前記処理対象の句に対し、適切な場合に適切な個所に適切な連結機能語を挿入する連結機能語挿入ステップと、前記連結機能語挿入ステップによる挿入処理と、前記対象句同定ステップによる解析結果に従い、目的言語の文章を生成する目的言語文生成ステップを備えることを特徴とする。   In the storage medium storing the machine translation program of the present invention, the target language generation step analyzes the structure of the sentence in the target language, and uses the specified type of sentence phrase in the sentence as a phrase to be processed. Connected function word insertion that inserts an appropriate connected function word at an appropriate place when appropriate for the phrase to be processed based on the target phrase identifying step to be detected and the example data referred to by the example reference step And a target language sentence generation step of generating a sentence in a target language according to an insertion process by the step of inserting the connected function word and an analysis result by the target phrase identification step.

本発明の機械翻訳プログラムを記録した記憶媒体は、入力された目的言語の文章データを基に、前記用例参照ステップが参照する前記データベースに対し、自動的に新たな用例データを編集し登録し更新する用例データベース作成ステップを備えることを特徴とする。   The storage medium storing the machine translation program of the present invention automatically edits, registers, and updates new example data with respect to the database referred to by the example reference step, based on the text data of the input target language. An example database creation step is provided.

本発明の機械翻訳プログラムを記録した記憶媒体は、前記用例データベース作成ステップは、前記入力された目的言語の文章データを解析し、解析データを形態素列として出力する形態素解析ステップと、前記形態素列から、前記指定された種類の文章句のデータを構成要素列として抽出する対象句構成要素抽出ステップと、前記構成要素列から、前記指定された連結機能語を含む用例である正用例を検出する正用例抽出ステップと、前記正用例抽出ステップが検出する前記正用例に係る前記用例データを生成し、前記用例参照ステップが参照する前記データベースに登録する用例登録ステップを備えることを特徴とする。
本発明の機械翻訳プログラムを記録した記憶媒体は、前記用例データベース作成ステップは、前記構成要素列から、前記指定された連結機能語を含まない用例である負用例を検出する負用例抽出ステップを備え、前記用例登録ステップは、前記負用例抽出ステップが検出する前記負用例に係る前記用例データを生成し、前記用例参照ステップが参照する前記データベースに登録を行い、前記用例データベース作成ステップは、登録された前記用例データにおける前記正用例と前記負用例の情報を基に、当該文章句内における前記指定された連結機能語の使用の適否を判定し、この適否の判定結果を前記用例参照ステップが参照する前記データベースに登録する用例調整ステップを備えることを特徴とする。
In the storage medium storing the machine translation program of the present invention, the example database creating step analyzes the input sentence data of the target language and outputs the analysis data as a morpheme string, and from the morpheme string A target phrase component extraction step for extracting data of the specified type of sentence / phrase as a component string, and a correct example for detecting a correct example that is an example including the specified connected function word from the component string An example extraction step, and an example registration step of generating the example data related to the actual example detected by the actual example extraction step and registering the example data in the database referred to by the example reference step are provided.
The storage medium storing the machine translation program of the present invention includes a negative example extracting step of detecting a negative example that is an example not including the designated connected function word from the component string in the example database creating step. The example registration step generates the example data related to the negative example detected by the negative example extraction step, registers in the database referred to by the example reference step, and the example database creation step is registered. Further, based on the information on the positive example and the negative example in the example data, it is determined whether or not the designated connected function word is used in the sentence phrase, and the determination result is referred to the example reference step. And an example adjustment step of registering in the database.

以上説明したように本発明によれば、以下のような効果が得られる。
第1に、連結機能語の使用の適否を示す用例データを用いるため、連接機能語を適切に出力して文章中の各句を適切に翻訳し、自然な翻訳結果を出力することができる。
第2に、原言語から目的言語への対訳用例を用いるのではなく、目的言語のみの用例データを参照するため、翻訳処理中に目的言語に変換した文章に対し、適切な文章への修正処理を実行することができる。
更に、このため従来では人手による膨大なコストを必要とした用例の対訳関係の設定処理を必要とせずに、単に目的言語の文章データを入力するのみで、こうした用例データを自動的に編集生成することが実現できる。
第4に、入力された目的言語の文章データから、文章句に連接機能語を含む用例と含まない用例の双方の情報を検出することにより、連接機能語の使用の適否の適切な判定ができ、またこの適切な判定による用例データ自動的に編集生成し、かつこの適切な判定に基づく翻訳を実行することができる。
As described above, according to the present invention, the following effects can be obtained.
First, since the example data indicating the appropriateness of the use of the connected function word is used, it is possible to appropriately output the connected function word, appropriately translate each phrase in the sentence, and output a natural translation result.
Secondly, instead of using an example of translation from the source language to the target language, a process for correcting the sentence converted into the target language during the translation process to refer to the example data of only the target language. Can be executed.
Furthermore, for this reason, conventionally, it is possible to automatically edit and generate such example data only by inputting text data in the target language without requiring the processing for setting the parallel translation relationship of the example which has required enormous costs. Can be realized.
Fourth, it is possible to appropriately determine whether or not to use the concatenated function word by detecting information on both the example including and not including the concatenated function word in the sentence phrase from the sentence data of the input target language. In addition, it is possible to automatically edit and generate example data based on the appropriate determination and execute translation based on the appropriate determination.

以下、本発明の実施の形態について図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

本発明の機械翻訳装置は、自然言語の翻訳処理等において、連結機能語の用例のデータを参照することで、文章中の各種の句の翻訳において自然な翻訳結果を出力することを特徴とする。   The machine translation apparatus of the present invention is characterized in that in natural language translation processing or the like, by referring to data of examples of connected function words, natural translation results are output in translation of various phrases in a sentence. .

なお、以下翻訳元の言語を原言語と言い、翻訳先の言語を目的言語と言う。例えば英日翻訳においては英語が原言語であり日本語が目的言語である。   Hereinafter, the source language is referred to as a source language, and the destination language is referred to as a target language. For example, in English-Japanese translation, English is the source language and Japanese is the target language.

また翻訳する翻訳元の文章データ(文章又は文字列、単語等)を原言語文字列と言い、翻訳結果として生成する文章データを目的言語文と言う。   The translation source sentence data (sentence or character string, word, etc.) to be translated is called a source language character string, and the sentence data generated as a translation result is called a target language sentence.

図1は、本発明の第1の実施の形態の機械翻訳装置の構成を示すブロック図である。   FIG. 1 is a block diagram showing the configuration of the machine translation apparatus according to the first embodiment of this invention.

図1を参照すると、本実施例の機械翻訳装置は、翻訳元の文章データである原言語文字列の入力を受け付ける入力手段10と、入力手段10に入力された原言語文字列を解析する原言語解析手段20と、原言語解析手段20が出力する解析結果を目的言語の構造に変換する言語変換手段30と、言語変換手段30が変換した目的言語の構造から目的言語文を生成する目的言語生成手段40と、目的言語生成手段40が生成した目的言語文を出力する出力手段50を備える。   Referring to FIG. 1, the machine translation apparatus of the present embodiment includes an input unit 10 that receives input of a source language character string that is sentence data of a translation source, and a source language character string that is input to the input unit 10. Language analysis unit 20, language conversion unit 30 that converts the analysis result output from source language analysis unit 20 to the structure of the target language, and target language that generates the target language sentence from the structure of the target language converted by language conversion unit 30 A generation unit 40 and an output unit 50 that outputs a target language sentence generated by the target language generation unit 40 are provided.

特に目的言語生成手段40は、目的言語における所定の連結機能語に関する句の用例を格納する連結機能語用例データベース41と、言語変換手段30が変換した目的言語の構造を解析して処理対象とすべき句に相当する部分構造を同定する対象句同定手段42と、連結機能語用例データベース41に格納された用例に従って対象句同定手段42で同定された句の適切な個所に連結機能語を挿入する連結機能語挿入手段43と、連結機能語挿入手段43の連結機能語の挿入処理等に従い目的言語の構造から目的言語文を生成する目的言語文生成手段44を備える。   In particular, the target language generating means 40 analyzes the structure of the target language converted by the language conversion means 30 and the connected function word example database 41 that stores phrase examples related to the predetermined connected function words in the target language, and sets them as processing targets. The target phrase identifying means 42 for identifying the partial structure corresponding to the power phrase, and the connected function word are inserted into appropriate phrases in the phrase identified by the target phrase identifying means 42 according to the examples stored in the connected function word example database 41. There is provided a connected function word inserting means 43 and a target language sentence generating means 44 for generating a target language sentence from the structure of the target language in accordance with the connecting function word inserting process of the connected function word inserting means 43 and the like.

次に、本実施の形態の機械翻訳装置の動作を説明する。   Next, the operation of the machine translation apparatus according to this embodiment will be described.

図2は、本実施の形態の機械翻訳装置の翻訳処理を説明するためのフローチャートである。   FIG. 2 is a flowchart for explaining the translation processing of the machine translation apparatus of this embodiment.

ここでは、本実施の形態の機械翻訳装置の用例を用いる翻訳処理を、特に2つの単語の間に所定の連結機能語を挿入するかどうかの判断処理を行う一具体例を用いて説明する。   Here, the translation process using the example of the machine translation apparatus of the present embodiment will be described using a specific example in which a determination process is performed to determine whether or not a predetermined connected function word is inserted between two words.

図2を参照すると、まず入力手段10は、翻訳対象となる原言語文字列の入力を受け付ける(ステップ201)。   Referring to FIG. 2, the input unit 10 first receives an input of a source language character string to be translated (step 201).

この翻訳する文章データの入力処理は、例えばキーボードやOCR、音声認識による入力方法によるものや、また外部記憶装置等の記憶媒体に電子データとして記録された文章データを直接読み込むこと等により実現できる。   This input processing of sentence data to be translated can be realized by, for example, a keyboard, OCR, an input method using voice recognition, or by directly reading sentence data recorded as electronic data in a storage medium such as an external storage device.

次に、原言語解析手段20は、入力手段10から読み込んだ原言語文字列を解析して文章の構造を計算する(ステップ202)。   Next, the source language analyzing unit 20 analyzes the source language character string read from the input unit 10 and calculates the structure of the sentence (step 202).

言語変換手段30は、翻訳知識のデータを参照して、原言語解析手段20が出力した翻訳対象の文章構造を、目的言語の文章構造に変換する(ステップ203)。   The language conversion means 30 refers to the translation knowledge data and converts the sentence structure to be translated output by the source language analysis means 20 into a sentence structure of the target language (step 203).

次に、目的言語生成手段40は、言語変換手段30が出力した目的言語の構造から目的言語文を生成する。   Next, the target language generation unit 40 generates a target language sentence from the structure of the target language output by the language conversion unit 30.

これは、まず対象句同定手段42は、ステップ203で言語変換手段30が目的言語の文章構造に変換したデータの中から、連結機能語挿入処理の対象となる句の部分を同定する(ステップ204)。   First, the target phrase identifying means 42 identifies the phrase part that is the target of the connected function word insertion processing from the data converted into the sentence structure of the target language by the language converting means 30 in step 203 (step 204). ).

具体的には、入力された文章データの句構造を構成する各単語を検査し、検査対象の句の構成要素である2単語が直接の係り受け関係にある場合に、この部分を連結機能語挿入処理の対象の句として抽出する。   Specifically, each word constituting the phrase structure of the input sentence data is inspected, and when two words that are constituent elements of the phrase to be inspected have a direct dependency relationship, this part is designated as a connected function word. Extracted as a phrase to be inserted.

連結機能語挿入手段43は、連結機能語用例データベース41に格納された用例を参照し、適切な場合においては所定の格助詞を、対象句同定手段42が処理対象として同定した句に挿入する。   The connected function word inserting means 43 refers to the examples stored in the connected function word example database 41, and inserts a predetermined case particle into the phrase identified as the processing target by the target phrase identifying means 42 when appropriate.

連結機能語用例データベース41は、所定の連結機能語に関する句の用例を格納している。   The linked function word example database 41 stores phrase examples related to predetermined linked function words.

ここで、連結機能語用例データベース41に用例を格納する方式の一具体例としては、句を構成する2つの単語の組と、その2つの単語の間に所定の連結機能語を挿入(表出)すべきかどうかを示す連結機能語表出フラグとの対応を記録するテーブルを用いて構成することができる。   Here, as a specific example of a method for storing examples in the connected function word example database 41, a set of two words constituting a phrase and a predetermined connected function word inserted between the two words (expressed) ) Can be configured using a table that records the correspondence with the connected function word expression flag indicating whether or not to be performed.

具体的には、まず対象句同定手段42が同定した処理対象の句構造を一つ取り出す(ステップ205)。これは、挿入処理を行うかどうかの判定がまだ未処理の句が残っているかどうかをチェックし(ステップ206)、未処理の句が残っていたらこれを取り出すのである。そして、取り出した処理対象の句を構成する2つの単語を連結機能語用例データベース41で検索する(ステップ207)。   Specifically, first, one phrase structure to be processed identified by the target phrase identifying means 42 is extracted (step 205). In this case, whether or not the insertion processing is to be performed is checked to see whether or not an unprocessed phrase remains (step 206), and if an unprocessed phrase remains, it is extracted. Then, two words constituting the extracted phrase to be processed are searched in the connected function word example database 41 (step 207).

次に、得られた検索結果をチェックし(ステップ208)、もし検索結果として用例が得られ、かつその用例の連結機能語表出フラグが連結機能語を挿入すべきである旨を示していれば、処理対象の句に所定の連結機能語を挿入する(ステップ209)。   Next, the obtained search result is checked (step 208), and if an example is obtained as the search result, the connected function word expression flag of the example should indicate that the connected function word should be inserted. For example, a predetermined connected function word is inserted into the phrase to be processed (step 209).

以上の挿入処理を行うかどうかの判定処理を、対象句同定手段42が同定した処理対象の句構造に対し実行し、挿入処理を実行する(ステップ206)。   The process for determining whether or not to perform the above insertion processing is executed for the phrase structure to be processed identified by the target phrase identifying means 42, and the insertion processing is executed (step 206).

全ての処理対象の句構造に対する処理の終了後、目的言語文生成手段44は、連結機能語挿入手段43が連結機能語処理を施した目的言語の構造に含まれる単語を並べて活用変形等の処理を行い、目的言語の文を生成する(ステップ210)。   After the processing for all the phrase structures to be processed is completed, the target language sentence generation unit 44 arranges the words included in the target language structure subjected to the connection function word processing by the connection function word insertion unit 43 and performs processing such as transformation To generate a target language sentence (step 210).

そして出力手段50は、目的言語生成手段40が生成した目的言語文を出力する(ステップ211)。   The output means 50 outputs the target language sentence generated by the target language generation means 40 (step 211).

この翻訳結果の出力方式としては、例えばディスプレイ等の表示装置や、音声合成装置によるスピーカからの出力や、また外部記憶装置等の記憶媒体に電子データとして直接出力する等の方式により実現できる。   This translation result output method can be realized by, for example, a display device such as a display, an output from a speaker by a speech synthesizer, or a direct output as electronic data to a storage medium such as an external storage device.

次に、本実施の形態の機械翻訳装置の具体的な翻訳動作の一例を、図3から図6を用いて具体的に説明する。   Next, an example of a specific translation operation of the machine translation apparatus according to the present embodiment will be specifically described with reference to FIGS.

以下の具体例では、翻訳元の言語である原言語を英語とし、翻訳先の言語である目的言語を日本語とする英日翻訳の例により説明するが、本実施の形態の機械翻訳装置の翻訳処理はこれに限られるものではなく、仏日翻訳、独日翻訳、露日翻訳や日英翻訳等任意の言語間の翻訳に適用可能である。   In the following specific example, explanation will be given by an example of English-Japanese translation in which the source language that is the translation source language is English and the target language that is the translation destination language is Japanese, but the machine translation device of the present embodiment The translation processing is not limited to this, and can be applied to translation between arbitrary languages such as French-Japanese translation, German-Japanese translation, Russian-Japanese translation, and Japanese-English translation.

また以下では処理対象の句として名詞句を考え、また所定の連結機能語として格助詞の「の」を考えるが、本発明の範囲はこれに限られるものではなく、形容詞句や動詞句等の任意の句構造、及び「な」「から」「より」「に」「へ」「は」「が」等の任意の連結機能語に対して適用可能である。   In the following, a noun phrase is considered as a phrase to be processed, and a case particle “no” is considered as a predetermined connected function word, but the scope of the present invention is not limited to this, and adjective phrases, verb phrases, etc. It can be applied to any phrase structure and any connected function word such as “NA”, “TO”, “TO”, “NI”, “HA”, “HA” and “GA”.

ここで翻訳対象の英文として“I went to the baseball game.”が入力手段10に入力された場合を考える。   Here, consider a case where “Iwent to the baseball game.” Is input to the input unit 10 as an English sentence to be translated.

ここで入力された英文は、原言語解析手段20により構文構造に解析され、さらに言語変換手段30により目的言語の構文構造に変換される。   The English text input here is analyzed into a syntax structure by the source language analysis means 20 and further converted into a syntax structure of the target language by the language conversion means 30.

図3は、本実施の形態の原言語解析手段による翻訳対象の英文の構文構造の解析一例を示す図である。図3では、各リーフノードに入力文中の各単語が割り当て、その単語間の依存関係をツリー構造で示している。   FIG. 3 is a diagram showing an example of the analysis of the syntax structure of an English sentence to be translated by the source language analysis means of the present embodiment. In FIG. 3, each word in the input sentence is assigned to each leaf node, and the dependency relationship between the words is shown in a tree structure.

例えば、図3に見られる「baseball game」に対する構造を参照すると、この2単語の間には直接の依存関係があり、2つがまとまって名詞句(NP)を作っていることが分かる。   For example, referring to the structure for “baseball game” shown in FIG. 3, it can be seen that there is a direct dependency between the two words, and the two together form a noun phrase (NP).

さらに、この図では各ノードに対して、その下位の構造の代表語となるヘッドワードを付与しており、またその関係を太線で表わしている。   Further, in this figure, a head word, which is a representative word of the subordinate structure, is given to each node, and the relationship is indicated by a bold line.

つまり「baseball game」という名詞句の構造では「game」がヘッドワードであり、その一つ上の構造は「the」と「game」の間の関係として捉えることができる。   In other words, in the structure of the noun phrase “baseball game”, “game” is the headword, and the structure above it can be understood as a relationship between “the” and “game”.

図4は、本発明の第1の実施の形態の言語変換手段による変換結果の日本文の構文構造の一例を示す図である。図4では、入力英文中の各単語に対する日本語訳を、日本語の語順で各リーフノードに割り当てている。   FIG. 4 is a diagram illustrating an example of a syntax structure of a Japanese sentence as a result of conversion by the language conversion unit according to the first embodiment of this invention. In FIG. 4, a Japanese translation for each word in the input English sentence is assigned to each leaf node in Japanese word order.

また、図3と同様に、その単語間の依存関係をツリー構造で示しているが、図4ではさらに各々の単語の依存関係を示す連結語も付与されている。   Further, as in FIG. 3, the dependency relationship between the words is shown in a tree structure, but in FIG. 4, a concatenated word indicating the dependency relationship of each word is also given.

例えば「私」と「行く」の間には、「が」で結ばれる主語−述語の関係があることが示されている。   For example, it is shown that there is a subject-predicate relationship connected by “ga” between “I” and “go”.

図5は、本発明の第1の実施の形態の連結機能語用例データベース41に格納された用例データの一例を示す図である。   FIG. 5 is a diagram illustrating an example of example data stored in the connected function word example database 41 according to the first embodiment of this invention.

図5では、格助詞の「の」の係り元と係り先に出現しうる名詞の組が単語1と単語2のカラムに格納されている。   In FIG. 5, pairs of nouns that can appear in the case particle “no” are stored in the word 1 and word 2 columns.

さらに、それぞれの単語の組にはその間に格助詞の「の」を表出すべきかどうかを表わす連結機能語表出フラグが格納されている。ここで、連結機能語表出フラグは“1”で表出すべき、“0”で表出すべきでないということを示すものとする。   Further, each word set stores a connected function word expression flag indicating whether or not the case particle “no” should be expressed in between. Here, it is assumed that the connected function word expression flag should be expressed by “1” and should not be expressed by “0”.

言語変換手段30で変換された目的言語の構文構造は、対象句同定手段42に送られる。   The syntax structure of the target language converted by the language conversion unit 30 is sent to the target phrase identification unit 42.

対象句同定手段42は、受け取った構文構造中の各単語を検査して名詞やそれに類する単語を探し、その係り先が名詞かそれに類する単語であった場合、これを処理対象の名詞句として抽出する。   The target phrase identifying means 42 examines each word in the received syntax structure to search for a noun or a similar word, and if the destination is a noun or similar word, it extracts it as a noun phrase to be processed. To do.

図4を参照すると、ここではまず「私」という単語を検査する。   Referring to FIG. 4, the word "I" is first examined here.

「私」は代名詞であり名詞に類する単語として認定できるが、その係り先が「行く」という動詞であるため、これは処理対象外であると認定する。   “I” is a pronoun and can be recognized as a word similar to a noun. However, since it is a verb “go”, it is determined that it is not subject to processing.

次に「野球」という単語を検査し、これが名詞であり、かつ「試合」という名詞に係るため、「野球/試合」に対する構文構造を処理対象の名詞句として同定する。   Next, the word “baseball” is examined, and since this is a noun and relates to the noun “game”, the syntactic structure for “baseball / game” is identified as a noun phrase to be processed.

同様に全ての単語をチェックして全ての処理対象を同定する。   Similarly, all words are checked to identify all objects to be processed.

ここで同定された処理対象の名詞句は一つずつ連結機能語挿入手段43に送られる。   The noun phrases to be processed identified here are sent one by one to the connected function word insertion means 43.

連結機能語挿入手段43は、対象句同定手段42で同定された処理対象の名詞句に含まれる2つの名詞、あるいはそれに類する単語を用いて連結機能語用例データベース41を検索する。   The connected function word inserting unit 43 searches the connected function word example database 41 using two nouns included in the noun phrase to be processed identified by the target phrase identifying unit 42 or a similar word.

ここでは係り元となる単語1が「野球」であり、係り先となる単語2が「試合」であるような用例を検索する。   Here, an example is searched in which the word 1 that is the source of the engagement is “baseball” and the word 2 that is the destination of the engagement is “game”.

ここで得られた検索結果の連結機能語表出フラグをチェックするとこれが“1”であり、この間には格助詞「の」を挿入すべきである旨が分かる。   When the connected function word expression flag in the search result obtained here is checked, it is found that this is “1”, and that the case particle “no” should be inserted between them.

連結機能語挿入手段43は、ここで得られた結果に従って「野球」が「試合」にかかる部分の関係として「の」を挿入する。   The connected function word inserting means 43 inserts “no” as the relationship of the part where “baseball” is related to “game” according to the result obtained here.

図6は、本実施の形態の連結機能語挿入処理の処理結果の一例を示す図である。   FIG. 6 is a diagram illustrating an example of a processing result of the connected function word insertion processing according to the present embodiment.

ここで得られた構文構造は目的言語文生成手段44に送られ、日本語文として生成される。   The syntax structure obtained here is sent to the target language sentence generation means 44 and is generated as a Japanese sentence.

ここでは単語間の関係を表わす「が」「の」「に」や過去の「た」などが助詞として表出すると共に活用変形などを行うことで、「私は野球の試合に行った」という日本語文が生成される。   Here, “G”, “No”, “Ni”, and “Ta” in the past, which represent the relationship between words, are expressed as particles, and are used and modified to say, “I went to a baseball game” Japanese sentences are generated.

ここで生成された日本語文は、出力手段50に送られ、出力される。   The Japanese sentence generated here is sent to the output means 50 and output.

図7は、本発明の第1の実施の形態の機械翻訳装置の一実施例の構成を示すブロック図である。   FIG. 7 is a block diagram showing a configuration of an example of the machine translation apparatus according to the first embodiment of this invention.

図7を参照すると、本実施例は入出力機能及び情報処理機能等を備えるコンピュータ処理装置90において、本実施の形態の目的言語生成手段40等の各機能を備える機械翻訳プログラムをメモリにロードすることで実現することができる。この機械翻訳プログラムは、磁気ディスク、磁気テープ、光ディスク、半導体メモリ又はその他のコンピュータ等によって読み取りが可能な記憶媒体100に格納される。そして、その記憶媒体100からコンピュータ処理装置90にロードされ、コンピュータ処理装置90の動作を制御することにより、上述した各機能を実現する。   Referring to FIG. 7, in this embodiment, in a computer processing apparatus 90 having an input / output function, an information processing function, and the like, a machine translation program having each function such as the target language generation means 40 of the present embodiment is loaded into a memory. Can be realized. The machine translation program is stored in a storage medium 100 that can be read by a magnetic disk, magnetic tape, optical disk, semiconductor memory, or other computer. Then, the above-described functions are realized by being loaded from the storage medium 100 to the computer processing device 90 and controlling the operation of the computer processing device 90.

つまり、この記憶媒体100に格納された機械翻訳プログラムは、記憶媒体100からコンピュータ処理装置90のメモリに読み込まれ、コンピュータ処理装置90の動作を制御することにより、コンピュータ処理装置90上に連結機能語用例記憶部941といった記憶部を実現すると共に、入力部91、原言語解析部92、言語変換部93、対象句同定部942、連結機能語挿入部943、目的言語文生成部944、出力部95といった各機能を実現するのである。   In other words, the machine translation program stored in the storage medium 100 is read from the storage medium 100 into the memory of the computer processing device 90, and the operation of the computer processing device 90 is controlled so that the connected function word is stored on the computer processing device 90. In addition to realizing a storage unit such as the example storage unit 941, the input unit 91, the source language analysis unit 92, the language conversion unit 93, the target phrase identification unit 942, the connected function word insertion unit 943, the target language sentence generation unit 944, and the output unit 95 Each function is realized.

ここで、図1の第1の実施の形態との関係では、入力部91が入力手段10に、原言語解析部92が原言語解析手段20に、言語変換部93が言語変換手段30に、目的言語生成部94内の各部が目的言語生成手段40内の各手段に、出力部95が出力手段50に、それぞれ対応する。   Here, in relation to the first embodiment of FIG. 1, the input unit 91 is the input unit 10, the source language analysis unit 92 is the source language analysis unit 20, the language conversion unit 93 is the language conversion unit 30, Each unit in the target language generation unit 94 corresponds to each unit in the target language generation unit 40, and the output unit 95 corresponds to the output unit 50.

本実施例は、コンピュータ処理装置90が機械翻訳プログラムの制御により動作する点に特徴があり、基本的な機能は図1や図2と同じである。   The present embodiment is characterized in that the computer processing apparatus 90 operates under the control of a machine translation program, and the basic functions are the same as those in FIGS.

つまり、コンピュータ処理装置90は、機械翻訳プログラムの制御により以下の処理を実行する。   That is, the computer processing device 90 executes the following processing under the control of the machine translation program.

入力部91への翻訳対象のデータの入力によって、入力部91は翻訳対象となる原言語文字列の入力を受け取り、原言語解析部92を起動する。   By inputting the data to be translated into the input unit 91, the input unit 91 receives the input of the source language character string to be translated and activates the source language analyzing unit 92.

原言語解析部92は、入力部91から入力された原言語文字列を解析し、言語変換部93を起動する。   The source language analysis unit 92 analyzes the source language character string input from the input unit 91 and activates the language conversion unit 93.

言語変換部93は、言語解析部92が出力した翻訳対象に対する解析結果の構造を目的言語の構造に変換した後、対象句同定部942を起動する。   The language conversion unit 93 activates the target phrase identification unit 942 after converting the structure of the analysis result for the translation target output by the language analysis unit 92 into the structure of the target language.

対象句同定部942は、言語変換部93が出力した目的言語の構造の中から連結機能語挿入処理の対象となる句の部分構造を同定し、各々に対して連結機能語挿入部943を起動する。   The target phrase identifying unit 942 identifies the partial structure of the phrase that is the target of the connected function word insertion processing from the structure of the target language output by the language converting unit 93, and activates the connected function word inserting unit 943 for each. To do.

連結機能語挿入部943は、連結機能語用例記憶部941に格納された用例を参照して適切な場合には、対象句同定部942で同定された句の部分構造に所定の格助詞を挿入する。   The link function word insertion unit 943 inserts a predetermined case particle into the partial structure of the phrase identified by the target phrase identification unit 942 when appropriate with reference to the example stored in the link function word example storage unit 941. To do.

ここでは、対象句同定部942が同定した部分構造の全てに対して連結機能語挿入処理を行った後、目的言語文生成部944を起動する。   Here, after performing the connected function word insertion processing on all the partial structures identified by the target phrase identifying unit 942, the target language sentence generating unit 944 is activated.

目的言語文生成部944は、連結機能語挿入部943が連結機能語処理を施した目的言語の構造に含まれる単語を並べて活用変形等の処理を行い、目的言語の文を生成する。   The target language sentence generation unit 944 generates words in the target language by arranging words included in the structure of the target language that has been subjected to the connection function word processing by the connection function word insertion unit 943 and performing processing such as utilization modification.

出力部95は、目的言語生成部94で生成された目的言語文を出力する。   The output unit 95 outputs the target language sentence generated by the target language generation unit 94.

以上説明した本実施の形態の機械翻訳装置により、連結機能語の使用の適否を示す用例データを用いるため、連接機能語を適切に出力して文章中の各句を適切に翻訳し、自然な翻訳結果を出力することができる。   Since the machine translation device of the present embodiment described above uses the example data indicating the suitability of the use of the connected function word, the concatenated function word is appropriately output, each phrase in the sentence is appropriately translated, The translation result can be output.

また、原言語から目的言語への対訳用例を用いるのではなく、目的言語のみの用例データを参照するため、翻訳処理中に目的言語に変換した文章に対し、適切な文章への修正処理を実行することができる。   Also, instead of using an example of parallel translation from the source language to the target language, refer to the example data of the target language only, so that the sentence converted to the target language during the translation process will be corrected to an appropriate sentence can do.

図8は、本発明の第2の実施の形態の機械翻訳装置の構造を示すブロック図である。   FIG. 8 is a block diagram showing the structure of the machine translation apparatus according to the second embodiment of the present invention.

本実施の形態の機械翻訳装置は、自動的に収集した連結機能語用例を用いることで、低コストで自然な翻訳結果を出力するものである。   The machine translation apparatus according to the present embodiment outputs a natural translation result at a low cost by using automatically collected examples of connected function words.

本実施の形態の機械翻訳装置が、図1の第1の実施の形態の機械翻訳装置と相違する点は、連結機能語用例データベース41を自動的に作成する用例データベース作成手段60を備える点にある。   The machine translation apparatus of the present embodiment is different from the machine translation apparatus of the first embodiment of FIG. 1 in that it includes an example database creation means 60 that automatically creates a linked function word example database 41. is there.

本実施例における用例データベース作成手段60は、目的言語文字列の入力を受け付ける用例入力手段61と、用例入力手段61から入力された文字列を解析して形態素列を出力する形態素解析手段62と、目的言語の形態素列から対象となる句の構成要素列を抽出する対象句構成要素抽出手段63と、形態素解析手段62で解析された形態素列から対象句構成要素抽出手段63で抽出された構成要素列を参照して所定の連結機能語を含む連結機能語正用例を抽出する正用例抽出手段64と、正用例抽出手段64で抽出された正用例を連結機能語用例データベース41に登録する用例登録手段65とから構成される。   An example database creation unit 60 in the present embodiment includes an example input unit 61 that receives an input of a target language character string, a morpheme analysis unit 62 that analyzes a character string input from the example input unit 61 and outputs a morpheme string, A target phrase component extraction unit 63 that extracts a component sequence of a target phrase from a morpheme sequence in the target language, and a component extracted by the target phrase component extraction unit 63 from the morpheme sequence analyzed by the morpheme analysis unit 62 Reference example extracting means 64 for extracting a connected function word correct example including a predetermined connected function word with reference to the column, and an example registration for registering the correct example extracted by the correct example extracting means 64 in the connected function word example database 41 And means 65.

ここで、正用例とは、用例データベース41に登録される用例において単語間に連結機能語を含む用例のことである。   Here, the right-use example is an example that includes a connected function word between words in the example registered in the example database 41.

次に、本実施の形態の機械翻訳装置の動作を説明する。   Next, the operation of the machine translation apparatus according to this embodiment will be described.

本実施の形態の機械翻訳装置の動作の、第1の実施の形態の機械翻訳装置の動作と相違する点は、用例データベース作成手段60による連結機能語用例データベース41を自動的に作成するステップを備えることであり、他の入力手段10、原言語解析手段20、言語変換手段30、目的言語生成手段40、出力手段50の動作は、第1の発明の実施例の動作で説明したものと同じである。以下、本実施の形態の特徴である用例データベース作成手段60の動作について説明する。   The operation of the machine translation apparatus according to the present embodiment is different from the operation of the machine translation apparatus according to the first embodiment in that a step of automatically creating the connection function word example database 41 by the example database creation means 60 is performed. The operations of the other input means 10, source language analysis means 20, language conversion means 30, target language generation means 40, and output means 50 are the same as those described in the operation of the embodiment of the first invention. It is. Hereinafter, the operation of the example database creating means 60, which is a feature of the present embodiment, will be described.

図9は、本実施の形態の用例データベース作成手段60の動作を説明するためのフローチャートである。図2のフローチャートにおいては翻訳の実行のための翻訳元の言語の原言語文字列の入力・解析を行ったのに対し、ここでは用例データの登録のための翻訳先の言語の目的言語文字列の入力・解析を実行する。   FIG. 9 is a flowchart for explaining the operation of the example database creation means 60 of this embodiment. In the flowchart of FIG. 2, input / analysis of the source language character string of the source language for execution of translation is performed, but here the target language character string of the destination language for registration of example data is shown here. Perform input / analysis of.

用例入力手段61は、用例抽出の対象となる目的言語文字列の入力を受け付ける(ステップ901)。   The example input means 61 receives an input of a target language character string that is a target of example extraction (step 901).

これは例えばキーボードやOCR、音声認識装置等を用いる入力方式や、また外部記憶装置等に記憶された原言語文字列の電子データを直接読み込む方式等により実現できる。   This can be realized by, for example, an input method using a keyboard, OCR, voice recognition device, or the like, or a method of directly reading electronic data of a source language character string stored in an external storage device or the like.

形態素解析手段62は、用例入力手段61から入力された目的言語文字列を形態素解析し、形態素列に分解する(ステップ902)。ここで形態素列は、図10の例に示されるように目的言語文字列の各単語と、その各単語が成す品詞等を示す情報である。   The morpheme analysis unit 62 performs morpheme analysis on the target language character string input from the example input unit 61 and decomposes it into a morpheme sequence (step 902). Here, the morpheme string is information indicating each word of the target language character string and the part of speech formed by each word as shown in the example of FIG.

正用例抽出手段64は、形態素解析手段62が解析結果として出力した形態素列の中から連結機能語用例データベース41に登録すべき用例を抽出する。   The correct example extracting unit 64 extracts an example to be registered in the connected function word example database 41 from the morpheme string output as an analysis result by the morpheme analyzing unit 62.

具体的には、まず形態素解析手段62が解析結果として出力した形態素列の中から所定の連結機能語(「の」等)を検索する(ステップ903)。   Specifically, first, a predetermined connected function word (such as “no”) is searched from the morpheme string output as an analysis result by the morpheme analysis means 62 (step 903).

ここで得られた検索結果をチェックし(ステップ904)、形態素列中に所定の連結機能語がある場合には、その全てに対して次の処理を実行する。   The search result obtained here is checked (step 904), and if there are predetermined linked function words in the morpheme string, the following processing is executed for all of them.

まず処理対象となる連結機能語の直前の形態素aが登録の対象となる句の構成要素であるかどうかをチェックする(ステップ905)。これは、形態素aの品詞が名詞や形容詞等であるか、また当該連結機能語を挟む句を構成するか等をチェックする。   First, it is checked whether or not the morpheme a immediately before the connected function word to be processed is a constituent element of the phrase to be registered (step 905). This checks whether the part of speech of the morpheme a is a noun, an adjective or the like, and whether a phrase sandwiching the connected function words is formed.

この形態素aが、対象となる句の構成要素である場合、その連結機能語の後ろにある形態素列(又は形態素)を対象句構成要素抽出手段63に渡し、その連結機能語の直後の構成要素列を抽出する(ステップ906)。   When the morpheme a is a constituent element of the target phrase, the morpheme string (or morpheme) after the connected function word is passed to the target phrase constituent element extraction unit 63, and the constituent element immediately after the connected function word A column is extracted (step 906).

対象句構成要素抽出手段63が構成要素列が抽出できたかどうかをチェックし(ステップ907)、正常に抽出でき場合には、例えば図5の例等に示される記録形態に合わせて記録するため、形態素aとその構成要素列の最後の形態素bの組を用例として抽出し、用例登録手段65に渡す(ステップ908)。   The target phrase component extraction means 63 checks whether or not the component string can be extracted (step 907), and if it can be extracted normally, for example, to record in accordance with the recording form shown in the example of FIG. A set of the morpheme a and the last morpheme b of its component string is extracted as an example and passed to the example registration unit 65 (step 908).

用例登録手段65は、正用例抽出手段64が用例として抽出した形態素aと形態素bの組を連結機能語用例データベース41に登録する(ステップ909)。   The example registration unit 65 registers the set of the morpheme a and the morpheme b extracted by the regular example extraction unit 64 as an example in the connected function word example database 41 (step 909).

ここで、連結機能語用例データベース41に格納する用例としては、図5の例に示されるように2つの単語の組と、その2つの単語の間に所定の連結機能語を表出すべきかどうかを表わす連結機能語表出フラグとで構成することができる。   Here, as an example of storing in the connected function word example database 41, whether or not a predetermined connected function word should be expressed between two words as shown in the example of FIG. 5 and the two words. And a connected function word expression flag representing.

用例登録手段65による連結機能語用例データベース41への登録方式として、既に登録済みの用例に対しては、連結機能語表出フラグと共に、あるいはその代わりとして、ステップ909において連結機能語用例データベース41に登録が指示された回数の情報を図11に示すように格納する形態も可能である。   As a registration method to the connected function word example database 41 by the example registering means 65, the already registered example is used in the connected function word example database 41 in step 909 together with or instead of the connected function word expression flag. It is also possible to store information on the number of times registration is instructed as shown in FIG.

さらにまた、各々の単語の組に対して、連結機能語表出フラグにより連結機能語を用いるか用いないかの二者択一の形式で登録するのではなく、単語間に所定の連結機能語が出現する確率の情報により(又、出現回数と出現しない回数の情報により)登録する形態も可能である。   Furthermore, for each set of words, instead of registering in the alternative form of using or not using the connected function word by the connected function word expression flag, a predetermined connected function word is used between the words. It is also possible to register with the information of the probability of occurrence of (and the information of the number of appearances and the number of non-appearances).

本実施の形態の翻訳処理においては、用例データベース作成手段60で作成された連結機能語用例データベース41を用いて、第1の実施の形態の動作で説明した処理を実行する。   In the translation processing of the present embodiment, the processing described in the operation of the first embodiment is executed using the connected function word example database 41 created by the example database creation means 60.

次に、第2の実施の形態の機械翻訳装置の具体的な動作について、図面を参照して詳細に説明する。   Next, a specific operation of the machine translation apparatus according to the second embodiment will be described in detail with reference to the drawings.

以下では、翻訳元の言語である原言語を英語とし、翻訳先の言語である目的言語を日本語とする例により説明するが、本実施の形態の機械翻訳装置が翻訳を行う言語はこれに限られるものではなく、任意の言語間の翻訳に対しても同様に適用可能である。   In the following description, the source language that is the source language is English and the target language that is the target language is Japanese, but the language that the machine translation device of the present embodiment translates is described here. The present invention is not limited, and can be similarly applied to translation between arbitrary languages.

また、以下では名詞句を処理対象の句とし、格助詞の「の」を所定の連結機能語とする例により説明するが、本実施の形態の機械翻訳装置が処理する処理対象の句及び連結機能語はこれに限られるものではなく、任意の句構造、連結機能語に対しても同様に適用可能である。   In the following description, the noun phrase is a processing target phrase and the case particle “no” is a predetermined connection function word. However, the processing target phrase and the connection processed by the machine translation device of the present embodiment will be described. The function word is not limited to this, and can be similarly applied to any phrase structure and connected function word.

本実施の形態の機械翻訳装置が、第1の実施の形態と相違する点は、用例データベース作成手段60により連結機能語用例データベース41を自動的に作成する処理であり、他の入力手段10、原言語解析手段20、言語変換手段30、目的言語生成手段40、出力手段50の各部の動作は第1の実施の形態の動作で説明したものと同じである。このため、以下では本実施の形態の特徴である用例データベース作成手段60の動作について具体的に説明する。   The machine translation apparatus according to the present embodiment is different from the first embodiment in the process of automatically creating the connected function word example database 41 by the example database creating means 60. The other input means 10, The operation of each part of the source language analysis unit 20, the language conversion unit 30, the target language generation unit 40, and the output unit 50 is the same as that described in the operation of the first embodiment. Therefore, the operation of the example database creation means 60 that is a feature of the present embodiment will be specifically described below.

「私は野球の試合に行くのが好きだ」という日本語文を、用例抽出の処理対象として説明する。   The Japanese sentence “I like to go to baseball games” will be explained as an example extraction target.

まず、この処理対象の日本語文を、用例入力手段61に入力する。すると、形態素解析手段62は、入力された日本語文を形態素解析し形態素列に変換する。   First, the Japanese sentence to be processed is input to the example input means 61. Then, the morpheme analyzing means 62 analyzes the input Japanese sentence and converts it into a morpheme string.

図10は、本実施の形態の形態素解析手段による形態素解析の結果として得られた形態素列の一例を示す図である。   FIG. 10 is a diagram illustrating an example of a morpheme string obtained as a result of morpheme analysis by the morpheme analysis unit of the present embodiment.

図10の例では、各行に一つの形態素が示されており、各々には形態素の文字列(単語)とその品詞が示されている。   In the example of FIG. 10, one morpheme is shown in each line, and each of them shows a morpheme character string (word) and its part of speech.

形態素解析手段62で得られたこの形態素解析結果は、正用例抽出手段64に送られ、そこに含まれる用例を抽出する。   The morpheme analysis result obtained by the morpheme analysis unit 62 is sent to the regular example extraction unit 64, and the examples contained therein are extracted.

まず正用例抽出手段64は、得られた形態素解析結果から所定の連結機能語を検索する。   First, the correct usage example extracting unit 64 searches for a predetermined connected function word from the obtained morpheme analysis result.

ここでは格助詞の「の」を検索すると、4番目の形態素が格助詞の「の」であり、この位置が検索結果として得られる。   Here, when the case particle “no” is searched, the fourth morpheme is the case particle “no”, and this position is obtained as a search result.

次に正用例抽出手段64は、得られた検索結果の直前の形態素(単語)である「野球」の品詞を調べる。品詞が名詞等の場合には用例の抽出すべき候補であり、助詞等の場合には用例の抽出すべき候補ではないものと判断する。   Next, the correct example extracting means 64 examines the part of speech of “baseball” which is a morpheme (word) immediately before the obtained search result. When the part of speech is a noun or the like, it is determined that the example is to be extracted, and when the part of speech is a particle or the like, it is determined that the example is not a candidate to be extracted.

ここで「野球」の品詞は名詞であり、用例の抽出すべき候補である。このため、正用例抽出手段64は、4番目の形態素である処理対象の格助詞「の」の、次から始まる形態素列を対象句構成要素抽出手段63に送る。そして、対象句構成要素抽出手段63は、正用例抽出手段64から送られた形態素列から、処理対象とする名詞句の構成要素列として名詞連続部分を抽出する。   Here, the part of speech of “baseball” is a noun and is a candidate to be extracted as an example. Therefore, the correct example extracting unit 64 sends the morpheme string starting from the next of the case particle “NO” to be processed, which is the fourth morpheme, to the target phrase component extracting unit 63. Then, the target phrase constituent element extracting unit 63 extracts a noun continuous portion from the morpheme string sent from the correct example extracting unit 64 as a constituent element string of the noun phrase to be processed.

正用例抽出手段64が抽出する名詞句の長さは、予め定めた所定の単語数を抽出する方式や、格助詞「の」以後の各単語の品詞を順次チェックし名詞等の名詞句を構成する品詞が続く範囲の単語を抽出する方式や、格助詞「の」以後に最初に句読点が表れるまでの単語を抽出する方式等が可能である。   The length of the noun phrase extracted by the correct usage example extracting means 64 is a method of extracting a predetermined number of words or a noun phrase such as a noun by sequentially checking the part of speech of each word after the case particle “no”. A method of extracting a word in a range in which a part of speech continues, a method of extracting a word until a punctuation mark appears first after the case particle “no”, and the like are possible.

ここでは、正用例抽出手段64から、例えば「試合/に/行く/の/が/好き/だ」という形態素列が対象句構成要素抽出手段63に送られたものとして説明する。   Here, description will be made assuming that the morpheme string “game / to / go / no / ga / like / da”, for example, is sent to the target phrase constituent element extraction unit 63 from the correct example extraction unit 64.

まず、対象句構成要素抽出手段63は、格助詞「の」以後の1番目の形態素「試合」の品詞を調べると名詞であるため、この形態素は名詞連続の一部(名詞句の一部)であると判断する。   First, since the target phrase component extraction means 63 examines the part of speech of the first morpheme “game” after the case particle “no”, it is a noun, so this morpheme is part of a noun sequence (part of a noun phrase). It is judged that.

次に2番目の形態素「に」の品詞を調べるとその品詞は格助詞であるため、この形態素は名詞連続に属さないと判断し、直前の形態素「試合」までの形態素列を名詞連続部分として抽出する。   Next, when the part of speech of the second morpheme “Ni” is examined, the part of speech is a case particle, so it is determined that this morpheme does not belong to the noun continuation, and the morpheme string up to the previous morpheme “match” is used as the noun continuation part. Extract.

以上の処理により「試合」が名詞連続部分として抽出され、正用例抽出手段64に送られる。   With the above processing, “game” is extracted as a noun continuous part and sent to the correct example extracting means 64.

正用例抽出手段64は、対象句構成要素抽出手段63で抽出された名詞連続部分の最後の形態素を、現在処理対象としている連結機能語の係り先の形態素として抽出する。   The correct usage example extracting unit 64 extracts the last morpheme of the noun continuous part extracted by the target phrase component extracting unit 63 as the morpheme of the connected function word currently being processed.

ここでは「試合」が抽出され、用例としては「野球」「試合」の形態素の組が得られるため、これを用例登録手段65に送る。   Here, “game” is extracted, and as an example, a set of morphemes “baseball” and “game” is obtained, and this is sent to the example registration means 65.

用例登録手段65は、正用例抽出手段64が用例として抽出した形態素の組を連結機能語データベース41に登録する。   The example registering unit 65 registers the set of morphemes extracted as examples by the correct example extracting unit 64 in the connected function word database 41.

ここでは「野球」「試合」の形態素の組を登録するが、対象となる連結機能語データベース41として図11に示したものを考える。図11は、本発明の第2の実施の形態の連結機能語用例データベースに格納された用例データの一例を示す図である。   Here, a set of morphemes of “baseball” and “game” is registered, but the one shown in FIG. FIG. 11 is a diagram illustrating an example of example data stored in the linked function word example database according to the second embodiment of this invention.

図11を参照すると、ここには格助詞の「の」の係り元と係り先に出現しうる名詞の組が単語1と単語2のカラムに格納されている。   Referring to FIG. 11, a pair of nouns that can appear in the case particle's “no” dependency source and the relationship destination is stored in the word 1 and word 2 columns.

さらにそれぞれの単語の組にはその間に格助詞の「の」を表出すべきかどうかを表わす連結機能語表出フラグが格納されている。   Further, each word set stores a connected function word expression flag indicating whether or not the case particle “no” should be expressed in between.

ここで連結機能語表出フラグは“1”で表出すべき、“0”で表出すべきでないということを表わしているものとする。   Here, it is assumed that the connected function word expression flag indicates that it should be expressed by “1” and should not be expressed by “0”.

さらに各々の単語の組には、それらの単語の間に所定の連結機能語が出現した用例に関して、連結機能語用例データベース41に登録された用例の数が格納されている。   Further, each set of words stores the number of examples registered in the connected function word example database 41 with respect to an example in which a predetermined connected function word appears between the words.

例えば「野球」「試合」の組み合わせを参照すると、「野球の試合」と格助詞「の」を伴って出現した用例が54回登録されていることが分かる。   For example, referring to a combination of “baseball” and “game”, it can be seen that an example that appears with a “baseball game” and a case particle “no” is registered 54 times.

この連結機能語データベース41に対する「野球」「試合」の形態素の組の登録では、まず単語1が「野球」で単語2が「試合」である用例の正用例数を1つ増やして55にする。   In the registration of a morpheme set of “baseball” and “game” in the connected function word database 41, first, the number of examples for which word 1 is “baseball” and word 2 is “game” is incremented by one to 55. .

さらに、正用例数の増加に従って連結機能語表出フラグも更新する。例えば、この用例の登録処理によって正用例数が所定の閾値を超えた場合に連結機能語表出フラグを1にするのである。   In addition, the linked function word expression flag is also updated as the number of regular examples increases. For example, the connected function word expression flag is set to 1 when the number of regular examples exceeds a predetermined threshold by the registration process of this example.

また第2の実施の形態における翻訳処理は、ここで作成した連結機能語用例データベース41を用いて、第1の発明の実施例の動作で説明した処理を実行するものである。   The translation processing in the second embodiment executes the processing described in the operation of the embodiment of the first invention using the connected function word example database 41 created here.

図12は、本発明の第2の実施の形態の機械翻訳装置の一実施例の構成を示すブロック図である。   FIG. 12 is a block diagram illustrating a configuration of an example of the machine translation apparatus according to the second embodiment of this invention.

図12を参照すると、本実施例は入出力機能及び情報処理機能等を備えるコンピュータ処理装置90において、本実施の形態の目的言語生成手段40、用例データベース作成手段60等の各機能を備える機械翻訳プログラムをメモリにロードすることで実現することができる。この機械翻訳プログラムは、磁気ディスク、磁気テープ、光ディスク、半導体メモリ又はその他のコンピュータ等によって読み取りが可能な記憶媒体100に格納される。そして、その記憶媒体100からコンピュータ処理装置90にロードされ、コンピュータ処理装置90の動作を制御することにより、上述した各機能を実現する。   Referring to FIG. 12, the present embodiment is a computer processing apparatus 90 having an input / output function, an information processing function, etc., and a machine translation having each function of the target language generation means 40, the example database creation means 60, etc. of the present embodiment. This can be realized by loading the program into memory. The machine translation program is stored in a storage medium 100 that can be read by a magnetic disk, magnetic tape, optical disk, semiconductor memory, or other computer. Then, the above-described functions are realized by being loaded from the storage medium 100 to the computer processing device 90 and controlling the operation of the computer processing device 90.

つまり、この記憶媒体100に格納された機械翻訳プログラムは、記憶媒体100からコンピュータ処理装置90のメモリに読み込まれ、コンピュータ処理装置90の動作を制御することにより、コンピュータ処理装置90上に連結機能語用例記憶部941といった記憶部を実現すると共に、入力部91、原言語解析部92、言語変換部93、対象句同定部942、連結機能語挿入部943、目的言語文生成部944、用例入力部961、形態素解析部962、対象句構成要素抽出部963、正用例抽出部964、用例登録部965、出力部95といった各機能を実現するのである。   In other words, the machine translation program stored in the storage medium 100 is read from the storage medium 100 into the memory of the computer processing device 90, and the operation of the computer processing device 90 is controlled so that the connected function word is stored on the computer processing device 90. In addition to realizing a storage unit such as the example storage unit 941, the input unit 91, the source language analysis unit 92, the language conversion unit 93, the target phrase identification unit 942, the connected function word insertion unit 943, the target language sentence generation unit 944, and the example input unit 961, morpheme analysis unit 962, target phrase component extraction unit 963, correct example extraction unit 964, example registration unit 965, and output unit 95 are realized.

ここで、図8の実施例との関係では、入力部91が入力手段10に、原言語解析部92が原言語解析手段20に、言語変換部93が言語変換手段30に、目的言語生成部94内の各部が目的言語生成手段40内の各手段に、出力部95が出力手段50に、用例生成部96内の各部が用例データベース作成手段60内の各種段に、それぞれ対応する。   8, the input unit 91 is the input unit 10, the source language analysis unit 92 is the source language analysis unit 20, the language conversion unit 93 is the language conversion unit 30, and the target language generation unit. Each unit in 94 corresponds to each unit in the target language generation unit 40, the output unit 95 corresponds to the output unit 50, and each unit in the example generation unit 96 corresponds to various stages in the example database creation unit 60.

本実施例は、コンピュータ処理装置90が機械翻訳プログラムの制御により動作する点に特徴があり、基本的な機能は図8や図9と同じである。   The present embodiment is characterized in that the computer processing apparatus 90 operates under the control of a machine translation program, and the basic functions are the same as those in FIGS.

つまり、コンピュータ処理装置90は、機械翻訳プログラムの制御により以下の処理を実行する。   That is, the computer processing device 90 executes the following processing under the control of the machine translation program.

用例登録処理においては、まず入力部91への用例の入力によって、用例入力部961は、用例抽出の対象となる目的言語文字列の入力を受け付け、形態素解析部962を起動する。   In the example registration process, first, according to an example input to the input unit 91, the example input unit 961 receives an input of a target language character string that is a target of example extraction, and activates the morpheme analysis unit 962.

形態素解析部962は、用例入力部961から入力された目的言語文字列を形態素解析し、形態素列に分解した後、正用例抽出部964を起動する。   The morpheme analysis unit 962 performs morpheme analysis on the target language character string input from the example input unit 961, decomposes it into a morpheme sequence, and then activates the correct example extraction unit 964.

正用例抽出部964は、形態素解析部962が解析結果として出力した形態素列の中から連結機能語用例記憶部941に登録すべき用例を抽出し、用例登録部965を起動する。   The correct usage example extraction unit 964 extracts a usage example to be registered in the connected function word usage example storage unit 941 from the morpheme sequence output as an analysis result by the morpheme analysis unit 962, and activates the usage example registration unit 965.

用例を抽出する際には、形態素解析部962が解析結果として出力した形態素列の中から所定の連結機能語を検索し、得られた連結機能語の直前の形態素と、直後の形態素列から対象句構成要素抽出部963によって抽出された対象となる句の構成要素列とを用いる。   When extracting an example, a predetermined connected function word is searched from the morpheme string output as an analysis result by the morpheme analysis unit 962, and the target morpheme immediately after the obtained connected function word and the immediately following morpheme string The phrase component element sequence extracted by the phrase component extraction unit 963 is used.

用例登録部965は、正用例抽出部964が用例として抽出した2つの形態素の組を、連結機能語用例記憶部941に登録する。   The example registration unit 965 registers the set of two morphemes extracted as examples by the regular example extraction unit 964 in the connected function word example storage unit 941.

さらに翻訳処理においては、用例作成部96で作成された連結機能語用例記憶部941を用いて、第1実施の形態の動作で説明した処理を行う。   Further, in the translation process, the process described in the operation of the first embodiment is performed using the connected function word example storage unit 941 created by the example creation unit 96.

以上説明した本実施の形態の機械翻訳装置により、単に目的言語の文章データを入力するのみで、翻訳に使用する用例データを自動的に編集し生成できる。   With the machine translation apparatus of the present embodiment described above, it is possible to automatically edit and generate example data used for translation simply by inputting text data in a target language.

図13は、本発明の第3の実施の形態の機械翻訳装置の構成を示すブロック図である。   FIG. 13 is a block diagram illustrating a configuration of the machine translation apparatus according to the third embodiment of this invention.

本実施の形態の機械翻訳装置は、自動的に収集した連結機能語用例を用いることで、低コストで自然な翻訳結果を出力することを特徴とする。   The machine translation apparatus according to the present embodiment is characterized in that a natural translation result is output at a low cost by using automatically collected examples of connected function words.

本実施の形態の機械翻訳装置の、図8の第2の実施の形態の機械翻訳装置と相違する点は、用例データベース作成手段60aの内部構成にあり、負用例抽出手段66と、用例調整手段67を新たに備えた点である。   The machine translation apparatus according to the present embodiment is different from the machine translation apparatus according to the second embodiment in FIG. 8 in the internal configuration of the example database creation means 60a. The negative example extraction means 66 and the example adjustment means 67 is newly provided.

ここで、負用例とは、正用例と逆に用例データベース41に登録される用例において単語間に連結機能語を含まない用例のことである。   Here, the negative example is an example in which the connected function word is not included between words in the example registered in the example database 41 contrary to the positive example.

つまり、本実施の形態の用例データベース作成手段60aは、目的言語文字列の入力を受け付ける用例入力手段61と、用例入力手段61から入力された文字列を解析して形態素列を出力する形態素解析手段62と、目的言語の形態素列から対象となる句の構成要素列を抽出する対象句構成要素抽出手段63と、形態素解析手段62で解析された形態素列から対象句構成要素抽出手段63で抽出された構成要素列を参照して所定の連結機能語を含む連結機能語正用例を抽出する正用例抽出手段64と、正用例抽出手段64で抽出された正用例を連結機能語用例データベース41に登録する用例登録手段65と、形態素解析手段62で解析された形態素列から対象句構成要素抽出手段63で抽出された構成要素列を参照して所定の連結機能語を含まない連結機能語負用例を抽出する負用例抽出手段66と、負用例抽出手段66で抽出された負用例を用いて連結機能語用例データベース41の内容を調整する用例調整手段67を備える。   That is, the example database creation unit 60a of the present embodiment includes an example input unit 61 that receives input of a target language character string, and a morpheme analysis unit that analyzes a character string input from the example input unit 61 and outputs a morpheme string. 62, a target phrase component extraction unit 63 that extracts a component sequence of a target phrase from a morpheme sequence in the target language, and a target phrase component extraction unit 63 that is extracted from the morpheme sequence analyzed by the morpheme analysis unit 62 A reference example extracting means 64 for extracting a connected function word correct example including a predetermined connected function word with reference to the component string, and a correct example extracted by the correct example extracting means 64 are registered in the connected function word example database 41. And a predetermined connected function word by referring to the constituent element sequence extracted by the target phrase constituent element extracting means 63 from the morpheme sequence analyzed by the morpheme analyzing means 62 Comprises a negative example extraction means 66 for extracting Manai connecting function words negative examples, the example adjusting means 67 for adjusting the content of the coupling function words example database 41 by using the negative examples extracted with negative example extraction means 66.

次に、本実施の形態の機械翻訳装置の動作を説明する。   Next, the operation of the machine translation apparatus according to this embodiment will be described.

図14は、本発明の第3の実施の形態の機械翻訳装置の翻訳処理を説明するためのフローチャートである。   FIG. 14 is a flowchart for explaining the translation processing of the machine translation apparatus according to the third embodiment of this invention.

本実施の形態の機械翻訳装置の動作の、第2の実施の形態の機械翻訳装置と相違する点は、用例データベース作成手段60aによる連結機能語用例データベース41を自動的に作成する処理であり、他の入力手段10、原言語解析手段20、言語変換手段30、目的言語生成手段40、出力手段50の動作は、第2の実施の形態の及び第1の実施の形態の動作で説明したものと同じである。このため、以下では本実施の形態の特徴である用例データベース作成手段60の動作について説明する。   The difference of the operation of the machine translation apparatus of the present embodiment from the machine translation apparatus of the second embodiment is the process of automatically creating the linked function word example database 41 by the example database creating means 60a. The operations of the other input means 10, source language analysis means 20, language conversion means 30, target language generation means 40, and output means 50 are the same as those described in the second embodiment and in the first embodiment. Is the same. For this reason, the operation of the example database creating means 60, which is a feature of the present embodiment, will be described below.

まず、用例入力手段61は、用例抽出の対象となる目的言語文字列の入力を受け付ける(ステップ1401)。   First, the example input means 61 receives an input of a target language character string that is a target of example extraction (step 1401).

この翻訳する文章データの入力処理は、例えばキーボードやOCR、音声認識による入力方法によるものや、また外部記憶装置等の記憶媒体に電子データとして記録された文章データを直接読み込むこと等により実現できる。   This input processing of sentence data to be translated can be realized by, for example, a keyboard, OCR, an input method using voice recognition, or by directly reading sentence data recorded as electronic data in a storage medium such as an external storage device.

形態素解析手段62は、用例入力手段61から入力された目的言語文字列を形態素解析し、形態素列に分解する(ステップ1402)。ここで解析結果の各形態素には、各単語の品詞の情報も付与する。   The morpheme analysis unit 62 performs morpheme analysis on the target language character string input from the example input unit 61 and decomposes it into a morpheme sequence (step 1402). Here, information on the part of speech of each word is also given to each morpheme of the analysis result.

正用例抽出手段64は、形態素解析手段62が解析結果として出力した形態素列の中から連結機能語用例データベース41に登録すべき正用例を抽出する。   The correct example extracting unit 64 extracts a correct example to be registered in the connected function word example database 41 from the morpheme string output as an analysis result by the morpheme analyzing unit 62.

具体的には、まず形態素解析手段62が解析結果として出力した形態素列の中から所定の連結機能語を検索する(ステップ1403)。   Specifically, first, a predetermined connected function word is searched from the morpheme string output as an analysis result by the morpheme analysis means 62 (step 1403).

そして、得られた検索結果をチェックし(ステップ1404)、形態素列中に所定の連結機能語があれば、その全てに対して次の処理を実行する。   Then, the obtained search result is checked (step 1404), and if there is a predetermined connected function word in the morpheme string, the following processing is executed for all of them.

まず処理対象となる連結機能語の直前の形態素aが対象となる句の構成要素であるかどうかをチェックする(ステップ1405)。   First, it is checked whether or not the morpheme a immediately before the connected function word to be processed is a constituent element of the target phrase (step 1405).

形態素aが対象となる句の構成要素である場合、その連結機能語の後ろにある形態素列を対象句構成要素抽出手段63に渡し、その連結機能語の直後の構成要素列を抽出する(ステップ1406)。   When the morpheme a is a constituent element of the target phrase, the morpheme string after the connected function word is passed to the target phrase constituent element extracting means 63, and the constituent element string immediately after the connected function word is extracted (step) 1406).

対象句構成要素抽出手段63で構成要素列が抽出できたかどうかをチェックし(ステップ1407)、抽出できたら、例えば形態素aとその構成要素列の最後の形態素bの組を用例として抽出し、用例登録手段65に渡す(ステップ1408)。   It is checked whether or not the component string can be extracted by the target phrase component extraction means 63 (step 1407). If extraction is possible, for example, a pair of morpheme a and the last morpheme b of the component string is extracted as an example. It passes to the registration means 65 (step 1408).

用例登録手段65は、正用例抽出手段64が正用例として抽出した形態素aと形態素bの組を連結機能語用例データベース41に登録する(ステップ1409)。   The example registration unit 65 registers the set of the morpheme a and the morpheme b extracted by the correct example extraction unit 64 as the correct example in the connected function word example database 41 (step 1409).

ここで連結機能語用例データベース41に格納する用例としては、例えば2つの単語の組と、その2つの単語の間に所定の連結機能語を表出すべきかどうかを表わす連結機能語表出フラグとで構成することができる。   Here, as an example of storing in the connected function word example database 41, for example, a set of two words and a connected function word expression flag indicating whether or not a predetermined connected function word should be expressed between the two words, Can be configured.

また連結機能語表出フラグと共に、あるいはその代わりとして、それらの単語の間に所定の連結機能語が出現した正用例や、それらの単語が所定の連結機能語を介さずに連続して出現した負用例について、連結機能語用例データベース41に登録された用例の数を格納してもよい。   Also, together with or instead of the connected function word expression flag, a correct example in which a predetermined connected function word appears between those words, or these words appear continuously without going through the specified connected function word About the negative example, you may store the number of the examples registered into the connection function word example database 41. FIG.

さらに各々の単語の組に対して、その間に所定の連結機能語が出現する確率を格納してもよい。   Furthermore, the probability that a predetermined connected function word appears between each pair of words may be stored.

負用例抽出手段66は、形態素解析手段62が解析結果として出力した形態素列の中から連結機能語用例データベース41に登録すべき負用例を抽出する。   The negative example extracting unit 66 extracts a negative example to be registered in the connected function word example database 41 from the morpheme string output as an analysis result by the morpheme analyzing unit 62.

具体的には、まず形態素解析手段62が解析結果として出力した形態素列の中から、対象句構成要素抽出手段63を用いて対象となる句の構成要素を抽出する(ステップ1410)。   Specifically, first, the constituent elements of the target phrase are extracted from the morpheme string output as the analysis result by the morpheme analyzing means 62 using the target phrase constituent element extracting means 63 (step 1410).

ここで2形態素以上の構成要素列が得られれば、その全てに対し次の処理を実行する。   Here, if two or more morpheme component strings are obtained, the following processing is executed for all of them.

まず、構成要素列の形態素の組み合わせを一つ取り出す(ステップ1411)。   First, one morpheme combination in the component row is extracted (step 1411).

2形態素の組み合わせが取り出せたら(ステップ1412)、その構成要素列の中で前方に出現した形態素cと後方に出現した形態素dを負用例として抽出し(ステップ1413)、用例調整手段67に渡す。   When the combination of two morphemes can be extracted (step 1412), the morpheme c that appears in the front and the morpheme d that appears in the rear are extracted as negative examples (step 1413) and passed to the example adjustment unit 67.

用例調整手段67は、負用例抽出手段66が負用例として抽出した形態素cと形態素dの組を連結機能語用例データベース41に登録し、既に登録済みである場合にはその用例の連結機能語表出フラグなどを調整する(ステップ1414)。   The example adjustment unit 67 registers the set of the morpheme c and the morpheme d extracted as the negative example by the negative example extraction unit 66 in the connected function word example database 41, and if already registered, the connected function word table of the example. The out flag and the like are adjusted (step 1414).

次に、本実施の形態の動作について、図面を参照して具体的に説明する。   Next, the operation of the present embodiment will be specifically described with reference to the drawings.

以下では、翻訳元の言語である原言語を英語とし、翻訳先の言語である目的言語を日本語とする例により説明するが、本実施の形態の機械翻訳装置が翻訳を行う言語はこれに限られるものではなく、任意の言語間の翻訳に対しても同様に適用可能である。   In the following description, the source language that is the source language is English and the target language that is the target language is Japanese, but the language that the machine translation device of the present embodiment translates is described here. The present invention is not limited, and can be similarly applied to translation between arbitrary languages.

また、以下では名詞句を処理対象の句とし、格助詞の「の」を所定の連結機能語とする例により説明するが、本実施の形態の機械翻訳装置が処理する処理対象の句及び連結機能語はこれに限られるものではなく、任意の句構造、連結機能語に対しても同様に適用可能である。   In the following description, the noun phrase is a processing target phrase and the case particle “no” is a predetermined connection function word. However, the processing target phrase and the connection processed by the machine translation device of the present embodiment will be described. The function word is not limited to this, and can be similarly applied to any phrase structure and connected function word.

本実施の形態の機械翻訳装置の、第2の実施の形態の機械翻訳装置と相違する点は、例データベース作成手段60aによる連結機能語用例データベース41を自動的に作成する処理であり、他の入力手段10、原言語解析手段20、言語変換手段30、目的言語生成手段40、出力手段50の動作は第2の実施の形態及び第1の実施の形態の動作で説明したものと同じである。このため、以下では用例データベース作成手段60aの動作について具体的に説明する。   The difference between the machine translation apparatus of the present embodiment and the machine translation apparatus of the second embodiment is the process of automatically creating the linked function word example database 41 by the example database creation means 60a. The operations of the input unit 10, the source language analysis unit 20, the language conversion unit 30, the target language generation unit 40, and the output unit 50 are the same as those described in the operations of the second embodiment and the first embodiment. . Therefore, the operation of the example database creation unit 60a will be specifically described below.

「野球選手を見た」という日本語文を、用例抽出の処理対象として説明する。   The Japanese sentence “I saw a baseball player” will be explained as an example extraction target.

まず、この処理対象の日本語文を、用例入力手段61に入力する。すると、形態素解析手段62は、入力された日本語文を形態素解析し形態素列に変換する。   First, the Japanese sentence to be processed is input to the example input means 61. Then, the morpheme analyzing means 62 analyzes the input Japanese sentence and converts it into a morpheme string.

図15は、本実施の形態の形態素解析手段による形態素解析の結果として得られた形態素列の一例を示す図である。   FIG. 15 is a diagram illustrating an example of a morpheme string obtained as a result of morpheme analysis by the morpheme analysis unit of the present embodiment.

図15の例では、各行に一つの形態素が示されており、各々には形態素の文字列(単語)とその品詞が示されている。   In the example of FIG. 15, one morpheme is shown in each line, and each of them shows a morpheme character string (word) and its part of speech.

形態素解析手段62で得られた形態素解析結果は、正用例抽出手段64に送られ、そこに含まれる正用例が抽出される。   The morpheme analysis result obtained by the morpheme analysis unit 62 is sent to the correct example extraction unit 64, and the correct example contained therein is extracted.

まず、第2の実施の形態と同様に、得られた形態素解析結果から所定の連結機能語を検索する。   First, as in the second embodiment, a predetermined connected function word is searched from the obtained morpheme analysis result.

しかし、ここでの「野球選手を見た」という日本文においては、格助詞の「の」を検索しても得られないため正用例は抽出されないが、検索結果が存在する場合においては第2の実施の形態の動作で説明したものと同様に正用例の抽出、登録の処理を行う。   However, in the Japanese sentence “I saw a baseball player” here, it cannot be obtained even by searching for the case particle “no”. In the same manner as described in the operation of the embodiment, the extraction and registration processing of the right-hand example is performed.

次に、形態素解析手段62で得られた形態素解析結果は、負用例抽出手段66に送られ、そこに含まれる負用例を抽出する。   Next, the result of morpheme analysis obtained by the morpheme analysis unit 62 is sent to the negative example extraction unit 66, and the negative example contained therein is extracted.

これはまず、対象句構成要素抽出手段63を起動して対象となる句の構成要素列を抽出する。対象句構成要素抽出手段63は、入力された形態素列から対象となる句の構成要素列を抽出するが、ここでは「野球/選手/を/見/た」という形態素列が入力されたと考える。   First, the target phrase component extraction means 63 is activated to extract a component string of the target phrase. The target phrase component extraction unit 63 extracts a target phrase component string from the input morpheme string. Here, it is considered that a morpheme string “baseball / player / watch / ta” has been input.

まず1番目の形態素「野球」の品詞を調べると、名詞であるため、この形態素は名詞句の構成要素であると判断する。   First, when the part of speech of the first morpheme “baseball” is examined, since it is a noun, it is determined that this morpheme is a constituent element of a noun phrase.

次に2番目の形態素「選手」の品詞を調べると、その品詞もやはり名詞であるため、この形態素も名詞句の構成要素であると判断する。   Next, when the part of speech of the second morpheme “player” is examined, since that part of speech is also a noun, it is determined that this morpheme is also a constituent element of the noun phrase.

さらに3番目の形態素「を」の品詞を調べると、格助詞であるため、この形態素は名詞句の構成要素に属さないと判断し直前の形態素までの形態素列を名詞句の構成要素列として抽出する。   Further, when the part of speech of the third morpheme “O” is examined, it is a case particle, so it is determined that this morpheme does not belong to a noun phrase component, and the morpheme string up to the previous morpheme is extracted as a noun phrase component string. To do.

以上により「野球/選手」が構成要素列として抽出され、負用例抽出手段66に送られる。   As described above, “baseball / player” is extracted as a component row and sent to the negative example extracting means 66.

負用例抽出手段66は、対象句構成要素抽出手段63で抽出された構成要素列に2つ以上の形態素が含まれているかどうかをチェックし、その内部の形態素の組み合わせを負用例として抽出する。   The negative example extracting unit 66 checks whether or not two or more morphemes are included in the constituent element sequence extracted by the target phrase constituent element extracting unit 63, and extracts a combination of the morphemes therein as a negative example.

ここでは「野球」「選手」という2つの形態素の組み合わせが負用例として抽出でき、これらを用例調整手段67に送る。   Here, a combination of two morphemes “baseball” and “player” can be extracted as negative examples, and these are sent to the example adjusting means 67.

用例調整手段67は、負用例抽出手段66が負用例として抽出した形態素の組を用いて、連結機能語データベース41内のデータを調整する。   The example adjustment unit 67 adjusts the data in the connected function word database 41 using the morpheme set extracted by the negative example extraction unit 66 as a negative example.

これはまず「野球」「選手」の形態素の組を登録するが、対象となる連結機能語データベース41として図16の例に示したものを考える。   First, a set of morphemes of “baseball” and “player” is registered, but the one shown in the example of FIG.

図16は、本実施の形態の連結機能語用例データベースに格納された用例データの一例を示す図である。   FIG. 16 is a diagram illustrating an example of example data stored in the connected function word example database according to the present embodiment.

図16を参照すると、ここには格助詞の「の」の係り元と係り先に出現しうる名詞の組が単語1と単語2のカラムに格納されている。   Referring to FIG. 16, a pair of nouns that can appear in the case particle “no” and the word noun are stored in the word 1 and word 2 columns.

さらに、各単語の組には、その間に格助詞の「の」を表出すべきかどうかを示す連結機能語表出フラグを格納している。   Further, each word group stores a connected function word expression flag indicating whether or not the case particle “no” should be expressed in between.

連結機能語表出フラグは、“1”で表出すべき、“0”で表出すべきでないということを表わしているものとする。   The connected function word expression flag indicates that it should be expressed by “1” and should not be expressed by “0”.

各々の単語の組には、それらの単語の間に所定の連結機能語を含む正用例の出現回数に関して、連結機能語用例データベース41に登録された正用例の出現回数を格納している。   Each word set stores the number of appearances of the correct example registered in the connected function word example database 41 with respect to the number of appearances of the correct example including a predetermined connected function word between the words.

例えば「野球」「選手」の組み合わせを参照すると、正用例である「野球の選手」として格助詞「の」を伴って出現した用例が8回登録されていることが分かる。   For example, referring to a combination of “baseball” and “player”, it can be seen that an example that appears with a case particle “no” is registered as a baseball player “no” eight times as a proper example.

またさらに各々の単語の組には、それらの単語の間が所定の連結機能語を介さずに名詞連続内に出現した負用例の出現回数に関しても同様に、連結機能語用例データベース41に登録された負用例の出現回数を格納している。   Furthermore, each word set is also registered in the connected function word example database 41 in the same manner with respect to the number of negative examples that appear in the noun series without a predetermined connected function word between them. The number of occurrences of negative examples is stored.

例えば「野球」「選手」の組み合わせを参照すると、負用例である「野球選手」として格助詞「の」を伴わずに名詞連続内に出現した用例が40回登録されていることが分かる。   For example, referring to the combination of “baseball” and “player”, it can be seen that an example that appears in the noun sequence without the case particle “no” is registered 40 times as a negative example “baseball player”.

また、ここで説明中の連結機能語データベース41に対する「野球」「選手」の形態素の組の登録処理においては、まず単語1が「野球」で単語2が「選手」である用例の負用例数を1つ増やして41にする処理を実行する。   In addition, in the registration process of the “baseball” and “player” morpheme pairs in the connected function word database 41 described here, first, the number of negative examples of the example in which the word 1 is “baseball” and the word 2 is “player”. Is incremented by 1 to 41.

さらに負用例数の増加に従って連結機能語表出フラグを更新する。この連結機能語表出フラグの更新処理は、例えばこの用例の登録処理によって“正用例数−負用例数”の値が所定の閾値(例えば“0回”)を下回った場合に連結機能語表出フラグを0にする等の処理を行う。   Further, the linked function word expression flag is updated as the number of negative examples increases. For example, when the value of “number of positive examples−number of negative examples” falls below a predetermined threshold value (for example, “0 times”), the update process of the connected function word expression flag is performed. Processing such as setting the output flag to 0 is performed.

また、本実施の形態の翻訳処理に関しては、ここで作成した連結機能語用例データベース41を用いて、第2の実施の形態及び第1の実施の形態の動作で説明したものと同じように行う。   Further, the translation processing of the present embodiment is performed in the same manner as described in the operations of the second embodiment and the first embodiment using the connected function word example database 41 created here. .

図17は、本発明の第3の実施の形態の機械翻訳装置の一実施例の構成を示すブロック図である。   FIG. 17 is a block diagram illustrating a configuration of an example of the machine translation apparatus according to the third embodiment of this invention.

図17を参照すると、本実施例は入出力機能及び情報処理機能等を備えるコンピュータ処理装置90において、本実施の形態の目的言語生成手段40や用例データベース作成手段60a等の各機能を備える機械翻訳プログラムを、メモリにロードすることで実現することができる。この機械翻訳プログラムは、磁気ディスク、磁気テープ、光ディスク、半導体メモリ又はその他のコンピュータ等によって読み取りが可能な記憶媒体100に格納される。そして、その記憶媒体100からコンピュータ処理装置90にロードされ、コンピュータ処理装置90の動作を制御することにより、上述した各機能を実現する。   Referring to FIG. 17, this embodiment is a computer translation apparatus 90 having input / output functions, information processing functions, and the like, and machine translation having each function such as target language generation means 40 and example database creation means 60a of the present embodiment. This can be realized by loading the program into the memory. The machine translation program is stored in a storage medium 100 that can be read by a magnetic disk, magnetic tape, optical disk, semiconductor memory, or other computer. Then, the above-described functions are realized by being loaded from the storage medium 100 to the computer processing device 90 and controlling the operation of the computer processing device 90.

つまり、この記憶媒体100に格納された機械翻訳プログラムは、記憶媒体100からコンピュータ処理装置90のメモリに読み込まれ、コンピュータ処理装置90の動作を制御することにより、コンピュータ処理装置90上に連結機能語用例記憶部941といった記憶部を実現すると共に、入力部91、原言語解析部92、言語変換部93、対象句同定部942、連結機能語挿入部943、目的言語文生成部944、用例入力部961、形態素解析部962、対象句構成要素抽出部963、正用例抽出部964、用例登録部965、負用例抽出部966、用例調整部967、出力部95といった各機能を実現するのである。   In other words, the machine translation program stored in the storage medium 100 is read from the storage medium 100 into the memory of the computer processing device 90, and the operation of the computer processing device 90 is controlled so that the connected function word is stored on the computer processing device 90. In addition to realizing a storage unit such as the example storage unit 941, the input unit 91, the source language analysis unit 92, the language conversion unit 93, the target phrase identification unit 942, the connected function word insertion unit 943, the target language sentence generation unit 944, and the example input unit 961, morphological analysis unit 962, target phrase component extraction unit 963, positive example extraction unit 964, example registration unit 965, negative example extraction unit 966, example adjustment unit 967, and output unit 95 are realized.

ここで、図13の実施例との関係では、入力部91が入力手段10に、原言語解析部92が原言語解析手段20に、言語変換部93が言語変換手段30に、目的言語生成部94内の各部が目的言語生成手段40内の各手段に、出力部95が出力手段50に、用例生成部96a内の各部が用例データベース作成手段60a内の各種段にそれぞれ対応する。   13, the input unit 91 is the input unit 10, the source language analysis unit 92 is the source language analysis unit 20, the language conversion unit 93 is the language conversion unit 30, and the target language generation unit. Each unit in 94 corresponds to each unit in the target language generation unit 40, the output unit 95 corresponds to the output unit 50, and each unit in the example generation unit 96a corresponds to various stages in the example database creation unit 60a.

本実施例は、コンピュータ処理装置90が機械翻訳プログラムの制御により動作する点に特徴があり、基本的な機能は図13や図14と同じである。   This embodiment is characterized in that the computer processing device 90 operates under the control of a machine translation program, and the basic functions are the same as those in FIGS. 13 and 14.

つまり、コンピュータ処理装置90は、機械翻訳プログラムの制御により以下の処理を実行する。   That is, the computer processing device 90 executes the following processing under the control of the machine translation program.

用例登録処理においては、まず入力部91への用例の入力によって、用例入力部961は、用例抽出の対象となる目的言語文字列の入力を受け付け、形態素解析部962を起動する。   In the example registration process, first, according to an example input to the input unit 91, the example input unit 961 receives an input of a target language character string that is a target of example extraction, and activates the morpheme analysis unit 962.

形態素解析部962は、用例入力部961から入力された目的言語文字列を形態素解析し、形態素列に分解した後、正用例抽出部964を起動する。   The morpheme analysis unit 962 performs morpheme analysis on the target language character string input from the example input unit 961, decomposes it into a morpheme sequence, and then activates the correct example extraction unit 964.

正用例抽出部964は、形態素解析部962が解析結果として出力した形態素列の中から連結機能語用例記憶部941に登録すべき正用例を抽出し、用例登録部965を起動する。   The correct example extracting unit 964 extracts a correct example to be registered in the connected function word example storage unit 941 from the morpheme sequence output as an analysis result by the morpheme analyzing unit 962, and starts the example registering unit 965.

正用例を抽出する際には、形態素解析部962が解析結果として出力した形態素列の中から所定の連結機能語を検索し、得られた連結機能語の直前の形態素と、直後の形態素列から対象句構成要素抽出部963によって抽出された対象となる句の構成要素列とを用いる。   When extracting the correct usage example, the morpheme analysis unit 962 searches for a predetermined connected function word from the morpheme string output as the analysis result, and from the morpheme immediately before and the morpheme string immediately after the obtained connected function word. The target phrase component extraction unit 963 uses the target phrase component string extracted by the target phrase.

用例登録部965は、正用例抽出部964が用例として抽出した2つの形態素の組を連結機能語用例記憶部941に登録する。   The example registration unit 965 registers the set of two morphemes extracted as examples by the correct example extraction unit 964 in the connected function word example storage unit 941.

負用例抽出部966は、形態素解析部962が解析結果として出力した形態素列の中から連結機能語用例記憶部941に登録すべき負用例を抽出し、用例調整部967を起動する。   The negative example extraction unit 966 extracts a negative example to be registered in the connected function word example storage unit 941 from the morpheme string output as the analysis result by the morpheme analysis unit 962, and starts the example adjustment unit 967.

負用例の抽出は、まず形態素解析部962が解析結果として出力した形態素列の中から対象句構成要素抽出部963によって構成要素列を抽出し、得られた構成要素列の中で形態素の組み合わせを取ることで行う。   In the extraction of the negative example, first, the target phrase constituent element extraction unit 963 extracts a constituent element string from the morpheme strings output as the analysis result by the morpheme analyzing unit 962, and the combination of the morphemes in the obtained constituent element string is obtained. Do by taking.

用例調整部967は、負用例抽出部966が用例として抽出した2つの形態素の組を連結機能語用例記憶部941に登録し、その用例の連結機能語フラグを調整する。   The example adjustment unit 967 registers the set of two morphemes extracted as an example by the negative example extraction unit 966 in the connection function word example storage unit 941 and adjusts the connection function word flag of the example.

さらに翻訳処理においては、用例作成部96で作成された連結機能語用例記憶部941を用いて、第1第2の実施の形態の実施例の動作で説明した処理を実行する。   Further, in the translation process, the process described in the operation of the example of the first and second embodiments is executed using the connected function word example storage unit 941 created by the example creation unit 96.

以上説明した本実施の形態の機械翻訳装置により、入力された目的言語の文章データから、文章句に連接機能語を含む正用例と含まない負用例の双方の検出回数等の情報を検出することにより、連接機能語の使用の適否の適切な判定ができ、またこの適切な判定による用例データ自動的に編集生成し、かつこの適切な判定に基づく翻訳を実行することができる。   By using the machine translation device of the present embodiment described above, information such as the number of detections of both a positive example including a concatenated function word in a sentence phrase and a negative example not included is detected from the input sentence data in the target language. Thus, it is possible to appropriately determine whether or not to use the concatenated function word, to automatically edit and generate example data based on this appropriate determination, and to execute translation based on this appropriate determination.

以上説明した各実施の形態においては、処理対象の句を名詞句とし、処理対象の連結機能語を格助詞「の」とした例により説明したが、これに限定されるものではなく、また処理対象の句の種類や処理対象の連結機能語の個数も一つに限定されるものではない。処理対象の句の種類や処理対象の連結機能語の個数を複数とする場合には、連結機能語用例データベース41に用例データを記録するテーブルを複数備え、それぞれに各種の句や連結機能語による用例データを記録する方式や、又連結機能語用例データベース41において用例データにこの句や連結機能語の種別の情報を合わせて記録する方式を用いることで、上述の各実施の形態において説明された1種類での場合と同様にして実施が可能である。   In each of the embodiments described above, the example in which the phrase to be processed is a noun phrase and the connected function word to be processed is the case particle “no” is described, but the present invention is not limited to this. The type of target phrase and the number of connected function words to be processed are not limited to one. When there are a plurality of types of phrases to be processed and the number of connected function words to be processed, a plurality of tables for recording example data are provided in the connected function word example database 41, each of which is based on various phrases and connected function words. As described in each of the above-described embodiments, a method for recording example data and a method for recording the phrase data and the type of the connected function word together with the example data in the connected function word example database 41 are used. It can be implemented in the same way as with one type.

以上説明した各実施の形態においては、用例データベースにおける用例データの記録方式として、文章句を連結機能語を挿入する位置から前部と後部に分けて記録する方式により説明しているがこれに限定されるものではない。他に、文章句全体のデータと連結機能語を挿入する位置のデータ(文章句の先頭から何文字目であるか等)により記録する方式も上記の各実施の形態と同様に実施できる。また、特に連結機能語の前方と後方の単語数を“1つ”とする例により説明しているが、前方と後方のいずれの単語数も“1つ”に限定されるものではなく、上記の各実施の形態において説明された方法により、任意の複数個の単語による文章句の用例データを用いる翻訳や用例データの自動登録を扱うことができる。   In each of the embodiments described above, as a recording method of the example data in the example database, a description has been given of a method in which a sentence phrase is recorded separately in the front part and the rear part from the position where the connected function word is inserted. Is not to be done. In addition, a method of recording the data based on the data of the entire text phrase and the data at the position where the connected function word is inserted (such as the number of characters from the beginning of the text phrase) can be implemented in the same manner as in each of the above embodiments. Moreover, although the example which makes the number of words of the front and back of a connection function word especially "1" is demonstrated, both the number of words of the front and back is not limited to "one". With the method described in each of the embodiments, it is possible to handle translation using example data of sentence phrases using arbitrary plural words and automatic registration of example data.

さらに、本発明の他の実施の形態として、以上説明してきた連結機能語を、翻訳元の文章中において直接該当する単語がない又は記載されない場合のある、補助的な意味や役割を示す単語の全般に適応し、前後の語句の間に挿入する単語に限定せず、英語の冠詞等の様に文章句の先頭に使用する単語や、また末尾に使用する単語をも対象とする形態が考えられる。つまり、用例データ中の連結機能語の前方の文又は後方の文のいずれか一方に単語を記録しない(単語数を“0個”とする)場合の用例データをも対象とする形態である。   Furthermore, as another embodiment of the present invention, the connected function words described above are words of a word indicating an auxiliary meaning or role that may not be directly described or described in the translation source sentence. Applicable in general, not limited to words that are inserted between the preceding and following words, but can be used for words used at the beginning of sentences and words used at the end, such as English articles. It is done. In other words, this example is also intended for example data when no word is recorded in either the sentence before or after the connected function word in the example data (the number of words is “0”).

第2、第3の実施の形態の用例データの自動登録処理においては、連結機能語の前後双方の(連結機能語の直前と直後の)単語をチェックしているが、これは例えば連結機能語の品詞が冠詞等の文章句の先頭に使用する単語である場合には、前方の単語をチェックする処理を省略する(ステップ905やステップ1405等を省略する)ことにより、第2、第3の実施の形態において説明された方法と同様にして用例データの自動登録処理が可能である。また、こうした連結機能語の前方又は後方の単語のない用例データによる翻訳処理についても、第1の実施の形態において説明された方法により翻訳できる。これにより名詞句の日英翻訳における冠詞の使用・不使用や“the”と“a”の選択等の処理を用例データを参照して実行することができる。   In the automatic registration processing of the example data of the second and third embodiments, the words before and after the connected function word (immediately before and after the connected function word) are checked. If the part of speech is a word used at the beginning of a sentence phrase such as an article, the process of checking the front word is omitted (steps 905 and 1405 are omitted), whereby the second and third The example data can be automatically registered in the same manner as described in the embodiment. In addition, the translation processing using the example data without the words preceding or following the connected function words can be translated by the method described in the first embodiment. As a result, processing such as use / nonuse of articles and selection of “the” and “a” in Japanese-English translation of noun phrases can be executed with reference to the example data.

以上好ましい実施の形態及び実施例をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び実施例に限定されるものではなく、その技術的思想の範囲内において様々に変形して実施することができる。   Although the present invention has been described with reference to the preferred embodiments and examples, the present invention is not necessarily limited to the above-described embodiments and examples, and various modifications can be made within the scope of the technical idea. Can be implemented.

本発明の第1の実施の形態の機械翻訳装置の構成を示すブロック図である。It is a block diagram which shows the structure of the machine translation apparatus of the 1st Embodiment of this invention. 本発明の第1の実施の形態の機械翻訳装置の翻訳処理を説明するためのフローチャートである。It is a flowchart for demonstrating the translation process of the machine translation apparatus of the 1st Embodiment of this invention. 本発明の第1の実施の形態の原言語解析手段による翻訳対象の英文の構文構造の解析結果の一例を示す図である。It is a figure which shows an example of the analysis result of the syntax structure of the English sentence of the translation object by the source language analysis means of the 1st Embodiment of this invention. 本発明の第1の実施の形態の言語変換手段による変換結果の日本文の構文構造の一例を示す図である。It is a figure which shows an example of the syntax structure of the Japanese sentence of the conversion result by the language conversion means of the 1st Embodiment of this invention. 本発明の第1の実施の形態の連結機能語用例データベースに格納された用例データの一例を示す図である。It is a figure which shows an example of the example data stored in the connection function word example database of the 1st Embodiment of this invention. 本発明の第1の実施の形態の連結機能語挿入処理の処理結果の一例を示す図である。It is a figure which shows an example of the process result of the connection function word insertion process of the 1st Embodiment of this invention. 本発明の第1の実施の形態の機械翻訳装置の一実施例の構成を示すブロック図である。It is a block diagram which shows the structure of one Example of the machine translation apparatus of the 1st Embodiment of this invention. 本発明の第2の実施の形態の機械翻訳装置の構造を示すブロック図である。It is a block diagram which shows the structure of the machine translation apparatus of the 2nd Embodiment of this invention. 本発明の第2の実施の形態の用例データベース作成手段の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the example database preparation means of the 2nd Embodiment of this invention. 本発明の第2の実施の形態の形態素解析手段による形態素解析の結果として得られた形態素列の一例を示す図である。It is a figure which shows an example of the morpheme row | line | column obtained as a result of the morpheme analysis by the morpheme analysis means of the 2nd Embodiment of this invention. 本発明の第2の実施の形態の連結機能語用例データベースに格納された用例データの一例を示す図である。It is a figure which shows an example of the example data stored in the connection function word example database of the 2nd Embodiment of this invention. 本発明の第2の実施の形態の機械翻訳装置の一実施例の構成を示すブロック図である。It is a block diagram which shows the structure of one Example of the machine translation apparatus of the 2nd Embodiment of this invention. 本発明の第3の実施の形態の機械翻訳装置の構成を示すブロック図である。It is a block diagram which shows the structure of the machine translation apparatus of the 3rd Embodiment of this invention. 本発明の第3の実施の形態の機械翻訳装置の翻訳処理を説明するためのフローチャートである。It is a flowchart for demonstrating the translation process of the machine translation apparatus of the 3rd Embodiment of this invention. 本発明の第3の実施の形態の形態素解析手段による形態素解析の結果として得られた形態素列の一例を示す図である。It is a figure which shows an example of the morpheme row | line | column obtained as a result of the morpheme analysis by the morpheme analysis means of the 3rd Embodiment of this invention. 本発明の第3の実施の形態の連結機能語用例データベースに格納された用例データの一例を示す図である。It is a figure which shows an example of the example data stored in the connection function word example database of the 3rd Embodiment of this invention. 本発明の第3の実施の形態の機械翻訳装置の一実施例の構成を示すブロック図である。It is a block diagram which shows the structure of one Example of the machine translation apparatus of the 3rd Embodiment of this invention.

符号の説明Explanation of symbols

10 入力手段
20 原言語解析手段
30 言語変換手段
40 目的言語生成手段
41 連結機能語用例データベース
42 対象句同定手段
43 連結機能語挿入手段
44 目的言語文生成手段
50 出力手段
60、60a 用例データベース作成手段
61 用例入力手段
62 形態素解析手段
63 対象句構成要素抽出手段
64 正用例抽出手段
65 用例登録手段
66 負用例抽出手段
67 用例調整手段
90 コンピュータ処理装置
91 入力部
92 原言語解析部
93 言語変換部
94 目的言語生成部
941 連結機能語用例記憶部
942 対象句同定部
943 連結機能語挿入部
944 目的言語文生成
95 出力部
96、96a 用例作成部
961 用例入力部
962 形態素解析部
963 対象句構成要素抽出部
964 正用例抽出部
965 用例登録部
966 負用例抽出部
967 用例調整部
100 記憶媒体
DESCRIPTION OF SYMBOLS 10 Input means 20 Source language analysis means 30 Language conversion means 40 Target language generation means 41 Concatenated function word example database 42 Target phrase identification means 43 Concatenated function word insertion means 44 Target language sentence generation means 50 Output means 60, 60a Example database creation means 61 Example input unit 62 Morphological analysis unit 63 Target phrase component extraction unit 64 Positive example extraction unit 65 Example registration unit 66 Negative example extraction unit 67 Example adjustment unit 90 Computer processor 91 Input unit 92 Source language analysis unit 93 Language conversion unit 94 Target language generation unit 941 Linked function word example storage unit 942 Target phrase identification unit 943 Linked function word insertion unit 944 Target language sentence generation 95 Output units 96, 96a Example creation unit 961 Example input unit 962 Morphological analysis unit 963 Target phrase component extraction 964 Positive example extraction unit 965 Example registration unit 966 Negative example extraction 967 Example adjustment unit 100 Storage medium

Claims (12)

翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳装置において、
目的言語の2単語が直接の係り受けの関係にある文章句の前記2単語と、
前記2単語の間に所定の連結機能語を含む用例である正用例の出現情報に基づいて事前に計算された前記2単語の間に前記所定の連結機能語を挿入することの適否に関する情報と、
を示す用例データを保持する用例データベースと、
目的言語の文章中における連結機能語の使用の適否を、前記用例データベースを参照して判断し、その結果として連結機能語を使用する際には、適用した用例を参照して前記文章中の対応する部分に連結機能語を設定し、連結機能語の使用について修正を施した文章を生成する目的言語生成手段とを備え、
前記目的言語生成手段は、
目的言語の文章の構造を解析して、文章中の前記文章句の部分を処理対象の句として検出する対象句同定手段と、
前記用例データベースに記録された前記用例データを参照し、前記処理対象の句に対し、係り元の単語に近接した位置に前記連結機能語を挿入する連結機能語挿入手段と、
前記連結機能語挿入手段の挿入処理と、前記対象句同定手段の解析結果に従い、目的言語の文章を生成する目的言語文生成手段と、
を備えることを特徴とする機械翻訳装置。
In a machine translation device that translates a source language sentence that is a source language into a target language that is a destination language,
The two words of the phrase in which the two words of the target language are in a direct dependency relationship;
Information relating to the suitability of inserting the predetermined connected function word between the two words calculated in advance based on the appearance information of the right example that is an example including the predetermined connected function word between the two words; ,
An example database that holds example data indicating
The appropriateness of the use of the connection function word in the sentence of the target language is determined with reference to the example database, and when using the connection function word as a result, the correspondence in the sentence is referred to with reference to the applied example. And a target language generating means for generating a sentence in which a connected function word is set in a portion to be used and the use of the connected function word is corrected,
The target language generation means includes
Analyzing the structure of the sentence in the target language and detecting the phrase part in the sentence as a phrase to be processed;
Linked function word insertion means for referring to the example data recorded in the example database and inserting the connected function word at a position close to the word of the origin with respect to the phrase to be processed;
In accordance with the insertion processing of the connected function word insertion means and the analysis result of the target phrase identification means, target language sentence generation means for generating a sentence in the target language,
A machine translation device comprising:
翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳装置において、
入力された翻訳対象の文章である原言語文を解析する原言語解析手段と、
前記原言語解析手段の解析に基づき、前記原言語文の各単語と文章構造を、翻訳先の言語である目的言語の単語と文章構造に変換したデータである変換データを生成する言語変換手段と、
目的言語の2単語が直接の係り受けの関係にある文章句の前記2単語と、
前記2単語の間に所定の連結機能語を含む用例である正用例の出現情報に基づいて事前に計算された前記2単語の間に前記所定の連結機能語を挿入することの適否に関する情報と、
を示す用例データを保持する用例データベースと、
前記変換データ中における連結機能語の使用の適否を、前記用例データベースを参照して判断し、その結果として連結機能語を使用する際には、適用した用例を参照して前記変換データ中の対応する部分に連結機能語を設定し、連結機能語の使用について修正を施して翻訳結果の文章である目的言語文を生成する目的言語生成手段とを備え、
前記目的言語生成手段は、
目的言語の文章の構造を解析して、文章中の前記文章句の部分を処理対象の句として検出する対象句同定手段と、
前記用例データベースに記録された前記用例データを参照し、前記処理対象の句に対し、係り元の単語に近接した位置に前記連結機能語を挿入する連結機能語挿入手段と、
前記連結機能語挿入手段の挿入処理と、前記対象句同定手段の解析結果に従い、目的言語の文章を生成する目的言語文生成手段と、
を備えることを特徴とする機械翻訳装置。
In a machine translation device that translates a source language sentence that is a source language into a target language that is a destination language,
A source language analysis means for analyzing a source language sentence that is a sentence to be translated;
Based on the analysis of the source language analysis means, a language conversion means for generating conversion data that is data obtained by converting each word and sentence structure of the source language sentence into a target language word and sentence structure as a translation destination language; ,
The two words of the phrase in which the two words of the target language are in a direct dependency relationship;
Information relating to the suitability of inserting the predetermined connected function word between the two words calculated in advance based on the appearance information of the right example that is an example including the predetermined connected function word between the two words; ,
An example database that holds example data indicating
Whether or not the connection function word is used in the converted data is determined by referring to the example database, and as a result, when using the connection function word, the correspondence in the conversion data is referred to by referring to the applied example. A target language generation means for setting a connection function word in a portion to be generated, correcting the use of the connection function word, and generating a target language sentence that is a translation result sentence;
The target language generation means includes
Analyzing the structure of the sentence in the target language and detecting the phrase part in the sentence as a phrase to be processed;
Linked function word insertion means for referring to the example data recorded in the example database and inserting the connected function word at a position close to the word of the origin with respect to the phrase to be processed;
In accordance with the insertion processing of the connected function word insertion means and the analysis result of the target phrase identification means, target language sentence generation means for generating a sentence in the target language,
A machine translation device comprising:
目的言語の文章データを入力として受け付け、前記文書データ中に出現する正用例や負用例を抽出し、抽出された正用例や負用例の前記文書データ中での出現情報に基づいて当該用例に含まれる2つの単語の間に所定の連結機能語を挿入することの適否に関する情報を計算することで前記用例データを作成し、前記用例データベースに登録する用例データベース作成手段
を備えることを特徴とする請求項1又は2に記載の機械翻訳装置。
Accepts sentence data in the target language as input, extracts positive examples and negative examples that appear in the document data, and includes them in the examples based on the appearance information in the document data of the extracted positive examples and negative examples It claims that between two words to create the example data by calculating information about the advisability of inserting a predetermined connecting function words, characterized in that it comprises the example database creation means for registering the example database Item 3. The machine translation device according to Item 1 or 2 .
前記文章句の一つが名詞句であること
を特徴とする請求項1乃至3のいずれか一つに記載の機械翻訳装置。
4. The machine translation apparatus according to claim 1, wherein one of the sentence phrases is a noun phrase.
前記目的言語を日本語とし、
前記所定の連結機能語の一つが、格助詞の「の」であること
を特徴とする請求項1乃至4のいずれか一つに記載の機械翻訳装置。
The target language is Japanese,
5. The machine translation apparatus according to claim 1, wherein one of the predetermined connected function words is a case particle “no”. 6.
翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳装置において、
目的言語の2単語が直接の係り受けの関係にある文章句の2単語と、
前記2単語の間に所定の連結機能語を挿入することの適否に関する情報と、
を示す用例データを保持する用例データベースと、
目的言語の文章データを入力として受け付け、前記2単語の間に所定の連結機能語を含む用例である正用例を抽出する正用例抽出手段と、
前記正用例抽出手段によって抽出された正用例の出現情報に基づいて前記2単語の間に前記所定の連結機能語を挿入することの適否に関する情報を計算し、前記正用例と共に用例データベースに格納する用例登録手段と、
目的言語の文章中における連結機能語の使用の適否を、前記用例データベースを参照して判断し、その結果として連結機能語を使用する際には、適用した用例を参照して前記文章中の対応する部分に連結機能語を設定し、連結機能語の使用について修正を施した文章を生成する目的言語生成手段と、
を備えることを特徴とする機械翻訳装置。
In a machine translation device that translates a source language sentence that is a source language into a target language that is a destination language,
Two words of a phrase in which the two words of the target language have a direct dependency relationship;
Information regarding the suitability of inserting a predetermined connected function word between the two words;
An example database that holds example data indicating
A correct example extracting means for accepting sentence data of a target language as an input and extracting a correct example that is an example including a predetermined connected function word between the two words;
Based on the appearance information of the correct example extracted by the correct example extracting means, information on the suitability of inserting the predetermined connected function word between the two words is calculated and stored in the example database together with the correct example. An example registration means;
The appropriateness of the use of the connection function word in the sentence of the target language is determined with reference to the example database, and when using the connection function word as a result, the correspondence in the sentence is referred to with reference to the applied example. A target language generating means for setting a connected function word in a portion to be generated and generating a sentence corrected for the use of the connected function word;
A machine translation device comprising:
翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳装置における機械翻訳方法において、
前記機械翻訳装置が、目的言語の2単語が直接の係り受けの関係にある文章句の前記2単語と、
前記2単語の間に所定の連結機能語を含む用例である正用例の出現情報に基づいて事前に計算された前記2単語の間に前記所定の連結機能語を挿入することの適否に関する情報と、
を示す用例データを保持した用例データベースと、目的言語生成手段とを備え、
前記目的言語生成手段が、目的言語の文章中における連結機能語の使用の適否を、前記用例データベースを参照して判断し、その結果として連結機能語を使用する際には、適用した用例を参照して前記文章中の対応する部分に連結機能語を設定し、連結機能語の使用について修正を施した文章を生成する目的言語生成ステップを含み、
前記目的言語生成手段が、対象句同定手段と連結機能語挿入手段と目的言語文生成手段とを備え、
前記目的言語生成ステップは、
前記対象句同定手段が、目的言語の文章の構造を解析して、文章中の前記文章句の部分を処理対象の句として検出する対象句同定ステップと、
前記連結機能語挿入手段が、前記用例データベースに記録された前記用例データを参照し、前記処理対象の句に対し、係り元の単語に近接した位置に前記連結機能語を挿入する連結機能語挿入ステップと、
前記目的言語文生成手段が、前記連結機能語挿入手段の挿入処理と、前記対象句同定手段の解析結果に従い、目的言語の文章を生成する目的言語文生成ステップと、
を含むことを特徴とする機械翻訳方法。
In a machine translation method in a machine translation device that translates a source language sentence that is a source language into a target language that is a destination language,
The machine translation device, wherein the two words of the sentence phrase in which the two words of the target language are in a direct dependency relationship;
Information relating to the suitability of inserting the predetermined connected function word between the two words calculated in advance based on the appearance information of the right example that is an example including the predetermined connected function word between the two words; ,
An example database that holds example data indicating, and target language generation means,
The target language generation means determines whether or not the connection function word is used in the target language sentence by referring to the example database, and when using the connection function word as a result, refer to the applied example. And setting a connected function word in a corresponding part in the sentence, including a target language generating step for generating a sentence corrected for the use of the connected function word,
The target language generation means comprises a target phrase identification means, a connected function word insertion means, and a target language sentence generation means,
The target language generation step includes:
The target phrase identifying means analyzes the structure of a sentence in a target language and detects a part of the sentence phrase in the sentence as a phrase to be processed,
The connected function word insertion means refers to the example data recorded in the example database and inserts the connected function word at a position close to the original word for the phrase to be processed. Steps,
The target language sentence generation means generates a target language sentence according to the insertion processing of the connected function word insertion means and the analysis result of the target phrase identification means; and
A machine translation method comprising:
翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳装置における機械翻訳方法において、
前記機械翻訳装置が、目的言語の2単語が直接の係り受けの関係にある文章句の前記2単語と、
前記2単語の間に所定の連結機能語を含む用例である正用例の出現情報に基づいて事前に計算された前記2単語の間に前記所定の連結機能語を挿入することの適否に関する情報と、
を示す用例データを保持する用例データベースと、
言語解析手段と言語変換手段と目的言語生成手段とを備え、
前記原言語解析手段が、入力された翻訳対象の文章である原言語文を解析する原言語解析ステップと、
前記言語変換手段が、前記原言語解析手段の解析に基づき、前記原言語文の各単語と文章構造を、翻訳先の言語である目的言語の単語と文章構造に変換したデータである変換データを生成する言語変換ステップと、
前記目的言語生成手段が、前記変換データ中における連結機能語の使用の適否を、前記用例データベースを参照して判断し、その結果として連結機能語を使用する際には、適用した用例を参照して前記変換データ中の対応する部分に連結機能語を設定し、連結機能語の使用について修正を施して翻訳結果の文章である目的言語文を生成する目的言語生成ステップとを含み、
前記目的言語生成手段が、対象句同定手段と連結機能語挿入手段と目的言語文生成手段とを備え、
前記目的言語生成ステップは、
前記対象句同定手段が、目的言語の文章の構造を解析して、文章中の前記文章句の部分を処理対象の句として検出する対象句同定ステップと、
前記連結機能語挿入手段が、前記用例データベースに記録された前記用例データを参照し、前記処理対象の句に対し、係り元の単語に近接した位置に前記連結機能語を挿入する連結機能語挿入ステップと、
前記目的言語文生成手段が、前記連結機能語挿入手段の挿入処理と、前記対象句同定手段の解析結果に従い、目的言語の文章を生成する目的言語文生成ステップと、
を含むことを特徴とする機械翻訳方法。
In a machine translation method in a machine translation device that translates a source language sentence that is a source language into a target language that is a destination language,
The machine translation device, wherein the two words of the sentence phrase in which the two words of the target language are in a direct dependency relationship;
Information relating to the suitability of inserting the predetermined connected function word between the two words calculated in advance based on the appearance information of the right example that is an example including the predetermined connected function word between the two words; ,
An example database that holds example data indicating
Language analysis means, language conversion means, and target language generation means,
The source language analysis means for analyzing a source language sentence that is an input sentence to be translated;
Based on the analysis of the source language analysis unit, the language conversion unit converts conversion data that is data obtained by converting each word and sentence structure of the source language sentence into a word and sentence structure of a target language that is a translation destination language. A language conversion step to generate,
The target language generation means determines whether or not the connection function word is used in the conversion data by referring to the example database, and when using the connection function word as a result, refer to the applied example. A target language generation step of setting a connected function word in a corresponding part in the converted data and correcting the use of the connected function word to generate a target language sentence that is a sentence of a translation result,
The target language generation means comprises a target phrase identification means, a connected function word insertion means, and a target language sentence generation means,
The target language generation step includes:
The target phrase identifying means analyzes the structure of a sentence in a target language and detects a part of the sentence phrase in the sentence as a phrase to be processed,
The connected function word insertion means refers to the example data recorded in the example database and inserts the connected function word at a position close to the original word for the phrase to be processed. Steps,
The target language sentence generation means generates a target language sentence according to the insertion processing of the connected function word insertion means and the analysis result of the target phrase identification means; and
A machine translation method comprising:
前記機械翻訳装置が、用例データベース作成手段を備え、
前記用例データベース作成手段が、目的言語の文章データを入力として受け付け、前記文書データ中に出現する正用例や負用例を抽出し、抽出された正用例や負用例の前記文書データ中での出現情報に基づいて当該用例に含まれる2つの単語の間に所定の連結機能語を挿入することの適否に関する情報を計算することで前記用例データを作成し、前記用例データベースに登録する用例データベース作成ステップ
を含むことを特徴とする請求項7又は8に記載の機械翻訳方法。
The machine translation device includes example database creation means,
The example database creation means accepts sentence data in a target language as input, extracts positive examples and negative examples that appear in the document data, and appearance information in the document data of the extracted positive examples and negative examples The example database creation step of creating the example data by calculating information on the suitability of inserting a predetermined connected function word between two words included in the example based on the example database and registering it in the example database The machine translation method according to claim 7, wherein the machine translation method is included.
翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳装置における機械翻訳プログラムを記録した記憶媒体において、
前記機械翻訳装置が、目的言語の2単語が直接の係り受けの関係にある文章句の前記2単語と、
前記2単語の間に所定の連結機能語を含む用例である正用例の出現情報に基づいて事前に計算された前記2単語の間に前記所定の連結機能語を挿入することの適否に関する情報と、
を示す用例データを保持した用例データベースと、目的言語生成手段とを備え、
前記目的言語生成手段が、目的言語の文章中における連結機能語の使用の適否を、前記用例データベースを参照して判断し、その結果として連結機能語を使用する際には、適用した用例を参照して前記文章中の対応する部分に連結機能語を設定し、連結機能語の使用について修正を施した文章を生成する目的言語生成ステップを含み、
前記目的言語生成手段が、対象句同定手段と連結機能語挿入手段と目的言語文生成手段とを備え、
前記目的言語生成ステップは、
前記対象句同定手段が、目的言語の文章の構造を解析して、文章中の前記文章句の部分を処理対象の句として検出する対象句同定ステップと、
前記連結機能語挿入手段が、前記用例データベースに記録された前記用例データを参照し、前記処理対象の句に対し、係り元の単語に近接した位置に前記連結機能語を挿入する連結機能語挿入ステップと、
前記目的言語文生成手段が、前記連結機能語挿入手段の挿入処理と、前記対象句同定手段の解析結果に従い、目的言語の文章を生成する目的言語文生成ステップと、
を含むことを特徴とする機械翻訳プログラムを記録した記憶媒体。
In a storage medium recording a machine translation program in a machine translation device that translates a source language sentence that is a source language into a target language that is a destination language,
The machine translation device, wherein the two words of the sentence phrase in which the two words of the target language are in a direct dependency relationship;
Information relating to the suitability of inserting the predetermined connected function word between the two words calculated in advance based on the appearance information of the right example that is an example including the predetermined connected function word between the two words; ,
An example database that holds example data indicating, and target language generation means,
The target language generation means determines whether or not the connection function word is used in the target language sentence by referring to the example database, and when using the connection function word as a result, refer to the applied example. And setting a connected function word in a corresponding part in the sentence, including a target language generating step for generating a sentence corrected for the use of the connected function word,
The target language generation means comprises a target phrase identification means, a connected function word insertion means, and a target language sentence generation means,
The target language generation step includes:
The target phrase identifying means analyzes the structure of a sentence in a target language and detects a part of the sentence phrase in the sentence as a phrase to be processed,
The connected function word insertion means refers to the example data recorded in the example database and inserts the connected function word at a position close to the original word for the phrase to be processed. Steps,
The target language sentence generation means generates a target language sentence according to the insertion processing of the connected function word insertion means and the analysis result of the target phrase identification means; and
A storage medium having a machine translation program recorded thereon.
翻訳元の言語である原言語の文章を、翻訳先の言語である目的言語に翻訳する機械翻訳装置における機械翻訳プログラムを記録した記憶媒体において、
前記機械翻訳装置が、目的言語の2単語が直接の係り受けの関係にある文章句の前記2単語と、
前記2単語の間に所定の連結機能語を含む用例である正用例の出現情報に基づいて事前に計算された前記2単語の間に前記所定の連結機能語を挿入することの適否に関する情報と、
を示す用例データを保持する用例データベースと、言語解析手段と言語変換手段と目的言語生成手段とを備え、
前記言語解析手段が、入力された翻訳対象の文章である原言語文を解析する原言語解析ステップと、
前記言語変換手段が、前記原言語解析手段の解析に基づき、前記原言語文の各単語と文章構造を、翻訳先の言語である目的言語の単語と文章構造に変換したデータである変換データを生成する言語変換ステップと、
前記目的言語生成手段が、前記変換データ中における連結機能語の使用の適否を、前記用例データベースを参照して判断し、その結果として連結機能語を使用する際には、適用した用例を参照して前記変換データ中の対応する部分に連結機能語を設定し、連結機能語の使用について修正を施して翻訳結果の文章である目的言語文を生成する目的言語生成ステップとを含み、
前記目的言語生成手段が、対象句同定手段と連結機能語挿入手段と目的言語文生成手段とを備え、
前記目的言語生成ステップは、
前記対象句同定手段が、目的言語の文章の構造を解析して、文章中の前記文章句の部分を処理対象の句として検出する対象句同定ステップと、
前記連結機能語挿入手段が、前記用例データベースに記録された前記用例データを参照し、前記処理対象の句に対し、係り元の単語に近接した位置に前記連結機能語を挿入する連結機能語挿入ステップと、
前記目的言語文生成手段が、前記連結機能語挿入手段の挿入処理と、前記対象句同定手段の解析結果に従い、目的言語の文章を生成する目的言語文生成ステップと、
を含むことを特徴とする機械翻訳プログラムを記録した記憶媒体。
In a storage medium recording a machine translation program in a machine translation device that translates a source language sentence that is a source language into a target language that is a destination language,
The machine translation device, wherein the two words of the sentence phrase in which the two words of the target language are in a direct dependency relationship;
Information relating to the suitability of inserting the predetermined connected function word between the two words calculated in advance based on the appearance information of the right example that is an example including the predetermined connected function word between the two words; ,
An example database for holding example data indicating, a language analysis unit, a language conversion unit, and a target language generation unit,
A source language analysis step in which the language analysis means analyzes a source language sentence that is an input sentence to be translated;
Based on the analysis of the source language analysis unit, the language conversion unit converts conversion data that is data obtained by converting each word and sentence structure of the source language sentence into a word and sentence structure of a target language that is a translation destination language. A language conversion step to generate,
The target language generation means determines whether or not the connection function word is used in the conversion data by referring to the example database, and when using the connection function word as a result, refer to the applied example. A target language generation step of setting a connected function word in a corresponding part in the converted data and correcting the use of the connected function word to generate a target language sentence that is a sentence of a translation result,
The target language generation means comprises a target phrase identification means, a connected function word insertion means, and a target language sentence generation means,
The target language generation step includes:
The target phrase identifying means analyzes the structure of a sentence in a target language and detects a part of the sentence phrase in the sentence as a phrase to be processed,
The connected function word insertion means refers to the example data recorded in the example database and inserts the connected function word at a position close to the original word for the phrase to be processed. Steps,
The target language sentence generation means generates a target language sentence according to the insertion processing of the connected function word insertion means and the analysis result of the target phrase identification means; and
A storage medium having a machine translation program recorded thereon.
前記機械翻訳装置が、用例データベース作成手段を備え、
前記用例データベース作成手段が、目的言語の文章データを入力として受け付け、前記文書データ中に出現する正用例や負用例を抽出し、抽出された正用例や負用例の前記文書データ中での出現情報に基づいて当該用例に含まれる2つの単語の間に所定の連結機能語を挿入することの適否に関する情報を計算することで前記用例データを作成し、前記用例データベースに登録する用例データベース作成ステップ
を含むことを特徴とする機械翻訳プログラムを記録した請求項10又は11に記載の記憶媒体。
The machine translation device includes example database creation means,
The example database creation means accepts text data in a target language as input, extracts positive examples and negative examples that appear in the document data, and appearance information in the document data of the extracted positive examples and negative examples The example database creation step of creating the example data by calculating information on the suitability of inserting a predetermined connected function word between two words included in the example based on the example database and registering it in the example database The storage medium according to claim 10 or 11 , wherein a machine translation program recorded therein is recorded.
JP2007035937A 2007-02-16 2007-02-16 Machine translation device, translation method thereof, and storage medium recording the machine translation program Expired - Fee Related JP4488010B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007035937A JP4488010B2 (en) 2007-02-16 2007-02-16 Machine translation device, translation method thereof, and storage medium recording the machine translation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007035937A JP4488010B2 (en) 2007-02-16 2007-02-16 Machine translation device, translation method thereof, and storage medium recording the machine translation program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000009310A Division JP3947859B2 (en) 2000-01-18 2000-01-18 Machine translation apparatus, translation method thereof, and storage medium recording the machine translation program

Publications (2)

Publication Number Publication Date
JP2007157175A JP2007157175A (en) 2007-06-21
JP4488010B2 true JP4488010B2 (en) 2010-06-23

Family

ID=38241365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007035937A Expired - Fee Related JP4488010B2 (en) 2007-02-16 2007-02-16 Machine translation device, translation method thereof, and storage medium recording the machine translation program

Country Status (1)

Country Link
JP (1) JP4488010B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335343A (en) 2014-07-25 2016-02-17 北京三星通信技术研究有限公司 Text editing method and apparatus

Also Published As

Publication number Publication date
JP2007157175A (en) 2007-06-21

Similar Documents

Publication Publication Date Title
JP3220560B2 (en) Machine translation equipment
JP3973549B2 (en) Bilingual dependency structure associating apparatus, method and program, and recording medium recording parallel translation dependency structure associating program
CN1608259B (en) Machine translation
US6920419B2 (en) Apparatus and method for adding information to a machine translation dictionary
US20050137853A1 (en) Machine translation
JPH02308370A (en) Machine translation system
US20110040553A1 (en) Natural language processing
KR20120021933A (en) Statistical machine translation method using dependency forest
KR20090061158A (en) Method and apparatus for correcting of translation error by using error-correction pattern in a translation system
US6385569B1 (en) Translator, translating method and recording medium having translating program recorded thereon
Stepanov et al. Language style and domain adaptation for cross-language SLU porting
JP4488010B2 (en) Machine translation device, translation method thereof, and storage medium recording the machine translation program
Li et al. Chinese spelling check based on neural machine translation
JP3947859B2 (en) Machine translation apparatus, translation method thereof, and storage medium recording the machine translation program
JP4007413B2 (en) Natural language processing system, natural language processing method, and computer program
Rosen Building and Using Corpora of Non-Native Czech.
JP3876014B2 (en) Machine translation device
WO2009144890A1 (en) Pre-translation rephrasing rule generating system
JP3236027B2 (en) Machine translation equipment
JP3972697B2 (en) Natural language processing system, natural language processing method, and computer program
Chen et al. Chinese Spelling Check based on Neural Machine Translation
CN114064907A (en) Corpus generation method, apparatus, system, device and readable storage medium
Armstrong Using EMBT to produce foreign language subtitles
JP2004158038A (en) Language processing system and program
JPH08278973A (en) Parallel phrase analyzing device and learning data generating device

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080401

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081028

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081226

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20090511

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091217

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100309

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100322

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130409

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140409

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees