JP2000250913A - Example type natural language translation method, production method and device for list of bilingual examples and recording medium recording program of the production method and device - Google Patents

Example type natural language translation method, production method and device for list of bilingual examples and recording medium recording program of the production method and device

Info

Publication number
JP2000250913A
JP2000250913A JP11049129A JP4912999A JP2000250913A JP 2000250913 A JP2000250913 A JP 2000250913A JP 11049129 A JP11049129 A JP 11049129A JP 4912999 A JP4912999 A JP 4912999A JP 2000250913 A JP2000250913 A JP 2000250913A
Authority
JP
Japan
Prior art keywords
sentence
bilingual
natural language
pair
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11049129A
Other languages
Japanese (ja)
Inventor
Takayuki Adachi
貴行 足立
Kura Furuse
蔵 古瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11049129A priority Critical patent/JP2000250913A/en
Publication of JP2000250913A publication Critical patent/JP2000250913A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To perform the translation by means of a proper list of bilingual examples corresponding to the sentences which are produced by eliminating the pairs of sentences having the low sentence correspondence accuracy out of a sentence correspondence text. SOLUTION: A sentence correspondence text storing the bilingual pairs of sentences of the 1st and 2nd natural languages is inputted (S1), and a list of bilingual examples with which a sentence of the 2nd natural language is equal to the proper translation of a sentence of the 1st natural language is produced from the sentence correspondence text (S2). Then a sentence similar to an input sentence of the 1st natural language is retrieved from the list of the bilingual examples (S3), and the difference is decided between the input sentence and its similar sentence (S4). According to this difference information, a sentence of the 2nd natural language corresponding to the similar sentence is mechanically processed (S5). Then a translation of the input sentence is outputted (S6).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、既に存在する第1
自然言語の文と第2自然言語の文の関係を模倣して、第
1自然言語の入力文に対する第2自然言語の文を自動的
に翻訳する実例型自然言語翻訳方法、対訳用例集作成方
法および装置とそのプログラムを記録した記録媒体に関
する。
TECHNICAL FIELD The present invention relates to the first existing device.
Example natural language translation method for automatically translating a second natural language sentence for an input sentence of a first natural language by imitating the relationship between a sentence of a natural language and a sentence of a second natural language, and a method of creating a bilingual example book Further, the present invention relates to an apparatus and a recording medium on which the program is recorded.

【0002】[0002]

【従来の技術】従来準備した文対応テキストから、第1
自然言語の入力文に類似した第1自然言語の文と第2自
然言語文の対訳対を検索し、前記検索された対の第1自
然言語の文中の異なる部分に対応する第2自然言語の文
中の部分を調べ、対応する部分を基に第2自然言語の文
を加工して入力文の訳を生成する実例型自然言語翻訳装
置が開発されてきた。
2. Description of the Related Art First, a sentence correspondence text is prepared from
A bilingual pair of a first natural language sentence and a second natural language sentence similar to the input sentence of the natural language is searched, and a second natural language corresponding to a different part in the first natural language sentence of the searched pair is searched. An example-type natural language translator has been developed which examines a part in a sentence, processes a sentence in a second natural language based on the corresponding part, and generates a translation of the input sentence.

【0003】このような従来の実例型自然言語翻訳装置
で様々な入力文を翻訳するには、様々な入力文に類似し
た文を持つ対訳対が検索されなければならないので、事
前に文対応テキストに第1自然言語の文と第2自然言語
の文の対訳対を大量に準備する必要がある。そこで、文
対応の付いていない第1自然言語のテキストと第2自然
言語のテキストから文対応テキストを作成するために人
手や機械によって文対応付けが行われてきた。
In order to translate various input sentences with such a conventional example-type natural language translation device, a translation pair having a sentence similar to the various input sentences must be searched. First, it is necessary to prepare a large number of translation pairs of the first natural language sentence and the second natural language sentence. Therefore, in order to create a sentence-corresponding text from a text in a first natural language and a text in a second natural language without a sentence correspondence, sentence correspondence has been performed manually or by a machine.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、実際に
利用されているテキストを用いて文対応付けを行った場
合、文対応が誤って付けられた対や一方の自然言語で部
分的な情報の欠如や付加が存在する対が文対応テキスト
に含まれるので、文対応テキストをそのまま実例型自然
言語翻訳装置で利用しても入力文に類似する文の対が不
適切なものは訳文が低品質になるという問題が起こる。
また、人手で文対応付けを行った場合、人的コストや時
間がかかるという問題がある。
However, when sentence matching is performed using texts that are actually used, there is a lack of partial information in a pair or a natural language in which sentence correspondence is incorrectly attached. Sentence corresponding text is included in the sentence corresponding text, so if the sentence corresponding text is used as it is in the example-type natural language translator, if the sentence Problem arises.
In addition, there is a problem in that when manually associating sentences, human cost and time are required.

【0005】本発明は、上記に鑑みてなされたもので、
その目的とするところは、文対応テキスト中から文対応
精度の低い対を除去して作成される文対応の適切な対訳
用例集を用いて翻訳を行う実例型自然言語翻訳方法、対
訳用例集作成方法および装置とそのプログラムを記録し
た記録媒体を提供することにある。
[0005] The present invention has been made in view of the above,
The purpose is to create an example-type natural language translation method that translates using an appropriate sentence-corresponding bilingual example set created by removing pairs with low sentence-correspondence accuracy from the sentence-corresponding text, and a bilingual example set. It is an object of the present invention to provide a method and apparatus and a recording medium on which the program is recorded.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の本発明は、第1自然言語の文と第2
自然言語の文の対である対訳対を納めた文対応テキスト
から、第2自然言語の文が第1自然言語の文の適切な訳
文となる対訳対の集合である対訳用例集を作成し、翻訳
しようとする第1自然言語の入力文に対する類似文を前
記対訳用例集から検索し、前記入力文と類似文との差分
を抽出し、この差分情報を用いて前記類似文に対応する
第2自然言語の文を機械的に加工して前記入力文の訳文
を生成することを要旨とする。
In order to achieve the above object, the present invention according to claim 1 comprises a first natural language sentence and a second natural language sentence.
From the sentence-corresponding text in which the bilingual pair, which is a pair of natural language sentences, is inserted, a bilingual example set, which is a set of bilingual pairs in which the second natural language sentence is an appropriate translation of the first natural language sentence, is created. A similar sentence to the input sentence of the first natural language to be translated is searched from the bilingual example collection, a difference between the input sentence and the similar sentence is extracted, and a second corresponding to the similar sentence is extracted using the difference information. The gist is to mechanically process a sentence in a natural language to generate a translated sentence of the input sentence.

【0007】請求項1記載の本発明にあっては、第1自
然言語の文と第2自然言語の文の対訳対を納めた文対応
テキストから第2自然言語の文が第1自然言語の文の適
切な訳文となる対訳用例集を作成し、第1自然言語の入
力文に対する類似文を対訳用例集から検索し、入力文と
類似文との差分を抽出し、差分情報を用いて類似文に対
応する第2自然言語の文を機械的に加工して入力文の訳
文を生成するため、適切な対訳対に絞り込んだ対訳用例
集を作成でき、この対訳用例集を利用し、文対応が適切
な対訳対を模倣して訳文を生成することができる。
According to the first aspect of the present invention, a sentence of a second natural language is converted from a sentence of a first natural language from a sentence corresponding text containing a bilingual pair of a sentence of a first natural language and a sentence of a second natural language. Creates a bilingual example collection that is an appropriate translation of the sentence, searches the bilingual example collection for a similar sentence to the input sentence of the first natural language, extracts the difference between the input sentence and the similar sentence, and uses the difference information to perform similarity. Since the translation of the input sentence is generated by mechanically processing the second natural language sentence corresponding to the sentence, it is possible to create a bilingual example collection narrowed down to an appropriate bilingual pair. Can generate a translation by imitating an appropriate translation pair.

【0008】また、請求項2記載の本発明は、請求項1
記載の発明において、前記対訳用例集が、複数の異なる
方法で抽出した、第2自然言語の文が第1自然言語の文
の適切な訳文となる対訳対を組み合わせて作成されるこ
とを要旨とする。
[0008] The present invention according to claim 2 is based on claim 1.
In the described invention, the gist is that the bilingual example collection is created by combining a bilingual pair, which is extracted by a plurality of different methods, and in which the second natural language sentence is an appropriate translation of the first natural language sentence. I do.

【0009】請求項2記載の本発明にあっては、対訳用
例集は複数の異なる方法で抽出した、第2自然言語の文
が第1自然言語の文の適切な訳文となる対訳対を組み合
わせて作成される。
According to the second aspect of the present invention, the bilingual example set is extracted by a plurality of different methods, and is combined with a bilingual pair in which the sentence of the second natural language is an appropriate translation of the sentence of the first natural language. Created.

【0010】更に、請求項3記載の本発明は、請求項2
記載の発明において、前記複数の異なる方法の一方法と
して、文対応テキストに頻出する良く類似した対訳対を
定型的な対訳対として抽出することを要旨とする。
Further, the present invention according to claim 3 provides the present invention as claimed in claim 2.
In the invention described above, one of the plurality of different methods is to extract a bilingual pair that is often similar to a sentence-corresponding text as a fixed bilingual pair.

【0011】請求項3記載の本発明にあっては、複数の
異なる方法の一方法として、文対応テキストに頻出する
良く類似した対訳対を定型的な対訳対として抽出する。
According to the third aspect of the present invention, as one of a plurality of different methods, a bilingual pair that is frequently similar to a text corresponding to a sentence is extracted as a fixed bilingual pair.

【0012】請求項4記載の本発明は、請求項2記載の
発明において、前記複数の異なる方法の一方法として、
第1自然言語の文と第2自然言語の文の間で語句の対応
を調べ、文全体で語句対応が取れている対訳対を抽出す
ることを要旨とする。
According to a fourth aspect of the present invention, in the second aspect, as one of the plurality of different methods,
The gist of the present invention is to check the correspondence between words and phrases between a sentence in the first natural language and a sentence in the second natural language, and to extract a translation pair that has word / phrase correspondence in the entire sentence.

【0013】請求項4記載の本発明にあっては、複数の
異なる方法の一方法として、第1自然言語の文と第2自
然言語の文の間で語句の対応を調べ、文全体で語句対応
が取れている対訳対を抽出する。
According to the present invention, as one of a plurality of different methods, the correspondence between phrases in a sentence in a first natural language and a sentence in a second natural language is checked, and the phrase in the entire sentence is examined. Extract the corresponding translation pairs.

【0014】また、請求項5記載の本発明は、請求項1
記載の発明において、前記文対応テキストが、文対応の
付いていない第1自然言語のテキストと第2自然言語の
テキストから人手および機械によって文対応付けされた
対で構成することを要旨とする。
Further, the present invention described in claim 5 is based on claim 1.
In the invention described above, the gist of the invention is that the sentence-corresponding text is composed of a pair of a text in a first natural language and a text in a second natural language without a sentence correspondence, the sentence being correlated by hand and machine.

【0015】請求項5記載の本発明にあっては、文対応
テキストは文対応の付いていない第1自然言語のテキス
トと第2自然言語のテキストから人手および機械によっ
て文対応付けされた対で構成する。
According to the present invention, the sentence-corresponding text is a pair in which a sentence is manually and manually matched from a text of a first natural language and a text of a second natural language, each of which has no sentence correspondence. Constitute.

【0016】更に、請求項6記載の本発明は、第1自然
言語の文と第2自然言語の文の対である対訳対を納めた
文対応テキストから、第2自然言語の文が第1自然言語
の文の適切な訳文となる対訳対に絞り込んで、対訳用例
集を作成することを要旨とする。
Further, according to the present invention, the second natural language sentence is converted into the first natural language sentence from the sentence corresponding text in which a translation pair which is a pair of the first natural language sentence and the second natural language sentence is stored. The gist is to narrow down to bilingual pairs that are appropriate translations of natural language sentences and to create bilingual translation examples.

【0017】請求項6記載の本発明にあっては、第1自
然言語の文と第2自然言語の文の対である対訳対を納め
た文対応テキストから、第2自然言語の文が第1自然言
語の文の適切な訳文となる対訳対に絞り込んで対訳用例
集を作成する。
According to the sixth aspect of the present invention, a sentence in a second natural language is converted from a sentence corresponding text in which a translation pair which is a pair of a sentence in a first natural language and a sentence in a second natural language is stored. (1) A bilingual example book is created by narrowing down to a bilingual pair that is an appropriate translation of a sentence in natural language.

【0018】請求項7記載の本発明は、請求項6記載の
発明において、前記対訳用例集が、複数の異なる方法で
抽出した、第2自然言語の文が第1自然言語の文の適切
な訳文となる対訳対を組み合わせて作成されることを要
旨とする。
According to a seventh aspect of the present invention, in the invention according to the sixth aspect, the bilingual example collection is extracted by a plurality of different methods, and the second natural language sentence is an appropriate one of the first natural language sentence. The gist is that it is created by combining the translation pairs to be translated.

【0019】請求項7記載の本発明にあっては、対訳用
例集は複数の異なる方法で抽出した、第2自然言語の文
が第1自然言語の文の適切な訳文となる対訳対を組み合
わせて作成される。
According to the present invention, a bilingual example set is extracted by a plurality of different methods, and a bilingual pair in which a sentence of the second natural language is an appropriate translation of a sentence of the first natural language is combined. Created.

【0020】また、請求項8記載の本発明は、請求項7
記載の発明において、前記複数の異なる方法の一方法と
して、文対応テキストに頻出する良く類似した対訳対を
定型的な対訳対として抽出することを要旨とする。
The present invention according to claim 8 provides the present invention according to claim 7.
In the invention described above, one of the plurality of different methods is to extract a bilingual pair that is often similar to a sentence-corresponding text as a fixed bilingual pair.

【0021】請求項8記載の本発明にあっては、複数の
異なる方法の一方法として文対応テキストに頻出する良
く類似した対訳対を定型的な対訳対として抽出する。
According to the present invention, as one of a plurality of different methods, a well-known bilingual pair frequently appearing in a sentence-corresponding text is extracted as a standard bilingual pair.

【0022】更に、請求項9記載の本発明は、請求項7
記載の発明において、前記複数の異なる方法の一方法と
して、第1自然言語の文と第2自然言語の文の間で語句
の対応を調べ、文全体で語句対応が取れている対訳対を
抽出することを要旨とする。
Further, the present invention described in claim 9 provides the present invention in claim 7.
In the invention described above, as one of the plurality of different methods, a correspondence between words and phrases between a sentence in a first natural language and a sentence in a second natural language is checked, and a translation pair having a word / phrase correspondence in the entire sentence is extracted. The point is to do.

【0023】請求項9記載の本発明にあっては、複数の
異なる方法の一方法として第1自然言語の文と第2自然
言語の文の間で語句の対応を調べ、文全体で語句対応が
取れている対訳対を抽出する。
According to the ninth aspect of the present invention, as one of a plurality of different methods, the correspondence between phrases in the first natural language sentence and the second natural language sentence is checked, and the phrase correspondence is determined in the entire sentence. Extract the bilingual pair that has been removed.

【0024】請求項10記載の本発明は、請求項6記載
の発明において、前記文対応テキストが、文対応の付い
ていない第1自然言語のテキストと第2自然言語のテキ
ストから人手および機械によって文対応付けされた対で
構成することを要旨とする。
According to a tenth aspect of the present invention, in the invention according to the sixth aspect, the sentence-corresponding text is manually or manually converted from a first natural language text and a second natural language text having no sentence correspondence. The gist of the present invention is to form a sentence-matched pair.

【0025】請求項10記載の本発明にあっては、文対
応テキストは文対応の付いていない第1自然言語のテキ
ストと第2自然言語のテキストから人手および機械によ
って文対応付けされた対で構成する。
According to the tenth aspect of the present invention, the sentence-corresponding text is a pair in which a sentence is manually and manually matched from a text in a first natural language and a text in a second natural language without a sentence correspondence. Constitute.

【0026】また、請求項11記載の本発明は、第1自
然言語の文と第2自然言語の文の対を納めた文対応テキ
ストを読み込む文対応テキスト入力手段と、前記文対応
テキストから第2自然言語の文が第1自然言語の文の適
切な訳文となる対で絞り込んで対訳用例集を作成する対
訳対絞り込み手段と、翻訳しようとする第1自然言語の
文を入力する入力文入力手段と、この入力文に対する類
似文を前記対訳用例集から検索する類似文検索手段と、
前記入力文と類似文で差分を取り、第1自然言語と第2
自然言語の語句の対応が記載された対訳辞書を用いて類
似文の差分部分と対応する第2自然言語文の部分の語句
対応を取り、入力文の差分部分に対応する第2自然言語
の訳を得る差分対応手段と、差分情報を用いて前記類似
文に対応する第2自然言語の文を機械的に加工して前記
入力文の訳文を生成する加工手段と前記入力文の訳文を
作成する訳文出力手段とを有することを要旨とする。
The present invention according to claim 11 is a sentence-corresponding text input means for reading a sentence-corresponding text containing a pair of a sentence of a first natural language and a sentence of a second natural language; A bilingual pair narrowing-down unit for narrowing down a pair of natural language sentences to be an appropriate translation of the first natural language sentence to create a bilingual example book, and an input sentence inputting a first natural language sentence to be translated Means, a similar sentence search means for searching for a similar sentence to the input sentence from the bilingual example collection,
The difference between the input sentence and the similar sentence is taken, and the first natural language and the second
Using a bilingual dictionary in which the correspondence between natural language terms is described, a phrase correspondence between the difference part of the similar sentence and the second natural language sentence corresponding to the difference part of the input sentence is obtained. And a processing unit for mechanically processing a sentence of the second natural language corresponding to the similar sentence using the difference information to generate a translated sentence of the input sentence, and creating a translated sentence of the input sentence. The gist of the present invention is to have a translation output means.

【0027】請求項11記載の本発明にあっては、第1
自然言語の文と第2自然言語の文の対を納めた文対応テ
キストを読み込み、この文対応テキストから第2自然言
語の文が第1自然言語の文の適切な訳文となる対で絞り
込んで対訳用例集を作成し、第1自然言語の入力文に対
する類似文を対訳用例集から検索し、入力文と類似文で
差分を取り、対訳辞書を用いて類似文の差分部分と対応
する第2自然言語文の部分の語句対応を取り、入力文の
差分部分に対応する第2自然言語の訳を得、差分情報を
用いて類似文に対応する第2自然言語の文を機械的に加
工して入力文の訳文を生成するため、適切な対訳対に絞
り込んだ対訳用例集を作成でき、この対訳用例集を利用
し、文対応が適切な対訳対を模倣して訳文を生成するこ
とができる。
According to the present invention described in claim 11, the first aspect
A sentence-corresponding text containing a pair of a sentence of a natural language and a sentence of a second natural language is read, and from this sentence-corresponding text, the sentence of the second natural language is narrowed down to a pair that is an appropriate translation of the sentence of the first natural language. A bilingual example set is created, a similar sentence to the input sentence of the first natural language is searched from the bilingual example set, a difference between the input sentence and the similar sentence is obtained, and a second part corresponding to the difference part of the similar sentence is obtained using the bilingual dictionary. A phrase of a part of a natural language sentence is obtained, a translation of a second natural language corresponding to a difference part of the input sentence is obtained, and a sentence of the second natural language corresponding to a similar sentence is mechanically processed using the difference information. In order to generate a translation of the input sentence, it is possible to create a bilingual example set narrowed down to an appropriate bilingual pair, and to use this bilingual example set to generate a translation by imitating a bilingual pair with an appropriate sentence correspondence .

【0028】更に、請求項12記載の本発明は、請求項
11記載の発明において、前記対訳対絞り込み手段が、
前記文対応テキストから複数の異なる適切な対訳対を抽
出する適切対訳対抽出手段と、該適切対訳対抽出手段で
抽出された対訳対を組合せ条件表と組合せ条件識別子を
用いて組み合わせて対訳用例集を作成する対訳用例集作
成手段とを有することを要旨とする。
Further, according to a twelfth aspect of the present invention, in accordance with the eleventh aspect of the present invention, the parallel translation narrowing means includes:
An appropriate bilingual pair extracting means for extracting a plurality of different appropriate bilingual pairs from the sentence-corresponding text; and a bilingual example set by combining the bilingual pairs extracted by the appropriate bilingual pair extracting means using a combination condition table and a combination condition identifier. And a means for creating a bilingual example book.

【0029】請求項12記載の本発明にあっては、対訳
対絞り込み手段では文対応テキストから複数の異なる適
切な対訳対を抽出し、この抽出した対訳対を組合せ条件
表と組合せ条件識別子を用いて組み合わせて対訳用例集
を作成する。
According to the twelfth aspect of the present invention, the translation pair narrowing means extracts a plurality of different suitable translation pairs from the text corresponding to the sentence and uses the extracted translation pairs by using a combination condition table and a combination condition identifier. To create a bilingual example book.

【0030】請求項13記載の本発明は、請求項12記
載の発明において、前記適切対訳対抽出手段が、前記文
対応テキストから語句の言語情報を取得するために形態
素解析を行う形態素解析手段と、この形態素解析済みの
文対応テキストから定型な対訳対を抽出する定型対訳抽
出手段と、前記形態素解析済みの文対応テキストから文
全体で語句対応の取れた対訳対を抽出する語句対応抽出
手段とを有することを要旨とする。
According to a thirteenth aspect of the present invention, in the twelfth aspect of the present invention, the appropriate bilingual pair extraction means performs a morphological analysis to acquire linguistic information of a phrase from the sentence correspondence text. A fixed bilingual translation extracting means for extracting a fixed bilingual pair from the morphologically analyzed sentence-corresponding text; and a phrase correspondence extracting means for extracting a bilingual pair in which the entire sentence has been matched from the morphologically analyzed sentence-corresponding text. The gist is to have.

【0031】請求項13記載の本発明にあっては、適切
対訳対抽出手段は文対応テキストから語句の言語情報を
取得するために形態素解析を行い、この形態素解析済み
の文対応テキストから定型な対訳対を抽出するととも
に、また形態素解析済みの文対応テキストから文全体で
語句対応の取れた対訳対を抽出する。
According to the thirteenth aspect of the present invention, the appropriate bilingual pair extraction means performs a morphological analysis to obtain linguistic information of a phrase from the sentence-corresponding text, and forms a fixed form from the morphologically analyzed sentence-corresponding text. A bilingual pair is extracted, and a bilingual pair in which the whole sentence has a word / phrase correspondence is extracted from the morphologically analyzed sentence corresponding text.

【0032】また、請求項14記載の本発明は、第1自
然言語の文と第2自然言語の文の対を納めた文対応テキ
ストを読み込む文対応テキスト入力手段と、前記文対応
テキストから第2自然言語の文が第1自然言語の文の適
切な訳文となる対で絞り込んで対訳用例集を作成する対
訳対絞り込み手段とを有することを要旨とする。
According to a fourteenth aspect of the present invention, there is provided a sentence-corresponding text input means for reading a sentence-corresponding text containing a pair of a sentence of a first natural language and a sentence of a second natural language; The gist of the present invention is to provide a bilingual pair narrowing-down means for narrowing down a sentence in two natural languages to a pair that is an appropriate translation of the first natural language sentence and creating a bilingual example book.

【0033】請求項14記載の本発明にあっては、第1
自然言語の文と第2自然言語の文の対を納めた文対応テ
キストを読み込み、この文対応テキストから第2自然言
語の文が第1自然言語の文の適切な訳文となる対で絞り
込んで対訳用例集を作成する。
In the present invention according to claim 14, the first aspect
A sentence-corresponding text containing a pair of a sentence of a natural language and a sentence of a second natural language is read, and from this sentence-corresponding text, the sentence of the second natural language is narrowed down to a pair that is an appropriate translation of the sentence of the first natural language. Create a bilingual example book.

【0034】更に、請求項15記載の本発明は、請求項
14記載の発明において、前記対訳対絞り込み手段が、
前記文対応テキストから複数の異なる適切な対訳対を抽
出する適切対訳対抽出手段と、該適切対訳対抽出手段で
抽出された対訳対を組合せ条件表と組合せ条件識別子を
用いて組み合わせて対訳用例集を作成する対訳用例集作
成手段とを有することを要旨とする。
Further, according to the present invention as set forth in claim 15, in the invention as set forth in claim 14, the translation pair narrowing means includes:
An appropriate bilingual pair extracting means for extracting a plurality of different appropriate bilingual pairs from the sentence-corresponding text; and a bilingual example set by combining the bilingual pairs extracted by the appropriate bilingual pair extracting means using a combination condition table and a combination condition identifier. And a means for creating a bilingual example book.

【0035】請求項15記載の本発明にあっては、対訳
対絞り込み手段は文対応テキストから複数の異なる適切
な対訳対を抽出し、この抽出された対訳対を組合せ条件
表と組合せ条件識別子を用いて組み合わせて対訳用例集
を作成する。
According to the present invention, the translation pair narrowing means extracts a plurality of different suitable translation pairs from the text corresponding to the sentence, and compares the extracted translation pairs with a combination condition table and a combination condition identifier. And use it to create a bilingual example book.

【0036】請求項16記載の本発明は、請求項15記
載の発明において、前記適切対訳対抽出手段が、前記文
対応テキストから語句の言語情報を取得するために形態
素解析を行う形態素解析手段と、この形態素解析済みの
文対応テキストから定型な対訳対を抽出する定型対訳抽
出手段と、前記形態素解析済みの文対応テキストから文
全体で語句対応の取れた対訳対を抽出する語句対応抽出
手段とを有することを要旨とする。
According to a sixteenth aspect of the present invention, in the invention according to the fifteenth aspect, the appropriate bilingual pair extraction unit performs a morphological analysis to obtain linguistic information of a phrase from the sentence correspondence text. A fixed bilingual translation extracting means for extracting a fixed bilingual pair from the morphologically analyzed sentence-corresponding text; and a phrase correspondence extracting means for extracting a bilingual pair in which the entire sentence has been matched from the morphologically analyzed sentence-corresponding text. The gist is to have.

【0037】請求項16記載の本発明にあっては、適切
対訳対抽出手段は文対応テキストから語句の言語情報を
取得するために形態素解析を行い、この形態素解析済み
の文対応テキストから定型な対訳対を抽出するととも
に、また形態素解析済みの文対応テキストから文全体で
語句対応の取れた対訳対を抽出する。
According to the sixteenth aspect of the present invention, the appropriate bilingual pair extraction means performs a morphological analysis to acquire linguistic information of a phrase from the sentence-corresponding text, and forms a fixed form from the morphologically analyzed sentence-corresponding text. A bilingual pair is extracted, and a bilingual pair in which the whole sentence has a word / phrase correspondence is extracted from the morphologically analyzed sentence corresponding text.

【0038】また、請求項17記載の本発明は、第1自
然言語の文と第2自然言語の文の対である対訳対を納め
た文対応テキストから、第2自然言語の文が第1自然言
語の文の適切な訳文となる対訳対の集合である対訳用例
集を作成し、翻訳しようとする第1自然言語の入力文に
対する類似文を前記対訳用例集から検索し、前記入力文
と類似文との差分を抽出し、この差分情報を用いて前記
類似文に対応する第2自然言語の文を機械的に加工して
前記入力文の訳文を生成する実例型自然言語翻訳プログ
ラムを記録媒体に記録することを要旨とする。
According to a seventeenth aspect of the present invention, the second natural language sentence is converted from the first natural language sentence and the second natural language sentence pair to the first natural language sentence. A bilingual example set, which is a set of bilingual pairs that are appropriate translations of natural language sentences, is created, and a similar sentence to the first natural language input sentence to be translated is searched from the bilingual example set. A natural language translation program for extracting a difference from a similar sentence and mechanically processing a second natural language sentence corresponding to the similar sentence using the difference information to generate a translated sentence of the input sentence is recorded. The point is to record on a medium.

【0039】請求項17記載の本発明にあっては、第1
自然言語の文と第2自然言語の文の対訳対を納めた文対
応テキストから、第2自然言語の文が第1自然言語の文
の適切な訳文となる対訳用例集を作成し、第1自然言語
の入力文に対する類似文を対訳用例集から検索し、入力
文と類似文との差分を抽出し、差分情報を用いて類似文
に対応する第2自然言語の文を機械的に加工して入力文
の訳文を生成する実例型自然言語翻訳プログラムを記録
媒体に記録しているため、該記録媒体を用いて、その流
通性を高めることができる。
In the present invention according to claim 17, the first aspect
From the sentence-corresponding text that contains the bilingual pair of the sentence of the natural language and the sentence of the second natural language, a bilingual translation example in which the sentence of the second natural language is an appropriate translation of the sentence of the first natural language is created, A similar sentence to the input sentence of the natural language is searched from the bilingual translation example collection, a difference between the input sentence and the similar sentence is extracted, and a sentence of the second natural language corresponding to the similar sentence is mechanically processed using the difference information. Since the example-type natural language translation program for generating the translated sentence of the input sentence is recorded in the recording medium, it is possible to enhance the circulation by using the recording medium.

【0040】更に、請求項18記載の本発明は、請求項
17記載の発明において、前記対訳用例集が、第2自然
言語の文が第1自然言語の文の適切な訳文となる対訳対
を複数の異なる方法で抽出し、作成される実例型自然言
語翻訳プログラムを記録媒体に記録することを要旨とす
る。
Further, in the present invention according to claim 18, in the invention according to claim 17, the bilingual example set includes a bilingual pair in which a sentence in the second natural language is an appropriate translation of a sentence in the first natural language. The gist of the present invention is to record an example-type natural language translation program extracted and created by a plurality of different methods on a recording medium.

【0041】請求項18記載の本発明にあっては、対訳
用例集は、第2自然言語の文が第1自然言語の文の適切
な訳文となる対訳対を複数の異なる方法で抽出し、作成
される実例型自然言語翻訳プログラムを記録媒体に記録
しているため、該記録媒体を用いて、その流通性を高め
ることができる。
According to the eighteenth aspect of the present invention, the bilingual example collection extracts a bilingual pair in which the second natural language sentence is an appropriate translation of the first natural language sentence by a plurality of different methods. Since the example-type natural language translation program to be created is recorded on the recording medium, the distribution of the program can be enhanced by using the recording medium.

【0042】請求項19記載の本発明は、請求項18記
載の発明において、前記複数の異なる方法の一方法とし
て、文対応テキストに頻出する良く類似した対訳対を定
型的な対訳対として抽出する実例型自然言語翻訳プログ
ラムを記録媒体に記録することを要旨とする。
According to a nineteenth aspect of the present invention, in the invention according to the eighteenth aspect, as one of the plurality of different methods, a bilingual pair that is frequently similar to a text corresponding to a sentence is extracted as a fixed bilingual pair. The gist is to record an example-type natural language translation program on a recording medium.

【0043】請求項19記載の本発明にあっては、複数
の異なる方法の一方法として、文対応テキストに頻出す
る良く類似した対訳対を定型的な対訳対として抽出する
実例型自然言語翻訳プログラムを記録媒体に記録してい
るため、該記録媒体を用いて、その流通性を高めること
ができる。
According to the nineteenth aspect of the present invention, as one of a plurality of different methods, an example-type natural language translation program for extracting a well-similar bilingual pair frequently appearing in a sentence-corresponding text as a standard bilingual pair. Is recorded on a recording medium, so that the distribution can be improved by using the recording medium.

【0044】また、請求項20記載の本発明は、請求項
18記載の発明において、前記複数の異なる方法の一方
法として、第1自然言語の文と第2自然言語の文の間で
語句の対応を調べ、文全体で語句対応が取れている対訳
対を抽出する実例型自然言語翻訳プログラムを記録媒体
に記録することを要旨とする。
According to a twentieth aspect of the present invention, in the invention according to the eighteenth aspect, as one of the plurality of different methods, a phrase between a first natural language sentence and a second natural language sentence is used. The gist is to record an example-type natural language translation program for examining the correspondence and extracting a bilingual pair having a phrase correspondence in the entire sentence on a recording medium.

【0045】請求項20記載の本発明にあっては、複数
の異なる方法の一方法として、第1自然言語の文と第2
自然言語の文の間で語句の対応を調べ、文全体で語句対
応が取れている対訳対を抽出する実例型自然言語翻訳プ
ログラムを記録媒体に記録しているため、該記録媒体を
用いて、その流通性を高めることができる。
According to the twentieth aspect of the present invention, as one of a plurality of different methods, a sentence in a first natural language and a second
To check the correspondence of phrases between sentences in natural language, and to record on a recording medium an example natural language translation program for extracting a bilingual pair having a phrase correspondence in the entire sentence, using the recording medium, Its distribution can be improved.

【0046】更に、請求項21記載の本発明は、請求項
17記載の発明において、前記文対応テキストが、文対
応の付いていない第1自然言語のテキストと第2自然言
語のテキストから人手および機械によって文対応付けさ
れた対で構成する実例型自然言語翻訳プログラムを記録
媒体に記録することを要旨とする。
Further, in accordance with the present invention as set forth in claim 21, in the invention as set forth in claim 17, the sentence-corresponding text is manually and manually derived from the first natural language text and the second natural language text having no sentence correspondence. The gist of the present invention is to record an example-type natural language translation program composed of pairs matched by a machine with a sentence on a recording medium.

【0047】請求項21記載の本発明にあっては、文対
応テキストは文対応の付いていない第1自然言語のテキ
ストと第2自然言語のテキストから人手および機械によ
って文対応付けされた対で構成する実例型自然言語翻訳
プログラムを記録媒体に記録しているため、該記録媒体
を用いて、その流通性を高めることができる。
According to the twenty-first aspect of the present invention, the sentence-corresponding text is a pair of a sentence corresponding to a sentence from a first natural language text and a second natural language text to which no sentence correspondence is attached by hand and machine. Since the constituent example natural language translation program is recorded on the recording medium, the distribution of the program can be improved by using the recording medium.

【0048】請求項22記載の本発明は、第1自然言語
の文と第2自然言語の文の対である対訳対を納めた文対
応テキストから、第2自然言語の文が第1自然言語の文
の適切な訳文となる対訳対に絞り込んで、対訳用例集を
作成する対訳用例集作成プログラムを記録媒体に記録す
ることを要旨とする。
According to a twenty-second aspect of the present invention, a sentence in a second natural language is converted into a first natural language from a sentence corresponding text containing a translation pair, which is a pair of a sentence in a first natural language and a sentence in a second natural language. The gist of the present invention is to record on a recording medium a bilingual example book creation program that creates a bilingual example book by narrowing down to a bilingual pair that is an appropriate translation of the sentence.

【0049】請求項22記載の本発明にあっては、第1
自然言語の文と第2自然言語の文の対である対訳対を納
めた文対応テキストから、第2自然言語の文が第1自然
言語の文の適切な訳文となる対訳対に絞り込んで対訳用
例集を作成する対訳用例集作成プログラムを記録媒体に
記録しているため、該記録媒体を用いて、その流通性を
高めることができる。
In the present invention according to claim 22, the first aspect
From the sentence-corresponding text that contains the bilingual pair, which is a pair of a natural language sentence and a second natural language sentence, narrow down to a bilingual pair in which the second natural language sentence is an appropriate translation of the first natural language sentence. Since the bilingual example book creation program for creating the example book is recorded on the recording medium, the distribution of the example book can be improved by using the recording medium.

【0050】また、請求項23記載の本発明は、請求項
22記載の発明において、前記対訳用例集が、複数の異
なる方法で抽出した、第2自然言語の文が第1自然言語
の文の適切な訳文となる対訳対を組み合わせて作成され
る対訳用例集作成プログラムを記録媒体に記録すること
を要旨とする。
According to a twenty-third aspect of the present invention, in the invention according to the twenty-second aspect, the bilingual example collection is obtained by extracting the second natural language sentence by a plurality of different methods from the first natural language sentence. The gist of the present invention is to record a bilingual translation example book creation program created by combining bilingual pairs that are appropriate translations on a recording medium.

【0051】請求項23記載の本発明にあっては、対訳
用例集は複数の異なる方法で抽出した、第2自然言語の
文が第1自然言語の文の適切な訳文となる対訳対を組み
合わせて作成される対訳用例集作成プログラムを記録媒
体に記録しているため、該記録媒体を用いて、その流通
性を高めることができる。
According to the twenty-third aspect of the present invention, the bilingual example set is extracted by a plurality of different methods, and a bilingual pair in which the sentence of the second natural language is an appropriate translation of the sentence of the first natural language is combined. Since the bilingual example book creation program created by this method is recorded on a recording medium, the distribution of the bilingual example book collection program can be enhanced using the recording medium.

【0052】更に、請求項24記載の本発明は、請求項
23記載の発明において、前記複数の異なる方法の一方
法として、文対応テキストに頻出する良く類似した対訳
対を定型的な対訳対として抽出する対訳用例集作成プロ
グラムを記録媒体に記録することを要旨とする。
Further, in the present invention according to claim 24, in the invention according to claim 23, as one of the plurality of different methods, a well-known bilingual pair frequently appearing in a sentence-corresponding text is used as a standard bilingual pair. The gist of the invention is to record the extracted bilingual example book creation program on a recording medium.

【0053】請求項24記載の本発明にあっては、複数
の異なる方法の一方法として、文対応テキストに頻出す
る良く類似した対訳対を定型的な対訳対として抽出する
対訳用例集作成プログラムを記録媒体に記録しているた
め、該記録媒体を用いて、その流通性を高めることがで
きる。
According to the present invention described in claim 24, as one of a plurality of different methods, a bilingual example book creation program for extracting a well-similar bilingual pair frequently appearing in a sentence corresponding text as a standard bilingual pair is provided. Since the information is recorded on the recording medium, the distribution property can be improved by using the recording medium.

【0054】請求項25記載の本発明は、請求項23記
載の発明において、前記複数の異なる方法の一方法とし
て、第1自然言語の文と第2自然言語の文の間で語句の
対応を調べ、文全体で語句対応が取れている対訳対を抽
出する対訳用例集作成プログラムを記録媒体に記録する
ことを要旨とする。
According to a twenty-fifth aspect of the present invention, in the invention according to the twenty-third aspect, as one of the plurality of different methods, correspondence between a phrase in a first natural language sentence and a second natural language sentence is determined. The gist of the present invention is to record, on a recording medium, a bilingual example book creation program for examining and extracting a bilingual pair having a phrase correspondence in the entire sentence.

【0055】請求項25記載の本発明にあっては、複数
の異なる方法の一方法として、第1自然言語の文と第2
自然言語の文の間で語句の対応を調べ、文全体で語句対
応が取れている対訳対を抽出する対訳用例集作成プログ
ラムを記録媒体に記録しているため、該記録媒体を用い
て、その流通性を高めることができる。
According to the twenty-fifth aspect of the present invention, as one of a plurality of different methods, a sentence in a first natural language and a second
By examining the correspondence between words and phrases between sentences in a natural language and recording a bilingual example book creation program that extracts a pair of translations that have word correspondence in the entire sentence on a recording medium, using the recording medium, Distribution can be improved.

【0056】また、請求項26記載の本発明は、請求項
22記載の発明において、前記文対応テキストが、文対
応の付いていない第1自然言語のテキストと第2自然言
語のテキストから人手および機械によって文対応付けさ
れた対で構成する対訳用例集作成プログラムを記録媒体
に記録することを要旨とする。
According to a twenty-sixth aspect of the present invention, in the twenty-sixth aspect, the sentence-corresponding text is manually and manually converted from a first natural language text and a second natural language text having no sentence correspondence. The gist of the present invention is to record a bilingual translation example book creation program, which is composed of pairs matched by a sentence by a machine, on a recording medium.

【0057】請求項26記載の本発明にあっては、文対
応テキストは文対応の付いていない第1自然言語のテキ
ストと第2自然言語のテキストから人手および機械によ
って文対応付けされた対で構成する対訳用例集作成プロ
グラムを記録媒体に記録しているため、該記録媒体を用
いて、その流通性を高めることができる。
According to the twenty-sixth aspect of the present invention, the sentence-corresponding text is a pair in which a sentence is manually and manually matched from a text in a first natural language and a text in a second natural language without a sentence correspondence. Since the constituent bilingual example book creation program is recorded on a recording medium, the distribution of the program can be improved by using the recording medium.

【0058】[0058]

【発明の実施の形態】以下、図面を用いて本発明の実施
の形態について説明する。図1は、本発明の一実施形態
に関わる実例型自然言語翻訳方法を実施する実例型自然
言語翻訳装置の動作原理を説明するためのフローチャー
トである。本実施形態の実例型自然言語翻訳方法は、2
つのフェーズからなっており、1つ目のフェーズでは翻
訳の事前処理として、文対応テキストを入力し(ステッ
プS1)、文対応テキストから第2自然言語の文が第1
自然言語の文の適切な訳文となっている対訳用例集を作
成する(ステップS2)。2つ目のフェーズでは翻訳処
理として、第1自然言語の入力文を入力し、第1自然言
語の入力文に対する類似文を検索し(ステップS3)、
入力文と類似文で差分を取り(ステップS4)、差分情
報を用いて前記類似文に対応する第2自然言語の文を機
械的に加工し(ステップS5)、前記入力文の訳文を生
成し出力する(ステップS6)。以前に作成した対訳用
例集を用いて別の入力文を翻訳する場合は、フェーズ1
の処理を飛ばし、フェーズ2のステップS3から始める
こともできる。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a flowchart for explaining the operation principle of an example-type natural language translation apparatus that implements an example-type natural language translation method according to an embodiment of the present invention. The example-type natural language translation method according to the present embodiment includes two methods:
In the first phase, a sentence-corresponding text is input as pre-translation processing (step S1), and the second natural language sentence is converted from the sentence-corresponding text to the first.
A bilingual example collection that is an appropriate translation of a natural language sentence is created (step S2). In the second phase, as a translation process, an input sentence of the first natural language is input, and a similar sentence to the input sentence of the first natural language is searched (step S3).
The difference between the input sentence and the similar sentence is obtained (step S4), and the sentence of the second natural language corresponding to the similar sentence is mechanically processed using the difference information (step S5) to generate a translated sentence of the input sentence. Output (Step S6). If you want to translate another input sentence using a previously created bilingual translation,
Can be skipped and the process can be started from step S3 of phase 2.

【0059】なお、図1のステップS1とステップS2
の処理は、本発明の一実施形態に関わる対訳用例集作成
方法を実施する対訳用例集作成装置の動作原理を説明す
るフローチャートである。
Note that steps S1 and S2 in FIG.
Is a flowchart for explaining the operation principle of the bilingual example book creation apparatus that executes the bilingual example book creation method according to the embodiment of the present invention.

【0060】また、実施形態においては、前記文対応テ
キストにおいて、文対応の付いていない第1自然言語の
テキストと第2自然言語のテキストから人手および機械
によって文対応付けされた対を文対応テキストとして利
用できる。
Further, in the embodiment, in the sentence-corresponding text, a pair in which the first natural language text having no sentence correspondence and the second natural language text are sentence-associated by hand and machine is used as the sentence-corresponding text. Available as

【0061】図2は、図1に示した実施形態の実例型自
然言語翻訳装置の構成を示すブロック図である。本装置
は、第1自然言語の文と第2自然言語の文の対を納めた
文対応テキストを読み込む文対応テキスト入力部100
と、第2自然言語の文が第1自然言語の文の適切な訳文
となる対に絞り込み、対訳用例集300を作成する対訳
対絞り込み部200と、第1自然言語の文を入力する入
力文入力部400と、前記対訳用例集300から入力文
に対する類似文を検索する類似文検索部500と、入力
文と類似文で差分を取り、第1自然言語と第2自然言語
の語句の対応が記載された対訳辞書900を用いて類似
文の差分部分と対応する第2自然言語文の部分の語句対
応を取り、入力文の差分部分に対応する第2自然言語の
訳を得る差分対応部600と、差分情報を基に、前記類
似文に対応する第2自然言語の文を機械的に加工する文
加工部700と、入力文の訳文を生成し出力する訳文出
力部800を有する。
FIG. 2 is a block diagram showing the configuration of the example-type natural language translator of the embodiment shown in FIG. This apparatus reads a sentence corresponding text containing a pair of a sentence of a first natural language and a sentence of a second natural language.
And a translation pair narrowing unit 200 that narrows down the sentence of the second natural language to an appropriate translation of the first natural language sentence and creates a bilingual example set 300, and an input sentence for inputting the first natural language sentence An input unit 400, a similar sentence search unit 500 that searches the parallel translation example collection 300 for a similar sentence to the input sentence, and a difference between the input sentence and the similar sentence, and the correspondence between the first natural language and the second natural language phrase is determined. Using the described bilingual dictionary 900, a phrase correspondence between the difference portion of the similar sentence and the portion of the second natural language sentence corresponding to the difference portion of the similar sentence, and a difference correspondence unit 600 for obtaining a translation of the second natural language corresponding to the difference portion of the input sentence And a sentence processing unit 700 that mechanically processes a sentence of the second natural language corresponding to the similar sentence based on the difference information, and a translated sentence output unit 800 that generates and outputs a translated sentence of the input sentence.

【0062】また、図2の一部は、図1の一部に示した
実施形態の対訳用例集作成装置の構成を示すブロック図
であり、本装置は、第1自然言語の文と第2自然言語の
文の対を納めた文対応テキストを読み込む文対応テキス
ト入力部100と、第2自然言語の文が第1自然言語の
文の適切な訳文となる対に絞り込み、対訳用例集300
を作成する対訳対絞り込み部200を有する。
FIG. 2 is a block diagram showing the configuration of the bilingual example book creating apparatus according to the embodiment shown in FIG. 1. The apparatus comprises a first natural language sentence and a second natural language sentence. A sentence-corresponding text input unit 100 that reads a sentence-corresponding text containing a pair of natural language sentences, and a pair of sentences in which the second natural language sentence is an appropriate translation of the first natural language sentence.
Is provided.

【0063】図3は、図2に示した実例型自然言語翻訳
装置及び、対訳用例集作成装置に使用されている対訳対
絞り込み部200の構成を示すブロック図である。対訳
対絞り込み部200は、複数の適切な文対応を持つ対訳
対を抽出する適切対訳対抽出部201と、組合せ条件表
250から所定の組合せ条件識別子で指定した方法で定
型対訳抽出部220と語句対応抽出部230で得られた
対訳対を組み合わせて対訳用例集300を作成する対訳
用例集作成部240を有する。適切対訳対抽出部201
は、文対応テキストの各文中の各語の品詞情報を得るた
めに形態素解析を行う形態素解析部210と、形態素解
析処理済みの文対応テキストから、定型的な対訳対を抽
出する定型対訳抽出部220と、形態素解析処理済みの
文対応テキストから、第1自然言語の文とその対の第2
自然言語の文の間で全体的に語句対応が付いている対訳
対を抽出する語句対応抽出部230を有する。
FIG. 3 is a block diagram showing the configuration of the translation pair narrowing unit 200 used in the example-type natural language translator shown in FIG. The bilingual pair narrowing unit 200 extracts the bilingual pair having a plurality of appropriate sentence correspondences from the appropriate bilingual pair extracting unit 201 and the fixed bilingual pair extracting unit 220 from the combination condition table 250 by a method designated by a predetermined combination condition identifier. It has a bilingual example set creating unit 240 that creates the bilingual example set 300 by combining the bilingual pairs obtained by the correspondence extracting unit 230. Appropriate translation pair extraction unit 201
Is a morphological analysis unit 210 that performs a morphological analysis to obtain part-of-speech information of each word in each sentence of the sentence-corresponding text, and a stylized bilingual extraction unit that extracts a stylized bilingual pair from the morphologically analyzed sentence-corresponding text 220 and the second sentence of the first natural language sentence and its pair from the morphologically analyzed sentence corresponding text
It has a phrase correspondence extraction unit 230 that extracts a translation pair having a phrase correspondence as a whole between sentences in a natural language.

【0064】図5は、図3に示した定型対訳抽出部22
0の構成を示すブロック図である。定型対訳抽出部22
0は、形態素解析済み文対応テキストから定型的な対訳
対を抽出するため、置換前の語句または品詞と置換後の
記号の情報が記載された置換対象辞書224を用いて、
第1自然言語と第2自然言語の特定の語句を特定の記号
に置換する表記置換部221と、置換された対訳対から
表記が同型である第1自然言語文とその対からなる対訳
対の集合を作成する第1自然言語文同型対訳集合作成部
222と、同型である第1自然言語文を含む対訳対の集
合から、第2自然言語文で類似している文とその対から
なる対訳対で部分集合を作成して、定型な対訳用例集を
抽出する定型対訳対絞り込み部223を有する。
FIG. 5 is a block diagram of the fixed-form bilingual extraction unit 22 shown in FIG.
FIG. 3 is a block diagram showing a configuration of a 0. Boilerplate bilingual extraction unit 22
0 uses a substitution target dictionary 224 in which information of a word or part of speech before replacement and information of a symbol after replacement are described, in order to extract a fixed bilingual pair from the morphologically analyzed sentence corresponding text.
A notation replacement unit 221 that replaces a specific phrase in the first natural language and the second natural language with a specific symbol, and a first natural language sentence whose notation is of the same type from the replaced bilingual pair and a bilingual pair consisting of the pair. A first natural language sentence isomorphic bilingual set generation unit 222 for creating a set, and a bilingual sentence composed of similar sentences in the second natural language sentence and a pair thereof from a set of bilingual pairs including the first natural language sentence having the same type It has a fixed form translation pair narrowing unit 223 that creates a subset in pairs and extracts a set of fixed form translation examples.

【0065】図8は、図3に示した語句対応抽出部23
0の構成を示すブロック図である。語句対応抽出部23
0は、形態素解析済み文対応テキストから語句対応対象
表234を用いて語句対応の調査対象となる語句を限定
する語句対応対象語句フィルタ部231と、第1自然言
語の語句と第2自然言語の間の語句対応が記述された対
訳辞書900を用いて、対訳対の各文間で語句の対応が
取れている部分を調べる語句対応調査部232と、指定
した調査対象語句中で対応のある語句の割合が高いもの
を文全体で語句対応が取れている対訳対として抽出し、
語句対応合格対訳用例集を作成する語句対応合格対訳対
絞り込み部233を有する。語句対応対象表234に何
も記述がなければ、文対応テキスト中のすべての語句を
対象として実行する。
FIG. 8 is a block diagram of the phrase correspondence extracting unit 23 shown in FIG.
FIG. 3 is a block diagram showing a configuration of a 0. Phrase correspondence extraction unit 23
0 is a phrase correspondence target phrase filter unit 231 that limits a phrase to be investigated for phrase correspondence from the morphologically analyzed sentence correspondence text using the phrase correspondence target table 234, a phrase in the first natural language and a phrase in the second natural language. A phrase correspondence investigation unit 232 that uses the bilingual dictionary 900 describing the correspondence between words and phrases to check a part in which the phrase correspondence is obtained between each sentence of the bilingual pair, and a corresponding phrase in the designated search target phrase Is extracted as a bilingual pair that has phrase correspondence in the entire sentence,
It has a phrase corresponding pass translation pair narrowing unit 233 that creates a phrase correspondence pass translation example book. If there is no description in the phrase correspondence target table 234, the processing is performed for all the phrases in the sentence correspondence text.

【0066】次に、上述したように構成される本実施形
態の実例型自然言語翻訳装置及び、対訳用例集作成装置
の作用について説明する。本実施形態の実例型自然言語
翻訳装置及び、対訳用例集作成装置では、文対応テキス
トを定型的な対訳対と語句対応が適切な対訳対の抽出処
理によって、文対応テキスト内の文対応に誤りがある対
訳対や部分的な対応は取れるが文全体では対応している
とはいえない、文対応の精度が低い対訳対を除去するこ
とで、文対応の適切な対訳対を納めた対訳用例集の作成
が可能である。また本実施形態の実例型自然言語翻訳装
置では、前記対訳用例集を用いて実例型自然言語翻訳を
行うことで、入力文に類似した文を持つ対訳対を模倣し
て適切な翻訳が可能である。また、人手による事前処理
や翻訳途中における複雑な処理は必要とせず、翻訳結果
の品質を保つことが可能である。
Next, the operation of the example-type natural language translating apparatus and the bilingual example book creating apparatus of the present embodiment configured as described above will be described. In the example-type natural language translation device and the bilingual example book creating device of the present embodiment, the sentence-corresponding text has an error in the sentence correspondence in the sentence-corresponding text by extracting the fixed-value parallel translation pair and the appropriate translation. A translation example in which an appropriate translation pair is sent by removing a translation pair with a low translation accuracy that can take a certain translation pair or partial correspondence but cannot be said to correspond to the entire sentence. It is possible to create a collection. Further, in the example-type natural language translation device of the present embodiment, by performing the example-type natural language translation using the bilingual example collection, it is possible to imitate a bilingual pair having a sentence similar to the input sentence and perform appropriate translation. is there. Further, the quality of the translation result can be maintained without the need for manual pre-processing or complicated processing during translation.

【0067】[具体例]この実施形態では、第1自然言
語を日本語、第2自然言語を英語とするが、これらに限
定されない。
[Specific Example] In this embodiment, the first natural language is Japanese and the second natural language is English, but the present invention is not limited to these.

【0068】まず、文対応テキスト入力部100で、日
英文対応テキストを読み込む。図11に日英文対応テキ
ストの例を示す。日本語文と英語文の先頭には文番号を
付けており、日英文対応表に日本語文の文番号と英語文
の文番号を記述することで対応付けしている。この文対
応テキストには文対応が1対1でない場合も含まれてい
る。例えば、“4:4,5”の行は日本語文4に英語文
4と5が対応していることを表している。
First, the sentence-corresponding text input unit 100 reads a Japanese-English text. FIG. 11 shows an example of the Japanese-English text. A sentence number is attached to the head of the Japanese sentence and the English sentence, and the Japanese sentence number and the English sentence number are described in the Japanese-English sentence correspondence table so as to correspond to each other. The sentence correspondence text includes a case where the sentence correspondence is not one-to-one. For example, the line "4: 4,5" indicates that English sentences 4 and 5 correspond to Japanese sentence 4.

【0069】次に、対訳対絞り込み部200の形態素解
析部210は、文対応テキストの日本語文、英語文につ
いて形態素解析を行い、単語ごとに品詞情報を取得す
る。図11の日本語文の形態素解析結果を図12に、図
11の英語文の形態素解析結果を図13に示す。形態素
解析結果は、単語のあとに区切り文字“/”と品詞を付
けている。例えば、図12の日本語文1の1語目の表記
“全般に/副詞”は単語「全般に」の品詞が副詞である
ことを意味する。同様に図13の英語文1の1語目の表
記“Aug./名詞”は単語「Aug.」の品詞が名詞であるこ
とを意味する。
Next, the morphological analysis unit 210 of the bilingual pair narrowing unit 200 performs a morphological analysis on the Japanese sentence and the English sentence of the sentence-corresponding text, and acquires part-of-speech information for each word. FIG. 12 shows a morphological analysis result of the Japanese sentence of FIG. 11, and FIG. 13 shows a morphological analysis result of the English sentence of FIG. In the morphological analysis result, a delimiter “/” and a part of speech are attached after the word. For example, the notation “General / Adverb” of the first word of Japanese sentence 1 in FIG. 12 means that the part of speech of the word “General” is an adverb. Similarly, the notation “Aug./Noun” of the first word of English sentence 1 in FIG. 13 means that the part of speech of the word “Aug.” is a noun.

【0070】次に、定型対訳抽出部220および語句対
応抽出部230は、文対応テキストと形態素解析済み文
対応テキストを用いて、各方法を適用して適切な対訳対
を抽出する。定型対訳抽出部220や語句対応抽出部2
30が行う処理以外に適切な対訳対を抽出する方法があ
れば、適切対訳抽出部201にその処理を行う部を追加
し、各抽出部の組み合わせ条件を組合せ条件表250に
記載して同様に処理することが可能である。
Next, the fixed phrase translation extraction unit 220 and the phrase correspondence extraction unit 230 use the sentence correspondence text and the morphologically analyzed sentence correspondence text to apply appropriate methods to extract an appropriate translation pair. Boilerplate bilingual extraction unit 220 and phrase correspondence extraction unit 2
If there is a method for extracting an appropriate translation pair other than the processing performed by the processing unit 30, a unit that performs the processing is added to the appropriate translation extraction unit 201, and the combination condition of each extraction unit is described in the combination condition table 250, and It is possible to process.

【0071】定型対訳抽出部220は、文対応テキスト
と形態素解析済み対応テキストから日本語文が同型な文
を持つ対訳対で集合を作成し、前記集合から類似した英
語文を持つ対訳対を定型な対訳対として抽出する。
The fixed form bilingual extraction unit 220 creates a set of bilingual pairs having the same type of Japanese sentence from the sentence corresponding text and the morphologically analyzed corresponding text, and converts a set of similar bilingual pairs having similar English sentences from the set. Extract as a bilingual pair.

【0072】図5に示す表記置換部221では、形態素
解析済み文対応テキストから定型的な日本語文と英語文
を抽出するため、日英それぞれで特定の語句を特定の記
号に置換する。置換対象辞書224が図6のようにあれ
ば、英語文中の品詞が数詞である語をすべて同じ記号
“<D>”に置換する。日本語も同様に処理を行う。置
換後、単語および置換した表記を用いて文対応テキスト
を作成する。図13の英語文1の“ 225/数詞”は“<
D>/数詞”となる。仮に、“Aug./名詞 Nikkei /名
詞 225/数詞 call /動詞 options/名詞 mostly /副
詞 fell /動詞 and/接続詞 many /形容詞 puts /名
詞 firmed /動詞 Monday /名詞 morning/名詞.
/.”と“Aug./名詞 Nikkei /名詞 300/数詞 call
/動詞 options/名詞 mostly /副詞 fell /動詞 and
/接続詞 many /形容詞 puts /名詞 firmed /動詞 M
onday /名詞 morning/名詞./.”という類似した文
の形態素解析結果が形態素解析済みと対応テキストにあ
った場合、品詞が数詞である語を”<D>”で置換し、
区切り対応し品詞を除いて文の形に変換した文対応テキ
ストは、同型の文“Aug.Nikkei<D>call options mos
tly fell and many puts firmed Monday morning. ”と
なる。図6に示すように、置換対象語句の指定は品詞に
限らず、特定の語句でもよい。
The notation replacement unit 221 shown in FIG. 5 replaces specific words and phrases with specific symbols in Japanese and English, respectively, in order to extract typical Japanese and English sentences from the morphologically analyzed sentence corresponding text. If the replacement target dictionary 224 is as shown in FIG. 6, all words in the English sentence whose part of speech is a numeral are replaced with the same symbol “<D>”. The same applies to Japanese. After the replacement, a sentence corresponding text is created using the word and the replaced notation. "225 / number" in English sentence 1 in FIG.
D> / numeral. ”Assuming that“ Aug./noun Nikkei / noun 225 / numeral call / verb options / noun mostly / adverb fell / verb and / connective many / adjective puts / noun firmed / verb Monday / noun morning / noun.
/. "/"Aug./Noun Nikkei / Noun 300 / Numerical call
/ Verb options / Noun mostly / Adverb fell / Verb and
/ Connective many / Adjective puts / Noun firmed / Verb M
onday / noun morning / noun. /. If the result of the morphological analysis of a similar sentence "is morphologically analyzed and the corresponding text, the word whose part of speech is a numeral is replaced with"<D>".
The sentence-corresponding text, which is delimited and converted to a sentence form excluding the part of speech, is a sentence of the same type "Aug. Nikkei <D> call options mos
tly fell and many puts firmed Monday morning. ". As shown in FIG. 6, the designation of the replacement target phrase is not limited to the part of speech, but may be a specific phrase.

【0073】次に、第1自然言語文同型対訳集合作成部
222で、置換を施した文対応テキストから同型の日本
語文を調べる。図11の1,3,5番目の文はすべて
“全般に商いは低調。”となるので、図14に示す日本
語文1,3,5を持つ対訳対で集合を作成する。
Next, the first natural language sentence isomorphic bilingual set creation unit 222 examines the same type of Japanese sentence from the replaced sentence corresponding text. Since the first, third, and fifth sentences in FIG. 11 are all “Trading is low in general.”, A set is created using the translation pairs having the Japanese sentences 1, 3, and 5 shown in FIG.

【0074】次に、定型対訳対絞り込み部223では、
第1自然言語文同型対訳集合作成部222で作成された
集合から、より一般的な英語文を持つ対訳対で部分集合
を作成する。より一般的な英語文を調べる方法として、
ここでは、多くの英語文で共通に出現する単語を基に行
う。より一般的な英語文を調べる方法は、集合中の文の
語数が極端に異なっているものを除く、絞り込みが不十
分な場合は絞り込んだ集合を同様の方法で必要なだけ繰
り返し行うというように、別の方法を用いたり、組合せ
ても構わない。図14に示す英語文で共通する単語(大
文字小文字は区別しない)は、太字のゴシックで示した
Next, the fixed-form bilingual pair narrowing unit 223
From the set created by the first natural language sentence isomorphic bilingual set creation unit 222, a subset is created with a bilingual pair having a more general English sentence. A more general way to look up English sentences is
Here, it is based on words that appear commonly in many English sentences. A more general method for examining English sentences is to exclude sentences in which the number of words in the set is extremely different, and if the refinement is insufficient, repeat the refined set in the same way as necessary Alternatively, another method may be used or a combination may be used. Common words (case insensitive) in the English sentence shown in FIG. 14 are shown in bold Gothic

【外1】 であるので、英語文3,6の文が類似した文となる。こ
の結果と文対応テキストを用いて図7に示すように
“3:3”、“5:6”の対訳対を定型な対訳用例集と
して抽出し、日本語は同型でも英語文が一般的でない対
訳対“1:1”や、定型的でない対訳対“2:2”、
“4:4,5”、“6:7”は不要な対訳対として除か
れる。
[Outside 1] Therefore, the English sentences 3 and 6 are similar sentences. Using this result and the sentence-corresponding text, as shown in FIG. 7, bilingual pairs of “3: 3” and “5: 6” are extracted as a set of fixed bilingual translation examples. A bilingual pair "1: 1", an unconventional bilingual pair "2: 2",
“4: 4,5” and “6: 7” are removed as unnecessary translation pairs.

【0075】語句対応抽出部230は、文対応テキスト
と形態素解析済み文対応テキストから対訳対の文間で全
体的に語句対応が取れている対訳対を抽出する。
The phrase correspondence extraction unit 230 extracts a bilingual pair having overall phrase correspondence between the sentences of the bilingual pair from the sentence corresponding text and the morphologically analyzed sentence corresponding text.

【0076】図8に示す語句対応対象語句フィルタ部2
31では、語句対応対象表234が図9に示すような場
合、日本語、英語とも品詞が名詞である語句を日英間で
語句対応の調査対象として限定する。日本語、英語とも
名詞に加えて動詞も調査対象としたい場合は日本語、英
語の両方に“品詞:動詞”と記述する。また、日本語で
“語句:午前”、英語で“語句:a.m.”と記述すれば、
特定の語句を調査対象にすることもできる。図11の日
本語文と英語文の対応が“4:4,5”の対訳対の語句
対応を例として図15を用いて説明する。太字のゴシッ
ク文字は語句が名詞であり、四角で囲まれた太字のゴシ
ック文字は図16の対訳辞書で対応付けができたもので
ある。日本語文は、名詞が6語、そのうち英語との語句
対応があるのが5語なので、語句対応率は5/6≒0.
83である。英語文は、1文目が名詞数3、そのうち日
本語との語句対応があるのが3で、2文目が名詞数6、
対応がある名詞数5となり、2つ合わせると、語句対応
率は(3+5)/(3+6)≒0.88である。日英の
語句対応率の閾値が共に0.6だとすると、日英共に閾
値以上であるので、この結果と文対応テキストを用いて
対訳対が抽出される。また、閾値の設定は別の方法を用
いることもできる。
The target phrase filtering unit 2 shown in FIG.
At 31, in the case where the phrase correspondence target table 234 is as shown in FIG. 9, the phrase whose part of speech is a noun in both Japanese and English is limited as a target for phrase correspondence between Japanese and English. If you want to investigate verbs in addition to nouns in both Japanese and English, write "part of speech: verb" in both Japanese and English. If you write "phrase: am" in Japanese and "phrase: am" in English,
You can also search for specific words. A description will be given using FIG. 15 as an example of the phrase correspondence of the bilingual pair in which the correspondence between the Japanese sentence and the English sentence in FIG. 11 is “4: 4,5”. A bold Gothic character is a noun whose word is a noun, and a bold Gothic character surrounded by a square can be associated with the bilingual dictionary of FIG. The Japanese sentence has six nouns, of which five have word correspondence with English, so the word correspondence rate is 5/6/0.
83. In the English sentence, the first sentence has 3 nouns, of which 3 has a phrase correspondence with Japanese, the second sentence has 6 nouns,
There are five nouns with correspondence, and when two are combined, the phrase correspondence rate is (3 + 5) / (3 + 6) ≒ 0.88. Assuming that the threshold value of the Japanese-English phrase correspondence rate is both 0.6, the bilingual pair is extracted using the result and the sentence-corresponding text since the threshold value is equal to or greater than the threshold value in both English and Japanese. In addition, another method can be used for setting the threshold.

【0077】図11にある対訳対について語句対応の調
査結果の例を図17に示す。図17の語句対応率が日英
両方で閾値0.6以上である対訳対は“4:4,5”と
“6:7”なので、この対訳対を図10に示すように語
句対応合格対訳用例集として抽出し、文対応付けが誤っ
ている対訳対“1:1”や、不必要な語句が英語文に含
まれており、語句対応が少ない対訳対“2:2”や、
“低調/名詞”の語句対応が“ muted/動詞”および
“weak/形容詞”で英語の語句の品詞が語句対応の対象
になっていない対訳対“3:3”、“5:6”は除外さ
れる。
FIG. 17 shows an example of a result of a survey corresponding to words and phrases with respect to the translation pair shown in FIG. Since the translation pairs in FIG. 17 having the phrase correspondence ratio of not less than the threshold value 0.6 in both Japanese and English are “4: 4, 5” and “6: 7”, as shown in FIG. A bilingual pair "1: 1" which is extracted as a collection of examples and has an incorrect sentence correspondence, a bilingual pair "2: 2" in which unnecessary phrases are included in an English sentence and the phrase correspondence is small,
Excludes translation pairs "3: 3" and "5: 6" where the phrase correspondence of "low tone / noun" is "muted / verb" and "weak / adjective" and the part of speech of English phrase is not the target of phrase correspondence. Is done.

【0078】対訳用例集作成部240では、異なる方法
で抽出された対訳対を組み合わせて適切な対訳対を抽出
する。組み合わせ方法は組合せ条件表250の中にあ
り、組合せ条件識別子によって選択する。例えば、組合
せ条件識別子を1とし、図18の中から組合せ条件識別
子に該当する識別記号1の方法が選択されると、定型的
な対訳対と語句対応の適切な対訳対のどちらか一方でも
含まれている対訳対と対訳用例集の対訳対とする。これ
は、定型的な対訳対のみを抽出した場合、定型的ではな
いが文対応が適切な対訳対の除外を防ぐ。また逆に語句
対応の適切な対訳対のみ抽出した場合、語句対応が適切
とはいえないが定型的な対訳対の除外を防ぐ。他に適切
な対訳対の抽出方法があれば、適宜、その抽出方法を適
切対訳抽出部201に追加し、その結果と他の抽出方法
の組み合わせ条件を組合せ条件表250に加えることで
処理できる。図11の日英文対応表の表記に従って抽出
された対訳対を示すと、定型な対訳対が“3:3”、
“5:6”、語句の対応の取れた対訳対が“4:4,
5”、“6:7”であるので、図4の対訳用例集には、
“3:3”、“4:4,5”、“5:6”、“6:7”
の4つの対訳が含まれている。
The bilingual example set creating unit 240 extracts appropriate bilingual pairs by combining bilingual pairs extracted by different methods. The combination method is in the combination condition table 250 and is selected by the combination condition identifier. For example, when the combination condition identifier is set to 1 and the method of the identification symbol 1 corresponding to the combination condition identifier is selected from FIG. 18, either one of a standard translation pair and an appropriate translation pair corresponding to a phrase is included. The translated translation pair and the translation translation example translation pair. This prevents the exclusion of a bilingual pair that is not a standard but has appropriate sentence correspondence when only a standard bilingual pair is extracted. Conversely, if only appropriate translation pairs corresponding to words / phrases are extracted, it is not possible to say that the word / phrase correspondences are not appropriate, but it is possible to prevent a standard translation pair from being excluded. If there is any other suitable bilingual pair extraction method, the extraction method can be added to the appropriate bilingual extraction unit 201 as appropriate, and the result can be added to the combination condition table 250 by adding the combination conditions of the other extraction methods. When the bilingual pair extracted according to the notation of the Japanese-English correspondence table of FIG. 11 is shown, the standard bilingual pair is “3: 3”,
"5: 6", and the translated pair with the corresponding phrase is "4: 4".
5 "and" 6: 7 ", the bilingual example collection of FIG.
“3: 3”, “4: 4,5”, “5: 6”, “6: 7”
4 translations are included.

【0079】次に、翻訳処理について説明するが、この
説明では上述したように作成された対訳用例集300を
使わない場合と使う場合(定型な対訳対を用いて翻訳す
る場合)について図19を用いて説明する。太字ゴシッ
ク文字は、入力文と類似文の差分部分、類似文の差分部
分に対応する英語文の部分、類似文の差分部分に対応す
る英語文の部分を入力文の差分部分の英訳で置換した部
分を表す。
Next, the translation process will be described. In this description, FIG. 19 shows a case where the bilingual example book 300 created as described above is not used and a case where it is used (a case where translation is performed using a fixed translation pair). It will be described using FIG. For bold Gothic characters, the difference between the input sentence and the similar sentence, the portion of the English sentence corresponding to the difference between the similar sentences, and the portion of the English sentence corresponding to the difference between the similar sentences are replaced with the English translation of the difference between the input sentences Represents a part.

【0080】上述したように、作成された対訳用例集3
00を用いず、文対応テキストをそのまま対訳用例集と
し、入力文入力部400から、入力文“全般に相場は低
調。”が読み込まれた場合、類似文検索部500におい
て、対訳用例集から入力文に類似した日本語文が検索さ
れる。様々な類似文検索方法があるが、文字の一致数が
多い文を類似文とする。但し、類似文検索方法はこの方
法以外のものを利用することもできる。類似文検索部5
00の検索結果は、日本語文1,3,5“全般に商いは
低調。”となる。以後、複数検索された場合は文番号の
最も小さいものを選ぶことにすると、ここでは、日本語
文1の対訳対が選択される。但し、この方法に限定され
ない。
As described above, the prepared bilingual translation example book 3
When the input sentence “Generally the price is low.” Is read from the input sentence input unit 400 and the sentence corresponding text is directly used as the bilingual example collection without using 00, the similar sentence search unit 500 inputs from the bilingual example collection. A Japanese sentence similar to the sentence is searched. Although there are various similar sentence search methods, a sentence having a large number of matching characters is regarded as a similar sentence. However, a similar sentence search method other than this method can be used. Similar sentence search unit 5
The search result of "00" is Japanese sentences 1, 3, and 5 "Trading is generally low." Thereafter, if a plurality of searches are made, the one with the smallest sentence number is selected. Here, a bilingual pair of Japanese sentence 1 is selected. However, it is not limited to this method.

【0081】差分対応部600では、入力文の「相場」
と類似文「商い」が差分部分であるとわかるが、類似文
の差分部分「商い」に対応する英語文の部分は図16の
対訳辞書と対訳対“1:1”からは見つからない。以
後、対訳対の間で差分部分の語句対応がない場合は、差
分部分の置換を行わないとすると、文加工部700では
何も処理を行わず、訳文出力部800から“Aug.Nikkei
225 call options mostly fell and many puts firmed
Monday morning.”が出力される。しかし、この出力文
は入力文の対訳として不適切な訳である。
In the difference correspondence unit 600, the “quote”
It can be seen that the similar sentence "Trading" is a difference portion, but the English sentence portion corresponding to the difference portion "Trading" of the similar sentence cannot be found from the bilingual dictionary and the bilingual pair "1: 1" in FIG. Thereafter, when there is no word correspondence of the difference portion between the parallel translation pairs, if the replacement of the difference portion is not performed, the sentence processing section 700 does not perform any processing, and the translation output section 800 outputs “Aug. Nikkei”.
225 call options mostly fell and many puts firmed
Monday morning. "Is output, but this output sentence is inappropriate as a translation of the input sentence.

【0082】そこで、上述したように本発明で作成した
対訳用例集300を用いて、入力文入力部400から、
同じ入力文“全般に相場は低調。”が読み込まれた場
合、類似文検索部500の検索した結果は、日本語文
3,5“全般に商いは低調。”となる。ここでは、文番
号の最も小さい日本語文3を持つ対訳対を翻訳に用いる
とする。差分対応部600で入力文の「相場」と類似文
の「商い」が差分部分であり、類似文の差分部分「商
い」に対応する英語文の部分は図16の対訳辞書と対訳
対“3:3”から「Trading 」である。また、入力文の
差分部分「相場」に対応する英語は図16の対訳辞書か
ら「market」である。よって、文加工部700で、入力
文に対し、対訳対“3:3”の差分部分を置換して作成
される訳文は“Market was generally muted. ”とな
る。最後に、解析情報を用いて訳文を整え、“The mark
et was generally muted. ”を訳文出力部800から出
力する。この出力文は入力文に対し適切な訳となってい
る。
Therefore, the input sentence input unit 400 uses the bilingual example book 300 created by the present invention as described above to
When the same input sentence “Generally the market is low” is read, the similar sentence search unit 500 searches for Japanese sentences 3 and 5 “General trade is low.” Here, it is assumed that a translation pair having Japanese sentence 3 with the smallest sentence number is used for translation. In the difference correspondence unit 600, “quote” of the input sentence and “business” of the similar sentence are difference portions, and the English sentence corresponding to the difference portion “business” of the similar sentence is the bilingual dictionary and the bilingual pair “3” in FIG. : 3 ”to“ Trading ”. Further, the English corresponding to the difference part “quote” of the input sentence is “market” from the bilingual dictionary of FIG. Therefore, the sentence processing section 700 replaces the input sentence with the difference part of the bilingual pair “3: 3”, and the translated sentence is “Market was generally muted.” Finally, the translation is prepared using the analysis information, and “The mark
et was generally muted. "is output from the translation output unit 800. This output sentence is appropriate for the input sentence.

【0083】別の翻訳処理の例として、ここで本発明に
よって作成された対訳用例集300を使わない場合と使
う場合(語句対応が適切な対訳対を用いて翻訳する場
合)について図20を用いて説明する。太字ゴシック文
字は、入力文と類似文の差分部分、類似文の差分部分に
対応する英語文の部分、類似文の差分部分に対応する英
語文の部分を入力文の差分部分の英訳で置換した部分を
表す。
As another example of the translation processing, FIG. 20 is used for a case where the bilingual translation example book 300 created according to the present invention is not used and a case where it is used (a case where translation is performed using an appropriate bilingual translation pair). Will be explained. For bold Gothic characters, the difference between the input sentence and the similar sentence, the portion of the English sentence corresponding to the difference between the similar sentences, and the portion of the English sentence corresponding to the difference between the similar sentences are replaced with the English translation of the difference between the input sentences Represents a part.

【0084】本発明によって作成された対訳用例集30
0を用いず、文対応テキストをそのまま対訳用例集と
し、入力文入力部400から、入力文“商いは全般に模
様眺めムードが強い。”という文が読み込まれた場合、
類似文検索部500の検索結果は、日本語文2“商いは
全般に模様眺めムードが強い。”となる。入力文と類似
文は一致するので、差分対応部600と文加工部700
は何も行わず、訳文出力部800から、“The tarding
was cautious ahead of the release of U.S.jobs dat
a. ”を出力するが、この出力文は入力文の「商い」と
訳文の「trading 」の部分しか語句対応が取れず、入力
文に対して不適切な訳が出力されている。
The bilingual example book 30 created by the present invention
If the sentence-corresponding text is directly used as a bilingual example collection without using 0, and the input sentence “Trading is generally strong in pattern-viewing mood” is read from the input sentence input unit 400,
The search result of the similar sentence search unit 500 is Japanese sentence 2 “Trading is generally strong in pattern-view mood.” Since the input sentence and the similar sentence match, the difference correspondence unit 600 and the sentence processing unit 700
Does nothing, and the translation output unit 800 outputs “The tarding
was cautious ahead of the release of USjobs dat
a. ”is output, but this output sentence has a word correspondence only in the“ trading ”part of the input sentence and“ trading ”of the translated sentence, and an inappropriate translation is output for the input sentence.

【0085】そこで、本発明で作成した対訳用例集30
0を用いて、入力文入力部400から、同じ入力文“商
いは全般に模様眺めムードが強い。”が読み込まれた場
合、類似文検索部500の検索結果は日本語文6“相場
は全般に模様眺めムードが強い。”となる。次に、差分
対応部600で入力文の「商い」と類似文の「相場」が
差分部分であるとわかり、類似文の差分部分「相場」に
対応する英語文の部分は図16の日英対訳辞書と対訳対
“6:7”から「market」である。また、入力文の差分
部分「商い」に対応する英語は図16の日英対訳辞書か
ら「trading 」である。よって、文加工部700で、入
力文に対し、対訳対“6:7”の差分部分を置換して作
成される訳文は“The trading was a wait-and-see moo
d.”となる。最後に、解析情報も用いて訳文を整え、
“Trading was a wait-and-see mood.”を訳文出力部8
00から出力する。この出力文は入力文に対し語句対応
の取れた翻訳となっている。
Therefore, the bilingual translation example book 30 created by the present invention is used.
When the same input sentence “Trading is generally strong in pattern view mood.” Is read from the input sentence input unit 400 using 0, the search result of the similar sentence search unit 500 is Japanese sentence 6 “The market price is generally The pattern view mood is strong. " Next, the difference correspondence unit 600 finds that the “quote” of the input sentence and the “quote” of the similar sentence are difference portions, and the English sentence portion corresponding to the difference portion “quote” of the similar sentence is the Japanese / English of FIG. The bilingual dictionary and the bilingual pair “6: 7” are “market”. In addition, the English corresponding to the difference part “business” of the input sentence is “trading” from the Japanese-English bilingual dictionary of FIG. Therefore, the sentence processing unit 700 replaces the difference part of the bilingual pair “6: 7” with the input sentence to create a translated sentence “The trading was a wait-and-see moo.
d. ”Finally, prepare the translation using the analysis information,
"Trading was a wait-and-see mood."
Output from 00. This output sentence is a translation that is compatible with words and phrases with respect to the input sentence.

【0086】別の翻訳処理の例として、ここで本発明に
よって作成された対訳用例集300が定型的な対訳対だ
けからなる場合と、定型的な対訳対と語句対応の適切な
対訳対のどちらか一方でも含んでいる対訳対からなる場
合について図21を用いて説明する。太字ゴシック文字
は、入力文と類似文の差分部分、類似文の差分部分に対
応する英語文の部分、類似文の差分部分に対応する英語
文の部分を入力文の差分部分の英訳で置換した部分を表
す。
As another example of the translation processing, here, the bilingual translation example book 300 created according to the present invention is composed of only a fixed bilingual pair, and is either a fixed bilingual pair or an appropriate bilingual pair corresponding to a phrase. A case of a bilingual pair including one or the other will be described with reference to FIG. For bold Gothic characters, the difference between the input sentence and the similar sentence, the portion of the English sentence corresponding to the difference between the similar sentences, and the portion of the English sentence corresponding to the difference between the similar sentences are replaced with the English translation of the difference between the input sentences Represents a part.

【0087】対訳用例集300が定型的な対訳対のみで
あるとし(対訳対“3:3”、“5:6”)、入力文入
力部400から、入力文“NTT、KDDが下げ、NT
Tドコモが年初来安値を更新した。”が読み込まれた場
合、類似文検索部500の検索結果は、何も得られない
ので、差分対応部600と文加工部700は行われず、
訳文出力部800から訳文が得られない。しかし、定型
的な対訳対の抽出では除かれた対訳対の中には、文対応
が適切で入力文に類似している対訳文“4:4,5”が
存在している。
Assuming that the bilingual translation example collection 300 is only a fixed bilingual translation pair (parallel translation pairs “3: 3”, “5: 6”), the input sentences “NTT, KDD” are lowered from the input sentence input unit 400 to NT
T Docomo has hit a new low for the year. Is read, nothing is obtained as a search result of the similar sentence search unit 500, so that the difference handling unit 600 and the sentence processing unit 700 are not performed.
No translated sentence can be obtained from translated sentence output section 800. However, among the bilingual pairs excluded in the standard bilingual pair extraction, there is a bilingual sentence “4: 4, 5” whose sentence correspondence is appropriate and which is similar to the input sentence.

【0088】そこで、対訳用例集300が定型的な対訳
対と語句対応のとれた対訳対であるとし、入力文入力部
400から、同じ入力文“NTT、KDD、DDIが下
げ、NTTドコモが年初来安値を更新した。”が読み込
まれた場合、類似文検索部500の検索結果は、日本語
文4“PHモリス、IBM、アップルが下げ、TIが年
初来安値を更新した。”となる。次に、差分対応部60
0で入力文の「NTT、KDD、DDI」と類似文の
「PHモリス、IBM、アップル」が差分部分であり、
また、入力文の「NTTドコモ」と類似文の「TI」が
差分部分である。図16の日英対訳辞書と対訳対“4:
4,5”から、類似文の差分部分「PHモリス、IB
M、アップル」に対する英語の部分は「Philip Morris,
IBM and Apple Computer」であり、また、「TI」に対
応する英語文の部分は「Texas Instruments 」である。
図16の日英対訳辞書などにより、入力文の差分部分
「NTT、KDD、DDI」に対する英語部分は「NTT,
KDD and DDI」であり、また、「NTTドコモ」に対応
する英語は「NTT Docomo」である。よって、文加工部7
00で、入力文に対し、対訳対“4:4,5”の差分部
分を置換して作成される訳文は、“NTT Docomo hit a y
ear's low.Among other decliners were NTT,KDD and D
DI. ”となり、訳文出力部800から出力する。この出
力文は入力文に対し適切な翻訳結果となっている。
Therefore, it is assumed that the bilingual translation example collection 300 is a fixed translation bilingual pair and a bilingual translation pair having correspondence between words and phrases. From the input sentence input unit 400, the same input sentence “NTT, KDD, DDI is lowered, and NTT DoCoMo is Is read, the search result of the similar sentence search unit 500 is Japanese sentence 4 "PH Morris, IBM, and Apple dropped, and TI updated the year-to-date low." Next, the difference correspondence unit 60
0, the input sentence "NTT, KDD, DDI" and the similar sentence "PH Morris, IBM, Apple" are the difference parts,
Also, the input sentence “NTT DOCOMO” and the similar sentence “TI” are the difference parts. Japanese-English bilingual dictionary and bilingual pair "4:
4, 5 ", the difference part of the similar sentence" PH Morris, IB
The English part of "M, Apple" is "Philip Morris,
"IBM and Apple Computer", and the portion of the English sentence corresponding to "TI" is "Texas Instruments".
According to the Japanese-English bilingual dictionary in FIG. 16, the English part corresponding to the difference part “NTT, KDD, DDI” of the input sentence is “NTT,
"KDD and DDI" and the English language corresponding to "NTT Docomo" is "NTT Docomo". Therefore, the sentence processing unit 7
00, the translated sentence created by replacing the difference part of the translated sentence pair “4: 4,5” with the input sentence is “NTT Docomo hit ay”.
ear's low.Among other decliners were NTT, KDD and D
DI. "Is output from the translated sentence output unit 800. This output sentence is an appropriate translation result for the input sentence.

【0089】なお、上記実施形態の処理をプログラムと
して記録媒体に記録することにより該記録媒体を用い
て、その流通性を高めることができる。
By recording the processing of the above-described embodiment as a program on a recording medium, it is possible to use the recording medium to enhance its circulation.

【0090】[0090]

【発明の効果】以上説明したように、本発明によれば、
第1自然言語の文と第2自然言語の文の対訳対を納めた
文対応テキストから第2自然言語の文が第1自然言語の
文の適切な訳文となる対訳用例集を作成することがで
き、また、第1自然言語の入力文に対する類似文を対訳
用例集から検索し、入力文と類似文との差分を抽出し、
差分情報を用いて類似文に対応する第2自然言語の文を
機械的に加工して入力文の訳文を生成するので、文対応
付けが誤った対訳対を含むような文対応の精度が低い文
対応テキストからでも適切な対訳対に絞り込んだ対訳用
例集を作成でき、この対訳用例集を実例型自然言語翻訳
において利用することにより、適切な翻訳結果を得るこ
とができる。
As described above, according to the present invention,
It is possible to create a bilingual translation example in which a sentence in the second natural language is an appropriate translation of the sentence in the first natural language from a sentence-corresponding text containing a translated pair of a sentence in the first natural language and a sentence in the second natural language. Also, a similar sentence to the input sentence of the first natural language is searched from the bilingual example collection, and a difference between the input sentence and the similar sentence is extracted.
Since the translated sentence of the input sentence is generated by mechanically processing the sentence of the second natural language corresponding to the similar sentence using the difference information, the accuracy of sentence correspondence including a wrong translated sentence pair is low. It is possible to create a bilingual example collection narrowed down to an appropriate bilingual pair even from a sentence-corresponding text, and to use this bilingual example collection in an example-type natural language translation, it is possible to obtain an appropriate translation result.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態に係る実例型自然言語翻訳
方法及び対訳用例集作成方法を実施する実例型自然言語
翻訳装置の動作原理を示すフローチャートである。
FIG. 1 is a flowchart illustrating the operation principle of an example natural language translation apparatus that implements an example natural language translation method and a bilingual example book creation method according to an embodiment of the present invention.

【図2】図1に示した実施形態の実例型自然言語翻訳装
置及び対訳用例集作成装置の構成を示すブロック図であ
る。
FIG. 2 is a block diagram showing a configuration of an example-type natural language translating apparatus and a bilingual example book creating apparatus of the embodiment shown in FIG. 1;

【図3】図2に示した実例型自然言語翻訳装置及び対訳
用例集作成装置に使用されている対訳対絞り込み部の構
成を示すブロック図である。
FIG. 3 is a block diagram showing a configuration of a bilingual-language narrowing-down unit used in the example-type natural language translating apparatus and the bilingual example book creating apparatus shown in FIG. 2;

【図4】図3の対訳対絞り込み部で作成される対訳用例
集の例を示す図である。
FIG. 4 is a diagram showing an example of a bilingual translation example book created by the bilingual translation narrowing unit of FIG. 3;

【図5】図3に示した定型対訳抽出部の構成を示すブロ
ック図である。
FIG. 5 is a block diagram illustrating a configuration of a fixed form bilingual extraction unit illustrated in FIG. 3;

【図6】図5に示した定型対訳抽出部で使用される置換
対象辞書の例を示す図である。
FIG. 6 is a diagram showing an example of a replacement target dictionary used in the fixed phrase translation extraction unit shown in FIG. 5;

【図7】図5に示した定型対訳抽出部で抽出される定型
な対訳用例集の例を示す図である。
FIG. 7 is a diagram showing an example of a set of fixed bilingual examples extracted by the fixed bilingual extraction unit shown in FIG. 5;

【図8】図3に示した語句対応抽出部の構成を示すブロ
ック図である。
FIG. 8 is a block diagram illustrating a configuration of a phrase correspondence extraction unit illustrated in FIG. 3;

【図9】 図8に示した語句対応抽出部で使用される語
句対応対象表の例を示す図である。
9 is a diagram illustrating an example of a phrase correspondence target table used in the phrase correspondence extraction unit illustrated in FIG. 8;

【図10】図8に示した語句対応抽出部で抽出される語
句対応合格対訳用例集の例を示す図である。
FIG. 10 is a diagram showing an example of a phrase-matched successful bilingual translation example extracted by the phrase-matching extraction unit shown in FIG. 8;

【図11】日英文対応テキストの例を示す図である。FIG. 11 is a diagram showing an example of a Japanese-English text.

【図12】図11に示した日本語文の形態素解析の例を
示す図である。
FIG. 12 is a diagram illustrating an example of morphological analysis of the Japanese sentence illustrated in FIG. 11;

【図13】図11に示した英語文の形態素解析の例を示
す図である。
FIG. 13 is a diagram illustrating an example of morphological analysis of the English sentence illustrated in FIG. 11;

【図14】定型的な対訳対の抽出例を示す図である。FIG. 14 is a diagram showing an example of extraction of a fixed bilingual pair.

【図15】日英の語句対応(名詞)の例を示す図であ
る。
FIG. 15 is a diagram showing an example of correspondence between Japanese and English phrases (nouns).

【図16】日英対訳辞書の例を示す図である。FIG. 16 is a diagram showing an example of a Japanese-English bilingual dictionary.

【図17】語句対応の調査結果の例を示す図である。FIG. 17 is a diagram showing an example of a survey result corresponding to a phrase.

【図18】組合せ条件表の例を示す図である。FIG. 18 is a diagram showing an example of a combination condition table.

【図19】適切な対訳対の絞り込みの効果を示す翻訳例
を示す図である。
FIG. 19 is a diagram illustrating a translation example showing the effect of narrowing down appropriate translation pairs.

【図20】適切な対訳対の絞り込みの効果を示す別の翻
訳例を示す図である。
FIG. 20 is a diagram showing another example of translation showing the effect of narrowing down appropriate translation pairs.

【図21】適切な対訳対の絞り込みの効果を示す更に別
の翻訳例を示す図である。
FIG. 21 is a diagram showing still another example of translation showing the effect of narrowing down appropriate translation pairs.

【符号の説明】[Explanation of symbols]

100 文対応テキスト入力文 200 対訳対絞り込み部 201 適切対訳対抽出部 210 形態素解析部 220 定型対訳抽出部 230 語句対応抽出部 240 対訳用例集作成部 250 組合せ条件表 300 対訳用例集 400 入力文入力部 500 類似文検索部 600 差分対応部 700 文加工部 800 訳文出力部 900 対訳辞書 100 text-corresponding text input sentence 200 parallel-translation pair narrowing-down unit 201 appropriate parallel-translation pair extraction unit 210 morphological analysis unit 220 fixed-phrase translation extraction unit 230 word-correspondence extraction unit 240 parallel translation example collection creation unit 250 combination condition table 300 parallel translation example collection 400 input sentence input unit 500 similar sentence search unit 600 difference correspondence unit 700 sentence processing unit 800 translated sentence output unit 900 bilingual dictionary

Claims (26)

【特許請求の範囲】[Claims] 【請求項1】 第1自然言語の文と第2自然言語の文の
対である対訳対を納めた文対応テキストから、第2自然
言語の文が第1自然言語の文の適切な訳文となる対訳対
の集合である対訳用例集を作成し、 翻訳しようとする第1自然言語の入力文に対する類似文
を前記対訳用例集から検索し、 前記入力文と類似文との差分を抽出し、 この差分情報を用いて前記類似文に対応する第2自然言
語の文を機械的に加工して前記入力文の訳文を生成する
ことを特徴とする実例型自然言語翻訳方法。
1. A sentence corresponding to a sentence corresponding to a translation pair which is a pair of a sentence of a first natural language and a sentence of a second natural language, the sentence of the second natural language is determined as an appropriate translation of the sentence of the first natural language. Creating a bilingual example set, which is a set of bilingual pairs, searching for a similar sentence to the input sentence of the first natural language to be translated from the bilingual example set, extracting a difference between the input sentence and the similar sentence, An example-type natural language translation method, characterized by mechanically processing a sentence of a second natural language corresponding to the similar sentence using the difference information to generate a translated sentence of the input sentence.
【請求項2】 前記対訳用例集は、第2自然言語の文が
第1自然言語の文の適切な訳文となる対訳対を複数の異
なる方法で抽出し、作成されることを特徴とする請求項
1記載の実例型自然言語翻訳方法。
2. The bilingual translation example collection is created by extracting a bilingual pair in which a sentence of a second natural language is an appropriate translation of a sentence of a first natural language by a plurality of different methods. Item 4. The example-type natural language translation method according to Item 1.
【請求項3】 前記複数の異なる方法の一方法として、
文対応テキストに頻出する良く類似した対訳対を定型的
な対訳対として抽出することを特徴とする請求項2記載
の実例型自然言語翻訳方法。
3. One of the plurality of different methods includes:
3. The example-type natural language translation method according to claim 2, wherein a bilingual pair that is frequently similar to the sentence-corresponding text is extracted as a fixed bilingual pair.
【請求項4】 前記複数の異なる方法の一方法として、
第1自然言語の文と第2自然言語の文の間で語句の対応
を調べ、文全体で語句対応が取れている対訳対を抽出す
ることを特徴とする請求項2記載の実例型自然言語翻訳
方法。
4. One of the plurality of different methods includes:
3. The example-type natural language according to claim 2, wherein a correspondence between words and phrases between a sentence of the first natural language and a sentence of the second natural language is checked, and a bilingual pair having a word correspondence in the entire sentence is extracted. Translation method.
【請求項5】 前記文対応テキストは、文対応の付いて
いない第1自然言語のテキストと第2自然言語のテキス
トから人手および機械によって文対応付けされた対で構
成することを特徴とする請求項1記載の実例型自然言語
翻訳方法。
5. The text according to claim 1, wherein the text corresponding to the first natural language and the text of the second natural language to which the text does not correspond have a sentence matched manually and manually. Item 4. The example-type natural language translation method according to Item 1.
【請求項6】 第1自然言語の文と第2自然言語の文の
対である対訳対を納めた文対応テキストから、第2自然
言語の文が第1自然言語の文の適切な訳文となる対訳対
に絞り込んで、対訳用例集を作成することを特徴とする
対訳用例集作成方法。
6. A sentence corresponding to a sentence of a first natural language sentence and a second natural language sentence, and a second natural language sentence is converted to an appropriate translated sentence of the first natural language sentence. A bilingual example collection creating method, wherein a bilingual example set is created by narrowing down to a bilingual pair.
【請求項7】 前記対訳用例集は、複数の異なる方法で
抽出した、第2自然言語の文が第1自然言語の文の適切
な訳文となる対訳対を組み合わせて作成されることを特
徴とする請求項6記載の対訳用例集作成方法。
7. The bilingual example set is created by combining a pair of bilingual sentences extracted by a plurality of different methods, the sentences of the second natural language being appropriate translations of the sentences of the first natural language. 7. The method for creating a bilingual example book according to claim 6.
【請求項8】 前記複数の異なる方法の一方法として、
文対応テキストに頻出する良く類似した対訳対を定型的
な対訳対として抽出することを特徴とする請求項7記載
の対訳用例集作成方法。
8. One of the plurality of different methods includes:
8. The bilingual translation example collection creating method according to claim 7, wherein a bilingual pair that is frequently similar to the text corresponding to the sentence is extracted as a fixed bilingual pair.
【請求項9】 前記複数の異なる方法の一方法として、
第1自然言語の文と第2自然言語の文の間で語句の対応
を調べ、文全体で語句対応が取れている対訳対を抽出す
ることを特徴とする請求項7記載の対訳用例集作成方
法。
9. One of the plurality of different methods includes:
8. The bilingual example book creation according to claim 7, wherein a correspondence between words and phrases between a sentence of the first natural language and a sentence of the second natural language is checked, and a bilingual pair having a word / phrase correspondence in the entire sentence is extracted. Method.
【請求項10】 前記文対応テキストは、文対応の付い
ていない第1自然言語のテキストと第2自然言語のテキ
ストから人手および機械によって文対応付けされた対で
構成することを特徴とする請求項6記載の対訳用例集作
成方法。
10. The text according to claim 1, wherein the text corresponding to the first natural language and the text of the second natural language to which no text corresponding to the text is attached are manually and mechanically paired by a machine. A method for creating a bilingual example book according to item 6.
【請求項11】 第1自然言語の文と第2自然言語の文
の対を納めた文対応テキストを読み込む文対応テキスト
入力手段と、 前記文対応テキストから第2自然言語の文が第1自然言
語の文の適切な訳文となる対で絞り込んで対訳用例集を
作成する対訳対絞り込み手段と、 翻訳しようとする第1自然言語の文を入力する入力文入
力手段と、 この入力文に対する類似文を前記対訳用例集から検索す
る類似文検索手段と、 前記入力文と類似文で差分を取り、第1自然言語と第2
自然言語の語句の対応が記載された対訳辞書を用いて類
似文の差分部分と対応する第2自然言語文の部分の語句
対応を取り、入力文の差分部分に対応する第2自然言語
の訳を得る差分対応手段と、 差分情報を用いて前記類似文に対応する第2自然言語の
文を機械的に加工する文加工手段と、 前記入力文の訳文を生成し出力する訳文出力手段とを有
することを特徴とする実例型自然言語翻訳装置。
11. A sentence-corresponding text input means for reading a sentence-corresponding text containing a pair of a sentence of a first natural language and a sentence of a second natural language; A bilingual pair narrowing means for narrowing down to an appropriate translation of a language sentence to create a bilingual example book, an input sentence inputting means for inputting a first natural language sentence to be translated, and a similar sentence for the input sentence A similar sentence search means for searching for the input sentence and the similar sentence from the bilingual example collection,
Using a bilingual dictionary in which the correspondence between natural language terms is described, a phrase correspondence between the difference part of the similar sentence and the second natural language sentence corresponding to the difference part of the input sentence is obtained. A sentence processing means for mechanically processing a sentence of the second natural language corresponding to the similar sentence using difference information; and a translated sentence output means for generating and outputting a translated sentence of the input sentence. An example-type natural language translator characterized by having.
【請求項12】 前記対訳対絞り込み手段は、前記文対
応テキストから複数の異なる適切な対訳対を抽出する適
切対訳対抽出手段と、該適切対訳対抽出手段で抽出され
た対訳対を組合せ条件表と組合せ条件識別子を用いて組
み合わせて対訳用例集を作成する対訳用例集作成手段と
を有することを特徴とする請求項11記載の実例型自然
言語翻訳装置。
12. The bilingual-parallel pair narrowing-down means includes a proper bilingual-pair extracting means for extracting a plurality of different proper bilingual pairs from the sentence-corresponding text, and a combination condition table combining the bilingual pairs extracted by the proper bilingual-pair extracting means. 13. The example-type natural language translation apparatus according to claim 11, further comprising: a bilingual example collection creating unit configured to create a bilingual example set by combining with the combination condition identifier.
【請求項13】 前記適切対訳対抽出手段は、前記文対
応テキストから語句の言語情報を取得するために形態素
解析を行う形態素解析手段と、この形態素解析済みの文
対応テキストから定型な対訳対を抽出する定型対訳抽出
手段と、前記形態素解析済みの文対応テキストから文全
体で語句対応の取れた対訳対を抽出する語句対応抽出手
段とを有することを特徴とする請求項12記載の実例型
自然言語翻訳装置。
13. The suitable bilingual pair extraction means, comprising: a morphological analysis means for performing morphological analysis to obtain linguistic information of a phrase from the sentence corresponding text; and a fixed bilingual pair from the morphologically analyzed sentence corresponding text. 13. The example-type natural language according to claim 12, comprising: a fixed-form bilingual extraction means for extracting; and a phrase correspondence extracting means for extracting a bilingual pair in which the whole sentence has a phrase correspondence from the morphologically analyzed sentence-corresponding text. Language translator.
【請求項14】 第1自然言語の文と第2自然言語の文
の対を納めた文対応テキストを読み込む文対応テキスト
入力手段と、 前記文対応テキストから第2自然言語の文が第1自然言
語の文の適切な訳文となる対で絞り込んで対訳用例集を
作成する対訳対絞り込み手段とを有することを特徴とす
る対訳用例集作成装置。
14. A sentence-corresponding text input means for reading a sentence-corresponding text containing a pair of a sentence of a first natural language and a sentence of a second natural language; A bilingual translation example narrowing-down device for narrowing down a translation to a pair that becomes an appropriate translation of a language sentence to generate a bilingual translation example collection.
【請求項15】 前記対訳対絞り込み手段は、前記文対
応テキストから複数の異なる適切な対訳対を抽出する適
切対訳対抽出手段と、該適切対訳対抽出手段で抽出され
た対訳対を組合せ条件表と組合せ条件識別子を用いて組
み合わせて対訳用例集を作成する対訳用例集作成手段と
を有することを特徴とする請求項14記載の対訳用例集
作成装置。
15. The bilingual-parallel pair narrowing-down means includes a proper bilingual-pair extracting means for extracting a plurality of different suitable bilingual pairs from the sentence-corresponding text, and a combination condition table combining the bilingual pairs extracted by the proper bilingual-pair extracting means. 15. The bilingual example book creating apparatus according to claim 14, further comprising: a bilingual example book creating unit that creates a bilingual example book by combining the bilingual example set with the combination condition identifier.
【請求項16】 前記適切対訳対抽出手段は、前記文対
応テキストから語句の言語情報を取得するために形態素
解析を行う形態素解析手段と、この形態素解析済みの文
対応テキストから定型な対訳対を抽出する定型対訳抽出
手段と、前記形態素解析済みの文対応テキストから文全
体で語句対応の取れた対訳対を抽出する語句対応抽出手
段とを有することを特徴とする請求項15記載の対訳用
例集作成装置。
16. The suitable bilingual pair extracting means includes a morphological analysis means for performing morphological analysis to obtain language information of a phrase from the sentence corresponding text, and a fixed bilingual pair from the morphologically analyzed sentence corresponding text. 16. The bilingual example collection according to claim 15, further comprising: a fixed form bilingual extraction means for extracting, and a phrase correspondence extracting means for extracting a bilingual pair in which the whole sentence has a phrase correspondence from the morphologically analyzed sentence corresponding text. Creating device.
【請求項17】 第1自然言語の文と第2自然言語の文
の対である対訳対を納めた文対応テキストから、第2自
然言語の文が第1自然言語の文の適切な訳文となる対訳
対の集合である対訳用例集を作成し、 翻訳しようとする第1自然言語の入力文に対する類似文
を前記対訳用例集から検索し、 前記入力文と類似文との差分を抽出し、 この差分情報を用いて前記類似文に対応する第2自然言
語の文を機械的に加工して前記入力文の訳文を生成する
ことを特徴とする実例型自然言語翻訳プログラムを記録
した記録媒体。
17. A sentence corresponding to a sentence in which a translation pair, which is a pair of a sentence of a first natural language and a sentence of a second natural language, is inserted into an appropriate translation of the sentence of the first natural language. A bilingual example set, which is a set of bilingual pairs, is searched from the bilingual example set for a similar sentence to the input sentence of the first natural language to be translated, and a difference between the input sentence and the similar sentence is extracted; A recording medium storing an example-type natural language translation program, wherein a sentence of a second natural language corresponding to the similar sentence is mechanically processed using the difference information to generate a translated sentence of the input sentence.
【請求項18】 前記対訳用例集は、第2自然言語の文
が第1自然言語の文の適切な訳文となる対訳対を複数の
異なる方法で抽出し、作成されることを特徴とする請求
項17記載の実例型自然言語翻訳プログラムを記録した
記録媒体。
18. The bilingual example set is created by extracting a bilingual pair in which a sentence of a second natural language is an appropriate translation of a sentence of a first natural language by a plurality of different methods. Item 18. A recording medium on which the example-type natural language translation program according to Item 17 is recorded.
【請求項19】 前記複数の異なる方法の一方法とし
て、文対応テキストに頻出する良く類似した対訳対を定
型的な対訳対として抽出することを特徴とする請求項1
8記載の実例型自然言語翻訳プログラムを記録した記録
媒体。
19. A method according to claim 1, wherein, as one of the plurality of different methods, a bilingual pair that is frequently similar to the sentence-corresponding text is extracted as a fixed bilingual pair.
8. A recording medium on which the example-type natural language translation program described in 8 is recorded.
【請求項20】 前記複数の異なる方法の一方法とし
て、第1自然言語の文と第2自然言語の文の間で語句の
対応を調べ、文全体で語句対応が取れている対訳対を抽
出することを特徴とする請求項18記載の実例型自然言
語翻訳プログラムを記録した記録媒体。
20. As one of the plurality of different methods, a correspondence between words and phrases between a sentence in a first natural language and a sentence in a second natural language is checked, and a translation pair having a word / phrase correspondence in the entire sentence is extracted. 19. A recording medium on which the example-type natural language translation program according to claim 18 is recorded.
【請求項21】 前記文対応テキストは、文対応の付い
ていない第1自然言語のテキストと第2自然言語のテキ
ストから人手および機械によって文対応付けされた対で
構成することを特徴とする請求項17記載の実例型自然
言語翻訳プログラムを記録した記録媒体。
21. The sentence-corresponding text is composed of a pair in which a sentence is associated with a text of a first natural language and a text of a second natural language that have no sentence correspondence by hand and machine. Item 18. A recording medium on which the example-type natural language translation program according to Item 17 is recorded.
【請求項22】 第1自然言語の文と第2自然言語の文
の対である対訳対を納めた文対応テキストから、第2自
然言語の文が第1自然言語の文の適切な訳文となる対訳
対に絞り込んで、対訳用例集を作成することを特徴とす
る対訳用例集作成プログラムを記録した記録媒体。
22. A sentence corresponding to a sentence corresponding to a first natural language sentence and a second natural language sentence, and a second natural language sentence is converted to an appropriate translated sentence of the first natural language sentence. A recording medium storing a bilingual example book creation program, wherein a bilingual example set is created by narrowing down to a bilingual pair.
【請求項23】 前記対訳用例集は、複数の異なる方法
で抽出した、第2自然言語の文が第1自然言語の文の適
切な訳文となる対訳対を組み合わせて作成されることを
特徴とする請求項22記載の対訳用例集作成プログラム
を記録した記録媒体。
23. The bilingual example set is created by combining a pair of bilingual sentences extracted by a plurality of different methods so that the second natural language sentence is an appropriate translation of the first natural language sentence. 23. A recording medium storing the bilingual example book creation program according to claim 22.
【請求項24】 前記複数の異なる方法の一方法とし
て、文対応テキストに頻出する良く類似した対訳対を定
型的な対訳対として抽出することを特徴とする請求項2
3記載の対訳用例集作成プログラムを記録した記録媒
体。
24. As one of the plurality of different methods, a bilingual pair that is frequently similar to a sentence-corresponding text is extracted as a fixed bilingual pair.
3. A recording medium on which the bilingual example book creation program described in 3 is recorded.
【請求項25】 前記複数の異なる方法の一方法とし
て、第1自然言語の文と第2自然言語の文の間で語句の
対応を調べ、文全体で語句対応が取れている対訳対を抽
出することを特徴とする請求項23記載の対訳用例集作
成プログラムを記録した記録媒体。
25. As one of the plurality of different methods, a correspondence between words and phrases between a sentence in a first natural language and a sentence in a second natural language is checked, and a translation pair having a word / phrase correspondence in the entire sentence is extracted. 24. A recording medium on which the bilingual example book creation program according to claim 23 is recorded.
【請求項26】 前記文対応テキストは、文対応の付い
ていない第1自然言語のテキストと第2自然言語のテキ
ストから人手および機械によって文対応付けされた対で
構成することを特徴とする請求項22記載の対訳用例集
作成プログラムを記録した記録媒体。
26. The sentence-corresponding text is composed of a pair of a sentence of a first natural language text and a text of a second natural language, to which no sentence correspondence is attached, which is manually and manually matched by a machine. A recording medium recording the bilingual example book creation program according to item 22.
JP11049129A 1999-02-25 1999-02-25 Example type natural language translation method, production method and device for list of bilingual examples and recording medium recording program of the production method and device Pending JP2000250913A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11049129A JP2000250913A (en) 1999-02-25 1999-02-25 Example type natural language translation method, production method and device for list of bilingual examples and recording medium recording program of the production method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11049129A JP2000250913A (en) 1999-02-25 1999-02-25 Example type natural language translation method, production method and device for list of bilingual examples and recording medium recording program of the production method and device

Publications (1)

Publication Number Publication Date
JP2000250913A true JP2000250913A (en) 2000-09-14

Family

ID=12822466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11049129A Pending JP2000250913A (en) 1999-02-25 1999-02-25 Example type natural language translation method, production method and device for list of bilingual examples and recording medium recording program of the production method and device

Country Status (1)

Country Link
JP (1) JP2000250913A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006012168A (en) * 2004-06-24 2006-01-12 Sharp Corp Method for improving coverage and quality in translation memory system
JP2009015512A (en) * 2007-07-03 2009-01-22 Toshiba Corp Machine translation device, method, and program
JP2009289219A (en) * 2008-05-30 2009-12-10 Fuji Xerox Co Ltd Translation-memory translation device and translation program
US8571869B2 (en) 2005-02-28 2013-10-29 Nuance Communications, Inc. Natural language system and method based on unisolated performance metric
US8612229B2 (en) 2005-12-15 2013-12-17 Nuance Communications, Inc. Method and system for conveying an example in a natural language understanding application

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006012168A (en) * 2004-06-24 2006-01-12 Sharp Corp Method for improving coverage and quality in translation memory system
US8571869B2 (en) 2005-02-28 2013-10-29 Nuance Communications, Inc. Natural language system and method based on unisolated performance metric
US8977549B2 (en) 2005-02-28 2015-03-10 Nuance Communications, Inc. Natural language system and method based on unisolated performance metric
US8612229B2 (en) 2005-12-15 2013-12-17 Nuance Communications, Inc. Method and system for conveying an example in a natural language understanding application
US9384190B2 (en) 2005-12-15 2016-07-05 Nuance Communications, Inc. Method and system for conveying an example in a natural language understanding application
US10192543B2 (en) 2005-12-15 2019-01-29 Nuance Communications, Inc. Method and system for conveying an example in a natural language understanding application
JP2009015512A (en) * 2007-07-03 2009-01-22 Toshiba Corp Machine translation device, method, and program
JP2009289219A (en) * 2008-05-30 2009-12-10 Fuji Xerox Co Ltd Translation-memory translation device and translation program

Similar Documents

Publication Publication Date Title
KR101130444B1 (en) System for identifying paraphrases using machine translation techniques
EP1308851B1 (en) Method of calculating translation relationships among words of different languages
EP1482414B1 (en) Translating method for emphasised words
EP1306775A1 (en) Machine translation
EP1349079A1 (en) Machine translation
EP1351158A1 (en) Machine translation
EP1655674A2 (en) THIRD LANGUAGE TEXT GENERATING ALGORITHM BY MULTI&amp;minus;LINGUAL TEXT INPUTTING AND DEVICE AND PROGRAM THEREFOR
JP2000250913A (en) Example type natural language translation method, production method and device for list of bilingual examples and recording medium recording program of the production method and device
JPH02112068A (en) System for simply displaying text
JP2003303194A (en) Idiom dictionary producing device, retrieval index producing device, document retrieving device, and their method, program, and recording medium
JPS59140582A (en) Natural language translation assisting system
JP4054353B2 (en) Machine translation apparatus and machine translation program
KR100204068B1 (en) Language translation modified method
JP2893740B2 (en) Machine translation equipment
JP2004310170A (en) Method and device for learning word pair of parallel translation and recording medium for recording learning program for word pair of parallel translation
JP3949874B2 (en) Translation translation learning method, translation translation learning device, storage medium, and translation system
JPS63109572A (en) Derivative processing system
Chambers Automatic Bilingual Terminology Extraction-A Practical Approach
CN115796194A (en) English translation system based on machine learning
JP3884001B2 (en) Language analysis system and method
JPH07334504A (en) Japanese processing system
JPH08241319A (en) Machine translation system
Chanod Multilingual Tools at the Xerox Research Centre
JPH03211669A (en) Mechanical translation device
JPH04282764A (en) Non-sentence translating device