JPH0887506A - Pattern collation type translation processor - Google Patents

Pattern collation type translation processor

Info

Publication number
JPH0887506A
JPH0887506A JP6222153A JP22215394A JPH0887506A JP H0887506 A JPH0887506 A JP H0887506A JP 6222153 A JP6222153 A JP 6222153A JP 22215394 A JP22215394 A JP 22215394A JP H0887506 A JPH0887506 A JP H0887506A
Authority
JP
Japan
Prior art keywords
pattern
translation
free part
category
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6222153A
Other languages
Japanese (ja)
Inventor
Hiroshi Tanano
裕氏 棚野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP6222153A priority Critical patent/JPH0887506A/en
Publication of JPH0887506A publication Critical patent/JPH0887506A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE: To provide a pattern collation type translation processor which can increase the freedom for production of the bilingual patterns, increase the application range of a single bilingual pattern, suppress the wrong applications of bilingual patterns, reduce the labor for production of the bilingual patterns, and also can improve the accuracy of translation processing results for the sentences of similar structures. CONSTITUTION: A pattern translation control part 3 includes a pattern collation means 8 which can perform the collation of both routine patterns when the routine parts of these patterns are coincident with each other even if the part corresponding to the free part of the routine pattern is not included in an input sentence, a syntactic category limitation means 14 which can limit a subject syntactic category of the free part, a syntactic category discrimination means 9 which discriminates the syntactic category of an input subject, a suffix word designation means 10 which designates the type of the suffix word positioned at the end of a subject of the free part of the routine pattern, a preposition designation means 11 which designates the types of a preposition and a preposition phrase or a conjunction positioned at the head of the free part of a collation pattern, a semantic category limitation means 12 which limits the semantic category of the subject core word of the free part of the routine pattern, and a semantic category collation means 13 which collates the semantic categories with each other for the input subject.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、パターン照合併用型翻
訳処理装置に関し、特に日本語の入力文テキストを目標
言語の翻訳出力文に変換するパターン照合併用型翻訳処
理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a pattern matching combined type translation processing device, and more particularly to a pattern matching combined type translation processing device for converting a Japanese input sentence text into a translated output sentence of a target language.

【0002】[0002]

【従来の技術】一般的に、翻訳処理装置は、解析及び変
換生成に関する文法ルールと原言語及び目標言語の単語
辞書データから構成され、予め各データ作成時に想定さ
れた文法的表現で書かれた構文構造の単純な文について
は、良好な翻訳処理結果を提供できるが、構文構造が複
雑であったり、特殊な言い回しであったりする文に対し
ては、正しく原言語文を解析することが困難であった。
このため、従来より、頻繁に出現する特殊な言い回しの
パターンが対訳形式にして予め登録され、入力された原
言語文と登録された対訳パターンを照合することで、複
雑な構文構造の解析を回避しつつ適切な翻訳処理結果を
得るパターン照合を併用した翻訳処理装置が提案されて
いる。この種の翻訳処理装置に関連して特開平3−11
6272号公報の「文パターン辞書を有する機械翻訳シ
ステム」が提案されている。
2. Description of the Related Art Generally, a translation processing device is composed of grammatical rules for analysis and conversion and word dictionary data of a source language and a target language, and is written in advance with a grammatical expression assumed at the time of creating each data. Good translation results can be provided for sentences with simple syntactic structure, but it is difficult to parse the source language sentence correctly for sentences with complicated syntactic structure or special phrases. Met.
For this reason, conventionally, special phrase patterns that frequently appear are registered in advance in a bilingual format, and by comparing the entered source language sentence with the registered bilingual pattern, analysis of complicated syntactic structure is avoided. Meanwhile, a translation processing apparatus has been proposed which also uses pattern matching to obtain an appropriate translation processing result. Japanese Patent Laid-Open No. 3-11 related to this type of translation processing device
The "machine translation system having a sentence pattern dictionary" of 6272 is proposed.

【0003】[0003]

【発明が解決しようとする課題】従来のパターン照合併
用型翻訳処理装置では、対訳パターンデータとして登録
されている定型パターンと訳パターンの対には任意の体
言句を当てはめ得る部分がそれぞれ設定されている。例
えば、日本語文「詳細については第5章を参照して下さ
い」を"Refer to chapter 5 for the details."と翻訳
したい場合、対訳パターンデータを「詳細についてはA
を参照して下さい」→"Refer to #A for the details."
のように登録することにより、上記日本語文の「第5
章」の部分が他の任意の体言句であっても同一の対訳パ
ターンデータによって翻訳処理することが可能である。
しかしながら、従来の手法では、この対訳パターンデー
タと照合可能な入力文は、「詳細については」「A(任
意の体言句)」「を参照して下さい」の三つの構成要素
のみからなる入力文に限定されており、例えば「本章で
は説明を省きますので、詳細については第5章を参照し
て下さい」のように、上記の構成要素のいずれにも当て
はまらない節「本章では説明を省きますので、」が付加
された入力文に対しては、対訳パターンとの照合ができ
ない。なお、上記対訳パターンにおけるA,#Aの記号
はそれぞれ定型パターン及び訳パターンにおいて任意の
体言句を当てはめ得る自由部を表すものとする。
In the conventional pattern matching combined type translation processing device, a portion to which an arbitrary phrase can be applied is set for each pair of a fixed pattern and a translation pattern registered as bilingual pattern data. There is. For example, if you want to translate the Japanese sentence "Refer to chapter 5 for the details." Into "Refer to chapter 5 for the details."
Please refer to "→" Refer to #A for the details. "
By registering as
Even if the "chapter" portion is any other phrase, it can be translated by the same bilingual pattern data.
However, in the conventional method, the input sentence that can be collated with this parallel translation pattern data is an input sentence that consists of only three components, "For details,""A (arbitrary phrase)" and "Please refer to." Section that does not apply to any of the above components, such as "For the details, please refer to Chapter 5 as it is omitted in this chapter". Therefore, the input sentence with "" added cannot be matched with the parallel translation pattern. The symbols A and #A in the bilingual pattern represent a free portion to which an arbitrary phrase can be applied in the standard pattern and the translated pattern, respectively.

【0004】また、日本語文「きっと彼は来ると思う」
を"I'm sure he comes."と翻訳したい場合、定型パター
ンの自由部が体言句でなければならないという制約か
ら、対訳パターンデータを「きっとAは来ると思う」
→"I'm sure #A comes."のように登録すると、動詞「来
る」については他の動詞への拡張がなく、訳語の"come
s"についても主語が三人称単数でなければ符合しないこ
とから、このような対訳パターンを登録することは難し
い。更に、節を自由部とすることが可能になったとして
も、対訳パターンデータ「きっとAと思う」→"I'm sur
e #A."の定型パターンの自由部Aに体言句が照合される
のは好ましくない。
In addition, the Japanese sentence "I think he will come"
If you want to translate "I'm sure he comes." Into "I'm sure he comes.", The translation pattern data is "I think A will come" because of the restriction that the free part of the fixed pattern must be a phrase.
→ If you register like "I'm sure #A comes.", There is no extension to other verbs for the verb "come", and the translation "come"
It is difficult to register such a bilingual pattern for s "because the subject does not match unless the subject is the third person singular. Furthermore, even if it becomes possible to use a clause as a free part, the bilingual pattern data I think A "→"I'm sur
It is not preferable that the phrase is matched with the free part A of the fixed pattern of "e #A.".

【0005】更に、対訳パターン例「きっとAと思う」
→"I'm sure #A."における自由部Aを存在任意としたい
場合、定型パターンの残りの部分は「きっと」と「と思
う」になるが、自由部Aの節に付随する格助詞「と」は
Aの部分が存在しない場合には、これに伴って削除させ
る必要があるため、自由部に付随する付属語等も自由部
に併せて存在任意とすることが可能でなければならな
い。
Further, an example of a parallel translation pattern "I think A"
→ If you want to make the free part A in "I'm sure #A." Optional, the rest of the standard pattern will be "probably" and "think," but the case particle attached to the section of free part A When there is no A part, it is necessary to delete "to" along with it. Therefore, it must be possible to add an accessory word attached to the free part together with the free part. .

【0006】また、定型パターンとして「Aを[Bに]
渡して下さい」([Bに]の部分は存在任意で、後置語
として格助詞「に」を指定)を登録すると、日本語文
「その本を少年に渡して下さい」が照合された際に、
「少年に」が動詞「渡す」に係っていることがわかって
初めて前置詞訳"to"が決定することから、「少年に」の
部分だけを独立に翻訳処理して"to a boy"の翻訳結果を
得ることは不可能である。
In addition, as a standard pattern, "A to [B]"
If you register "Please give me the book to the boy", the Japanese sentence "Please give the book to the boy" is registered. ,
Only when it is known that "to boy" is related to the verb "pass", the prepositional translation "to" is determined. Therefore, only "to boy" is independently translated and processed to "to a boy". It is impossible to get the translation result.

【0007】加えて、従来のパターン照合併用型翻訳処
理装置では、表層的な文字列照合により対訳パターンを
適用するかどうかを決定していることにより、対訳パタ
ーン「Aを[Bに]渡して下さい」に対して「Bに」の
訳語として前置詞"to"を付与するよう実現されても、表
層的な文字列のみの一致で対訳パターンを適用させる
と、例えば「その本を今日中に渡して下さい」のように
「Bに」の部分が人間でない場合には誤った翻訳結果を
出力する可能性がある。
In addition, in the conventional pattern matching combined type translation processing apparatus, it is determined whether or not the parallel translation pattern is applied by the superficial character string matching, so that the parallel translation pattern "A is passed to [B]" is passed. Even if it was realized by adding the preposition "to" as a translation of "B ni" to "Please", if the bilingual pattern is applied by matching only the superficial character strings, for example, "the book is handed over today. If the portion of "B to" is not human like "Please, please" there is a possibility that an incorrect translation result is output.

【0008】本発明は、上記のような課題を解消するた
めになされたもので、対訳パターン作成における自由度
を拡張し、一つの対訳パターンの適用範囲を広げると共
に、対訳パターンの誤適用を抑制し、対訳パターン作成
の労力を軽減でき、類似した構造を持つ文の翻訳処理結
果の精度を向上し得るパターン照合併用型翻訳処理装置
を提供することを目的とする。
The present invention has been made to solve the above problems, and expands the degree of freedom in creating a bilingual pattern, expands the range of application of one bilingual pattern, and suppresses the misapplication of the bilingual pattern. However, it is an object of the present invention to provide a pattern matching combined type translation processing device capable of reducing the labor of creating a parallel translation pattern and improving the accuracy of the translation processing result of a sentence having a similar structure.

【0009】[0009]

【課題を解決するための手段】本発明によれば、前述の
目的は、日本語の入力文テキストを目標言語の翻訳出力
文に変換する翻訳処理装置であって、入力文テキスト中
に固定語部分に相当する定型部及びそれ以外の任意の文
字列に対応する自由部より構成される所定のパターンが
存在する場合はこれに対応する目標言語文の訳パターン
を訳出するパターン翻訳手段を有しており、該パターン
翻訳手段が一つの対訳パターンを複数の入力文に対応可
能とするように所定のパターンの自由部に対応する部分
が入力文中に存在しない場合にも定型部が一致した場合
には照合を可能とするパターン照合手段を備える請求項
1に記載のパターン照合併用型翻訳処理装置によって達
成される。
According to the present invention, the aforementioned object is a translation processing device for converting a Japanese input sentence text into a translation output sentence of a target language, wherein a fixed word is included in the input sentence text. When there is a predetermined pattern composed of a fixed part corresponding to a part and a free part corresponding to any other character string, it has a pattern translation means for translating a translation pattern of the target language sentence corresponding to this. Even when the fixed part does not exist in the input sentence so that the pattern translation means can support one parallel translation pattern for a plurality of input sentences, the part corresponding to the free part of the predetermined pattern does not occur. Is achieved by the pattern matching combined type translation processing apparatus according to claim 1, which is provided with a pattern matching means that enables matching.

【0010】本発明によれば、前述の目的は、前記パタ
ーン翻訳手段が前記所定のパターン又は訳パターンの自
由部の対象を体言句のみならず節にも拡張し、更にその
対象を節、体言句又は名詞等の特定の構文カテゴリに限
定し得る限定手段と、入力された対象がいずれの構文カ
テゴリに属するものであるかを判別し得る判別手段とを
更に備える請求項2に記載のパターン照合併用型翻訳処
理装置によって達成される。
According to the present invention, the above-mentioned object is to extend the object of the free portion of the predetermined pattern or the translated pattern to not only a phrase but also a clause by the pattern translation means. The pattern matching according to claim 2, further comprising limiting means capable of limiting to a specific syntactic category such as a phrase or noun, and discriminating means capable of determining to which syntactic category the inputted object belongs. This is achieved by the combined translation processor.

【0011】本発明によれば、前述の目的は、前記パタ
ーン翻訳手段が前記所定のパターンの自由部の対象とな
る節、句又は語に対してその末尾に位置する後置語の種
類を任意に指定する指定手段を更に備える請求項3に記
載のパターン照合併用型翻訳処理装置によって達成され
る。
According to the present invention, the above-mentioned object is that the pattern translation means selects any kind of postpositional word located at the end of a clause, phrase or word which is a target of the free part of the predetermined pattern. This is achieved by the pattern matching combined type translation processing apparatus according to claim 3, further comprising a designating means for designating.

【0012】本発明によれば、前述の目的は、前記パタ
ーン翻訳手段が前記訳パターンの自由部に対してその先
頭に位置する前置詞及び前置詞句又は接続詞の種類を任
意に指定する指定手段を更に備える請求項4に記載のパ
ターン照合併用型翻訳処理装置によって達成される。
According to the present invention, the above-mentioned object further comprises a designating means for designating the preposition located at the head of the free part of the translated pattern and the type of the prepositional phrase or the connective as desired. This is achieved by the translation processing device with combined pattern matching according to claim 4.

【0013】本発明によれば、前述の目的は、前記パタ
ーン翻訳手段が前記所定のパターンの自由部の対象とな
る節、句又は語に対してその中心となる語の意味カテゴ
リを限定する限定手段と、入力された対象に関してその
意味カテゴリを照合する照合手段とを更に備える請求項
5に記載のパターン照合併用型翻訳処理装置によって達
成される。
According to the present invention, the aforementioned object is to limit the meaning category of the central word to the clause, phrase or word targeted by the free portion of the predetermined pattern by the pattern translation means. The translation processing device according to claim 5, further comprising: a means and a matching means for matching the semantic category of the input object.

【0014】[0014]

【作用】請求項1に記載のパターン照合併用型翻訳処理
装置においては、パターン翻訳手段により、入力された
日本語文中にの固定語部分に相当する定型部及びそれ以
外の任意の文字列に対応する自由部より構成される所定
のパターンが存在する場合は対応する目標言語文の対訳
パターンを訳出するパターン翻訳処理が行われ、パター
ン照合手段により一つの対訳パターンを複数の入力文に
対応可能とするために所定のパターンの自由部に対応す
る部分が入力文中に存在しない場合にも定型部が一致し
た場合には照合が可能とされる。これにより、一つの対
訳パターンの適用範囲が広範囲となる。例えば、以下の
二つの日本語文「詳細については第5章を参照して下さ
い」と「本章では説明を省きますので、詳細については
第5章を参照して下さい」の双方を一つの対訳パターン
によりまかなうことは不可能であったが、存在任意の自
由部の設定を許容することにより、以下の対訳パターン
「*A詳細についてはBを参照して下さい」→"Refer t
o #B for the details#A." を一つ登録しておくことに
より、上記の二つの文を一つの対訳パターンで包含する
ことが可能となる。なお、上記対訳パターンにおける*
Aの記号“*”は存在任意の自由部を表し、この部分に
対応する文字列が空であることを許す。
In the pattern matching combined type translation processing device according to claim 1, the pattern translation means handles the fixed part corresponding to the fixed word part in the input Japanese sentence and any other character string. When there is a predetermined pattern composed of the free part, a pattern translation process for translating a corresponding translation pattern of the target language sentence is performed, and one parallel translation pattern can correspond to a plurality of input sentences by the pattern matching means. Therefore, even if the portion corresponding to the free portion of the predetermined pattern does not exist in the input sentence, the collation is possible if the fixed portions match. As a result, the application range of one bilingual pattern becomes wide. For example, the following two Japanese sentences, "please refer to Chapter 5 for details" and "Please refer to Chapter 5 for the details because this chapter omits the explanation". However, by allowing the setting of any free part that exists, the following parallel translation pattern "* A For details, see B" → "Refer t
By registering one "#B for the details # A.", it is possible to include the above two sentences in one bilingual pattern.
The symbol "*" of A represents an existing free part, and allows the character string corresponding to this part to be empty.

【0015】請求項2に記載のパターン照合併用型翻訳
処理装置においては、構文カテゴリ限定手段により対訳
パターンの所定のパターン又は訳パターンにおける自由
部に当てはまる対象が体言句のみならず節にも拡張さ
れ、更にその対象が節、体言句又は名詞等の特定の構文
カテゴリに限定され、構文カテゴリ判別手段により入力
された対象がいずれの構文カテゴリに属するものである
かが判別される。これにより、対訳パターン作成の自由
度を拡張すると共に、その誤適用の抑制が可能となる。
所定のパターンの自由部に対して節にも適用可能とする
ことにより、例えば「*AきっとB%節%と思う]→"
I'm sure #B #A."のような対訳パターンを登録すること
で、「きっと彼は来ると思う」のように「B%節%」の
部分に節が相当する日本語文を上記対訳パターンの適用
により翻訳することができる。なお、上記対訳パターン
におけるB%節%の記号の“%節%”はこの自由部に相
当する部分が節である場合に該対訳パターンの適用を限
定することを表すものとし、これにより対訳パターンの
適用範囲をより適切に制御することが可能である。
In the pattern matching combined type translation processing device according to the second aspect, the object applicable to the predetermined pattern of the parallel translation pattern or the free part in the translation pattern is expanded not only to the phrase but also to the clause by the syntactic category limiting means. Further, the object is limited to a specific syntactic category such as a clause, a phrase or a noun, and the syntactic category discriminating means discriminates to which syntactic category the inputted object belongs. As a result, it is possible to expand the degree of freedom in creating the bilingual translation pattern and suppress its misapplication.
By making it possible to apply to a free part of a predetermined pattern, for example, "* A surely B% node% think] →"
By registering a bilingual pattern such as "I'm sure #B #A.", You can translate a Japanese sentence in which the section corresponds to "B% section%", such as "I think he will come," It can be translated by applying a pattern. In addition, "% clause%" of the symbol of B% clause% in the above-mentioned parallel translation pattern means that the application of the parallel translation pattern is limited when the portion corresponding to this free part is a clause, and by this, the parallel translation pattern It is possible to more appropriately control the application range of.

【0016】請求項3に記載のパターン照合併用型翻訳
処理装置においては、後置語指定手段により所定のパタ
ーンの自由部にあてはまり得る節、句又は語に対してそ
の末尾に位置する後置語の種類が任意に指定される。例
えば、「*AきっとB%節%と思う」→"I'm sure #B #
A." の自由部Bを存在任意としたい場合、自由部Bに相
当する部分が存在しなければ付随する格助詞「と」も削
除して対訳パターンを適用し、自由部Bに相当する部分
が存在すれば格助詞「と」が付随していることを条件と
して対訳パターンを適用することが可能となる。すなわ
ち、所定のパターンが「*Aきっと[Bと]思う」と登
録されている場合は、自由部Bが欠落している文「きっ
と思う」や、自由部Bに相当する部分が存在する「きっ
と雨が降ると思う」等の文は上記所定のパターンに照合
可能となるが、「きっと迷惑に思う」のように自由部B
に相当する部分「迷惑に」が指定後置語を「と」とする
という条件に合わないため、上記所定のパターンには照
合されず、対訳パターンの誤適用を抑制できる。なお、
上記対訳パターンにおける[Bと]の記号“[,]”は
後置語指定のある存在任意の自由部を表す。
According to another aspect of the present invention, in the pattern matching combined type translation processing device, the postword located at the end of the clause, phrase or word that can be applied to the free part of the predetermined pattern by the postword designating means. Is arbitrarily specified. For example, "* A surely B% section% think" → "I'm sure #B #
If you want to make the free part B of A. "optional, then if there is no part corresponding to the free part B, delete the accompanying case particle" to "and apply the bilingual pattern to the part corresponding to the free part B. If there is, it is possible to apply the bilingual pattern on condition that the case particle “to” is attached. That is, when the predetermined pattern is registered as “* A surely [B] think”, the sentence “I think” in which the free portion B is missing or a portion corresponding to the free portion B exists. It is possible to match sentences such as "I think it will rain" with the above-mentioned predetermined pattern.
Since the part "nuisance" corresponding to does not meet the condition that the designated postword is "to", it is not matched with the above-mentioned predetermined pattern, and the misapplication of the bilingual pattern can be suppressed. In addition,
The symbol “[,]” of [B and] in the parallel translation pattern represents an existing arbitrary free part with a postfix designation.

【0017】請求項4に記載のパターン照合併用型翻訳
処理装置においては、前置詞指定手段により訳パターン
の自由部に対してその先頭に位置する前置詞及び前置詞
句又は接続詞の種類が任意に指定される。これにより、
本来自由部の係り先の用語が如何なる単語であるかによ
って決定され、自由部に相当する節、句又は語のみから
は決定できない前置詞訳等についても、あらかじめ指定
された正確な訳語を使用することにより、例えば対訳パ
ターン「Aを[Bに]渡して下さい」→"Please hand #
A #B[to]."と登録しておけば、訳パターンの自由部#Bに
相当する部分には所定のパターンの自由部Bに相当する
名詞等の訳語に指定前置詞訳の"to"を付加した訳語を当
てはめるだけで、正確な訳文が生成される。なお、上記
対訳パターンの#B[to]における記号"[,]"は先頭に位置
する前置詞及び前置詞句又は接続詞の種類指定のある自
由部の前置詞及び前置詞句又は接続詞の訳を表す。
In the pattern matching combined type translation processing device according to the fourth aspect, the preposition designating means arbitrarily designates the type of the preposition and the preposition phrase or the conjunction located at the head of the free part of the translation pattern. . This allows
Use the pre-specified exact translation even for prepositional translations, etc. that are originally determined by the words to which the free part relates and that cannot be determined only from the clauses, phrases, or words corresponding to the free part. So, for example, the parallel translation pattern "Please pass A to [B]" → "Please hand #
If you register "A #B [to].", The part corresponding to the free part #B of the translation pattern will be designated as a translated word such as a noun corresponding to the free part B of the given pattern. An accurate translated sentence is generated simply by applying the translated word with the addition of "." Note that the symbol "[,]" in #B [to] of the above bilingual pattern indicates the preposition and preposition phrase at the beginning or the kind of conjunction. Represents the translation of a preposition and a prepositional phrase or conjunction of a free part.

【0018】請求項5に記載のパターン照合併用型翻訳
処理装置においては、意味カテゴリ限定手段により所定
のパターンの自由部にあてはまり得る節、句又は語に対
してその中心となる語の意味カテゴリが限定され、意味
カテゴリ照合手段により入力された対象に関してその意
味カテゴリが照合される。これにより、意味の違いによ
る対訳パターンの誤適用が抑止され、表層的には同じ形
の文を意味の違いにより異なった訳文とすることが可能
となる。例えば対訳パターン「Aを[Bに]$人間$渡
して下さい」→"Please hand #A #B[to]."と登録してお
くことにより、日本語文「その本を少年に渡して下さ
い」については、自由部Bに相当する部分である「少年
(に)」が指定された意味カテゴリである「人間」に含
まれる名詞であるので該対訳パターンが適用され、「そ
の本を今日中に渡して下さい」については、自由部Bに
相当する部分である「今日中(に)」が指定された意味
カテゴリである「人間」に含まれない名詞でないので、
この日本語文は表層的には対訳パターンに当てはまる
が、意味の違いにより翻訳処理には適用されない。な
お、上記対訳パターン[Bに]$人間$の記号“$人間
$”はこの自由部に相当する部分の中心語の意味カテゴ
リが人間である場合に該対訳パターンの適用を限定する
ことを表し、これにより対訳パターンの適用範囲をより
適切に制御することができる。
In the pattern matching combined type translation processing device according to the fifth aspect, the meaning category of the central word is set for the clause, phrase or word that can be applied to the free part of the predetermined pattern by the meaning category limiting means. The semantic category is collated with respect to the object limited and inputted by the semantic category collating means. As a result, it is possible to prevent erroneous application of the bilingual translation pattern due to the difference in meaning, and to convert sentences having the same shape in the surface layer into different translated sentences depending on the difference in meaning. For example, by registering the parallel translation pattern "Please give A to [B] $ human $" → "Please hand #A #B [to].", The Japanese sentence "Please give the book to the boy" With regard to, since the part corresponding to the free part B, "boy (ni)", is a noun included in the specified semantic category "human", the bilingual pattern is applied, and "the book "Please pass" is not a noun that is not included in the specified meaning category "human", which is the part corresponding to the free part B, "today (ni)",
Although this Japanese sentence corresponds to the bilingual pattern in the surface layer, it is not applied to the translation process due to the difference in meaning. The symbol "$ Human $" of $ human $ in the bilingual pattern [B] means that the application of the bilingual pattern is limited when the meaning category of the central word of the portion corresponding to the free portion is human. Thus, the range of application of the bilingual pattern can be controlled more appropriately.

【0019】[0019]

【実施例】以下、本発明のパターン照合併用型翻訳処理
装置の第1の実施例を目標言語が英語である場合につい
て、図1を参照しながら説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A first embodiment of a pattern matching combined type translation processing apparatus of the present invention will be described below with reference to FIG. 1 when the target language is English.

【0020】本実施例のパターン照合併用型翻訳処理装
置は、日本語文データを入力する入力部1と、日本語文
パターンの固定語部分に相当する定型部及びそれ以外の
任意の文字列に対応する自由部より構成される定型パタ
ーン並びにこれに対応する目標言語文の訳パターンから
なる対訳パターンを格納する対訳パターンデータベース
2と、前記入力部1より送られる入力文と対訳パターン
データベース2に記憶されている定型パターンとのパタ
ーン照合から翻訳処理結果の訳パターンへのセットまで
のパターン翻訳処理を制御するパターン翻訳手段として
のパターン翻訳制御部3と、入力文全体又はパターン翻
訳制御部3から送られる入力文部分の構文構造の解析を
行う解析処理部4と、該解析処理部4で得られた解析結
果を目標言語の構文構造に変換して目標言語文を生成す
る変換生成処理部5と、パターン翻訳制御部3又は変換
生成処理部5で生成された出力文を出力する出力部6
と、解析処理部4及び変換生成処理部5に必要なデータ
を蓄積する翻訳処理用辞書部7とを具備している。
The pattern matching combined type translation processing apparatus of this embodiment corresponds to the input section 1 for inputting Japanese sentence data, the fixed section corresponding to the fixed word portion of the Japanese sentence pattern, and any other character string. A bilingual pattern database 2 for storing a bilingual pattern composed of a fixed pattern composed of a free part and a translation pattern of a target language sentence corresponding thereto, and an input sentence sent from the input part 1 and a bilingual pattern database 2 stored therein. A pattern translation control unit 3 as a pattern translation unit for controlling the pattern translation process from the pattern matching with the existing fixed pattern to the setting of the translation process result into the translated pattern, and the entire input sentence or the input sent from the pattern translation control unit 3. The analysis processing unit 4 that analyzes the syntactic structure of the sentence portion and the analysis result obtained by the analysis processing unit 4 are used to construct the target language. A conversion generating unit 5 for generating a target language statements into the structure, the output unit 6 for outputting the output text generated by the pattern translation controller 3 or the conversion generation processing unit 5
And a translation processing dictionary unit 7 for accumulating necessary data in the analysis processing unit 4 and the conversion generation processing unit 5.

【0021】また、パターン翻訳制御部3は、図2に示
すように、一つの対訳パターンを複数の入力文に対応可
能とするために定型パターンの自由部に対応する部分が
入力文中に存在するしないにかかわらず照合を可能とす
るパターン照合手段8と、対訳パターンデータの定型パ
ターン又は訳パターンにおける自由部に当てはまる対象
を体言句のみならず節にも拡張し、更にその対象を節、
体言句又は名詞等の特定の構文カテゴリに限定し得る構
文カテゴリ限定手段14と、入力された対象がいずれの
構文カテゴリに属するものであるかを判別し得る構文カ
テゴリ判別手段9と、定型パターンの自由部にあてはま
り得る節、句又は語に対してその末尾に位置する後置語
の種類を任意に指定する後置語指定手段10と、訳パタ
ーンの自由部に対してその先頭に位置する前置詞及び前
置詞句又は接続詞の種類を任意に指定する前置詞指定手
段11と、定型パターンの自由部に当てはまり得る節、
句又は語に対してその中心となる語の意味カテゴリを限
定する意味カテゴリ限定手段12と、入力された対象に
関してその意味カテゴリを照合する意味カテゴリ照合手
段13とを備えている。
Further, as shown in FIG. 2, the pattern translation control unit 3 has a portion corresponding to the free portion of the fixed pattern in the input sentence so that one bilingual translation pattern can correspond to a plurality of input sentences. The pattern matching means 8 that enables matching regardless of whether or not, and the target applicable to the free part in the fixed pattern or the translated pattern of the bilingual pattern data is expanded to not only phrase but also clause,
A syntax category limiting unit 14 that can limit to a specific syntax category such as a phrase or a noun, a syntax category determining unit 9 that can determine to which syntax category the input object belongs, and a fixed pattern A postposition word designating means 10 for arbitrarily specifying the type of postposition word located at the end of a clause, phrase or word that can be applied to the free part, and a preposition located at the head of the free part of the translation pattern. And a preposition designating means 11 for arbitrarily designating a preposition phrase or a kind of conjunction, and a clause applicable to a free part of a fixed pattern,
It is provided with a meaning category limiting means 12 for limiting the meaning category of a central word with respect to a phrase or a word, and a meaning category matching means 13 for matching the meaning category of an input object.

【0022】次に、本実施例の作用を図3のフローチャ
ートに沿って説明する。
Next, the operation of this embodiment will be described with reference to the flowchart of FIG.

【0023】入力部1において、日本語文データから一
文が取り出され、取り出された文がパターン翻訳制御部
3へ送られる(ステップS1)。対訳パターンデータベ
ース2に対応する対訳パターンデータがあるか否かが判
断され(ステップS2)、対応する対訳パターンデータ
がない場合、パターン照合を使用せずに翻訳処理する
「通常翻訳処理とする」旨の情報フラグが設定される
(ステップS3)。また、対応する対訳パターンデータ
があると判断した場合、パターン翻訳制御部3におい
て、対訳パターンデータベース2より図5(a)に示す
ように対応する対訳パターンデータが一つ取り出され、
図5(b)及び図5(c)に示すように定型パターンと
訳パターンがそれぞれ定型部と自由部とに分けてバッフ
ァ上にセットされる。この時、定型パターンの自由部が
存在任意であるか必須であるかの区別、後置語指定があ
れがその指定後置語、「人間」「抽象概念」等の意味カ
テゴリ指定があればその意味カテゴリ、更に訳パターン
の自由部に前置詞指定があればその指定前置詞が所定の
形式でバッファ上に併記される(ステップS4)。そし
て、入力された日本語データと定型パターンが照合さ
れ、入力された日本語文データと定型パターンがマッチ
するか否かが判断される(ステップS5)。日本語文デ
ータと定型パターンがマッチしない場合、上述ステップ
S2に戻り、対応する別の対訳パターンデータとの照合
が続けられる。また、マッチすれば、入力文から各自由
部に相当する部分が抽出されてそれぞれセットされた状
態で、入力文が定型パターンにマッチングしたことを受
けて、「パターン翻訳処理とする」旨の情報フラグがセ
ットされる(ステップS6)。定型パターンの自由部の
うち、対応する訳パターンの自由部に翻訳結果が格納さ
れていないものがあるか否かが判断され(ステップS
7)、未処理の自由部があれば、対応する訳パターンの
自由部に翻訳結果が格納されていない定型パターンの自
由部に入力文から抽出されてセットされている文字列が
解析処理部へ送られる(ステップS8)。
In the input unit 1, one sentence is extracted from the Japanese sentence data, and the extracted sentence is sent to the pattern translation control unit 3 (step S1). It is judged whether or not there is the corresponding bilingual pattern data in the bilingual pattern database 2 (step S2). If there is no corresponding bilingual pattern data, the translation processing is performed without using the pattern matching. Information flag is set (step S3). If it is determined that there is the corresponding parallel translation pattern data, the pattern translation control unit 3 retrieves one corresponding parallel translation pattern data from the parallel translation pattern database 2 as shown in FIG.
As shown in FIGS. 5B and 5C, the fixed pattern and the translated pattern are separately set in the fixed portion and the free portion and set in the buffer. At this time, if the free part of the fixed pattern exists, it is discriminated whether it is optional or required, and if there is a postfix designation, the designated postword, if there is a semantic category designation such as "human" or "abstract concept", If there is a preposition designation in the meaning category and in the free part of the translation pattern, the designated preposition is also written in the buffer in a predetermined format (step S4). Then, the input Japanese data and the fixed pattern are collated, and it is determined whether or not the input Japanese sentence data and the fixed pattern match (step S5). If the Japanese sentence data and the fixed pattern do not match, the process returns to step S2, and matching with another corresponding parallel translation pattern data is continued. Also, if there is a match, in the state in which the portions corresponding to each free part are extracted from the input sentence and set, respectively, the information that “the pattern translation process is performed” is received in response to the input sentence matching the fixed pattern. The flag is set (step S6). It is judged whether or not there is a free part of the corresponding translation pattern in which the translation result is not stored among the free parts of the fixed pattern (step S
7) If there is an unprocessed free part, the character string extracted from the input sentence and set in the free part of the fixed pattern in which the translation result is not stored in the free part of the corresponding translation pattern is sent to the analysis processing part. It is sent (step S8).

【0024】そして、解析処理部4において、送られて
きた文字列に対して解析処理が行われる。例えば、「彼
の息子か娘」という文字列が送られてきた場合は、形態
素解析及び構文解析処理が行われ、最終的に図8(d)
に示すような係り受け構造を表す依存構造が形成される
(ステップS9)。「パターン翻訳処理とする」旨の情
報フラグがセットされていたら、解析結果が一旦パター
ン翻訳制御部3に返される。ここで、自由部に構文カテ
ゴリの指定又は意味カテゴリの指定があるか否かが判断
される(ステップS10)。解析処理の結果、指定され
ている構文カテゴリ又は意味カテゴリの指定条件を満た
しているか否かが判断され(ステップS11)、条件を
満たしていない場合、上述ステップS2へ戻り、対応す
る別の対訳パターンデータとの照合を続ける。条件を満
たしている場合、解析結果が変換生成処理部5へ送られ
る。この時、図8(d)に示すように解析結果の依存構
造において最上位の文節が中心語文節とされ、構文カテ
ゴリ及び意味カテゴリの指定条件を満たしているか否か
の判断は、この中心語文節によって行われる。すなわ
ち、構文カテゴリが「体言句」と指定されている場合、
中心語文節が「体言文節」であれば指定条件が満たされ
ると判断され、「節」と指定されている場合は、中心語
文節が「用言文節」であれば指定条件が満たされると判
断され、「単語」と指定されている場合は、形成された
依存構造において中心語文節に対して下位文節が存在し
なければ指定条件が満たされると判断される。また、意
味カテゴリの指定に対しては、中心語文節におけるその
語単独で文節となり得る自立語が辞書データとして持つ
意味素性に照らして条件を満たすか否かが判断される。
例えば、図8(c)の定型パターンの第3要素(図8
(c)中のNo.3見出し「B」の欄)の自由部の場合
は、意味カテゴリが「人間」の条件が指定されている
が、図8(d)に示すように、この自由部の中心語文節
における自立語は「娘」であり、名詞「娘」の辞書デー
タに「人間」の意味素性を持つことが記載されていれ
ば、その入力文部分である「彼の息子か娘」はこの場合
の意味カテゴリの指定条件を満足すると判断される。
Then, the analysis processing unit 4 performs analysis processing on the sent character string. For example, when the character string “his son or daughter” is sent, morphological analysis and syntactic analysis are performed, and finally, FIG.
A dependency structure representing a dependency structure as shown in (3) is formed (step S9). If the information flag indicating “to perform pattern translation processing” is set, the analysis result is once returned to the pattern translation control unit 3. Here, it is determined whether or not there is a syntax category specification or a semantic category specification in the free part (step S10). As a result of the analysis process, it is determined whether or not the specified condition of the specified syntax category or the semantic category is satisfied (step S11). If the condition is not satisfied, the process returns to step S2, and another corresponding parallel translation pattern is obtained. Continue to collate with the data. When the condition is satisfied, the analysis result is sent to the conversion generation processing unit 5. At this time, as shown in FIG. 8D, the highest bunsetsu in the dependency structure of the analysis result is set as the central word bunsetsu, and it is judged whether or not the specified conditions of the syntax category and the semantic category are satisfied. Done by clause. That is, if the syntactic category is specified as "comprehension",
If the central phrase is a "boiler phrase", it is judged that the specified condition is satisfied. If the central phrase is "a phrase", it is judged that the specified condition is satisfied. If the word is designated as a "word", it is determined that the designated condition is satisfied unless a lower clause is present with respect to the central word clause in the formed dependency structure. Further, with respect to the designation of the semantic category, it is determined whether or not the independent word in the central word bunsetsu that can be a bunsetsu alone satisfies the condition based on the semantic feature possessed as dictionary data.
For example, the third element (FIG. 8) of the fixed pattern of FIG.
No. in (c). In the case of the free part of 3 heading “B”), the condition that the semantic category is “human” is specified, but as shown in FIG. 8D, the independent word in the central phrase of this free part Is a "daughter", and if the dictionary data of the noun "daughter" has a semantic feature of "human", the input sentence part "his son or daughter" is a semantic category in this case. It is judged that the specified condition of is satisfied.

【0025】それから、変換生成処理部5において、送
られてきた文字列に対して変換生成処理が行われる(ス
テップS12)。通常翻訳処理か否かが判断され(ステ
ップS13)、「通常翻訳処理とする」旨の情報フラグ
がセットされていたら、変換生成結果が出力部6へ送ら
れ、出力部6において、送られてきた翻訳結果が出力さ
れる(ステップS14)。また、通常翻訳処理でない場
合、変換生成結果がパターン翻訳制御部3へ送られ、パ
ターン翻訳制御部3により、図8(e)に示すように、
自由部に対応する訳パターンの自由部に変換生成結果が
格納され、残りの定型パターンの自由部に対する処理を
行うためステップS7へ戻る。また、上述ステップS7
において、未処理の自由部がない場合、訳パターンに格
納されている各定型部及び自由部の訳語を指定されてい
る順に並べて訳文が生成され(ステップS15)、翻訳
結果として出力部6へ送られ、翻訳結果が出力される。
Then, the conversion generation processing unit 5 performs conversion generation processing on the sent character string (step S12). It is judged whether or not it is the normal translation processing (step S13), and if the information flag indicating "it is the normal translation processing" is set, the conversion generation result is sent to the output unit 6 and sent by the output unit 6. The translated result is output (step S14). If it is not the normal translation process, the conversion generation result is sent to the pattern translation control unit 3, and the pattern translation control unit 3 changes the result as shown in FIG.
The conversion generation result is stored in the free part of the translation pattern corresponding to the free part, and the process returns to step S7 to perform processing on the remaining free parts of the fixed pattern. In addition, step S7 described above.
If there is no unprocessed free part, the translated words of the fixed parts and free parts stored in the translation pattern are arranged in the specified order (step S15), and the translated text is sent to the output part 6 as the translation result. And the translation result is output.

【0026】次に、図4a及び図4bのフローチャート
と、この処理を実際の例文に適用した場合の実施例であ
る図6及び図7を参照しながら、日本語文データと定型
パターンとの照合の方法について説明する。
Next, referring to the flow charts of FIGS. 4a and 4b and FIGS. 6 and 7 showing an embodiment in which this processing is applied to an actual example sentence, the Japanese sentence data is collated with a fixed pattern. The method will be described.

【0027】なお、図6及び図7において、網かけ部分
は照合中の部分を示し、日本語文データの黒矢印位置は
次の照合開始位置を示し、中ヌキ矢印位置は直前の自由
部仮想開始位置を示している。図6は定型パターンが定
型部から始まる対訳パターン例で、対訳パターンが「必
ずAを[Bに]$人間$渡して下さい」→"Please besu
re to hand #A #B[to]."であり、照合される入力文が
「必ずこの本を彼の息子か娘に渡して下さい」である場
合を示している。一方、図7は定型パターンが自由部か
ら始まる対訳パターン例で、対訳パターンが「Aを[B
に]$人間$渡して下さい」→"Please hand #A #B[t
o]."であり、照合される入力文が「この本を彼の息子か
娘に渡して下さい」である場合を示している。
In FIGS. 6 and 7, the shaded portion indicates the portion being collated, the position of the black arrow in the Japanese sentence data indicates the next collation start position, and the position of the middle arrow indicates the virtual start of the previous free part. The position is shown. Fig. 6 shows an example of a bilingual pattern that begins with a fixed pattern. The bilingual pattern is "Make sure to give A to [B] $ human $" → "Please besu
"re to hand #A #B [to]." and the input sentence to be matched is "Make sure to give this book to his son or daughter." On the other hand, FIG. 7 shows an example of the bilingual pattern in which the fixed pattern starts from the free part.
[] Give me $ human $ "→" Please hand #A #B [t
o]. "and the input sentence to be matched is" please give this book to his son or daughter. "

【0028】入力日本語文の文頭文字が照合開始位置と
され(ステップS21)、定型パターンが定型部から始
まっているか否かが判断される(ステップS22)。定
型パターンが定型部から始まっている場合、入力日本語
文の長さが定型部の長さ以上か否かが判断され(ステッ
プS23)、入力日本語文の長さが定型部の長さ以上で
あると判断した場合、定型部文字列とその文字数文の入
力日本語文頭の文字列が一致するか否かが判断される
(ステップS24)。一致すると判断された場合、照合
開始位置を、定型部の文字列に一致した部分の後ろの文
字である図6及び図7における「次の照合開始位置」に
移す(ステップS25)。例えば、図6(a)の場合、
定型パターンの第1要素である「必ず」と入力文の文頭
文字列が一致しているため、照合処理は継続される。そ
れから、照合開始位置が、入力日本語文の文末にあるか
否かが判断され(ステップS26)、入力日本語の文末
に照合開始位置があると判断された場合、定型パターン
のすべての定型部及び自由部に対する照合処理が終わっ
ているか、又は後置語指定のない存在任意の自由部が一
つだけ残っている状態か否かが判断される(ステップS
27)。いずれかの状態であると判断された場合、入力
日本語文と定型パターンがマッチしたとして(ステップ
S28)、定型パターンについての照合処理が終了され
る。例えば、図6(h)及び図7(g)の場合は、照合
開始位置が日本語文の文末にあって、定型パターンのす
べての定型部及び自由部に対する照合処理が終わってい
るので、いずれの例も定型パターンが入力日本語文にマ
ッチしたと判断される。
The initial letter of the input Japanese sentence is set as the collation start position (step S21), and it is determined whether or not the fixed pattern starts from the fixed portion (step S22). When the fixed pattern starts from the fixed part, it is determined whether or not the length of the input Japanese sentence is equal to or longer than the fixed portion (step S23), and the length of the input Japanese sentence is equal to or longer than the fixed portion. If it is determined, it is determined whether or not the fixed part character string and the character string at the beginning of the input Japanese sentence of the number-of-characters sentence match (step S24). If it is determined that they match, the collation start position is moved to the "next collation start position" in FIGS. 6 and 7, which is the character after the portion that matches the character string of the standard part (step S25). For example, in the case of FIG.
Since the first element of the fixed pattern, "always", and the initial character string of the input sentence match, the matching process is continued. Then, it is determined whether or not the matching start position is at the end of the sentence of the input Japanese sentence (step S26). If it is determined that the matching start position is at the end of the sentence of the input Japanese sentence, all the fixed parts of the fixed pattern and It is determined whether or not the matching process for the free part is completed, or only one existing arbitrary free part without postfix designation remains (step S).
27). If it is determined to be in any state, it is determined that the input Japanese sentence and the fixed pattern match (step S28), and the matching process for the fixed pattern ends. For example, in the case of FIG. 6 (h) and FIG. 7 (g), since the collation start position is at the end of the Japanese sentence and the collation processing for all the fixed parts and free parts of the fixed pattern has ended, In the example as well, it is determined that the fixed pattern matches the input Japanese sentence.

【0029】また、上述ステップS26において、照合
開始位置が文末にないと判断された場合、定型パターン
のすべての定型部及び自由部に対する照合処理が終わっ
ているか否かが判断され(ステップS29)、照合処理
が終わっていると判断された場合、入力日本語文と定型
パターンがマッチしなかったとして、該定型パターンに
ついての照合処理が終了される(ステップS30)。な
お、上述ステップS23において、入力文長は定型文長
以上でないと判断された場合、上述ステップS24にお
いて、定型部と文頭の文字列が一致しないと判断された
場合、上述ステップS27において、定型パターンのす
べての定型部及び自由部に対する照合処理が終わってい
ないと判断された場合、又は後置語指定のない存在任意
の自由部が一つだけ残っていないと判断された場合も同
様に、入力日本語文と定型パターンがマッチしなかった
として、該定型パターンについての照合処理が終了され
る。
If it is determined in step S26 that the collation start position is not at the end of the sentence, it is determined whether or not the collation processing has been completed for all the fixed parts and free parts of the fixed pattern (step S29). If it is determined that the matching process is completed, it is determined that the input Japanese sentence and the fixed pattern do not match, and the matching process for the fixed pattern is ended (step S30). If it is determined in step S23 that the input sentence length is not greater than or equal to the fixed phrase length, or if it is determined in step S24 that the fixed part does not match the character string at the beginning of the sentence, the fixed pattern is determined in step S27. Similarly, if it is determined that the collation processing for all the fixed parts and free parts of the above has not been completed, or if only one free arbitrary part that does not have a postfix designation remains Assuming that the Japanese sentence and the fixed pattern do not match, the matching process for the fixed pattern ends.

【0030】そして、上述ステップS29において、照
合処理が終わっていないと判断された場合、次の自由部
で定型パターンのすべての定型部及び自由部に対する照
合処理が終わっているか否かが判断され(ステップS3
1)、照合処理が終わっていると判断された場合、その
自由部に対して後置語があるか否かが判断される(ステ
ップS32)。後置語指定があると判断された場合、指
定後置語と指定後置語の文字数文の入力日本語文末の文
字列が一致するか否かが判断され(ステップS33)、
一致する場合、上述ステップS28へ移り、入力日本語
文と定型パターンがマッチしたとして、定型パターンに
ついての照合処理が終了される。また、一致しない場
合、上述ステップS30へ移り、入力日本語と定型パタ
ーンがマッチしなかったとして、定型パターンについて
の照合処理が終了される。
When it is determined in the above step S29 that the collation processing is not completed, it is determined whether or not the collation processing is completed for all the fixed parts and free parts of the fixed pattern in the next free part ( Step S3
1) If it is determined that the collation processing is completed, it is determined whether or not there is a postword for the free part (step S32). When it is determined that the postfix word is designated, it is determined whether the designated postword and the character string at the end of the input Japanese sentence of the number of characters of the designated postword match (step S33).
If they match, the process proceeds to step S28, and it is determined that the input Japanese sentence and the fixed pattern match, and the matching process for the fixed pattern ends. If they do not match, the process proceeds to step S30, and it is determined that the input Japanese and the standard pattern do not match, and the matching process for the standard pattern ends.

【0031】また、上述ステップS31において、照合
処理が終わっていないと判断した場合、次の自由部は存
在任意か否かが判断され(ステップS34)、次の自由
部が存在任意でない場合、照合開始位置を1文字分後ろ
にずらす(ステップS35)。例えば、図6(b)の例
の場合は、定型パターン第2要素が存在必須の自由部で
あるため、定型パターン第1要素である定型部の「必
ず」の次の文字列は最低1文字以上が第2要素の自由部
に当てはまる必要がある。このため、続く定型パターン
第3要素の定型部の照合開始位置を、1文字分後ろにず
らした文字にすることで、存在必須の自由部相当部分が
確保される。このことは、図7(a)で示すように、入
力文頭が存在必須の自由部に相当する場合についても同
様である。そして、照合開始位置以降の入力日本語文の
長さが次の定型部の長さ以上か否かが判断され(ステッ
プS36)、照合開始位置以降の入力日本語文の長さが
次の定型部の長さ以上であると判断された場合、定型部
文字列と照合開始位置以降のその文字数文の入力日本語
分の文字列が一致するか否かが判断される(ステップS
37)。一致しない場合、上述ステップS35へ戻る。
一致すると判断された場合、その定型部の直前の自由部
に後置語指定があるか否かが判断される(ステップS3
8)。例えば、図6(d)に示すように、定型パターン
第2要素の自由部相当部分が確定する。このことは、図
7(b)及び図7(c)においても同様である。また、
図6(f)又は図7(e)の場合は、同様に自由部相当
部分が確定するが、該自由部に対しては後置語指定があ
るため、該入力文がパターンに適用可能か否かの判断
は、後述のステップにて判断される。後置語指定がある
場合、指定後置語と指定後置語の文字数分の自由部末の
文字列が一致するか否かが判断される(ステップS3
9)。この時、例えば、図7(e)に示すように、定型
パターンの第4要素の定型部が入力文例の12文字目以
降の「渡して下さい」と照合されたものとすると、この
直前の自由部である定型パターンの第3要素(見出し
「B」)の自由部は後置語「に」が指定されているた
め、該自由部に相当する入力分に対してまだ照合が完了
していない5文字目以降の「彼の息子か娘に」の末尾と
指定後置語「に」の照合が行われ、図7(f)に示すよ
うに、指定後置語がマッチしたものとして処理が継続さ
れる。これは図6(f)及び図6(g)においても同様
である。
If it is determined in the above step S31 that the collation processing is not completed, it is determined whether or not the next free part is optional (step S34). If the next free part is not optional, the verification is performed. The start position is moved backward by one character (step S35). For example, in the case of the example of FIG. 6B, since the second element of the fixed pattern is an indispensable free part, the character string next to “must” of the fixed part which is the first element of the fixed pattern has at least one character. The above must apply to the free part of the second element. Therefore, by setting the collation start position of the fixed part of the third fixed pattern pattern element that is shifted backward by one character, the free part corresponding to the essential existence is secured. This is the same as in the case where the beginning of the input sentence corresponds to the free portion that is essential to exist, as shown in FIG. Then, it is determined whether or not the length of the input Japanese sentence after the collation start position is equal to or longer than the length of the next fixed part (step S36), and the length of the input Japanese sentence after the collation start position is of the next fixed part. If it is determined that the length is equal to or longer than the length, it is determined whether or not the fixed part character string and the character string for the input Japanese of the number of characters after the collation start position match (step S).
37). If they do not match, the process returns to step S35.
When it is determined that they coincide with each other, it is determined whether or not there is a postword designation in the free part immediately before the fixed part (step S3).
8). For example, as shown in FIG. 6D, the portion corresponding to the free portion of the second element of the fixed pattern is determined. This also applies to FIGS. 7B and 7C. Also,
In the case of FIG. 6 (f) or FIG. 7 (e), similarly, the part corresponding to the free part is determined, but since the postword is specified for the free part, is the input sentence applicable to the pattern? The determination as to whether or not to make the determination is made in the steps described below. When there is a postfix word designation, it is determined whether or not the designated postword and the character string at the end of the free portion for the number of characters of the designated postword match (step S3).
9). At this time, for example, as shown in FIG. 7 (e), assuming that the fixed part of the fourth element of the fixed pattern is collated with "pass me" after the 12th character of the input sentence example, the freedom immediately before this Since the postfix "ni" is specified for the free part of the third element (heading "B") of the fixed pattern which is the part, matching has not been completed for the input corresponding to the free part. The end of "his son or daughter" after the 5th character and the specified postfix "ni" are collated, and as shown in FIG. Continued. This also applies to FIGS. 6F and 6G.

【0032】入力日本語文の内、該定型部の直前の自由
部に対応する部分の文字列がバッファにセットされ(ス
テップS40)、上述ステップS25へ移り以降の動作
を繰り返す。例えば、図7の例の場合、図7(f)にお
いて定型パターン第3要素の自由部が確定され、対応部
分がバッファにセットされた時点でのバッファ状態が図
8(c)に概念的に示される。
In the input Japanese sentence, the character string of the part corresponding to the free part immediately before the fixed part is set in the buffer (step S40), and the operation proceeds to step S25 to repeat the operations thereafter. For example, in the case of the example of FIG. 7, the buffer state at the time when the free part of the third element of the fixed pattern is determined in FIG. 7 (f) and the corresponding part is set in the buffer is conceptually shown in FIG. 8 (c). Shown.

【0033】また、上述ステップS36、S39でNO
と判断された場合、上述ステップS30へ移り、入力日
本語と定型パターンがマッチしなかったとして、定型パ
ターンについての照合処理が終了する。
Further, NO in the above steps S36 and S39.
If it is determined that the input Japanese and the fixed pattern do not match, the collation process for the fixed pattern ends.

【0034】以上のように、本実施例のパターン照合併
用型翻訳処理装置によれば、対訳パターン作成における
自由度を拡張し、一つの対訳パターンの適用範囲を広げ
ると共に、対訳パターンの誤適用を抑制し、対訳パター
ン作成の労力を軽減でき、類似した構造を持つ文の翻訳
処理結果の精度を向上することができる。
As described above, according to the pattern matching combined type translation processing apparatus of the present embodiment, the degree of freedom in bilingual pattern creation is expanded, the application range of one bilingual translation pattern is expanded, and the misapplication of bilingual translation patterns is prevented. It is possible to suppress, reduce the labor of creating the parallel translation pattern, and improve the accuracy of the translation processing result of the sentence having a similar structure.

【0035】[0035]

【発明の効果】請求項1のパターン照合併用型翻訳処理
装置によれば、一つの対訳パターンの適用範囲を広範囲
とすることができる。これにより、対訳パターン作成の
省力化、及び翻訳処理精度の向上を図ることができる。
According to the translation processing apparatus with combined pattern matching of the first aspect, the application range of one parallel translation pattern can be widened. As a result, it is possible to save labor in creating a parallel translation pattern and improve the accuracy of translation processing.

【0036】請求項2に記載のパターン照合併用型翻訳
処理装置によれば、対訳パターン作成の自由度を拡張し
つつ、その誤適用の抑制を行うことができる。これによ
り、対訳パターン作成の自由度を確保すると共に誤適用
の抑制が可能であり、対訳パターン作成時に誤適用への
配慮から登録できないケースを減らすことができる。
According to the pattern matching combined type translation processing device of the second aspect, it is possible to extend the degree of freedom of creating the parallel translation pattern and to suppress the misapplication thereof. As a result, it is possible to secure the degree of freedom in creating the bilingual translation pattern and suppress misapplication, and it is possible to reduce the number of cases in which bilateral translation patterns cannot be registered due to consideration of misapplication.

【0037】請求項3に記載のパターン照合併用型翻訳
処理装置によれば、定型パターンの自由部にあてはまり
得る節、句又は語に対してその末尾に位置する後置語の
種類が任意に指定でき、誤適用の抑制を行うことができ
る。これにより、後置語に対する訳語選択の精度を向上
し得ると共に、対訳パターン作成時に誤適用への配慮か
ら登録できないケースを減らすことができる。
According to the pattern matching combined type translation processing device of the third aspect, the kind of the postfix word located at the end of the clause, phrase or word that can be applied to the free part of the fixed pattern is arbitrarily designated. It is possible to suppress erroneous application. As a result, it is possible to improve the accuracy of selecting a translated word for a postfix word and reduce the number of cases in which a bilingual translation pattern cannot be registered due to misapplication.

【0038】請求項4に記載のパターン照合併用型翻訳
処理装置によれば、訳パターンの自由部に対してその先
頭に位置する前置詞及び前置詞句又は接続詞の種類を任
意に指定される。これにより、本来自由部の係り先の用
語が如何なる単語であるかによって決定され、自由部に
相当する節・句・語のみからは決定できない前置詞訳等
についても、あらかじめ指定された正確な訳語を使用す
ることにより、対訳パターン使用時の訳語選択をより正
確にすることができる。
According to the pattern matching combined type translation processing device of the fourth aspect, the kind of the preposition and the preposition phrase or the conjunction located at the head of the free part of the translation pattern is arbitrarily designated. As a result, it is determined by what kind of words the dependent part of the free part is originally related to, and even for prepositional translations that cannot be determined only from the clauses / phrases / words corresponding to the free part, the correct prespecified translations are By using it, it is possible to make the translation word selection more accurate when using the bilingual translation pattern.

【0039】請求項5に記載のパターン照合併用型翻訳
処理装置によれば、定型パターンの自由部にあてはまり
得る節、句又は語に対してその中心となる語の意味カテ
ゴリが限定され、入力された対象に関してその意味カテ
ゴリが照合される。これにより、意味の違いによる対訳
パターンの誤適用が抑止され、表層的には同じ形の文を
意味の違いにより異なった訳文とすることが可能とな
る。これにより、従来は誤適用の可能性があることによ
り登録できなかった、特定の場合にのみ適用される対訳
パターンの登録が可能となり、パターン照合併用型翻訳
処理の有効性を向上させる。
According to the pattern matching combined type translation processing device of the fifth aspect, with respect to a clause, a phrase or a word which can be applied to the free part of the fixed pattern, the semantic category of the central word is limited and inputted. The semantic category is matched with respect to the target object. As a result, it is possible to prevent erroneous application of the bilingual translation pattern due to the difference in meaning, and to convert sentences having the same shape in the surface layer into different translated sentences depending on the difference in meaning. As a result, it is possible to register a bilingual translation pattern that is applied only in a specific case, which could not be registered due to the possibility of incorrect application in the related art, and improve the effectiveness of the pattern matching combined translation process.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施例のパターン照合併用型翻訳処理
装置の構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a pattern matching combined type translation processing apparatus according to an embodiment of the present invention.

【図2】図1の実施例のパターン翻訳制御部の構成を示
すブロック図である。
FIG. 2 is a block diagram showing a configuration of a pattern translation control unit of the embodiment of FIG.

【図3】図1の実施例の動作を示すフローチャートであ
る。
FIG. 3 is a flowchart showing the operation of the embodiment of FIG.

【図4a】図1の実施例の照合処理の動作を示すフロー
チャートの一部である。
4a is a part of a flowchart showing the operation of the matching process of the embodiment of FIG.

【図4b】図1の実施例の照合処理の動作を示すフロー
チャートの他の部分である。
FIG. 4b is another part of the flowchart showing the operation of the matching process of the embodiment of FIG.

【図5】図1の実施例で対訳パターンデータがバッファ
上にセットされる際の概念を示す説明図である。
FIG. 5 is an explanatory diagram showing the concept of setting bilingual pattern data in the buffer in the embodiment of FIG.

【図6】図1の実施例で定型パターンが定型部で始まる
場合の、定型パターンと入力文の照合方法の説明図であ
る。
FIG. 6 is an explanatory diagram of a matching method of a fixed pattern and an input sentence when the fixed pattern starts in a fixed portion in the embodiment of FIG.

【図7】図1の実施例で定型パターンが自由部で始まる
場合の、定型パターンと入力文の照合方法の説明図であ
る。
FIG. 7 is an explanatory diagram of a matching method of a fixed pattern and an input sentence when the fixed pattern starts in a free portion in the embodiment of FIG.

【図8】図1の実施例の定型パターンとマッチした入力
文のバッファへのセットの様子と、解析結果の依存構造
と中心語文節の関係、及び翻訳結果の出力方法の説明図
である。
8A and 8B are explanatory diagrams of a state of setting an input sentence matching a fixed pattern of the embodiment of FIG. 1 in a buffer, a relationship between a dependency structure of an analysis result and a central word phrase, and a method of outputting a translation result.

【符号の説明】[Explanation of symbols]

1 入力部 2 対訳パターンデータベース 3 パターン翻訳制御部 4 解析処理部 5 変換生成処理部 6 出力部 7 翻訳処理用辞書部 8 パターン照合手段 9 構文カテゴリ判別手段 10 後置語指定手段 11 前置詞指定手段 12 意味カテゴリ限定手段 13 意味カテゴリ照合手段 14 構文カテゴリ限定手段 1 input part 2 bilingual pattern database 3 pattern translation control part 4 analysis processing part 5 conversion generation processing part 6 output part 7 translation processing dictionary part 8 pattern matching means 9 syntax category discrimination means 10 postposition word designation means 11 preposition designation means 12 Meaning category limiting means 13 Meaning category matching means 14 Syntax category limiting means

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 日本語の入力文テキストを目標言語の翻
訳出力文に変換する翻訳処理装置であって、入力文テキ
スト中に固定語部分に相当する定型部及びそれ以外の任
意の文字列に対応する自由部より構成される所定のパタ
ーンが存在する場合はこれに対応する目標言語文の訳パ
ターンを訳出するパターン翻訳手段を有しており、該パ
ターン翻訳手段が一つの対訳パターンを複数の入力文に
対応可能とするように所定のパターンの自由部に対応す
る部分が入力文中に存在しない場合にも定型部が一致し
た場合には照合を可能とするパターン照合手段を備える
パターン照合併用型翻訳処理装置。
1. A translation processing device for converting a Japanese input sentence text into a translation output sentence of a target language, wherein a fixed part corresponding to a fixed word part and an arbitrary character string other than the fixed part are included in the input sentence text. When there is a predetermined pattern composed of the corresponding free part, it has a pattern translation means for translating a translation pattern of the target language sentence corresponding to the predetermined pattern, and the pattern translation means has a plurality of parallel translation patterns. A pattern matching combined type having a pattern matching means that enables matching when the fixed part matches even if the part corresponding to the free part of the predetermined pattern does not exist in the input sentence so as to be compatible with the input sentence. Translation processor.
【請求項2】 前記パターン翻訳手段が前記所定のパタ
ーン又は訳パターンの自由部の対象を体言句のみならず
節にも拡張し、更にその対象を節、体言句又は名詞等の
特定の構文カテゴリに限定し得る限定手段と、入力され
た対象がいずれの構文カテゴリに属するものであるかを
判別し得る判別手段とを更に備える請求項1に記載のパ
ターン照合併用型翻訳処理装置。
2. The pattern translation means extends the target of the free part of the predetermined pattern or translated pattern to not only a phrase but also a clause, and further, the target is a specific syntactic category such as a clause, phrase or noun. 2. The pattern matching combined type translation processing device according to claim 1, further comprising: a limiting unit that can limit the input target and a determining unit that can determine which syntax category the input target belongs to.
【請求項3】 前記パターン翻訳手段が前記所定のパタ
ーンの自由部の対象となる節、句又は語に対してその末
尾に位置する後置語の種類を任意に指定する指定手段を
更に備える請求項1又は2に記載のパターン照合併用型
翻訳処理装置。
3. The pattern translation means further comprises designation means for arbitrarily designating a type of a postpositional word located at the end of a clause, phrase or word to be a target of a free part of the predetermined pattern. 3. A pattern matching combined type translation processing device according to item 1 or 2.
【請求項4】 前記パターン翻訳手段が前記訳パターン
の自由部に対してその先頭に位置する前置詞及び前置詞
句又は接続詞の種類を任意に指定する指定手段を更に備
える請求項1から3のいずれか1項に記載のパターン照
合併用型翻訳処理装置。
4. The pattern translation means further comprises designation means for arbitrarily designating a preposition and a preposition phrase or a conjunction which are located at the head of the free part of the translation pattern. A translation processing device according to item 1, which is used in combination with pattern matching.
【請求項5】 前記パターン翻訳手段が前記所定のパタ
ーンの自由部の対象となる節、句又は語に対してその中
心となる語の意味カテゴリを限定する限定手段と、入力
された対象に関してその意味カテゴリを照合する照合手
段とを更に備える請求項1から4のいずれか1項に記載
のパターン照合併用型翻訳処理装置。
5. The limiting means for limiting the meaning category of a word, which is the center of a clause, a phrase, or a word, which is a target of the free portion of the predetermined pattern, by the pattern translation means, and the limiting means for the input object. 5. The pattern matching combined type translation processing device according to claim 1, further comprising a matching unit that matches the semantic category.
JP6222153A 1994-09-16 1994-09-16 Pattern collation type translation processor Pending JPH0887506A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6222153A JPH0887506A (en) 1994-09-16 1994-09-16 Pattern collation type translation processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6222153A JPH0887506A (en) 1994-09-16 1994-09-16 Pattern collation type translation processor

Publications (1)

Publication Number Publication Date
JPH0887506A true JPH0887506A (en) 1996-04-02

Family

ID=16778017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6222153A Pending JPH0887506A (en) 1994-09-16 1994-09-16 Pattern collation type translation processor

Country Status (1)

Country Link
JP (1) JPH0887506A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8311799B2 (en) 2007-11-20 2012-11-13 Fuji Xerox Co., Ltd. Example-based translation using common and uncommon portions of an input sentence

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8311799B2 (en) 2007-11-20 2012-11-13 Fuji Xerox Co., Ltd. Example-based translation using common and uncommon portions of an input sentence

Similar Documents

Publication Publication Date Title
JP4714400B2 (en) Scalable machine translation system
Brill Some advances in transformation-based part of speech tagging
JP4544674B2 (en) A system that provides information related to the selected string
JP2963463B2 (en) Interactive language analyzer
JP2002215617A (en) Method for attaching part of speech tag
JPH1011447A (en) Translation method and system based upon pattern
JPH05120324A (en) Language processing system
Phillips et al. GPSGP—a parser for generalized phrase structure grammars
JPH0887506A (en) Pattern collation type translation processor
KR950013129B1 (en) Method and apparatus for machine translation
JP4043176B2 (en) Natural language processing device
JP3358100B2 (en) Japanese question message analysis method and device
JP3233800B2 (en) Machine translation equipment
JP3353873B2 (en) Machine translation equipment
JP3692711B2 (en) Machine translation device
JP3700193B2 (en) Kana-kanji conversion device and kana-kanji conversion method
JP2938897B2 (en) Document creation processing device
JP3386520B2 (en) Kana-kanji conversion apparatus and method
JPS63136265A (en) Mechanical translating device
JP3061855B2 (en) Kana-kanji conversion device and kana-kanji conversion method
JP4092861B2 (en) Natural language pattern creation apparatus and method
JPH04330565A (en) Natural language processing system using universal file
JP5331964B2 (en) Translation support device, translation support method, and translation support program
JP2856736B2 (en) Dictionary reference device and dictionary reference method
JPH1139347A (en) Text retrieval system, index generation device, text retrieval device and recording medium which computer can read