JPH03116272A - Mechanical translation system containing sentence pattern dictionary - Google Patents

Mechanical translation system containing sentence pattern dictionary

Info

Publication number
JPH03116272A
JPH03116272A JP1251810A JP25181089A JPH03116272A JP H03116272 A JPH03116272 A JP H03116272A JP 1251810 A JP1251810 A JP 1251810A JP 25181089 A JP25181089 A JP 25181089A JP H03116272 A JPH03116272 A JP H03116272A
Authority
JP
Japan
Prior art keywords
sentence
pattern
dictionary
translation system
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1251810A
Other languages
Japanese (ja)
Inventor
Takashi Nakamura
俊 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1251810A priority Critical patent/JPH03116272A/en
Publication of JPH03116272A publication Critical patent/JPH03116272A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To improve the processing efficiency for analysis of an input sentence by performing simultaneously the retrieval and the collation of character patterns during analysis of a morpheme. CONSTITUTION:A morpheme analysis part 3 is provided together with a word dictionary 4, a pattern dictionary 5, and a word list/pattern candidate list screening part 6. An input text inputted to the part 3 undergoes the segmentation of character strings and the reference to dictionaries. Both dictionaries 4 and 3 are simultaneously retrieved and collated with each other in a dictionary reference mode. Then a word list or a pattern candidate list is obtained via the part 6. Thus the processing efficiency is improved in a mechanical translation system.

Description

【発明の詳細な説明】 [4!I  要] 原言語の入力文の解析の際に、単語辞書を用いた形態素
解析と共に、予めシステムの利用者が登録した文パター
ンとのパターン照合を行う機械翻訳システムに関し、 従来、単語辞書を用いた形態素解析の後に、再度入力文
の表記を調べ、上記文パターンの検索及び照合を行って
おり、非効率的であった問題の解決を目的とし、 文パターン中の所定の語句を検索キーとする文パターン
辞書を生成する手段と、 原言語の入力文の解析の際には、形態素解析中に、上記
単語辞書の検索と同時に、上記パターン辞書の検索をも
行う手段とを設けて構成する。
[Detailed description of the invention] [4! I Summary] Regarding machine translation systems that perform pattern matching with sentence patterns registered in advance by the system user, as well as morphological analysis using a word dictionary when analyzing input sentences in the source language, conventionally, word dictionaries were used. After morphological analysis, the notation of the input sentence is examined again, and the above sentence patterns are searched and matched.With the aim of solving the inefficient problem, predetermined words in the sentence patterns are used as search keys. and a means for searching the pattern dictionary at the same time as searching the word dictionary during morphological analysis when analyzing an input sentence in the source language. .

[産業上の利用分野コ 本発明は、原言語の入力文を目標言語の出力文に変換す
る機械翻訳システムに関し、特に原言語の入力文の解析
の際に、単語辞書を用いた形態素解析と共に、予めシス
テムの利用者が登録した文パターンとのパターン照合(
「パターンマツチ」ともいう)を行う機械翻訳システム
に関する。
[Industrial Application Field] The present invention relates to a machine translation system that converts an input sentence in a source language into an output sentence in a target language, and in particular, when analyzing an input sentence in a source language, it can be used in conjunction with morphological analysis using a word dictionary. , pattern matching with sentence patterns registered in advance by the system user (
Related to a machine translation system that performs "pattern matching" (also called "pattern matching").

[従来の技術] 一般的に、機械翻訳システムは、翻訳エンジと知識ベー
スからなるエキスパートシステムで構成されている。
[Prior Art] Generally, a machine translation system is composed of an expert system consisting of a translation engine and a knowledge base.

翻訳エンジンは、解析文法知識による原言語の入力文の
解析、生成文法知識による目標言語の出力文を生成する
エキスパートシステムの中心部分であり、また知識ベー
スは、解析及び生成文法知識、原言語及び目標言語の単
語辞書から構成されている。
The translation engine is the core part of an expert system that parses input sentences in the source language using analytical grammar knowledge and generates output sentences in the target language using generative grammar knowledge. It consists of a dictionary of words in the target language.

このような、翻訳システムにおいては、通常定型的な文
法表現の入力文については正しい翻訳結果を出力し得る
が、比較的複雑な文法構造を有する表現、例えば専門分
野の特有の言い回し等については正しい翻訳結果を得る
ことが困難である。
In such a translation system, it is possible to output correct translation results for input sentences with regular grammatical expressions, but it is possible to output correct translation results for expressions with relatively complex grammatical structures, such as phrases specific to specialized fields. It is difficult to obtain translation results.

従って、上記専門分野の特有な言い回しや、その他慣用
的な表現についての入力文とその対訳文とを、予めシス
テムの利用者が必要に応じて文パターン表に登録して置
き、入力文の解析の際に、通常の単語辞書を用いた形態
素分析に加えて、上記文パターン表とのパターン照合を
行う方式が提案されている。
Therefore, the system user can register in advance the input sentences and their parallel translations regarding phrasings specific to the above specialized fields and other idiomatic expressions in the sentence pattern table as necessary, and then analyze the input sentences. At this time, a method has been proposed in which, in addition to morphological analysis using a normal word dictionary, pattern matching is performed against the sentence pattern table.

以下、これについてより詳細に説明する。This will be explained in more detail below.

第3図は従来の文パターン表を用いた翻訳処理方式を説
明する図であり、本発明に直接関係する原言語の入力文
の解析部分のみを示したものである。
FIG. 3 is a diagram illustrating a conventional translation processing method using a sentence pattern table, and shows only the analysis portion of an input sentence in the source language that is directly related to the present invention.

原言語の入力文なる人力テキストは形態素解析部51で
、入力文章の文字切り出し、単語辞書52を用いた辞書
引きにより、各品詞毎に分解され単it IJストが得
られる。
A human text, which is an input sentence in the source language, is broken down into individual parts of speech by cutting out characters from the input sentence and looking it up in a dictionary using a word dictionary 52 in a morphological analysis unit 51 to obtain a single IJ sentence.

また、第4図は上記単工吾辞書の概念を説明する図であ
り、該単語辞書の検索キー55を検索し辞書内容56を
調べることにより形態素解析を行う。
Further, FIG. 4 is a diagram for explaining the concept of the above-mentioned Single Kogo dictionary, and morphological analysis is performed by searching the search key 55 of the word dictionary and examining the dictionary contents 56.

上記形態素解析の後に、入力テキストは、パターン検索
部53に送られ、文パターン表54を検索し、パターン
照合が行われることになる。
After the morphological analysis, the input text is sent to the pattern search unit 53, where the sentence pattern table 54 is searched and pattern matching is performed.

このパターン表は、上述の如く、システムの利用者が予
め、専門分野の特有な言い回し等の文章をその対訳文と
共に文パターンとして登録したものである。
As described above, in this pattern table, the user of the system has previously registered sentences such as phrases specific to the specialized field as sentence patterns together with their bilingual sentences.

以下、この文パターンについて、より具体的に説明する
This sentence pattern will be explained in more detail below.

第5図は文パターンの概念を示す図であり、第5図(a
)は実際の文例を示す図、第5図ら)は文パターンの構
成要素を説明する図、第5図(C)は文パターンの各種
構成を示す図である。
Figure 5 is a diagram showing the concept of sentence patterns, and Figure 5 (a
) is a diagram showing an actual sentence example, FIG. 5, etc.) is a diagram explaining the constituent elements of a sentence pattern, and FIG.

すなわち、第5図(a)の実際の文例、「背昔ある所に
、おじいさんとおばあさんが(住んで1暮して)おりま
した」 の場合、 “右じいさん”おばあさん”は名詞相当語句として変数
記号化され、記号N1、N2に変換され、また、(住ん
でl暮して)部の語句は選択可能な語句として扱われ、
その他の語句は固定的な語句となる。
In other words, in the actual sentence example in Figure 5 (a), ``A long time ago, there lived an old man and an old woman in a place.'' ``The right old man'' and ``old woman'' are variables as noun-equivalent words. It is symbolized and converted into symbols N1 and N2, and the words in the (live and live) part are treated as selectable words.
Other words are fixed words.

従って、文パターンの構成要素は、第5図(b)に示す
ように、−船釣に、〈固定部〉、〈変数部〉、く選択部
〉から、構成され、上述のごとく、く固定部〉は固定的
な確定した文、く変数部〉は変数記号化された未確定な
部分で、パターン照合の際には無視され、後の段階で単
語辞書を用いて決定される部分、〈選択可変部〉は複数
の語句の内から1つを選択することにより、変形された
複数の文パターンを生じさせる部分である。
Therefore, the constituent elements of the sentence pattern, as shown in Figure 5(b), consist of a fixed part, a variable part, and a selection part. The part〉 is a fixed fixed sentence, the variable part is an undetermined part encoded as a variable, and is ignored during pattern matching and determined at a later stage using a word dictionary. The variable selection section is a section that generates a plurality of modified sentence patterns by selecting one of a plurality of words.

また、実際の文例では、第5図(e)に示すごとく、〈
固定部〉、〈変数部〉、く選択可変部〉はその順序が種
々入れ替り得るものである。
In addition, in an actual sentence example, as shown in Figure 5(e),
The order of the fixed part, variable part, and variable selection part can be changed in various ways.

このような、文パターンの登録されたパターン表を検索
して、パターン候補リストが抽出されることになる。
A pattern candidate list is extracted by searching a pattern table in which sentence patterns are registered.

[発明が解決しようとする課題] 以上説明したように、従来の方式では、文パターン表の
検索及びパターン照合を、形態素解析とは別々に行って
おり、形態素解析中で表記を全検査したのち、パターン
検索で再度同様の検査を行う必要があり、非効率的であ
った。
[Problems to be Solved by the Invention] As explained above, in the conventional method, the search in the sentence pattern table and the pattern matching are performed separately from the morphological analysis. , it was necessary to perform the same test again in pattern search, which was inefficient.

本発明は上記問題点に鑑みなされたものであり、形態素
解析時に同時にパターン検索を行い得るようにし、処理
の効率を高めた機械翻訳システムを提供することを目的
とする。
The present invention has been made in view of the above-mentioned problems, and an object of the present invention is to provide a machine translation system that can simultaneously perform pattern search during morphological analysis and improve processing efficiency.

[課題を解決するための手段] 本発明によれば、上述の目的は前記特許請求の範囲に記
載した手段により達成される。
[Means for Solving the Problems] According to the present invention, the above objects are achieved by the means described in the claims.

すなわち、本発明は、原言語の入力文を目標言語の出力
文に変換する機械翻訳システムであって、原言語の入力
文の構文解析の際には、原言語の単語辞書を用いて形態
素解析を行うと共に、予めシステム中に登録された文パ
ターンと原言語の入力文とのパターン照合を行う機械翻
訳システムにおいて、上記文パターン中の所定の語句を
検索キーとする文パターン辞書を生成する手段と、原言
語の入力文の解析の際には、形態素解析中に、上記単語
辞書の検索と同時に、上記パターン辞書の検索を行う手
段とを設けた文パターン辞書を有する機械翻訳システム
である。
That is, the present invention is a machine translation system that converts an input sentence in a source language into an output sentence in a target language. In a machine translation system that performs pattern matching between a sentence pattern registered in advance in the system and an input sentence in the source language, means for generating a sentence pattern dictionary using predetermined words in the sentence pattern as a search key. and a means for searching the pattern dictionary at the same time as searching the word dictionary during morphological analysis when analyzing an input sentence in the source language.

[作 用] 本発明の機械翻訳処理システムにおいては、形態素解析
中には人力文中の表記を分解しながら辞書を引くので、
パターン辞書の検索キーを、単語゛辞書と同様に照合す
べき表記の一部としておくことにより、形態素解析で単
語辞書の検索と同時にパターン辞書の検索が行える。
[Function] In the machine translation processing system of the present invention, during morphological analysis, the dictionary is looked up while decomposing the notation in the human sentence.
By setting the search key of the pattern dictionary as part of the notation to be compared in the same way as the word dictionary, the pattern dictionary can be searched simultaneously with the word dictionary using morphological analysis.

以下、具体的な例により説明する。This will be explained below using a specific example.

入力文と文パターンとの照合は、文パターン中のく固定
部〉の一致、く選択可変部〉のどれかとの一致、残りの
表記と変数記号部の対応を!認することで成立する。従
って、パターンマツチすべき入力文に対しては、パター
ン固定部は常に一致していなければならないため、第1
図のパターン辞書構造の概念を示す図に示されるごとく
、同図(a)の文パターンの例、「昔昔あるところにN
1とN2が(住んで暮して)おりました」 に対して、同図(b)のパターン辞書の構造に示される
ごとく、 固定部の一部(「昔昔あるところに」)を検索キー1と
し、その他の部分をパターン内容2(r#N1とN2が
(住んで 暮して)おりました」)として、第4図に示
した単語辞書と同じ構造にする。
Match the input sentence with the sentence pattern by matching the fixed part in the sentence pattern, matching with any of the selected variable part, and matching the remaining notation with the variable symbol part! It is established by acknowledging it. Therefore, for the input sentence to be pattern matched, the fixed pattern part must always match, so the first
As shown in the diagram illustrating the concept of the pattern dictionary structure, an example of the sentence pattern in Figure (a) is ``In a place long ago, N
1 and N2 (lived together)'', as shown in the structure of the pattern dictionary in figure (b), use the search key to search for part of the fixed part (``in a place long ago''). 1, and the other parts as pattern content 2 (r#N1 and N2 (lived) together.'') to create the same structure as the word dictionary shown in Figure 4.

これにより、形態素解析中にパターンマツチする可能性
のある文パターンの検索ができることになる。
This makes it possible to search for sentence patterns that may be matched during morphological analysis.

[実施例] 第2図は本発明の一実施例を説明する図であり、本発明
に直接関係する原言語の入力文の解析部のみを示したも
のである。同図において、3は形態素解析部、4は単語
辞書、5はパターン辞書、6は単語リストとパターン候
補のリストのふるい分は部を示している。
[Embodiment] FIG. 2 is a diagram illustrating an embodiment of the present invention, and shows only the source language input sentence analysis unit that is directly related to the present invention. In the figure, 3 is a morphological analysis section, 4 is a word dictionary, 5 is a pattern dictionary, and 6 is a section for sifting the word list and pattern candidate list.

すなわち、本実施例では、第1図で説明したパターン辞
書5が用いられ、形態素解析部3に入力された人力テキ
ストは、文字列の切り出しと辞書引きが行われ、該辞書
引きの際には、単語辞書4とパターン辞書3が同時に検
索照合され、ふるい分は部6を介して、単語リスト又は
パターン候補リストを得ることができる。
That is, in this embodiment, the pattern dictionary 5 explained in FIG. , the word dictionary 4 and the pattern dictionary 3 are searched and collated at the same time, and a word list or a pattern candidate list can be obtained through the sieve section 6.

[発明の効果] 以上説明したごとく、本発明の機械翻訳システムによれ
ば、形態素解析中に文パターンの検索及び照合が同時に
行われるので、その分処理の効率が向上する。
[Effects of the Invention] As explained above, according to the machine translation system of the present invention, search and matching of sentence patterns are performed simultaneously during morphological analysis, so that processing efficiency is improved accordingly.

【図面の簡単な説明】[Brief explanation of drawings]

第1図はパターン辞書構造の概念を示す図、第2図は本
発明の一実施例を説明する図、第3図は従来の文パター
ン表を用いた闘訳処理方式を説明する図、第4図は単語
辞書構造の概念を示す図、第5図は文パターンの概念を
示す図である。 1・・・・・・文パターン辞書中の検索キー 2・・・
・・・文パターン辞書中のパターン内容、3・・・・・
・形態素解析部、4・・・・・・単語辞書、5・・・・
・・パターン辞書、6・・・・・・単語リストとパター
ン候補リストのふるい分は部
FIG. 1 is a diagram showing the concept of a pattern dictionary structure, FIG. 2 is a diagram explaining an embodiment of the present invention, FIG. 3 is a diagram explaining a conventional translation processing method using a sentence pattern table, and FIG. FIG. 4 is a diagram showing the concept of word dictionary structure, and FIG. 5 is a diagram showing the concept of sentence pattern. 1... Search key in the sentence pattern dictionary 2...
...Pattern contents in the sentence pattern dictionary, 3...
・Morphological analysis section, 4... Word dictionary, 5...
...Pattern Dictionary, 6...The sifting of the word list and pattern candidate list is

Claims (1)

【特許請求の範囲】 原言語の入力文を目標言語の出力文に変換する機械翻訳
システムであって、原言語の入力文の構文解析の際には
、原言語の単語辞書を用いて形態素解析を行うと共に、
予めシステム中に登録された文パターンと原言語の入力
文とのパターン照合を行う機械翻訳システムにおいて、
上記文パターン中の所定の語句を検索キーとする文パタ
ーン辞書を生成する手段と、 原言語の入力文の解析の際には、形態素解析中に、上記
単語辞書の検索と同時に、上記パターン辞書の検索を行
う手段とを、 設けたことを特徴とする文パターン辞書を有する機械翻
訳システム。
[Scope of Claims] A machine translation system that converts an input sentence in a source language into an output sentence in a target language, which performs morphological analysis using a word dictionary of the source language when parsing the input sentence in the source language. In addition to doing
In a machine translation system that performs pattern matching between sentence patterns registered in the system in advance and input sentences in the source language,
means for generating a sentence pattern dictionary using a predetermined word in the sentence pattern as a search key; What is claimed is: 1. A machine translation system having a sentence pattern dictionary, characterized in that:
JP1251810A 1989-09-29 1989-09-29 Mechanical translation system containing sentence pattern dictionary Pending JPH03116272A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1251810A JPH03116272A (en) 1989-09-29 1989-09-29 Mechanical translation system containing sentence pattern dictionary

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1251810A JPH03116272A (en) 1989-09-29 1989-09-29 Mechanical translation system containing sentence pattern dictionary

Publications (1)

Publication Number Publication Date
JPH03116272A true JPH03116272A (en) 1991-05-17

Family

ID=17228262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1251810A Pending JPH03116272A (en) 1989-09-29 1989-09-29 Mechanical translation system containing sentence pattern dictionary

Country Status (1)

Country Link
JP (1) JPH03116272A (en)

Similar Documents

Publication Publication Date Title
US5579224A (en) Dictionary creation supporting system
US6876963B1 (en) Machine translation method and apparatus capable of automatically switching dictionaries
JPH03185561A (en) Method for inputting european word
CA2020058A1 (en) Machine translation apparatus having a process function for proper nouns with acronyms
KR100956794B1 (en) Translation apparatus by using multi-level verb pattern, and application and extraction method thereof
JP2828692B2 (en) Information retrieval device
JPS6180362A (en) Translation system
JPH03116272A (en) Mechanical translation system containing sentence pattern dictionary
JP3085394B2 (en) Translated word selection method in multi-sentence translation and machine translation system using the same
JPS6190269A (en) Translation system
JPH0561902A (en) Mechanical translation system
JP2994080B2 (en) Translation selection method
JP2742059B2 (en) Dictionary editor for translation
JPS6174069A (en) Translation system
KR19980036108A (en) Automatic Grammar Correction of Concept-based Multilingual Translation System
JPH02208775A (en) Machine translation system
JPS6180358A (en) Translation system
JPH0421167A (en) Machine translation device
KR100341397B1 (en) Method of Solving the Unknown String of Concepts in a Concept-based Machine Translation System
JPH03116273A (en) Mechanical translation system using bilingual sentence template pair
JPH03130873A (en) Text base retrieving system
JPH01152573A (en) Translating processing system
JPH086950A (en) Machine translation apparatus with keyword translation function
JPS6367677A (en) Mechanical translation device
JPH11238060A (en) Natural language processor