JPH05290084A - Unregstered word translation system - Google Patents

Unregstered word translation system

Info

Publication number
JPH05290084A
JPH05290084A JP4120163A JP12016392A JPH05290084A JP H05290084 A JPH05290084 A JP H05290084A JP 4120163 A JP4120163 A JP 4120163A JP 12016392 A JP12016392 A JP 12016392A JP H05290084 A JPH05290084 A JP H05290084A
Authority
JP
Japan
Prior art keywords
word
dictionary
unregistered
verb
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4120163A
Other languages
Japanese (ja)
Inventor
Ayako Oono
亜矢子 大野
Sakiko Honma
咲子 本間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP4120163A priority Critical patent/JPH05290084A/en
Publication of JPH05290084A publication Critical patent/JPH05290084A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To synthesize an appropriate translated word at the time of translating an unregistered word into Japanese. CONSTITUTION:When an input sentence is inputted from an input part 1, an analysis part 2 refers to a dictionary 6 and a grammar rule 7 and analyzes the structure of the input sentence. When there is the unregistered word in the input sentence at that time, the analysis part 2 estimates the part of speech and analysis is continued. When the unregistered word is estimated to be a noun, the analysis part 2 decides the meaning origin and the usage of the unregistered word. Namely, the analysis part 2 estimates an attribute and the like which are required for translating the unregistered word. Then, a conversion generation part 3 generates a Japanese sentence based on an analyzed result. When the unregistered word is the noun, the corresponding translated word is synthesized. Thus, the conversion generation part 3 generates the Japanese sentence by using the synthetic translated word.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【技術分野】本発明は、未登録語翻訳方式に関し、より
詳細には、機械翻訳装置、特に英日機械翻訳装置におけ
る未登録語翻訳方式に関する。例えば、辞書を用いて自
然言語を翻訳する翻訳装置に適用されるものである。
TECHNICAL FIELD The present invention relates to an unregistered word translation system, and more particularly, to a machine translation device, and more particularly to an unregistered word translation system in an English-Japanese machine translation device. For example, it is applied to a translation device that translates a natural language using a dictionary.

【0002】[0002]

【従来技術】辞書を用いた機械翻訳装置などにおいて
は、入力文中に出現する全ての単語を予め辞書登録して
おくことは不可能であり、未登録語が生じることは避け
られない。そこで、未登録語を含む文でも処理できるよ
うに、未登録語の属性を構文解析のルールから期待され
る属性によって推定し、その属性を用いて解析を行う構
文分析方式や、接頭接尾辞テーブルを用いてより高性能
で属性推定を行う未登録語処理方式などが提案され、未
登録語を含む文でも解析ができるようになった。
2. Description of the Related Art In a machine translation device using a dictionary, it is impossible to register all the words appearing in an input sentence in the dictionary in advance, and it is inevitable that unregistered words will occur. Therefore, in order to be able to process even sentences containing unregistered words, the attributes of unregistered words are estimated from the attributes expected from the syntax analysis rules, and the analysis is performed using those attributes. An unregistered word processing method for attribute estimation with higher performance has been proposed, and it has become possible to analyze even sentences containing unregistered words.

【0003】前記構文分析方式としては、例えば、特開
昭58−175075号公報に提案されている。この公
報のものは、辞書未登録語の属性を構文解析のルールか
ら期待される属性によって推定するものである。また、
前記未登録語処理方式としては、例えば、特開昭63−
68972号公報に提案されており、辞書未登録語を接
頭語、接尾語、語基に分解して得た情報から属性を推定
するものである。
The syntax analysis method is proposed in, for example, Japanese Patent Laid-Open No. 175075/1983. In this publication, the attribute of a dictionary unregistered word is estimated by the attribute expected from the syntax analysis rule. Also,
The unregistered word processing method is, for example, Japanese Patent Laid-Open No. 63-
It is proposed in Japanese Patent No. 68972, and an attribute is estimated from information obtained by decomposing a dictionary unregistered word into a prefix, a suffix, and a word base.

【0004】しかし、未登録語の訳出処理に関しては、
未登録語を原語のまま表示するか、接辞と語基の訳語を
定型的に組み合わせて訳語を合成する方法が取られてお
り、合成された訳語は目的言語の単語として不適切なも
のである事態が多く生じた。例えば、英日機械翻訳装置
で、下記の(1)の文が入力され、このうち“analyse
r”が辞書に未登録であるが、語基“analyse”は登録さ
れているとする。 (1)「This system is equipped with an automatic
analyser.」 定型的な訳語合成を行う従来技術では、例えば、“anal
yse”の訳語「分析する」と“er”の訳語「人」を組み
合わせて“analyser”の訳語が合成され、以下の(2)
のような出力が得られる。 (2)「このシステムは、自動的な分析する人が備わっ
ている。」 しかしながら、この場合、“analyser”は人ではなく装
置を意味しているため、「分析する人」は不適切な訳語
である。さらに日本語としても冗長なあまりよくない訳
語であり、「分析者」「分析装置」などと適切な訳語を
合成して訳し分けることは、従来技術ではできない。ま
た、未登録語を原語のまま表示する従来技術では、以下
の(3)のような出力が得られる。 (3)「このシステムは自動的なanalyserが備わってい
る。」 この方式では、“analyse”に関する情報が辞書にある
にもかかわらず、その情報が訳文に反映されていないた
め、ユーザが“analyse”の意味を知らない場合、辞書
を引くなどの手間が必要となる。
However, regarding the translation processing of unregistered words,
The unregistered word is displayed as the original word, or the translation word is synthesized by combining the affix and the translation word of the word base in a fixed form, and the synthesized translation word is inappropriate as the target language word. Many things happened. For example, in the English-Japanese machine translation device, the sentence (1) below is input, and of these, "analyse
It is assumed that "r" is not registered in the dictionary, but the base "analyse" is registered. (1) "This system is equipped with an automatic
“Analyser.” In the conventional technique for performing a fixed word synthesis, for example, “anal
The translation of “analyser” is synthesized by combining the translation of “yse” “analyze” and the translation of “er” “person”.
You will get an output like (2) “This system is equipped with a person who analyzes automatically.” However, in this case, “analyser” means a device, not a person, so “analyzer” is an inappropriate translation. Is. Furthermore, it is a poorly translated word that is redundant even in Japanese, and it is not possible with the conventional technology to synthesize and translate appropriate translated words such as "analyzer" and "analyzer". Further, in the conventional technique in which an unregistered word is displayed as it is, the output as shown in (3) below is obtained. (3) “This system is equipped with an automatic analyzer.” In this method, even though the information on “analyse” is in the dictionary, the information is not reflected in the translated text, so the user can “analyse”. If you don't know the meaning of "," you need to look up the dictionary.

【0005】[0005]

【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、未登録語を日本語へ翻訳する際に、適切な訳語
を合成するようにした未登録語翻訳方式を提供すること
を目的としてなされたものである。
It is an object of the present invention to provide an unregistered word translation system that synthesizes appropriate translated words when translating unregistered words into Japanese. It was done for the purpose.

【0006】[0006]

【構成】本発明は、上記目的を達成するために、(1)
原言語の単語や接辞について、その属性や格パターンな
どの情報と、日本語訳語を記述した辞書と、該辞書に未
登録であるが、辞書に登録してある単語からの派生形
で、かつ構文上名詞であると推定される未登録語の意味
素性を、共起する動詞の格パターンを用いて推定する推
定手段と、該未登録語の訳語を、該推定手段により推定
された未登録語の意味素性に応じて辞書に登録してある
単語の訳語から合成する合成手段とから成ること、更に
は、(2)前記未登録語が辞書に登録されている動詞か
らの派生名詞であるときに、辞書に記述されている当該
動詞の訳語を名詞化したものを用いて、該未登録語の訳
語を合成すること、更には、(3)前記(2)におい
て、前記未登録語を構成する動詞の日本語訳語がサ変動
詞であるときには、その語幹を用いて、該未登録語の訳
語を合成すること、或いは、(4)原言語の単語や接辞
について、その属性や格パターンなどの情報と、日本語
訳語を記述した辞書と、該辞書に未登録であるが、辞書
に登録してある動詞からの派生形であり、かつ構文上名
詞であると推定される未登録語の意味素性を、当該動詞
の格パターンと共起する名詞の意味素性を用いて推定す
る推定手段と、前記辞書に登録してある当該動詞の訳語
のうち、該推定手段により推定された意味素性に応じた
ものを名詞化して、当該未登録語の訳語を合成する合成
手段とから成ることを特徴としたものである。以下、本
発明の実施例に基づいて説明する。
In order to achieve the above object, the present invention provides (1)
For the source language words and affixes, information such as their attributes and case patterns, a dictionary that describes Japanese translations, and a dictionary that is not registered in the dictionary but is a derivative form of the words registered in the dictionary, and Estimating means for estimating the semantic feature of an unregistered word that is presumed to be a syntactic noun by using the case pattern of co-occurring verbs, and the translated word of the unregistered word, which is estimated by the estimating means. And (2) the unregistered word is a derivative noun from a verb registered in the dictionary, and (2) the unregistered word is derived from the translated word of the word registered in the dictionary according to the semantic feature of the word. Sometimes, a translated word of the verb described in the dictionary is used as a noun to synthesize a translated word of the unregistered word, and further, (3) in (2), the unregistered word is When the Japanese translation of the constituent verb is a sa verb, The word stem is used to synthesize a translated word of the unregistered word, or (4) information about attributes and case patterns of words and affixes in the source language, a dictionary describing Japanese translated words, and the dictionary Although it is not registered in, the semantic features of unregistered words that are derived from verbs registered in the dictionary and are presumed to be syntactically nouns Of the translation means of the verb registered in the dictionary, which is estimated using the semantic feature, the translation word of the unregistered word is converted into a noun by converting the translation word of the verb corresponding to the semantic feature estimated by the estimation means. And a synthesizing means for synthesizing. Hereinafter, description will be given based on examples of the present invention.

【0007】図1は、本発明による未登録語翻訳方式の
一実施例を説明するための構成図で、図中、1は入力
部、2は解析部、3は変換生成部、4は出力部、5は接
辞辞書、6は辞書部、7は文法規則、8は入力文、9は
出力文である。辞書6には原言語の単語に対して、格パ
ターンや意味素性等の属性情報とその日本語訳が、例え
ば、図2のように記述されており、その情報は、通常の
翻訳処理に加え、未登録語の翻訳処理にも利用される。
同様にして、接辞辞書5には図3のように、接続する語
基の品詞属性、接辞の訳語などが記述されている。
FIG. 1 is a block diagram for explaining an embodiment of an unregistered word translation system according to the present invention. In the figure, 1 is an input unit, 2 is an analysis unit, 3 is a conversion generation unit, and 4 is an output. Part, 5 is an affix dictionary, 6 is a dictionary part, 7 is a grammar rule, 8 is an input sentence, and 9 is an output sentence. Attribute information such as case patterns and semantic features and its Japanese translation are described in the dictionary 6 for words in the source language, for example, as shown in FIG. 2, and this information is added to normal translation processing. Also used for translation processing of unregistered words.
Similarly, as shown in FIG. 3, the affix dictionary 5 describes the part-of-speech attribute of the word base to be connected, the translation of the affix, and the like.

【0008】入力文が入力部1より入力されると、解析
部2が辞書6、文法規則7を参照して入力文の構造を解
析する。この時、入力文中に未登録語があると、解析部
2により品詞が推定され、解析が続けられる。この品詞
推定の方式としては前述した特開昭63−68972号
公報に記載の方式などがある。さて、これにより未登録
語が名詞であると推定された場合、解析部2は図4に示
す処理を行って未登録語の意味素性および用法を決定す
る。以下、各ステップに基づき説明する。
When an input sentence is input from the input unit 1, the analyzing unit 2 refers to the dictionary 6 and the grammar rule 7 to analyze the structure of the input sentence. At this time, if there is an unregistered word in the input sentence, the analysis unit 2 estimates the part of speech and continues the analysis. As the method of estimating the part of speech, there is the method described in the above-mentioned Japanese Patent Laid-Open No. 63-68972. Now, when the unregistered word is estimated to be a noun by this, the analysis unit 2 determines the semantic feature and usage of the unregistered word by performing the process shown in FIG. Hereinafter, description will be given based on each step.

【0009】step1;未登録語が辞書に登録してある単
語または接辞に分解できるかどうかを判断し、分解でき
なければ処理を終了する。step2 ;未登録語が単語+接辞からなる場合、接尾辞が
複数の訳語を持つかどうかを判断し、複数の訳語を持つ
ならstep3へ、そうでなければstep4へ移る。step3 ;未登録語と共起する動詞の格パターンを参照し
て、未登録語の意味素性を決定する。step4 ;未登録語の語基である単語が複数の用法(訳
語)を持つかどうかを判断し、単一の用法(訳語)しか
もたなければ処理を終了する。step5 ;未登録語の語基が動詞であるかを判断し、動詞
でなければ処理を終了する。step6 ;未登録語が他の辞書登録名詞と共に複合名詞を
構成しているかどうかを判断し、そうでなければ処理を
終了する。step7 ;未登録語の語基動詞についての辞書の共起記述
と共起する名詞の意味素性を用いて、語基動詞の用法を
決定する。
Step 1 ; It is judged whether or not the unregistered word can be decomposed into a word or an affix registered in the dictionary, and if it cannot be decomposed, the process ends. step2 ; If the unregistered word consists of a word and an affix, it is judged whether or not the suffix has a plurality of translated words. If the suffix has a plurality of translated words, the process proceeds to step3, and if not, the process proceeds to step4. step3 ; The semantic feature of the unregistered word is determined by referring to the case pattern of the verb that co-occurs with the unregistered word. step4 ; It is judged whether or not the word which is the base of the unregistered word has a plurality of usages (translated words), and if there is only a single usage (translated word), the processing is ended. step5 ; It is judged whether the word base of the unregistered word is a verb, and if it is not a verb, the processing ends. step6 ; It is judged whether or not the unregistered word constitutes a compound noun together with other dictionary registered nouns, and if not, the processing ends. step7 : Determine the usage of the word base verb by using the co-occurrence description of the dictionary about the word base verb of the unregistered word and the semantic feature of the noun co-occurring.

【0010】以上のような処理により解析部2において
未登録語の訳出に必要な属性等が推定される。例として
前記英文(1)が入力された場合、“analyser”は名詞
であることが推定され、図4に示す処理により、共起す
る動詞“be equipped with”の辞書記述から[TOO
L]という属性を持つことが推定される。
By the above processing, the analysis unit 2 estimates the attributes and the like necessary for translating unregistered words. As an example, when the English sentence (1) is input, "analyser" is presumed to be a noun, and by the process shown in FIG. 4, from the dictionary description of the co-occurring verb "be equipped with" [TOO
It is presumed to have an attribute of L].

【0011】次に、変換生成部3で解析結果を基に日本
語文が生成される。ここで未登録語が名詞であれば、対
応する訳語が図5のフローに示すような処理によって合
成される。以下、各ステップに基づき説明する。step1 ;未登録語が辞書登録語および接辞から構成され
ているかどうか判断し、そうでなければstep11へ行
く。step2 ;未登録語が動詞を含むか判断し、含まなければ
step7へ行く。step3 ;動詞の訳語が単文節かどうか判断し、そうでな
ければstep7へ行く。step4 ;動詞の訳語がサ変動詞かどうか判断し、そうで
なければstep6へ行く。 step5 ;動詞の訳語の語幹を訳語合成に用いる。step6 ;動詞の訳語の名詞形が辞書にあればそれを訳語
合成に用いる。step7 ;辞書登録語の訳語が複数あるかどうかを判断
し、複数あれば、step8へ、そうでなければstep9へ行
く。step8 ;解析時に推定された属性を用いて訳語が一つに
しぼれるかどうか判断し、そうでなければstep10へ行
く。step9 ;未登録語を分割して辞書引きした訳語(動詞の
訳語に関してはstep2〜7で名詞化されたもの)結合し
て、訳語を合成する。step10 ;訳語が一つにしぼれなければ、複数の訳を合
成する。step11 ;辞書登録語を含まない未登録語に関しては、
原語のままを訳語とする。
Next, based on the analysis result in the conversion generator 3,
Words are generated. If the unregistered word is a noun here,
The corresponding translated word is processed according to the process shown in the flow of FIG.
Is made. Hereinafter, description will be given based on each step.step1 ; Unregistered words are composed of dictionary registered words and affixes
If yes, go to step 11.
Ku.step2 ; Determine if the unregistered word contains a verb, and if not
Go to step 7.step3 ; Determine if the verb is a simple phrase
If so, go to step 7.step4 ; Determine if the verb is a sa-verb and so
If not, go to step6. step5 Use the stem of the verb's translation for translation synthesis.step6 ; If the noun form of the verb's translation is in the dictionary, translate it
Used for synthesis.step7 ; Determine if there are multiple translations of the dictionary registration word
If there is more than one, go to step 8, otherwise go to step 9.
Ku.step8 ; Translated words into one by using attributes estimated during analysis
Determine if squeezed, otherwise go to step 10.
Ku.step9 ; Translation of unregistered words divided into dictionaries (verb
Regarding translated words, those translated into nouns in steps 2 to 7)
And synthesize the translated words.step10 If multiple translations are not possible, combine multiple translations
To achieve.step11 ; For unregistered words that do not include dictionary registered words,
Translate the original language.

【0012】例として、上記“analyser”は名詞である
と推定されたため、前記step1で辞書登録語に分割でき
ているかどうかが判断される。この場合、辞書登録動詞
“analyse”と接尾辞“er”に分割できることが分かっ
ているためstep2へ進む。動詞が含まれているので、st
ep3へ進み、“analyse”の訳語「分析する」は単文節
からなるサ変動詞であるため、step5で語幹「分析」が
訳語として、生成される。次にstep7へ進む。
As an example, since the above "analyser" is presumed to be a noun, it is judged in step 1 whether the word can be divided into dictionary registered words. In this case, since it is known that the dictionary registration verb "analyse" and the suffix "er" can be divided, the process proceeds to step 2. Since the verb is included, st
Proceeding to ep3, since the translated word "analyse""analyse" is a syllable composed of a single phrase, the stem "analyze" is generated as a translated word in step 5. Then go to step 7.

【0013】“analyse”の訳語は一つだが、“er”は
「者」と「装置」の二つの訳語(用法)があるため、st
ep8へ。解析部で推定した属性[TOOL]により、
「装置」の訳語が選ばれるので、step9へ進み、「分
析」と「装置」を組み合わせて、未登録語“analyser”
の訳語として、「分析装置」が合成される。このように
して、合成された訳語を用いて、変換生成部が日本語文
を生成する。
Although there is only one translated word for "analyse", "er" has two translated words (usage), "person" and "apparatus".
Go to ep8. By the attribute [TOOL] estimated by the analysis unit,
Since the translated word of "device" is selected, go to step 9 and combine "analysis" and "device", and the unregistered word "analyser"
“Analysis device” is synthesized as a translation of. In this way, the conversion generating unit generates a Japanese sentence using the translated words synthesized.

【0014】このように、本発明は、未登録語の品詞や
意味素性の属性を推定し、未登録語が辞書登録語からの
派生語である場合には、辞書から当該辞書登録語に関す
る解析手段と、解析手段により推定された属性と辞書情
報を用いて、未登録語に対して適切な訳語を合成する訳
語合成する訳語合成手段を備え、未登録語が名詞であ
るときにその意味素性を共起する動詞の格パターンを参
照して推定し、その素性に基づいた訳出を行うこと、そ
の際、未登録語が辞書登録語の動詞からの派生語であ
るときに、当該動詞の訳語を名詞化したものを用いて未
登録語の訳語を合成すること、さらに、当該動詞の訳
語がサ変動詞である場合には、訳語の語幹を自動的に当
該動詞の名詞化表現として採用して、未登録語の訳語を
合成すること、および、未登録語が辞書登録語の動詞
からの派生名詞であり、かつ他の辞書登録語の名詞と共
起して複合名詞となっている場合には、当該動詞の格パ
ターン、または共起記述と、共起している名詞の属性情
報を用いて、当該動詞の訳語のうち最も適するものを用
いて未登録語の訳語を合成することを特徴としたもので
ある。
As described above, the present invention estimates the part-of-speech and semantic feature attribute of an unregistered word, and when the unregistered word is a derivative of the dictionary registered word, analyzes the dictionary registered word from the dictionary. Means, and a translation word synthesizing means for synthesizing a translation word suitable for an unregistered word by using the attribute and dictionary information estimated by the analysis means, and when the unregistered word is a noun, its semantic feature Estimate by referring to the case pattern of the verb that co-occurs with, and perform translation based on its feature. At that time, when the unregistered word is a derivative of the verb of the dictionary registered word, the translated word of the verb Is used to synthesize a translation of an unregistered word, and when the translation of the verb is a sa verb, the stem of the translation is automatically adopted as a nounized expression of the verb. Synthesizing translations of unregistered words, and When the registered word is a derivative noun from the verb of the dictionary registered word and is a compound noun that co-occurs with a noun of another dictionary registered word, the case pattern of the verb or the co-occurrence description, The feature is that, by using the attribute information of the co-occurring noun, the translation of the unregistered word is synthesized using the most suitable translation of the verb.

【0015】[0015]

【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 (1)請求項1の未登録語翻訳方式においては、共起す
る動詞の格パターンを用いて未登録語の属性を推定し、
その属性に応じて未登録語の訳語を辞書登録語の訳語か
ら合成するため、未登録語でも適切に訳出することがで
きる。 (2)請求項2の未登録語翻訳方式においては、未登録
語を構成する動詞の訳語を名詞化したものを未登録語の
訳出に用いるため、より自然な訳出が出来る。 (3)請求項3の未登録語翻訳方式においては、未登録
語を構成する動詞の訳語がサ変名詞であるときに、語幹
を未登録語の訳出に用いるため、より自然な訳出が出来
る。 (4)請求項4の未登録語翻訳方式においては、複数の
訳語(用法)をもつ辞書登録語が未登録語を構成すると
き、その語が動詞であれば、他の共起する名詞との格関
係から訳語(用法)を決定して、未登録語の訳出に用い
るため、適切に訳出することが出来る。
As is apparent from the above description, the present invention has the following effects. (1) In the unregistered word translation method of claim 1, the attribute of the unregistered word is estimated using the case pattern of the co-occurring verb,
Since the translated word of the unregistered word is synthesized from the translated word of the dictionary registered word according to the attribute, the unregistered word can be appropriately translated. (2) In the unregistered word translation method according to claim 2, since the translated word of the verb that constitutes the unregistered word is converted into a noun for translation of the unregistered word, more natural translation can be performed. (3) In the unregistered word translation method of claim 3, when the translated word of the verb forming the unregistered word is a sahen noun, the stem is used for translating the unregistered word, so that a more natural translation is possible. (4) In the unregistered word translation method according to claim 4, when a dictionary registered word having a plurality of translated words (usages) constitutes an unregistered word, if the word is a verb, it is regarded as another co-occurring noun. Since the translated word (usage) is determined from the case relation and used for translating an unregistered word, it can be translated appropriately.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明による未登録語翻訳方式の一実施例を
説明するための構成図である。
FIG. 1 is a configuration diagram for explaining an embodiment of an unregistered word translation system according to the present invention.

【図2】 本発明の辞書部の情報を示す図である。FIG. 2 is a diagram showing information in a dictionary section of the present invention.

【図3】 本発明の接辞辞書の情報を示す図である。FIG. 3 is a diagram showing information of an affix dictionary according to the present invention.

【図4】 本発明の解析部の動作を示すフローチャート
である。
FIG. 4 is a flowchart showing the operation of the analysis unit of the present invention.

【図5】 本発明の変換生成部の動作を示すフローチャ
ートである。
FIG. 5 is a flowchart showing the operation of the conversion generation unit of the present invention.

【符号の説明】[Explanation of symbols]

1…入力部、2…解析部、3…変換生成部、4…出力
部、5…接辞辞書、6…辞書部、7…文法規則、8…入
力文、9…出力文。
1 ... input part, 2 ... analysis part, 3 ... conversion generation part, 4 ... output part, 5 ... affix dictionary, 6 ... dictionary part, 7 ... grammar rules, 8 ... input sentence, 9 ... output sentence.

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 原言語の単語や接辞について、その属性
や格パターンなどの情報と、日本語訳語を記述した辞書
と、該辞書に未登録であるが、辞書に登録してある単語
からの派生形で、かつ構文上名詞であると推定される未
登録語の意味素性を、共起する動詞の格パターンを用い
て推定する推定手段と、該未登録語の訳語を、該推定手
段により推定された未登録語の意味素性に応じて辞書に
登録してある単語の訳語から合成する合成手段とから成
ることを特徴とする未登録語翻訳方式。
1. For a word or affix in the source language, information such as its attribute or case pattern, a dictionary describing Japanese translations, and a word that is not registered in the dictionary but is registered in the dictionary An estimator that estimates the semantic feature of an unregistered word that is a derivational form and is presumed to be a syntactic noun using a case pattern of co-occurring verbs, and a translated word of the unregistered word by the estimator. An unregistered word translation method comprising: a synthesizing unit that synthesizes from translated words of words registered in a dictionary according to the estimated semantic features of the unregistered words.
【請求項2】 前記未登録語が辞書に登録されている動
詞からの派生名詞であるときに、辞書に記述されている
当該動詞の訳語を名詞化したものを用いて、該未登録語
の訳語を合成することを特徴とする請求項1記載の未登
録語翻訳方式。
2. When the unregistered word is a derivative noun from a verb registered in the dictionary, the translated word of the verb described in the dictionary is converted into a noun to use the unregistered word of the unregistered word. The unregistered word translation method according to claim 1, wherein translated words are synthesized.
【請求項3】 前記未登録語を構成する動詞の日本語訳
語がサ変動詞であるときには、その語幹を用いて、該未
登録語の訳語を合成することを特徴とする請求項2記載
の未登録語翻訳方式。
3. The non-registered word according to claim 2, wherein when the Japanese translation of the verb forming the unregistered word is a sa verb, the stem of the verb is used to synthesize the translation of the unregistered word. Registered word translation method.
【請求項4】 原言語の単語や接辞について、その属性
や格パターンなどの情報と、日本語訳語を記述した辞書
と、該辞書に未登録であるが、辞書に登録してある動詞
からの派生形であり、かつ構文上名詞であると推定され
る未登録語の意味素性を、当該動詞の格パターンと共起
する名詞の意味素性を用いて推定する推定手段と、前記
辞書に登録してある当該動詞の訳語のうち、該推定手段
により推定された意味素性に応じたものを名詞化して、
当該未登録語の訳語を合成する合成手段とから成ること
を特徴とする未登録語翻訳方式。
4. For a word or affix in the source language, information such as its attribute or case pattern, a dictionary describing Japanese translations, and a verb that is not registered in the dictionary but is registered in the dictionary Registered in the dictionary, an estimating means for estimating the semantic feature of an unregistered word that is a derivational form and is presumed to be a syntactic noun using the semantic feature of the noun that co-occurs with the case pattern of the verb. Of the translated words of the verb, the word corresponding to the semantic feature estimated by the estimating means is converted into a noun,
An unregistered word translation method comprising: a synthesizing unit that synthesizes a translated word of the unregistered word.
JP4120163A 1992-04-13 1992-04-13 Unregstered word translation system Pending JPH05290084A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4120163A JPH05290084A (en) 1992-04-13 1992-04-13 Unregstered word translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4120163A JPH05290084A (en) 1992-04-13 1992-04-13 Unregstered word translation system

Publications (1)

Publication Number Publication Date
JPH05290084A true JPH05290084A (en) 1993-11-05

Family

ID=14779510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4120163A Pending JPH05290084A (en) 1992-04-13 1992-04-13 Unregstered word translation system

Country Status (1)

Country Link
JP (1) JPH05290084A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8311807B2 (en) 2004-11-09 2012-11-13 Samsung Electronics Co., Ltd. Periodically extracting and evaluating frequency of occurrence data of unregistered terms in a document for updating a dictionary

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8311807B2 (en) 2004-11-09 2012-11-13 Samsung Electronics Co., Ltd. Periodically extracting and evaluating frequency of occurrence data of unregistered terms in a document for updating a dictionary

Similar Documents

Publication Publication Date Title
JP2004355625A (en) Method and system for training machine translator
JP2003196274A (en) Syntax analyzing method and device
Palmer et al. Rapid prototyping of domain-specific Machine Translation systems
JPH05290084A (en) Unregstered word translation system
Minematsu et al. Automatic estimation of accentual attribute values of words for accent sandhi rules of Japanese text-to-speech conversion
Soudi et al. A prototype English-to-Arabic interlingua-based MT system
JPH03260766A (en) Translating device with parenthesis generation deciding function
JP4033093B2 (en) Natural language processing system, natural language processing method, and computer program
JP3113257B2 (en) Machine translation equipment
JP3919732B2 (en) Machine translation apparatus and machine translation program
JPH06295311A (en) Machine translation system
JP4033088B2 (en) Natural language processing system, natural language processing method, and computer program
JP2742059B2 (en) Dictionary editor for translation
JP4033012B2 (en) Natural language processing system, natural language processing method, and computer program
JP4036172B2 (en) Natural language processing system, natural language processing method, and computer program
JPH02254565A (en) Syntax analysis system
JP2555921B2 (en) Word processor with translation conversion function
JP2935928B2 (en) Natural language translator
Huiskens et al. Developing a tool for the description of language acquisition
Aref et al. English to Arabic machine translation: a critical review and suggestions for development
JPH09281993A (en) Phonetic symbol forming device
JPH06236394A (en) Automatic natural language translation system
JPH0443462A (en) Proofreading support system after translation
JP2003114890A (en) Translation device, translation method, translation server, and program
JPH01213750A (en) Salvage method in syntax analysis for mechanical translation