JPH113336A - Machine translation apparatus and computer-readable recording medium recording machine translation processing program - Google Patents

Machine translation apparatus and computer-readable recording medium recording machine translation processing program

Info

Publication number
JPH113336A
JPH113336A JP9153484A JP15348497A JPH113336A JP H113336 A JPH113336 A JP H113336A JP 9153484 A JP9153484 A JP 9153484A JP 15348497 A JP15348497 A JP 15348497A JP H113336 A JPH113336 A JP H113336A
Authority
JP
Japan
Prior art keywords
headword
speech
dictionary
program
morphological analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9153484A
Other languages
Japanese (ja)
Other versions
JP3692711B2 (en
Inventor
Akiko Niimi
晶子 新美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP15348497A priority Critical patent/JP3692711B2/en
Publication of JPH113336A publication Critical patent/JPH113336A/en
Application granted granted Critical
Publication of JP3692711B2 publication Critical patent/JP3692711B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 機能語の登録による副作用をなくすことによ
り、ユーザに機能語の登録を許し、その結果、高精度の
翻訳結果文を得て、後編集の負荷を軽減することが可能
な機械翻訳装置及び機械翻訳処理プログラムを記録した
コンピュータ読み取り可能な記録媒体を提供すること。 【解決手段】 見出し語と品詞とが入力され(S51
0:Y)、前記見出し語が辞書内に無いと判断されると
(S520:N)、辞書情報が新規作成される(S53
0)。そして、辞書に登録される場合には(S550:
Y)、品詞が助詞か否かが判断され(S560)、助詞
の場合は(S560:Y)、ダミーの名詞をつけて形態
素解析を実行し(S570)、得られた各要素を要素見
出し語として辞書情報と分割フラグとともに辞書へ登録
する(S580〜S590)。
(57) [Summary] [PROBLEMS] To allow a user to register a function word by eliminating side effects caused by the registration of the function word, thereby obtaining a high-accuracy translation result sentence, and reducing the load of post-editing. A computer-readable recording medium that records a machine translation device and a machine translation processing program. A headword and a part of speech are input (S51).
0: Y), if it is determined that the entry is not in the dictionary (S520: N), dictionary information is newly created (S53).
0). And when it is registered in the dictionary (S550:
Y), it is determined whether or not the part of speech is a particle (S560). If the part of speech is a particle (S560: Y), a morphological analysis is performed with a dummy noun attached (S570), and each obtained element is identified as an element headword. Is registered in the dictionary together with the dictionary information and the division flag (S580 to S590).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、第一言語の原文を
第二言語に翻訳する機械翻訳装置及び機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation device for translating an original sentence of a first language into a second language, and a computer-readable recording medium on which a machine translation processing program is recorded.

【0002】[0002]

【従来の技術】従来、この種の機械翻訳装置において
は、一般的に複数種類の辞書が用意されており、翻訳処
理においては、その翻訳しようとするテキストに応じて
最もふさわしい辞書を使用するように構成されている。
ここで、用意されている辞書の種類としては、例えば、
広い範囲の語句が一般的な訳語や語法で登録されてお
り、機械翻訳装置が予め保有している基本辞書と、ある
特定の分野でのみ使用される語句や訳語などが登録され
ている専門辞書と、ユーザが独自に編集することができ
るユーザ辞書などがある。
2. Description of the Related Art Conventionally, in this type of machine translation apparatus, a plurality of types of dictionaries are generally prepared. In a translation process, a dictionary most suitable for a text to be translated is used. Is configured.
Here, as the type of the prepared dictionary, for example,
A wide range of words and phrases are registered in general translations and grammar, and a basic dictionary stored in advance by a machine translation device and a specialized dictionary in which words and translations used only in a specific field are registered And a user dictionary that the user can independently edit.

【0003】機械による翻訳処理に限らず、人手による
翻訳処理においても、様々な種類の辞書を利用する必要
があり、用例の豊富な一般の学習用辞書、専門用語の対
訳が並んでいる専門分野の辞書、専門書、雑誌、論文な
どを用いる場合もある。また、実際の翻訳処理では、こ
れらの市販されているものだけでは十分でなく、翻訳処
理を行う者の知識や、独自に集めた用語集などが併用さ
れる。この状況は機械による翻訳処理でも同様である。
[0003] Not only machine translation processing but also manual translation processing requires the use of various types of dictionaries, general learning dictionaries with abundant examples, and specialized fields in which bilingual technical terms are arranged. Dictionaries, specialized books, magazines, papers, etc. Further, in the actual translation processing, these commercially available ones are not enough, and the knowledge of the person who performs the translation processing, a glossary of original terms and the like are also used. This situation is the same in translation processing by a machine.

【0004】実際の翻訳文中には、個々のユーザが独自
に用いる用語や言い回しがかなりの割合で含まれている
ため、システム側で予め用意してある前記基本辞書、専
門辞書だけでは不十分であり、未登録語が多数存在して
しまう。また、基本辞書、専門辞書に登録されている語
句であっても、その訳語がユーザに最もふさわしいもの
あるとは限らず、特定のユーザが使う決まり文句や独特
の表現、慣用句を文字通り訳してしまうため意味が通ら
ない訳文や、不自然な訳文が生成されてしまうことがあ
った。このような訳文が多ければ多いほど、ユーザは膨
大な後編集を行わなければならない。従って、ユーザが
自由に編集できるユーザ辞書は、自然な翻訳結果を得る
ためには不可欠である。
[0004] Since actual translations contain a considerable proportion of terms and phrases used by individual users, the basic dictionary and specialized dictionary prepared in advance by the system are not sufficient. Yes, there are many unregistered words. In addition, even if a phrase is registered in the basic dictionary or specialized dictionary, its translation may not always be the most suitable for the user, and may be translated literally into a fixed phrase, unique expression, or idiom used by a specific user. Therefore, a translated sentence that does not make sense or an unnatural translated sentence may be generated. The more such translations, the more extensive post-editing must be performed by the user. Therefore, a user dictionary that the user can freely edit is indispensable for obtaining a natural translation result.

【0005】ところが、ユーザは機械翻訳装置の内部に
詳しいわけではないため、必ずしも適切なユーザ辞書が
作れないという問題がある。即ち、ユーザは、注目して
いる部分の翻訳のことのみを考えて見出し語の登録を行
う傾向にあるが、その見出し語を登録したために前記注
目している部分以外の翻訳が不適切になるという副作用
が発生することがある。
However, since the user is not familiar with the inside of the machine translator, there is a problem that an appropriate user dictionary cannot always be created. That is, the user tends to register the headword only by considering the translation of the focused part, but the translation of the part other than the focused part becomes inappropriate because the registered headword is registered. Side effects may occur.

【0006】そこで、従来の機械翻訳装置では、このよ
うな弊害を誘発しないように、ユーザ辞書へ登録できる
品詞を名詞のみ、或いは動詞や形容詞など自立語のみに
制限していた。
Therefore, in the conventional machine translator, the part of speech that can be registered in the user dictionary is limited to only nouns or only independent words such as verbs and adjectives so as not to induce such adverse effects.

【0007】また、特開平7−85059号公報におい
ては、翻訳処理に悪影響を及ぼすような辞書登録に対し
警告を出す辞書検査装置が開示されている。
Japanese Patent Application Laid-Open No. 7-85059 discloses a dictionary inspection apparatus which issues a warning for dictionary registration that adversely affects translation processing.

【0008】[0008]

【発明が解決しようとする課題】しかしながら、前述し
たように辞書登録に制限ばかり設けることは、初心者の
ユーザであればともかく、機械翻訳装置を自在に使いこ
なしているユーザにとってはとても歯がゆい状況になっ
ている。即ち、自立語の編集だけでなく、機能語と呼ば
れる助詞や助動詞の中でも自由度が高い連語を使うこと
ができれば文章がより自然になるのにも拘わらず、その
ような品詞は形態素解析で不適切な結果が生じるという
危険を伴うという理由でユーザに開放されていなかっ
た。
However, as described above, providing only a limit to dictionary registration, as well as a novice user, is very difficult for users who use the machine translator freely. I have. That is, not only the editing of independent words, but also the use of collocations with a high degree of freedom among particles and auxiliary verbs called functional words, even though the sentence becomes more natural, such parts of speech cannot be analyzed by morphological analysis. It was not open to the user because it involved the danger of proper results.

【0009】本発明は、上述した問題点を解決するため
になされたものであり、ユーザ辞書に機能語を登録する
ことを可能にし、且つ、その登録による翻訳処理におけ
る副作用を抑え、精度の高い翻訳結果を得ることができ
る機械翻訳装置及び機械翻訳処理プログラムを記録した
コンピュータ読み取り可能な記録媒体を提供することを
目的としている。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problems, and enables a function word to be registered in a user dictionary, suppresses side effects in translation processing due to the registration, and achieves high accuracy. An object of the present invention is to provide a machine translation device capable of obtaining a translation result and a computer-readable recording medium recording a machine translation processing program.

【0010】[0010]

【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の機械翻訳装置は、第一言
語の見出し語と、品詞と、前記各見出し語に対応する第
二言語の訳語と、形態素解析処理に必要な接続情報等の
翻訳処理に用いられる各種の辞書登録情報とを格納する
辞書と、その辞書に対して前記第一言語の見出し語等の
情報を追加、修正、削除等する辞書編集手段と、入力さ
れた前記第一言語の原文について前記辞書に登録された
見出し語を検索することにより形態素解析を行う形態素
解析手段と、その形態素解析手段による形態素解析結果
に対して構文解析を行う構文解析手段とを備え、前記第
一言語の原文を前記第二言語に翻訳するようにしたもの
を対象として、特に、前記辞書編集手段が、前記辞書へ
登録しようとする見出し語が特定の品詞であるか否かを
判定する特定品詞判定手段と、その特定品詞判定手段が
前記特定の品詞であると判断した場合に、前記形態素解
析手段により前記見出し語の形態素解析を行って複数の
要素に分割する見出し語分割手段と、その見出し語分割
手段により分割された複数の要素の各々を見出し語とし
て前記辞書に登録するとともに、前記見出し語分割手段
により分割する前の原見出し語の要素であることを示す
要素見出し語情報を前記各要素の辞書登録情報として付
加する登録手段とを備えている。
In order to achieve this object, a machine translation apparatus according to a first aspect of the present invention provides a machine translation apparatus comprising: A dictionary that stores bilingual translations and various dictionary registration information used for translation processing such as connection information necessary for morphological analysis processing, and adds information such as headwords of the first language to the dictionary. Dictionary editing means for correcting, deleting, etc., morphological analysis means for performing a morphological analysis by searching for an entry word registered in the dictionary for the input original text of the first language, and morphological analysis by the morphological analyzing means A parsing means for parsing a result, wherein the original text of the first language is translated into the second language. To be A specific part-of-speech determining means for determining whether or not the putative word is a specific part-of-speech, and when the specific part-of-speech determining means determines that the specific part of speech, the morphological analysis means performs morphological analysis of the headword. Headword division means for performing division into a plurality of elements, and registering each of the plurality of elements divided by the headword division means as the headword in the dictionary, A registration unit that adds element headword information indicating that the element is a headword element as dictionary registration information of each element.

【0011】従って、特定品詞判定手段は辞書へ登録し
ようとする見出し語が特定の品詞であるか否かを判定
し、見出し語分割手段は前記特定品詞判定手段が前記特
定の品詞であると判断した場合に、形態素解析手段によ
り前記見出し語の形態素解析を行って複数の要素に分割
し、登録手段は前記見出し語分割手段により分割された
複数の要素の各々を見出し語として前記辞書に登録する
とともに、前記見出し語分割手段により分割する前の原
見出し語の要素であることを示す要素見出し語情報を前
記各要素の辞書登録情報として付加する。
Therefore, the specific part-of-speech determining means determines whether the headword to be registered in the dictionary is a specific part-of-speech, and the headword dividing means determines that the specific part-of-speech determining means is the specific part of speech. In this case, a morphological analysis of the headword is performed by the morphological analysis unit to divide the headword into a plurality of elements, and the registration unit registers each of the plurality of elements divided by the headword division unit as a headword in the dictionary. At the same time, element headword information indicating that the element is an element of the original headword before division by the headword division means is added as dictionary registration information of each element.

【0012】また、請求項2に記載の機械翻訳装置は、
前記特定品詞判定手段が、前記登録しようとする見出し
語が助詞であるか否かを判定するように構成され、前記
見出し語分割手段は、前記登録しようとする見出し語の
直前に仮の名詞を接続して形態素解析を行うように構成
されている。
Further, the machine translation device according to claim 2 is
The specific part-of-speech determining means is configured to determine whether the headword to be registered is a particle, and the headword dividing means converts a temporary noun immediately before the headword to be registered. It is configured to perform morphological analysis by connecting.

【0013】従って、特定品詞判定手段は、登録しよう
とする見出し語が助詞であるか否かを判定し、前記特定
品詞判定手段により助詞であると判定された場合には、
見出し語分割手段が、前記登録しようとする見出し語の
直前に仮の名詞を接続して形態素解析を行って複数の要
素に分割する。
Therefore, the specific part-of-speech determining means determines whether or not the headword to be registered is a particle. If the specific part-of-speech determining means determines that the headword is a particle,
The headword division unit connects the provisional noun immediately before the headword to be registered and performs morphological analysis to divide the headword into a plurality of elements.

【0014】また、請求項3に記載の機械翻訳装置は、
前記構文解析手段は、入力された原文の前記形態素解析
手段による形態素解析結果内に、前記要素見出し語情報
を有する見出し語が存在するか否かを判定する要素見出
し語判定手段と、その要素見出し語判定手段により前記
見出し語が存在すると判定された場合に、前記要素見出
し語情報を有する複数の見出し語が前記原文中において
前記特定の品詞として使われているか否かを判断する品
詞判断手段と、その品詞判断手段により前記特定の品詞
として使われていると判断された場合に、前記要素見出
し語情報を有する複数の見出し語を前記原見出し語に置
換する置換手段とを備えている。
Further, the machine translation device according to claim 3 is
The syntax analysis means includes: an element headword determination means for determining whether a headword having the element headword information is present in a morphological analysis result of the input original text by the morphological analysis means; A part-of-speech determining means for determining whether a plurality of headwords having the element headword information are used as the specific part-of-speech in the original text when the headword is determined to be present by the word determining means; Replacement means for replacing a plurality of headwords having the element headword information with the original headword when the part-of-speech determination means determines that the headword is used as the specific part of speech.

【0015】従って、要素見出し語判定手段は、入力さ
れた原文の前記形態素解析手段による形態素解析結果内
に、前記要素見出し語情報を有する見出し語が存在する
か否かを判定し、品詞判断手段は、前記要素見出し語判
定手段により前記見出し語が存在すると判定された場合
に、前記要素見出し語情報を有する複数の見出し語が前
記原文中において前記特定の品詞として使われているか
否かを判断し、置換手段は、前記品詞判断手段により前
記特定の品詞として使われていると判断された場合に、
前記要素見出し語情報を有する複数の見出し語を前記原
見出し語に置換する。
Therefore, the element headword determining means determines whether or not a headword having the element headword information exists in the morphological analysis result of the input original sentence by the morphological analysis means. Determines whether or not a plurality of headwords having the element headword information are used as the specific part of speech in the original sentence when the element headword determination means determines that the headword exists. The replacement means, when it is determined by the part of speech determination means is used as the specific part of speech,
A plurality of headwords having the element headword information are replaced with the original headword.

【0016】また、請求項4に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
は、第一言語の見出し語と、品詞と、前記各見出し語に
対応する第二言語の訳語と、形態素解析処理に必要な接
続情報等の翻訳処理に用いられる各種の辞書登録情報と
を格納する辞書に対して前記第一言語の見出し語等の情
報を追加、修正、削除等する辞書編集プログラムと、入
力された前記第一言語の原文について前記辞書に登録さ
れた見出し語を検索することにより形態素解析を行う形
態素解析プログラムと、その形態素解析プログラムによ
る形態素解析結果に対して構文解析を行う構文解析プロ
グラムとを格納したものを対象として、特に、前記辞書
編集プログラムは、前記辞書へ登録しようとする見出し
語が特定の品詞であるか否かを判定する特定品詞判定プ
ログラムと、その特定品詞判定プログラムが前記特定の
品詞であると判断した場合に、前記形態素解析プログラ
ムにより前記見出し語の形態素解析を行って複数の要素
に分割する見出し語分割プログラムと、その見出し語分
割プログラムにより分割された複数の要素の各々を見出
し語として前記辞書に登録するとともに、前記見出し語
分割プログラムにより分割する前の原見出し語の要素で
あることを示す要素見出し語情報を前記各要素の辞書登
録情報として付加する登録プログラムとを備えている。
According to a fourth aspect of the present invention, there is provided a computer-readable recording medium storing a machine translation processing program, comprising: a headword of a first language; a part of speech; and a translation of a second language corresponding to each headword. A dictionary editing program for adding, modifying, deleting, etc., information such as headwords of the first language with respect to a dictionary storing various dictionary registration information used for translation processing such as connection information necessary for morphological analysis processing A morphological analysis program for performing a morphological analysis by searching for an entry word registered in the dictionary for the input original text of the first language, and a syntax for performing a syntax analysis on a morphological analysis result by the morphological analysis program In particular, the dictionary editing program is designed to store an analysis program and a headword to be registered in the dictionary with a specific part of speech. A specific part-of-speech determination program that determines whether or not the headword is divided into a plurality of elements by performing a morphological analysis of the headword with the morphological analysis program when the specific part-of-speech determination program determines that the specific part of speech is A headword division program, and each of the plurality of elements divided by the headword division program are registered in the dictionary as headwords, and are elements of the original headword before being divided by the headword division program. And a registration program for adding element headword information indicating the above as dictionary registration information of each element.

【0017】従って、この記録媒体を用いてプログラム
を実行することにより、辞書へ登録しようとする見出し
語が特定の品詞であるか否かが判定され、前記特定の品
詞であると判断された場合に、前記形態素解析プログラ
ムにより前記見出し語の形態素解析を行って複数の要素
に分割され、その分割された複数の要素の各々を見出し
語として前記辞書に登録されるとともに、分割する前の
原見出し語の要素であることを示す要素見出し語情報
が、前記各要素の辞書登録情報として付加される。
Therefore, by executing a program using this recording medium, it is determined whether or not the headword to be registered in the dictionary is a specific part of speech. If the headword is determined to be the specific part of speech, The morphological analysis of the headword is performed by the morphological analysis program, the headword is divided into a plurality of elements, and each of the plurality of divided elements is registered in the dictionary as a headword, and the original headword before the division is obtained. Element headword information indicating that the element is a word element is added as dictionary registration information of each element.

【0018】また、請求項5に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
は、前記登録しようとする見出し語が助詞であるか否か
を判定するようにされた特定品詞判定プログラムと、前
記登録しようとする見出し語の直前に仮の名詞を接続し
て形態素解析を行うようにされた見出し語分割プログラ
ムとを格納する。
According to a fifth aspect of the present invention, there is provided a computer-readable recording medium storing the machine translation processing program according to the fifth aspect, wherein the specific part-of-speech determination is performed so as to determine whether the headword to be registered is a particle. A program and a headword division program for performing morphological analysis by connecting a temporary noun immediately before the headword to be registered are stored.

【0019】従って、この記録媒体を用いてプログラム
を実行することにより、登録しようとする見出し語が助
詞であるか否かを判定し、助詞であると判定された場合
には、前記登録しようとする見出し語の直前に仮の名詞
を接続して形態素解析を行って複数の要素に分割するこ
とができる。
Accordingly, by executing a program using this recording medium, it is determined whether or not the headword to be registered is a particle, and if it is determined that the headword is a particle, the registration is attempted. A tentative noun can be connected immediately before the headword to be morphologically analyzed and divided into a plurality of elements.

【0020】また、請求項6に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
は、入力された原文の前記形態素解析プログラムによる
形態素解析結果内に、前記要素見出し語情報を有する見
出し語が存在するか否かを判定する要素見出し語判定プ
ログラムと、その要素見出し語判定プログラムにより前
記見出し語が存在すると判定された場合に、前記要素見
出し語情報を有する複数の見出し語が前記原文中におい
て前記特定の品詞として使われているか否かを判断する
品詞判断プログラムと、その品詞判断プログラムにより
前記特定の品詞として使われていると判断された場合
に、前記要素見出し語情報を有する複数の見出し語を前
記原見出し語に置換する置換プログラムとを備えた構文
解析プログラムを格納する。
According to a sixth aspect of the present invention, there is provided a computer-readable recording medium storing the machine translation processing program according to the first aspect of the present invention, wherein a heading having the element headword information is included in a morphological analysis result of the input original sentence by the morphological analysis program. An element headword determination program for determining whether or not a word exists; and, when the element headword determination program determines that the headword is present, a plurality of headwords having the element headword information are included in the original text. A part-of-speech determination program that determines whether or not the part-of-speech is used as the specific part-of-speech; and a plurality of parts having the element headword information when the part-of-speech determination program determines that the part-of-speech is used. And a replacement program for replacing the headword with the original headword. To.

【0021】従って、この記録媒体を用いてプログラム
を実行することにより、入力された原文の前記形態素解
析手段による形態素解析結果内に、前記要素見出し語情
報を有する見出し語が存在するか否かを判定し、前記見
出し語が存在すると判定された場合に、前記要素見出し
語情報を有する複数の見出し語が前記原文中において前
記特定の品詞として使われているか否かを判断し、前記
品詞判断手段により前記特定の品詞として使われている
と判断された場合に、前記要素見出し語情報を有する複
数の見出し語を前記原見出し語に置換することができ
る。
Therefore, by executing a program using this recording medium, it is possible to determine whether or not a headword having the element headword information exists in the morphological analysis result of the input original text by the morphological analysis means. Determining, when it is determined that the headword is present, determining whether or not a plurality of headwords having the element headword information are used as the specific part of speech in the original sentence; Thus, when it is determined that the headword is used as the specific part of speech, a plurality of headwords having the element headword information can be replaced with the original headword.

【0022】[0022]

【発明の実施の形態】以下、本発明の機械翻訳装置を具
体化した実施の形態について図面を参照して説明する。
尚、本実施の形態では、日本語を第一言語とし、英語を
第二言語とする機械翻訳装置において、ユーザがユーザ
辞書に助詞を登録することができるようにした例を説明
する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment embodying a machine translation apparatus according to the present invention will be described below with reference to the drawings.
In the present embodiment, an example will be described in which a user can register particles in a user dictionary in a machine translator using Japanese as a first language and English as a second language.

【0023】まず、本実施形態の機械翻訳装置の概略構
成のブロック図を図1に示す。
First, FIG. 1 shows a block diagram of a schematic configuration of a machine translation apparatus according to the present embodiment.

【0024】図1に示すように、本実施形態の機械翻訳
装置は、翻訳対象となる日本語の原文や各種操作指示等
を入力するためのキーボード等から成る入力部2と、翻
訳処理に利用される各種辞書が格納され、ハードディス
クや光ディスク等から成る外部記憶装置4と、入力され
た日本語の原文や翻訳結果である英語の訳文等を表示す
るためのCRT等から成る表示部6と、その表示部6に
表示するデータを制御する表示制御部7と、翻訳結果で
ある英語の訳文等を印刷して出力するためのレーザープ
リンタ等から成る印刷部8と、前記入力部2や外部翻訳
装置4から入力されるデータに基づいて翻訳処理を行
い、その翻訳結果を表示部6に表示したり、印刷部8か
ら出力する等の制御を行う制御部10とから構成されて
いる。
As shown in FIG. 1, the machine translation apparatus of this embodiment has an input unit 2 composed of a keyboard or the like for inputting a Japanese original to be translated, various operation instructions, and the like, and is used for translation processing. An external storage device 4 including a hard disk, an optical disk, or the like, in which various dictionaries are stored, a display unit 6 including a CRT or the like for displaying an input Japanese original and an English translation as a translation result, and the like. A display control unit 7 for controlling data to be displayed on the display unit 6, a printing unit 8 such as a laser printer for printing and outputting English translations and the like as translation results, the input unit 2 and external translation The control unit 10 performs a translation process based on the data input from the device 4, displays the translation result on the display unit 6, and outputs the translation result from the printing unit 8.

【0025】前記入力部2には、文字を入力するための
文字キー、各種処理を起動するための入力文編集キー、
翻訳実行キー、辞書編集キー、出力文編集キー、終了キ
ー、及び印字実行キーといった各種機能キー、入力文や
出力文の編集、表示部6に表示されている画面操作等に
使用するカーソルキー、挿入キー、削除キー、確定キ
ー、及び次候補選択キー等が設けられている。
The input unit 2 includes a character key for inputting characters, an input sentence editing key for activating various processes,
Various function keys such as a translation execution key, a dictionary editing key, an output sentence editing key, an end key, and a print execution key; cursor keys used for editing an input sentence or an output sentence; operating a screen displayed on the display unit 6; An insert key, a delete key, a decision key, a next candidate selection key, and the like are provided.

【0026】また、前記外部記憶装置4には、翻訳処理
に利用される基本辞書12とユーザ辞書14が格納され
ている。このユーザ辞書14が、本発明の辞書を構成し
ている。
The external storage device 4 stores a basic dictionary 12 and a user dictionary 14 used for translation processing. This user dictionary 14 constitutes the dictionary of the present invention.

【0027】機械翻訳装置が利用する辞書としては、機
械翻訳装置が予め保有している基本辞書、専門分野毎に
編集された専門辞書、及びユーザが独自に構築するユー
ザ辞書がある。専門辞書、ユーザ辞書は利用しても、利
用しなくてもよい。もし専門辞書を利用する際には、外
部記憶装置4内に格納される。また、専門辞書は、各種
専門分野毎に、ユーザ辞書は、例えば、ユーザ毎や利用
分野毎にそれぞれ複数個の辞書が同時に存在可能に構成
されていてもよい。本実施形態では、これらの利用につ
いては特に明言しない。
The dictionaries used by the machine translation device include a basic dictionary held in advance by the machine translation device, a specialized dictionary edited for each specialized field, and a user dictionary constructed by the user independently. The specialized dictionary and the user dictionary may or may not be used. If a specialized dictionary is used, it is stored in the external storage device 4. Further, the specialized dictionary may be configured such that a plurality of dictionaries can exist simultaneously for each specialized field, and the user dictionary can be simultaneously present for each user or each usage field, for example. In the present embodiment, their use is not specifically stated.

【0028】図2に、前述した基本辞書のデータ構成の
一例を示す。個々の辞書登録情報は、それぞれ見出し語
30と、各見出し語の品詞32と、各見出し語に対する
訳語34と前後の接続情報や意味情報等を含む様々な辞
書情報36とから構成されている。
FIG. 2 shows an example of the data structure of the above-mentioned basic dictionary. Each dictionary registration information is composed of a headword 30, a part of speech 32 of each headword, a translated word 34 for each headword, and various dictionary information 36 including connection information and semantic information before and after.

【0029】図3に、前述したユーザ辞書のデータ構成
の一例を示す。個々の辞書登録情報は、それぞれ見出し
語40と、各見出し語の品詞42と、各見出し語に対す
る訳語44と、前後の接続情報や意味情報等を含む様々
な辞書情報46とから構成されている。
FIG. 3 shows an example of the data structure of the above-mentioned user dictionary. Each dictionary registration information is composed of a headword 40, a part of speech 42 of each headword, a translated word 44 for each headword, and various dictionary information 46 including connection information and semantic information before and after. .

【0030】次に、前記制御部10は、CPU18、R
OM20、RAM22、入出力ポート24、及びこれら
各部を結ぶバスライン26を備えた周知のマイクロコン
ピュータにより構成されている。そして、制御部10に
おいては、ROM20に格納されたプログラムによって
各種処理が実行される。例えば、前記入力部2から入力
された日本語の原文を英語に翻訳すると共に、原文や翻
訳文の編集等を行う翻訳・編集処理、また、翻訳時に利
用するユーザ辞書を構築するための辞書編集処理等が実
行される。
Next, the control unit 10 includes a CPU 18 and an R
It comprises a well-known microcomputer having an OM 20, a RAM 22, an input / output port 24, and a bus line 26 connecting these components. In the control unit 10, various processes are executed by a program stored in the ROM 20. For example, a translation and editing process for translating a Japanese original sentence input from the input unit 2 into English, editing the original sentence and the translated sentence, and a dictionary editing for constructing a user dictionary used at the time of translation. Processing and the like are executed.

【0031】また、前記ROM20には、後述する翻訳
処理において使用される各種情報が格納されている。
The ROM 20 stores various types of information used in a translation process described later.

【0032】前記RAM22には、入力部から入力され
る日本語の原文、及び翻訳・編集処理により翻訳、編集
された英語の訳文、及びユーザ辞書14の辞書登録情報
が格納される。
The RAM 22 stores the Japanese original sentence input from the input unit, the English translation translated and edited by the translation and editing processing, and the dictionary registration information of the user dictionary 14.

【0033】続いて、制御部10が実行する翻訳・編集
処理について図4〜図6に示すフローチャートに従って
説明する。
Next, the translation / editing process executed by the control unit 10 will be described with reference to the flowcharts shown in FIGS.

【0034】図4に示すように、翻訳・編集処理が実行
されると、まず、ステップ110(以下、ステップをS
と略記する。他のステップも同様)において、ユーザに
より入力部2の文字キー等が操作され、翻訳対象となる
日本語の原文が入力されるのを待つ。ここで、原文の入
力は、既に作成されている原文のファイルを読み込むよ
うに構成してもよい。そして、日本語の原文(以下、入
力文)が入力されると、S120に進み、この入力文
を、表示部6の所定のエリアに表示する。
As shown in FIG. 4, when the translation / editing process is executed, first, step 110 (hereinafter, step is referred to as S
Abbreviated. In the same manner as in the other steps), the user waits until the user operates a character key or the like of the input unit 2 to input a Japanese original text to be translated. Here, the input of the original text may be configured to read the file of the original text that has already been created. Then, when a Japanese original sentence (hereinafter, input sentence) is input, the process proceeds to S120, and the input sentence is displayed in a predetermined area of the display unit 6.

【0035】次に、S130では、入力部2に設けられ
た入力文編集キーが操作されたか否かを判断し、操作さ
れていなければ(S130:N)、S150に移行す
る。また、入力文編集キーが操作されていれば(S13
0:Y)、S140に移行し、入力文編集処理を実行す
る。尚、入力文編集処理が実行されると、ユーザは表示
部6の所定のエリアに表示された入力文を、入力部2に
設けられたカーソルキー、削除キー、挿入キー及び文字
キー等を使用して直接修正することが可能となる。S1
50では、入力部2に設けられた翻訳実行キーが操作さ
れたか否かを判断し、操作されていなければ(S15
0:N)、S190に移行し、また、翻訳実行キーが操
作されていれば(S150:Y)、S160に移行し、
日本語の入力文を英語の訳文(以下、出力文とする)に
翻訳する翻訳処理を実行し、続くS170において、翻
訳処理により得られた出力文を入力文と対にしてRAM
22に格納すると共に、S180において、表示部6に
設けられた所定のエリアにそれぞれ入力文と出力文とを
表示する。
Next, in S130, it is determined whether or not the input sentence edit key provided in the input unit 2 has been operated. If not (S130: N), the process proceeds to S150. If the input sentence edit key is operated (S13
0: Y), and proceeds to S140 to execute an input sentence editing process. When the input sentence editing process is executed, the user uses the cursor keys, the delete key, the insert key, the character keys, and the like provided on the input unit 2 to change the input sentence displayed in a predetermined area of the display unit 6. Can be directly modified. S1
At 50, it is determined whether or not the translation execution key provided on the input unit 2 has been operated, and if it has not been operated (S15).
0: N), the process proceeds to S190, and if the translation execution key is operated (S150: Y), the process proceeds to S160,
A translation process for translating a Japanese input sentence into an English translated sentence (hereinafter referred to as an output sentence) is executed, and in S170, the output sentence obtained by the translation process is paired with the input sentence in the RAM.
In step S180, the input sentence and the output sentence are displayed in predetermined areas provided in the display unit 6, respectively.

【0036】尚、翻訳処理は、入力文全部を一括して実
行しても良いし、文章単位で範囲を指定し、指定された
範囲の文章のみについて実行するようにしてもよい。
The translation process may be performed for all input sentences at once, or for a range of sentences, and may be performed only for the specified range of sentences.

【0037】S190では、入力部2に設けられた辞書
編集キーが操作されたか否かを判断し、操作されていな
ければ(S190:N)、S210に移行する。また、
辞書編集キーが操作されていれば(S190:Y)、S
200に移行し、辞書編集処理を実行する。尚、辞書編
集処理が実行されると、ユーザはユーザ辞書14に登録
されている情報の内容を修正したり、削除したり、新た
に必要な語句を登録することが可能となる。また、S2
00の処理が、本発明の辞書編集手段若しくは辞書編集
プログラムとして機能している。
In S190, it is determined whether or not the dictionary editing key provided on the input unit 2 has been operated. If not (S190: N), the process proceeds to S210. Also,
If the dictionary edit key is operated (S190: Y), S
The process proceeds to 200, where a dictionary editing process is executed. When the dictionary editing process is executed, the user can correct or delete the content of the information registered in the user dictionary 14 or register a new necessary phrase. Also, S2
The processing of 00 functions as a dictionary editing means or a dictionary editing program of the present invention.

【0038】S210では、入力部2に設けられた出力
文編集キーが操作されたか否かを判断し、操作されてい
なければ(S210:N)、S230に移行する。ま
た、出力文編集キーが操作されていれば(S210:
Y)、S220に移行し、出力文編集処理を実行する。
尚、出力文編集処理が実行されると、ユーザは先のS1
60において翻訳処理が実行されることにより表示部6
の所定のエリアに表示される出力文(英語の訳文)を、
S140の入力文編集処理と同様に、入力部2に設けら
れたカーソルキー、削除キー、挿入キー及び文字キー等
を使用して、直接修正することが可能となる。
In S210, it is determined whether or not the output sentence editing key provided on the input unit 2 has been operated. If not (S210: N), the flow proceeds to S230. If the output sentence edit key is operated (S210:
Y), and proceeds to S220 to execute an output sentence editing process.
When the output sentence editing process is executed, the user enters S1
When the translation process is executed at 60, the display unit 6
The output sentence (English translation) displayed in the specified area of
As in the input sentence editing process in S140, it is possible to directly make corrections using a cursor key, a delete key, an insert key, a character key, and the like provided on the input unit 2.

【0039】S230では、入力部2に設けられた終了
キーが操作されたか否かを判断し、操作されていなけれ
ば(S230:N)、S240に移行し、例えば、翻訳
された出力文を印刷部8に出力し印刷させる印刷実行キ
ー等、その他のキー操作を検出すると共に、操作された
キーに応じた処理を実行する。
In S230, it is determined whether or not the end key provided on the input unit 2 has been operated. If the end key has not been operated (S230: N), the process proceeds to S240, for example, a translated output sentence is printed. It detects other key operations such as a print execution key that is output to the unit 8 and prints, and executes a process corresponding to the operated key.

【0040】そして、先のS140、S180、S20
0、S220、S240が処理された後は、S130に
戻り、同様の処理を繰り返し実行する。
Then, S140, S180, S20
After the processing of 0, S220, and S240, the process returns to S130, and the same processing is repeatedly executed.

【0041】また、S230にて、終了キーが操作され
たと判断されると(S230:Y)、本処理を終了す
る。
If it is determined in S230 that the end key has been operated (S230: Y), the process is terminated.

【0042】このように翻訳・編集処理においては、日
本語の原文が入力された後、入力部2に設けられた各種
キーの操作に従って、入力文の編集処理、翻訳処理、辞
書編集処理、及び出力文編集処理といった各種処理が実
行される。そして、もし、翻訳実行キーを操作し翻訳処
理を実行したが、得られた出力文(英語の訳文)が不正
確であったり不自然であったりする場合には、入力文編
集キーを操作して入力文編集処理を実行し、入力文であ
る日本語の原文を再編集した後、またはユーザ辞書編集
キーを操作してユーザ辞書を編集した後、再度、翻訳実
行キーを操作して再翻訳させるか、あるいは出力文編集
キーを操作して出力文編集処理を実行し、出力文である
英語の訳文を直接編集する。
As described above, in the translation / editing process, after the Japanese original sentence is input, the input sentence editing process, translation process, dictionary editing process, and the like are performed in accordance with the operation of various keys provided on the input unit 2. Various processes such as an output sentence editing process are executed. Then, if the translation process is executed by operating the translation execution key, if the obtained output sentence (English translation) is incorrect or unnatural, the input sentence edit key is operated. Execute the input sentence editing process to re-edit the Japanese original sentence that is the input sentence, or edit the user dictionary by operating the user dictionary edit key, and then operate the translation execution key again to re-translate Alternatively, an output sentence editing key is operated to execute an output sentence editing process, and an English translation sentence, which is an output sentence, is directly edited.

【0043】このような処理を繰り返すことにより、ユ
ーザが求める翻訳結果を得ることができれば、印刷キー
を操作して、翻訳結果を印刷部8から出力したり、テキ
ストデータとしてRAM22や外部記憶装置4に保存
し、その後、終了キーを操作して、処理を終了する。
If the translation result desired by the user can be obtained by repeating such processing, the print key is operated to output the translation result from the printing unit 8 or to the RAM 22 or the external storage device 4 as text data. And then operate the end key to end the process.

【0044】次に、図4に示すフローチャート中のS2
00の辞書編集処理の詳細について、図5に示すフロー
チャートに従って説明する。
Next, S2 in the flowchart shown in FIG.
00 will be described in detail with reference to the flowchart shown in FIG.

【0045】まず、S510では、ユーザが編集したい
見出し語とその品詞が入力されたか否かを判断する。入
力されていれば(S510:Y)、S520に移行す
る。S520では、入力された見出し語と品詞のペア
が、既にユーザ辞書14に登録されているか否かを判断
する。既に登録されていれば(S520:Y)、S54
0に移行する。S540では、ユーザ辞書内のデータを
再編集して、S550へ移行する。まだ登録されていな
ければ(S520:N)、S530へ移行する。S53
0では、新規に辞書情報を編集してS550へ移行す
る。S550では、編集された辞書情報が登録されるか
否かを判断する。登録されるならば(S550:Y)、
S560へ移行する。S560では、ユーザによって入
力された見出し語の品詞が助詞であるか否かを判断す
る。尚、S560の処理が、本発明の特定品詞判定手段
若しくは特定品詞判定プログラムとして機能している。
First, in S510, it is determined whether or not the user has input a headword to be edited and its part of speech. If it has been input (S510: Y), the process proceeds to S520. In S520, it is determined whether or not the input headword and part-of-speech pair is already registered in the user dictionary 14. If already registered (S520: Y), S54
Move to 0. In S540, the data in the user dictionary is re-edited, and the process proceeds to S550. If it has not been registered yet (S520: N), the process proceeds to S530. S53
In the case of 0, the dictionary information is newly edited and the process proceeds to S550. In S550, it is determined whether or not the edited dictionary information is registered. If registered (S550: Y),
The process moves to S560. In S560, it is determined whether or not the part of speech of the headword input by the user is a particle. Note that the processing of S560 functions as the specific part-of-speech determining means or the specific part-of-speech determining program of the present invention.

【0046】助詞であれば(S560:Y)、見出し語
分割処理S570へ移行する。見出し語分割処理S57
0では、入力された見出し語の前にダミーの名詞(仮の
名詞)を付けて、形態素解析処理S250を行い、S5
80へ移行する。これは、助詞により差はあるが、基本
的に助詞は名詞に続くので、それを想定して形態素解析
結果を得るためである。尚、S570の処理が、本発明
の見出し語分割手段若しくは見出し語分割プログラムと
して機能している。
If it is a particle (S560: Y), the flow shifts to headword division processing S570. Headword division processing S57
In the case of 0, a dummy noun (temporary noun) is added before the input headword, and morphological analysis processing S250 is performed.
Move to 80. This is because, although there is a difference depending on the particle, the particle basically follows the noun, and the morphological analysis result is obtained on the assumption of the particle. The processing of S570 functions as a headword division unit or a headword division program of the present invention.

【0047】S580では、見出し語分割処理S570
の結果検索された個々の分割された要素(以下、要素見
出し語と称する)を新たな見出し語とし、且つ、各要素
の直後は、それぞれ次の要素見出し語しか検索されない
ような接続情報とする。一番最後の要素見出し語の後方
接続は、その語が本来持っている接続情報とする。全て
の要素見出し語の辞書情報に分割フラグを立て、分割前
の原見出し語と品詞とを辞書情報として格納し、S59
0へ移行する。尚、S580の処理が、本発明の登録手
段若しくは登録プログラムとして機能しており、分割フ
ラグ及び原見出し語が、要素見出し語情報に相当してい
る。
In S580, a headword division process S570
Of each divided element (hereinafter, referred to as an element headword) retrieved as a result of the above, and connection information such that only the next element headword is searched immediately after each element. . The backward connection of the last element headword is the connection information that the word originally has. A division flag is set for the dictionary information of all the element headwords, and the original headword and the part of speech before the division are stored as dictionary information.
Move to 0. Note that the processing in S580 functions as the registration unit or the registration program of the present invention, and the division flag and the original headword correspond to the element headword information.

【0048】ここで、図3は、助詞「に係わる」をユー
ザ辞書に登録した場合の個々の要素に分割された見出し
語の例を示している。
Here, FIG. 3 shows an example of a headword divided into individual elements when the particle “related” is registered in the user dictionary.

【0049】また、入力された見出し語の品詞が助詞で
ない時(S560:N)、S590へ移行する。
When the part of speech of the input headword is not a particle (S560: N), the flow shifts to S590.

【0050】S590では、編集された情報をユーザ辞
書14へ格納し、S510へ移行して次の見出し語の編
集に備える。
In step S590, the edited information is stored in the user dictionary 14, and the flow advances to step S510 to prepare for editing the next headword.

【0051】S550で登録されないならば(S55
0:N)、辞書情報を破棄し、S510へ移行する。
If it is not registered in S550 (S55
0: N), the dictionary information is discarded, and the routine goes to S510.

【0052】S510において、見出し語と品詞とが入
力されなかった時(S510:N)、この処理を終了す
る。
In S510, when the headword and the part of speech have not been input (S510: N), this processing ends.

【0053】次に、図4に示すフローチャート中のS1
60において実行され、入力文(日本語の原文)から出
力文(英語の訳文)に翻訳する翻訳処理について、図6
に示すフローチャートに従って説明する。
Next, S1 in the flowchart shown in FIG.
FIG. 6 shows a translation process executed in step S60 for translating an input sentence (Japanese original sentence) into an output sentence (English translated sentence).
This will be described according to the flowchart shown in FIG.

【0054】まず、S250では、形態素解析処理内の
予め定められた判断規則と基本辞書12、ユーザ辞書1
4内の接続情報とを用いて、入力文を構成する単語につ
いて各辞書を検索し、見出し語が検索できたものに対し
て、訳語、品詞、といった検索情報を形態素解析結果に
付与する形態素解析処理を実行する。ここでは同じ文字
列に対してはユーザ辞書14が優先される。もし、専門
辞書を利用する場合は、ユーザ辞書の次に優先される。
ユーザ辞書14になかった時、基本辞書12が検索され
る。この時、ユーザ辞書の助詞は、その接続情報によ
り、各要素が連続して全て検索された時のみ検索され
る。このS250の処理が、本発明の形態素解析手段若
しくは形態素解析プログラムとして機能している。
First, in S250, predetermined judgment rules in the morphological analysis processing, the basic dictionary 12, and the user dictionary 1
Morphological analysis that searches each dictionary for words that make up the input sentence using the connection information in 4 and adds search information such as translations and parts of speech to the morphological analysis results for those for which a headword could be searched. Execute the process. Here, the user dictionary 14 has priority over the same character string. If a specialized dictionary is used, it is given priority next to the user dictionary.
When not found in the user dictionary 14, the basic dictionary 12 is searched. At this time, the particle in the user dictionary is searched only when all the elements are continuously searched according to the connection information. The process of S250 functions as a morphological analysis unit or a morphological analysis program of the present invention.

【0055】S260では、S250における形態素解
析処理の結果を受け取り、ROM20に格納されている
予め定められた解析文法を用いて、日本語の構造を解析
する解析処理を実行する。この時、S400の判定処理
に移行し、形態素解析結果に辞書編集処理S200の見
出し語分割手段により分割された見出しであることを示
す分割フラグが付与されている箇所を処理しながら日本
語の解析処理を実行する。尚、S260の処理が、本発
明の構文解析手段若しくは構文解析プログラムとして、
S400の処理が、要素見出し語判定手段若しくは要素
見出し語判定プログラムとしてそれぞれ機能している。
In S260, the result of the morphological analysis process in S250 is received, and an analysis process for analyzing a Japanese structure is executed using a predetermined analysis grammar stored in the ROM 20. At this time, the processing shifts to the determination processing of S400, and the Japanese morphological analysis is performed while processing the part where the division flag indicating the headline divided by the headword division means of the dictionary editing processing S200 is added to the morphological analysis result. Execute the process. Incidentally, the processing of S260 is performed as a syntax analysis means or a syntax analysis program of the present invention.
The process of S400 functions as an element headword determination unit or an element headword determination program.

【0056】続くS270では、ROM20に格納され
ている予め定められた変換文法を用いて、解析処理によ
り解析された日本語の構造を英語の構造に変換すると共
に、個々の単語を英語に置き換える変換処理を実行す
る。続くS280では、ROM20に格納されている予
め定められた生成文法を用いて、変換処理により変換さ
れた英語の構造から英語の語順を決定したり、英語に特
有の冠詞を生成したり、入力文に存在しなくても出力文
には必須の主語を補充したり、テンス、アスペクト、人
称及び数素性等を処理し、英語の単語列から成る出力文
を生成する生成処理を実行する。そして、S290で
は、ROM20に格納されている予め定められた形態素
生成規則を用いて、S280の生成処理により生成され
た英語の単語列に対して、名詞の複数形、動詞の過去、
過去分詞等の活用形を生成して、出力文を得る形態素生
成処理を実行して翻訳処理を終了する。
In the following S270, using a predetermined conversion grammar stored in the ROM 20, the Japanese structure analyzed by the analysis process is converted into the English structure, and the individual words are converted into English. Execute the process. At S280, using a predetermined generation grammar stored in the ROM 20, an English word order is determined from the English structure converted by the conversion processing, an article specific to English is generated, and an input sentence is determined. Even if it does not exist, an output sentence is supplemented with an indispensable subject, and a process of generating an output sentence composed of an English word string is performed by processing a tense, an aspect, a person, a numerical feature, and the like. Then, in S290, using a predetermined morpheme generation rule stored in the ROM 20, the plural forms of the noun, the past of the verb,
A morpheme generation process for generating an inflected form such as a past participle and obtaining an output sentence is executed, and the translation process ends.

【0057】次に、図6中のS400において実行され
る処理の詳細について、図7に示すフローチャートに従
って説明する。
Next, details of the processing executed in S400 in FIG. 6 will be described with reference to the flowchart shown in FIG.

【0058】まず、S410において、入力文中に分割
フラグが立っている見出し語、即ち、要素見出し語が存
在するか否かを検出する。存在していれば(S410:
Y)、S420へ移行する。S420では、要素見出し
語が連体修飾の助詞か否かを検出する。連体修飾の助詞
か否かの情報は、前記辞書情報46の中に格納されてい
る。連体修飾の助詞であれば(S420:Y)、S43
0へ移行する。S430では、検出された要素見出し語
に動詞を含み、かつ、最右に出現している要素見出し語
の右側が文末か、句点か、若しくは助動詞であるかの何
れかに該当するか否かを検出する。即ち、これらに該当
する場合は、前記各要素見出し語を助詞としてまとめる
よりも動詞とした方が適切である確率が高いからであ
る。尚、S420及びS430の処理が、本発明の品詞
判断手段若しくは品詞判断プログラムとして機能してい
る。そして、文末か、句点か、助動詞ではない場合は
(S430:N)、S440へ移行する。
First, in S410, it is detected whether or not there is a headword in which a division flag is set in the input sentence, that is, whether an element headword exists. If it exists (S410:
Y), and proceed to S420. In S420, it is detected whether or not the element headword is a particle of a continuous modification. Information on whether or not the particle is a noun modification is stored in the dictionary information 46. If the particle is a noun modification particle (S420: Y), S43
Move to 0. In S430, it is determined whether or not the detected element headword includes a verb, and whether the right side of the element headword appearing at the rightmost is the end of a sentence, a period, or an auxiliary verb. To detect. That is, in these cases, there is a high probability that it is more appropriate to use the element headwords as verbs than to combine them as particles. The processing of S420 and S430 functions as the part of speech judgment means or the part of speech judgment program of the present invention. If it is not a sentence end, a period, or an auxiliary verb (S430: N), the process proceeds to S440.

【0059】また、S420で要素見出し語が連体修飾
をしている助詞ではない場合、前後判断処理S450へ
移行する。S450では、検出された要素見出し語が連
用修飾の助詞か否かを検出する。連用修飾の助詞か否か
の情報は、辞書情報46の中に格納されている。連用修
飾の助詞であれば(S450:Y)、S460へ移行す
る。S460では、検出された要素見出し語に動詞を含
み、かつ、最右に出現している要素見出し語の右側が助
動詞か、若しくは動詞「下さる」であるかの何れかに該
当するか否かを検出する。即ち、これらに該当する場合
は、前記各要素見出し語を助詞としてまとめるよりも動
詞とした方が適切である確率が高いからである。この右
側が助動詞か、若しくは「下さる」であるかの何れにも
該当しない場合(S460:N)、見出し語復活処理S
440へ移行する。
If it is determined in S420 that the element headword is not a particle that has a continuous modification, the process proceeds to before-and-after judgment processing S450. In S450, it is detected whether or not the detected element headword is a particle for continuous modification. Information as to whether or not the particle is a continuous modification particle is stored in the dictionary information 46. If it is a consecutively modified particle (S450: Y), the process proceeds to S460. In S460, it is determined whether or not the detected element headword includes a verb, and whether the right side of the element headword appearing at the rightmost is an auxiliary verb or a verb "Sarusaru" is applicable. To detect. That is, in these cases, there is a high probability that it is more appropriate to use the element headwords as verbs than to combine them as particles. If the right side does not correspond to either an auxiliary verb or “subject” (S460: N), the headword resurrection processing S
Move to 440.

【0060】見出し語復活処理S440では、前記複数
の要素見出し語を最左の要素のみを残して削除し、残っ
た見出し語を辞書情報に記憶された原見出し語に置換し
て、S480へ移行する。即ち、これ以降あたかも形態
素解析処理S250で助詞が引けたのと同様の処理を行
うことができるようにするためである。尚、S440の
処理が、本発明の置換手段若しくは置換プログラムとし
て機能している。
In headword resurrection processing S440, the plurality of element headwords are deleted leaving only the leftmost element, and the remaining headwords are replaced with original headwords stored in the dictionary information, and the process proceeds to S480. I do. That is, it is possible to perform the same processing as if the particle was closed in the morphological analysis processing S250 thereafter. Note that the process of S440 functions as a replacement unit or a replacement program of the present invention.

【0061】S430で文末か句点か助動詞であった場
合(S430:Y)と、S450で助動詞、若しくは
「下さる」であった場合(S460:Y)、S470へ
移行する。S470では、要素見出し語の情報を全て破
棄し、ユーザが登録した助詞の情報がなかった状態に戻
して、S480へ移行する。
If the sentence is a sentence end, a punctuation mark, or an auxiliary verb in S430 (S430: Y), and if it is an auxiliary verb or "subscribe" in S450 (S460: Y), the flow shifts to S470. In S470, all the information on the element headwords is discarded, and the state is returned to a state in which there is no information on the particle registered by the user, and the process proceeds to S480.

【0062】また、S450で連用修飾の助詞でなかっ
た場合(S450:N)、S480へ移行する。
If it is not a combined particle in S450 (S450: N), the flow shifts to S480.

【0063】S480では、分割フラグをNILにし
て、S410へ戻る。
In S480, the division flag is set to NIL, and the flow returns to S410.

【0064】S410で、分割フラグの立っている箇所
が検出されなかった場合(S410:N)、S400の
処理を終了し、翻訳処理S260を続行する。
In S410, if no part where the division flag is set is detected (S410: N), the processing of S400 is ended and the translation processing S260 is continued.

【0065】ここで、S400においてなされる処理に
ついて、例文を挙げて説明する。
Here, the processing performed in S400 will be described with reference to example sentences.

【0066】例えば、入力文が「彼女に係わる問題」で
ある場合は以下のように処理される。
For example, if the input sentence is "a problem relating to her", the following processing is performed.

【0067】ユーザ辞書14に何も登録されていない場
合、まず、ユーザにより入力部2から翻訳処理S160
が実行される。翻訳処理S160内の形態素解析処理S
250において得られる形態素解析結果は、「彼女(名
詞)/に(助詞)/係わる(動詞)/問題(名詞)」で
ある。これについて、解析処理S260以下が実行され
る。この時の翻訳処理S160が出力する文章は、”T
he problemwhich involves
her”である。これは通常の埋め込み文(動詞が名詞
を修飾している文章)である。これを、助詞「に係わる
=on」で登録しようとする。
If nothing is registered in the user dictionary 14, first, the translation processing S160 is performed by the user through the input unit 2.
Is executed. Morphological analysis processing S in translation processing S160
The morphological analysis result obtained in 250 is “She (noun) / ni (particle) / related (verb) / problem (noun)”. For this, analysis processing S260 and subsequent steps are executed. The text output by the translation process S160 at this time is “T
he problemwitch involves
her ". This is a normal embedded sentence (a sentence in which a verb modifies a noun). An attempt is made to register this by using the particle" = on ".

【0068】辞書編集処理S200のS510におい
て、見出し語「に係わる」と品詞「助詞」とが入力され
る。これは未登録なのでS530の新規作成に移行し、
「連体修飾」などの他の辞書情報が付与される。品詞が
助詞であるので(S560:Y)、前方に仮の名詞をつ
けて形態素解析を行い「に(助詞)/係わる(動詞)」
を得る。そして、分割した要素「に」,「係わる」を新
たな見出し語としてユーザ辞書14へ登録すると共に、
原見出し語「に係わる」の情報と分割フラグとを辞書情
報として付加する。図3は、このようにして、「に」及
び「係わる」が登録された状態を表している。
In S510 of the dictionary editing process S200, a headword "related to" and a part of speech "particle" are input. Since this has not been registered, the process moves to new creation in S530,
Other dictionary information such as “adjunct modification” is added. Since the part-of-speech is a particle (S560: Y), a tentative noun is added to the front and a morphological analysis is performed, and "ni (particle) / related (verb)" is performed.
Get. Then, the divided elements “ni” and “related” are registered in the user dictionary 14 as new headwords,
The information of the original headword "related to" and the division flag are added as dictionary information. FIG. 3 shows a state where “ni” and “related” are registered in this way.

【0069】ユーザにより、再度、入力部2から翻訳処
理S160が実行される。
The translation process S160 is executed again from the input unit 2 by the user.

【0070】この時、形態素解析処理S250において
得られる形態素解析結果は、「彼女(名詞)/に(助
詞)/係わる(動詞)/問題(名詞)」であり、前回と
同一である。しかし、「に」と「係わる」の情報には
「に係わる」でまとまって助詞になる情報が付与されて
いる。解析処理S260の処理S410において、
「に」に分割フラグが立っていることが判定され(S4
10:Y)、次に、連体修飾である助詞であると判定さ
れる(S420:Y)。次の、S430の処理で、最右
の要素見出し語「係わる」の右側が文末でも句点でも助
動詞でもないので(S430:N)、見出し語復活処理
S440で、「に係わる(助詞)」に置き換えられ、
「に」と「係わる」は破棄される。この後、解析処理S
260は続行され、最終的に出力文”The prob
lem on her”が生成される。このように、ユ
ーザ辞書を登録する前よりもだいぶ英語らしいすっきり
した英文を得ることができる。
At this time, the result of the morphological analysis obtained in the morphological analysis processing S250 is “She (noun) / (native particle) / related (verb) / problem (noun)”, which is the same as the previous time. However, the information on “ni” and “related” is given information that collectively becomes a particle by “related”. In processing S410 of analysis processing S260,
It is determined that the division flag is set to “ni” (S4).
10: Y) Then, it is determined that the particle is a particle which is a continuous modification (S420: Y). In the next processing of S430, since the right side of the rightmost element headword "relevant" is not the end of a sentence, a punctuation mark, or an auxiliary verb (S430: N), it is replaced with "relevant (particle)" in the headword resurrection processing S440. And
"Ni" and "Related" are discarded. After this, the analysis processing S
260 is continued and finally the output sentence "The probe
"lem on her" is generated. In this way, it is possible to obtain a much clearer English-like sentence than before registering the user dictionary.

【0071】次に、入力文が「彼女はこの問題に係わる
だろう。」であった場合の処理を示す。
Next, the processing when the input sentence is "She will be involved in this problem."

【0072】この時、形態素解析処理S250において
得られる形態素解析結果は、「彼女(名詞)/は(助
詞)/この(連体詞)/問題(名詞)/に(助詞)/係
わる(動詞)/だ(助動詞)」である。S400におけ
るS410〜S430までの処理は、前記例と同じであ
る。S430で、最右の要素見出し語「係わる」の右側
が助動詞「だ」であるため(S430:Y)、見出し語
復活処理S440ではなくS470へ移行し、「に係わ
る」の助詞の情報が破棄される。この後解析処理S26
0は続行され、最終的に正しい出力文”She wil
l invlove the problem.”が生
成される。
At this time, the result of the morphological analysis obtained in the morphological analysis processing S250 is “She (noun) / wa (particle) / this (adnominal) / problem (noun) / (particle) / related (verb) / (Auxiliary verb) ". The processing from S410 to S430 in S400 is the same as in the above example. In S430, since the right side of the rightmost element headword "relevant" is the auxiliary verb "da" (S430: Y), the processing shifts to S470 instead of the headword resurrection processing S440, and the information of the particle of "relevant" is discarded. Is done. Thereafter, analysis processing S26
0 is continued and finally the correct output statement "She wil
l inlove the problem. Is generated.

【0073】尚、本発明は以上詳述した実施の形態に限
定されるものではなく、その要旨を逸脱しない範囲にお
いて、種々の変更を加えることができる。
The present invention is not limited to the embodiment described in detail above, and various changes can be made without departing from the gist of the present invention.

【0074】例えば、前記実施の形態においては、助詞
を登録する場合の実施の形態について説明したが、助動
詞など他の機能語を登録できるように拡張することも可
能である。
For example, in the above-described embodiment, the embodiment in which particles are registered has been described. However, the present invention can be extended so that other functional words such as auxiliary verbs can be registered.

【0075】また、助詞の前後の状況を厳しくしたり、
緩くしたりすることでさらに柔軟に対応することができ
る。また、ユーザにその設定を解放することで、更に使
いやすいユーザ辞書環境を持った機械翻訳装置を提供す
ることが可能であり、より精度の高い翻訳結果を得るこ
とができる。
Also, the situation before and after the particle is strict,
By making it looser, it is possible to respond more flexibly. Further, by releasing the setting to the user, it is possible to provide a machine translation device having a user dictionary environment that is easier to use, and a translation result with higher accuracy can be obtained.

【0076】また、前記実施の形態では、入力された原
文を形態素解析した結果をそのまま使用して、要素見出
し語が存在するか否かを判断するように構成したが、形
態素解析結果に対して構文解析を行うことにより得られ
る構文解析木を使用して判断を行うように構成してもよ
い。
Further, in the above-described embodiment, the result of morphological analysis of the input original text is used as it is to determine whether or not an element headword exists. The determination may be made using a parse tree obtained by performing the parse.

【0077】また、前記実施の形態では日本語を第一言
語とし、英語を第二言語とした場合を示したが、他の言
語に適用することも可能であることはいうまでもない。
In the above embodiment, the case where Japanese is used as the first language and English is used as the second language has been described, but it goes without saying that the present invention can be applied to other languages.

【0078】更に、前記実施の形態では、辞書編集プロ
グラムと、形態素解析プログラムと、構文解析プログラ
ムと、特定品詞判定プログラムと、見出し語分割プログ
ラムと、登録プログラムと、要素見出し語判定プログラ
ムと、品詞判断プログラムと、置換プログラムとがRO
Mに予め格納されたものであるが、本発明は必ずしもこ
れに限定されるものではない。例えば、これらのプログ
ラムをフロッピーディスクやCD−ROMなどに格納し
たものを読み取り装置により読み取って動作させること
もできる。また、有線もしくは無線回線を使用して外部
情報処理装置からプログラムを読み込んで動作させるこ
ともできる。この場合、前記フロッピーディスクやCD
−ROMや、外部情報処理装置の当該プログラムを格納
したメモリが本発明の記録媒体を構成することとなる。
Further, in the above embodiment, a dictionary editing program, a morphological analysis program, a syntax analysis program, a specific part of speech determination program, a headword division program, a registration program, an element headword determination program, a part of speech The judgment program and the replacement program are RO
Although stored in advance in M, the present invention is not necessarily limited to this. For example, a program in which these programs are stored in a floppy disk, CD-ROM, or the like can be read and operated by a reading device. In addition, a program can be read from an external information processing device using a wired or wireless line and operated. In this case, the floppy disk or CD
-The ROM or the memory of the external information processing device storing the program constitutes the recording medium of the present invention.

【0079】[0079]

【発明の効果】以上説明したことから明らかなように、
本発明の請求項1に記載の機械翻訳装置は、前記辞書編
集手段が、前記辞書へ登録しようとする見出し語が特定
の品詞であるか否かを判定する特定品詞判定手段と、そ
の特定品詞判定手段が前記特定の品詞であると判断した
場合に、前記形態素解析手段により前記見出し語の形態
素解析を行って複数の要素に分割する見出し語分割手段
と、その見出し語分割手段により分割された複数の要素
の各々を見出し語として前記辞書に登録するとともに、
前記見出し語分割手段により分割する前の原見出し語の
要素であることを示す要素見出し語情報を前記各要素の
辞書登録情報として付加する登録手段とを備えているの
で、従来の機械翻訳装置ではユーザによる辞書登録が禁
止されていた機能語等の特定の品詞についても、ユーザ
が辞書登録をすることができ、その結果として、最終的
に精度の高い自然な翻訳結果を得ることができ、翻訳後
の後編集の手間を軽減することができる。
As is apparent from the above description,
The machine translation device according to claim 1 of the present invention, wherein the dictionary editing means determines whether a headword to be registered in the dictionary is a specific part of speech, and a specific part of speech part. When the determination unit determines that the word is the specific part of speech, the morphological analysis unit performs a morphological analysis of the headword and divides the headword into a plurality of elements. While registering each of the plurality of elements as a headword in the dictionary,
A registration unit that adds element headword information indicating that it is an element of the original headword before being divided by the headword division unit as dictionary registration information of each element. The user can also register a specific part of speech, such as a functional word, for which registration of the dictionary was prohibited by the user, and as a result, a natural translation result with high accuracy can be finally obtained. It is possible to reduce the work of later post-editing.

【0080】また、請求項2に記載の機械翻訳装置は、
前記特定品詞判定手段が、前記登録しようとする見出し
語が助詞であるか否かを判定するように構成され、前記
見出し語分割手段は、前記登録しようとする見出し語の
直前に仮の名詞を接続して形態素解析を行うように構成
されているので、助詞を正確に形態素分析し、各要素を
見出し語として登録することができ、翻訳処理において
副作用が生じることがない。
Further, the machine translation device according to claim 2 is
The specific part-of-speech determining means is configured to determine whether the headword to be registered is a particle, and the headword dividing means converts a temporary noun immediately before the headword to be registered. Since the morphological analysis is performed by connecting the particles, the particles can be accurately morphologically analyzed, and each element can be registered as a headword, so that there is no side effect in the translation process.

【0081】また、請求項3に記載の機械翻訳装置は、
前記構文解析手段は、入力された原文の前記形態素解析
手段による形態素解析結果内に、前記要素見出し語情報
を有する見出し語が存在するか否かを判定する要素見出
し語判定手段と、その要素見出し語判定手段により前記
見出し語が存在すると判定された場合に、前記要素見出
し語情報を有する複数の見出し語が前記原文中において
前記特定の品詞として使われているか否かを判断する品
詞判断手段と、その品詞判断手段により前記特定の品詞
として使われていると判断された場合に、前記要素見出
し語情報を有する複数の見出し語を前記原見出し語に置
換する置換手段とを備えているので、機能語が使われて
いる状況を正確に判断して、必要な場合にのみユーザに
より辞書登録された機能語に置換することができ、その
結果として、最終的に精度の高い自然な翻訳結果を得る
ことができ、翻訳後の後編集の手間を軽減することがで
きる。
The machine translation device according to claim 3 is
The syntax analysis means includes: an element headword determination means for determining whether a headword having the element headword information is present in a morphological analysis result of the input original text by the morphological analysis means; A part-of-speech determining means for determining whether a plurality of headwords having the element headword information are used as the specific part-of-speech in the original text when the headword is determined to be present by the word determining means; When the part-of-speech determining unit determines that the part-of-speech is used as the specific part-of-speech, the replacing unit replaces a plurality of headwords having the element headword information with the original headword. It is possible to accurately determine the situation in which the function word is used, and replace the function word with the function word registered in the dictionary only when necessary. High accuracy it is possible to obtain a natural translation results, it is possible to reduce the time and effort of editing after the post-translational.

【0082】また、請求項4に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
によれば、前記辞書へ登録しようとする見出し語が特定
の品詞であるか否かを判定する特定品詞判定プログラム
と、その特定品詞判定プログラムが前記特定の品詞であ
ると判断した場合に、前記形態素解析プログラムにより
前記見出し語の形態素解析を行って複数の要素に分割す
る見出し語分割プログラムと、その見出し語分割プログ
ラムにより分割された複数の要素の各々を見出し語とし
て前記辞書に登録するとともに、前記見出し語分割プロ
グラムにより分割する前の原見出し語の要素であること
を示す要素見出し語情報を前記各要素の辞書登録情報と
して付加する登録プログラムとを備えた辞書編集プログ
ラムを、フロッピーディスクやCD−ROM等の様々な
媒体の中から機械翻訳装置に適した記録媒体に格納する
ことができる。そして、この記録媒体を用いてプログラ
ムを実行することにより、従来の機械翻訳装置ではユー
ザによる辞書登録が禁止されていた機能語等の特定の品
詞についても、ユーザが辞書登録をすることができ、そ
の結果として、最終的に精度の高い自然な翻訳結果を得
ることができ、翻訳後の後編集の手間を軽減することが
できる。
According to a computer-readable recording medium on which a machine translation processing program according to claim 4 is recorded, a specific word for determining whether or not a headword to be registered in the dictionary is a specific part of speech is determined. A part-of-speech determination program, and a headword division program that, when the specific part-of-speech determination program determines that the specific part of speech is determined, performs a morphological analysis of the headword by the morphological analysis program to divide the headword into a plurality of elements; Each of the plurality of elements divided by the headword division program is registered as the headword in the dictionary, and the element headword information indicating that the element is the element of the original headword before being divided by the headword division program. A dictionary editing program with a registration program to add as dictionary registration information for each element It can be stored from various media such as disk or CD-ROM to a recording medium suitable for machine translation apparatus. Then, by executing the program using this recording medium, the user can register a dictionary even for a specific part of speech such as a functional word, which is prohibited from being registered by the user in the conventional machine translator, As a result, a natural translation result with high accuracy can be finally obtained, and the post-translation post-editing effort can be reduced.

【0083】また、請求項5に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
によれば、前記登録しようとする見出し語が助詞である
か否かを判定するようにされた特定品詞判定プログラム
と、前記登録しようとする見出し語の直前に仮の名詞を
接続して形態素解析を行うようにされた見出し語分割プ
ログラムとを、フロッピーディスクやCD−ROM等の
様々な媒体の中から機械翻訳装置に適した記録媒体に格
納することができる。
According to a computer-readable recording medium on which the machine translation processing program according to claim 5 is recorded, it is possible to specify whether or not the headword to be registered is a particle. A part-of-speech determination program and a headword division program adapted to perform a morphological analysis by connecting a temporary noun immediately before the headword to be registered in various media such as a floppy disk and a CD-ROM. Thus, it can be stored in a recording medium suitable for a machine translation device.

【0084】そして、この記録媒体を用いてプログラム
を実行することにより、助詞を正確に形態素分析し、各
要素を見出し語として登録することができ、翻訳処理に
おいて副作用が生じることがない。
By executing a program using this recording medium, the particles can be accurately morphologically analyzed, and each element can be registered as a headword, so that there is no side effect in the translation process.

【0085】また、請求項6に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
によれば、入力された原文の前記形態素解析プログラム
による形態素解析結果内に、前記要素見出し語情報を有
する見出し語が存在するか否かを判定する要素見出し語
判定プログラムと、その要素見出し語判定プログラムに
より前記見出し語が存在すると判定された場合に、前記
要素見出し語情報を有する複数の見出し語が前記原文中
において前記特定の品詞として使われているか否かを判
断する品詞判断プログラムと、その品詞判断プログラム
により前記特定の品詞として使われていると判断された
場合に、前記要素見出し語情報を有する複数の見出し語
を前記原見出し語に置換する置換プログラムとを備えた
構文解析プログラムをフロッピーディスクやCD−RO
M等の様々な媒体の中から機械翻訳装置に適した記録媒
体に格納することができる。そして、この記録媒体を用
いてプログラムを実行することにより、機能語が使われ
ている状況を正確に判断して、必要な場合にのみユーザ
により辞書登録された機能語に置換することができ、そ
の結果として、最終的に精度の高い自然な翻訳結果を得
ることができ、翻訳後の後編集の手間を軽減することが
できる。
According to a computer-readable recording medium on which the machine translation processing program according to claim 6 is recorded, the element headword information is stored in the morphological analysis result of the input original sentence by the morphological analysis program. An element headword determination program for determining whether or not a headword having the same is present, and a plurality of headwords having the element headword information when the headword is determined to be present by the element headword determination program. A part-of-speech determination program that determines whether or not the part-of-speech is used as the specific part-of-speech in the original text, and when it is determined that the part-of-speech is used as the specific part of speech, the element headword information is And a replacement program for replacing a plurality of headwords having the same with the original headword. A floppy disk or CD-RO
It can be stored in a recording medium suitable for a machine translation device from various media such as M. Then, by executing the program using this recording medium, it is possible to accurately determine the situation where the function word is used, and to replace the function word with the function word registered in the dictionary only when necessary, As a result, a natural translation result with high accuracy can be finally obtained, and the post-translation post-editing effort can be reduced.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態の機械翻訳装置の全体構成
を示すブロック図である。
FIG. 1 is a block diagram illustrating an overall configuration of a machine translation device according to an embodiment of the present invention.

【図2】基本辞書のデータ構成を説明する説明図であ
る。
FIG. 2 is an explanatory diagram illustrating a data configuration of a basic dictionary.

【図3】ユーザ辞書のデータ構成を説明する説明図であ
る。
FIG. 3 is an explanatory diagram illustrating a data configuration of a user dictionary.

【図4】機械翻訳装置の全体の動作を表わすフローチャ
ートである。
FIG. 4 is a flowchart illustrating an entire operation of the machine translation apparatus.

【図5】辞書編集処理の流れを表わすフローチャートで
ある。
FIG. 5 is a flowchart illustrating a flow of a dictionary editing process.

【図6】翻訳処理の流れを表わすフローチャートであ
る。
FIG. 6 is a flowchart illustrating a flow of a translation process.

【図7】要素見出し語判定処理の流れを表わすフローチ
ャートである。
FIG. 7 is a flowchart illustrating a flow of an element headword determination process.

【符号の説明】[Explanation of symbols]

4 外部記憶装置 10 制御部 18 CPU 20 ROM 22 RAM 40 見出し語 42 品詞 44 訳語 46 辞書情報 4 External storage device 10 Control unit 18 CPU 20 ROM 22 RAM 40 Headword 42 Part of speech 44 Translated word 46 Dictionary information

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 第一言語の見出し語と、品詞と、前記各
見出し語に対応する第二言語の訳語と、形態素解析処理
に必要な接続情報等の翻訳処理に用いられる各種の辞書
登録情報とを格納する辞書と、その辞書に対して前記第
一言語の見出し語等の情報を追加、修正、削除等する辞
書編集手段と、入力された前記第一言語の原文について
前記辞書に登録された見出し語を検索することにより形
態素解析を行う形態素解析手段と、その形態素解析手段
による形態素解析結果に対して構文解析を行う構文解析
手段とを備え、前記第一言語の原文を前記第二言語に翻
訳するようにした機械翻訳装置において、 前記辞書編集手段は、 前記辞書へ登録しようとする見出し語が特定の品詞であ
るか否かを判定する特定品詞判定手段と、 その特定品詞判定手段が前記特定の品詞であると判断し
た場合に、前記形態素解析手段により前記見出し語の形
態素解析を行って複数の要素に分割する見出し語分割手
段と、 その見出し語分割手段により分割された複数の要素の各
々を見出し語として前記辞書に登録するとともに、前記
見出し語分割手段により分割する前の原見出し語の要素
であることを示す要素見出し語情報を前記各要素の辞書
登録情報として付加する登録手段とを備えたことを特徴
とする機械翻訳装置。
1. An entry word in a first language, a part of speech, a translation word in a second language corresponding to each entry word, and various dictionary registration information used for translation processing such as connection information necessary for morphological analysis processing. And a dictionary editing means for adding, correcting, deleting, etc., information such as the headwords of the first language to the dictionary, and inputting the original text of the first language registered in the dictionary. Morphological analysis means for performing a morphological analysis by searching for a headword, and syntactic analysis means for performing a syntactic analysis on a morphological analysis result by the morphological analysis means, and converts the original text of the first language into the second language In the machine translation apparatus, the dictionary editing means includes: a specific part-of-speech determining means for determining whether a headword to be registered in the dictionary is a specific part-of-speech; Is determined to be the specific part of speech, when the morphological analysis unit performs morphological analysis of the headword and divides the headword into a plurality of elements, a plurality of headwords divided by the headword division unit Registering each of the elements as headwords in the dictionary and adding element headword information indicating that the element is an element of the original headword before being divided by the headword division means as dictionary registration information of each element Machine translation device comprising:
【請求項2】 前記特定品詞判定手段は、前記登録しよ
うとする見出し語が助詞であるか否かを判定するように
構成され、 前記見出し語分割手段は、前記登録しようとする見出し
語の直前に仮の名詞を接続して形態素解析を行うように
構成されたことを特徴とする請求項1に記載の機械翻訳
装置。
2. The specific part-of-speech determining means is configured to determine whether or not the headword to be registered is a particle, and the headword dividing means is provided immediately before the headword to be registered. 2. The machine translation apparatus according to claim 1, wherein a morphological analysis is performed by connecting a tentative noun to the first term.
【請求項3】 前記構文解析手段は、 入力された原文の前記形態素解析手段による形態素解析
結果内に、前記要素見出し語情報を有する見出し語が存
在するか否かを判定する要素見出し語判定手段と、 その要素見出し語判定手段により前記見出し語が存在す
ると判定された場合に、前記要素見出し語情報を有する
複数の見出し語が前記原文中において前記特定の品詞と
して使われているか否かを判断する品詞判断手段と、 その品詞判断手段により前記特定の品詞として使われて
いると判断された場合に、前記要素見出し語情報を有す
る複数の見出し語を前記原見出し語に置換する置換手段
とを備えたことを特徴とする請求項1若しくは2に記載
の機械翻訳装置。
3. The element headword determining means for determining whether or not a headword having the element headword information exists in a morphological analysis result of the input original text by the morphological analysis means. When the element headword determination means determines that the headword is present, it is determined whether or not a plurality of headwords having the element headword information are used as the specific part of speech in the original text. A part-of-speech determining means for performing, and a replacing means for replacing a plurality of headwords having the element headword information with the original headword when the part-of-speech determining means determines that the specific headword is used as the specific part of speech. The machine translation device according to claim 1, further comprising:
【請求項4】 第一言語の見出し語と、品詞と、前記各
見出し語に対応する第二言語の訳語と、形態素解析処理
に必要な接続情報等の翻訳処理に用いられる各種の辞書
登録情報とを格納する辞書に対して前記第一言語の見出
し語等の情報を追加、修正、削除等する辞書編集プログ
ラムと、入力された前記第一言語の原文について前記辞
書に登録された見出し語を検索することにより形態素解
析を行う形態素解析プログラムと、その形態素解析プロ
グラムによる形態素解析結果に対して構文解析を行う構
文解析プログラムとを備え、前記第一言語の原文を前記
第二言語に翻訳するようにした機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体におい
て、 前記辞書編集プログラムは、 前記辞書へ登録しようとする見出し語が特定の品詞であ
るか否かを判定する特定品詞判定プログラムと、 その特定品詞判定プログラムが前記特定の品詞であると
判断した場合に、前記形態素解析プログラムにより前記
見出し語の形態素解析を行って複数の要素に分割する見
出し語分割プログラムと、 その見出し語分割プログラムにより分割された複数の要
素の各々を見出し語として前記辞書に登録するととも
に、前記見出し語分割プログラムにより分割する前の原
見出し語の要素であることを示す要素見出し語情報を前
記各要素の辞書登録情報として付加する登録プログラム
とを備えたことを特徴とする機械翻訳処理プログラムを
記録したコンピュータ読み取り可能な記録媒体。
4. Various dictionary registration information used for translation processing such as a headword of the first language, a part of speech, a translated word of the second language corresponding to each headword, and connection information necessary for morphological analysis processing. A dictionary editing program for adding, modifying, deleting, etc., information such as the headwords of the first language to the dictionary storing, and a headword registered in the dictionary for the input original text of the first language. A morphological analysis program that performs a morphological analysis by searching, and a syntactic analysis program that performs a syntactic analysis on a morphological analysis result by the morphological analysis program, wherein the original text of the first language is translated into the second language. In a computer-readable recording medium recording a machine translation processing program according to the present invention, the dictionary editing program may be configured such that the headword to be registered in the dictionary is A specific part-of-speech determination program for determining whether or not the part-of-speech is a specific part-of-speech; and when the specific part-of-speech determination program determines that the part of speech is the specific part of speech, a plurality of morphological analyzes of the headword are performed by the morphological analysis program. A headword division program that divides each of the plurality of elements divided by the headword division program into the dictionary as a headword, and an original headword before being divided by the headword division program. A computer-readable recording medium storing a machine translation processing program, comprising: a registration program for adding element headword information indicating that the element is a dictionary registration information of each element.
【請求項5】 前記特定品詞判定プログラムは、前記登
録しようとする見出し語が助詞であるか否かを判定する
ようにされ、 前記見出し語分割プログラムは、前記登録しようとする
見出し語の直前に仮の名詞を接続して形態素解析を行う
ようにされたことを特徴とする請求項4に記載の機械翻
訳処理プログラムを記録したコンピュータ読み取り可能
な記録媒体。
5. The specific part-of-speech determination program is configured to determine whether the headword to be registered is a particle, and the headword division program immediately before the headword to be registered. 5. A computer-readable recording medium recording a machine translation processing program according to claim 4, wherein morphological analysis is performed by connecting temporary nouns.
【請求項6】 前記構文解析プログラムは、 入力された原文の前記形態素解析プログラムによる形態
素解析結果内に、前記要素見出し語情報を有する見出し
語が存在するか否かを判定する要素見出し語判定プログ
ラムと、 その要素見出し語判定プログラムにより前記見出し語が
存在すると判定された場合に、前記要素見出し語情報を
有する複数の見出し語が前記原文中において前記特定の
品詞として使われているか否かを判断する品詞判断プロ
グラムと、 その品詞判断プログラムにより前記特定の品詞として使
われていると判断された場合に、前記要素見出し語情報
を有する複数の見出し語を前記原見出し語に置換する置
換プログラムとを備えたことを特徴とする請求項4若し
くは5に記載の機械翻訳処理プログラムを記録したコン
ピュータ読み取り可能な記録媒体。
6. An element headword determination program for determining whether or not a headword having the element headword information exists in a morphological analysis result of the input original sentence by the morphological analysis program. When the element headword determination program determines that the headword exists, it is determined whether or not a plurality of headwords having the element headword information are used as the specific part of speech in the original text. A part-of-speech determination program to perform, and a replacement program that replaces a plurality of headwords having the element headword information with the original headword when the part-of-speech determination program determines that the headword is used as the specific part of speech. 6. A computer recording the machine translation processing program according to claim 4 or claim 5. A readable recording medium.
JP15348497A 1997-06-11 1997-06-11 Machine translation device Expired - Fee Related JP3692711B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15348497A JP3692711B2 (en) 1997-06-11 1997-06-11 Machine translation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15348497A JP3692711B2 (en) 1997-06-11 1997-06-11 Machine translation device

Publications (2)

Publication Number Publication Date
JPH113336A true JPH113336A (en) 1999-01-06
JP3692711B2 JP3692711B2 (en) 2005-09-07

Family

ID=15563590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15348497A Expired - Fee Related JP3692711B2 (en) 1997-06-11 1997-06-11 Machine translation device

Country Status (1)

Country Link
JP (1) JP3692711B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008602A (en) * 2009-06-26 2011-01-13 Fuji Xerox Co Ltd Information processing apparatus and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008602A (en) * 2009-06-26 2011-01-13 Fuji Xerox Co Ltd Information processing apparatus and program

Also Published As

Publication number Publication date
JP3692711B2 (en) 2005-09-07

Similar Documents

Publication Publication Date Title
JP3692711B2 (en) Machine translation device
JPS62271057A (en) Dictionary register system for translation device
JP3999771B2 (en) Translation support program, translation support apparatus, and translation support method
JP2626722B2 (en) Japanese generator
JP3131432B2 (en) Machine translation method and machine translation device
JP3147947B2 (en) Machine translation equipment
JP2000029882A (en) Summary preparing device
JP3313810B2 (en) Aspect processing device
JPH10134055A (en) Sentence creation support device and medium storing sentence creation support program
JP2002183134A (en) Translating device
JP3233800B2 (en) Machine translation equipment
JPH11282845A (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JPH10320391A (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JPH11282846A (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JPH10171804A (en) Machine translation equipment
JPH10340264A (en) Machine translation device and computer-readable recording medium where machine translation processing program is recorded
JPH11328176A (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JPH05314172A (en) Machine translation device
JPH1173413A (en) Machine translation device and computer-readable recording medium recording machine translation processing program
JP2002041517A (en) Machine translation apparatus, machine translation method, and computer-readable storage medium storing machine translation program
JPH07141375A (en) Machine translation device
JPH1063660A (en) Machine translation equipment
JP2000137709A (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JPH10320395A (en) Machine translation device and computer-readable recording medium recording machine translation processing program
JP2001265766A (en) Machine translation method, machine translation device, and recording medium

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040428

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040625

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040625

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050222

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050222

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050613

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees