JPH07334506A - Machine translation device - Google Patents

Machine translation device

Info

Publication number
JPH07334506A
JPH07334506A JP6131739A JP13173994A JPH07334506A JP H07334506 A JPH07334506 A JP H07334506A JP 6131739 A JP6131739 A JP 6131739A JP 13173994 A JP13173994 A JP 13173994A JP H07334506 A JPH07334506 A JP H07334506A
Authority
JP
Japan
Prior art keywords
word
concept
language
output
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6131739A
Other languages
Japanese (ja)
Inventor
Takeshi Aizawa
武史 相澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIPPON DENKI FIELD SERVICE
NEC Fielding Ltd
Original Assignee
NIPPON DENKI FIELD SERVICE
NEC Fielding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIPPON DENKI FIELD SERVICE, NEC Fielding Ltd filed Critical NIPPON DENKI FIELD SERVICE
Priority to JP6131739A priority Critical patent/JPH07334506A/en
Publication of JPH07334506A publication Critical patent/JPH07334506A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To provide a machine translation device which can automatically select an appropriate synonym considering a content that the original is to express, at the time of selecting translated word of a word constituting the original. CONSTITUTION:A input word concept factor analysis means 21 retrieves an input language concept factor dictionary 42 with the word of the original received from an original analys means 20, and stores the result in an input word concept factor evaluation table 43. A synonym extraction means 25 retrieves a synonym classification disctionary 47 with the word received from a translated sentence generation means 26 and transfers the synonym concerned to an output word concept factor analysis means 24. The output word concept factor analysis means 24 retrieves an output language concept factor dictionary 46 by the received synonym and stores the result in an output word concept factor evaluation table 45. A concept factor evaluation means 22 evaluates the input word concept factor evaluation table 43 and the output word concept factor evaluation table 45 and a translated word substitution means 23 instructs the translated sentence generation means 26 to carry out the substitution of the translated word.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は機械翻訳装置に関し、特
に任意の言語の文章を他の言語に翻訳す機械翻訳装置の
訳文の編集処理方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation device, and more particularly to a translation editing system of a machine translation device for translating a sentence in an arbitrary language into another language.

【0002】[0002]

【従来の技術】従来の機械翻訳装置では、翻訳されるべ
き入力文に対して、ただ一つの翻訳文を出力するように
構成されているので、人間の手を介さずに入力文の内容
を適切に、かつ、目的言語として自然な表現の訳文を確
実に得ることは困難である。
2. Description of the Related Art A conventional machine translation device is configured to output only one translated sentence for an input sentence to be translated, so that the contents of the input sentence can be read without human intervention. It is difficult to obtain a translation of an appropriate and natural expression as a target language.

【0003】そのため、機械翻訳処理に先立って、入力
文を予め翻訳しやすいように修正したり、翻訳された出
力文を修正して理解しやすい文にするようなことが行な
われている。なお、前者の修正は前編集と呼ばれ、後者
の修正は後編集と呼ばれている。
Therefore, prior to the machine translation process, the input sentence is modified in advance so that it can be easily translated, or the translated output sentence is modified to make it easier to understand. The former correction is called pre-editing, and the latter correction is called post-editing.

【0004】これら前編集および後編集は、機械翻訳装
置の処理能力を越えた部分を補うものであるので、人間
が中心的に行なう。このような機械翻訳装置での翻訳処
理と人間が行なう前編集・後編集とを組み合せることに
より、高品質の訳文を得ることができる。
Since these pre-editing and post-editing are for supplementing a portion exceeding the processing capability of the machine translation apparatus, they are mainly performed by humans. A high-quality translated sentence can be obtained by combining the translation processing in such a machine translation device and the pre-editing / post-editing performed by a human.

【0005】ところで、多くの機械翻訳装置において
は、この装置上で人間が前編集や後編集を容易に実行で
きるような支援機能を有している。このような機械翻訳
装置が支援する後編集機能の一つに訳語の選択がある。
By the way, many machine translation apparatuses have a support function that allows a person to easily perform pre-editing and post-editing on this apparatus. One of the post-editing functions supported by such a machine translation device is selection of translated words.

【0006】これは翻訳処理の実行結果として出力され
た訳文を人間が確認して、訳文中の語句を他の適切な類
義語や同義語と置換するという編集操作を、機械翻訳装
置を使用して実施するものである。
[0006] This is done by using a machine translation device to perform an editing operation in which a human verifies the translated text output as the execution result of the translation process and replaces the phrase in the translated text with another appropriate synonym or synonym. It is to be implemented.

【0007】例えば、特開昭61−260362号公報
記載の翻訳装置によれば、今、/This rose
smells sweet./という英文を入力した場
合の訳文としては、 (a)「このバラは甘い臭いがする。」 (b)「このバラは甘い香りがする。」 などが考えられるが、″smell″の辞書に「臭いが
する」の方が先に入っていたとすると、機械翻訳装置は
(a)の訳文を出力する。このため、より適切と思われ
る(b)の訳文を得るには、「臭い」の部分を表示装置
(CRT)上で指示して、その訳語「臭い」に関連する
類義語の内容を表示し、さらに表示された類義語の中か
ら、例えば「香り」を指示することにより、「臭い」を
「香り」に置換するといった編集操作を行なっていた。
For example, according to the translation device disclosed in Japanese Patent Laid-Open No. 61-260362, / This rose
smells sweet. When the English sentence "/" is entered, (a) "This rose has a sweet smell." (B) "This rose has a sweet scent." If "smelling" comes first, the machine translation device outputs the translated sentence of (a). For this reason, in order to obtain a more appropriate translation of (b), the "smell" portion is indicated on the display device (CRT), and the content of synonyms related to that translation "smell" is displayed. Further, an editing operation such as replacing "smell" with "scent" is performed by instructing "scent" from the displayed synonyms.

【0008】[0008]

【発明が解決しようとする課題】しかし、どの類義語を
選択するべきかは、これに対応する入力文中の語が、と
のような概念を表すのに用いられているのか、また、そ
の語を含む文章がどのような文脈の中で使用されている
のか等、その語が使用されている種々の状況に依存する
ため、人間がこれらの点を総合的に判断した上で、機械
翻訳装置に適切な訳語との置換指示を与える必要があっ
た。
However, which synonym should be selected depends on whether the corresponding word in the input sentence is used to represent a concept such as and. It depends on various situations in which the word is used, such as in what context the sentence it contains is used. It was necessary to give a replacement instruction with an appropriate translation.

【0009】一方、このような判断を適切に行なうに
は、機械翻訳装置の操作者が入力文や出力文を形成して
いる言語体系に精通している必要がある上に、翻訳の対
象となる分野によっては、言葉の運用に関する文学的な
見識を要求される。
On the other hand, in order to appropriately make such a judgment, the operator of the machine translation device needs to be familiar with the language system forming the input sentence and the output sentence, and further Some fields require literary insight into the use of words.

【0010】以上のように、従来の機械翻訳装置が提供
する類義語の選択手段によって品質の高い訳文を得るに
は、人手の介入する余地が増し、最終的な訳文の品質が
操作者の翻訳技能に左右されやすいという問題点があっ
た。
As described above, in order to obtain a high-quality translated sentence by means of selecting a synonym provided by the conventional machine translation device, there is more room for human intervention, and the final translated text quality depends on the translation skill of the operator. There was a problem that it was easily affected by.

【0011】本発明の目的は、訳文の初期生成段階から
自然な表現が得られ訳文品質を大幅に向上できる機械翻
訳装置を提供することにある。
An object of the present invention is to provide a machine translation device which can obtain a natural expression from the initial stage of generation of a translated sentence and can greatly improve the translated sentence quality.

【0012】[0012]

【課題を解決するための手段】第1の発明の機械翻訳装
置は、翻訳対象である原文を入力する入力手段と翻訳処
理に使用する知識情報を記憶した翻訳辞書と前記翻訳辞
書の内容を用いて前記原文を中間言語に変換する原文解
析手段と前記原文解析手段の結果得られた中間言語を記
憶する中間言語記憶手段と前記翻訳辞書の内容を用いて
前記中間言語記憶手段に記憶されている前記中間言語を
訳文に変換する訳文生成手段と前記訳文生成手段の結果
得られた訳文を出力する出力手段とを備えた機械翻訳装
置において、入力言語の単語から想起され得る1つ以上
の概念を入力言語概念因子情報として予め記憶した入力
言語概念因子記憶手段と、前記原文を構成する単語に対
応する情報が前記入力言語概念因子記憶手段に記憶され
ているかどうかを調べ記憶されている場合には対応する
単語の情報を読み出す入力語概念因子解析手段と、前記
入力語概念因子解析手段によって読み出された入力言語
概念因子情報を記憶する入力語概念因子評価記憶手段
と、出力言語の単語から想起され得る1つ以上の概念を
出力言語概念因子情報として予め記憶した出力言語概念
因子記憶手段と、前記出力言語の単語の類義語関係を予
め記憶した類義語記憶手段と、前記訳文生成手段で得ら
れた前記訳文を構成している訳語に対してその類義語が
前記類義語記憶手段に記憶されているかどうかを調べ記
憶されている場合には対応する類義語の情報を読み出す
類義語抽出手段と、前記類義語抽出手段によって読み出
された類義語に対応する情報が前記出力言語概念因子記
憶手段に記憶されているかどうかを調べ記憶されている
場合には対応する単語の情報を読み出す出力語概念因子
解析手段と、前記出力語概念因子解析手段によって読み
出された出力言語概念因子情報を記憶する出力語概念因
子評価記憶手段と、前記入力語概念因子評価記憶手段に
記憶されている入力言語概念因子情報を読み出しこれに
対応する類義語についての出力言語概念因子情報が前記
出力語概念因子評価記憶手段に記憶されているかどうか
を調べ記憶されている場合には対応する類義語の出力言
語概念因子情報を読み出して前記入力言語概念因子情報
との類似性を比較し最も類似性の高い類義語を選択する
概念因子評価手段と、前記概念因子評価手段により選択
された類義語と訳文中の訳語とを置換する訳語置換手段
とを備えて構成されている。
A machine translation apparatus of the first invention uses an input means for inputting an original sentence to be translated, a translation dictionary storing knowledge information used for translation processing, and contents of the translation dictionary. Is stored in the intermediate language storage means using the contents of the translation dictionary and the intermediate language storage means for storing the intermediate language obtained as a result of the original text analysis means. In a machine translation device including a translated sentence generation unit that converts the intermediate language into a translated sentence and an output unit that outputs a translated sentence obtained as a result of the translated sentence generation unit, one or more concepts that can be recalled from words in an input language are defined. Input language concept factor storage means prestored as input language concept factor information and whether or not information corresponding to the words forming the original sentence is stored in the input language concept factor storage means Input word concept factor analysis means for reading the information of the corresponding word when stored in memory, and input word concept factor evaluation storage means for storing the input language concept factor information read by the input word concept factor analysis means. An output language concept factor storage means for storing in advance one or more concepts that can be recalled from the words of the output language as output language concept factor information, and a synonym storage means for storing a synonym relation of the output language words in advance. The synonym extraction which reads out the information of the corresponding synonym when the synonym is stored in the synonym storage means by checking whether or not the synonym of the translation obtained by the translation generation means is stored in the synonym storage means Means and whether or not information corresponding to the synonyms read by the synonym extraction means is stored in the output language concept factor storage means. Output word concept factor analysis means for reading the information of the corresponding word if stored, and output word concept factor evaluation storage means for storing the output language concept factor information read by the output word concept factor analysis means. , Reading out the input language concept factor information stored in the input word concept factor evaluation storage means, and checking whether the output language concept factor information about the corresponding synonym is stored in the output word concept factor evaluation storage means If stored, the concept factor evaluation means for reading out the output language concept factor information of the corresponding synonym, comparing the similarity with the input language concept factor information, and selecting the most similar synonym, and the concept. The translation word replacement means replaces the synonym selected by the factor evaluation means with the translation word in the translation.

【0013】第2の発明の機械翻訳装置は、第1の発明
において、入力言語概念因子記憶手段が入力言語の単語
から想起され得る概念を、対立概念を持つ1つ以上の修
飾語対に関する相対的な偏りの割合として数値化した情
報を記憶していることを特徴としている。
In the machine translation apparatus of the second invention, in the first invention, the concept that the input language concept factor storage means can recall from the word of the input language is relative to one or more modifier pairs having an opposite concept. It is characterized in that it stores information quantified as the ratio of the physical bias.

【0014】第3の発明の機械翻訳装置は、第1の発明
において、出力言語概念因子記憶手段が出力言語の単語
から想起され得る概念を、対立概念を持つ1つ以上の修
飾語対に関する相対的な偏りの割合として数値化した情
報を記憶していることを特徴としている。
The machine translation apparatus of the third invention is the machine translation apparatus of the first invention, wherein the output language concept factor storage means associates a concept that can be recalled from a word of the output language with respect to one or more modifier pairs having an opposite concept. It is characterized in that it stores information quantified as the ratio of the physical bias.

【0015】[0015]

【実施例】次に、本発明の実施例について図面を参照し
て説明する。
Embodiments of the present invention will now be described with reference to the drawings.

【0016】図1は本発明の機械翻訳装置の一実施例を
示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a machine translation apparatus of the present invention.

【0017】本実施例の機械翻訳装置は、図1に示すよ
うに、翻訳対象となる入力文や装置の動作環境を設定す
るための制御情報等を入力するキーボート等の入力装置
1と、入力文を解析して中間言語を生成する原文解析手
段20と、生成された中間言語を記憶する中間言語構造
フアイル44と、原文解析手段20が使用する知識情報
を予め登録してある入力言語構文変換規則40ならびに
入力言語単語変換辞書41と、入力言語の体系の中で許
容される単語・熟語のそれぞれについてその語から想起
され得る概念を数値情報として予め登録してある入力言
語概念因子辞書42と、これを利用して入力文を構成し
ている各単語に概念情報を付与する入力語概念因子解析
手段21と、その結果を格納する入力語概念因子評価テ
ーブル43と、中間言語構造フアイル44に格納されて
いる中間言語から目的言語の訳文を生成する訳文生成手
段26と、訳文生成手段26が使用する知識情報を予め
登録してある出力言語構文変換規則48ならびに出力言
語単語変換辞書49と、出力言語の体系の中で許容され
る単語・熟語についてこれらの類義語関係を予め登録し
た類義語分類辞書47と、これを参照して訳文生成手段
26が中間言語に対する訳語として採用した単語・熟語
のそれぞれについてその類義語を抽出する類義語抽出手
段25と、出力言語の体系の中で許容される単語・熟語
のそれぞれについてその語から想起され得る概念を数値
情報として予め登録してある出力言語概念因子辞書46
と、これを利用して類義語抽出手段25によって抽出さ
れた個々の類義語に概念情報を付与する出力語概念因子
解析手段24と、その結果を格納する出力語概念因子評
価テーブル45と、この出力語概念因子評価テーブル4
5の内容を入力装置1から予め与えられている制御情報
に基ずいて入力語概念因子評価テーブル43の内容とを
比較し類義語の中から最適と判断された語を選択する概
念因子評価手段22と、この概念因子評価手段22によ
って選択された単語を用いて訳文生成手段26が初期選
択した訳語を置換する訳語置換手段23と、最終的に得
られた訳文を出力するデイスプレイ装置等の出力装置3
とから構成されている。
As shown in FIG. 1, the machine translation apparatus according to the present embodiment includes an input device 1 such as a keyboard for inputting an input sentence to be translated and control information for setting an operating environment of the device, and an input. Source language analysis means 20 for analyzing a sentence to generate an intermediate language, intermediate language structure file 44 for storing the generated intermediate language, and input language syntax conversion in which knowledge information used by the source text analysis means 20 is registered in advance. A rule 40 and an input language word conversion dictionary 41, and an input language concept factor dictionary 42 in which a concept that can be recalled from each word or idiom allowed in the system of the input language is registered in advance as numerical information. , An input word concept factor analysis means 21 for applying concept information to each word constituting an input sentence using this, and an input word concept factor evaluation table 43 for storing the result, A translation generation unit 26 for generating a translation of a target language from an intermediate language stored in the language structure file 44, an output language syntax conversion rule 48 and an output language word in which knowledge information used by the translation generation unit 26 is registered in advance. The conversion dictionary 49, the synonym classification dictionary 47 in which the synonym relationships of words and phrases allowed in the output language system are registered in advance, and by referring to this, the translation generation unit 26 adopts them as translations for intermediate languages. A synonym extraction means 25 for extracting a synonym for each word / idiom, and an output in which a concept conceivable from the word / idiom that is allowed in the system of the output language is registered in advance as numerical information Language concept factor dictionary 46
And an output word concept factor analysis means 24 for assigning concept information to each synonym extracted by the synonym extraction means 25 using this, an output word concept factor evaluation table 45 for storing the result, and this output word Conceptual factor evaluation table 4
The concept factor evaluating means 22 for comparing the contents of No. 5 with the contents of the input word concept factor evaluation table 43 based on the control information given in advance from the input device 1 and selecting the word judged to be optimum from the synonyms 22 And a word replacement unit 23 that replaces the translated word initially selected by the translated sentence generation unit 26 using the word selected by the concept factor evaluation unit 22, and an output device such as a display device that outputs the finally obtained translated sentence. Three
It consists of and.

【0018】なお、上述の各規則、辞書、テーブルおよ
びフアイルは情報を記憶する記憶装置4で構成され、上
述の各手段はプログラム制御で動作するデータ処理装置
2で構成される。
The above-mentioned rules, dictionaries, tables and files are constituted by a storage device 4 for storing information, and the above-mentioned means are constituted by a data processing device 2 which operates under program control.

【0019】図5は、入力言語概念因子辞書42の一例
の記憶内容図である。但し、本例は入力言語が英語の場
合を想定しており、説明を行なう上で必要な構成要素の
みを記載してある。
FIG. 5 is a memory content diagram of an example of the input language concept factor dictionary 42. However, this example assumes that the input language is English, and only the components necessary for the explanation are described.

【0020】図5を参照すると、入力言語概念因子辞書
42は、入力言語の言語体系の中で許容される個々の単
語を、中間言語で表現した概念記号5aと、これに対応
する実際の単語5bと、この単語から想起され得る概念
を、数値要素の行列として定義した概念因子値5cとか
ら構成される。
Referring to FIG. 5, the input language concept factor dictionary 42 is a conceptual symbol 5a in which individual words allowed in the language system of the input language are expressed in an intermediate language, and actual words corresponding thereto. 5b and a concept factor value 5c that defines a concept that can be recalled from this word as a matrix of numerical elements.

【0021】ここで、図4を参照して、概念因子値5c
の定義方法、すなわち、単語5bから想起され得る概念
を評価し、その結果を概念因子値5cとして定義する方
法について説明する。
Here, referring to FIG. 4, the concept factor value 5c
Will be described, that is, a method of evaluating a concept that can be recalled from the word 5b and defining the result as a concept factor value 5c.

【0022】図4は日本語の「スパイ」という語を、
「男性的か、女性的か」という対立概念を有する1組の
修飾語対を用いて段階評価する手法を示す一例であり、
それぞれの段階には、1から7までの数値を概念因子値
として割り当ててある。
FIG. 4 shows the Japanese word "spy"
1 is an example showing a method for graded evaluation using a pair of modifiers having a confrontation concept of "masculine or feminine";
A numerical value from 1 to 7 is assigned to each stage as a concept factor value.

【0023】この概念因子値は、「とちらでもない」を
表す数値の4を中間点として1に近いほど「男性的」で
あり、7に近いほど「女性的」な何かしらの概念が、こ
の「スパイ」という語に含まれていることを示すもので
ある。ここでは、概念因子値を2として定義してあるの
で、「スパイ」という語から想起される概念の1つとし
て、「かなり男性的」という評価がされていることを示
している。
This concept factor value is "masculine" as it is closer to 1 with a numerical value of 4 representing "to chira chi nara" as an intermediate point and "feminine" as it is closer to 7. It is meant to be included in the word "spy". Here, since the concept factor value is defined as 2, it is shown that "quite masculine" is evaluated as one of the concepts recalled from the word "spy".

【0024】入力言語概念因子辞書42は、このような
評価手法に基ずき、対立概念を有する修飾語対を複数個
用意し、それぞれの修飾語対について概念因子値の評価
を行なって得られた概念因子値を要素とする行列を、評
価対象の単語に対して定義したものである。
The input language concept factor dictionary 42 is obtained by preparing a plurality of modifier pairs having an opposite concept based on such an evaluation method and evaluating the concept factor value for each modifier pair. A matrix whose elements are the conceptual factor values is defined for the word to be evaluated.

【0025】図6は、出力言語概念因子辞書46の一例
の記憶内容図である。但し、本実施例は出力言語が日本
語の場合を想定しており、説明を行なう上で必要な構成
要素のみを記載してある。
FIG. 6 is a storage content diagram of an example of the output language concept factor dictionary 46. However, this embodiment assumes that the output language is Japanese, and only the components necessary for the explanation are described.

【0026】図6を参照すると、出力言語概念因子辞書
42は、出力言語の言語体系の中で許容される個々の単
語を、中間言語で表現した概念記号6aと、これに対応
する実際の単語6bと、この単語から想起され得る概念
を、数値要素の行列として定義した概念因子値6cとか
ら構成される。
Referring to FIG. 6, the output language concept factor dictionary 42 represents the concept symbols 6a in which individual words allowed in the language system of the output language are expressed in an intermediate language, and the corresponding actual words. 6b and a concept factor value 6c that defines a concept that can be recalled from this word as a matrix of numerical elements.

【0027】出力言語の概念因子値6cの定義方法、す
なわち、出力言語の単語6bから想起され得る概念を評
価し、その結果を概念因子値6cとして定義する方法に
ついては、先に図4を参照して説明したものと同一であ
るため、ここでは説明を省略する。
Regarding the method of defining the concept factor value 6c of the output language, that is, the method of evaluating the concept that can be recalled from the word 6b of the output language and defining the result as the concept factor value 6c, refer to FIG. Since it is the same as that described above, the description is omitted here.

【0028】次に、類義語分類辞書47の一例について
図面を参照して説明する。
Next, an example of the synonym classification dictionary 47 will be described with reference to the drawings.

【0029】図7は、類義語分類辞書47の一例の記憶
内容図である。
FIG. 7 is a storage content diagram of an example of the synonym classification dictionary 47.

【0030】概念記号7aは、出力言語の体系の中で許
容されている単語について予め定義されている概念記号
を、テーブルを参照するための見出しにしたものであ
る。また、類義語群7bは、概念記号7aで表現される
単語の意味を上位概念にもつような類義語を、概念記号
を用いて定義したものである。本例では、日本語の「ス
パイ」という単語の概念記号は「SPY」であり、「ブ
タ野郎」という単語の概念記号は「PIG」であって、
どちらの単語も概念記号の「SPY」に対する訳語とし
て利用可能であることを示している。
The conceptual symbol 7a is a conceptual symbol that is defined in advance for a word permitted in the system of the output language and is used as a heading for referring to the table. Further, the synonym group 7b is a synonym having a meaning of a word expressed by the concept symbol 7a as a superordinate concept defined by using the concept symbol. In this example, the concept symbol of the Japanese word "spy" is "SPY", and the concept symbol of the word "piggy" is "PIG",
Both words are shown to be usable as translations of the conceptual symbol "SPY".

【0031】次に、本実施例の動作について図面を参照
して説明する。
Next, the operation of this embodiment will be described with reference to the drawings.

【0032】図9〜図12は、本実施例の処理過程その
1からその4に分けて示すフローチャートである。
9 to 12 are flow charts showing the process steps 1 to 4 of the present embodiment separately.

【0033】入力装置1から翻訳対象となる原文が入力
されると、原文解析手段20では原文解析を行なう(図
9ステップS40)。
When an original sentence to be translated is input from the input device 1, the original sentence analysis means 20 analyzes the original sentence (step S40 in FIG. 9).

【0034】原文解析手段20は、図2に示すように、
形態素解析部20aと、構文解析部20bと、意味解析
部20cとから構成されている。
The source text analysis means 20, as shown in FIG.
It is composed of a morpheme analysis unit 20a, a syntax analysis unit 20b, and a semantic analysis unit 20c.

【0035】形態素解析部20aは、入力文を単語に分
解し、それぞれの単語の品詞等の文法属性を認識する。
この際、入力言語構文変換規則40と入力言語単語変換
辞書41とを利用する。
The morphological analysis unit 20a decomposes the input sentence into words and recognizes grammatical attributes such as the part of speech of each word.
At this time, the input language syntax conversion rule 40 and the input language word conversion dictionary 41 are used.

【0036】構文解析部20bは、形態素解析部20a
によって得られた品詞情報などをもとに、単語と単語の
係り受け関係等を認識する。この際入力言語構文変換規
則40に格納されている入力言語に関する文法規則等を
利用する。
The syntax analysis unit 20b is a morphological analysis unit 20a.
Based on the part-of-speech information and the like obtained by, the relationship between words and the dependency of words is recognized. At this time, the grammar rules and the like regarding the input language stored in the input language syntax conversion rule 40 are used.

【0037】意味解析部20cは、入力言語構文変換規
則40と入力言語単語変換辞書41を利用して、単語と
単語の意味関係を調べ、入力文の意味表現を認識する。
ここでは、1つの単語に複数個の意味を持つような多義
語についても、その意味を限定する。このようにして解
析された結果は、機械翻訳装置が対象とする各言語に依
存しない概念記号(一般に中間言語と呼ぶ)として、中
間言語構造フアイル44に記憶される。
The semantic analysis unit 20c uses the input language syntax conversion rules 40 and the input language word conversion dictionary 41 to check the semantic relationship between words and recognizes the semantic expression of the input sentence.
Here, the meaning of a polysemous word in which one word has a plurality of meanings is also limited. The result analyzed in this way is stored in the intermediate language structure file 44 as a concept symbol (generally called an intermediate language) that does not depend on each language targeted by the machine translation device.

【0038】なお、入力文から中間言語を生成する原文
解析手段50や、これによって参照される入力言語構文
変換規則40および入力言語単語変換辞書41について
は、いぜれも既知なる手法、例えば、特開平4−321
178号公報記載の各解析部および単語辞書などを用い
ることがでるので、説明を省略する。
The source sentence analysis means 50 for generating an intermediate language from an input sentence, and the input language syntax conversion rules 40 and the input language word conversion dictionary 41 referred to by the source language analysis means 50 are all known methods, for example, JP-A-4-321
Since each analysis unit and word dictionary described in Japanese Patent No. 178 can be used, description thereof will be omitted.

【0039】原文の解析が終了すると、訳文生成手段2
6によって目的言語の訳文生成が行なわれる(図9ステ
ップS50)。
When the analysis of the original sentence is completed, the translated sentence generating means 2
A translation of the target language is generated by 6 (step S50 in FIG. 9).

【0040】訳文生成手段26は図3に示すように、意
味生成部26aと、構文生成部26bと、形態素生成部
26cとから構成されている。
As shown in FIG. 3, the translated sentence generation means 26 is composed of a meaning generation unit 26a, a syntax generation unit 26b, and a morpheme generation unit 26c.

【0041】意味生成部26aは、中間言語構造フアイ
ル44に記憶されている原文解析手段20の解析結果を
順次入力し、類義語抽出手段25に出力する。この後
に、類義語抽出手段25に出力した中間言語に対して、
訳語置換手段23から当該中間言語の置換情報が出力さ
れるので、これを訳文として出力する対象となる目的言
語の語や句等に置き換える。この際、中間言語の概念記
号と目的言語を構成する各単語との対応関係をとる出力
言語単語変換辞書49を利用する。
The meaning generator 26a sequentially inputs the analysis results of the source sentence analysis means 20 stored in the intermediate language structure file 44 and outputs them to the synonym extraction means 25. After this, for the intermediate language output to the synonym extraction means 25,
Since the replacement information of the intermediate language is output from the translation replacement unit 23, the replacement information is replaced with a word or phrase of the target language to be output as a translation. At this time, the output language word conversion dictionary 49 is used which has a correspondence relationship between the conceptual symbols of the intermediate language and the respective words constituting the target language.

【0042】構文生成部26bは、出力言語単語変換辞
書49を利用しながら、単語と単語のかかり受け関係を
認識し、語順も決定する。この際、目的言語に関する出
力言語構文変換規則48なども利用する。
The syntax generation unit 26b recognizes the word-to-word relationship and determines the word order while using the output language word conversion dictionary 49. At this time, the output language syntax conversion rule 48 for the target language is also used.

【0043】形態素生成部26cは、出力言語単語変換
辞書49を利用しながら、各単語の語尾変化等の活用処
理を行ない、目的とする訳文を生成する。
The morpheme generation unit 26c uses the output language word conversion dictionary 49 to perform a utilization process such as a change in the ending of each word to generate a target translation.

【0044】なお、中間言語構造フアイル44に記憶さ
れている中間言語から訳文を生成する訳文生成手段26
や、これによって参照される出力言語構文変換規則48
および出力言語単語変換辞書49については、いずれも
既知なる手法、例えば特開平4−321178号公報記
載の各生成部および対訳辞書などを用いることができる
ので、説明を省略する。
The translated sentence generation means 26 for generating translated sentences from the intermediate language stored in the intermediate language structure file 44.
Or the output language syntax conversion rule 48 referenced by this
As for the output language word conversion dictionary 49, a known method, for example, each generation unit described in Japanese Patent Laid-Open No. 4-321178 and a bilingual dictionary can be used, and therefore description thereof will be omitted.

【0045】入力語概念因子解析手段21は、原文解析
手段20から原文を構成する単語を入力し(図9ステッ
プS1)、この単語と同じ単語が入力言語概念因子辞書
42に記憶されているかどうかを調べる(ステップS
2)。
The input word concept factor analysis means 21 inputs the words constituting the original sentence from the original sentence analysis means 20 (step S1 in FIG. 9), and determines whether the same word as this word is stored in the input language concept factor dictionary 42. (Step S
2).

【0046】同じ単語が入力言語概念因子辞書42に記
憶されていた場合、入力語概念因子解析手段21は、該
当する入力言語概念因子辞書42の内容を読み出して、
入力語概念因子評価テーブル43に出力する(ステップ
S3)。
When the same word is stored in the input language concept factor dictionary 42, the input word concept factor analysis means 21 reads the contents of the corresponding input language concept factor dictionary 42,
It is output to the input word concept factor evaluation table 43 (step S3).

【0047】一方、同じ単語が入力言語概念因子辞書4
2に記憶されていなかった場合、入力語概念因子解析手
段21は何ら処理を実行しない。入力語概念因子解析手
段21は、ステップS1〜S3の処理を、原文の終わり
を検出するまで繰り返す(ステップS4およびS5)。
On the other hand, the same word is the input language concept factor dictionary 4
If not stored in 2, the input word concept factor analysis means 21 does not execute any processing. The input word concept factor analysis means 21 repeats the processes of steps S1 to S3 until the end of the original sentence is detected (steps S4 and S5).

【0048】類義語抽出手段25は、訳文生成手段26
から訳文を構成する訳語の概念記号(訳語候補)を入力
し(図10ステップS6)、この訳語の概念記号と同じ
概念記号を持つレコードが類義語分類辞書47に記憶さ
れているかどうか調べて、同じ概念記号が類義語分類辞
書47に記憶されていた場合、類義語抽出手段25は類
義語分類辞書47の該当する情報を読み出し、出力語概
念因子解析手段24に出力する(ステップS7)。
The synonym extraction means 25 is a translation generation means 26.
The concept symbol (translated word candidate) of the translated word that constitutes the translated sentence is input from (step S6 in FIG. 10), and it is checked whether or not a record having the same conceptual symbol as the conceptual symbol of this translated word is stored in the synonym classification dictionary 47, and the same. When the concept symbol is stored in the synonym classification dictionary 47, the synonym extraction means 25 reads the corresponding information from the synonym classification dictionary 47 and outputs it to the output word concept factor analysis means 24 (step S7).

【0049】一方、訳語の概念記号と同じものが類義語
分類辞書47に記憶されていなかった場合、類義語抽出
手段25は何ら処理を実行しない。
On the other hand, if the same symbol as the translated word is not stored in the synonym classification dictionary 47, the synonym extraction means 25 does not perform any processing.

【0050】出力語概念因子解析手段24は、類義語抽
出手段25から訳文を構成している訳語の類義語に関す
る情報を入力し、この類義語の中に分類されている個々
の概念記号と同じ概念記号を持つものが出力言語概念因
子辞書46に記憶されているかどうかを調べる(ステッ
プS8)。
The output word concept factor analysis means 24 inputs the information about the synonyms of the translated words constituting the translated sentence from the synonym extraction means 25, and outputs the same concept symbols as the individual concept symbols classified in the synonyms. It is checked whether or not the possession is stored in the output language concept factor dictionary 46 (step S8).

【0051】訳語の類義語と同じ概念記号が出力言語概
念因子辞書46に記憶されていた場合、出力語概念因子
解析手段24は、該当する出力言語概念因子辞書46の
内容を読み出して、出力語概念因子評価テーブル45に
出力する(ステップS9)。
When the same concept symbol as the synonym of the translated word is stored in the output language concept factor dictionary 46, the output word concept factor analysis means 24 reads the contents of the corresponding output language concept factor dictionary 46 and outputs the output word concept. The data is output to the factor evaluation table 45 (step S9).

【0052】一方、訳語の類義語と同じ概念記号が出力
言語概念因子辞書46に記憶されていなかった場合、出
力語概念因子解析手段24は、何ら処理を実行しない。
On the other hand, when the same concept symbol as the synonym of the translated word is not stored in the output language concept factor dictionary 46, the output word concept factor analysis means 24 does not execute any processing.

【0053】出力語概念因子解析手段24は、ステップ
S8〜S9の処理を、類義語抽出手段25から入力され
た、特定の訳語の中に分類されているすべての類義語に
ついて実行する。また、ステップS7〜S9の処理は、
訳文の終わりを検出するまで繰り返す(ステップS10
およびステップS11)。
The output word concept factor analysis means 24 executes the processing of steps S8 to S9 for all the synonyms which are input from the synonym extraction means 25 and which are classified into the specific translated words. In addition, the processing of steps S7 to S9
Repeat until the end of the translated sentence is detected (step S10).
And step S11).

【0054】概念因子評価手段22は、入力語概念因子
評価テーブル43に記憶されている情報を順に読み出し
(図11ステップS12)、この情報が、原文を構成し
ている一文の終わりを通知するものであるか否かを判定
する(ステップS13)。
The concept factor evaluation means 22 sequentially reads the information stored in the input word concept factor evaluation table 43 (step S12 in FIG. 11), and this information notifies the end of one sentence forming the original sentence. It is determined whether or not (step S13).

【0055】この判定の結果が、一文の終わりを通知す
るものでない場合は、その概念因子値を概念因子ごとに
加算し(ステップS14)、一文の終わりを通知するも
のである場合は、その一文を構成している単語の概念因
子値の平均を算出して、その結果を入力語概念因子評価
テーブル43に記憶する(ステップS15)。
If the result of this judgment does not notify the end of one sentence, the concept factor value is added for each concept factor (step S14), and if the end of one sentence is notified, that sentence is terminated. The average of the concept factor values of the words constituting the is calculated, and the result is stored in the input word concept factor evaluation table 43 (step S15).

【0056】次に、概念因子評価手段22は、ステップ
S12で読み出した情報が、原文を構成している一文の
終わりであると同時に、原文を構成している一段落の終
わりであるか否かを判定する(ステップS16)。
Next, the concept factor evaluation means 22 determines whether the information read out in step S12 is the end of one sentence forming the original sentence and at the same time the end of one paragraph forming the original sentence. The determination is made (step S16).

【0057】この判定の結果が、一段落の終わりを通知
するものである場合は、その一段落を構成している単語
の概念因子値の平均を算出し、その結果を入力語概念因
子評価テーブル43に記憶し(ステップS17)、一段
落の終わりを通知するものでない場合、概念因子評価手
段22は何ら処理を実行しない。
If the result of this determination is the notification of the end of a paragraph, the average of the concept factor values of the words forming the paragraph is calculated, and the result is stored in the input word concept factor evaluation table 43. If not stored (step S17) and notifying the end of one paragraph, the concept factor evaluation means 22 does not execute any processing.

【0058】概念因子評価手段22はステップS12〜
S18の処理を、入力語概念因子評価テーブルの終わり
を検出するまで繰り返す(ステップS18)。
The concept factor evaluation means 22 starts from step S12.
The process of S18 is repeated until the end of the input word concept factor evaluation table is detected (step S18).

【0059】次に、概念因子評価手段22は、入力語概
念因子評価テーブル43に記憶されている情報を順に読
み出して(図12ステップS19)、その中に記述され
れいる個々の単語と対応付けされている類義語の情報
を、出力語概念因子評価テーブル45から読み出す(ス
テップS20)。
Next, the concept factor evaluation means 22 sequentially reads out the information stored in the input word concept factor evaluation table 43 (step S19 in FIG. 12), and associates it with the individual words described therein. Information on the synonyms that have been read is read from the output word concept factor evaluation table 45 (step S20).

【0060】ここで、ステップS19で読み出された単
語に定義されている入力語の概念因子値と、ステップS
20で読み出された単語に定義されている出力語の概念
因子値との類似性を計算し、これを単語概念類似率とす
る(ステップS21およびS22)。
Here, the concept factor value of the input word defined in the word read out in step S19 and the step S
The similarity with the concept factor value of the output word defined in the word read in 20 is calculated, and this is set as the word concept similarity rate (steps S21 and S22).

【0061】次に、ステップS19で読み出された単語
に定義されている概念因子値の平均値が、ステップS1
5で求められているので、この値とステップS20で読
み出された単語に定義されている出力語の概念因子値と
の類似性を計算し、これを文概念類似率とする(ステッ
プS23およびS24)。
Next, the average value of the concept factor values defined for the word read in step S19 is calculated in step S1.
5, the similarity between this value and the concept factor value of the output word defined in the word read in step S20 is calculated, and this is set as the sentence concept similarity rate (step S23 and S24).

【0062】また、ステップS19で読み出された単語
を含んでいる入力語の一段落について、その段落を構成
している個々の単語に定義されている概念因子値の平均
値が、ステップS17で求められているので、この値と
ステップS20で読み出された単語に定義されている出
力語の概念因子値との類似性を計算して、これを段落概
念類似率とする(ステップS25およびS26)。
Further, with respect to one paragraph of the input word containing the word read in step S19, the average value of the concept factor values defined in the individual words forming the paragraph is calculated in step S17. Therefore, the similarity between this value and the concept factor value of the output word defined in the word read in step S20 is calculated, and this is set as the paragraph concept similarity rate (steps S25 and S26). .

【0063】ここで、単語概念類似率と、文概念類似率
と、段落概念類似率の3つの和を求め、これをステップ
S20で選択された類義語の総合概念類似率とする(ス
テップS27)。
Here, three sums of the word concept similarity rate, the sentence concept similarity rate, and the paragraph concept similarity rate are obtained and used as the total concept similarity rate of the synonyms selected in step S20 (step S27).

【0064】概念因子評価手段22は、ステップS19
で読み出した単語との対応付けがされている、出力語概
念因子評価テーブル45内の個々の類義語について、ス
テップS20〜S27の処理を行ない(ステップS2
8)、総合概念類似率の値を最大にするような類義語
を、訳語置換手段23に出力する(ステップS29)。
The concept factor evaluating means 22 carries out step S19.
The steps S20 to S27 are performed for each synonym in the output word concept factor evaluation table 45 that is associated with the word read in step S2 (step S2).
8) A synonym that maximizes the value of the overall concept similarity rate is output to the translation word replacement unit 23 (step S29).

【0065】概念因子評価手段22は、ステップS19
〜S29の処理を、入力語概念因子評価テーブル43の
終わりを検出するまで繰り返す(ステップS30)。
The concept factor evaluating means 22 carries out step S19.
The process from S29 to S29 is repeated until the end of the input word concept factor evaluation table 43 is detected (step S30).

【0066】ここでステップS12〜S30の過程で行
なわれる数値計算の詳細について、図面を参照して説明
する。
Details of the numerical calculation performed in steps S12 to S30 will be described with reference to the drawings.

【0067】図8は、入力語概念因子評価テーブル43
の数理モデルである。
FIG. 8 shows the input word concept factor evaluation table 43.
Is a mathematical model of.

【0068】入力原文を構成している任意の段落をPr
(r=1,2,3,…)とするとPr は、この段落を構
成している文Si (i=1,2,…,d)の有限集合G
であり、この元Si を重複することなく並べたものであ
る。
Let P r be an arbitrary paragraph that constitutes the input source text.
(R = 1, 2, 3, ...) Let P r be a finite set G of sentences S i (i = 1, 2, ..., d) that compose this paragraph.
And the elements S i are arranged without duplication.

【0069】今、任意の段落Pr を構成する文の個数を
d個とし、段落Pr に含まれる文の個数を求めるための
関数をFL (Pr )として次式(1) および(2) を定義す
る。
[0069] Now, the number of statements that make up any paragraph P r and d pieces, the following equation function for obtaining the number of statements contained in paragraph P r as F L (P r) (1) and ( 2) is defined.

【0070】[0070]

【0071】 [0071]

【0072】 [0072]

【0073】文Si は、これを構成している単語の有限
集合Hの元Wijを重複することなく並べたものである。
また、Si を構成する単語の個数をmとし、文Si に含
まれる単語の個数を求める関数をFW (Si )として次
式(3) および(4) を定義する。
The sentence S i is an arrangement of the elements W ij of the finite set H of the constituent words without duplication.
Further, let m be the number of words that compose S i , and let F W (S i ) be a function that finds the number of words included in the sentence S i , and define the following equations (3) and (4).

【0074】 [0074]

【0075】 [0075]

【0076】文Si を構成している単語Wijが、n個の
概念評価項目CK (K =1,2,…,n)に対しそれぞ
れ概念因子値aijk を持つとき、これを個々の単語を要
素とするx行の行列を入力語概念因子評価テーブルに設
定する。但し、xは段落Prを構成している総単語数
で、次式によって定義される。
When the word W ij forming the sentence S i has the concept factor value a ijk for each of the n concept evaluation items C K (K = 1, 2, ..., N), the word W ij is individually defined. An x-row matrix having the word of as an element is set in the input word concept factor evaluation table. However, x is the total number of words forming the paragraph P r and is defined by the following equation.

【0077】 [0077]

【0078】上記の式(1) 〜(5) により、入力語概念因
子評価テーブル43の内容を定めることができる。ここ
で、単語Wijの概念因子値の要素aijk を次式によって
定義する。
The contents of the input word concept factor evaluation table 43 can be determined by the above equations (1) to (5). Here, the element a ijk of the concept factor value of the word W ij is defined by the following equation.

【0079】 [0079]

【0080】次に、単語Wijを含む文Si を構成してい
るすべての単語の要素aijk の列平均をSi バーとして
式(7) により計算する。
Next, the column average of the elements a ijk of all the words forming the sentence S i containing the word W ij is calculated by the formula (7) as S i bar.

【0081】 [0081]

【0082】ここにおいて、例へば、i.n とは第2番目
のサフイックス、この場合にはjについて平均をとった
ことを示す。
Here, for example, in indicates that the second suffix, j in this case, is averaged.

【0083】また、文Si を含む段落Pr を構成してい
るすべての単語の要素aijk の列平均をPr バーとして
式(8) により計算する。
Further, the column average of the elements a ijk of all the words forming the paragraph P r including the sentence S i is calculated by the formula (8) as the P r bar.

【0084】 [0084]

【0085】ここにおいて、例へば、..n とは第1およ
び第2番目のサフイックス、この場合にはiとjとにつ
いて平均をとったことを示す。
Here, for example, ..n means that the first and second suffixes, in this case, i and j are averaged.

【0086】入力語の単語Wijに対する訳語候補の1つ
をTijとし、このTijがn個の概念評価項目Ck に対し
それぞれ概念因子値bijk を持つときに、TijとWij
らびにSi バー、Pr バーについて、式(9) 〜(11)に定
義する関数値を計算する。
When one of the translation word candidates for the word W ij of the input word is T ij and this T ij has the concept factor value b ijk for each of the n concept evaluation items C k , T ij and W ij. Also, for S i bar and P r bar, the function values defined in the equations (9) to (11) are calculated.

【0087】 [0087]

【0088】 [0088]

【0089】 [0089]

【0090】ここで、式(9) 〜(11)で得られた値と、入
力装置1から予め与えられている3つの定数Vw
s ,Vp を用いて、総合概念類似率gt を次式により
計算する。
Here, the values obtained by the equations (9) to (11) and three constants V w given in advance from the input device 1,
Using V s and V p , the overall concept similarity g t is calculated by the following equation.

【0091】 [0091]

【0092】Vw 、Vs 、Vp はそれぞれ式(9) 、式(1
0)および式(11)で算出された値に対する重み付けをする
ための定数であり、それぞれ単語概念重み係数、文概念
重み係数および段落概念重み係数である。
V w , V s , and V p are respectively expressed by equation (9) and equation (1
0) and a constant for weighting the values calculated by Expression (11), which are a word concept weight coefficient, a sentence concept weight coefficient, and a paragraph concept weight coefficient, respectively.

【0093】機械翻訳装置の利用者は、キーボード等の
入力装置1から、これら3つの係数値を予め与える。こ
れによって、訳語の候補として複数の類義語が存在する
場合に、どれを採用すべきかという基準を変化させ、出
力される訳文の文体を規定することができる。
The user of the machine translation device gives these three coefficient values from the input device 1 such as a keyboard in advance. Thus, when there are a plurality of synonyms as translation word candidates, it is possible to change the criterion of which to adopt and specify the style of the translated text to be output.

【0094】例えば、Vs 、Vp に比べてVw の値を大
きくした場合には、原文側の対応する単語に対する訳語
として、最も一般的に用いられている第1義的なことば
を訳語として採用する傾向が強くなるため、直訳的とな
り、自然科学系の文章のように訳文の曖昧さを嫌う傾向
にあるような場合に有効である。
For example, when the value of V w is set to be larger than the values of V s and V p , the most commonly used first meaningful word is translated as the translated word for the corresponding word on the original sentence side. As it tends to be adopted as, it becomes a literal translation, and it is effective when there is a tendency to dislike the ambiguity of translated texts, such as natural science texts.

【0095】逆に、Vw に比べてVs およびVp の値を
大きくした場合には、それぞれ原文側の対応する単語を
含んでいる一文、あるいは段落に含まれる概念に類似す
る概念を持つことばを訳語として採用する傾向が強くな
るために意訳的となり、小説や随筆文など文学的な分野
の文章のように、単語の意味が言葉の使用状況に依存す
る割合の大きい場合に有効である。
On the contrary, when the values of V s and V p are made larger than that of V w , each of them has a sentence containing the corresponding word on the original sentence side or a concept similar to the concept contained in the paragraph. It becomes more free as the tendency to adopt words as translated words becomes stronger, and it is effective when the meaning of a word has a large proportion depending on the usage of the word, such as a sentence in a literary field such as a novel or essay. .

【0096】入力語の単語Wijに対するすべての訳語候
補(類義語)について、総合概念類似率gt を計算し、
この値を最大にするような単語を、入力語の単語Wij
訳語として確定する。
The overall concept similarity g t is calculated for all translation word candidates (synonyms) for the word W ij of the input word,
The word that maximizes this value is determined as the translation of the input word W ij .

【0097】[0097]

【発明の効果】以上説明したように、本発明の機械翻訳
装置は、入力語概念因子解析手段により、機械翻訳の対
象となる原文を構成する文や段落が、どのような概念を
表現しようとしているのかを数値情報に変換したもの
と、出力語概念因子解析手段により、複数ある訳語候補
のそれぞれが持っている概念を数値情報に変換したもの
とを、概念因子評価手段によって比較して、最も概念的
に近い訳語を自動的に選択するように構成したため、訳
文の初期生成段階で自然な表現が得られるという効果
と、従来の翻訳機械が主として対象としている自然科学
系の文書のように、翻訳すべき重要な情報が何かを明確
に判断できる分野だけでなく、小説や随筆文のように、
言葉の意味が言語使用の状況に依存する割合の大きい分
野での訳文品質を向上させられるという効果を有する。
As described above, in the machine translation apparatus of the present invention, the input word concept factor analysis means tries to express what concept the sentence or paragraph constituting the original sentence to be machine translated is intended to express. Whether or not it is converted to numerical information, and the output word concept factor analysis means compares the concepts of each of the multiple translation word candidates to numerical information by the concept factor evaluation means, and Since it is configured to automatically select a conceptually similar translated word, the effect that a natural expression can be obtained at the initial generation stage of the translated text, and as in the case of natural science documents mainly targeted by conventional translation machines, Not only in areas where you can clearly determine what important information to translate, but also in novels and essays,
This has the effect of improving the translation quality in a field in which the meaning of words is highly dependent on the language usage.

【0098】また、概念因子評価手段の評価基準を、入
力装置から与える制御情報によって調整可能にするとい
う構成にしたため、訳文の文体を予め規定できるという
効果を有する。
Further, since the evaluation criterion of the concept factor evaluating means is made adjustable by the control information given from the input device, the style of the translated sentence can be defined in advance.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の機械翻訳装置の一実施例を示すブロッ
ク図である。
FIG. 1 is a block diagram showing an embodiment of a machine translation device of the present invention.

【図2】図1における原文解析手段のブロック図であ
る。
FIG. 2 is a block diagram of an original sentence analysis unit in FIG.

【図3】図1における訳文生成手段のブロック図であ
る。
FIG. 3 is a block diagram of a translated sentence generation unit in FIG.

【図4】修飾語対による単語の概念評価例について説明
する評価図である。
FIG. 4 is an evaluation diagram illustrating an example of conceptual evaluation of a word by a modifier pair.

【図5】図1で用いる入力言語概念因子辞書の一例を示
す記憶内容図である。
5 is a storage content diagram showing an example of an input language concept factor dictionary used in FIG. 1. FIG.

【図6】図1で用いる出力言語概念因子辞書の一例を示
す記憶内容図である。
6 is a storage content diagram showing an example of an output language concept factor dictionary used in FIG. 1. FIG.

【図7】図1で用いる類義語分類辞書の一例を示す記憶
内容図である。
7 is a storage content diagram showing an example of a synonym classification dictionary used in FIG. 1. FIG.

【図8】図1で用いる入力言語概念因子評価テーブルの
一例を示す記憶内容図である。
8 is a storage content diagram showing an example of an input language concept factor evaluation table used in FIG. 1. FIG.

【図9】図1の動作を示すフローチャートその1であ
る。
9 is a first flowchart showing the operation of FIG. 1. FIG.

【図10】図1の動作を示すフローチャートその2であ
る。
10 is a second flowchart showing the operation of FIG. 1. FIG.

【図11】図1の動作を示すフローチャートその3であ
る。
11 is a third flowchart showing the operation of FIG. 1. FIG.

【図12】図1の動作を示すフローチャートその4であ
る。
12 is a fourth flowchart showing the operation of FIG. 1. FIG.

【符号の説明】[Explanation of symbols]

1 入力装置 2 データ処理装置 3 出力装置 4 記憶装置 20 原文解析手段 21 入力語概念因子解析手段 22 概念因子評価手段 23 訳語置換手段 24 出力語概念因子解析手段 25 類義語抽出手段 26 訳文生成手段 40 入力言語構文変換規則 41 入力言語単語変換辞書 42 入力言語概念因子辞書 43 入力語概念因子評価テーブル 44 中間言語構造フアイル 45 出力語概念因子評価テーブル 46 出力言語概念因子辞書 47 類義語分類辞書 48 出力言語構文変換規則 49 出力言語単語変換辞書 DESCRIPTION OF SYMBOLS 1 input device 2 data processing device 3 output device 4 storage device 20 original sentence analysis means 21 input word concept factor analysis means 22 concept factor evaluation means 23 translation word replacement means 24 output word concept factor analysis means 25 synonym extraction means 26 translation generation means 40 input Language syntax conversion rules 41 Input language word conversion dictionary 42 Input language concept factor dictionary 43 Input word concept factor evaluation table 44 Intermediate language structure file 45 Output word concept factor evaluation table 46 Output language concept factor dictionary 47 Synonym classification dictionary 48 Output language syntax conversion Rule 49 Output language word conversion dictionary

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 翻訳対象である原文を入力する入力手段
と翻訳処理に使用する知識情報を記憶した翻訳辞書と前
記翻訳辞書の内容を用いて前記原文を中間言語に変換す
る原文解析手段と前記原文解析手段の結果得られた中間
言語を記憶する中間言語記憶手段と前記翻訳辞書の内容
を用いて前記中間言語記憶手段に記憶されている前記中
間言語を訳文に変換する訳文生成手段と前記訳文生成手
段の結果得られた訳文を出力する出力手段とを備えた機
械翻訳装置において、入力言語の単語から想起され得る
1つ以上の概念を入力言語概念因子情報として予め記憶
した入力言語概念因子記憶手段と、前記原文を構成する
単語に対応する情報が前記入力言語概念因子記憶手段に
記憶されているかどうかを調べ記憶されている場合には
対応する単語の情報を読み出す入力語概念因子解析手段
と、前記入力語概念因子解析手段によって読み出された
入力言語概念因子情報を記憶する入力語概念因子評価記
憶手段と、出力言語の単語から想起され得る1つ以上の
概念を出力言語概念因子情報として予め記憶した出力言
語概念因子記憶手段と、前記出力言語の単語の類義語関
係を予め記憶した類義語記憶手段と、前記訳文生成手段
で得られた前記訳文を構成している訳語に対してその類
義語が前記類義語記憶手段に記憶されているかどうかを
調べ記憶されている場合には対応する類義語の情報を読
み出す類義語抽出手段と、前記類義語抽出手段によって
読み出された類義語に対応する情報が前記出力言語概念
因子記憶手段に記憶されているかどうかを調べ記憶され
ている場合には対応する単語の情報を読み出す出力語概
念因子解析手段と、前記出力語概念因子解析手段によっ
て読み出された出力言語概念因子情報を記憶する出力語
概念因子評価記憶手段と、前記入力語概念因子評価記憶
手段に記憶されている入力言語概念因子情報を読み出し
これに対応する類義語についての出力言語概念因子情報
が前記出力語概念因子評価記憶手段に記憶されているか
どうかを調べ記憶されている場合には対応する類義語の
出力言語概念因子情報を読み出して前記入力言語概念因
子情報との類似性を比較し最も類似性の高い類義語を選
択する概念因子評価手段と、前記概念因子評価手段によ
り選択された類義語と訳文中の訳語とを置換する訳語置
換手段とを備えたことを特徴とする機械翻訳装置。
1. An input unit for inputting an original sentence to be translated, a translation dictionary storing knowledge information used for translation processing, an original sentence analyzing unit for converting the original sentence into an intermediate language by using the contents of the translation dictionary, and An intermediate language storage unit for storing the intermediate language obtained as a result of the original sentence analysis unit, and a translated sentence generation unit for converting the intermediate language stored in the intermediate language storage unit into a translated sentence using the contents of the translation dictionary and the translated sentence. An input language concept factor memory in which one or more concepts that can be recalled from a word in the input language are stored in advance as input language concept factor information in a machine translation device including an output unit that outputs a translated sentence obtained as a result of the generation unit. Means and information on the corresponding word if it is stored by the input language concept factor storage means by checking whether or not the information corresponding to the word constituting the original sentence is stored Input word concept factor analysis means, an input word concept factor evaluation storage means for storing the input language concept factor information read by the input word concept factor analysis means, and one or more that can be recalled from words in the output language. The output language concept factor storage means pre-stores the concept of as the output language concept factor information, the synonym storage means pre-stores the synonym relation of the words of the output language, and the translated sentence obtained by the translated sentence generation means. For the translated word, it is checked whether the synonym is stored in the synonym storage means, and if the synonym is stored, the synonym extraction means for reading the information of the corresponding synonym, and the synonym read by the synonym extraction means It is checked whether or not the information corresponding to is stored in the output language concept factor storage means, and if stored, the corresponding word information is stored. The output word concept factor analysis means, the output word concept factor evaluation storage means for storing the output language concept factor information read by the output word concept factor analysis means, and the input word concept factor evaluation storage means The input language concept factor information is read out and it is checked whether or not the output language concept factor information for the corresponding synonym is stored in the output word concept factor evaluation storage means, and if it is stored, the output of the corresponding synonym is output. Conceptual factor evaluation means for reading out the language conceptual factor information and comparing the similarities with the input language conceptual factor information and selecting a synonym with the highest similarity, and a synonym selected by the conceptual factor evaluation means and a translation A machine translation device comprising: a translation word replacement unit that replaces a translation word.
【請求項2】 入力言語概念因子記憶手段が入力言語の
単語から想起され得る概念を、対立概念を持つ1つ以上
の修飾語対に関する相対的な偏りの割合として数値化し
た情報を記憶していることを特徴とする請求項1記載の
機械翻訳装置。
2. The input language concept factor storage means stores information quantifying a concept that can be recalled from a word in the input language as a relative bias ratio for one or more modifier pairs having an opposite concept. The machine translation device according to claim 1, wherein
【請求項3】 出力言語概念因子記憶手段が出力言語の
単語から想起され得る概念を、対立概念を持つ1つ以上
の修飾語対に関する相対的な偏りの割合として数値化し
た情報を記憶していることを特徴とする請求項1記載の
機械翻訳装置。
3. The output language concept factor storage means stores information that quantifies a concept that can be recalled from a word of the output language as a relative bias ratio with respect to one or more modifier pairs having an opposite concept. The machine translation device according to claim 1, wherein
JP6131739A 1994-06-14 1994-06-14 Machine translation device Pending JPH07334506A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6131739A JPH07334506A (en) 1994-06-14 1994-06-14 Machine translation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6131739A JPH07334506A (en) 1994-06-14 1994-06-14 Machine translation device

Publications (1)

Publication Number Publication Date
JPH07334506A true JPH07334506A (en) 1995-12-22

Family

ID=15065067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6131739A Pending JPH07334506A (en) 1994-06-14 1994-06-14 Machine translation device

Country Status (1)

Country Link
JP (1) JPH07334506A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002075585A1 (en) * 2001-03-21 2002-09-26 Fujitsu Limited Machine-translation apparatus
US7873508B2 (en) 2005-05-25 2011-01-18 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for supporting communication through translation between languages
US8209166B2 (en) * 2007-07-03 2012-06-26 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for machine translation

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59103171A (en) * 1982-12-02 1984-06-14 Fujitsu Ltd Mechanical translator

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59103171A (en) * 1982-12-02 1984-06-14 Fujitsu Ltd Mechanical translator

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002075585A1 (en) * 2001-03-21 2002-09-26 Fujitsu Limited Machine-translation apparatus
US7873508B2 (en) 2005-05-25 2011-01-18 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for supporting communication through translation between languages
US8209166B2 (en) * 2007-07-03 2012-06-26 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for machine translation

Similar Documents

Publication Publication Date Title
US5748973A (en) Advanced integrated requirements engineering system for CE-based requirements assessment
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
JP3038079B2 (en) Automatic translation device
JPH1011447A (en) Translation method and system based upon pattern
JPH083815B2 (en) Natural language co-occurrence relation dictionary maintenance method
WO2003083708A2 (en) Machine translation
JPS6140673A (en) Method and machine for translation for foreign language composition
US20040254783A1 (en) Third language text generating algorithm by multi-lingual text inputting and device and program therefor
JPH05120324A (en) Language processing system
US9009023B2 (en) Computer-readable medium having sentence dividing program stored thereon, sentence dividing apparatus, and sentence dividing method
JPH07334506A (en) Machine translation device
Jagtman et al. Report-COMOLA: a computer system for the analysis of interlanguage data
Khusainov et al. Building the Tatar-Russian NMT system based on re-translation of multilingual data
JPS6180362A (en) Translation system
JP2838984B2 (en) General-purpose reference device
EP0409425A2 (en) Method and apparatus for translating language
JP4845857B2 (en) Machine translation apparatus and machine translation program
JPH07244665A (en) Method and device for dictionary and rule learning for machine translation system
JPH0561902A (en) Mechanical translation system
JP4417967B2 (en) Example database and example search system
JP2009059290A (en) Device, method, and program for supporting preparation of foreign language document
WO2002075585A1 (en) Machine-translation apparatus
JP3041002B2 (en) Kana-kanji conversion method and kana-kanji conversion device
JPH03273360A (en) Method and device for machine translation
JPS63136265A (en) Mechanical translating device

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19961217