JPH11282845A - Machine translation apparatus and computer-readable recording medium recording machine translation processing program - Google Patents

Machine translation apparatus and computer-readable recording medium recording machine translation processing program

Info

Publication number
JPH11282845A
JPH11282845A JP10103925A JP10392598A JPH11282845A JP H11282845 A JPH11282845 A JP H11282845A JP 10103925 A JP10103925 A JP 10103925A JP 10392598 A JP10392598 A JP 10392598A JP H11282845 A JPH11282845 A JP H11282845A
Authority
JP
Japan
Prior art keywords
fixed
sentence
translation
procedure
morphological analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10103925A
Other languages
Japanese (ja)
Inventor
Akiko Niimi
晶子 新美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP10103925A priority Critical patent/JPH11282845A/en
Publication of JPH11282845A publication Critical patent/JPH11282845A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a machine translation device applicable to a regular sentence even with no existence of a strict input sentence and obtaining a translated result sentence of high accuracy to reduce the load of a post-editing job by absorbing the slight variance of bath honorific and ordinary states of the regular sentence and the changes of auxiliary verbs etc. SOLUTION: It is decided whether a regular header sentence is included in an input sentence (S400) and also whether a regular sentence element exists at the head of the input sentence (S420). If the header sentence is included in the input sentence and the sentence element exists at the head of the input sentence, other sentence elements are detected (S430) and the extra adverbs and auxiliary verbs if included are given to an output sentence as the auxiliary information (S460). Thus, the translation processing is over. If no regular keyword is included, the ordinary translation processing is carried on.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、原言語からなる原
文を目的言語に翻訳する機械翻訳装置及び機械翻訳処理
プログラムを記録したコンピュータ読み取り可能な記録
媒体に関し、詳しくは、変化させた原言語による定型文
であっても、適切に定型文として翻訳を行う技術に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation apparatus for translating an original sentence composed of a source language into a target language, and a computer-readable recording medium recording a machine translation processing program. The present invention relates to a technique for appropriately translating a fixed phrase as a fixed phrase.

【0002】[0002]

【従来の技術】従来、この種の機械翻訳装置において
は、一般的に複数種類の辞書が用意されており、翻訳処
理においては、その翻訳しようとするテキストに応じて
最もふさわしい辞書を使用するように構成されている。
ここで、用意されている辞書の種類としては、例えば、
広い範囲の語句が一般的な訳語や語法で登録されてお
り、機械翻訳装置が予め保有している基本辞書と、ある
特定の分野でのみ使用される語句や訳語などが登録され
ている専門辞書と、ユーザが独自に編集することができ
るユーザ辞書などである。ユーザが翻訳したい入力文の
語彙が持つ範囲を特定し、適切な辞書選びと構築とが、
より正確な翻訳結果をもたらす。
2. Description of the Related Art Conventionally, in this type of machine translation apparatus, a plurality of types of dictionaries are generally prepared. In a translation process, a dictionary most suitable for a text to be translated is used. Is configured.
Here, as the type of the prepared dictionary, for example,
A wide range of words and phrases are registered in general translations and grammar, and a basic dictionary stored in advance by a machine translation device and a specialized dictionary in which words and translations used only in a specific field are registered And a user dictionary that the user can independently edit. Specify the range of the vocabulary of the input sentence that the user wants to translate, and select and build an appropriate dictionary,
Provides more accurate translation results.

【0003】同時に、定型文の登録も高度な翻訳結果を
もたらすのに有効である。定型文は主に以下の2つの目
的のために登録される。1つ目は、ユーザ辞書や専門辞
書の有無や、翻訳者の変更などに左右されることなく、
安定した翻訳精度を得る場合である。常に人手による翻
訳処理においても、字面通りの翻訳ではなくて、特定の
言い回しを特定の訳語に置き換えることが必要になるこ
とは多い。端的な例は挨拶表現である。マニュアル文か
ら社内文書まで、この一文はいつもこの訳文でよい、と
いうものには大変有効である。
[0003] At the same time, registration of fixed phrases is also effective for providing high-level translation results. Fixed phrases are registered mainly for the following two purposes. First, regardless of the presence or absence of a user dictionary or specialized dictionary, and changes in translators,
This is a case where stable translation accuracy is obtained. Even in the manual translation process, it is often necessary to replace a specific phrase with a specific translation, instead of performing literal translation. A simple example is a greeting expression. This is very effective for those who want to always translate this sentence, from manual sentences to company documents.

【0004】2つ目は、重要でかつ、出現頻度が高いに
もかかわらず、機械翻訳では翻訳できない場合である。
仮に定型文登録が行われていないと、ユーザが使う決ま
り文句や独特の表現、慣用句を文字どおり訳してしまう
ため意味の通らなかったり、不自然な訳文が生成されて
しまったりする。これらの量が多ければ多いほどユーザ
は膨大な後編集を行わなければならない。ユーザが自由
に編集できるユーザ辞書と定型文とは、自然な翻訳結果
を得るためには不可欠であり、特に定型文は理想的な訳
語に置き換わるのであるから、完璧な翻訳精度を求める
ことが難しい機械翻訳システムにおいては、たいへん有
効である。特開平7−152767号公報には、その登
録方法の一技術として、以下のようなものが提案されて
いる。即ち、定型文を任意語句を表わすシンボルと固定
語句との組み合わせで表わした原文パターンとそれに対
応する訳文パターンとの対でパターンファイルに登録し
ておき、パターン処理部が入力部から入力された原文が
登録されている原文パターンにマッチするかを検査し、
マッチすれば原文パターンのシンボルに対応する語句を
切り出す。翻訳制御部は翻訳部を制御し、切り出された
語句を一つずつ翻訳させる。訳文合成部は、原文パター
ンに対応する訳文パターンをパターン処理部から受け取
り、翻訳制御部を介して受け取った切り出された語句の
翻訳結果を訳文パターンのシンボルを置換して最終的な
訳文を作成する。パターンファイルは、利用者が容易に
登録及び更新することができるようなものである。
[0004] The second is a case in which machine translation is impossible even though it is important and its appearance frequency is high.
If the fixed phrases are not registered, the fixed phrases, unique expressions, and idioms used by the user are literally translated, so that the translated sentences have no meaning or unnatural translations are generated. The greater these quantities, the more extensive the user has to do post-editing. User dictionaries and fixed phrases that users can freely edit are indispensable for obtaining natural translation results. In particular, fixed phrases are replaced with ideal translations, so it is difficult to find perfect translation accuracy. It is very effective in machine translation systems. Japanese Unexamined Patent Publication No. 7-152767 proposes the following technique as one technique of the registration method. That is, a fixed sentence is registered in a pattern file as a pair of an original sentence pattern expressed by a combination of a symbol representing an arbitrary phrase and a fixed phrase and a corresponding translated sentence pattern, and the pattern processing unit inputs the original sentence input from the input unit. Checks if matches the registered source pattern,
If there is a match, a word corresponding to the symbol of the original pattern is cut out. The translation control unit controls the translation unit to translate the extracted words one by one. The translated sentence synthesis unit receives a translated sentence pattern corresponding to the original sentence pattern from the pattern processing unit, and creates a final translated sentence by replacing the translation result of the cut-out phrase received via the translation control unit with the symbol of the translated sentence pattern. . The pattern file is such that the user can easily register and update.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、定型文
は入力文中で厳密に全体一致した場合のみ置き換えても
よい、という枠組みであり、それが長所なのであるが、
逆に、微妙な表現の揺れに対応することができない。名
詞句など入力文の構造に変更がない場合は、一部限定し
てワイルドカードが利用できることもある。また、送り
がなや字種の違いによる表記の揺れという問題は、各種
の文書推敲支援ツールなどを利用することにより、マニ
ュアル文などで用語の統一が行われつつある。こういっ
た動きは文書処理として必要な行為であり、機械翻訳の
ためだけではない。しかし、日本語の特性として、常
体、敬体は、文章が使われる場面毎に変化するものであ
る。同時に、機械翻訳では困難な文章を定型文として登
録する場合には、否定文等の助動詞がついたパターン
も、場合によっては登録しなければならない。可能な場
合をすべて想定して定型文登録をするのはユーザに大変
な負荷を強いるものであるという問題があった。また、
いたずらにユーザに開放された定型文登録の空き容量を
使うことになり非効率であるという問題があった。
However, the fixed phrase may be replaced only when the whole sentence exactly matches in the input sentence, which is an advantage.
Conversely, it cannot respond to subtle fluctuations in expression. When there is no change in the structure of an input sentence such as a noun phrase, a wild card can be used with some restrictions. In addition, for the problem of swaying of notation due to differences in sending and character types, terms are being unified in manual sentences and the like by using various document revision support tools and the like. These actions are necessary for document processing, not just for machine translation. However, as a characteristic of Japanese, the ordinary body and the honorific body change every time a sentence is used. At the same time, when a sentence that is difficult to machine translation is registered as a fixed sentence, a pattern with an auxiliary verb such as a negative sentence must also be registered in some cases. There is a problem that registering a fixed phrase assuming all possible cases imposes a heavy load on a user. Also,
There is a problem that it is inefficient because the free space of the fixed form registration that is unnecessarily opened to the user is used.

【0006】本発明は、上述した問題点を解決するため
になされたものであり、ユーザが定型文を登録する際
に、形態素解析を行い、定型文の要素を登録しておき、
構文解析時にまとめることにより、定型文が適合する枠
を広げ、精度の高い目的言語の翻訳結果を得、後編集の
負荷を軽減することが可能な機械翻訳装置を提供するこ
とを目的としている。
The present invention has been made to solve the above-described problem. When a user registers a fixed phrase, the user performs a morphological analysis and registers the elements of the fixed phrase.
It is an object of the present invention to provide a machine translation device that can broaden a frame to which a fixed phrase can be applied, obtain a translation result of a target language with high accuracy, and reduce the load of post-editing by combining at the time of syntax analysis.

【0007】[0007]

【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の機械翻訳装置は、原言語
文を入力する入力手段と、前記入力手段により入力され
た原言語文を記憶する原言語文記憶手段と、原言語によ
る見出語、前記見出語の品詞、前記見出語に対応する目
的言語の訳語を含む単語情報と、形態素解析処理に必要
な接続情報を含む文法情報とを格納している翻訳辞書
と、前記原言語の任意の語句の並びである定型見出文
と、前記定型見出文に対応する目的言語の訳語句の並び
である定型訳文との対からなる定型文データを複数記憶
した定型文データ記憶手段と、前記翻訳辞書と前記定型
文データ記憶手段を用いて、前記原言語文について前記
見出語と前記定型見出文とを検索することにより形態素
解析を行う形態素解析手段と、前記形態素解析手段によ
り与えられた前記原言語文の形態素解析の結果に基づい
て構文解析を行う構文解析手段とを有し、前記原言語文
を目的言語文に翻訳する翻訳手段と、最終訳文である目
的言語文を表示する表示手段とを備えた機械翻訳装置で
あって、前記定型文データ記憶手段は、新たな定型文デ
ータを追加をして登録し、又は既に登録されている定型
文データを修正をして登録をする定型文編集手段を有
し、前記定型文編集手段は、新たに追加され又は修正さ
れた前記定型見出文と前記定型訳文の対からなる定型文
データを登録する際に、前記形態素解析手段により前記
定型見出文の形態素解析を行ない、その結果に基づき前
記登録される定型見出文を見出語としての定型文要素
と、定型文要素以外の一般要素に分割する定型文分割手
段と、前記定型文分割手段により前記定型見出文が定型
文要素と一般要素とに分割された場合、前記定型文要素
のみを使用して定型見出文にまとめるまとめあげ手段
と、前記まとめあげ手段によりまとめあげられた定型見
出文を、当該定型見出文に対応する前記定型訳文に置換
える置換手段とを備えている。
In order to achieve this object, a machine translation apparatus according to a first aspect of the present invention comprises: an input means for inputting a source language sentence; and a source language input by the input means. Source language sentence storage means for storing sentences, headwords in the source language, part of speech of the headwords, word information including target language translations corresponding to the headwords, and connection information necessary for morphological analysis processing A translation dictionary storing grammatical information including: a fixed phrase sentence which is a sequence of arbitrary phrases in the source language; and a fixed translation sentence which is a sequence of translated words in the target language corresponding to the fixed phrase. A fixed sentence data storage unit storing a plurality of fixed sentence data consisting of pairs of the following, and using the translation dictionary and the fixed sentence data storage unit, the headword and the fixed headword for the source language sentence Morphological analysis that performs morphological analysis by searching A translation unit for translating the source language sentence into a target language sentence, comprising: a stage; and a syntax analysis unit that performs a syntax analysis based on a result of the morphological analysis of the source language sentence given by the morphological analysis unit. A display unit for displaying a target language sentence that is a final translation sentence, wherein the fixed sentence data storage unit adds and registers new fixed sentence data or is already registered It has a fixed phrase editing means for correcting and registering the fixed phrase data, wherein the fixed phrase editing means is a fixed phrase data comprising a pair of the newly added or corrected fixed entry and the fixed translation. When registering, the morphological analysis means performs a morphological analysis of the fixed headings, based on the results, the registered fixed headings to be registered as fixed headings and fixed sentence elements other than the fixed sentence elements Rule to divide into general elements A sentence dividing unit, when the fixed sentence dividing unit divides the fixed sentence into a fixed sentence element and a general element, a grouping unit that collects the fixed sentence element into a fixed sentence using only the fixed sentence element; And replacing means for replacing the standardized headline sentence compiled by the generalizing unit with the fixed-form translation corresponding to the standard headline sentence.

【0008】従って、この構成によれば定型文を自由に
追加、修正して定型文データ記憶手段に登録でき、この
定型文データ記憶手段に格納されたデータにより、原言
語を目的言語に機械翻訳する場合に、ですます調や、だ
である調などで言い表わされる敬体・常体の違いや、活
用の違いがあったり、助動詞が付加されているような場
合であっても定型文と認識させ、これを所定の定型訳文
に翻訳することができ、この定型訳文をそのまま或いは
僅かな修正をするだけで高品質な翻訳を得ることができ
る。
Therefore, according to this configuration, fixed phrases can be freely added and modified and registered in the fixed phrase data storage means, and the data stored in the fixed phrase data storage means can be used to machine translate the source language into the target language. Even if there is a difference in the honorific or ordinary body expressed in the tonality or the dana tongue, the difference in inflection, or the case where an auxiliary verb is added, It can be recognized and translated into a predetermined fixed translation, and a high quality translation can be obtained with the fixed translation as it is or with only a slight correction.

【0009】また、請求項2に記載の機械翻訳装置は、
請求項1に記載の機械翻訳装置の構成に加え、前記一般
要素を訳文生成補助情報として前記定型訳文に付与する
訳文生成補助情報記憶手段と、前記表示手段に表示され
た前記定型訳文に関連させて、前記訳文生成補助情報を
前記表示手段で表示する訳文生成補助情報表示制御手段
とを備えたことを特徴とする。
Further, the machine translation device according to claim 2 is
In addition to the configuration of the machine translation device according to claim 1, a translation generation auxiliary information storage unit that adds the general element as the translation generation auxiliary information to the fixed translation, and a translation associated with the fixed translation displayed on the display unit. And a translation generation auxiliary information display control means for displaying the translation generation auxiliary information on the display means.

【0010】従って、この構成によれば、定型文に一般
要素である助動詞などが付加され、意味が多少異なるよ
うな場合、これを一旦定型訳文にし、同時に表示される
訳文生成補助情報により、定型訳文を最小限の修正をす
るだけで品質の高い翻訳とすることができる。
Therefore, according to this configuration, when the auxiliary sentence, which is a general element, is added to the fixed phrase and the meaning is slightly different, the fixed verb is temporarily converted to a fixed translation, and the fixed translation is displayed by the translation generation auxiliary information displayed at the same time. The translation can be made a high quality translation with only minimal modification.

【0011】また、請求項3に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
は、原言語文を目的言語文に翻訳するための機械翻訳処
理のための機械翻訳処理プログラムを記録した記録媒体
であって、コンピュータに、原言語文を入力する入力の
手順と、前記入力の手順により入力された原言語文を記
憶する原言語文記憶の手順と、原言語による見出語、前
記見出語の品詞、前記見出語に対応する目的言語の訳語
を含む単語情報と、形態素解析処理に必要な接続情報を
含む文法情報とを格納している翻訳辞書と、前記原言語
の任意の語句の並びである定型見出文と、前記定型見出
文に対応する目的言語の訳語句の並びである定型訳文と
の対からなる定型文データを複数記憶した定型文データ
記録手段とを用いて、前記原言語文について前記見出語
と前記定型見出文とを検索することにより形態素解析を
行う形態素解析の手順と、前記形態素解析の手順により
与えられた前記原言語文の形態素解析の結果に基づいて
構文解析を行う構文解析の手順とを有し、前記原言語文
を目的言語文に翻訳する翻訳の手順と、最終訳文である
前記目的言語文を表示する表示の手順とを実行させる機
械翻訳処理プログラムであって、前記定型文データ記憶
の手順は、新たな定型文データを追加して登録し、又は
既に登録されている定型文データを修正して登録をする
定型文編集の手順を有し、前記定型文編集の手順は、新
たに追加され又は修正された前記定型見出文と前記定型
訳文の対からなる定型文データを登録する際に、前記形
態素解析の手順により前記定型見出文の形態素解析を行
ない、その結果に基づき前記登録される定型見出文を見
出語としての定型文要素と、定型文要素以外の一般要素
に分割する定型文分割の手順と、前記定型文分割の手順
により前記定型見出文が定型文要素と一般要素とに分割
された場合、前記定型要素のみを使用して定型見出文に
まとめるまとめあげの手順と、前記まとめあげの手順に
よりまとめあげられた定型見出文を、当該定型見出文に
対応する前記定型訳文に置き換える置換の手順とを実行
させることを特徴とする。
A computer-readable recording medium on which the machine translation processing program according to claim 3 is recorded stores a machine translation processing program for machine translation processing for translating a source language sentence into a target language sentence. Recording medium, a computer, an input procedure for inputting a source language sentence, a source language sentence storage procedure for storing the source language sentence input by the input procedure, a headword in the source language, A translation dictionary storing the part of speech of the headword, word information including a translation of the target language corresponding to the headword, and grammar information including connection information required for morphological analysis processing, A fixed phrase data recording unit that stores a plurality of fixed phrase data, each of which is a pair of a fixed phrase sentence that is a sequence of arbitrary phrases and a fixed phrase translation that is a sequence of translated phrases of the target language corresponding to the fixed phrase. Using A morphological analysis procedure for performing a morphological analysis by searching the headword and the fixed-form headword for the source language sentence, and a result of a morphological analysis of the source language sentence given by the morphological analysis procedure And performing a translation procedure for translating the source language sentence into a target language sentence and a display procedure for displaying the target language sentence that is the final translated sentence. A machine translation processing program, wherein the procedure for storing the fixed form data is a fixed form editing procedure for adding and registering new fixed form data, or correcting and registering already registered fixed form data. Has a fixed sentence editing procedure, when registering the fixed sentence data consisting of a pair of the newly added or modified fixed entry and fixed form translation, the fixed form data by the morphological analysis procedure Finding Morphological analysis, and based on the result, a fixed sentence element as a headword, and a fixed sentence dividing procedure for dividing the fixed fixed sentence into general elements other than the fixed sentence element; When the fixed entry is divided into the fixed sentence element and the general element according to the procedure of the above, the setting procedure of putting together the fixed entry by using only the fixed element and the fixed form put together by the setting procedure And replacing the entry sentence with the fixed translation corresponding to the fixed entry sentence.

【0012】従って、この記録媒体を用いることによ
り、コンピュータに、定型文を自由に追加、修正して定
型文データ記憶手段に登録でき、この定型文データ記憶
手段に格納されたデータにより、原言語を目的言語語に
機械翻訳する場合に、ですます調や、だである調などで
言い表せる敬体・常体の違いや、活用の違いがあった
り、助動詞が付加されているような場合であっても定型
文と認識させ、これを所定の定型訳文に翻訳することが
でき、この定型訳文をそのまま或いは僅かな修正をする
だけで高品質な翻訳を得る手順を実行させることができ
る。
[0012] Therefore, by using this recording medium, fixed phrases can be freely added and corrected in the computer and registered in the fixed phrase data storage means, and the data stored in the fixed phrase data storage means can be used in the source language. When translating into a target language, if there is a difference in the honorific or ordinary body that can be expressed in the tonality or the tonality, the difference in the use, or when an auxiliary verb is added Even if it is, it can be recognized as a fixed form sentence and can be translated into a predetermined fixed form translation, and a procedure for obtaining a high-quality translation can be executed with the fixed form translation as it is or with a slight modification.

【0013】また、本発明の請求項4に記載の機械翻訳
処理プログラムを記録したコンピュータ読み取り可能な
記録媒体は、請求項3に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体の構成
に加え、前記一般要素を訳文生成補助情報として前記定
型訳文に付与する訳文生成補助情報記憶の手順と、前記
表示手段に表示された前記定型訳文に関連させて、前記
訳文生成補助情報を前記表示手段で表示する訳文生成補
助情報表示を制御する手順を実行することを特徴とす
る。
Further, a computer readable recording medium on which the machine translation processing program according to claim 4 of the present invention is recorded is a computer readable recording medium on which the machine translation processing program according to claim 3 is recorded. In addition to the above, the translation element generating auxiliary information storage procedure of adding the general element to the fixed form translation as the translated sentence generation auxiliary information, and displaying the translated sentence generation auxiliary information in association with the fixed form translation displayed on the display means. A step of controlling the display of the translated sentence generation auxiliary information to be displayed by the means.

【0014】従って、この記録媒体を用いることにより
コンピュータに、定型文に一般要素である助動詞などが
付加され、意味が多少異なるような場合、これを一旦定
型訳文にし、同時に表示される訳文生成補助情報によ
り、定型訳文を最小限の修正をするだけで品質の高い翻
訳とする手順を実行させることができる。
Therefore, when the recording medium is used, an auxiliary verb or the like, which is a general element, is added to the fixed sentence to the computer, and when the meaning is slightly different, the fixed sentence is temporarily converted into a fixed translated sentence, and the translated sentence generation assist displayed at the same time is displayed. With the information, it is possible to execute a procedure for converting a fixed-form translation into a high-quality translation with only minimal modification.

【0015】[0015]

【発明の実施の形態】以下、本発明の機械翻訳装置を具
体化した実施の形態について図面を参照して説明する。
尚、本実施の形態では、日本語(原言語)から英語(目
的言語)に翻訳する場合を例として説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment embodying a machine translation apparatus according to the present invention will be described below with reference to the drawings.
In the present embodiment, a case where translation from Japanese (source language) to English (target language) will be described as an example.

【0016】まず、本実施の形態の機械翻訳装置の概略
構成を示すブロック図を図1に示す。図1に示すよう
に、本実施の形態の機械翻訳装置は、翻訳対象となる日
本語の原文や各種操作指示等を入力するためのキーボー
ド等からなる入力手段である入力部2と、翻訳処理に利
用される翻訳辞書が格納され、ハードディスクや光ディ
スク等からなる外部記憶装置4と、入力された日本語の
原文や翻訳結果である英語の訳文等を表示するためのC
RT等からなる表示手段である表示部6と、その表示部
6に表示するデータを制御する表示制御部7と、翻訳結
果である英語の訳文等を印刷して出力するためのレーザ
ープリンタ等からなる印刷部8と、前記入力部2や外部
記憶装置4から入力されるデータに基づいて翻訳処理を
行い、その翻訳結果を表示部6に表示したり、印刷部8
から出力する等の制御を行う制御部10とから構成され
ている。
First, FIG. 1 is a block diagram showing a schematic configuration of a machine translation apparatus according to the present embodiment. As shown in FIG. 1, a machine translation apparatus according to the present embodiment includes an input unit 2 that is an input unit including a keyboard or the like for inputting a Japanese original to be translated, various operation instructions, and the like. An external storage device 4 composed of a hard disk, an optical disk, or the like, and a C for displaying an input Japanese original and an English translation as a translation result.
A display unit 6 which is a display means composed of an RT or the like; a display control unit 7 which controls data to be displayed on the display unit 6; and a laser printer for printing and outputting English translations and the like as translation results. The translation unit performs translation processing based on data input from the input unit 2 or the external storage device 4, and displays the translation result on the display unit 6,
And a control unit 10 for performing control such as output from the controller.

【0017】前記入力部2には、文字を入力するための
文字キー、各種処理を起動するための入力文編集キー、
翻訳実行キー、定型文編集キー、出力文編集キー、終了
キー、及び印字実行キーといった各種機能キー、入力文
や出力文の編集、表示部6に表示されている画面操作等
に使用するカーソルキー、挿入キー、削除キー、確定キ
ー、及び次候補選択キー等が設けられている。
The input unit 2 includes a character key for inputting characters, an input sentence editing key for activating various processes,
Various function keys such as a translation execution key, a fixed phrase editing key, an output sentence editing key, an end key, and a print execution key, cursor keys used for editing input and output sentences, and for operating the screen displayed on the display unit 6 , An insert key, a delete key, a decision key, a next candidate selection key, and the like.

【0018】また、前記外部記憶装置4には、翻訳処理
に利用される翻訳辞書12と定型文データ記憶部16と
が備えられている。この翻訳辞書12が本発明の翻訳辞
書を構成している。また、定型文データ記憶部16が、
本発明の定型文データ記憶手段を構成している。
Further, the external storage device 4 includes a translation dictionary 12 and a fixed phrase data storage unit 16 used for translation processing. This translation dictionary 12 constitutes the translation dictionary of the present invention. Also, the fixed phrase data storage unit 16 stores
This constitutes the standard sentence data storage means of the present invention.

【0019】なお、機械翻訳装置が利用する翻訳辞書1
2の内容としては、機械翻訳装置が予め保有している必
須の基本辞書があるが、この他任意で、専門分野毎に編
集された専門辞書、及びユーザが独自に構築するユーザ
辞書を外部記憶装置4内に格納して、これを参照して翻
訳処理をすることにより翻訳の精度を上げることができ
る。
The translation dictionary 1 used by the machine translation device
The contents of item 2 include an essential basic dictionary held in advance by the machine translation apparatus, and optionally, a specialized dictionary edited for each specialized field and a user dictionary independently constructed by the user are externally stored. By storing it in the device 4 and performing translation processing with reference to this, the translation accuracy can be improved.

【0020】図2に、上記した翻訳辞書12のデータ構
成の一例を示す。個々の辞書登録情報は、それぞれ見出
語30と、各見出語の品詞32と、各見出語に対する訳
語34と、前後の接続情報や意味情報等を含む様々な辞
書情報36とを記憶するフィールドから構成されてい
る。
FIG. 2 shows an example of the data structure of the translation dictionary 12 described above. Each dictionary registration information stores a headword 30, a part of speech 32 of each headword, a translated word 34 for each headword, and various dictionary information 36 including connection information and semantic information before and after. It consists of fields that

【0021】図3に、上記した定型文データ記憶部16
のデータ構成の一例を示す。個々の定型文データ記憶部
16は、定型見出文40と、定型文要素42と、訳語、
品詞などの辞書情報44、定型文要素ID46と、定型
訳文48とを記憶するフィールドから構成されている。
FIG. 3 shows the fixed form data storage section 16 described above.
1 shows an example of the data configuration. Each fixed sentence data storage unit 16 stores a fixed entry sentence 40, a fixed sentence element 42, a translated word,
It is composed of fields for storing dictionary information 44 such as part of speech, fixed sentence element ID 46, and fixed translation 48.

【0022】次に、前記制御部10は、CPU18、R
OM20、RAM22、入出力ポート24、及びこれら
各部を結ぶパスライン26を備えた周知のマイクロコン
ピュータにより構成されている。
Next, the control unit 10 includes a CPU 18 and an R
It comprises a well-known microcomputer having an OM 20, a RAM 22, an input / output port 24, and a pass line 26 connecting these components.

【0023】そして、制御部10においては、ROM2
0に格納されたプログラムによって各種処理が実行され
る。例えば、前記入力部2から入力された日本語の原文
を英語に翻訳すると共に、原文や翻訳文の編集等を行う
翻訳・編集処理、また、翻訳時に利用する定型文データ
を構築するための定型文編集処理等が実行される。
In the control unit 10, the ROM 2
Various kinds of processing are executed by the program stored in “0”. For example, a translation / editing process for translating a Japanese original sentence input from the input unit 2 into English, editing the original sentence and the translated sentence, and a fixed form for constructing fixed sentence data used at the time of translation. A sentence editing process is performed.

【0024】また、前記ROM20には、後述する翻訳
処理において使用される各種情報が格納されており、具
体的には本機械翻訳プログラム全体を制御する制御プロ
グラム202、翻訳処理全体を制御する翻訳手段である
翻訳プログラム204、形態素解析を行う形態素解析手
段である形態素解析プログラム206、構文解析を行う
構文解析手段である構文解析プログラム208、日本語
から英語への変換を行う変換手段である変換プログラム
210、変換後の訳文生成を行う生成手段である生成プ
ログラム212、定型文を編集する定型文編集手段であ
る定型文編集プログラム214、定型文の分割を行う定
型文分割手段である定型文分割プログラム216、定型
文データ記憶部16と共に分割された定型文要素を管理
する定型文要素記録手段である定型文要素記録プログラ
ム218などが格納されている。
The ROM 20 stores various kinds of information used in a translation process described later. More specifically, a control program 202 for controlling the entire machine translation program, a translation means for controlling the entire translation process A translation program 204, a morphological analysis program 206 as a morphological analysis means for performing morphological analysis, a syntactic analysis program 208 as a syntactic analysis means for performing syntactic analysis, and a conversion program 210 as a conversion means for converting Japanese into English. A generating program 212 which is a generating means for generating a translated sentence after conversion, a fixed sentence editing program 214 which is a fixed sentence editing means for editing a fixed sentence, and a fixed sentence dividing program 216 which is a fixed sentence dividing means for dividing the fixed sentence. , A fixed phrase data storage unit 16 and a fixed phrase data management unit Such as fixed text element recording program 218 is a unit are stored.

【0025】前記RAM22には、翻訳等の作業を行
い、一時的にデータを呼び出し格納する作業領域22
2、入力部から入力される日本語の原文を記録する原言
語文記憶手段である原言語文記憶領域224、翻訳・編
集処理により翻訳、編集された英語の訳文が記録される
訳文記憶領域226が確保される。
In the RAM 22, a work area 22 for performing work such as translation and temporarily retrieving and storing data.
2. A source language sentence storage area 224, which is a source language sentence storage means for recording a Japanese source sentence input from the input unit, and a translated sentence storage area 226 in which an English translation translated and edited by translation and editing processing is recorded. Is secured.

【0026】続いて、制御部10が実行する翻訳・編集
処理の手順について図4〜図6に示すフローチャートに
従って説明する。
Next, the procedure of the translation / editing process executed by the control unit 10 will be described with reference to the flowcharts shown in FIGS.

【0027】図4に示すように、翻訳・編集処理が実行
されると、まず、ステップ110(以下、S110と略
称する。他のステップも同様)において、ユーザにより
入力部2の文字キー等が操作され、翻訳対象となる日本
語の原文が入力されるのを待つ。ここで、原文の入力
は、既に作成されている原文のファイルを読み込むよう
に構成してもよい。そして、日本語の原文(以下、入力
文)が入力されると、この入力文を、表示部6の所定の
エリアに表示する(S120)。
As shown in FIG. 4, when the translation / editing process is executed, first, in step 110 (hereinafter abbreviated as S110; other steps are the same), the user operates the character keys of the input unit 2 by the user. It is operated and waits for the input of the Japanese original to be translated. Here, the input of the original text may be configured to read the file of the original text that has already been created. Then, when a Japanese original sentence (hereinafter, input sentence) is input, the input sentence is displayed in a predetermined area of the display unit 6 (S120).

【0028】次に、S130では、入力部2に設けられ
た入力文編集キーが操作されたか否かを判断し、操作さ
れていなければ(S130:NO)、S150に移行す
る。また、入力文編集キーが操作されていれば(S13
0:YES)、S140に移行し、入力文編集処理を実
行する。尚、入力文編集処理が実行されると、ユーザは
表示部6の所定のエリアに表示された入力文を、入力部
2に設けられたカーソルキー、削除キー、挿入キー及び
文字キー等を使用して直接修正することが可能となる。
S150では、入力部2に設けられた翻訳実行キーが操
作されたか否かを判断し、操作されていなければ(S1
50:NO)、S190に移行し、また、翻訳実行キー
が操作されていれば(S150:YES)、S160に
移行し、日本語の入力文を英語の訳文(以下、出力文と
する)に翻訳する翻訳処理を実行し、続くS170にお
いて、翻訳処理により得られた出力文を入力文と対にし
てRAM22に格納すると共に、S180において、表
示部6に設けられた所定のエリアにそれぞれ入力文と出
力文とを表示する。
Next, in S130, it is determined whether or not the input sentence editing key provided in the input unit 2 has been operated. If not (S130: NO), the process proceeds to S150. If the input sentence edit key is operated (S13
0: YES), proceeds to S140, and executes an input sentence editing process. When the input sentence editing process is executed, the user uses the cursor keys, the delete key, the insert key, the character keys, and the like provided on the input unit 2 to change the input sentence displayed in a predetermined area of the display unit 6. Can be directly modified.
In S150, it is determined whether or not the translation execution key provided on the input unit 2 has been operated, and if it has not been operated (S1).
50: NO), the process proceeds to S190, and if the translation execution key is operated (S150: YES), the process proceeds to S160 to convert the Japanese input sentence into an English translated sentence (hereinafter referred to as an output sentence). In step S170, the output sentence obtained by the translation process is stored in the RAM 22 as a pair with the input sentence. In step S180, the input sentence is stored in a predetermined area provided on the display unit 6. And the output statement.

【0029】尚、翻訳処理の手順は、入力文全部を一括
して実行しても良いし、文章単位で範囲を指定し、指定
された範囲の文章のみについて実行するようにしてもよ
い。
The procedure of the translation process may be such that the entire input sentence is executed collectively, or a range is specified for each sentence, and only the sentences in the specified range may be executed.

【0030】S190では、入力部2に設けられた定型
文編集キーが操作されたか否かを判断し、操作されてい
なければ(S190:N)、S210に移行する。ま
た、定型文編集キーが操作されていれば(S190:
Y)、S200に移行し、定型文編集処理を実行する。
尚、定型文編集処理が実行されると、ユーザは定型文デ
ータ記憶部16に登録されている情報の内容を修正した
り、削除したり、新たに必要な定型文を登録することが
可能となる。このS200の手順を実行させる定型文編
集プログラム214が、本発明の定型文編集手段に相当
する。
In S190, it is determined whether or not the fixed phrase editing key provided on the input unit 2 has been operated, and if not (S190: N), the process proceeds to S210. If the fixed phrase editing key is operated (S190:
Y), and proceeds to S200 to execute a fixed phrase editing process.
When the fixed phrase editing process is executed, the user can correct or delete the content of the information registered in the fixed phrase data storage unit 16 or register a new required fixed phrase. Become. The fixed phrase editing program 214 for executing the procedure of S200 corresponds to a fixed phrase editing unit of the present invention.

【0031】S210では、入力部2に設けられた出力
文編集キーが操作されたか否かを判断し、操作されてい
なければ(S210:NO)、S230に移行する。ま
た、出力文編集キーが操作されていれば(S210:Y
ES)、S220に移行し、出力文編集処理を実行す
る。尚、出力文編集処理が実行されると、ユーザは先の
S160において翻訳処理が実行されることにより表示
部6の所定のエリアに表示される出力文(英語の訳文)
を、S140の入力文編集処理と同様に、入力部2に設
けられたカーソルキー、削除キー、挿入キー及び文字キ
ー等を使用して、直接修正することが可能となる。
In S210, it is determined whether or not the output sentence editing key provided on the input unit 2 has been operated. If not (S210: NO), the process proceeds to S230. If the output sentence edit key is operated (S210: Y
ES), and proceeds to S220 to execute an output sentence editing process. When the output sentence editing process is executed, the user executes the translation process in S160 to display an output sentence (English translation) displayed in a predetermined area of the display unit 6.
Can be directly corrected using the cursor key, the delete key, the insert key, the character key, and the like provided in the input unit 2 as in the input sentence editing process in S140.

【0032】S230では、入力部2に設けられた終了
キーが操作されたか否かを判断し、操作されていなけれ
ば(S230:NO)、S240に移行し、例えば、翻
訳された出力文を印刷部8に出力し印刷させる印刷実行
キー等、その他のキー操作を検出すると共に、操作され
たキーに応じた処理を実行する。
In S230, it is determined whether or not the end key provided on the input unit 2 has been operated. If it has not been operated (S230: NO), the process proceeds to S240, for example, a translated output sentence is printed. It detects other key operations such as a print execution key that is output to the unit 8 and prints, and executes a process corresponding to the operated key.

【0033】そして、先のS140、S180、S20
0、S220、S240が処理された後は、S130に
戻り、同様の処理を繰り返し実行する。
Then, S140, S180, S20
After the processing of 0, S220, and S240, the process returns to S130, and the same processing is repeatedly executed.

【0034】また、S230にて、終了キーが操作され
たと判断されると(S230:YES)、本処理を終了
する。
If it is determined in S230 that the end key has been operated (S230: YES), the process is terminated.

【0035】このように翻訳・編集処理においては、日
本語の原文が入力された後、入力部2に設けられた各種
キーの操作に従って、入力文編集処理、翻訳処理、定型
文編集処理、及び出力文編集処理といった各種処理が実
行される。そして、もし、翻訳実行キーを操作し翻訳処
理を実行したが、得られた出力文(英語の訳文)が不正
確であったり不自然であったりする場合には、入力文編
集キーを操作して入力文編集処理を実行し、入力文であ
る日本語の原文を再編集した後、または定型文編集キー
を操作して定型文データを編集した後、再度、翻訳実行
キーを操作して再翻訳させるか、あるいは出力文編集キ
ーを操作して出力文編集処理を実行し、出力文である英
語の訳文を直接編集する後編集を行う。
As described above, in the translation / editing process, after the Japanese original is input, the input sentence editing process, the translation process, the fixed phrase editing process, and the input process are performed in accordance with the operation of various keys provided on the input unit 2. Various processes such as an output sentence editing process are executed. Then, if the translation process is executed by operating the translation execution key, if the obtained output sentence (English translation) is incorrect or unnatural, the input sentence edit key is operated. After executing the input sentence editing process and re-editing the Japanese original sentence that is the input sentence, or operating the fixed phrase edit key to edit the fixed sentence data, operating the translation execution key again An output sentence editing process is executed by translating or operating an output sentence edit key, and then an English translated sentence, which is an output sentence, is directly edited and then edited.

【0036】このような処理を繰り返すことにより、ユ
ーザが求める翻訳結果を得ることができれば、印刷キー
を操作して、翻訳結果を印刷部8から出力したり、テキ
ストデータとしてRAM22の訳文記憶領域226や外
部記憶装置4に保存し、その後、終了キーを操作して、
処理を終了する。
If the translation result desired by the user can be obtained by repeating such processing, the print key is operated to output the translation result from the printing unit 8 or the translated text storage area 226 of the RAM 22 as text data. Or the external storage device 4, and then operate the end key to
The process ends.

【0037】次に、図5において、図4に示すフローチ
ャート中のS200において実行され、ユーザが定型文
データ記憶部16の内容を修正したり、削除したり、新
たに必要な定型文を登録する定型文編集処理についての
フローチャートに従って説明する。
Next, in FIG. 5, the process is executed in S200 in the flowchart shown in FIG. 4, and the user corrects or deletes the contents of the fixed phrase data storage unit 16, or registers a new required fixed phrase. The fixed phrase editing process will be described with reference to the flowchart.

【0038】まず、S510では、ユーザが編集したい
定型見出文が入力されたか否かを判断する。入力されて
いれば(S510:YES)、S520に移行する。S
520では、入力された定型見出文が、既に定型文デー
タ記憶部16に登録されているか否かを判断する。既に
登録されていれば(S520:YES)、S540に移
行する。S540では、定型文データ16記憶部内の定
型見出文、または定型訳文を再編集して、S550へ移
行する。まだ登録されていなければ(S520:N
O)、S530へ移行する。S530では、新規に定型
見出文と定型訳文を編集してS550へ移行する。S5
50では編集された定型見出文が完全一致の時のみ定型
訳文に置き換えるか否かを判断する。ユーザが完全一致
の時のみの置き換えを望む場合は、ここでYESを選択
する。完全一致の時のみであれば(S550:YE
S)、S590へ移行する。S590では、定型見出文
に、文区切りである句読点、コロン、セミコロン、改行
コードなどが後方に来る場合のみ接続可とする接続情報
を付与してS610へ移行する。
First, in S510, it is determined whether or not the user has input a standard heading to be edited. If it has been input (S510: YES), the flow shifts to S520. S
At 520, it is determined whether or not the input standard sentence is already registered in the standard sentence data storage unit 16. If it has already been registered (S520: YES), the process proceeds to S540. In S540, the standard entry or the standard translation in the storage of the standard sentence data 16 is re-edited, and the process proceeds to S550. If not registered yet (S520: N
O), and proceed to S530. In S530, the routine edits the standard entry sentence and the standard translated sentence, and then proceeds to S550. S5
At 50, it is determined whether or not to replace the edited standard sentence with the standard translated sentence only when there is a perfect match. If the user wants replacement only when there is an exact match, select YES here. If only at the time of perfect match (S550: YE
S), and proceeds to S590. In S590, connection information that allows connection only when a punctuation mark, a colon, a semicolon, a line feed code, or the like, which is a sentence delimiter, comes to the fixed entry sentence, and the process proceeds to S610.

【0039】完全一致以外でも置き換えるのであれば、
(S550:NO)、S560へ移行する。S560で
は、定型見出文がS530で新規登録されたものか、ま
たはS540で再編集されたものか否かを判断する。定
型見出文が再編集されていなければ(S560:N
O)、S590へ移行する。定型見出文が書き換わって
いなければ、改めて形態素解析を行う必要がないので、
そのまま登録すれば良いからである。定型見出文が新規
か、再編集されている場合、S570へ移行する。S5
70では、翻訳辞書12を用いて、後述のフローチャー
トで説明する形態素解析処理S250を行い、S580
へ移行する。S580では、形態素解析結果から得た定
型文要素に対して、品詞、訳語等の辞書情報と共に、固
有の定型文要素IDを付与し、S600へ移行する。品
詞、訳語などの辞書情報を付与するのは、解析処理中に
定型文としてまとめられない場合、通常の翻訳処理を続
行するためである。なお、S560、S570、S58
0の手順が本発明の定型文分割手段である定型文分割プ
ログラム216により実行されている。S600では、
その最後の定型文要素に文区切りである句読点、コロ
ン、セミコロン、改行コードなどや、丁寧語の助動詞
「です」、「ます」などが接続可とする情報を付与し、
S610へ移行する。
If a replacement other than an exact match is to be replaced,
(S550: NO), and proceeds to S560. In S560, it is determined whether the fixed entry is newly registered in S530 or re-edited in S540. If the fixed entry is not re-edited (S560: N
O), and proceed to S590. If the fixed headings are not rewritten, there is no need to perform morphological analysis again.
This is because it is sufficient to register as it is. If the standard entry is new or has been re-edited, the process proceeds to S570. S5
At 70, the morphological analysis processing S250 described in a flowchart described later is performed using the translation dictionary 12, and S580
Move to. In S580, a unique fixed sentence element ID is assigned to the fixed sentence element obtained from the result of the morphological analysis, together with dictionary information such as part of speech and translation, and the process proceeds to S600. The reason why the dictionary information such as the part of speech and the translated word is added is to continue the normal translation process when the sentence is not put together as a fixed phrase during the analysis process. Note that S560, S570, S58
The procedure 0 is executed by the fixed sentence dividing program 216 which is the fixed sentence dividing means of the present invention. In S600,
At the end of the fixed phrase element, add punctuation marks, colons, semicolons, line feed codes, etc., which are sentence breaks, and information that the polite auxiliary words "is" and "mas" can be connected.
The process moves to S610.

【0040】S610では、上記の各ステップで得た定
型見出文、定型文要素、辞書情報、定型文要素ID、定
型訳文を定型文データ記憶部16の各フィールド40、
42、44、46、48へ登録して、S510へ移行す
る。これらの接続情報は、形態素解析実行時に入力文の
真ん中で検索されることがないようにするためである。
このS590、S600、S610の手順が、本発明の
定型文要素記録手段である定型文要素記録プログラム2
18により実行されている。
In S610, the fixed phrase sentence, the fixed phrase element, the dictionary information, the fixed phrase element ID, and the fixed translation obtained in each of the above steps are stored in each field 40 of the fixed phrase data storage unit 16,
42, 44, 46, and 48 are registered, and the process proceeds to S510. These pieces of connection information are for preventing a search in the middle of the input sentence during the execution of the morphological analysis.
The procedures of S590, S600, and S610 correspond to the fixed phrase element recording program 2 which is the fixed phrase element recording means of the present invention.
18.

【0041】S510において、見出語と品詞が入力さ
れなかった時(S510:NO)、この処理を終了す
る。
In S510, when the headword and the part of speech have not been input (S510: NO), this processing ends.

【0042】次に、図4に示すフローチャート中のS1
60において実行され、入力文(日本語の原文)から出
力文(英語の訳文)に翻訳する翻訳処理について、図6
に示すフローチャートに従って説明する。
Next, S1 in the flowchart shown in FIG.
FIG. 6 shows a translation process executed in step S60 for translating an input sentence (Japanese original sentence) into an output sentence (English translated sentence).
This will be described according to the flowchart shown in FIG.

【0043】まず、S250では、形態素解析プログラ
ム206の予め定められた判断規則と翻訳辞書12内の
接続情報と、定型文データ記憶部16を用いて、定型
文、あるいは入力文を構成する単語について翻訳辞書1
2及び定型文データ記憶部16を検索する。定型見出文
が検索できたものは、定型訳文を形態素解析結果に付与
し、翻訳辞書12の見出語が検索できたものに対して、
訳語、品詞、といった検索情報を形態素解析結果に付与
する形態素解析処理を実行する。もし、ユーザ辞書、専
門辞書を利用する場合は、ユーザ辞書、専門辞書、基本
辞書の順に優先される。このS250の手順が本発明の
形態素解析手段としての形態素解析プログラム206に
より実行される。
First, in S250, using the predetermined judgment rule of the morphological analysis program 206, the connection information in the translation dictionary 12, and the fixed sentence data storage unit 16, the fixed sentence or the words constituting the input sentence are used. Translation dictionary 1
2 and the fixed phrase data storage unit 16 are searched. In the case where the fixed entry was found, the fixed translation was added to the morphological analysis result.
A morphological analysis process is performed for adding search information such as a translation word and a part of speech to the morphological analysis result. If a user dictionary and a specialized dictionary are used, priority is given to the user dictionary, the specialized dictionary, and the basic dictionary in this order. The procedure of S250 is executed by the morphological analysis program 206 as the morphological analysis means of the present invention.

【0044】S250における形態素解析処理の結果を
受け取り、S260では、構文解析手段である構文解析
プログラム208により、外部記憶装置4の翻訳辞書1
2の文法部に格納されている予め定められた解析文法を
用いて、日本語の構造を解析する解析の手順を実行す
る。これが終了するとS400へ移行する。S400で
は、入力文が定型見出文であったか否かを検出する。定
型見出文であった場合(S400:YES)、S410
へ移行する。S410では、定型訳文へ置き換えて、こ
の入力文の翻訳処理を終了する。
In step S260, the result of the morphological analysis process is received. In step S260, the translation dictionary 1 in the external storage device 4 is transmitted by the syntax analysis program 208 as a syntax analysis unit.
Using a predetermined analysis grammar stored in the second grammar section, an analysis procedure for analyzing a Japanese structure is executed. When this is completed, the process moves to S400. In S400, it is detected whether or not the input sentence is a fixed entry sentence. If it is a fixed entry (S400: YES), S410
Move to. In S410, the input sentence is replaced with the fixed-form translation, and the translation process of the input sentence ends.

【0045】定型見出文でなかった場合(S400:N
O)、S420へ移行する。S420では、形態素解析
結果の先頭の見出語が、定型見出文の最初の定型文要素
であるか否かを検出する。定型文要素であった場合(S
420:YES)、S430へ移行する。
If it is not a fixed entry (S400: N
O), proceed to S420. In S420, it is detected whether or not the head entry of the morphological analysis result is the first fixed sentence element of the fixed head sentence. If it is a fixed phrase element (S
420: YES), and proceeds to S430.

【0046】S430では、定型文要素IDの並びが適
当か否かを検出する。この時、例えば、用言の直後に定
型文要素IDではない助動詞が入っていても良い。ま
た、格助詞の直後や、またはそのかわりに副助詞が出現
していても良い。この場合、例えばIDを有する本来の
格助詞が、副助詞に置換わっていたとしても、大きな意
味の変化がないので、IDを持たない副助詞が出現した
場合は、本来のIDを持った格助詞と置換可能と判断し
てこの部分についてはIDが連続したとみなし、次のI
Dを検出する。但し、この部分が、動詞や名詞だった場
合は、置換えることにより意味が大きく変動すると予想
され、また接続関係も異なってくることから、置換不可
能と判断して、IDが連続しないと判断して(S43
0:NO)定型文としての処理はしないで、通常の解析
処理であるその他の解析処理(S265)に移行する。
定型文要素IDが連続している場合、または連続してい
るとみなされた場合、S440へ移行する。S440で
は、本来の定型見出文のかたちにまとめ、定型文要素で
はない助動詞、副助詞などの要素を除き、S450へ移
行する。S450では、まとめあげられた本来の定型見
出文を対応する定型訳文へ置き換えて、S460へ移行
する。S460では、定型文要素ではない助動詞、副助
詞などを、ユーザに分かりやすい情報に変更して、定型
訳文に補助情報として付与して、この入力文の翻訳処理
を終了する。このS460の手順は本発明の訳文生成補
助手段として訳文生成補助プログラム219により実行
されている。また、S440の手順はまとめあげ手段で
あるまとめあげプログラムにより実行され、S410、
S450の手順は置換手段である置換プログラムにより
実行されている。これら、まとめあげプログラム、置換
プログラムは形態素解析プログラム206の一部であ
る。
At S430, it is detected whether the arrangement of the fixed phrase element IDs is appropriate. At this time, for example, an auxiliary verb other than the fixed phrase element ID may be included immediately after the declinable word. In addition, an auxiliary particle may appear immediately after the case particle or instead of the case particle. In this case, for example, even if an original case particle having an ID is replaced with a sub-particle, there is no significant change in meaning. Therefore, when a sub-particle without an ID appears, the case having the original ID is used. It is determined that the ID can be replaced with the particle, and it is considered that the ID is continuous for this part.
D is detected. However, if this part is a verb or a noun, it is expected that the meaning will fluctuate greatly by replacement, and the connection relationship will also be different. (S43
0: NO) The process proceeds to another analysis process (S265), which is a normal analysis process, without performing the process as a fixed phrase.
When the fixed phrase element IDs are continuous or when it is determined that they are continuous, the process proceeds to S440. In step S440, the process goes to step S450, excluding elements such as auxiliary verbs and sub-particles that are not fixed phrase elements. In S450, the original fixed heading sentence that has been put together is replaced with the corresponding fixed translation, and the process proceeds to S460. In step S460, auxiliary verbs, sub-particles, etc., which are not fixed phrase elements, are changed to information that can be easily understood by the user, added to the fixed translation as auxiliary information, and the input sentence translation process ends. The procedure of S460 is executed by the translated sentence generation auxiliary program 219 as the translated sentence generation auxiliary means of the present invention. The procedure of S440 is executed by a grouping program as a grouping unit.
The procedure of S450 is executed by a replacement program that is a replacement unit. These grouping program and replacement program are a part of the morphological analysis program 206.

【0047】入力文が定型見出文でなかった場合(S4
00:NO)、または、形態素解析結果の先頭の見出語
が、定型見出文の最初の定型文要素でなかった場合(S
420:NO)、また、定型文要素IDが確実に連続し
ていなかった場合(S430:NO)、定型文を用いな
い通常の入力文と同様、その他の翻訳処理を行うためS
265へ移行し、通常の解析処理を続行して、S270
へ移行する。
When the input sentence is not a fixed entry sentence (S4
00: NO) or when the head entry of the morphological analysis result is not the first fixed sentence element of the fixed head sentence (S:
420: NO) Also, if the fixed phrase element IDs are not reliably consecutive (S430: NO), S is used to perform other translation processing as in the case of a normal input sentence not using fixed phrases.
The process proceeds to H.265, and normal analysis processing is continued, and S270 is performed.
Move to.

【0048】続くS270では、変換手段である変換プ
ログラム210により外部記憶装置4の翻訳辞書12の
文法情報に格納されている予め定められた変換文法を用
いて、解析処理により解析された日本語の構造を英語の
構造に変換すると共に、個々の単語を英語に置き換える
変換の手順を実行する。続くS280では、生成手段で
ある生成プログラム212によりROM20に格納され
ている予め定められた生成文法を用いて、変換処理によ
り変換された英語の構造から英語の語順を決定したり、
英語に特有の冠詞を生成したり、入力文に存在しなくて
も出力文には必須の主語を補充したり、テンス、アスペ
クト、人称及び数素性等を処理し、英語の単語列からな
る出力文を生成する生成処理の手順が実行される。そし
て、S290では、ROM20の生成プログラム212
に格納されている予め定められた形態素生成規則を用い
て、S280の生成処理により生成された英語の単語列
に対して、名詞の複数形、動詞の過去、過去分詞等の活
用形を生成して、出力文を得る形態素生成処理を実行し
て翻訳処理を終了する。
At S 270, the conversion program 210, which is the conversion means, uses the predetermined conversion grammar stored in the grammar information of the translation dictionary 12 of the external storage device 4 to convert the Japanese language analyzed by the analysis process. Perform the conversion procedure to convert the structure to English structure and replace individual words with English. In S280, using the predetermined generation grammar stored in the ROM 20 by the generation program 212 as the generation means, the English word order is determined from the English structure converted by the conversion processing,
Generates articles unique to English, supplements essential subjects in output sentences even if they do not exist in the input sentence, processes tense, aspect, person and numerical features, etc., and outputs an English word string A procedure of a generation process for generating a sentence is executed. Then, in S290, the generation program 212 of the ROM 20
Using a predetermined morpheme generation rule stored in the above, a plural form of a noun, a past verb, and an inflected form such as a past participle are generated for the English word string generated by the generation process of S280. Then, a morpheme generation process for obtaining an output sentence is executed, and the translation process ends.

【0049】ここで、上述した機械翻訳処理においてな
される処理について、例文を挙げて説明する。
Here, the processing performed in the above-described machine translation processing will be described with reference to example sentences.

【0050】例えば、図3に示してあるように、活用す
る部分を含まず、常に同じ表現を用いる例として、「拝
啓、貴社ますますご清栄のこととお慶び申し上げます」
を登録する場合を例に挙げる。
For example, as shown in FIG. 3, as an example of always using the same expression without using the parts to be used, "Dear sir, I am grateful to your company for being more and more prosperous."
An example of registering is described.

【0051】もし、上記の日本文が定型見出文として登
録していなければ、機械翻訳の原則に則り、字面通りの
翻訳を行うため、”It is glad that
Dear, your company are mo
re well and prospering.”と
いう英文としてはきわめて不自然な翻訳を行ってしま
う。これを、英語の習慣に則った”Dear Sir
s,”になるように定型文データとして登録するとす
る。
If the Japanese sentence is not registered as a fixed head sentence, the translation is performed literally in accordance with the principle of machine translation, so that "It is glad that"
Dear, your company are mo
re well and prospering. "It's a very unnatural translation for the English sentence. This is in line with English customs," Dear Sir
Suppose that it is registered as fixed phrase data so that "s," is obtained.

【0052】定型文編集処理S200のS510におい
て、定型見出文として「拝啓、貴社ますますご清栄のこ
ととお慶び申し上げます」が入力される。これはS52
0で未登録であるとし(S520:NO)、S530へ
移行する。ここで見出語訳文”Dear Sirs,”
が入力されて、S550へ移行する。この場合、「〜申
し上げる」というような言い方は存在しないので、この
まま全体一致の定型見出文でよいので(S550:YE
S)、そのままS590、S610へ移行する。S61
0で定型文データ記憶部16の定型見出文フィールド4
0と定型訳文フィールド48へ登録して、S510へ戻
る。さらに次の定型見出文が入力されなければ(S51
0:NO)、定型文編集処理を終了する。
In step S510 of the standard sentence editing process S200, "Dear sir, I am grateful to you for your continued pleasure" is input as a standard heading. This is S52
If it is not registered at 0 (S520: NO), the process proceeds to S530. Here, the headword translation “Dear Sirs,”
Is input, and the flow shifts to S550. In this case, there is no such a phrase as “to say”, so a fixed heading sentence that matches the whole can be used as it is (S550: YE
S), the process proceeds directly to S590 and S610. S61
0, the fixed sentence field 4 of the fixed sentence data storage unit 16
0 is registered in the fixed translation field 48, and the process returns to S510. If the next fixed heading is not input (S51)
0: NO), and ends the fixed phrase editing process.

【0053】この状態で入力文「拝啓、貴社ますますご
清栄のこととお慶び申し上げます。」に対して、ユーザ
により入力部2から翻訳処理S160が実行される。
In this state, a translation process S160 is executed by the user from the input unit 2 for the input sentence "Dear sir, I am grateful to you for your continued pleasure."

【0054】まずS250において、形態素解析処理で
定型見出文が検索され、形態素解析結果「拝啓、貴社ま
すますご清栄のこととお慶び申し上げます<定型見出文
>/。<句点>」を得、S260、S400へ移行す
る。S400では、定型見出文が検索されているので
(S400:YES)、S410へ移行する。S410
では、そのまま定型訳文に置き換えられて、この入力文
に対する翻訳処理を終了する。
First, in S250, a morphological analysis process is performed to search for a typical headline sentence, and the morphological analysis result is obtained, "Dear Sirs, I am grateful that your company is becoming more and more prosperous <typical headline> /. <Phrase >>. , S260, and S400. In S400, since the fixed entry is searched (S400: YES), the process proceeds to S410. S410
Then, the input sentence is replaced with the fixed translation and the translation process for the input sentence ends.

【0055】次に別の例文として、図3に示してあるよ
うに、活用する部分を含む「角縫い時に糸のたるみが発
生する」を登録した場合を例に挙げる。これは、翻訳し
たいテキスト内の入力文の表現として、「発生します」
または「発生いたします」等の表現が可能である。ま
た、否定文「発生しない」や、副助詞を伴う「糸のたる
みも発生する」なども入力文として想定可能である。こ
の文章は、工業用ミシンのマニュアル文のトラブルシュ
ーティングで頻出する表現であるが、ユーザが「角縫
い”corner stitching”」をユーザ辞
書に登録してあったとしても、そのまま機械翻訳システ
ムで翻訳すると”During the corner
stitching, looseness of
the thread occurs.”となり、所望
する英文”Improper upper threa
d tension at the corner
s.”を得ることはできない。これは、決まり文句とし
て登録するべき表現である。
Next, as another example sentence, as shown in FIG. 3, a case will be described in which "thread slack occurs at the time of square sewing" including a part to be utilized is registered. This "occurs" as a representation of the input sentence in the text you want to translate
Or, an expression such as "will occur" can be used. In addition, a negative sentence “does not occur” or a “slack of thread also occurs” accompanied by an auxiliary particle can be assumed as an input sentence. This sentence is frequently used in troubleshooting of manual sentences of industrial sewing machines. Even if the user registers “corner stitching” in the user dictionary, if this is translated by the machine translation system as it is. "During the corner
stitching, looseness of
the thread occurs. "Is the desired English sentence" Imper upper upper
d tension at the corner
s. Cannot be obtained. This is an expression that should be registered as a cliche.

【0056】定型文編集処理S200のS510におい
て、定型見出文として「角縫い時に糸のたるみが発生す
る」が入力される。これは未登録であるとし、S530
へ移行する。ここで見出語訳文”Improper u
pper thread tension at th
e corners.”が入力されて、S550へ移行
する。この場合、助動詞や副助詞が出現する表現が存在
するので、S550:NOであり、S560へ移行す
る。S560では、今回の登録が新規であるので、S5
60:YESであり、S570へ移行する。S570で
は、形態素解析を行い、その結果定型文要素「角縫い
(名詞)」「時(名詞)」「に(格助詞)」「糸(名
詞)」「の(格助詞)」「たるみ(名詞)」「が(格助
詞)」「発生する(動詞)」を得る。このように各要素
に分割するのは、各格助詞の直後、または格助詞の代わ
りに副助詞が出現しても良いとか、文末は動詞で、助動
詞が後ろに出現しても良いからである。次のS580で
は、それぞれに定型文要素IDを付与し、S590、S
610で定型文データ記憶部16の定型見出文フィール
ド40と定型文要素フィールド42、定型文要素IDフ
ィールド46、定型訳文フィールド48へ登録して、S
510へ戻る。さらに次の定型見出文が入力されなけれ
ば(S510:NO)、定型文編集処理を終了する。
In step S510 of the standard sentence editing process S200, "slack of thread occurs at the time of corner stitching" is input as a standard heading sentence. This is assumed to be unregistered, and S530
Move to. Here, the headword translation "Imperper u
paper thread tension at th
e corners. Is input and the process proceeds to S550. In this case, since there is an expression in which an auxiliary verb or an auxiliary particle appears, S550 is NO and the process proceeds to S560. In S560, since the current registration is new, S5
60: YES, proceeding to S570. In S570, morphological analysis is performed, and as a result, the fixed phrase elements “square stitch (noun)” “time (noun)” “ni (case particle)” “thread (noun)” “no (case particle)” “sag (noun) ), “Ga (case particle)” and “occurs (verb)”. The reason for dividing into elements in this way is that the auxiliary particle may appear immediately after each case particle or in place of the case particle, or that the sentence end is a verb and the auxiliary verb may appear later. . In the next S580, a fixed phrase element ID is assigned to each, and S590, S
At step 610, the standard sentence field 40, the standard sentence element field 42, the standard sentence element ID field 46, and the standard translation field 48 of the standard sentence data storage unit 16 are registered.
Return to 510. If the next fixed entry is not input (S510: NO), the fixed sentence editing process ends.

【0057】この状態で入力文「角縫い時に糸のたるみ
も発生します。」に対して、ユーザにより入力部2から
翻訳処理S160が実行される。
In this state, a translation process S160 is executed by the user from the input unit 2 for the input sentence "a slack of the thread also occurs at the time of square sewing".

【0058】まずS250において、形態素解析処理で
定型見出文が検索されずに、定型文要素が検索され、形
態素解析結果「角縫い<名詞・定型文要素>/時<名詞
・定型文要素>/に<格助詞・定型文要素>/糸<名詞
・定型文要素>/の<格助詞・定型文要素>/たるみ<
名詞・定型文要素>/も<副助詞>/発生する<動詞・
定型文要素>/ます<助動詞>/。<句点>」を得、S
260、S400へ移行する。S400では、定型見出
文が検索されていないので(S400:NO)、S42
0へ移行する。S420では、「角縫い」が定型見出文
の先頭の定型文要素であり(S420:YES)、ま
た、S430では、その後方の要素がすべて揃っている
ことを定型文要素IDにより検出する。この場合、定型
文要素は、「角縫い」「時」「に」「糸」「の」「たる
み」「発生する」であり、IDを持った単語が欠如して
おりIDが連続しない部分や、最終IDの後にも単語が
付属している。S430で、定型文要素以外の要素であ
る「も<副助詞>」と、「ます<助動詞>」を抽出する
が、IDを有する「が」は「も」に置換可能であり、
「ます」は付属しても意味の上では等価であるため、I
Dは文末までOKとみなされ(S430:YES)、S
440でまとめあげられて、元の定型見出文が再び生成
され、S450で、元の定型見出文に対応する定型訳文
に置き換えられる。この際にS460で、副助詞「も」
が入力文中に存在したことを補助情報として付与され、
この入力文に対しては翻訳処理を終了する。ユーザは表
示部6で出力文”Improper upper th
read tension atthe corner
s.(も)”を見て、例えば、”Also, impr
oper upper thread tension
at the corners.”などと後編集を行
う。この時、助動詞「ます」は、英文にとっては不要な
情報であるので、あえてユーザに対して補助情報として
は提示しない。
First, in S250, the morphological analysis processing does not search for a fixed-form head sentence, but instead searches for a fixed-form sentence element. The result of the morphological analysis is "square stitch <noun / fixed-statement element> / time <noun / fixed-statement element> / To <case particle / formal sentence element> / thread <noun / formal sentence element> / of <case particle / formal sentence element> / sag
Noun / fixed sentence element> / also <adjunct particle> / occurs <verb /
Fixed phrase element> / Masu <Auxiliary verb> /. <Period> ”and S
260, proceed to S400. In S400, since the standard entry has not been searched (S400: NO), S42
Move to 0. In S420, "square stitching" is the first fixed sentence element of the fixed entry (S420: YES), and in S430, it is detected from the fixed sentence element ID that all the elements behind it are aligned. In this case, the standard sentence elements are “square stitching”, “time”, “ni”, “thread”, “no”, “sag”, and “occur”. , Words are attached after the final ID. In S430, "mo <sub-particle>" and "mas <auxiliary verb" which are elements other than the fixed phrase element are extracted, but "ga" having an ID can be replaced with "mo",
Since "masu" is semantically equivalent even if attached,
D is considered OK until the end of the sentence (S430: YES), and S
The original fixed entry is compiled again at 440, and is replaced with the fixed translation corresponding to the original fixed entry at S450. At this time, in S460, the auxiliary particle "mo"
Is added as supplementary information that exists in the input sentence,
The translation process ends for this input sentence. The user displays the output sentence “Imper upper th on the display unit 6.
read tension at the corner
s. (Also, impr)
upper upper thread tension
at the corners. At this time, the auxiliary verb "Masu" is unnecessary information for an English sentence, and is not intentionally presented to the user as auxiliary information.

【0059】また、もしも、入力文が「....発生し
ない。」であれば、出力文に(ない)などの否定文であ
った情報を付与し、ユーザに提示する。ユーザはこれら
の情報を利用しながら、ある場合は定型訳文を効果的に
再編集し、ある場合はS550で全体一致の場合にのみ
定型文を利用できるような設定に変更することにより、
その後の翻訳処理の高精度化と、後編集の効率化をはか
ることができる。
If the input sentence is "... does not occur", the output sentence is provided with information that is a negative sentence such as (none) and is presented to the user. In some cases, the user effectively re-edits the fixed phrase while utilizing the information, and in some cases, changes the setting so that the fixed phrase can be used only in the case of overall matching in S550.
It is possible to improve the accuracy of the subsequent translation processing and increase the efficiency of post-editing.

【0060】尚、本発明を1の実施の形態により説明し
たが、本発明は、上記した実施の形態に限定されるもの
ではなく、種々の変更を加えることができる。例えば、
今回は、補助情報として可能な副助詞、助動詞の値はシ
ステム内部のS440のまとめあげの手順、S460の
補助情報付与の手順における内部処理で決めて行った
が、ユーザインターフェースのメニューの中に設定でき
るようにしてもよい。例えば、CRTの画面上で見出語
が動詞の命令形であった場合で、「て下さい」が入力文
に出現した場合、補助情報として出力するか否かなどを
マウス操作で指定できるようなものである。定型文は完
璧な翻訳が不可能である機械翻訳システムには救いであ
るが、同時に「やりすぎ」があっては不都合である。こ
れをユーザが細かくコントロールできるようにすれば、
ユーザの自由が広がり、翻訳精度の向上と後編集の大幅
な軽減が可能になる。
Although the present invention has been described with reference to one embodiment, the present invention is not limited to the above-described embodiment, and various modifications can be made. For example,
In this case, the values of the auxiliary particles and auxiliary verbs that can be used as auxiliary information are determined by the internal processing in the procedure for summarizing S440 in the system and the procedure for adding auxiliary information in S460, but can be set in the menu of the user interface. You may do so. For example, if the headword is in the verb imperative form on the screen of the CRT, and "Tetsu" appears in the input sentence, it is possible to specify with the mouse operation whether or not to output as auxiliary information. Things. Boilerplate sentences are a rescue for machine translation systems where perfect translation is not possible, but at the same time it is inconvenient if there is too much. If you give users fine control over this,
The freedom of the user is expanded, and the translation accuracy can be improved and post-editing can be greatly reduced.

【0061】更に、本実施の形態の機械翻訳装置は、R
OM20に制御プログラム202、翻訳プログラム20
4、形態素解析プログラム206、構文解析プログラム
208、変換プログラム210、生成プログラム21
2、定型文編集プログラム214、定型文分割プログラ
ム216、定型文要素記録プログラム218などが格納
されている。これらのほかにも細かく分ければ辞書編集
プログラム、品詞判定プログラム、見出語分割プログラ
ム、判定プログラム、前後判断プログラム、見出語復活
プログラムがROMに予め格納されたものであるが、本
発明は必ずしもこれに限定されるものではない。例え
ば、これらのプログラムをフロッピーディスクやCD−
ROMなどに格納したものを読み取り装置により読み取
って直接またはハードディスクなどにインストールさせ
て動作させることができる。また、有線もしくは無線回
線を使用して外部情報処理装置からプログラムを読み込
んで動作させることもできる。この場合、前記フロッピ
ーディスクやCD−ROMや、外部情報処理装置である
ハードディスクや、当該プログラムを格納したメモリが
本発明の記録媒体を構成することとなる。
Further, the machine translation apparatus of the present embodiment
OM 20 has control program 202 and translation program 20
4. Morphological analysis program 206, syntax analysis program 208, conversion program 210, generation program 21
2, a fixed sentence editing program 214, a fixed sentence division program 216, a fixed sentence element recording program 218, and the like. In addition to these, the dictionary editing program, the part-of-speech determination program, the headword division program, the determination program, the before / after determination program, and the headword resurrection program are stored in the ROM in advance. It is not limited to this. For example, these programs are stored on a floppy disk or CD-
What is stored in a ROM or the like can be read by a reading device and installed directly on a hard disk or the like to operate. In addition, a program can be read from an external information processing device using a wired or wireless line and operated. In this case, the above-mentioned floppy disk, CD-ROM, hard disk which is an external information processing device, and a memory storing the program constitute a recording medium of the present invention.

【0062】また、本実施の形態のようにプログラムが
明確に区別されて格納されていなくても、要は特許請求
の範囲の記載の機械翻訳装置及び機械翻訳処理プログラ
ムの機能を発揮すればよい。
Further, even if the programs are not clearly distinguished and stored as in the present embodiment, the functions of the machine translation device and the machine translation processing program described in the claims may be achieved. .

【0063】本実施の形態では、原言語は日本語を例に
説明したが、原言語は日本語に限るものではない。それ
ぞれの言語の持つ文法の許容範囲内で定型表現の幅を吸
収しこれを定型文として処理し、ユーザに分かり易い形
で表示することが可能であれば、言語の種類は問うもの
ではない。
In the present embodiment, the source language has been described using Japanese as an example, but the source language is not limited to Japanese. The type of language does not matter as long as the width of the fixed expression can be absorbed within the allowable range of the grammar of each language, processed as a fixed sentence, and displayed in a form that is easy for the user to understand.

【0064】また、目的言語も、英語に限らず、本発明
の適用が困難なほど文法構造が異ならない限り各国語に
その適用は可能である。
The target language is not limited to English, and can be applied to various languages as long as the grammatical structure is not so different that application of the present invention is difficult.

【0065】入力手段は、キーボードを例に挙げたが、
もちろん有線、無線を問わず赤外線、音声、各種記録媒
体など如何なるものであっても、コンピュータに入力が
可能であればよい。
The input means is exemplified by a keyboard.
It goes without saying that any type of recording medium, such as infrared rays, voice, and various recording media, whether wired or wireless, may be input to the computer.

【0066】また、表示手段もCRTに限らず、液晶デ
ィスプレーは言うまでもなく、音声など如何なる表示方
法であっても良く、印刷手段はその有無を問わない。
Further, the display means is not limited to the CRT, but may be any display method such as sound, not to mention a liquid crystal display.

【0067】[0067]

【発明の効果】以上説明したことから明かなように、請
求項1に記載の機械翻訳装置によれば定型文を自由に追
加、修正して定型文データ記憶手段に登録でき、この定
型文データ記憶手段に格納されたデータにより、原言語
を目的言語に機械翻訳する場合に、ですます調や、だで
ある調などで言い表される敬体・常体の違いや、活用の
違いがあったり、助動詞が付加されているような場合で
あっても定型文と認識させ、これを所定の定型訳文に翻
訳することができ、この定型訳文をそのまま或いは僅か
な修正をするだけで高品質な翻訳を得ることができると
いう効果がある。そのため、僅かな違いから定型文と認
識されず、本来の機械翻訳がされて翻訳の品質が下がり
翻訳をやり直すようなことがないので機械翻訳後の後編
集が極めて容易になる一方で、高品質の翻訳結果を得る
ことが出来るという効果がある。
As is apparent from the above description, according to the machine translation device of the first aspect, fixed form sentences can be freely added and corrected and registered in the fixed form data storage means. When the source language is machine-translated into the target language based on the data stored in the storage means, there are differences between the polite and ordinary forms expressed in the tonality, the tonality, etc., and the difference in utilization. Or even if an auxiliary verb is added, it can be recognized as a fixed phrase, and can be translated into a predetermined fixed translation. There is an effect that a translation can be obtained. Therefore, it is not recognized as a fixed sentence due to a slight difference, and the original machine translation is not performed, and the quality of the translation is not reduced. There is an effect that a translation result can be obtained.

【0068】また、定型文として処理できれば、翻訳処
理の高速化も達成できるという効果もある。
Further, if it can be processed as a standard sentence, there is an effect that the speed of the translation process can be increased.

【0069】また、請求項2に記載の機械翻訳装置によ
れば、定型文に一般要素である助動詞などが付加され、
意味が多少異なるような場合であっても、これを定型文
として認識し、これを一旦定型訳文にし、同時に付加さ
れた訳文生成補助情報を表示装置に表示するため、全文
を通常の機械翻訳をした場合のように翻訳し直すことな
く、訳文生成補助情報を参考に定型訳文を僅かに修正す
るだけで品質の高い翻訳とすることができる。そのた
め、翻訳忘れもなくなり効率的に高品質の訳文を短時間
に得ることができるという効果がある。
According to the machine translation device of the second aspect, an auxiliary verb or the like which is a general element is added to a fixed phrase,
Even if the meaning is slightly different, it is recognized as a fixed phrase, and once converted to a fixed phrase, and at the same time, the added translation information generation auxiliary information is displayed on the display device. A high-quality translation can be achieved by slightly modifying the fixed-form translation with reference to the translation generation assistance information without retranslating as in the case where the translation is performed. Therefore, there is an effect that the translation is not lost and a high-quality translated sentence can be efficiently obtained in a short time.

【0070】請求項3に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体によれ
ば、コンピュータに、定型文を自由に追加、修正して定
型文データ記憶手段に登録する手順を実行させることが
でき、この定型文データ記憶手段に格納されたデータに
より、原言語を目的言語に機械翻訳する場合に、ですま
す調や、だである調などで言い表される敬体・常体の違
いや、活用の違いがあったり、助動詞が付加されている
ような場合であっても定型文と認識させ、これを所定の
定型訳文に翻訳する手順を実行させることができ、この
定型訳文をそのまま或いは僅かな修正をするだけで高品
質な翻訳を得ることができるという効果がある。そのた
め、僅かな違いから定型文と認識されず、本来の機械翻
訳がされて翻訳の品質が下がり翻訳をやり直すようなこ
とがないので、機械翻訳後の後編集が極めて容易になる
一方で、高品質の翻訳結果を得ることが出来るという効
果がある。
According to the computer-readable recording medium on which the machine translation processing program according to the third aspect is recorded, the procedure for freely adding and correcting fixed phrases in the computer and registering them in the fixed phrase data storage means is executed. When the source language is machine-translated into the target language by using the data stored in the fixed-form sentence data storage means, the polite / ordinary body is expressed in the form of a key or a key. Even if there is a difference in usage, a difference in usage, or an auxiliary verb is added, it can be recognized as a fixed phrase and a procedure for translating this into a predetermined fixed translation can be executed. There is an effect that a high-quality translation can be obtained by simply or slightly modifying. For this reason, it is not recognized as a fixed sentence due to a slight difference, and the original machine translation is not performed, so that the quality of the translation does not deteriorate and the translation is not redone. There is an effect that quality translation results can be obtained.

【0071】また、定型文として処理できれば、翻訳処
理の高速化も達成できるという効果もある。
Further, if it can be processed as a standard sentence, there is an effect that the speed of the translation process can be increased.

【0072】請求項4に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体によれ
ば、コンピュータに、定型文に一般要素である助動詞な
どが付加され、意味が多少異なるような場合であって
も、これを定型文として認識し、これを一旦定型訳文に
し、同時に表示される訳文生成補助情報により全文を通
常の機械翻訳をした場合に、訳文生成補助情報を表示装
置に表示する手順を実行させることができるため、すべ
て翻訳し直すことなく、この情報を参考に定型訳文を僅
かに修正するだけで品質の高い翻訳とすることができる
という効果がある。そのため、効率的に高品質の訳文を
短時間に得ることができるという効果がある
According to the computer-readable recording medium on which the machine translation processing program according to claim 4 is recorded, an auxiliary verb or the like which is a general element is added to a fixed sentence, and the meaning is slightly different. Even if there is, a procedure for recognizing this as a fixed phrase, temporarily converting it to a fixed phrase, and displaying the translated sentence generation auxiliary information on the display device when the entire sentence is subjected to normal machine translation by the translated sentence generation auxiliary information displayed at the same time Can be executed, and there is an effect that a high quality translation can be obtained by only slightly correcting the standard translation with reference to this information without retranslation. Therefore, there is an effect that a high-quality translation can be efficiently obtained in a short time.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施の形態の機械翻訳装置の全体構成を示す
ブロック図である。
FIG. 1 is a block diagram illustrating an overall configuration of a machine translation device according to an embodiment.

【図2】本実施の形態の辞書のデータの構成の説明図で
ある。
FIG. 2 is an explanatory diagram of a configuration of dictionary data according to the present embodiment.

【図3】本実施の形態の定型文データ記憶手段のデータ
の構成の説明図である。
FIG. 3 is an explanatory diagram of a data configuration of a fixed form data storage unit according to the present embodiment.

【図4】本実施の形態の機械翻訳装置の処理の流れを表
わすフローチャートである。
FIG. 4 is a flowchart illustrating a processing flow of the machine translation device according to the present embodiment.

【図5】本実施の形態の機械翻訳装置の定型文編集処理
の流れを表わすフローチャートである。
FIG. 5 is a flowchart showing the flow of a fixed sentence editing process of the machine translation device of the present embodiment.

【図6】本実施の形態の機械翻訳装置の翻訳処理の流れ
を表わすフローチャートである。
FIG. 6 is a flowchart illustrating a flow of a translation process of the machine translation device according to the present embodiment.

【符号の説明】[Explanation of symbols]

2 入力部 4 外部記憶装置 6 表示部 7 表示制御部 10 制御部 12 翻訳辞書 16 定型文データ記憶部 18 CPU 20 ROM 22 RAM 204 翻訳プログラム 206 形態素解析プログラム 208 構文解析プログラム 210 変換プログラム 212 生成プログラム 214 定型文編集プログラム 216 定型文分割プログラム 218 定型文要素記録プログラム 219 訳文生成補助プログラム 222 作業領域 224 原言語文記憶領域 226 訳文記憶領域 2 input unit 4 external storage device 6 display unit 7 display control unit 10 control unit 12 translation dictionary 16 fixed sentence data storage unit 18 CPU 20 ROM 22 RAM 204 translation program 206 morphological analysis program 208 syntax analysis program 210 conversion program 212 generation program 214 Fixed sentence editing program 216 Fixed sentence division program 218 Fixed sentence element recording program 219 Translation sentence generation auxiliary program 222 Work area 224 Source language sentence storage area 226 Translated sentence storage area

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 原言語文を入力する入力手段と、 前記入力手段により入力された原言語文を記憶する原言
語文記憶手段と、 原言語による見出語、前記見出語の品詞、前記見出語に
対応する目的言語の訳語を含む単語情報と、形態素解析
処理に必要な接続情報を含む文法情報とを格納している
翻訳辞書と、 前記原言語の任意の語句の並びである定型見出文と、前
記定型見出文に対応する目的言語の訳語句の並びである
定型訳文との対からなる定型文データを複数記憶した定
型文データ記憶手段と、 前記翻訳辞書と前記定型文データ記憶手段を用いて、前
記原言語文について前記見出語と前記定型見出文とを検
索することにより形態素解析を行う形態素解析手段と、
前記形態素解析手段により与えられた前記原言語文の形
態素解析の結果に基づいて構文解析を行う構文解析手段
とを有し、前記原言語文を目的言語文に翻訳する翻訳手
段と、 最終訳文である前記目的言語文を表示する表示手段とを
備えた機械翻訳装置であって、 前記定型文データ記憶手段は、新たな定型文データを追
加して登録し、又は既に登録されている定型文データを
修正して登録をする定型文編集手段を有し、 前記定型文編集手段は、新たに追加され又は修正された
前記定型見出文と前記定型訳文の対からなる定型文デー
タを登録する際に、前記形態素解析手段により前記定型
見出文の形態素解析を行ない、その結果に基づき前記登
録される定型見出文を見出語としての定型文要素と、定
型文要素以外の一般要素に分割する定型文分割手段と、 前記定型文分割手段により前記定型見出文が定型文要素
と一般要素とに分割された場合、前記定型文要素のみを
使用して定型見出文にまとめるまとめあげ手段と、 前記まとめあげ手段によりまとめあげられた定型見出文
を、当該定型見出文に対応する前記定型訳文に置換える
置換手段とを備えた機械翻訳装置。
An input unit for inputting a source language sentence; a source language sentence storage unit for storing the source language sentence input by the input unit; a headword in the source language; a part of speech of the headword; A translation dictionary storing word information including a translation of the target language corresponding to the headword and grammatical information including connection information necessary for morphological analysis processing; and a fixed form which is an array of arbitrary phrases in the source language. A fixed sentence data storage unit storing a plurality of fixed sentence data each comprising a pair of an entry sentence and a fixed translation that is a sequence of translated phrases of the target language corresponding to the fixed entry, the translation dictionary and the fixed sentence A morphological analysis unit that performs a morphological analysis by searching the headword and the fixed headword for the source language sentence using a data storage unit;
A translation unit that performs a syntax analysis based on a result of the morphological analysis of the source language sentence given by the morphological analysis unit, and a translation unit that translates the source language sentence into a target language sentence; Display means for displaying the target language sentence, wherein the fixed form data storage means adds and registers new fixed form data, or the fixed form data already registered A fixed phrase editing means for correcting and registering the fixed phrase sentence data, wherein the fixed phrase editing means is for registering fixed phrase data comprising a pair of the newly added or corrected fixed phrase heading and the fixed phrase translation. Then, the morphological analysis unit performs a morphological analysis of the fixed-form head sentence, and divides the registered fixed-statement sentence into a fixed-form sentence element as a headword and a general element other than the fixed-form sentence element based on the result. Fixed phrase Means, when the fixed-form sentence is divided into a fixed-form sentence element and a general element by the fixed-form sentence dividing means, a consolidating means for consolidating the fixed-form sentence element into a fixed-form sentence only, and the consolidating means And a replacing means for replacing the standardized headline sentence compiled by the above with the standardized translation corresponding to the standard headline.
【請求項2】 前記一般要素を訳文生成補助情報として
前記定型訳文に付与する訳文生成補助情報記憶手段と、 前記表示手段に表示された前記定型訳文に関連させて、
前記訳文生成補助情報を前記表示手段で表示する訳文生
成補助情報表示制御手段とを備えたことを特徴とする請
求項1に記載の機械翻訳装置。
2. A translated sentence generation auxiliary information storage unit for adding the general element as the translated sentence generation auxiliary information to the fixed translation, and in association with the fixed translation displayed on the display unit,
2. The machine translation apparatus according to claim 1, further comprising a translation generation auxiliary information display control unit that displays the translation generation auxiliary information on the display unit.
【請求項3】 原言語文を目的言語文に翻訳するための
機械翻訳処理のための機械翻訳処理プログラムを記録し
た記録媒体であって、 コンピュータに、原言語文を入力する入力の手順と、 前記入力の手順により入力された原言語文を記憶する原
言語文記憶の手順と、 日本語による見出語、前記見出語の品詞、前記見出語に
対応する目的言語の訳語を含む単語情報と、形態素解析
処理に必要な接続情報を含む文法情報とを格納している
翻訳辞書と、前記原言語の任意の語句の並びである定型
見出文と、前記定型見出文に対応する目的言語の訳語句
の並びである定型訳文との対からなる定型文データを複
数記憶した定型文データ記録手段とを用いて、前記原言
語文について前記見出語と前記定型見出文とを検索する
ことにより形態素解析を行う形態素解析の手順と、前記
形態素解析の手順により与えられた前記原言語文の形態
素解析の結果に基づいて構文解析を行う構文解析の手順
とを有し、前記原言語文を目的言語文に翻訳する翻訳の
手順と、 最終訳文である前記目的言語文を表示する表示の手順と
を実行させる機械翻訳処理プログラムであって、 前記定型文データ記憶の手順は、新たな定型文データを
追加をして登録し、又は既に登録されている定型文デー
タを修正をして登録をする定型文編集の手順を有し、 前記定型文編集の手順は、新たに追加され又は修正され
た前記定型見出文と前記定型訳文の対からなる定型文デ
ータを登録する際に、前記形態素解析の手順により前記
定型見出文の形態素解析を行ない、その結果に基づき前
記登録される定型見出文を見出語としての定型文要素
と、定型文要素以外の一般要素に分割する定型文分割の
手順と、 前記定型文分割の手順により前記定型見出文が定型文要
素と一般要素とに分割された場合、前記定型要素のみを
使用して定型見出文にまとめるまとめあげの手順と、 前記まとめあげの手順によりまとめあげられた定型見出
文を、当該定型見出文に対応する前記定型訳文に置き換
える置換の手順とを実行させる機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体。
3. A recording medium on which a machine translation processing program for machine translation processing for translating a source language sentence into a target language sentence is recorded. A source language sentence storage procedure for storing the source language sentence input by the input procedure; a headword in Japanese; a part of speech of the headword; and a word including a target language translation corresponding to the headword. A translation dictionary storing information and grammatical information including connection information necessary for morphological analysis processing, a fixed-form heading that is a sequence of arbitrary words and phrases in the source language, and corresponding to the fixed-form heading. Using the fixed phrase data recording means storing a plurality of fixed phrase data, which are pairs of fixed translations, which are a sequence of translated phrases of the target language, the headword and the fixed headword for the source language sentence Perform morphological analysis by searching A morpheme analysis procedure, and a syntax analysis procedure for performing a syntax analysis based on a result of the morphological analysis of the source language sentence given by the morphological analysis procedure, wherein the source language sentence is converted into a target language sentence. A machine translation processing program for executing a translation procedure for translating and a display procedure for displaying the target language sentence that is the final translation, wherein the fixed form data storage procedure includes adding new fixed form data. And has the procedure of editing the fixed form data to correct the already registered fixed form data and register the fixed form data, wherein the fixed form editing procedure is newly added or corrected. When registering the fixed phrase data composed of pairs of the sentence and the fixed translation, the morphological analysis of the fixed phrase is performed by the morphological analysis procedure, and the registered fixed phrase is registered based on the result. Fixed form as a word Elements, a procedure for dividing a fixed sentence into general elements other than fixed-form elements, and when the fixed entry is divided into fixed-form elements and general elements by the fixed-segment division procedure, only the fixed elements are included. A machine that executes a grouping procedure of summarizing into a fixed form heading using the above, and a replacement procedure of replacing the fixed form heading assembled by the grouping procedure with the fixed form translation corresponding to the fixed heading sentence. A computer-readable recording medium on which a translation processing program is recorded.
【請求項4】 前記一般要素を訳文生成補助情報として
前記定型訳文に付与する訳文生成補助情報記憶の手順
と、 前記表示手段に表示された前記定型訳文に関連させて、
前記訳文生成補助情報を前記表示手段で表示する訳文生
成補助情報表示を制御する手順を実行することを特徴と
する請求項3に記載の機械翻訳処理プログラムを記録し
たコンピュータ読み取り可能な記録媒体。
4. A procedure for storing the translated sentence generation auxiliary information for adding the general element as the translated sentence generation auxiliary information to the fixed translation, and in association with the fixed translation displayed on the display means,
The computer-readable recording medium according to claim 3, wherein the computer-readable recording medium executes a procedure for controlling display of the translated sentence generation auxiliary information in which the display unit displays the translated sentence generation auxiliary information.
JP10103925A 1998-03-30 1998-03-30 Machine translation apparatus and computer-readable recording medium recording machine translation processing program Withdrawn JPH11282845A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10103925A JPH11282845A (en) 1998-03-30 1998-03-30 Machine translation apparatus and computer-readable recording medium recording machine translation processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10103925A JPH11282845A (en) 1998-03-30 1998-03-30 Machine translation apparatus and computer-readable recording medium recording machine translation processing program

Publications (1)

Publication Number Publication Date
JPH11282845A true JPH11282845A (en) 1999-10-15

Family

ID=14367016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10103925A Withdrawn JPH11282845A (en) 1998-03-30 1998-03-30 Machine translation apparatus and computer-readable recording medium recording machine translation processing program

Country Status (1)

Country Link
JP (1) JPH11282845A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657202A (en) * 2017-10-10 2019-04-19 北京国双科技有限公司 The method and device of text-processing

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657202A (en) * 2017-10-10 2019-04-19 北京国双科技有限公司 The method and device of text-processing
CN109657202B (en) * 2017-10-10 2022-10-28 北京国双科技有限公司 Text processing method and device

Similar Documents

Publication Publication Date Title
US6289302B1 (en) Chinese generation apparatus for machine translation to convert a dependency structure of a Chinese sentence into a Chinese sentence
JP2732563B2 (en) Machine translation method and apparatus
US7346488B2 (en) Automatic translator and computer-readable storage medium having automatic translation program recorded thereon
JPH11282845A (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JPS62271057A (en) Dictionary register system for translation device
JP3999771B2 (en) Translation support program, translation support apparatus, and translation support method
JP2626722B2 (en) Japanese generator
JP3692711B2 (en) Machine translation device
JPH11282846A (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JP2938897B2 (en) Document creation processing device
JP2002041517A (en) Machine translation apparatus, machine translation method, and computer-readable storage medium storing machine translation program
JPS62271056A (en) Dictionary registration method in translation device
JP3233800B2 (en) Machine translation equipment
JP3147947B2 (en) Machine translation equipment
JP3244286B2 (en) Translation processing device
JPH03132866A (en) document creation device
JPH11328176A (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JPH10320391A (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JP3313810B2 (en) Aspect processing device
JP2000137709A (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JPH07141375A (en) Machine translation device
JPH10171804A (en) Machine translation equipment
JPH05189421A (en) Kana-Kanji conversion device and method
JPH1173413A (en) Machine translation device and computer-readable recording medium recording machine translation processing program
JPS62271055A (en) Translation editing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040329

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060220