JPH11282846A - Machine translation apparatus and computer-readable recording medium recording machine translation processing program - Google Patents
Machine translation apparatus and computer-readable recording medium recording machine translation processing programInfo
- Publication number
- JPH11282846A JPH11282846A JP10103926A JP10392698A JPH11282846A JP H11282846 A JPH11282846 A JP H11282846A JP 10103926 A JP10103926 A JP 10103926A JP 10392698 A JP10392698 A JP 10392698A JP H11282846 A JPH11282846 A JP H11282846A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- fixed
- translation
- source language
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000013519 translation Methods 0.000 title claims abstract description 173
- 238000000034 method Methods 0.000 claims abstract description 95
- 230000000877 morphologic effect Effects 0.000 claims description 48
- 238000012545 processing Methods 0.000 claims description 42
- 238000013500 data storage Methods 0.000 claims description 27
- 230000011218 segmentation Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 68
- 230000014616 translation Effects 0.000 description 156
- 230000014509 gene expression Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000021615 conjugation Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 241001122315 Polites Species 0.000 description 2
- 210000001072 colon Anatomy 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 241000277269 Oncorhynchus masou Species 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【課題】 定型文の一部が活用しまたは常体、敬体の揺
れを吸収することにより、厳密な入力文でなくても定型
文が利用可能にし、その結果、高精度の翻訳結果文を
得、後編集の負荷を軽減することが可能な機械翻訳装置
を提供すること。
【解決手段】 入力文中に定型見出し文が存在するか否
か(S400)、活用部分を持つか否か(S410)を
検出し、活用部分を含んでいる場合は活用部分毎に置き
換え可能な形態素解析の解の条件にあっているか否か
(S430)を検出し、条件にあっていれば定型訳文に
置き換え(S420)、翻訳処理を終了する。定型文見
出し語を含まなければ、通常の翻訳処理を続行する。
(57) [Summary] [Problem] By making use of a part of a fixed sentence or absorbing fluctuations of the ordinary and honorific forms, a fixed sentence can be used even if it is not a strict input sentence. Provided is a machine translation apparatus capable of obtaining a translation result sentence with high accuracy and reducing the load of post-editing. SOLUTION: It is detected whether or not a fixed headline sentence exists in an input sentence (S400), and whether or not the input sentence has a utilization part (S410). When the utilization part includes a utilization part, a morpheme replaceable for each utilization part. It is detected whether or not the condition of the solution of the analysis is satisfied (S430). If the condition is satisfied, the sentence is replaced with a fixed form translation (S420), and the translation process is terminated. If the fixed phrase entry is not included, the normal translation process is continued.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、原言語からなる原
文を目的言語に翻訳する機械翻訳装置及び機械翻訳処理
プログラムを記録したコンピュータ読み取り可能な記録
媒体に関し、詳しくは、原言語による定型文が活用する
ようなものであっても、適切に定型文として翻訳を行う
技術に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation apparatus for translating an original sentence composed of a source language into a target language and a computer-readable recording medium recording a machine translation processing program. The present invention relates to a technique for appropriately translating a fixed sentence even if it is used.
【0002】[0002]
【従来の技術】従来、この種の機械翻訳装置において
は、一般的に複数種類の辞書が用意されており、翻訳処
理においては、その翻訳しようとするテキストに応じて
最もふさわしい辞書を使用するように構成されている。
ここで、用意されている辞書の種類としては、例えば、
広い範囲の語句が一般的な訳語や語法で登録されてお
り、機械翻訳装置が予め保有している基本辞書と、ある
特定の分野でのみ使用される語句や訳語などが登録され
ている専門辞書と、ユーザが独自に編集することができ
るユーザ辞書などである。ユーザが翻訳したい入力文の
語彙が持つ範囲を特定し、適切な辞書選びと構築とが、
より正確な翻訳結果をもたらす。2. Description of the Related Art Conventionally, in this type of machine translation apparatus, a plurality of types of dictionaries are generally prepared. In a translation process, a dictionary most suitable for a text to be translated is used. Is configured.
Here, as the type of the prepared dictionary, for example,
A wide range of words and phrases are registered in general translations and grammar, and a basic dictionary stored in advance by a machine translation device and a specialized dictionary in which words and translations used only in a specific field are registered And a user dictionary that the user can independently edit. Specify the range of the vocabulary of the input sentence that the user wants to translate, and select and build an appropriate dictionary,
Provides more accurate translation results.
【0003】同時に、定型文登録も高度な翻訳結果をも
たらすのに有効である。人手による翻訳処理において
も、字面通りの翻訳ではなくて、特定の言い回しを特定
の訳語に置き換えることが必要になることは多い。端的
な例は挨拶表現である。マニュアル文から社内文書ま
で、この一文はいつもこの訳文でよい、というものは、
ユーザ辞書や専門辞書の有無などに左右されることな
く、安定した翻訳精度を得るために、定型文登録は有効
である。仮に定型文登録が行われていないと、ユーザが
使う決まり文句や独特の表現、慣用句を文字どおり訳し
てしまうため意味の通らなかったり、不自然な訳文が生
成されてしまったりする。これらの量が多ければ多いほ
どユーザは膨大な後編集を行わなければならない。ユー
ザが自由に編集できるユーザ辞書と定型文とは、自然な
翻訳結果を得るためには不可欠であり、特に定型文は理
想的な訳語に置き換わるのであるから、完璧な翻訳精度
を求めることが難しい機械翻訳システムにおいては、た
いへん有効である。特開平7−152767号公報にそ
の登録方法の一技術として、以下のようなものが提案さ
れている。即ち、定型文を任意語句を表わすシンボルと
固定語句との組み合わせで表わした原文パターンとそれ
に対応する訳文パターンとの対でパターンファイルに登
録しておき、パターン処理部が入力部から入力された原
文が登録されている原文パターンにマッチするかを検査
し、マッチすれば原文パターンのシンボルに対応する語
句を切り出す。翻訳制御部は翻訳部を制御し、切り出さ
れた語句を一つずつ翻訳させる。訳文合成部は、原文パ
ターンに対応する訳文パターンをパターン処理部から受
け取り、翻訳制御部を介して受け取った切り出された語
句の翻訳結果を訳文パターンのシンボルを置換して最終
的な訳文を作成する。パターンファイルは、利用者が容
易に登録及び更新することができるようなものである。[0003] At the same time, fixed phrase registration is also effective in providing high-level translation results. Even in manual translation processing, it is often necessary to replace a specific phrase with a specific translation, instead of performing literal translation. A simple example is a greeting expression. From a manual to an in-house document, this one sentence should always be this translation,
In order to obtain stable translation accuracy without being affected by the presence or absence of a user dictionary or specialized dictionary, fixed phrase registration is effective. If the fixed phrases are not registered, the fixed phrases, unique expressions, and idioms used by the user are literally translated, so that the translated sentences have no meaning or unnatural translations are generated. The greater these quantities, the more extensive the user has to do post-editing. User dictionaries and fixed phrases that users can freely edit are indispensable for obtaining natural translation results. In particular, fixed phrases are replaced with ideal translations, so it is difficult to find perfect translation accuracy. It is very effective in machine translation systems. Japanese Patent Application Laid-Open No. 7-152767 discloses the following technique as one of the registration methods. That is, a fixed sentence is registered in a pattern file as a pair of an original sentence pattern expressed by a combination of a symbol representing an arbitrary phrase and a fixed phrase and a corresponding translated sentence pattern, and the pattern processing unit inputs the original sentence input from the input unit. Is checked to see if it matches the registered original pattern, and if it matches, a word corresponding to the symbol of the original pattern is cut out. The translation control unit controls the translation unit to translate the extracted words one by one. The translated sentence synthesis unit receives a translated sentence pattern corresponding to the original sentence pattern from the pattern processing unit, and creates a final translated sentence by replacing the translation result of the cut-out phrase received via the translation control unit with the symbol of the translated sentence pattern. . The pattern file is such that the user can easily register and update.
【0004】[0004]
【発明が解決しようとする課題】しかしながら、定型文
は入力文中で厳密に全体一致した場合のみ(一部ワイル
ドカードなどが利用できるが)置き換えてもよい、とい
う枠組みであり、それが長所なのであるが、逆に、微妙
な表現の揺れに対応することができない。送りがなや字
種の違いによる表記の揺れという問題と共に、常体、敬
体の区別などの差もある。さらに、現在や過去の時制を
表わす言葉や否定文など定型文といえども、常に完全に
一致した状態で用いられるわけではない。つまり常体、
敬体をはじめ、定型文は文章が使われる場面毎に活用す
るものである。なお、ここで活用というのは本来の活用
形のみならず助動詞などの付加なども含む広い概念を言
うものとする。例えば、敬体・常体であれば「〜だ」
「〜である」「〜です」「〜でございます」など、全て
の場合を想定して定型文登録をするのはユーザに大変な
負荷を強いるという問題があり、また、いたずらにユー
ザに開放された定型文登録の空き容量を使うことになり
非効率であるという問題があった。これは、原言語が日
本語に限らず、英語を始めとする外国語である場合にも
あてはまり、一部が変化したために、定型文としての処
理がなされないという問題があった。However, a fixed sentence can be replaced only when the whole sentence exactly matches in the input sentence (although some wildcards can be used), which is an advantage. However, on the contrary, it is not possible to cope with a subtle fluctuation of expression. In addition to the problem of swaying of notation due to differences in character type and character type, there are also differences in the distinction between the ordinary and the honorific. Furthermore, even fixed phrases such as words expressing the present and past tense and negative sentences are not always used in a completely consistent state. That is,
Fixed phrases and other fixed phrases are used every time a sentence is used. Here, the term “conjugation” refers to a broad concept including not only the original conjugation form but also the addition of auxiliary verbs and the like. For example, if it is a polite body or ordinary body,
Registering fixed phrases in all cases, such as "is,""is," and "is," places a heavy burden on users, and it is open to users unnecessarily. There is a problem that the used free space of the fixed form registration is used, which is inefficient. This applies not only to a case where the source language is not limited to Japanese but also to a foreign language such as English, and there has been a problem that processing as a fixed phrase is not performed because a part of the language has changed.
【0005】本発明は、上述した問題点を解決するため
になされたものであり、ユーザが定型文を登録する際
に、定型文の活用可能な部分が活用されて変形された場
合であっても元の定型文と同じとみなし、形態素解析の
際に定型文が適合する枠を広げ、精度の高い目的言語の
翻訳結果を得ることが可能で、後編集も容易な機械翻訳
装置を提供することを目的としている。SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problem, and is intended to be applied to a case where a user registers a fixed form sentence and utilizes a usable part of the fixed form sentence to transform the form. Is also considered to be the same as the original fixed sentence, provides a machine translation device that can expand the frame to which the fixed sentence fits during morphological analysis, obtain a high-accuracy translation result of the target language, and easily perform post-editing It is intended to be.
【0006】[0006]
【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の機械翻訳装置は、原言語
文を入力する入力手段と、前記入力手段により入力され
た原言語文を記憶する原言語文記憶手段と、原言語によ
る見出語、前記見出語の品詞、前記見出語に対応する目
的言語の訳語を含む単語情報と、形態素解析処理に必要
な接続情報を含む文法情報とを格納している翻訳辞書
と、前記原言語の任意の語句の並びである定型見出文
と、前記定型見出文に対応する目的言語の訳語句の並び
である定型訳文との対からなる定型文データを複数記憶
した定型文データ記憶手段と、前記翻訳辞書と前記定型
文データ記憶手段を用いて、前記原言語文について前記
見出語と前記定型見出文とを検索することにより形態素
解析を行う形態素解析手段と、前記形態素解析手段によ
り与えられた前記原言語文の形態素解析の結果に基づい
て構文解析を行う構文解析手段とを有し、前記原言語文
を目的言語文に翻訳する翻訳手段と、前記翻訳された目
的言語文を表示する表示手段とを備えた機械翻訳装置で
あって、前記定型文データ記憶手段は、新たな定型文デ
ータを追加して登録し、または、既に登録されている定
型文データを修正して登録する定型文編集手段を有し、
前記定型文編集手段は、新たに追加され又は修正された
前記定型見出文と前記定型訳文の対からなる定型文デー
タを登録する際に、前記定型見出文が活用可能な部分を
含む場合に、当該部分を任意指定する活用部分指定手段
と、前記登録しようとする定型見出文を、前記活用部分
指定手段により指定された活用する部分と、当該定型見
出文から活用する部分を除いた活用しない部分とに分割
し、前記活用しない部分を新たな定型見出文とする定型
文分割手段とを有することを特徴とする。In order to achieve this object, a machine translation apparatus according to a first aspect of the present invention comprises: an input means for inputting a source language sentence; and a source language input by the input means. Source language sentence storage means for storing sentences, headwords in the source language, part of speech of the headwords, word information including target language translations corresponding to the headwords, and connection information necessary for morphological analysis processing A translation dictionary storing grammatical information including: a fixed phrase sentence which is a sequence of arbitrary phrases in the source language; and a fixed translation sentence which is a sequence of translated words in the target language corresponding to the fixed phrase. A fixed sentence data storage unit storing a plurality of fixed sentence data consisting of pairs of the following, and using the translation dictionary and the fixed sentence data storage unit, the headword and the fixed headword for the source language sentence Morphological analysis that performs morphological analysis by searching A translation unit for translating the source language sentence into a target language sentence, comprising: a stage; and a syntax analysis unit that performs a syntax analysis based on a result of the morphological analysis of the source language sentence given by the morphological analysis unit. Display means for displaying the translated target language sentence, wherein the fixed form data storage means adds and registers new fixed form data or is already registered It has a fixed phrase editing means for correcting and registering the fixed phrase data,
The above-mentioned fixed phrase editing means, when registering the fixed phrase data which is a pair of the newly added or modified fixed phrase and the fixed translation, includes a portion which can be used by the fixed phrase. In addition, a utilization part designation unit for arbitrarily designating the part, a part to be used for the standard heading to be registered, and a part for utilization from the standard heading are excluded. And a fixed sentence dividing unit for dividing the unused portion into a new fixed entry sentence.
【0007】この構成に係る機械翻訳装置によれば、定
型文が活用部分を含むため、定型文が変形され、元の定
型文とは異なるものになっても、活用しない部分を新た
に定型見出文とすることで、変形された定型文を検出
し、活用しない部分を定型文として定型訳文に置換え、
活用部分は、これと関連付けて処理することで、定型文
の処理範囲を広げ、高品質の翻訳を容易に得ることがで
き、後編集も定型文の僅かな修正ですむ。特に活用させ
たい部分と活用させたくない部分をユーザが指定できる
ようにしてあるため、変形された定型文について、定型
文として扱うか定型文でない文章として扱うかユーザの
思う通りの結果を得ることができる。[0007] According to the machine translation device having this configuration, since the fixed phrase includes a part to be used, even if the fixed phrase is deformed and becomes different from the original fixed sentence, a part which is not used is newly viewed. By making a sentence, the transformed fixed phrase is detected, and the part that is not used is replaced with a fixed translation as a fixed phrase,
By processing the utilization part in association with this, the processing range of the fixed phrase can be expanded, high-quality translation can be easily obtained, and post-editing can be performed with a slight modification of the fixed phrase. In particular, since the user can specify the parts that he or she wants to use and the parts that he or she does not want to use, the user can decide whether to handle the transformed fixed phrase as a fixed phrase or a non-fixed phrase, as desired by the user. Can be.
【0008】また、請求項2に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
は、原言語文を目的言語文に翻訳するための機械翻訳処
理のための機械翻訳処理プログラムを記録した記録媒体
であって、コンピュータに、原言語文を入力する入力の
手順と、前記入力手段により入力された原言語文を記憶
する原言語文記憶の手順と、原言語による見出語、前記
見出語の品詞、前記見出語に対応する目的言語の訳語を
含む単語情報と、形態素解析処理に必要な接続情報を含
む文法情報とを格納している翻訳辞書と、前記原言語の
任意の語句の並びである定型見出文と、前記定型見出文
に対応する目的言語の訳語句の並びである定型訳文との
対からなる定型文データを複数記憶した定型文データ記
憶手段とを用いて、前記原言語文について前記見出語と
前記定型見出文とを検索することにより形態素解析を行
う形態素解析の手順と、前記形態素解析の手順により与
えられた前記原言語文の形態素解析の結果に基づいて構
文解析を行う構文解析に手順とを有し、前記原言語文を
目的言語文に翻訳する翻訳の手順と、前記翻訳された目
的言語文を表示する表示の手順とを実行させる機械翻訳
処理プログラムであって、前記定型文データ記憶の手順
において、新たな定型文データを追加して登録し、及び
既に登録されている定型文データを修正して登録する定
型文編集の手順と、前記定型文編集の手順において、新
たに追加され又は修正された前記定型見出文と前記定型
訳文の対からなる定型文データを登録する際に、前記定
型見出文が活用可能な部分を含む場合に、当該部分を任
意指定する活用部分指定の手順と、前記登録しようとす
る定型見出文を、前記活用部分指定の手順により指定さ
れた活用する部分と、当該定型見出文から活用する文末
を除いた活用しない部分とに分割し、前記活用しない部
分を新たな定型見出文とする定型文分割の手順とを実行
させる機械翻訳プログラムをコンピュータに読み取り可
能に記録したことを特徴とする。[0008] A computer-readable recording medium recording the machine translation processing program according to claim 2 stores a machine translation processing program for machine translation processing for translating a source language sentence into a target language sentence. A recording medium, comprising: inputting a source language sentence to a computer; storing the source language sentence input by the input means; storing a source language sentence; A translation dictionary that stores the part of speech of the headword, word information including a translation of the target language corresponding to the headword, and grammar information including connection information necessary for morphological analysis processing; And a fixed phrase data storage unit that stores a plurality of fixed phrase data, each of which is a pair of a fixed phrase sentence that is a sequence of words and a fixed phrase translation that is a sequence of translated words of the target language corresponding to the fixed phrase. make use of A morphological analysis procedure for performing morphological analysis by searching for the headword and the fixed-form headword for the source language sentence, and a morphological analysis result of the source language sentence given by the morphological analysis procedure Machine translation that has a procedure for parsing based on the parsing based on the translation procedure for translating the source language sentence into a target language sentence, and a display procedure for displaying the translated target language sentence A processing program, in the procedure for storing the fixed form data, adding and registering new fixed form data, and correcting and registering the fixed form data already registered; In the fixed phrase editing procedure, when registering fixed phrase data that is a pair of the newly added fixed phrase and the fixed phrase translation, the fixed phrase includes a part that can be used. In addition, a procedure for specifying a part to be used to arbitrarily specify the part, a part to be used to register the standard entry to be registered in the procedure for specifying the part to be used, and a sentence ending to be used from the standard entry A machine translation program is recorded in a computer-readable manner so as to divide into a part not to be used except for the part and to execute a fixed sentence division procedure in which the part not to be used is set as a new fixed heading.
【0009】この構成に係る機械翻訳処理プログラムを
記録したコンピュータ読み取り可能な記録媒体によれ
ば、コンピュータに、定型文が活用部分を含むため、定
型文が変形され、元の定型文とは異なるものになって
も、活用しない部分を新たに定型見出文とすることで、
変形された定型文を検出し、活用しない部分を定型文と
して定型訳文に置換え、活用部分は、これと関連付けて
処理する手順を実行させることで、定型文の処理範囲を
広げ、高品質の翻訳を容易に得ることができ、後編集も
定型文の僅かな修正ですむ機械翻訳処理が可能になる。
特に活用させたい部分と活用させたくない部分をユーザ
が指定できるような手順にしてあるため、変形された定
型文について、定型文として扱うか定型文でない文章と
して扱うかユーザの思う通りの結果を得ることができ
る。[0009] According to the computer-readable recording medium storing the machine translation processing program according to this configuration, since the fixed sentence includes a part to be used, the fixed sentence is deformed and differs from the original fixed sentence. Even if it becomes, by making the part that is not used a new fixed heading,
Detects deformed fixed phrases and replaces unused parts with fixed translations as fixed phrases, and executes the associated parts in association with the fixed phrase, thereby expanding the processing range of fixed phrases and providing high-quality translation. Can be easily obtained, and post-editing can be performed by machine translation processing that requires only a slight modification of the fixed phrase.
In particular, because the procedure is such that the user can specify the parts that he or she wants to utilize and the parts that he or she does not want to utilize, the user can decide whether to treat the transformed fixed sentence as a fixed sentence or a non-fixed sentence as desired. Obtainable.
【0010】[0010]
【発明の実施の形態】以下、本発明の機械翻訳装置を具
体化した実施の形態について図面を参照して説明する。
尚、本実施の形態では、日本語(原言語)から英語(目
的言語)に翻訳する場合を例として説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment embodying a machine translation apparatus according to the present invention will be described below with reference to the drawings.
In the present embodiment, a case where translation from Japanese (source language) to English (target language) will be described as an example.
【0011】まず、本実施の形態の機械翻訳装置の概略
構成を示すブロック図を、図1に示す。図1に示すよう
に、本実施形態の機械翻訳装置は、翻訳対象となる日本
語の原文や各種操作指示等を入力するためのキーボード
等からなる入力部2と、翻訳処理に利用される各種辞書
12や、定型文データを記憶する定型文データ記憶部1
6が格納された、ハードディスクや光ディスク等及びそ
のドライブからなる外部記憶装置4と、入力された日本
語の原文や翻訳結果である英語の訳文等を表示するため
のCRT等からなる表示部6と、その表示部6に表示す
るデータを制御する表示制御部7と、翻訳結果である英
語の訳文等を印刷して出力するためのレーザープリンタ
等からなる印刷部8が、入出力ポート24を介して、制
御部10に接続されている。制御部10は、CPU1
8、RAM22、ROM20がパスライン26を介して
接続されており、同じく入出力ポート24を介してパス
ライン26に前記入力部2や外部翻訳装置4から入力さ
れ、このデータに基づいて翻訳処理を行い、その翻訳結
果を表示部6に表示したり、印刷部8から出力する等の
制御を行う。FIG. 1 is a block diagram showing a schematic configuration of a machine translation apparatus according to the present embodiment. As shown in FIG. 1, the machine translation apparatus according to the present embodiment includes an input unit 2 including a keyboard or the like for inputting a Japanese original to be translated, various operation instructions, and the like. Dictionary 12 and fixed phrase data storage unit 1 for storing fixed phrase data
And an external storage device 4 including a hard disk, an optical disk, or the like and a drive thereof, and a display unit 6 including a CRT or the like for displaying an input Japanese original and an English translation as a translation result. A display control unit 7 for controlling data to be displayed on the display unit 6 and a printing unit 8 such as a laser printer for printing and outputting an English translation as a translation result through an input / output port 24. Connected to the control unit 10. The control unit 10 includes the CPU 1
8, a RAM 22, and a ROM 20 are connected via a pass line 26, and are also input from the input unit 2 and the external translation device 4 to the pass line 26 via an input / output port 24, and perform a translation process based on the data. Then, control is performed such that the translation result is displayed on the display unit 6 or output from the printing unit 8.
【0012】前記入力部2は、本発明の入力手段に相当
し、図示しない文字を入力するための文字キー、各種処
理を起動するための入力文編集キー、翻訳実行キー、定
型文編集キー、出力文編集キー、終了キー、及び印字実
行キーといった各種機能キー、入力文や出力文の編集、
表示部6に表示されている画面操作等に使用するカーソ
ルキー、挿入キー、削除キー、確定キー、及び次候補選
択キー等が設けられている。The input unit 2 corresponds to an input means of the present invention, and includes a character key for inputting a character (not shown), an input sentence editing key for starting various processes, a translation execution key, a fixed phrase editing key, Various function keys such as output sentence editing key, end key, print execution key, input sentence and output sentence editing,
A cursor key, an insert key, a delete key, a decision key, a next candidate selection key, and the like, which are used for screen operations and the like displayed on the display unit 6, are provided.
【0013】また、前記外部記憶装置4は本発明の翻訳
辞書や定型文データ記憶手段に相当するもので、翻訳処
理に利用される翻訳辞書12と定型文データ記憶部16
記憶部とが格納されている。翻訳辞書12が本発明の翻
訳辞書に、定型文データ記憶部16が、本発明の定型文
データ記憶手段を構成している。The external storage device 4 corresponds to a translation dictionary and fixed phrase data storage means of the present invention, and includes a translation dictionary 12 and a fixed phrase data storage unit 16 used for translation processing.
And a storage unit. The translation dictionary 12 is the translation dictionary of the present invention, and the fixed phrase data storage unit 16 is a fixed phrase data storage unit of the present invention.
【0014】なお、機械翻訳装置が利用する翻訳辞書1
2としては、機械翻訳装置が予め外部記憶装置保有して
いる基本辞書のみならず、専門分野毎に編集された専門
辞書、及びユーザが独自に構築するユーザ辞書などを利
用してもよい。The translation dictionary 1 used by the machine translation device
2, the machine translation apparatus may use not only a basic dictionary stored in an external storage device in advance, but also a specialized dictionary edited for each specialized field, a user dictionary constructed by the user independently, and the like.
【0015】図2に、上記した翻訳辞書12のデータ構
成の一例を示す。個々の辞書登録情報は、それぞれ見出
語30と、各見出語の品詞32と、各見出語に対する訳
語34と、前後の接続情報や意味情報等を含む様々な辞
書情報36とからなるフィールドから構成されている。FIG. 2 shows an example of the data configuration of the translation dictionary 12 described above. Each piece of dictionary registration information includes a headword 30, a part of speech 32 of each headword, a translated word 34 for each headword, and various dictionary information 36 including connection information and semantic information before and after. Consists of fields.
【0016】図3に、上記した定型文データ記憶部16
に格納されたデータ構成の一例を示す。個々の定型文デ
ータ情報は、定型見出文40と、活用部分42と、定型
訳文44からなるフィールドとから構成されている。こ
こで、ユーザが入力部2から編集するのは、活用部分4
2がないものは定型見出文40そのままであり、活用部
分42には活用しないことをしめす「NIL」の表示が
される。活用部分42があるものは、定型見出文40と
活用部分42を合成したものが定型文としてユーザに示
される。こうすることにより、ユーザは内部データが分
割されていることを意識せずに編集することが可能とな
る。FIG. 3 shows the fixed form data storage section 16 described above.
2 shows an example of a data configuration stored in the. Each of the fixed sentence data information includes a fixed entry sentence 40, a utilization part 42, and a field including a fixed translation 44. Here, what the user edits from the input unit 2 is the utilization part 4
Those without 2 are the standard headings 40 as they are, and "NIL" indicating that they are not utilized is displayed in the utilization part 42. In the case where there is the utilization part 42, a combination of the standard heading 40 and the utilization part 42 is shown to the user as a standard sentence. By doing so, the user can edit without being aware that the internal data is divided.
【0017】次に、前記制御部10は、CPU18、R
OM20、RAM22、入出力ポート24、及びこれら
各部を結ぶパスライン26を備えた周知のマイクロコン
ピュータにより構成されている。そして、制御部10に
おいては、ROM20に格納されたプログラムによって
各種処理が実行される。Next, the control unit 10 includes a CPU 18, an R
It comprises a well-known microcomputer having an OM 20, a RAM 22, an input / output port 24, and a pass line 26 connecting these components. In the control unit 10, various processes are executed by a program stored in the ROM 20.
【0018】例えば、前記入力部2から入力された日本
語の原文を英語に翻訳すると共に、原文や翻訳文の編集
等を行う翻訳・編集処理、また、翻訳時に利用する定型
文データを構築するための定型文編集処理等が実行され
る。For example, a translation / editing process for translating a Japanese original sentence input from the input unit 2 into English, editing the original sentence and the translated sentence, and constructing a fixed sentence data used at the time of translation. For example, a fixed phrase editing process is executed.
【0019】また、前記ROM20には、後述する翻訳
処理において使用される各種情報が以下のように格納さ
れている。The ROM 20 stores various types of information used in a translation process described below as follows.
【0020】制御プログラム202は、入出力や印刷、
各プログラムの制御をするプログラムで、本装置全体の
コントロールをするものである。The control program 202 includes input / output, printing,
This program controls each program and controls the entire device.
【0021】翻訳プログラム204は、入力部2から入
力された原言語文を目的言語文に翻訳するプログラム
で、本発明の翻訳手段に相当するものである。翻訳プロ
グラム204には、本発明の形態素解析手段である形態
素解析プログラム206、構文解析手段である構文解析
プログラム208の他、変換プログラム210、生成プ
ログラム212が含まれる。The translation program 204 is a program for translating a source language sentence input from the input unit 2 into a target language sentence, and corresponds to the translation means of the present invention. The translation program 204 includes a conversion program 210 and a generation program 212 in addition to a morphological analysis program 206 which is a morphological analysis unit of the present invention and a syntax analysis program 208 which is a syntax analysis unit.
【0022】形態素解析プログラム206は、定型文デ
ータ記憶部16に格納された定型文データ、翻訳辞書1
2内の単語情報を参照しつつ、原言語文の形態素である
単語に分割し、同時に接続情報等をその単語に関連付け
て保有したり、定型訳文を形態素解析結果に付与したり
する。The morphological analysis program 206 stores the fixed phrase data stored in the fixed phrase data storage unit 16 and the translation dictionary 1
While referring to the word information in 2, the source language sentence is divided into words that are morphemes, and at the same time, connection information and the like are held in association with the words, and fixed-form translations are added to the morphological analysis results.
【0023】構文解析プログラム208は、形態素解析
の結果を受けて、形態素の関係を文法的に解析する。変
換プログラム212は、原言語文の単語を目的言語文の
単語に変換するものである。生成プログラム212は、
変換された単語を、目的言語の文法に基づいて訳文を生
成するものである。The syntax analysis program 208 receives the result of the morphological analysis and grammatically analyzes the relationship between the morphemes. The conversion program 212 converts words in the source language sentence into words in the target language sentence. The generation program 212
A translated sentence is generated from the converted word based on the grammar of the target language.
【0024】定型文編集プログラム214は、本発明の
定型文編集手段に相当するもので、定型文データ記憶部
16に格納されたデータを追加したり修正するためのプ
ログラムである。定型文編集プログラム214には、活
用部分指定プログラム218と定型文分割プログラム2
16が含まれる。活用部分指定プログラム218は、本
発明の活用部分指定手段に相当し、定型文の活用部分を
指定するものである。The fixed phrase editing program 214 corresponds to the fixed phrase editing means of the present invention, and is a program for adding or modifying data stored in the fixed phrase data storage unit 16. The fixed phrase editing program 214 includes a utilization part designation program 218 and a fixed phrase segmentation program 2
16 are included. The utilization part designation program 218 corresponds to utilization part designation means of the present invention, and designates a utilization part of a fixed phrase.
【0025】定型文分割プログラム216は、活用部分
指定プログラム218により、定型文のうち活用を許容
する部分を指定すると、その活用をするとして指定した
部分と、定型文からこの指定された部分を除いた活用し
ない部分とに、分割するものである。The fixed phrase segmentation program 216, when a portion permitted to be used in the fixed phrase is designated by the utilization portion designation program 218, removes the portion designated to be utilized and the designated portion from the fixed phrase. It is divided into parts that are not utilized.
【0026】RAM22には、原言語文記憶領域22
4、訳文記憶領域226、作業領域222が確保され
る。この原言語文記憶領域224は、本発明の原言語文
記憶手段に相当するものである。The RAM 22 has a source language sentence storage area 22
4. A translation storage area 226 and a work area 222 are secured. This source language sentence storage area 224 corresponds to the source language sentence storage means of the present invention.
【0027】原言語文記憶領域224には、入力部2か
ら入力された原言語文が格納される。作業領域222に
は、翻訳作業のための処理対象や編集中の定型文データ
などが一時的に取り込まれ翻訳・編集処理がされる記憶
領域である。訳文記憶領域は、翻訳、編集された英語の
訳文が保存される。なお、作業領域222で編集、追加
された定型文データは定型見出文とその対になる定型訳
文とともに定型文データ記憶部16に格納、保存され
る。The source language sentence storage area 224 stores the source language sentence input from the input unit 2. The work area 222 is a storage area in which a processing target for translation work, fixed sentence data being edited, and the like are temporarily captured and subjected to translation / edit processing. The translated sentence storage area stores translated and edited English translated sentences. The fixed phrase data edited and added in the work area 222 is stored and stored in the fixed phrase data storage unit 16 together with the fixed phrase sentence and the fixed phrase translation corresponding thereto.
【0028】続いて、制御部10が実行する翻訳・編集
処理について図4〜図6に示すフローチャートに従って
説明する。Next, the translation / editing process executed by the control unit 10 will be described with reference to the flowcharts shown in FIGS.
【0029】図4に示すように、翻訳・編集処理が実行
されると、まず、ステップ110(以下、S110と略
称する。他のステップも同様)において、ユーザにより
入力部2の文字キー等が操作され、翻訳対象となる日本
語の原文が入力されるのを待つ。ここで、原文の入力
は、既に作成されている原文のファイルを読み込むよう
に構成してもよい。そして、日本語の原文(以下、入力
文)が入力されると、S120に進み、この入力文を、
表示部6の所定のエリアに表示する。As shown in FIG. 4, when the translation / edit processing is executed, first, in step 110 (hereinafter abbreviated as S110; other steps are the same), the user operates the character keys of the input section 2 by the user. It is operated and waits for the input of the Japanese original to be translated. Here, the input of the original text may be configured to read the file of the original text that has already been created. Then, when a Japanese original sentence (hereinafter, input sentence) is input, the process proceeds to S120, and the input sentence is
It is displayed in a predetermined area of the display unit 6.
【0030】次に、入力部2に設けられた入力文編集キ
ーが操作されたか否かを判断し(S130)、操作され
ていなければ(S130:NO)、S150に移行す
る。また、入力文編集キーが操作されていれば(S13
0:YES)、入力文編集処理を実行する(S14
0)。尚、入力文編集処理が実行されると、ユーザは表
示部6の所定のエリアに表示された入力文を、入力部2
に設けられたカーソルキー、削除キー、挿入キー及び文
字キー等を使用して直接修正することが可能となる。そ
して、入力文編集キーを押さなかった場合は(S13
0:NO)、入力部2に設けられた翻訳実行キーが操作
されたか否かを判断し(S150)、操作されていなけ
れば(S150:NO)、S190に移行する。また、
翻訳実行キーが操作されていれば(S150:YE
S)、日本語の入力文を英語の訳文(以下、出力文とす
る)に翻訳する翻訳処理を実行し(S160)、続い
て、翻訳処理により得られた出力文を入力文と対にして
RAM22に格納する(S170)と共に、表示部6に
設けられた所定のエリアにそれぞれ入力文と出力文とを
表示する(S180)。Next, it is determined whether or not the input sentence editing key provided on the input unit 2 has been operated (S130). If not (S130: NO), the process proceeds to S150. If the input sentence edit key is operated (S13
0: YES), execute the input sentence editing process (S14)
0). When the input sentence editing process is executed, the user inputs the input sentence displayed in a predetermined area of the display unit 6 to the input unit 2.
Can be directly corrected using the cursor key, delete key, insert key, character key, etc. If the input sentence edit key is not pressed (S13
0: NO), it is determined whether or not the translation execution key provided on the input unit 2 has been operated (S150), and if not (S150: NO), the process proceeds to S190. Also,
If the translation execution key is operated (S150: YE
S), executing a translation process for translating a Japanese input sentence into an English translation (hereinafter referred to as an output sentence) (S160), and then pairing the output sentence obtained by the translation process with the input sentence The input sentence and the output sentence are displayed in a predetermined area provided in the display unit 6 while being stored in the RAM 22 (S170) (S180).
【0031】尚、翻訳処理は、入力文全部を一括して実
行しても良いし、文章単位で範囲を指定し、指定された
範囲の文章のみについて実行するようにしてもよい。The translation process may be performed on all input sentences at once, or may be performed on a specified range of sentences by designating a range in units of sentences.
【0032】次に翻訳実行キーが操作されていなければ
(S150:NO)、入力部2に設けられた定型文編集
キーが操作されたか否かを判断し(S190)、操作さ
れていなければ(S190:NO)、S210に移行す
る。また、辞書編集キーが操作されていれば(S19
0:YES)、定型文編集処理を実行する(S20
0)。尚、定型文編集処理が実行されると、ユーザは定
型文データ記憶部16に登録されている情報の内容を修
正したり、削除したり、新たに必要な定型文を登録する
ことが可能となる。このS200の手順を実行する定型
文編集プログラムが、本発明の定型文編集手段に相当す
る。Next, if the translation execution key has not been operated (S150: NO), it is determined whether or not the fixed phrase editing key provided on the input unit 2 has been operated (S190). S190: NO), and proceeds to S210. If the dictionary edit key is operated (S19)
0: YES), execute the fixed phrase editing process (S20)
0). When the fixed phrase editing process is executed, the user can correct or delete the content of the information registered in the fixed phrase data storage unit 16 or register a new required fixed phrase. Become. The fixed phrase editing program that executes the procedure of S200 corresponds to a fixed phrase editing unit of the present invention.
【0033】定型文編集キーが操作されていなければ
(S190:NO)、S210では、入力部2に設けら
れた出力文編集キーが操作されたか否かを判断し、操作
されていなければ(S210:NO)、S230に移行
する。また、出力文編集キーが操作されていれば(S2
10:YES)、出力文編集処理を実行する(S22
0)。尚、出力文編集処理が実行されると、ユーザは先
のS160において翻訳処理が実行されることにより表
示部6の所定のエリアに表示される出力文(英語の訳
文)を、S140の入力文編集処理と同様に、入力部2
に設けられたカーソルキー、削除キー、挿入キー及び文
字キー等を使用して、直接修正することが可能となる。If the standard sentence edit key is not operated (S190: NO), it is determined in S210 whether or not the output sentence edit key provided on the input unit 2 is operated, and if not, the operation is not performed (S210). : NO), and proceeds to S230. If the output sentence edit key is operated (S2
10: YES), execute output sentence editing processing (S22)
0). Note that, when the output sentence editing process is executed, the user executes the translation process in step S160 to convert the output sentence (English translation) displayed in a predetermined area of the display unit 6 into the input sentence in S140. As with the editing process, the input unit 2
Can be directly corrected using a cursor key, a delete key, an insert key, a character key, etc.
【0034】出力文編集キーが操作されていなければ
(S210:NO)、S230では、入力部2に設けら
れた終了キーが操作されたか否かを判断し、操作されて
いなければ(S230:NO)、例えば、翻訳された出
力文を印刷部8に出力し印刷させる印刷実行キー等、そ
の他のキー操作を検出すると共に、操作されたキーに応
じた処理を実行する(S240)。If the output sentence edit key has not been operated (S210: NO), it is determined in S230 whether the end key provided on the input unit 2 has been operated, and if not, it has been operated (S230: NO). For example, other key operations such as a print execution key for outputting the translated output sentence to the printing unit 8 for printing are detected, and a process corresponding to the operated key is executed (S240).
【0035】そして、先のS140、S180、S20
0、S220、S240が処理された後は、S130に
戻り、同様の処理を繰り返し実行する。Then, S140, S180, S20
After the processing of 0, S220, and S240, the process returns to S130, and the same processing is repeatedly executed.
【0036】また、S230にて、終了キーが操作され
たと判断されると(S230:YES)、本処理を終了
する。If it is determined in S230 that the end key has been operated (S230: YES), the process is terminated.
【0037】このように翻訳・編集処理においては、日
本語の原文が入力された後、入力部2に設けられた各種
キーの操作に従って、入力文の編集処理、翻訳処理、定
型文編集処理、及び出力文編集処理といった各種処理が
実行される。そして、もし、翻訳実行キーを操作し翻訳
処理を実行したが、得られた出力文(英語の訳文)が不
正確であったり不自然であったりする場合には、入力文
編集キーを操作して入力文編集処理を実行し、入力文で
ある日本語の原文を再編集した後、または定型文編集キ
ーを操作して定型文データを編集した後、再度、翻訳実
行キーを操作して再翻訳させるか、あるいは出力文編集
キーを操作して出力文編集処理を実行し、出力文である
英語の訳文を直接編集する。As described above, in the translation / editing process, after the Japanese original sentence is input, the input sentence editing process, translation process, fixed phrase editing process, and the like are performed in accordance with the operation of various keys provided on the input unit 2. And various processes such as an output sentence editing process. Then, if the translation process is executed by operating the translation execution key, if the obtained output sentence (English translation) is incorrect or unnatural, the input sentence edit key is operated. After executing the input sentence editing process and re-editing the Japanese original sentence that is the input sentence, or operating the fixed phrase edit key to edit the fixed sentence data, operating the translation execution key again The output sentence editing process is executed by causing a translation or operating the output sentence edit key, and the English translated sentence which is the output sentence is directly edited.
【0038】このような処理を繰り返すことにより、ユ
ーザが求める翻訳結果を得ることができれば、印刷キー
を操作して、翻訳結果を印刷部8から出力したり、テキ
ストデータとしてRAM22や外部記憶装置4に保存
し、その後、終了キーを操作して、処理を終了する。If the translation result desired by the user can be obtained by repeating such processing, the print key is operated to output the translation result from the printing unit 8 or the RAM 22 or the external storage device 4 as text data. And then operate the end key to end the process.
【0039】次に、図4に示すフローチャート中のS2
00において実行され、ユーザが定型文データ記憶部1
6の内容を修正したり、削除したり、新たに必要な定型
文を登録する定型文編集処理について図5に示すフロー
チャートに従って説明する。Next, S2 in the flowchart shown in FIG.
00, the user sets the fixed phrase data storage unit 1
6 will be described with reference to the flowchart shown in FIG. 5 for correcting or deleting the content of No. 6 and for registering a new required fixed phrase.
【0040】まず、S510では、ユーザが編集したい
定型見出文が入力されたか否かを判断する。入力されて
いれば(S510:YES)、入力された定型見出文
が、既に定型文データ記憶部16に登録されているか否
かを判断する(S520)。既に登録されていれば(S
520:YES)、定型文データ記憶部16内の定型見
出文、または定型訳文を再編集して(S540)、S5
50へ移行する。まだ登録されていなければ(S52
0:NO)、新規に定型見出文と定型訳文を登録し(S
530)、登録された定型文について、活用部分がある
としてユーザがその部分を指示したか否かを判断する
(S550)。活用する部分ないとして指示をしないの
であれば(S550:NO)、S590へ移行する。First, in S510, it is determined whether or not the user has input a standard heading to be edited. If it has been input (S510: YES), it is determined whether or not the input fixed phrase entry has already been registered in the fixed phrase data storage unit 16 (S520). If already registered (S
520: YES), re-edit the fixed phrase sentence or the fixed phrase translation in the fixed phrase data storage unit 16 (S540), and return to S5.
Move to 50. If not registered yet (S52
0: NO), and newly register a fixed entry and a fixed translation (S:
530), it is determined whether or not the registered fixed phrase has a part to be used and the user has instructed the part (S550). If there is no instruction to determine that there is no part to utilize (S550: NO), the process proceeds to S590.
【0041】活用させるとユーザが考えたのであれば、
画面上に表示された編集中の文章について活用すると考
えた部分をキー入力またはマウスなどを使用して指定し
(S550:YES)、ユーザが指示した活用部分を形
態素解析と同様の処理で指定された文字列を解析して活
用部分を抽出し(S560)、抽出された活用部分の品
詞を推定する(S570)。具体的には、「ない」で終
わっていれば否定の「ない」、「下さい」で終わってい
れば助動詞、「い」で終わっていれば形容詞、「だ」ま
たは「です」または「である」で終わっていれば、形容
動詞、「う」段で終わっていれば動詞、などの推定ルー
ルを適応する。品詞を推定したのち、ユーザが入力した
定型見出文から活用部分を除き、活用しない部分を抽出
して、活用しない部分を新たな定型見出文とし、その直
後には活用部分のみ検索されるような接続情報として定
型見出文と活用部分に分割して(S580)、S590
へ移行する。なお、S560、S570、S580の手
順が本発明の活用部分指定手段である活用部分指定プロ
グラム218により実行されている。If the user thinks that it can be used,
The part considered to be utilized for the text being edited displayed on the screen is designated using a key input or a mouse or the like (S550: YES), and the utilized part designated by the user is designated by the same processing as morphological analysis. The extracted character string is analyzed to extract a utilized part (S560), and the part of speech of the extracted utilized part is estimated (S570). Specifically, if it ends with "no", it is negated "no", if it ends with "Please", it is an auxiliary verb, if it ends with "i", it is an adjective, "da" or "is" or "is" If it ends with "", the adjective verb is applied, and if it ends with "U", the estimating rule such as verb is applied. After estimating the part-of-speech, the part that is not used is extracted from the fixed headings input by the user, the parts that are not used are extracted, and the parts that are not used are made into new fixed headings, and immediately after that, only the used parts are searched. Such connection information is divided into a standard entry and a utilization part (S580), and S590
Move to. Note that the procedures of S560, S570, and S580 are executed by the utilization part designation program 218, which is the utilization part designation means of the present invention.
【0042】活用部分の指定されない定型文及び活用部
分が指定されその処理が終了した定型文は、登録処理が
なされる(S590)。定型文見出語の文頭に、文区切
りである句読点、コロン、セミコロン、改行コードなど
の後ろの場合のみ接続可とする接続情報を付与し、ま
た、文末が活用しない定型見出文(S550:NO)の
場合はその文末に、文末が活用する場合(S550:Y
ES)は活用部分に、それぞれ文区切りになる句読点、
コロン、セミコロン、改行コードなどの文区切りの他
に、丁寧語の助動詞「です」「ます」も接続可とする接
続情報を付与し、この情報を定型文データ記憶部16に
登録し(S590)、次の見出語の編集に備える(S5
10)。これらの接続情報は、形態素解析実行時に入力
文の真ん中で検索されることがないようにするためであ
る。The fixed form sentence in which the use portion is not specified and the fixed form sentence in which the use portion is specified and the processing is completed are registered (S590). At the beginning of the fixed phrase entry, connection information that allows connection only after a punctuation mark, a colon, a semicolon, a line feed code, etc., which is a sentence delimiter, is added, and a fixed phrase entry that does not utilize the end of the sentence (S550: In the case of (NO), the end of the sentence is used at the end of the sentence (S550: Y)
ES) is a punctuation mark that is used as a sentence delimiter,
In addition to sentence delimiters such as colons, semicolons, and line feed codes, connection information that allows connection of polite auxiliary words "is" and "masu" is added, and this information is registered in the fixed phrase data storage unit 16 (S590). Prepares for editing of the next headword (S5
10). These pieces of connection information are for preventing a search in the middle of the input sentence during the execution of the morphological analysis.
【0043】次に、新たな見出語と品詞の入力の有無が
判断され(S510)、見出語と品詞が入力されなかっ
た時(S510:NO)、この処理を終了する。Next, it is determined whether or not a new headword and part of speech have been input (S510). If no headword and part of speech have been input (S510: NO), this processing is terminated.
【0044】次に、図4に示すフローチャート中のS1
60において実行され、入力文(日本語の原文)から出
力文(英語の訳文)に翻訳する翻訳処理について、図6
に示すフローチャートに従って説明する。Next, S1 in the flowchart shown in FIG.
FIG. 6 shows a translation process executed in step S60 for translating an input sentence (Japanese original sentence) into an output sentence (English translated sentence).
This will be described according to the flowchart shown in FIG.
【0045】まず、形態素解析処理をし、予め形態素解
析プログラム206内に格納された判断規則と、翻訳辞
書12に格納された文法情報、翻訳辞書12に格納され
た接続情報とを参照しつつ、定型文データ記憶部16に
格納された定型文データ、翻訳辞書12内の単語情報を
検索する。定型見出文が検索できたものは、定型訳文を
形態素解析結果に付与し、翻訳辞書12の見出語が検索
できたものに対して、訳語、品詞といった検索情報を形
態素解析結果に付与する形態素解析処理を実行する(S
250)。なお、ユーザ辞書、専門辞書を利用する場合
は、ユーザ辞書、専門辞書、基本辞書の順に優先され
る。このS250の手順は本発明の形態素解析手段であ
る形態素解析プログラム206により実行がなされてい
る。First, a morphological analysis process is performed, and while referring to the judgment rules stored in advance in the morphological analysis program 206, the grammatical information stored in the translation dictionary 12, and the connection information stored in the translation dictionary 12, The fixed phrase data stored in the fixed phrase data storage unit 16 and word information in the translation dictionary 12 are searched. If a fixed entry can be searched, a fixed translation is added to the morphological analysis result, and if a fixed word in the translation dictionary 12 can be searched, search information such as a translated word or part of speech is added to the morphological analysis result. Execute morphological analysis processing (S
250). When a user dictionary and a specialized dictionary are used, priority is given to the user dictionary, the specialized dictionary, and the basic dictionary in this order. The procedure of S250 is executed by the morphological analysis program 206 which is the morphological analysis means of the present invention.
【0046】次に、S250における形態素解析処理の
結果を受け取り、ROM20の構文解析プログラム20
8に格納されている予め定められた解析文法を用いて、
日本語の構造を解析する解析処理の実行をし(S26
0)、終了したら、入力文が定型見出文であったか否か
を検出する(S400)。定型見出文であった場合(S
400:YES)、指定された活用部分があるか否かを
検出する(S410)。定型文見出語に指定された活用
部分がある場合(S410:YES)、活用部分と実際
に行った形態素解析の結果と比較して、定型見出文の活
用部分の後ろに引けている助動詞「です」「ます」等の
助動詞の解を削除したりして置換え準備をし(S43
0)、定型訳文に置換え処理をする(S420)。Next, the result of the morphological analysis processing in S250 is received, and the syntax analysis program 20 in the ROM 20 is received.
8 using a predetermined parsing grammar stored in
An analysis process for analyzing the structure of the Japanese language is performed (S26).
0), upon completion, it is detected whether the input sentence is a fixed entry sentence (S400). If it is a fixed entry (S
400: YES), it is detected whether or not there is a designated utilization part (S410). If there is a designated conjugation part in the fixed phrase entry (S410: YES), the auxiliary verb closed behind the conjugation part of the fixed phrase entry is compared with the result of the morphological analysis actually performed. Preparations for replacement are made by deleting solutions of auxiliary verbs such as "is" and "mas" (S43)
0), a replacement process is performed for the fixed form translation (S420).
【0047】活用部分が指定されてない定型見出文の場
合(S410:NO)、定型見出文をそのまま定型訳文
へ置き換えて(S420)、この入力文の翻訳処理を終
了する。このS420の手順は定型文置換プログラム2
20により実行されている。入力文が定型見出文でなか
った場合(S400:NO)、定型文を用いない通常の
入力文と同様、その他の翻訳処理を行うため、解析処理
を続行する(S265)。In the case of a fixed entry sentence in which the utilization part is not specified (S410: NO), the fixed entry is replaced with a fixed translation as it is (S420), and the translation processing of the input sentence is terminated. The procedure of S420 is the fixed phrase replacement program 2
20. If the input sentence is not a fixed entry sentence (S400: NO), the analysis process is continued to perform other translation processing as in the case of a normal input sentence not using a fixed sentence (S265).
【0048】解析処理に続いて、ROM20の変換プロ
グラム210に格納されている予め定められた変換文法
を用いて、解析処理により解析された日本語の構造を英
語の構造に変換すると共に、個々の単語を英語に置き換
える変換処理を実行する(S270)。変換処理後、R
OM20の生成プログラム212に格納されている予め
定められた生成文法を用いて、変換処理により変換され
た英語の構造から英語の語順を決定したり、英語に特有
の冠詞を生成したり、入力文に存在しなくても出力文に
は必須の主語を補充したり、テンス、アスペクト、人称
及び数素性等を処理し、英語の単語列からなる出力文を
生成する生成処理を実行する(S280)。生成処理に
続き、ROM20に格納されている予め定められた形態
素生成規則を用いて、S280の生成処理により生成さ
れた英語の単語列に対して、名詞の複数形、動詞の過
去、過去分詞等の活用形を生成して、出力文を得る形態
素生成処理を実行して(S290)翻訳処理を終了す
る。Subsequent to the analysis process, the Japanese structure analyzed by the analysis process is converted into an English structure by using a predetermined conversion grammar stored in the conversion program 210 of the ROM 20, and the individual structures are also converted. A conversion process for replacing words with English is performed (S270). After the conversion process, R
Using a predetermined generation grammar stored in the generation program 212 of the OM 20, an English word order is determined from the English structure converted by the conversion process, an article specific to English is generated, and an input sentence is generated. , An essential sentence is added to the output sentence even if it does not exist, and a process of generating an output sentence composed of an English word string is executed by processing a tense, an aspect, a person, a numerical feature, and the like (S280). . Subsequent to the generation process, the plural words of the noun, the past of the verb, the past participle, etc. are applied to the English word string generated by the generation process of S280 by using a predetermined morpheme generation rule stored in the ROM 20. Then, a morpheme generation process for obtaining an output sentence by generating an inflected form of is performed (S290), and the translation process ends.
【0049】ここで、上述した判断処理においてなされ
る処理について、例文を挙げて説明する。Here, the processing performed in the above-described determination processing will be described with reference to example sentences.
【0050】例えば、図3に示してあるように、活用す
る部分を含まず、常に同じ表現を用いる例として、「拝
啓、貴社ますますご清栄のこととお慶び申し上げます」
を登録した場合を例に挙げる。For example, as shown in FIG. 3, as an example of always using the same expression without using the parts to be used, "Dear sir, I am grateful to your company for being more and more prosperous."
Is registered as an example.
【0051】もし、上記の日本文が定型見出文として登
録していなければ、機械翻訳の原則に則り、字面通りの
翻訳を行うため、”It is glad that
Dear, your company are mo
re well and prospering”とい
う英文としてはきわめて不自然な翻訳を行ってしまう。
これを、英語の習慣に則った”Dear Sirs,”
になるように定型文データに登録するとする。If the Japanese sentence is not registered as a fixed head sentence, the translation is performed literally in accordance with the principle of machine translation, so that "It is glad that"
Dear, your company are mo
The English sentence "re well and prospering" translates very unnaturally.
This is called "Dear Sirs," according to English habits.
Suppose that it is registered in the fixed form data so that
【0052】定型文編集処理S200のS510におい
て、定型見出文として「拝啓、貴社ますますご清栄のこ
ととお慶び申し上げます」が入力される。これは未登録
であるとし(S520:NO)、ここで見出語訳文”D
ear Sirs,”が入力されて(S530)、S5
50で活用部分の指定の有無が判断される。この場合、
「〜申し上げる」というような表現の揺れは存在しない
ので、このままの定型見出文でよい。よってS550:
NOであり、そのまま登録の手順(S590)へ移行す
る。S590で定型文データ記憶部16の定型見出文フ
ィールド40と定型訳文フィールド44へ登録して、S
510へ戻る。さらに次の定型見出文が入力されなけれ
ば(S510:NO)、定型文編集処理を終了する。In step S510 of the standard sentence editing process S200, "Dear sir, I am grateful to you for your continued pleasure" is input as a standard heading. This is assumed to be unregistered (S520: NO), and here, the headword translation "D
ear Sirs, "is input (S530), and S5
At 50, it is determined whether or not a designated portion is designated. in this case,
Since there is no fluctuation in the expression such as “I say,” the fixed headings may be used as they are. Therefore S550:
No, and the process directly proceeds to the registration procedure (S590). In step S590, the standard sentence field 40 and the standard translation field 44 of the standard text data storage unit 16 are registered.
Return to 510. If the next fixed entry is not input (S510: NO), the fixed sentence editing process ends.
【0053】この状態で入力文「拝啓、貴社ますますご
清栄のこととお慶び申し上げます。」に対して、ユーザ
により入力部2から翻訳処理S160が実行される。In this state, a translation process S160 is executed by the user from the input unit 2 for the input sentence "Dear sir, I am grateful to you for your continued pleasure."
【0054】まずS250において、形態素解析処理で
定型見出文が検索され、形態素解析結果「拝啓、貴社ま
すますご清栄のこととお喜び申し上げます<定型見出文
>/。<句点>」を得、S260、S400へ移行す
る。S400では、定型見出文が検索されるので(S4
00:YES)、S410へ移行する。S410で、活
用部分が存在しない、すなわち文末が活用しないので
(S410:NO)、S420でそのまま定型訳文に置
き換えられて、この入力文に対する翻訳処理を終了す
る。First, in step S250, a morphological analysis process is performed to search for a fixed-form headword, and the morphological analysis result “Dear Sirs, I am delighted that your company is becoming more and more prosperous <standard-form headline> /. , S260, and S400. In S400, the standard entry is searched (S4
00: YES), and proceeds to S410. In S410, since there is no useful part, that is, the end of the sentence is not used (S410: NO), in S420, the sentence is replaced as it is with the fixed form translation, and the translation process for this input sentence ends.
【0055】また、図3に示してあるように、活用する
部分を含む例として、「新美だ」を登録した場合を例に
挙げる。これは、翻訳したいテキスト内の入力文の表現
として、「新美です」または「新美でございます」等の
表現が可能である。同時に、ここでは、機械翻訳で翻訳
できる文章であるが、「こちらはブラザー工業の新美で
す」と入力する手間を省いて、かつ所望する英文”Th
is is NIIMI, Brother Indu
stries, Ltd.”を得るために登録する場合
を例にとるものとする。Further, as shown in FIG. 3, as an example including a part to be used, a case where "Nimi-da" is registered will be described. This can be an expression such as "I am Niimi" or "I am Niimi" as the expression of the input sentence in the text to be translated. At the same time, here is a sentence that can be translated by machine translation, but it saves the trouble of inputting "This is the new beauty of Brother Industries" and the desired English sentence "Th
is is NIIMI, Brother Indu
stories, Ltd. Take the example of registration in order to obtain ".
【0056】図5に示す定型文編集処理S200のS5
10において、定型見出文として「新美だ」が入力され
る。これは未登録であるとし(S520:NO)、次
に、見出語訳文”This is NIIMI, Br
other Industires, Ltd.”が入
力される(S530)。ここでユーザによる活用部分の
指定をするが(S550)、この場合、「〜です」「〜
でございます」というような表現の揺れは存在するので
ユーザにより活用部分「だ」が示されて(S550:Y
ES)、この部分が抽出され(S560)、「だ」が助
動詞であり、形容動詞型の活用を行い、助動詞「です」
と置き換え可能であることが推定され(S570)、定
型見出文を「新美」にし、活用部分「だ」とし(S58
0)、「新美」を定型見出文フィールド40へ、「だ」
を活用部分フィールド42へ、英文を定型訳文フィール
ド44へそれぞれ登録して(S590)、S510へ戻
る。さらに次の定型見出文が入力されなければ(S51
0:NO)、定型文編集処理を終了する。S5 of the fixed phrase editing process S200 shown in FIG.
At 10, "Nimi-da" is input as a standard entry. It is assumed that this is not registered (S520: NO), and then the headword translation “This is NIIMI, Br”
other Industries, Ltd. Is input (S530). Here, the user designates a part to be used (S550).
There is a fluctuation of the expression such as "I am there," so the user indicates the utilization part "da" (S550: Y
ES), this part is extracted (S560), "da" is an auxiliary verb, and the adjective verb type is used, and the auxiliary verb "is"
It is presumed that it can be replaced with (S570), the fixed heading is changed to "Nimi", and the utilized part is set to "Da" (S58).
0), "Niimi" is added to the fixed entry field 40, "Da"
Is registered in the utilization part field 42 and the English sentence is registered in the fixed translation field 44 (S590), and the process returns to S510. If the next fixed heading is not input (S51)
0: NO), and ends the fixed phrase editing process.
【0057】この状態でユーザにより入力部2から入力
文「新美です。」が入力され、翻訳処理が実行される
(S160)。In this state, the input sentence "Nimi is." Is input from the input unit 2 by the user, and the translation process is executed (S160).
【0058】まず形態素解析処理において、定型見出文
が検索され、形態素解析結果「新美<定型見出文>/で
す<助動詞>/。<句点>」を得(S250)、S26
0、S400へ移行する。S400では、定型見出文が
検索されているので(S400:YES)、S410へ
移行する。S410で、活用部分「だ」が存在してい
る、すなわち文末が活用するので(S410:YE
S)、へ移行する。First, in the morphological analysis processing, the fixed head sentence is searched, and the result of the morphological analysis is obtained as “Niimi <fixed head sentence> / is <auxiliary verb> /. <Phrase point>” (S250), S26
0, and proceed to S400. In S400, since the fixed entry is searched (S400: YES), the process proceeds to S410. In S410, since the use part “da” exists, that is, the end of the sentence is used (S410: YE
S), proceed to.
【0059】形態素解析結果の「です」と活用部分
「だ」が等価であり、「です」は不要な解として削除さ
れ(S430)、定型訳文に置き換えられて(S42
0)、この入力文に対する翻訳処理を終了する。The result of the morphological analysis, “da” and the utilized part “da” are equivalent, and “da” is deleted as an unnecessary solution (S430), and is replaced with a fixed form translation (S42).
0), the translation process for this input sentence ends.
【0060】尚、本発明は上記した実施の形態に限定さ
れるものではなく、種々の変更を加えることができる。
例えば、本実施の形態は日本語を英語に翻訳する場合を
例に説明したが、機械翻訳における形態素解析−構文解
析−変換−構文生成−形態素生成という一連の流れの翻
訳処理は他の言語においても同様であり、また、定型文
を扱うこともまた、言語を問わない。従って、本発明
は、異なった言語間の翻訳処理について適用可能である
ことは、言うまでもない。Note that the present invention is not limited to the above-described embodiment, and various changes can be made.
For example, although the present embodiment has been described by taking as an example the case of translating Japanese into English, translation processing in a series of flows of morphological analysis-syntax analysis-conversion-syntax generation-morpheme generation in machine translation is performed in other languages. Is also the same, and the handling of fixed phrases is not limited to any language. Therefore, it is needless to say that the present invention is applicable to a translation process between different languages.
【0061】なお、本実施例においては、活用部分は文
末にある「だ」「です」の場合を例にしたが、本発明に
いう活用とは、本来の単語の語尾部分の変化のみなら
ず、助動詞の付加などを含む広い概念である。本実施の
形態の例では、原言語文に日本語を例に取ったため、日
本語の活用部分は文末にあるのが一般的で、例えば英語
であれば動詞部の「is」が、「isn’t」となるよ
うな場合や「do」が、「will do」になるよう
な場合の活用を許容する構成であってもよい。この場合
は、活用部分が文中にあるので、活用部分により分割さ
れた活用しない部分及び活用部分には、それぞれ接続情
報を付与することにより、分割された部分を一体に扱う
ことで、本実施の形態と同様の処理が可能になるのは容
易に理解されるものである。In the present embodiment, the case where the inflected part is "da" and "is" at the end of the sentence is taken as an example. However, in the present invention, the inflected part means not only the change of the ending part of the original word but also the change. It is a broad concept including the addition of auxiliary verbs. In the example of the present embodiment, Japanese is used as an example of the source language sentence. Therefore, it is common that the part utilizing Japanese is at the end of the sentence. For example, in the case of English, the verb "is" is replaced with "isn" A configuration that allows utilization in cases where “t” or “do” becomes “will do” may be used. In this case, since the utilized portion is in the sentence, the unutilized portion and the utilized portion divided by the utilized portion are each provided with connection information, so that the divided portions are integrally handled, thereby implementing the present embodiment. It is easily understood that the same processing as that of the embodiment can be performed.
【0062】さらに、活用部分を複数含むような文章で
あっても、同様な処理をすることにより本発明の適用が
可能である。Further, the present invention can be applied to a sentence including a plurality of utilized portions by performing the same processing.
【0063】また本実施の形態では、活用部分の品詞な
どの類推と、可能な表現の揺れはシステム内部のS43
0で決めて行ったが、ユーザインターフェースのメニュ
ーの中に設定できるようにしてもよい。例えば、見出語
が動詞の命令形であった場合には「て下さい」と等価に
するなど、である。定型文は完璧な翻訳が不可能である
機械翻訳システムには救いであるが、同時に「やりす
ぎ」があっては不都合である。これをユーザが細かくコ
ントロールできるようにすれば、ユーザの自由が広が
り、翻訳精度の向上と後編集の軽減が可能になる。In the present embodiment, the analogy of the part of speech of the utilized part and the fluctuation of the possible expression are determined in S43 inside the system.
Although it was decided to be 0, it may be set in a menu of the user interface. For example, if the entry is in the verb imperative form, it is equivalent to "Please". Boilerplate sentences are a rescue for machine translation systems where perfect translation is not possible, but at the same time it is inconvenient if there is too much. If this can be finely controlled by the user, the freedom of the user can be expanded, and the translation accuracy can be improved and post-editing can be reduced.
【0064】更に、本実施形態の機械翻訳装置は、辞書
編集プログラムと、形態素解析プログラムと、解析プロ
グラムと、品詞判定プログラムと、見出語分割プログラ
ムと、判定プログラムと、前後判断プログラムと、見出
語復活プログラムとがROMに予め格納されたものであ
るが、本発明は必ずしもこれに限定されるものではな
い。例えば、これらのプログラムをフロッピーディスク
やCD−ROMなどに格納したものを読み取り装置によ
り読み取って、インストールさせて動作させることがで
きる。また、有線もしくは無線回線を使用して外部情報
処理装置からプログラムを読み込んで動作させることが
できる。この場合、前記フロッピーディスクやCD−R
OMや、外部情報処理装置の当該プログラムを格納した
メモリが本発明の記録媒体を構成することとなる。Further, the machine translation apparatus of this embodiment includes a dictionary editing program, a morphological analysis program, an analysis program, a part of speech determination program, a headword division program, a determination program, a before / after determination program, The word recovery program is stored in the ROM in advance, but the present invention is not necessarily limited to this. For example, a program in which these programs are stored in a floppy disk, CD-ROM, or the like can be read by a reading device, installed, and operated. In addition, a program can be read and operated from an external information processing device using a wired or wireless line. In this case, the floppy disk or CD-R
The OM and the memory of the external information processing device that stores the program constitute the recording medium of the present invention.
【0065】[0065]
【発明の効果】以上説明したことから明かなように、本
発明の請求項1に記載の機械翻訳装置によれば、定型文
が活用部分を含むため、定型文が変形され、入力文が通
常の機械翻訳では困難な元の定型文とは異なるものにな
っても、活用しない部分を新たに定型見出文とすること
で、変形された定型文を検出することができ、活用しな
い部分を定型文として定型訳文に置換え、活用部分は、
これと関連付けて処理することで、定型文の処理範囲を
広げ、高品質の翻訳を容易に得ることができ、後編集も
定型訳文の僅かな修正ですむため極めて容易高品質な翻
訳作業を短時間に処理できるという効果がある。As is apparent from the above description, according to the machine translation apparatus according to the first aspect of the present invention, since the fixed sentence includes a part to be used, the fixed sentence is transformed, and the input sentence is usually changed. Even if it becomes different from the original fixed sentence that is difficult with machine translation, it can detect the deformed fixed sentence by making the unused part a new fixed heading sentence, Replace it with a fixed translation as a fixed sentence,
By processing in conjunction with this, the processing range of fixed phrases can be expanded, and high-quality translations can be easily obtained. There is an effect that processing can be performed in time.
【0066】特に、活用部分指定手段は、文末が活用す
る場合、どの部分が活用するかをユーザが指定すること
ができ、登録手段は、活用する部分を有する場合に、定
型見出文の活用しない部分を定型見出文として、活用す
る部分を活用部分として分けて前記定型文データに登録
ことができる。In particular, the utilization part designation means allows the user to designate which part is to be utilized when the end of the sentence is utilized, and the registration means is provided for utilizing the fixed entry sentence when there is a utilized part. The part not to be used can be registered as the standard sentence data while the part to be utilized is divided as the utilization part and the part to be utilized is divided as the utilization part.
【0067】特に活用させたい部分と活用させたくない
部分をユーザが指定できるようにしてあるため、変形さ
れた定型文について、定型文として扱うか定型文でない
文章として扱うかユーザの思う通りの結果を得ることが
できるという効果がある。つまり、定型文を登録する際
に、活用する部分を指定することにより、例えば敬体・
常体の変化は許容するがそれ以上の変化は認めないな
ど、定型文として認める範囲をユーザが特定でき、一定
の変化は認めるが、それ以上お変化は認めないなど、ユ
ーザの思い通りに変化した定型文を扱うことが可能にな
るという効果がある。その結果精度の高い目的言語の翻
訳結果を、より少ない手間で得ることができるという効
果を生じる。In particular, since the user can designate a part to be used and a part not to be used, the user can specify whether the modified fixed sentence is to be treated as a fixed sentence or a non-fixed sentence. Is obtained. In other words, when registering a fixed phrase, by specifying the part to be used, for example,
The user can specify the range that can be recognized as a fixed sentence, such as allowing the change of the normal state but not further change, and the user has changed as desired, such as accepting a certain change, but not accepting any further change There is an effect that it is possible to handle fixed phrases. As a result, there is an effect that a translation result of the target language with high accuracy can be obtained with less labor.
【0068】更に、変形した定型文は形態素解析をしな
いで対応する定型訳文にそのまま置換えるので処理の高
速化を図ることもできるという効果がある。また、請求
項2に記載の、機械翻訳処理プログラムを記録したコン
ピュータ読み取り可能な記録媒体によれば、コンピュー
タに、定型文が活用部分を含むため、定型文が変形さ
れ、入力文が通常の機械翻訳では困難な元の定型文とは
異なるものになっても、活用しない部分を新たに定型見
出文とすることで、変形された定型文を検出することが
でき、活用しない部分を定型文として定型訳文に置換
え、活用部分は、これと関連付けて処理する手順を実行
させることができる。そのため、定型文の処理範囲を広
げ、高品質の翻訳を容易に得ることができ、後編集も定
型訳文の僅かな修正ですむため極めて容易高品質な翻訳
作業を短時間に処理させることができるという効果があ
る。Further, since the transformed fixed sentence is directly replaced with the corresponding fixed-form translated sentence without performing morphological analysis, the processing can be speeded up. Further, according to the computer-readable recording medium on which the machine translation processing program is recorded, since the fixed sentence includes a part to be used, the fixed sentence is deformed, and the input sentence is converted to a normal machine. Even if it is different from the original fixed phrase that is difficult to translate, the part that is not used can be newly detected as a fixed phrase, so that the transformed fixed phrase can be detected. Can be replaced with a fixed form translation, and the utilized part can be executed in association with this. Therefore, the processing range of fixed phrases can be expanded, and high-quality translations can be easily obtained. Post-editing can be performed with only minor corrections of fixed-line translations, making it extremely easy to process high-quality translations in a short time. This has the effect.
【0069】特に、活用部分指定の手順は、文末が活用
する場合、どの部分が活用するかをユーザが指定するこ
とができ、登録の手順は、活用する部分を有する場合
に、定型見出文の活用しない部分を定型見出文として、
活用する部分を活用部分として分けて前記定型文データ
に登録ことができる。その結果として、定型文を登録す
る際に、活用する部分を指定することにより、形態素解
析の際に定型文が適合する枠を広げ、より精度の高い目
的言語の翻訳結果を、より少ない手間で得ることができ
る効果がある。In particular, in the procedure for specifying the part to be used, when the end of the sentence is used, the user can specify which part is to be used. The part that does not utilize is a fixed heading,
The part to be used can be registered as the part to be used in the fixed form data. As a result, when registering a fixed phrase, by specifying the part to be utilized, the frame to which the fixed phrase is adapted during morphological analysis is expanded, and the translation result of the target language with higher accuracy can be reduced with less effort. There is an effect that can be obtained.
【0070】更に、変形した定型文は形態素解析をしな
いで対応する定型訳文にそのまま置換えるので、コンピ
ュータに高速な処理を実行させることができるという効
果がある。Further, since the transformed fixed sentence is directly replaced with the corresponding fixed translation without performing morphological analysis, there is an effect that the computer can execute high-speed processing.
【図1】本実施形態の機械翻訳装置の全体構成を示すブ
ロック図である。FIG. 1 is a block diagram illustrating an overall configuration of a machine translation device according to an embodiment.
【図2】本実施形態の辞書のデータの構成の説明図であ
る。FIG. 2 is an explanatory diagram of a data structure of a dictionary according to the embodiment.
【図3】本実施形態の定型文データのデータの構成の説
明図である。FIG. 3 is an explanatory diagram of a data configuration of fixed phrase data according to the embodiment;
【図4】本実施形態の機械翻訳装置の動作を表わすフロ
ーチャートである。FIG. 4 is a flowchart illustrating an operation of the machine translation device of the present embodiment.
【図5】本実施形態の機械翻訳装置の定型文編集処理の
流れを表わすフローチャートである。FIG. 5 is a flowchart illustrating a flow of a fixed sentence editing process of the machine translator according to the embodiment.
【図6】本実施形態の機械翻訳装置の翻訳処理の流れを
表わすフローチャートである。FIG. 6 is a flowchart illustrating a flow of a translation process of the machine translation device of the present embodiment.
2 入力部(入力手段) 4 外部記憶装置 6 表示部(表示手段) 7 表示制御部(表示手段) 10 制御部 12 翻訳辞書(翻訳辞書) 16 定型文データ記憶部(定型文データ記憶手段) 18 CPU 20 ROM 22 RAM 202 制御プログラム 204 翻訳プログラム(翻訳手段) 206 形態素解析プログラム(形態素解析手段) 208 構文解析プログラム(構文解析手段) 210 変換プログラム 212 生成プログラム 214 定型文編集プログラム(定型文編集手段) 216 定型文分割プログラム(定型文分割手段) 218 活用部分指定プログラム(活用部分指定手段) 220 定型文置換プログラム 222 作業領域 224 原言語文記憶領域(原言語文記憶手段) 226 訳文記憶領域 Reference Signs List 2 input unit (input means) 4 external storage device 6 display unit (display means) 7 display control unit (display means) 10 control unit 12 translation dictionary (translation dictionary) 16 fixed sentence data storage unit (fixed sentence data storage means) 18 CPU 20 ROM 22 RAM 202 control program 204 translation program (translation means) 206 morphological analysis program (morphological analysis means) 208 syntax analysis program (syntax analysis means) 210 conversion program 212 generation program 214 fixed form editing program (fixed form editing means) 216 Fixed sentence segmentation program (fixed sentence segmentation means) 218 Utilization part designation program (utilization segment designation means) 220 Fixed sentence replacement program 222 Work area 224 Source language sentence storage area (source language sentence storage means) 226 Translated sentence storage area
Claims (2)
語文記憶手段と、 原言語による見出語、前記見出語の品詞、前記見出語に
対応する目的言語の訳語を含む単語情報と、形態素解析
処理に必要な接続情報を含む文法情報とを格納している
翻訳辞書と、 前記原言語の任意の語句の並びである定型見出文と、前
記定型見出文に対応する目的言語の訳語句の並びである
定型訳文との対からなる定型文データを複数記憶した定
型文データ記憶手段と、 前記翻訳辞書と前記定型文データ記憶手段を用いて、前
記原言語文について前記見出語と前記定型見出文とを検
索することにより形態素解析を行う形態素解析手段と、
前記形態素解析手段により与えられた前記原言語文の形
態素解析の結果に基づいて構文解析を行う構文解析手段
とを有し、前記原言語文を目的言語文に翻訳する翻訳手
段と、 前記翻訳された目的言語文を表示する表示手段とを備え
た機械翻訳装置であって、 前記定型文データ記憶手段は、新たな定型文データを追
加して登録し、または、既に登録されている定型文デー
タを修正して登録する定型文編集手段を有し、 前記定型文編集手段は、新たに追加され又は修正された
前記定型見出文と前記定型訳文の対からなる定型文デー
タを登録する際に、前記定型見出文が活用可能な部分を
含む場合に、当該部分を任意指定する活用部分指定手段
と、 前記登録しようとする定型見出文を、前記活用部分指定
手段により指定された活用する部分と、当該定型見出文
から活用する部分を除いた活用しない部分とに分割し、
前記活用しない部分を新たな定型見出文とする定型文分
割手段とを有することを特徴とする機械翻訳装置。An input unit for inputting a source language sentence; a source language sentence storage unit for storing the source language sentence input by the input unit; a headword in the source language; a part of speech of the headword; A translation dictionary storing word information including a translation of the target language corresponding to the headword and grammatical information including connection information necessary for morphological analysis processing; and a fixed form which is an array of arbitrary phrases in the source language. A fixed sentence data storage unit storing a plurality of fixed sentence data each comprising a pair of an entry sentence and a fixed translation that is a sequence of translated phrases of the target language corresponding to the fixed entry, the translation dictionary and the fixed sentence A morphological analysis unit that performs a morphological analysis by searching the headword and the fixed headword for the source language sentence using a data storage unit;
Syntactic analysis means for performing syntax analysis based on the result of the morphological analysis of the source language sentence given by the morphological analysis means, translation means for translating the source language sentence into a target language sentence, Display means for displaying the target language sentence, wherein the fixed form data storage means adds and registers new fixed form data, or the fixed form data already registered Has fixed form editing means for correcting and registering the fixed form sentence editing means, when registering the fixed form sentence data consisting of a pair of the newly added or corrected fixed form head sentence and the fixed form translation sentence When the standard heading includes a part that can be utilized, a utilization part designating unit arbitrarily designating the part, and utilizing the standard heading to be registered designated by the utilization part designating unit Part and this It is divided into non-utilized parts excluding the parts to be utilized from the fixed headings,
A machine translation unit comprising: a fixed sentence dividing unit that uses the unused portion as a new fixed entry.
機械翻訳処理のための機械翻訳処理プログラムを記録し
た記録媒体であって、 コンピュータに、 原言語文を入力する入力の手順と、 前記入力手段により入力された原言語文を記憶する原言
語文記憶の手順と、 原言語による見出語、前記見出語の品詞、前記見出語に
対応する目的言語の訳語を含む単語情報と、形態素解析
処理に必要な接続情報を含む文法情報とを格納している
翻訳辞書と、前記原言語の任意の語句の並びである定型
見出文と、前記定型見出文に対応する目的言語の訳語句
の並びである定型訳文との対からなる定型文データを複
数記憶した定型文データ記憶手段とを用いて、前記原言
語文について前記見出語と前記定型見出文とを検索する
ことにより形態素解析を行う形態素解析の手順と、前記
形態素解析の手順により与えられた前記原言語文の形態
素解析の結果に基づいて構文解析を行う構文解析に手順
とを有し、前記原言語文を目的言語文に翻訳する翻訳の
手順と、 前記翻訳された目的言語文を表示する表示の手順とを実
行させる機械翻訳処理プログラムであって、 前記定型文データ記憶の手順において、新たな定型文デ
ータを追加して登録し、及び既に登録されている定型文
データを修正して登録する定型文編集の手順と、 前記定型文編集の手順において、新たに追加され又は修
正された前記定型見出文と前記定型訳文の対からなる定
型文データを登録する際に、前記定型見出文が活用可能
な部分を含む場合に、当該部分を任意指定する活用部分
指定の手順と、 前記登録しようとする定型見出文を、前記活用部分指定
の手順により指定された活用する部分と、当該定型見出
文から活用する部分を除いた活用しない部分とに分割
し、前記活用しない部分を新たな定型見出文とする定型
文分割の手順とを実行させる機械翻訳処理プログラムを
記録したコンピュータ読み取り可能な記録媒体。2. A recording medium storing a machine translation processing program for machine translation processing for translating a source language sentence into a target language sentence, comprising: A source language sentence storage procedure for storing the source language sentence input by the input means, and word information including a headword in the source language, a part of speech of the headword, and a target language translation corresponding to the headword. A translation dictionary storing grammatical information including connection information necessary for morphological analysis processing, a fixed-form heading which is an array of arbitrary phrases in the source language, and an object corresponding to the fixed-form heading Searching for the headword and the fixed head sentence for the source language sentence using fixed sentence data storage means storing a plurality of fixed sentence data which are pairs of fixed sentence data which are a sequence of language translation phrases Form that performs morphological analysis A step of parsing, and a step of parsing which performs parsing based on a result of the morphological analysis of the source language sentence given by the step of morphological analysis, translating the source language sentence into a target language sentence And a display procedure for displaying the translated target language sentence, wherein in the fixed form data storage procedure, new fixed form data is added and registered. And a fixed sentence editing procedure for correcting and registering already registered fixed sentence data; and in the fixed sentence editing procedure, the newly added or corrected fixed entry sentence and the fixed translation When registering a set of fixed phrase data, if the fixed phrase includes a usable portion, a procedure for specifying a part to be used to arbitrarily specify the portion; ,Previous A standard sentence segmentation that is divided into a part to be used designated by the procedure for specifying a part to be used and a part not to be used by removing the part to be used from the fixed heading, and the part not to be used to be a new fixed heading. And a computer-readable recording medium on which a machine translation processing program for executing the above steps is recorded.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10103926A JPH11282846A (en) | 1998-03-30 | 1998-03-30 | Machine translation apparatus and computer-readable recording medium recording machine translation processing program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10103926A JPH11282846A (en) | 1998-03-30 | 1998-03-30 | Machine translation apparatus and computer-readable recording medium recording machine translation processing program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11282846A true JPH11282846A (en) | 1999-10-15 |
Family
ID=14367046
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10103926A Withdrawn JPH11282846A (en) | 1998-03-30 | 1998-03-30 | Machine translation apparatus and computer-readable recording medium recording machine translation processing program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11282846A (en) |
-
1998
- 1998-03-30 JP JP10103926A patent/JPH11282846A/en not_active Withdrawn
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR900008375B1 (en) | Machine translation system | |
| KR900008769B1 (en) | Machine Translation System | |
| EP0370774A2 (en) | Machine translation system | |
| JPH09259127A (en) | Translation device | |
| JP4869281B2 (en) | Machine translation apparatus, program and method | |
| JPH11282846A (en) | Machine translation apparatus and computer-readable recording medium recording machine translation processing program | |
| JPS62271057A (en) | Dictionary register system for translation device | |
| JP3692711B2 (en) | Machine translation device | |
| JP3999771B2 (en) | Translation support program, translation support apparatus, and translation support method | |
| JP3131432B2 (en) | Machine translation method and machine translation device | |
| JPH11282845A (en) | Machine translation apparatus and computer-readable recording medium recording machine translation processing program | |
| JP2938897B2 (en) | Document creation processing device | |
| JP3147947B2 (en) | Machine translation equipment | |
| JP2000137709A (en) | Machine translation apparatus and computer-readable recording medium recording machine translation processing program | |
| JPS62271056A (en) | Dictionary registration method in translation device | |
| JP3233800B2 (en) | Machine translation equipment | |
| JPH09160920A (en) | Machine translation equipment | |
| JPH11328176A (en) | Machine translation apparatus and computer-readable recording medium recording machine translation processing program | |
| JPH0773185A (en) | Machine translation device and method | |
| JPH10171804A (en) | Machine translation equipment | |
| JPH10134054A (en) | Sentence preparation support device | |
| JPH10320391A (en) | Machine translation apparatus and computer-readable recording medium recording machine translation processing program | |
| JPH07141375A (en) | Machine translation device | |
| JPH10340264A (en) | Machine translation device and computer-readable recording medium where machine translation processing program is recorded | |
| JPS62271055A (en) | Translation editing method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040329 |
|
| A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20060220 |