JPH07253981A - Machine translation system - Google Patents

Machine translation system

Info

Publication number
JPH07253981A
JPH07253981A JP6070135A JP7013594A JPH07253981A JP H07253981 A JPH07253981 A JP H07253981A JP 6070135 A JP6070135 A JP 6070135A JP 7013594 A JP7013594 A JP 7013594A JP H07253981 A JPH07253981 A JP H07253981A
Authority
JP
Japan
Prior art keywords
translation
english
japanese
character string
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6070135A
Other languages
Japanese (ja)
Inventor
Masaharu Nii
正治 仁井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Printing Co Ltd filed Critical Toppan Printing Co Ltd
Priority to JP6070135A priority Critical patent/JPH07253981A/en
Priority to US08/403,958 priority patent/US5659765A/en
Priority to EP95301677A priority patent/EP0672989A3/en
Publication of JPH07253981A publication Critical patent/JPH07253981A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To improve the translation capability of a machine translation system by additionally registering an example of original-translation in an original-translation data base. CONSTITUTION:First and second language character strings are preliminarily generated as a translation example (original-translation). The first language character string is inputted to a first language character string input means 3, and the second language character string obtained by translating the first language character string to the second language is inputted to a second language character string input means 4. Inputted first and second language character strings are displayed on a display means 5. A correspondence means 6 makes first and second language character strings displayed on the display means 5 correspond to each other. A register means 7 registers first and second language character strings, which are made correspond to each other, in an original-translation data base 1. At the time of translation, a translating means 2 retrieves the first language character string, which is a similar or exact equivalent expression for an original character string, from the original-translation data base and translates the original character string to the second language based on the second language character string corresponding to the retrieved first language character string.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は機械翻訳システム、詳し
くは翻訳例を学習することにより翻訳能力を向上可能な
機械翻訳システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation system, and more particularly to a machine translation system capable of improving translation ability by learning translation examples.

【0002】[0002]

【従来の技術】近年のコンピュータ技術の発展は、自動
翻訳を行う機械翻訳システムを生み出した。現在、実用
化されている機械翻訳システムの多くは、構文変換方式
と呼ばれる翻訳方式を採用したものである。構文変換方
式を用いた機械翻訳システムの処理の概要を図31を用
いながら説明する。
2. Description of the Related Art Recent developments in computer technology have created machine translation systems that perform automatic translation. Most of the machine translation systems currently in practical use employ a translation method called a syntax conversion method. An outline of the processing of the machine translation system using the syntax conversion method will be described with reference to FIG.

【0003】例えば、「Development of
・・・・」という英文が機械翻訳システムに入力された
とする。入力された英文は単語に分解され、分解した単
語の品詞(名詞(n)、他動詞(vt)、・・・)が決
定される(形態素解析)。そして、予め定められた文法
規則に基づき入力英文の構造が解析され、入力英文は名
詞句(NP)、動詞句(VP)等に分解される(構文解
析)。このように解析された構文は他の言語(日本語)
に変換され、形態素生成を経て「計算機科学と言語学の
発展は機械翻訳に対して道を開けた」という邦文が生成
される。
For example, "Development of
It is assumed that the English sentence "..." is input to the machine translation system. The input English sentence is decomposed into words, and the part of speech (noun (n), transitive verb (vt), ...) Of the decomposed word is determined (morphological analysis). Then, the structure of the input English sentence is analyzed based on a predetermined grammatical rule, and the input English sentence is decomposed into noun phrases (NP), verb phrases (VP), etc. (syntactic analysis). The syntax parsed in this way is in another language (Japanese)
After being converted to, morpheme generation produces a Japanese sentence "The development of computer science and linguistics has paved the way for machine translation."

【0004】しかしながら、構文変換方式による機械翻
訳システムは、文法規則のみによって翻訳を行うため、
文法規則から離れた表現を行うことはできず、上述した
ように不自然な訳が出力されるという問題がある。ま
た、翻訳品質を向上させようとした場合、文法規則を追
加しなければならないが、文法規則が干渉し合って逆に
翻訳品質が低下するという問題も生じる。
However, since the machine translation system based on the syntax conversion system translates only by the grammatical rules,
There is a problem that an expression that is far from the grammar rules cannot be made, and an unnatural translation is output as described above. Further, in order to improve the translation quality, it is necessary to add grammatical rules, but the grammatical rules interfere with each other, which causes a problem that the translation quality is deteriorated.

【0005】そこで、近年、実例(翻訳例)に基づく翻
訳を行うEBMT(Example-BasedMachine Translatio
n)方式の機械翻訳システムが提案された(Nagao,M A F
ramework of a Mechanical Translation between Japan
ese and English by Analogy Principle, in ARTIFICIA
L AND HUMAN INTELLIG-ENCE(Elithorn & Banerji,Ed
s.),Elsevier Science Publishers,pp173-180,1984)。
このEBMT方式の機械翻訳システムは、翻訳対象とな
る原文に最も類似した翻訳例を検索し、この翻訳例に基
づき翻訳を行うというものである。このEBMT方式に
よる機械翻訳システムを実現するための具体的な実現手
段は未だ案出されていないが、およそ図32に示される
ような処理を行うものと考えられる。
Therefore, in recent years, EBMT (Example-Based Machine Translatio) for performing translation based on actual examples (translation examples)
n) type machine translation system was proposed (Nagao, MAF
ramework of a Mechanical Translation between Japan
ese and English by Analogy Principle, in ARTIFICIA
L AND HUMAN INTELLIG-ENCE (Elithorn & Banerji, Ed
s.), Elsevier Science Publishers, pp 173-180, 1984).
This EBMT-based machine translation system searches for a translation example that is most similar to the original text to be translated and translates based on this translation example. Although no specific means for realizing the machine translation system based on the EBMT method has been devised, it is considered that the processing shown in FIG. 32 is performed.

【0006】EBMT方式による機械翻訳システムにあ
っては、構文解析の処理において、過去の翻訳例に基づ
き原文の構文解析(NP、VP等)を行い、構文解析結
果に基づき構文変換を行うことにより原文の訳を生成す
るものである。
In the machine translation system based on the EBMT method, in the syntax analysis process, the original text is syntactically analyzed (NP, VP, etc.) based on past translation examples, and the syntactical conversion is performed based on the syntactic analysis result. It produces a translation of the original text.

【0007】[0007]

【発明が解決しようとする課題】上述した従来の機械翻
訳システムは以下に示すように種々の問題を抱えてい
た。
The conventional machine translation system described above has various problems as described below.

【0008】第1に、ユーザが翻訳能力を向上させるこ
とは困難であった。構文変換方式による機械翻訳システ
ムにあっては、翻訳能力の向上を行うためには、文法規
則および構文規則を書き換える必要がある。ところが、
文法規則および構文規則はプログラムとして機械翻訳シ
ステムに組み込まれているため、文法規則および構文規
則の書換えを行うことができる者はシステム開発者に限
定されていた。したがって、ユーザは翻訳品質を向上さ
せることはできず、ユーザが機械翻訳システムに所望の
翻訳を行わせることは不可能であった。例えば、不所望
の翻訳結果が出力された場合に、ユーザが翻訳結果を修
正したとしても、同一の原文に対しては繰り返し不所望
の翻訳結果が出力されてしまう。このため、ユーザは過
大な修正作業を強いられていた。
First, it has been difficult for the user to improve the translation ability. In the machine translation system using the syntax conversion method, it is necessary to rewrite the grammar rules and the syntax rules in order to improve the translation ability. However,
Since the grammar rules and the syntax rules are incorporated in the machine translation system as a program, the system developers are limited to those who can rewrite the grammar rules and the syntax rules. Therefore, the user cannot improve the translation quality, and it is impossible for the user to cause the machine translation system to perform a desired translation. For example, when an undesired translation result is output, even if the user corrects the translation result, the undesired translation result is repeatedly output for the same original sentence. For this reason, the user has been forced to make excessive correction work.

【0009】また、EBMT方式による機械翻訳システ
ムは具体的には実現されていないが、理論的には翻訳例
を追加登録することにより翻訳能力を向上させることは
可能である。ところが、オペレータは、追加登録された
翻訳例の文法解析(NP、VP)等を行わなければなら
ず、オペレータの作業負担が大きくなるという問題が生
じる。
Although the machine translation system based on the EBMT system has not been concretely realized, it is theoretically possible to improve the translation capability by additionally registering a translation example. However, the operator must perform grammatical analysis (NP, VP) of the additionally registered translation example, which causes a problem that the operator's work load increases.

【0010】第2に、翻訳品質の向上には限界があっ
た。構文変換方式による機械翻訳システムにおいて、翻
訳品質を向上させるために文法規則および構文規則を追
加すると、規則の数が増加し、規則同士が干渉しやすく
なる。このため、翻訳品質の向上には限界があり、逆に
規則を追加することにより翻訳品質が低下することもあ
った。
Second, there is a limit to the improvement of translation quality. In a machine translation system using a syntactic conversion method, if grammatical rules and syntactic rules are added to improve translation quality, the number of rules increases, and the rules are likely to interfere with each other. Therefore, there is a limit to the improvement of the translation quality, and conversely, the addition of the rule may reduce the translation quality.

【0011】一方、EBMT方式による機械翻訳システ
ムにあっては、翻訳例を追加することによって翻訳品質
を向上させることは理論的には可能であるが、EBMT
方式による機械翻訳システムの具体的な実現手段は未だ
案出されていない。
On the other hand, in the machine translation system based on the EBMT method, although it is theoretically possible to improve the translation quality by adding a translation example, the EBMT
The concrete realization method of the machine translation system by the method has not been devised yet.

【0012】第3に、自然な翻訳を行うことが困難であ
った。実際の文章は必ずしも文法規則のみにとらわれず
に作成されることが多い。しかしながら、構文変換方式
の機械翻訳システムにあっては、文法規則および構文規
則のみに従い翻訳を行っていたため、翻訳結果は不自然
なものになりやすかった。例えば、上述した英文「De
velopment of・・・・」に対しては、本来
「計算機科学と言語学の発展により機械翻訳への道が開
けた」と訳されるべきであるにも拘らず、「計算機科学
と言語学の発展は機械翻訳に対して道を開けた」という
不自然な訳がなされてしまう。
Third, it was difficult to perform natural translation. Actual sentences are often created without being restricted by grammar rules. However, in the machine translation system of the syntax conversion method, since the translation is performed only according to the grammar rules and the syntax rules, the translation result is likely to be unnatural. For example, the English sentence “De
“Veloping of ...” should be translated as “the path to machine translation has been opened by the development of computer science and linguistics”, but “of computer science and linguistics” The development has paved the way for machine translation. "

【0013】EBMT方式による機械翻訳システムは、
過去の翻訳例に基づき翻訳を行うため、比較的に自然な
訳を出力することが可能である。ところが、EBMT方
式による機械翻訳システムといえども、過去の翻訳例に
基づき文法解析を行っているため、文法から大きく離れ
た慣用的表現に対して自然な訳を出力できない場合が生
じ得る。
A machine translation system based on the EBMT system is
Since the translation is performed based on the past translation examples, it is possible to output a relatively natural translation. However, even in the machine translation system based on the EBMT method, since the grammar analysis is performed based on the past translation examples, there may be a case where a natural translation cannot be output for an idiomatic expression far apart from the grammar.

【0014】本発明は上述した課題に鑑みてなされたも
のであり、本発明の目的は上述した課題を解決すること
にある。
The present invention has been made in view of the above problems, and an object of the present invention is to solve the above problems.

【0015】[0015]

【課題を解決するための手段】請求項1記載の発明は、
第1言語で表された複数の第1言語文字列、および、当
該複数の第1言語文字列を第2言語に訳した複数の第2
言語文字列が登録された対訳データベース1と、第1言
語で表された原文字列に最も類似の、若しくは、同一の
第1言語文字列を対訳データベース1から検索し、検索
された第1言語文字列に対応する第2言語文字列に基づ
き原文字列を第2言語に翻訳する翻訳手段2とを備えた
機械翻訳システムにおいて、第1言語文字列を入力する
第1言語文字列入力手段3と、第1言語文字列を第2言
語に訳した第2言語文字列を入力する第2言語文字列入
力手段4と、第1言語文字列および第2言語文字列を表
示する表示手段5と、表示手段にそれぞれ表示された第
1言語文字列および第2言語文字列を対応付ける対応付
け手段6と、対応付けがなされた第1言語文字列および
第2言語文字列を上記対訳データベースに登録する登録
手段7とを備えたことを特徴とする機械翻訳システムで
ある。
The invention according to claim 1 is
A plurality of first language character strings represented in a first language, and a plurality of second language strings obtained by translating the plurality of first language character strings into a second language.
A first language character string that is most similar to or the same as the original character string represented in the first language is searched from the parallel translation database 1 in which the language character string is registered, and the searched first language is searched. In a machine translation system including a translation means 2 for translating an original character string into a second language based on a second language character string corresponding to a character string, a first language character string input means 3 for inputting a first language character string. A second language character string input means 4 for inputting a second language character string obtained by translating the first language character string into a second language, and a display means 5 for displaying the first language character string and the second language character string. The associating means 6 for associating the first language character string and the second language character string displayed on the display means with each other, and the associated first language character string and the second language character string are registered in the parallel translation database. With registration means 7 It is a machine translation system, wherein the door.

【0016】請求項2記載の発明は、第1言語で表され
た単語が登録された第1言語辞書と、第2言語で表され
た単語が登録された第2言語辞書と、を備え、上記表示
手段に表示された第1言語文字列に、第1言語辞書に未
登録の単語が含まれている場合、または、上記表示手段
に表示された第2言語文字列に、第2言語辞書に未登録
の単語が含まれている場合には、当該未登録の単語を上
記表示手段に表示することを特徴とする請求項1記載の
機械翻訳システムである。
The invention according to claim 2 comprises a first language dictionary in which words in the first language are registered, and a second language dictionary in which words in the second language are registered. If the first language character string displayed on the display means includes a word that has not been registered in the first language dictionary, or if the second language character string displayed on the display means is the second language dictionary. The machine translation system according to claim 1, wherein, when the unregistered word is included in, the unregistered word is displayed on the display means.

【0017】請求項3記載の発明は、請求項1記載の登
録手段は、対応付けがなされた第1言語文字列および第
2言語文字列とともに、対訳番号を対訳データベースに
登録することを特徴とする機械翻訳システムである。
The invention according to claim 3 is characterized in that the registration means according to claim 1 registers the translation number in the translation database together with the associated first language character string and second language character string. Machine translation system.

【0018】請求項4記載の発明は、表示手段にそれぞ
れ表示された第1言語文字列および第2言語文字列を指
し示す対話入力手段を備え、対応付け手段は、指し示さ
れた第1言語文字列および第2言語文字列を対応付ける
ことを特徴とする請求項1記載の機械翻訳システムであ
る。
The invention according to claim 4 is provided with an interactive input means for pointing the first language character string and the second language character string respectively displayed on the display means, and the associating means is the designated first language character. The machine translation system according to claim 1, wherein the strings and the second language character strings are associated with each other.

【0019】請求項5記載の発明は、請求項1に記載の
上記第1言語文字列入力手段および上記第2言語文字列
入力手段は、異なるファイルから文字列を入力すること
を特徴とする機械翻訳システムである。
According to a fifth aspect of the present invention, the first language character string input means and the second language character string input means according to the first aspect input character strings from different files. It is a translation system.

【0020】請求項6記載の発明は、請求項1に記載の
第1言語文字列入力手段および第2言語文字列入力手段
は、同一のファイルから文字列を入力することを特徴と
する機械翻訳システムである。
According to a sixth aspect of the present invention, the first language character string inputting means and the second language character string inputting means according to the first aspect input the character strings from the same file. System.

【0021】[0021]

【作用】請求項1記載の発明において、翻訳例(対訳
例)として第1言語文字列および第2言語文字列を予め
作成しておく。そして、第1言語文字列を第1言語入力
手段に入力し、第1言語文字列を第2言語に訳した第2
言語文字列を第2言語文字列入力手段に入力する。表示
手段は、入力された第1言語文字列および第2言語文字
列を表示する。対応付け手段は、表示手段にそれぞれ表
示された第1言語文字列および第2言語文字列を対応付
ける。そして、登録手段は、対応付けがなされた第1言
語文字列および第2言語文字列を上記対訳データベース
に登録する。翻訳時においては、翻訳手段は、原文字列
に最も類似の、若しくは、同一の第1言語文字列を対訳
データベースから検索し、検索された第1言語文字列に
対応する第2言語文字列に基づき原文字列を第2言語に
翻訳する。
In the invention according to claim 1, the first language character string and the second language character string are created in advance as a translation example (translation example). Then, the first language character string is input to the first language input means, and the first language character string is translated into the second language.
The language character string is input to the second language character string input means. The display means displays the input first language character string and second language character string. The associating unit associates the first language character string and the second language character string displayed on the display unit with each other. Then, the registration means registers the associated first language character string and second language character string in the parallel translation database. At the time of translation, the translation means searches the bilingual database for a first language character string that is most similar to or the same as the original character string, and creates a second language character string corresponding to the searched first language character string. Based on this, the original character string is translated into the second language.

【0022】したがって、本発明によれば、対訳例を対
訳データベースに追加登録することにより、機械翻訳シ
ステムの翻訳能力を向上させることが可能となる。ま
た、オペレータは表示手段に表示された対訳例を見なが
ら、対訳例をデータベースに登録することができるた
め、登録作業を容易に行うことができる。
Therefore, according to the present invention, the translation capability of the machine translation system can be improved by additionally registering the bilingual example in the bilingual database. Further, since the operator can register the parallel translation examples in the database while looking at the parallel translation examples displayed on the display means, the registration work can be easily performed.

【0023】請求項2記載の発明において、表示手段に
表示された第1言語文字列に、第1言語辞書に未登録の
単語が含まれている場合、または、上記表示手段に表示
された第2言語文字列に、第2言語辞書に未登録の単語
が含まれている場合には、表示手段はこれらの未登録の
単語を表示する。したがって、オペレータは、対訳登録
しようとする第1言語文字列および第2言語文字列中に
未登録の単語が存在することを容易に把握することでき
る。
In the invention according to claim 2, when the first language character string displayed on the display means includes a word which is not registered in the first language dictionary, or when the first language character string displayed on the display means is displayed. When the bilingual character string includes unregistered words in the second language dictionary, the display means displays these unregistered words. Therefore, the operator can easily understand that there is an unregistered word in the first language character string and the second language character string to be registered for parallel translation.

【0024】請求項3記載の発明において、請求項1記
載の登録手段は、対応付けがなされた第1言語文字列お
よび第2言語文字列とともに、対訳番号を対訳データベ
ースに登録する。これにより、登録された第1言語文字
列および第2言語文字列の検索が容易になる。
In the invention according to claim 3, the registration means according to claim 1 registers the parallel translation number in the parallel translation database together with the associated first language character string and second language character string. This facilitates the search for the registered first language character string and second language character string.

【0025】請求項4記載の発明において、対話入力手
段は、表示手段にそれぞれ表示された第1言語文字列お
よび第2言語文字列を指し示す。すなわち、ユーザは、
表示手段を見ながら対訳登録すべき第1言語文字列およ
び第2言語文字列を対話形式で指示入力することが可能
である。対訳登録の作業を軽減することができる。
In the invention according to claim 4, the dialogue input means indicates the first language character string and the second language character string respectively displayed on the display means. That is, the user
It is possible to interactively input the first language character string and the second language character string to be registered for parallel translation while observing the display means. The work of parallel translation registration can be reduced.

【0026】請求項5記載の発明において、請求項1に
記載の第1言語文字列入力手段および第2言語文字列入
力手段は、異なるファイルから文字列を入力可能であ
る。したがって、翻訳者等によって異なるファイルに書
き込まれた対訳を、対訳データベースに登録刷ることが
可能となる。
In the invention of claim 5, the first language character string input means and the second language character string input means according to claim 1 can input character strings from different files. Therefore, it is possible to register and print the parallel translations written in different files depending on the translator or the like.

【0027】請求項6記載の発明において、請求項1に
記載の第1言語文字列入力手段および第2言語文字列入
力手段は、同一のファイルから文字列を入力可能であ
る。すなわち、同一ファイルに書き込まれた対訳につい
ても対訳データベースに登録することができる。
In the invention according to claim 6, the first language character string input means and the second language character string input means according to claim 1 can input character strings from the same file. In other words, parallel translations written in the same file can be registered in the parallel translation database.

【0028】[0028]

【実施例】以下に、本発明の一実施例に係る機械翻訳シ
ステムを図面を参照しながら説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS A machine translation system according to an embodiment of the present invention will be described below with reference to the drawings.

【0029】図2は本発明の一実施例に係る機械翻訳シ
ステムを表すブロック図である。本実施例に係る機械翻
訳システムは、翻訳例に基づく翻訳を行うEBMT(Ex
ample-Based Machine Translation)方式によるもの
である。この機械翻訳システムは複数のワークステーシ
ョン等により構成されている。それぞれのワークステー
ションはイーサネット等の通信系2eを介してオンライ
ン接続され、ワークステーション間において後述する辞
書等のデータベース24を送受信可能なものである。図
3にワークステーションの機能ブロック図を示す。この
ワークステーションは、プロセッサおよびメモリ等によ
り構成されたメインフレーム2a、キーボードあるいは
OCR(光学読み取り装置)等の入力部2b、ディスプ
レイ等の表示部2c、辞書データベース24、文書ファ
イル25を備えている。
FIG. 2 is a block diagram showing a machine translation system according to an embodiment of the present invention. The machine translation system according to the present embodiment is an EBMT (Ex.
ample-Based Machine Translation) method. This machine translation system is composed of a plurality of workstations and the like. Each workstation is connected online via a communication system 2e such as Ethernet, and a database 24 such as a dictionary to be described later can be transmitted and received between the workstations. FIG. 3 shows a functional block diagram of the workstation. This workstation is provided with a mainframe 2a composed of a processor and a memory, an input unit 2b such as a keyboard or an OCR (optical reading device), a display unit 2c such as a display, a dictionary database 24, and a document file 25.

【0030】メインフレーム2aは、翻訳例の学習登録
を行う対訳データ登録手段21、翻訳処理を行う翻訳手
段22、辞書管理およびデータベースの送受信を行う辞
書管理手段23の3つの機能を実現するものである。以
下、これらの手段を説明する。
The mainframe 2a realizes the three functions of a parallel translation data registration means 21 for performing learning registration of translation examples, a translation means 22 for translation processing, and a dictionary management means 23 for dictionary management and database transmission / reception. is there. Hereinafter, these means will be described.

【0031】(1)対訳データ登録手段21 対訳データ登録手段21は、翻訳例(実例)を登録学習
するための手段であって、以下の構成要素を備えてい
る。 対訳データ登録部211 対訳データ登録部211は、翻訳例として、文書ファイ
ル25内の英文および邦文を対応づけて登録(対訳デー
タ登録)するものである。このように、英文および邦文
を対応づけて登録することにより、後の翻訳処理におい
て同一の英文に対して同一の邦文を出力することが可能
となる。
(1) Parallel translation data registration means 21 The parallel translation data registration means 21 is means for registering and learning translation examples (actual examples), and comprises the following components. Parallel translation data registration unit 211 As a translation example, the parallel translation data registration unit 211 associates and registers English sentences and Japanese sentences in the document file 25 (parallel translation data registration). In this way, by registering the English sentence and the Japanese sentence in association with each other, it becomes possible to output the same Japanese sentence to the same English sentence in the subsequent translation processing.

【0032】対訳データ登録の方法は、以下の2通りが
ある。第1は、同一ファイル中の邦文および英文を登録
する方法であり、第2は、別ファイルに収められた邦文
および英文を登録する方法である。
There are the following two methods for registering parallel translation data. The first is a method of registering Japanese and English sentences in the same file, and the second is a method of registering Japanese and English sentences contained in another file.

【0033】先ず、同一ファイル中の邦文および英文を
登録する第1の方法について説明する。日英文書ファイ
ル251には、邦文および英文が対になって書き込まれ
ており、メインフレーム2aは日英文書ファイル251
から対になった邦文および英文を読み出す。読み出され
た邦文および英文は図4に示すように表示部2bに表示
される。
First, the first method for registering Japanese and English sentences in the same file will be described. The Japanese-English document file 251 is written in Japanese and English in pairs, and the mainframe 2a is written in the Japanese-English document file 251.
Read the paired Japanese and English sentences from. The read Japanese and English sentences are displayed on the display unit 2b as shown in FIG.

【0034】英文41「Selectively ・・
・ in section 6.3.1.」に対する邦
文42「6.3.1の項の計算方法により、・・・施さ
れていること。」は、翻訳者により既に翻訳済みのもの
である。オペレータは、この表示画面を見ながら英文4
1および邦文42を対に登録する旨をメインフレーム2
aに指示する。この指示により、対訳データ登録部21
1は英文41および邦文42をデータベース管理部21
5を介して対訳データベース246に登録する。このと
き、翻訳時において対訳データを検索するために用いら
れるキーデータを併せて対訳データベース246に登録
される。また、登録を指示すると、当該対訳に対し
て、”文番号3646で登録.OK?[y/n]”と表
示される。そして、”y”を選択すると内部で自動発生
させた固有の文番号3646付加され、この番号が登録
される。
English sentence 41 "Selective ...
-In section 6.3.1. The Japanese sentence 42 for "" has been applied according to the calculation method in the section 6.3.1. "Has already been translated by the translator. The operator, while watching this display screen,
Mainframe 2 to register 1 and Japanese 42 as a pair
Instruct a. By this instruction, the parallel translation data registration unit 21
1 is a database management unit 21 with English 41 and Japanese 42
5 is registered in the parallel translation database 246. At this time, key data used for searching the parallel translation data during translation is also registered in the parallel translation database 246. Further, when the registration is instructed, “Registration.OK? [Y / n] at sentence number 3646” is displayed for the translation. When "y" is selected, a unique sentence number 3646 automatically generated internally is added, and this number is registered.

【0035】対訳データ登録部211は、単語および品
詞の情報が登録された英語形態素解析辞書243および
日本語形態素解析辞書244に基づき、英文41および
邦文42の対訳データ登録を行う。すなわち、対訳登録
しようとする英文41中に英語形態素解析辞書243に
登録されていない単語がある場合には、この単語が英語
未登録語表示欄43に表示される。同様に、対訳登録し
ようとする邦文42中に日本語形態素解析辞書244に
登録されていない単語がある場合には、この単語が日本
語未登録語表示欄44に表示される。これらの未登録語
表示欄43、44に未登録語が表示されている限り、対
訳登録を行うことはできない。オペレータが未登録語を
登録することにより、未登録語表示欄43、44は空欄
となり、対訳登録が可能となる。
The parallel translation data registration unit 211 registers the parallel translation data of the English sentence 41 and the Japanese sentence 42 based on the English morphological analysis dictionary 243 and the Japanese morphological analysis dictionary 244 in which the information of words and parts of speech is registered. That is, if there is a word that is not registered in the English morphological analysis dictionary 243 in the English sentence 41 to be registered for parallel translation, this word is displayed in the English unregistered word display field 43. Similarly, if there is a word that is not registered in the Japanese morphological analysis dictionary 244 in the Japanese sentence 42 to be registered for parallel translation, this word is displayed in the Japanese unregistered word display field 44. As long as unregistered words are displayed in these unregistered word display fields 43 and 44, parallel translation cannot be registered. When the operator registers an unregistered word, the unregistered word display fields 43 and 44 become blank and the parallel translation can be registered.

【0036】第2の方法は、別ファイルに収められた英
文および邦文の対訳登録を行う方法である。英文ファイ
ル252には英文が収められ、邦文ファイル253には
英文の対訳である邦文が邦文ファイル253に収められ
ている。このように、英文および邦文が別ファイルに収
められている場合には、英文と邦文との対応関係が不明
であるため、以下の処理を行う必要がある。先ず、メイ
ンフレーム2aは、英文ファイル252、邦文ファイル
253から英文および邦文を読み出し、これらの英文お
よび邦文を図5に示すように同一画面上に表示する。オ
ペレータは、コマンド53を入力することにより、対訳
データとして登録しようとする英文および邦文を指示す
る。例えば、英文51に対する邦文52を指示すると、
対訳データ登録部211は英文51および邦文52より
なる対訳データを対訳データベース246に登録する。
このとき、対訳文番号およびキーデータもまた対訳デー
タベース246に登録される。
The second method is a method of performing parallel translation registration of English and Japanese sentences stored in another file. The English file 252 stores English, and the Japanese file 253 stores Japanese, which is a parallel translation of English, in the Japanese file 253. As described above, when the English sentence and the Japanese sentence are stored in separate files, the correspondence between the English sentence and the Japanese sentence is unknown, and therefore the following processing is required. First, the mainframe 2a reads English sentences and Japanese sentences from the English sentence file 252 and the Japanese sentence file 253, and displays these English sentences and Japanese sentences on the same screen as shown in FIG. By inputting the command 53, the operator designates an English sentence and a Japanese sentence to be registered as parallel translation data. For example, if you specify Japanese 52 for English 51,
The parallel translation data registration unit 211 registers the parallel translation data including the English sentence 51 and the Japanese sentence 52 in the parallel translation database 246.
At this time, the bilingual sentence number and the key data are also registered in the bilingual database 246.

【0037】なお、必ずしも1文毎に対訳登録を行う必
要はなく、単語毎、あるいは、センテンス毎に行っても
よい。また、一つの単語に対して一つの文章全体を対応
させて対訳登録を行ってもよい。
It is not always necessary to carry out parallel translation registration for each sentence, and it may be carried out for each word or for each sentence. In addition, parallel translation may be registered by associating one sentence with one word as a whole.

【0038】対訳学習部212 対訳学習部212は、対訳データ登録部によって登録さ
れた対訳データの対訳学習処理を行うものである。対訳
学習処理は、対訳データ登録された英文および邦文をパ
ーツに分解し、英文のパーツと邦文のパーツとを対応さ
せる処理である。このように対訳学習処理を行うことに
より、対訳登録された英文の中から翻訳対象となる英文
に最も類似した英文を検索し、自然な邦文訳を行うこと
が可能となるものである。
Parallel Translation Learning Unit 212 The parallel translation learning unit 212 performs parallel translation learning processing of the parallel translation data registered by the parallel translation data registration unit. The bilingual learning process is a process in which the English and Japanese sentences registered in the bilingual data are decomposed into parts, and the English parts and the Japanese parts are associated with each other. By performing the parallel translation learning process in this way, it is possible to search for an English sentence that is most similar to the translation target English sentence from among the English sentences registered for parallel translation, and perform a natural Japanese translation.

【0039】図6に、対訳学習処理時の表示画面の一例
を示す。この表示画面は、対訳文番号3646の英文6
1および邦文62の対訳学習を行う際の画面である。対
訳学習部212は、英文61をパーツと呼ばれる語句の
単位に分解し、英語パーツ情報66を生成する。同様
に、対訳学習部212は、邦文62から日本語パーツ情
報67を生成する。英語パーツ情報66、日本語パーツ
情報67中の「:」の前の数値は、英文61および邦文
62中のパーツの順序を表している。
FIG. 6 shows an example of a display screen during the parallel translation learning process. This display screen shows 6
It is a screen when performing parallel translation learning of 1 and Japanese sentence 62. The parallel translation learning unit 212 decomposes the English sentence 61 into word units called parts, and generates English part information 66. Similarly, the parallel translation learning unit 212 generates Japanese parts information 67 from the Japanese sentence 62. The numbers before the ":" in the English parts information 66 and the Japanese parts information 67 represent the order of the parts in the English sentence 61 and the Japanese sentence 62.

【0040】対訳学習部212は、英語パーツ情報6
6、日本語パーツ情報67、過去の学習例に基づき推論
を行い、英文61および邦文62をパーツ単位で自動的
に対応づける(リンクする)。例えば過去の対訳学習処
理において[Selectively plated]
というパーツと[部分メッキが施されていること]とい
うパーツとがリンクされているとする。すなわち、両パ
ーツが対訳として対訳パーツ解析辞書245上に登録さ
れているとする。この場合、対訳学習部212は、[1:
Selectively 2:plated]のパーツを
[18;部分 19:メッキが 20:施さ 21:れて 22:いる
23:こと]のパーツに自動的に対応づけることが可能
である。パーツリンク情報63中の<<1:Select
ively2:plated 18;部分 19:メッキが 2
0:施さ 21:れて 22:いる 23:こと>>は、両者が対
応づけられたことを表している。
The parallel translation learning unit 212 uses the English parts information 6
6. Inference is performed based on Japanese parts information 67 and past learning examples, and English sentences 61 and Japanese sentences 62 are automatically associated (linked) in parts units. For example, in the past bilingual learning process, [Selectively plated]
It is assumed that the part called "partial plating is applied" and the part called "partially plated" are linked. That is, it is assumed that both parts are registered as parallel translations in the parallel translation parts analysis dictionary 245. In this case, the parallel translation learning unit 212 uses [1:
Selective 2: Plated parts are [18; part 19: plated 20: applied 21: end 22:
23: Things] can be automatically associated. << 1: Select in the parts link information 63
ively2: plated 18; part 19: plating is 2
0: Enforced 21: Ended 22: Existence 23: Thing >> indicates that the two have been associated.

【0041】同様に、過去の対訳学習処理において[m
inimum of]のパーツが、[最低]のパーツに
既に対応づけられ、そして両パーツが対訳パーツ解析辞
書245上に登録されているとする。対訳学習部212
は英文61中の[minimum of]というパーツ
と、邦文62中の[最低]という邦文のパーツとを自動
的にリンクすることが可能となる。
Similarly, in the past parallel translation learning process, [m
It is assumed that the part of [inimum of] is already associated with the [lowest] part, and both parts are registered in the bilingual part analysis dictionary 245. Bilingual learning unit 212
It becomes possible to automatically link the part [minimum of] in the English sentence 61 and the part of the Japanese sentence [minimum] in the Japanese sentence 62.

【0042】ところが、英文61および邦文62中に過
去の学習例において対応づけがなされていないパーツが
あった場合には、パーツリンク情報63において<<3:
with ****>>のような表示がなされる。オペ
レータは、この表示を見ることにより対応づけがなされ
ていないパーツを把握することが可能となる。未登録の
パーツの対応づけは、オペレータによって行われる。例
えば、オペレータが、[3:wth]のパーツの順序番号
「3」を入力し、このパーツに対応する[16:厚さ 17:
で]のパーツの順序番号「16、17」を入力する(符
号68)ことにより、[3:wth]のパーツと[16:厚
さ 17:で]のパーツとの対応づけを行うことができ
る。同様に、[13:measured 14:as]のパー
ツの順序番号「13、14」を入力し、このパーツに対
応する[3:計測 4:方法 5:により]の順序番号「3、
4、5」を入力することによって、[13:measur
ed14:as]のパーツと[3:計測 4:方法 5:によ
り]のパーツとの対応づけを行うことができる。これら
の[13:measured 14:as]のパーツと[3:計
測 4:方法 5:により]のパーツとは、対訳パーツ解析
辞書245に登録される。
However, if there is a part that has not been associated in the past learning example in the English sentence 61 and the Japanese sentence 62, << 3: in the parts link information 63.
A display such as with *** >> is made. The operator can grasp the parts that are not associated with each other by looking at this display. The operator associates the unregistered parts with each other. For example, the operator inputs the sequence number "3" of the part of [3: wth], and the corresponding [16: thickness 17:
By inputting the sequence number "16, 17" of the part of [de] (reference numeral 68), the part of [3: wth] and the part of [16: thickness 17: de] can be associated with each other. . Similarly, enter the sequence number "13, 14" of the part of [13: measured 14: as], and the sequence number "3, 4 of [3: Measurement 4: Method 5:]" corresponding to this part.
By inputting "4, 5", [13: measure
ed14: as] parts can be associated with [3: Measurement 4: Method 5:] parts. The parts of [13: measured 14: as] and the parts of [3: measurement 4: method 5:] are registered in the bilingual part analysis dictionary 245.

【0043】このようにして、英文61および邦文62
の各パーツの対応づけを表すパーツリンク情報63が生
成される。生成されたパーツリンク情報63は、英文6
1および邦文62に対応付けられながら対訳データベー
ス246に登録される。このパーツリンク情報63は後
述する翻訳処理において使用されるものである。
In this way, English 61 and Japanese 62
The part link information 63 representing the correspondence of each part is generated. The generated parts link information 63 is in English 6.
It is registered in the parallel translation database 246 while being associated with 1 and the Japanese sentence 62. The parts link information 63 is used in the translation process described later.

【0044】また、対訳学習の際には、パーツリンク情
報の他、各パーツの文法解析に関する情報等も生成され
る。図8、図9に、英文「In the beginn
ing God created the heave
ns and the earth」と、邦文[初めに
神は天地を創造された]を例に説明する。
In parallel translation learning, information about grammatical analysis of each part is also generated in addition to the part link information. 8 and 9, the English text "In the beginning
ing God created the heave
ns and the earth "and Japanese [God created heaven and earth] as an example.

【0045】[In the beginning]に
は[In]という前置詞が含まれている。このため、
[In the beginning]は、[In]に
対応する[〜に]という助詞を含む[初めに]という副
詞的なパーツに対応させられる。また、[God]は、
文中において主格として使用されているため、単語リン
ク情報93に基づき[神は]に対応させられる。[cr
eated]は、動作を表すとともに受身形である[創
造された]に対応させられる。さらに、[thehea
vens and the earth]は名詞である
が、主格ではないので([God]が主格であるので)
対象を表す[天地を]に対応させられる。以上の文法解
析結果は、パーツリンク情報96とともに対訳データベ
ース246に登録される。そして、後述する翻訳処理に
おいては、これらの情報に基づき訳文生成が行われる。
すなわち、主格を表すパーツは訳文の主格の位置に配置
され、動作を表すパーツは訳文の述部の位置に配置され
る。
[In the beginning] includes the preposition [In]. For this reason,
[In the beginning] is made to correspond to an adverbial part [in the beginning] including a particle [to] corresponding to [In]. Also, [God] is
Since it is used as a nominative in the sentence, it is associated with [God] based on the word link information 93. [Cr
“Eated” represents a motion and is associated with the passive form “created”. In addition, [thehea
vens and the earth] is a noun, but it is not a nominative case (because [God] is a nominative case)
Corresponds to [top and bottom] representing the object. The above grammar analysis result is registered in the parallel translation database 246 together with the parts link information 96. Then, in the later-described translation process, a translated sentence is generated based on these pieces of information.
That is, the nominative part is placed at the nominative position of the translated sentence, and the action part is placed at the predicate position of the translated sentence.

【0046】登録テスト部213 登録テスト部213は、対訳データベース246上に登
録された対訳データの管理(メンテナンス)を行うため
のものである。すなわち、登録テスト部213は、対訳
データベース246に登録された対訳データの表示、削
除、追加、検索等の機能を備えている。
Registration Test Unit 213 The registration test unit 213 is for managing (maintaining) the parallel translation data registered on the parallel translation database 246. That is, the registration test unit 213 has functions such as displaying, deleting, adding, and searching the parallel translation data registered in the parallel translation database 246.

【0047】学習テスト部214 学習テスト部214は、対訳データベース246に登録
されたパーツリンク情報等の表示、削除、追加、検索等
の管理を行うためのものである。学習テスト時における
表示画面を図9に示す。この表示画面は、英語形態素9
1、日本語形態素92、単語リンク情報93、英語パー
ツ情報94、日本語パーツ情報95、パーツリンク情報
96を表している。これらの情報91〜96は、英文
「In the ・・・ the earth」および
邦文「初めに・・・創造された」についてのものであ
る。
Learning Test Unit 214 The learning test unit 214 is for managing the display, deletion, addition, retrieval, etc. of the part link information registered in the parallel translation database 246. The display screen at the time of the learning test is shown in FIG. This display screen shows English morpheme 9
1, Japanese morpheme 92, word link information 93, English parts information 94, Japanese parts information 95, and parts link information 96 are shown. These pieces of information 91 to 96 are about the English sentence "In the ... the earth" and the Japanese sentence "Initially ... Created."

【0048】英語形態素91および日本語形態素92
は、単語と品詞等の情報よりなるものである。図8に示
す英文「In the beginning God
created the heavens and t
he earth」は、[In前置詞][the 冠
詞][beginning 名詞][God 名詞]
[created 他動詞][the 冠詞][hea
vens 名詞][and接続詞][the 冠詞]
[earth 名詞]のように、単語と品詞が対になっ
た英語形態素に分解可能である。同様に、日本文「神は
初めに天地を創造された。」は、[初め:名詞][に]
[、][神:名詞][は][天地:名詞][を][創造
さ:名サ][れ][た]のように単語と品詞が対になっ
た日本語形態素に分解可能である。
English morpheme 91 and Japanese morpheme 92
Is composed of information such as words and parts of speech. The English sentence "In the beginning God" shown in FIG.
created the heavens and t
"he earth" means [In preposition] [the article] [beginning noun] [God noun]
[Created transitive verb] [the article] [hea
vens noun] [and conjunction] [the article]
It can be decomposed into English morphemes in which words and parts of speech are paired, such as [earth noun]. Similarly, the Japanese sentence "God first created heaven and earth."
It can be decomposed into Japanese morphemes such as words and parts of speech, such as [,] [God: noun] [ha] [top and bottom: noun] [o] [creativity: name sa] [re] [ta]. is there.

【0049】単語リンク情報93は、英語形態素91お
よび日本語形態素92中の語句のうち、英和辞書241
および和英辞書242に登録されている語句と同一のも
のを表したものである。すなわち、単語リンク情報93
に表示された語句は、過去の学習例を用いることなく、
辞書241、242のみで対応づけ(リンク)可能であ
ることを意味している。ただし、これらの語句と同一の
パーツが対訳パーツ解析辞書245に登録済みである場
合には、これらの語句の対訳学習においてパーツリンク
情報93に基づき対応付けが行われる。
The word link information 93 is the English-Japanese dictionary 241 out of the words and phrases in the English morphemes 91 and the Japanese morphemes 92.
And the same words as those registered in the Japanese-English dictionary 242. That is, the word link information 93
The phrase displayed in is, without using past learning examples,
This means that correspondence (linking) is possible only with the dictionaries 241 and 242. However, when the same parts as these words / phrases are already registered in the bilingual part analysis dictionary 245, they are associated with each other in the bilingual learning of these words / phrases based on the parts link information 93.

【0050】単語リンク情報93において、[4:他動詞
created :7]は、英語形態素91の配列の4番
目(0番目から起算)の形態素[created 他動
詞]が日本語形態素92の7番目(0番目から起算)の
形態素[創造さ:名サ]に対応することを示している。
In the word link information 93, the [4: transitive verb created: 7] is the 4th (starting from 0th) morpheme [created transitive verb] of the array of English morphemes 91 is the 7th (0th) of the Japanese morpheme 92. It corresponds to the morpheme [creativity: name sa] of

【0051】英語パーツ情報94、日本語パーツ情報9
5、パーツリンク情報96は上述したものと同様であ
る。すなわち、英語パーツ情報94、日本語パーツ情報
95は、英文および日本文を過去の学習例等に基づき分
解された語句を表し、パーツリンク情報96は分解され
た語句同士の対応づけを表している。
English parts information 94, Japanese parts information 9
5. The parts link information 96 is the same as that described above. That is, the English parts information 94 and the Japanese parts information 95 represent words and phrases obtained by decomposing English sentences and Japanese sentences based on past learning examples and the like, and the parts link information 96 represents correspondence between the decomposed phrases. .

【0052】データベース管理部215 データベース管理部215は、対訳データベース246
に対する各種データのアクセスを制御するためのもので
ある。したがって、対訳データ登録時、対訳学習時、翻
訳時における対訳データベース246に対するデータの
アクセスは全てデータベース管理部215を介して行わ
れる。ただし、後述するデータベースの送受信時におい
ては、対訳データベース246に対するデータのアクセ
スは辞書データベース送受信部236によって行われ
る。
Database Management Unit 215 The database management unit 215 uses the parallel translation database 246.
Is for controlling access to various data with respect to. Therefore, all the data access to the parallel translation database 246 at the time of parallel translation data registration, parallel translation learning, and translation is performed via the database management unit 215. However, at the time of transmitting / receiving a database, which will be described later, data access to the parallel translation database 246 is performed by the dictionary database transmitting / receiving unit 236.

【0053】(2)翻訳手段22 翻訳手段22は、英日翻訳を行う英日翻訳部221、日
英翻訳を行う日英翻訳部222、英日翻訳結果をプリン
トアウトする英日翻訳印書部223、日英翻訳結果をプ
リントアウトする日英翻訳印書部224により構成され
ている。
(2) Translating Means 22 The translating means 22 includes an English-Japanese translation section 221, which performs English-Japanese translation, a Japanese-English translation section 222, which performs Japanese-English translation, and an English-Japanese translation printing section, which prints out the English-Japanese translation result. 223, and a Japanese-English translation printing unit 224 that prints out the Japanese-English translation result.

【0054】英日翻訳部221、日英翻訳部222 英日翻訳部221は、対訳データベース246に登録さ
れたパーツリンク情報およびキーデータ等に基づき英文
を邦文に翻訳する処理を行うものである。また、日英翻
訳部222は邦文を英文に翻訳する処理を行うものであ
る。
English-Japanese translation unit 221 and Japanese-English translation unit 222 The English-Japanese translation unit 221 performs a process of translating an English sentence into a Japanese sentence based on the parts link information and key data registered in the parallel translation database 246. Further, the Japanese-English translation unit 222 performs a process of translating a Japanese sentence into an English sentence.

【0055】図7に日英翻訳処理時の概要を表す。例え
ば、原文71が日英翻訳部222に与えられると、日英
翻訳部222は対訳データベース246に登録された対
訳データの中から原文71に最も類似した邦文(訳文番
号3646)73を検索する。このようにして検索され
た邦文73の対訳(英訳)は、英文72として登録され
ている。日英翻訳部222は、対訳文番号3646のパ
ーツリンク情報74を対訳データベース246から読み
出し、パーツリンク情報74中の邦文の各パーツと原文
71中の各パーツとを比較する。
FIG. 7 shows an outline of Japanese-English translation processing. For example, when the original sentence 71 is given to the Japanese-English translation unit 222, the Japanese-English translation unit 222 searches the parallel translation data registered in the parallel translation database 246 for the Japanese sentence (translation number 3646) 73 most similar to the original sentence 71. The parallel translation (English translation) of the Japanese sentence 73 retrieved in this way is registered as the English sentence 72. The Japanese-English translation unit 222 reads the parts link information 74 of the parallel translation sentence number 3646 from the parallel translation database 246, and compares each part in the Japanese sentence in the parts link information 74 with each part in the original sentence 71.

【0056】比較の結果をリスト75に例示する。リス
ト75中の<****>の表示は、両パーツが一致しな
いことを示している。パーツリンク情報74のうち「1
50」「計測方法により」「項の」「6.3.1の」の
各パーツが原文71のパーツと一致していないため、こ
ららのパーツに<****>のマークを付与する。この
場合には、<****>の付加されたパーツは、原文に
は不要なのでこれらを削除し、かつ数字を置き換えて翻
訳結果として出力する。
The result of the comparison is illustrated in list 75. The display of <***> in the list 75 indicates that the two parts do not match. Of the parts link information 74, "1
Since the parts "50", "By the measuring method", "No.", "6.3.1" do not match the parts in the original sentence 71, these parts are marked with <****> . In this case, the parts to which <***> is added are not necessary in the original sentence, and are deleted, and the numbers are replaced and output as the translation result.

【0057】なお、原文に最も類似した文字列(類似度
の高い文字列)の検索は以下の手順により行われる。例
えば、[進歩が著しい]という原文が与えられたとす
る。この原文の自立語は[進歩]と[著し]である。そ
して、対訳データベース246の中から自立語[進歩]
と[著し]を含む文字列を検索する。ここで、以下の3
つの文字列が検索されたとする。
The search for a character string most similar to the original sentence (a character string having a high degree of similarity) is performed by the following procedure. For example, suppose that the original text [Progress] is given. The independent words in this text are [Progress] and [Writing]. Then, from the parallel translation database 246, an independent word [advancement]
Search for a character string that includes and [author]. Here, the following 3
Suppose one string is searched.

【0058】文字列1:[機械翻訳の進歩が著しい] 文字列2:[著しく進歩した技術] 文字列3:[技術の進歩と製品の価格]Character string 1: [Major progress in machine translation] Character string 2: [Remarkably advanced technology] Character string 3: [Technological progress and product price]

【0059】次に、これらの文字列を以下の集合に分類
する。なお、集合Aの類似度が最も高く、以下集合B、
集合Cの順に類似度が低くなるものとする。
Next, these character strings are classified into the following sets. The similarity of the set A is the highest, and
It is assumed that the degree of similarity decreases in the order of set C.

【0060】集合A:原文が文字列に現れているもの。 集合B:原文の全構成語を文字列に含んでいるもの。 集合C:原文の全機械語の一部を文字列に含んでいるも
の。
Set A: Original text appearing in a character string. Set B: A character string that includes all the constituent words of the original sentence. Set C: A character string that includes a part of the entire machine language of the original text.

【0061】集合Aに該当するのが文1であり、集合B
に該当するのが文2である。また、集合Cに該当するの
が文3である。すなわち、原文との類似度が最も大きい
ものは文1である。同一の集合に複数の文字列が分類さ
れた場合には、さらに以下の方法により類似度を決定す
る。
Sentence 1 corresponds to set A, and set B
The sentence 2 corresponds to. The sentence 3 corresponds to the set C. That is, sentence 1 has the highest similarity to the original sentence. When a plurality of character strings are classified into the same set, the similarity is further determined by the following method.

【0062】原文の複数の構成語が他の語を挟むことな
く連続して含んでいる文字列を、1番目に類似度が高い
文字列とする。次に、文字列の自立語の個数に対する原
文の構成語の個数の比が高い文字列を、2番目に類似度
が高い文字列とする。さらに、原文の構成語をより多く
含んでいる文字列を、3番目に類似度が高い文字列とす
る。なお、類似度の決定方法は上述した方法に限定され
ることなく、他の方法を用いて類似度を決定してもよ
い。ここでは、類似度計算により、対訳データベースよ
り抽出された複数の対訳の文番号を類似度順に並べ、上
位から比較する方法をとるが、比較の都度類似度計算を
しながら対訳を読みだしてもよい。
A character string in which a plurality of constituent words of the original sentence are continuously included without interposing other words is set as a character string having the highest similarity. Next, a character string having a high ratio of the number of constituent words of the original sentence to the number of independent words of the character string is set as a character string having the second highest similarity. Furthermore, the character string that includes more constituent words of the original sentence is set as the character string having the third highest similarity. The method of determining the degree of similarity is not limited to the method described above, and the degree of similarity may be determined using another method. Here, by the similarity calculation, the sentence numbers of a plurality of bilingual translations extracted from the bilingual database are arranged in order of similarity, and comparison is performed from the top.However, even if the bilingual translation is read out while calculating the similarity each time. Good.

【0063】英日翻訳印書部223、日英翻訳印書部
224 英日翻訳印書部223、日英翻訳印書部224は、翻訳
された邦文または英文のテキストデータを所定の形式で
プリンタ2dに出力し、印字を行うためのものである。
英日翻訳印書部223による印字例を図10に、日英翻
訳印書部224による印字例を図11に示す。これらの
図において、左欄の文が原文を表し、右欄の文が翻訳文
を表している。翻訳結果が不十分であると翻訳手段22
が判断した場合には、翻訳文の先頭に「◇」のマークが
表示される。
English-Japanese translation stamp section 223, Japanese-English translation stamp section 224 The English-Japanese translation stamp section 223, Japanese-English translation stamp section 224 prints translated Japanese or English text data in a predetermined format. It is for outputting to 2d and printing.
An example of printing by the English-Japanese translation stamp section 223 is shown in FIG. 10, and an example of printing by the Japanese-English translation stamp section 224 is shown in FIG. In these figures, the sentence in the left column represents the original sentence, and the sentence in the right column represents the translated sentence. If the translation result is insufficient, the translation means 22
If is judged, the mark of "◇" is displayed at the beginning of the translated text.

【0064】(3)辞書管理手段23 辞書管理手段23は、英和辞書管理部231、和英辞書
管理部232、英語形態素解析辞書管理部233、日本
語形態素解析辞書管理部234、対訳パーツ解析辞書管
理部235、辞書データベース送受信部236により構
成されている。
(3) Dictionary management unit 23 The dictionary management unit 23 manages the English-Japanese dictionary management unit 231, the Japanese-English dictionary management unit 232, the English morphological analysis dictionary management unit 233, the Japanese morphological analysis dictionary management unit 234, and the bilingual part analysis dictionary management. It is composed of a unit 235 and a dictionary database transmitting / receiving unit 236.

【0065】英和辞書管理部231、和英辞書管理部
232は、英和辞書241および和英辞書242の管理
を行うものである。すなわち、和英辞書241、英和辞
書242に対する単語の登録、削除等は英和辞書管理部
231、和英辞書管理部232によって行われる。
The English-Japanese dictionary management unit 231 and the Japanese-English dictionary management unit 232 manage the English-Japanese dictionary 241 and the Japanese-English dictionary 242. That is, registration and deletion of words in the Japanese-English dictionary 241, English-Japanese dictionary 242 are performed by the English-Japanese dictionary management unit 231 and the Japanese-English dictionary management unit 232.

【0066】英語形態素解析辞書管理部233、日本
語形態素解析辞書管理部234 英語形態素解析辞書管理部233、日本語形態素解析辞
書管理部234は、英語形態素解析辞書243および日
本語形態素解析辞書244の管理(登録、表示、削除)
を行うものである。
The English morpheme analysis dictionary management unit 233, the Japanese morpheme analysis dictionary management unit 234, the English morpheme analysis dictionary management unit 233, and the Japanese morpheme analysis dictionary management unit 234. Management (registration, display, deletion)
Is to do.

【0067】対訳パーツ解析辞書管理部235 対訳パーツ解析辞書管理部235は、学習済みの対訳パ
ーツが登録された対訳パーツ解析辞書245の管理(登
録、表示、削除)を行うものである。
The bilingual part analysis dictionary management unit 235 manages (registers, displays, and deletes) the bilingual part analysis dictionary 245 in which the learned bilingual parts are registered.

【0068】辞書データベース送受信部236 辞書データベース送受信部236は、辞書データベース
24上の各種情報を、通信系2eを介して他のワークス
テーションとの間で送受信を行うものである。図12
に、辞書データベース送受信の概念図を示す。送受信の
対象となるものは、辞書データベース24上の各種情
報、すなわち、英和辞書241、和英辞書242、英語
形態素解析辞書243、日本語形態素解析辞書244、
対訳パーツ解析辞書245、対訳データベース246上
の情報である。例えば、ワークステーション12aから
ワークステーション12bに送信された各種辞書および
対訳データベースは、ワークステーション12b側の辞
書データベース24に追加される。受信した情報のう
ち、自己の辞書データベース24に登録されていない情
報のみが、辞書データベース24に書き込まれる。これ
により、辞書データベース24への書き込み作業を短時
間で行うことが可能となる。
Dictionary database transmitting / receiving unit 236 The dictionary database transmitting / receiving unit 236 transmits / receives various information in the dictionary database 24 to / from other workstations via the communication system 2e. 12
A conceptual diagram of transmission / reception of a dictionary database is shown in FIG. Items to be transmitted and received are various information in the dictionary database 24, that is, the English-Japanese dictionary 241, the Japanese-English dictionary 242, the English morphological analysis dictionary 243, the Japanese morphological analysis dictionary 244,
This is information on the bilingual part analysis dictionary 245 and the bilingual database 246. For example, various dictionaries and parallel translation databases transmitted from the workstation 12a to the workstation 12b are added to the dictionary database 24 on the workstation 12b side. Of the received information, only the information that is not registered in its own dictionary database 24 is written in the dictionary database 24. As a result, the writing operation to the dictionary database 24 can be performed in a short time.

【0069】なお、ワークステーション12bからワー
クステーション12aに各種辞書および対訳データベー
スを送信することもでき、あるいは、同図に示されてい
ない他のワークステーションとの間で送受信を行うこと
も可能である。これにより、複数のワークステーション
の辞書データベース24を共有でき、対訳学習等の効率
化を図ることが可能となる。
Various dictionaries and parallel translation databases can be transmitted from the workstation 12b to the workstation 12a, or can be transmitted / received to / from other workstations not shown in the figure. . As a result, the dictionary database 24 of a plurality of workstations can be shared, and the efficiency of parallel translation learning can be improved.

【0070】(4)辞書データベース24 上述したように辞書データベース24は、英和辞書24
1、和英辞書242、英語形態素解析辞書243、日本
語形態素解析辞書244、対訳パーツ解析辞書245、
対訳データベース246から構成されている。対訳パー
ツ解析辞書245には学習済みの対訳パーツが保存され
ている。対訳データベース246には、対訳データ、英
語形態素情報、日本語形態素情報、対訳パーツ同士の対
応を示すパーツリンク情報、翻訳時の検索のためのキー
データが保存されている。
(4) Dictionary database 24 As described above, the dictionary database 24 is the English-Japanese dictionary 24.
1, Japanese-English dictionary 242, English morphological analysis dictionary 243, Japanese morphological analysis dictionary 244, parallel translation parts analysis dictionary 245,
It is composed of a parallel translation database 246. The translated parts analysis dictionary 245 stores the learned translated parts. The bilingual database 246 stores bilingual data, English morpheme information, Japanese morpheme information, part link information indicating correspondence between bilingual parts, and key data for searching during translation.

【0071】続いて本実施例に係る機械翻訳システムの
動作をフローチャートを参照しながら説明する。
Next, the operation of the machine translation system according to this embodiment will be described with reference to the flowchart.

【0072】(メインフローチャート)図15は本実施
例に係る機械翻訳システムの作用を表すメインフローチ
ャートである。先ず、オペレータは、表示部2cに表示
されたメニュー画面の中から所望の処理を選択する。対
訳データの登録学習の処理がオペレータによって選択さ
れた場合(S1でYES)には、対訳データ登録手段2
1は対訳データの登録学習の処理を実行する(S2)。
対訳データの登録学習の処理が選択されなかった場合
(S1でNO)には、翻訳処理が選択されたか否かをメ
インフレーム2aが判断する(S3)。翻訳処理が選択
された場合(S3でYES)には、翻訳部22は翻訳処
理(S4)を実行する。翻訳処理が選択されなかった場
合(S3でNO)には、辞書管理の処理が選択されたか
否かをメインフレーム2aが判断する(S5)。辞書管
理の処理が選択された場合(S5でYES)には、辞書
管理部23は辞書管理の処理(S6)を実行する。辞書
管理の処理が選択されなかった場合(S5でNO)に
は、メインフローチャートの処理が終了する。
(Main Flowchart) FIG. 15 is a main flowchart showing the operation of the machine translation system according to this embodiment. First, the operator selects a desired process from the menu screen displayed on the display unit 2c. When the operator selects the parallel translation data registration learning process (YES in S1), the parallel translation data registration means 2
1 executes the processing of registration learning of parallel translation data (S2).
When the parallel learning data registration learning process is not selected (NO in S1), the mainframe 2a determines whether the translation process is selected (S3). When the translation process is selected (YES in S3), the translation unit 22 executes the translation process (S4). When the translation process is not selected (NO in S3), the mainframe 2a determines whether or not the dictionary management process is selected (S5). When the dictionary management process is selected (YES in S5), the dictionary management unit 23 executes the dictionary management process (S6). If the dictionary management process is not selected (NO in S5), the process of the main flowchart ends.

【0073】(対訳データの登録学習)図16は、図1
5中の対訳データの登録学習処理(S2)を表すフロー
チャートである。オペレータは、表示部2cに表示され
たメニューを見ながら対訳データ登録、対訳学習、登録
テスト、学習テストのいずれかの処理を選択する。オペ
レータが対訳データ登録の処理を選択した場合(S10
1でYES)には、対訳データ登録部211は翻訳済み
の英文および邦文を用いて対訳データ登録を行う(S1
02)。この処理によって生成された対訳データは対訳
データベース246に保存される。後の翻訳処理におい
て、対訳データと同一の文(語句)が翻訳対象となる文
章中に存在する場合には、対訳データと同一の訳文を出
力することが可能となる。
(Learn parallel language data registration) FIG.
It is a flowchart showing the registration learning process (S2) of the parallel translation data in 5. The operator selects one of parallel translation data registration, parallel translation learning, a registration test, and a learning test while looking at the menu displayed on the display unit 2c. When the operator selects the parallel translation data registration process (S10)
If YES in 1), the parallel translation data registration unit 211 performs parallel translation data registration using translated English and Japanese sentences (S1).
02). The parallel translation data generated by this processing is stored in the parallel translation database 246. In the later translation process, if the same sentence (phrase) as the parallel translation data is present in the sentence to be translated, it is possible to output the same translated sentence as the parallel translation data.

【0074】対訳データ登録の処理が選択されなかった
場合(S101でNO)には、対訳学習の処理が選択さ
れたか否かをメインフレーム2aが判断する(S10
3)。対訳学習処理が選択された場合(S103でYE
S)には、対訳学習部212は対訳学習の処理を実行す
る(S104)。すなわち、対訳データをパーツに分解
し、英文のパーツと邦文のパーツとを対応づける。これ
により、後の翻訳処理において、対訳データに類似する
文に対して自然な翻訳を行うことが可能となる。
If the parallel translation data registration process is not selected (NO in S101), the mainframe 2a determines whether or not the parallel translation learning process is selected (S10).
3). When the bilingual learning process is selected (YE in S103)
In S), the parallel translation learning unit 212 executes a parallel translation learning process (S104). That is, the parallel translation data is decomposed into parts, and the English parts and the Japanese parts are associated with each other. As a result, in a later translation process, it becomes possible to perform a natural translation on a sentence similar to the parallel translation data.

【0075】対訳学習の処理が選択されなかった場合
(S103でNO)には、登録テストの処理が選択され
たか否かをメインフレーム2aが判断する(S10
5)。登録テストの処理が選択された場合(S105で
YES)には、登録テスト部213は登録テストの処理
を実行する(S106)。すなわち、登録テスト部21
3は登録された対訳データの表示、削除、追加、検索等
の管理(メンテナンス)を行う。
When the parallel translation learning process is not selected (NO in S103), the mainframe 2a determines whether or not the registration test process is selected (S10).
5). When the registration test process is selected (YES in S105), the registration test unit 213 executes the registration test process (S106). That is, the registration test unit 21
3 manages (maintains) registered bilingual data such as displaying, deleting, adding, and searching.

【0076】登録テストの処理が選択されなかった場合
(S105でNO)には、学習テストの処理が選択され
たか否かをメインフレーム2aが判断する(S10
6)。学習テストの処理が選択された場合(S107で
YES)には、学習テスト部214は学習テストの処理
を実行する(S108)。すなわち、学習テスト部21
4は、登録されたパーツリンク情報等の表示、削除、追
加、検索等の管理を行う。以上の処理が終了すると、図
15のメインフローチャートに戻る。
When the registration test process is not selected (NO in S105), the mainframe 2a determines whether or not the learning test process is selected (S10).
6). When the learning test process is selected (YES in S107), the learning test unit 214 executes the learning test process (S108). That is, the learning test unit 21
4 manages display, deletion, addition, search, etc. of registered part link information and the like. When the above process ends, the process returns to the main flowchart of FIG.

【0077】(翻訳)図17は、図15中の翻訳処理
(S4)を表すフローチャートである。オペレータは、
表示部2cに表示されたメニューを見ながら英日翻訳、
日英翻訳のいずれかの処理を選択する。オペレータが英
日翻訳の処理を選択した場合(S201でYES)に
は、英日翻訳部221は対訳データおよびパーツリンク
情報等に基づき英日翻訳を行う(S202)。翻訳が終
了すると、オペレータは翻訳結果を印字するか否かを判
断する(S203)。印字するとオペレータが判断した
場合(S203でYES)には、英日翻訳印書部223
は翻訳結果をプリンタ2dに出力する。この結果、図1
0に示すような書式による印字が行われる。一方、印字
しないとオペレータが判断した場合(S203でNO)
には、印字を行うことなく図15のメインフローチャー
トに戻る。
(Translation) FIG. 17 is a flowchart showing the translation process (S4) in FIG. The operator
English-Japanese translation while looking at the menu displayed on the display 2c,
Select one of Japanese-English translation processing. When the operator selects the English-Japanese translation processing (YES in S201), the English-Japanese translation unit 221 performs English-Japanese translation based on the bilingual translation data, the part link information and the like (S202). When the translation is completed, the operator determines whether to print the translation result (S203). When the operator determines that the print is to be made (YES in S203), the English-Japanese translation stamp section 223
Outputs the translation result to the printer 2d. As a result,
Printing is performed in the format shown in 0. On the other hand, when the operator determines not to print (NO in S203)
, The process returns to the main flow chart of FIG. 15 without printing.

【0078】英日翻訳の処理が選択されなかった場合
(S201でNO)には、日英翻訳の処理が選択された
か否かをメインフレーム2aが判断する(S205)。
日英翻訳の処理が選択された場合(S205でYES)
には、日英翻訳部222は対訳データおよびパーツリン
ク情報等に基づき日英翻訳を行う(S206)。翻訳が
終了すると、オペレータは翻訳結果を印字するか否かを
判断する(S207)。印字するとオペレータが判断し
た場合(S207でYES)には、日英翻訳印書部22
4は翻訳結果をプリンタ2dに出力する。この結果、図
11に示すような書式による印字が行われる。一方、印
字しないとオペレータが判断した場合(S207でN
O)には、印字を行うことなく図15のメインフローチ
ャートに戻る。
When the English-Japanese translation process is not selected (NO in S201), the mainframe 2a determines whether the Japanese-English translation process is selected (S205).
When Japanese-English translation processing is selected (YES in S205)
First, the Japanese-English translation unit 222 performs Japanese-English translation based on the parallel translation data, the parts link information, and the like (S206). When the translation is completed, the operator determines whether to print the translation result (S207). If the operator determines that the print is to be made (YES in S207), the Japanese-English translated stamp section 22
4 outputs the translation result to the printer 2d. As a result, printing is performed in the format as shown in FIG. On the other hand, when the operator determines that the printing is not performed (N in S207,
In step O), the process returns to the main flow chart of FIG. 15 without printing.

【0079】(辞書管理)図18は、図15中の辞書管
理処理(S6)を表すフローチャートである。オペレー
タは、表示部2cに表示されたメニューを見ながら英和
辞書管理、和英辞書管理、英語形態素解析辞書管理、日
本語形態素解析辞書管理、対訳パーツ解析辞書管理、辞
書データベース送受信のいずれかの処理を選択する。オ
ペレータが英和辞書管理の処理を選択した場合(S30
1でYES)には、英和辞書管理部231は英和辞書2
41の登録、表示、削除、検索等を行う(S302)。
英和辞書管理の処理が選択されなかった場合(S301
でNO)には、和英辞書管理の処理が選択されたか否か
をメインフレーム2aが判断する(S303)。そし
て、和英辞書管理の処理が選択された場合(S303で
YES)には、和英辞書管理部232は和英辞書242
の登録、表示、削除、検索等を行う(S304)。
(Dictionary Management) FIG. 18 is a flowchart showing the dictionary management processing (S6) in FIG. While looking at the menu displayed on the display unit 2c, the operator performs any of the processes of English-Japanese dictionary management, Japanese-English dictionary management, English morphological analysis dictionary management, Japanese morphological analysis dictionary management, parallel parts analysis dictionary management, and dictionary database transmission / reception. select. When the operator selects the processing of managing the English-Japanese dictionary (S30
If YES, the English-Japanese dictionary management unit 231 determines that the English-Japanese dictionary 2
41 is registered, displayed, deleted, and searched (S302).
When the processing for managing the English-Japanese dictionary is not selected (S301
If the answer is NO, the mainframe 2a determines whether the Japanese-English dictionary management process has been selected (S303). When the Japanese-English dictionary management process is selected (YES in S303), the Japanese-English dictionary management unit 232 causes the Japanese-English dictionary 242 to be selected.
Registration, display, deletion, search, etc. are performed (S304).

【0080】和英辞書管理の処理が選択されなかった場
合(S303でNO)には、英語形態素解析辞書管理の
処理が選択されたか否かをメインフレーム2aが判断す
る(S305)。英語形態素解析辞書管理の処理が選択
された場合(S305でYES)には、英語形態素解析
辞書管理部233は英語形態素解析辞書243の登録、
表示、削除、検索等を行う(S306)。同様に、日本
語形態素解析辞書管理の処理が選択された場合(S30
7でYES)には、日本語形態素解析辞書管理部234
は日本語形態素解析辞書244の登録、表示、削除、検
索等を行う(S308)。また、対訳パーツ解析辞書管
理の処理が選択された場合(S309でYES)には、
対訳パーツ解析辞書管理部235は対訳パーツ解析辞書
245の登録、表示、削除、検索等の処理を実行する
(S310)。
When the Japanese-English dictionary management process is not selected (NO in S303), the mainframe 2a determines whether the English morphological analysis dictionary management process is selected (S305). When the processing of managing the English morphological analysis dictionary is selected (YES in S305), the English morphological analysis dictionary management unit 233 registers the English morphological analysis dictionary 243,
Display, deletion, search, etc. are performed (S306). Similarly, when the processing of managing the Japanese morphological analysis dictionary is selected (S30
7 is YES), the Japanese morphological analysis dictionary management unit 234
Performs registration, display, deletion, search, etc. of the Japanese morphological analysis dictionary 244 (S308). Further, when the process of managing the bilingual parts analysis dictionary is selected (YES in S309),
The bilingual part analysis dictionary management unit 235 executes processes such as registration, display, deletion, and search of the bilingual part analysis dictionary 245 (S310).

【0081】辞書データベース送受信処理が選択された
場合(S311でYES)には、辞書データベース送受
信部236は各種辞書および対訳データベースの送受信
を行う(S312)。すなわち、辞書データベース送受
信部236は、図12に示すように英和辞書241、和
英辞書242、英語形態素解析辞書243、日本語形態
素解析辞書244、対訳パーツ解析辞書245、対訳デ
ータベース246上の各種情報を他のワークステーショ
ン12に送信する。これにより、各ワークステーション
の辞書データベースを共有化することが可能となる。
When the dictionary database transmission / reception process is selected (YES in S311), the dictionary database transmission / reception unit 236 transmits / receives various dictionaries and bilingual databases (S312). That is, the dictionary database transmitting / receiving unit 236 stores various information on the English-Japanese dictionary 241, the Japanese-English dictionary 242, the English morphological analysis dictionary 243, the Japanese morphological analysis dictionary 244, the bilingual part analysis dictionary 245, and the bilingual database 246 as shown in FIG. Send to another workstation 12. This makes it possible to share the dictionary database of each workstation.

【0082】(対訳データ登録の詳細)図20、図21
は、対訳データ登録(図16のS102)の詳細を表す
フローチャートである。
(Details of parallel translation data registration) FIGS. 20 and 21.
FIG. 16 is a flowchart showing details of parallel translation data registration (S102 in FIG. 16).

【0083】対訳データ登録しようとする英文および邦
文が同一ファイルに存在する場合(S401でYES)
には、オペレータは、英文および邦文を有する日英文書
ファイル名を入力する(S402)。メインフレーム2
aは日英文書ファイル251を読み込み(S403)、
対になった英文および邦文を図4に示すように表示部2
cに表示する(S404)。対訳データ登録部211
は、表示された英文中に、英語形態素解析辞書243に
登録されていない単語があるか否かを判断する(S40
5)。同様に、対訳データ登録部211は、表示された
邦文中に、日本語形態素解析辞書244に登録されてい
ない単語があるか否かを判断する(S406)。未登録
の単語が存在する場合(S407でYES)には、未登
録単語を英語未登録語表示欄43、日本語未登録語表示
欄44(図4)に表示する(S408)。
When the English sentence and the Japanese sentence to be registered as the parallel translation data exist in the same file (YES in S401)
The operator inputs a Japanese-English document file name having English and Japanese sentences (S402). Mainframe 2
a reads the English-Japanese document file 251 (S403),
A pair of English and Japanese sentences are displayed on the display unit 2 as shown in FIG.
It is displayed in c (S404). Parallel data registration unit 211
Judges whether or not there is a word not registered in the English morphological analysis dictionary 243 in the displayed English sentences (S40).
5). Similarly, the parallel translation data registration unit 211 determines whether or not the displayed Japanese sentence includes a word that is not registered in the Japanese morphological analysis dictionary 244 (S406). If there is an unregistered word (YES in S407), the unregistered word is displayed in the English unregistered word display column 43 and the Japanese unregistered word display column 44 (FIG. 4) (S408).

【0084】この後、所定のコマンドを入力し(S40
9)、他の英文および邦文の対訳データ登録を行うか否
かを判断する(S410)。他の英文および邦文の対訳
データ登録を行う場合(S410でYES)には、新た
な英文および邦文を選択し(S422)、S404以降
の処理を実行する。一方、他の英文および邦文に変更す
る必要がない場合(S410でNO)には、さらに表示
中の英文および邦文を対訳データとして登録するか否か
をオペレータが判断する(S411)。対訳データ登録
を行う場合(S411でYES)にはS412以降の処
理を実行し、対訳データ登録を行わない場合(S411
でNO)にはS417以降の処理を実行する。
Thereafter, a predetermined command is input (S40
9), it is determined whether or not to register parallel translation data for other English and Japanese sentences (S410). When parallel translation data registration of other English and Japanese sentences is performed (YES in S410), a new English sentence and Japanese sentence are selected (S422), and the processes of S404 and thereafter are executed. On the other hand, when it is not necessary to change to another English sentence or Japanese sentence (NO in S410), the operator determines whether to further register the displayed English sentence and Japanese sentence as parallel translation data (S411). When parallel translation data registration is performed (YES in S411), the processing of S412 and subsequent steps is executed, and when parallel translation data registration is not performed (S411).
If NO), the processing from S417 is executed.

【0085】S412において、英語および邦文中に未
登録語が存在する場合(S412でYES)には、S4
08に戻り未登録語を表示する。一方、英語および邦文
中に未登録語が存在しない場合(S412でNO)に
は、英文および邦文の固有番号である対訳番号を生成
し、対訳番号を英文および邦文に付加する(S41
3)。そして、対訳データ登録部211は、英文および
邦文の対訳データを検索するためのキーデータを生成し
(S414)、このキーデータとともに英文および邦文
を対訳データとして対訳データベース246に登録する
(S415)。この後、対訳データ登録部211は、日
英文書ファイル251中の他の英文および邦文を用意し
(S418)、表示部2cに表示する(S404)。以
下、S405以降の処理が繰り返される。
In S412, if there are unregistered words in English and Japanese (YES in S412), S4 is entered.
Returning to 08, the unregistered word is displayed. On the other hand, when there is no unregistered word in English and Japanese (NO in S412), a translation number, which is a unique number of English and Japanese, is generated and the translation number is added to the English and Japanese (S41).
3). Then, the parallel translation data registration unit 211 generates key data for searching the parallel translation data of English and Japanese (S414), and registers the English and Japanese sentences as parallel translation data in the parallel translation database 246 together with this key data (S415). After that, the parallel translation data registration unit 211 prepares other English and Japanese sentences in the Japanese-English document file 251 (S418) and displays them on the display unit 2c (S404). Hereinafter, the processing from S405 is repeated.

【0086】一方、S411において登録を行わない場
合には、英語未登録語表示欄43に表示された英語の未
登録単語を登録するか否かをオペレータが判断する(S
417)。英語の未登録語を登録すると判断した場合
(S417でYES)には、英語の未登録単語を英語形
態素解析辞書243に登録し(S418)、S404に
戻る。登録しないと判断した場合(S417でNO)に
は、さらに日本語の未登録単語を登録するか否かを判断
する(S419)。日本語の未登録語を登録すると判断
した場合(S419でYES)には、日本語の未登録語
を日本語形態素解析辞書244に登録し(S420)、
S404に戻る。登録しないと判断した場合(S419
でNO)には、さらに対訳データ登録の処理を終了する
か否かを判断する(S421)。対訳データ登録の処理
を終了しないと判断した場合(S421でNO)にはS
404以降の処理を実行し、対訳データ登録の処理を終
了すると判断した場合(S421でYES)には、対訳
データ登録の処理は全て終了する。
On the other hand, when the registration is not performed in S411, the operator determines whether or not to register the English unregistered word displayed in the English unregistered word display field 43 (S).
417). When it is determined that the English unregistered word is to be registered (YES in S417), the English unregistered word is registered in the English morphological analysis dictionary 243 (S418), and the process returns to S404. If it is determined not to register (NO in S417), it is further determined whether or not to register an unregistered word in Japanese (S419). If it is determined to register the Japanese unregistered word (YES in S419), the Japanese unregistered word is registered in the Japanese morphological analysis dictionary 244 (S420).
It returns to S404. When it is determined not to register (S419
If NO, further, it is determined whether or not the parallel translation data registration processing is to be ended (S421). If it is determined that the parallel translation data registration processing is not to be ended (NO in S421), S
When it is determined that the processes of 404 and thereafter are executed and the process of parallel translation data registration is completed (YES in S421), the process of parallel translation data registration is completed.

【0087】S431以降の処理は、対訳データ登録の
対象となる英文および邦文が別ファイルにある場合(S
401でNO)の処理である。オペレータは、英文ファ
イル名および邦文ファイル名を入力部2bからメインフ
レーム2aに入力する(S431、S432)。する
と、メインフレーム2aは、文書ファイル25から英文
ファイル252および邦文ファイル253を読み込む
(S433、S434)。読み込まれた英文ファイル2
52中の英文、および邦文ファイル253中の邦文は表
示部2cに表示される(S435)。
The processing after S431 is performed when the English and Japanese sentences to be registered for the parallel translation data are in different files (S
This is the process of NO in 401). The operator inputs an English file name and a Japanese file name from the input unit 2b to the mainframe 2a (S431, S432). Then, the mainframe 2a reads the English file 252 and the Japanese file 253 from the document file 25 (S433, S434). Read English file 2
The English sentence in 52 and the Japanese sentence in the Japanese sentence file 253 are displayed on the display unit 2c (S435).

【0088】例えば、図5に示されるように、同一画面
上に英文51「Selectively ・・・ in
section 6.3.1.」と、邦文52「6.
3.1の項の計算方法により、・・・施されているこ
と。」が対となって表示される。このように対になった
英文および邦文をそのまま対訳データ登録するとオペレ
ータが判断した場合(S436でYES)には、S43
7以降の処理を実行する。一方、この対のまま英文およ
び邦文を登録しないとオペレータが判断した場合(S4
36でNO)には、S445以降の処理を実行する。
For example, as shown in FIG. 5, the English sentence 51 "Selective ... In
section 6.3.1. , And the Japanese sentence 52 “6.
According to the calculation method in section 3.1 ... Are displayed as a pair. When the operator determines that the English and Japanese sentences thus paired are directly registered as the bilingual data (YES in S436), S43.
The processing after 7 is executed. On the other hand, if the operator determines that the English and Japanese sentences should not be registered as they are (S4
If NO in S36, the processes in and after S445 are executed.

【0089】S437において、対訳データ登録部21
1は、英文51中に英語形態素解析辞書243に登録さ
れていない単語があるか否かを調べる。同様に、対訳デ
ータ登録部211は、邦文52中に日本語形態素解析辞
書244に登録されていない単語があるか否かを調べる
(S438)。英文51および邦文52に未登録単語が
存在する場合(S439でYES)には、対訳データ登
録部211は表示部2bに未登録単語を表示する(S4
40)。オペレータは、この表示に基づき英語の未登録
語を登録するか否かを判断する(S441)。英語の未
登録語を登録すると判断した場合(S441でYES)
には、英語の未登録語を英語形態素解析辞書243に登
録し(S442)、S435に戻る。登録しないと判断
した場合(S441でNO)には、さらに日本語の未登
録語を登録するか否かをオペレータは判断する(S44
3)。日本語の未登録語を登録すると判断した場合(S
443でYES)には、日本語の未登録語を日本語形態
素解析辞書244に登録し(S444)、S435に戻
る。登録しないと判断した場合(S443でNO)に
は、未登録語の登録を行うことなくS435に戻る。
In S437, the parallel translation data registration unit 21
1 checks whether or not there is a word in the English sentence 51 that is not registered in the English morphological analysis dictionary 243. Similarly, the parallel translation data registration unit 211 checks whether or not the Japanese sentence 52 has a word that is not registered in the Japanese morphological analysis dictionary 244 (S438). When there are unregistered words in the English sentence 51 and the Japanese sentence 52 (YES in S439), the parallel translation data registration unit 211 displays the unregistered word on the display unit 2b (S4).
40). Based on this display, the operator determines whether to register an unregistered word in English (S441). When it is determined to register an unregistered word in English (YES in S441)
In English, an unregistered word in English is registered in the English morphological analysis dictionary 243 (S442), and the process returns to S435. If it is determined not to register (NO in S441), the operator further determines whether to register an unregistered word in Japanese (S44).
3). If it is determined to register an unregistered word in Japanese (S
If YES in 443), the Japanese unregistered word is registered in the Japanese morphological analysis dictionary 244 (S444), and the process returns to S435. If it is determined not to register (NO in S443), the process returns to S435 without registering an unregistered word.

【0090】S439において、未登録語がないと対訳
データ登録部221が判断した場合には、S457以降
の処理を実行する。すなわち、対訳データ登録部221
は、英文および邦文の固有番号である対訳番号を生成
し、対訳番号を英文および邦文に付加する(S45
7)。そして、対訳データ登録部211は、英文および
邦文の対訳データを検索するためのキーデータを生成し
(S458)、このキーデータとともに英文および邦文
を対訳データとして対訳データベース246に登録する
(S459)。この後、オペレータは表示された他の英
文および邦文を選択し(S460)、S435以降の処
理が実行される。
In S439, if the parallel translation data registration unit 221 determines that there is no unregistered word, the processing from S457 is executed. That is, the parallel translation data registration unit 221
Generates a bilingual translation number, which is a unique number for English and Japanese, and adds the bilingual translation number to the English and Japanese (S45).
7). Then, the parallel translation data registration unit 211 generates key data for searching the parallel translation data of English and Japanese (S458), and registers the English and Japanese sentences as parallel translation data in the parallel translation database 246 together with this key data (S459). After that, the operator selects another displayed English sentence or Japanese sentence (S460), and the processing from S435 is executed.

【0091】S436において、表示された英文および
邦文の対訳を登録しないとオペレータが判断した場合
(S436でNO)には、コマンド53を入力すること
により他の英文を選択する(S445、S446)。同
様に、コマンド53を入力することにより他の邦文を選
択する(S447、S448)。英文および邦文の対を
変更しない場合(S445でNO、S447でNO)に
は、S449以降の処理を実行する。
In S436, when the operator determines that the parallel translation of the displayed English sentence and Japanese sentence is not registered (NO in S436), another English sentence is selected by inputting the command 53 (S445, S446). Similarly, another Japanese sentence is selected by inputting the command 53 (S447, S448). When the pair of English sentence and Japanese sentence is not changed (NO in S445, NO in S447), the processes of S449 and thereafter are executed.

【0092】S449において、英文51を他の英文に
結合するか否かをオペレータが判断する(S449)。
他の英文に結合する場合(S449でYES)には、英
文51と、英文51に続く英文54とを結合し(S45
0)、S435以降の処理を実行する。英文51を分割
する場合(S451でYES)、指定箇所において英文
51を分割し(S452)、S435以降の処理を実行
する。
In S449, the operator determines whether to combine the English sentence 51 with another English sentence (S449).
When combining with another English sentence (YES in S449), the English sentence 51 and the English sentence 54 following the English sentence 51 are combined (S45).
0), the processing from S435 is executed. When the English sentence 51 is divided (YES in S451), the English sentence 51 is divided at the designated location (S452), and the processing of S435 and thereafter is executed.

【0093】また、邦文についても同様の処理を行う。
すなわち、邦文52と、邦文52に続く邦文55とを結
合するとオペレータが判断した場合(S453でYE
S)には、邦文52と邦文55とを結合し(S45
4)、S435以降の処理を実行する。邦文52を分割
する場合(S455でYES)には、指定箇所において
邦文52を分割し(S456)、S435以降の処理を
実行する。したがって、英文51および邦文52中の所
望の部分同士を対訳登録することもでき、また、複数の
英文と複数の邦文とを結合して対訳登録することも可能
である。英文51、邦文52の結合および分割を行わな
い場合(S449、S451、S453、S455でN
O)には、対訳データ登録の処理が終了する。
The same processing is performed for Japanese sentences.
That is, when the operator determines to combine the Japanese sentence 52 and the Japanese sentence 55 following the Japanese sentence 52 (YE in S453).
In S), the Japanese sentence 52 and the Japanese sentence 55 are combined (S45).
4), the processing from S435 is executed. When the Japanese sentence 52 is divided (YES in S455), the Japanese sentence 52 is divided at the designated portion (S456), and the processes of S435 and thereafter are executed. Therefore, desired parts of the English sentence 51 and the Japanese sentence 52 can be registered in parallel translation, or a plurality of English sentences and a plurality of Japanese sentences can be combined and registered in parallel translation. When the English sentence 51 and the Japanese sentence 52 are not combined and divided (N in S449, S451, S453, S455)
In O), the parallel data registration process ends.

【0094】(対訳データ学習の詳細)図22は、対訳
学習(図16のS104)の詳細を表すフローチャート
である。オペレータは、入力部2bを介してメインフレ
ーム2aに対訳文番号を入力する(S501)。この対
訳文番号は、対訳データ登録された文に付加された固有
番号である。例えば、図6に示すように対訳文番号36
46が入力されたとすると、メインフレーム2aは英文
61および邦文62を表示部2cに表示する。
(Details of Parallel Translation Data Learning) FIG. 22 is a flowchart showing the details of parallel translation learning (S104 in FIG. 16). The operator inputs the bilingual sentence number to the mainframe 2a via the input unit 2b (S501). This bilingual sentence number is a unique number added to the sentence registered in the bilingual data. For example, as shown in FIG.
If 46 is input, the main frame 2a displays the English sentence 61 and the Japanese sentence 62 on the display unit 2c.

【0095】対訳学習部212は、過去の学習例(対訳
パーツ解析辞書245)に基づき英文61および邦文6
2をパーツ単位で自動的に対応づけ、パーツリンク情報
63を生成する。すなわち、英文61および邦文62中
に、対訳パーツ解析辞書245に登録された対訳パーツ
と同一のパーツが存在する場合には、登録された対訳パ
ーツに基づきパーツリンク情報63を生成する。英文6
1および邦文62中に、対訳パーツ解析辞書245に未
登録のパーツが存在する場合には、英和辞書241およ
び和英辞書242に登録された単語を用いることにより
パーツリンク情報63を生成する(S502)。
The bilingual learning unit 212 uses English 61 and Japanese 6 based on past learning examples (bilingual parts analysis dictionary 245).
2 is automatically associated with each part, and the part link information 63 is generated. That is, when the same part as the bilingual part registered in the bilingual part analysis dictionary 245 exists in the English sentence 61 and the Japanese sentence 62, the part link information 63 is generated based on the registered bilingual part. English 6
If there is an unregistered part in the bilingual parts analysis dictionary 245 in 1 and the Japanese sentence 62, the parts link information 63 is generated by using the words registered in the English-Japanese dictionary 241 and the Japanese-English dictionary 242 (S502). .

【0096】生成されたパーツリンク情報63は表示部
2cに表示される(S503)。パーツリンク情報63
が正しく生成されたとオペレータが判断した場合(S5
04でYES)には、表示欄64において「y]を入力
する。これにより、対訳学習部212は生成されたパー
ツリンク情報63を対訳データベース24内の対訳パー
ツ解析辞書245に自動的に追加登録し(S511)、
対訳学習の処理を終了する。
The generated parts link information 63 is displayed on the display section 2c (S503). Parts link information 63
If the operator determines that the is correctly generated (S5
(YES in 04), enter “y” in the display field 64. As a result, the parallel translation learning unit 212 automatically additionally registers the generated parts link information 63 in the parallel parts analysis dictionary 245 in the parallel translation database 24. (S511),
The bilingual learning process ends.

【0097】一方、パーツリンク情報63が正しく生成
されていないとオペレータが判断した場合(S504で
NO)には、S505以降の処理が実行される。S50
5において、パーツリンクリストを表示するとオペレー
タが判断した場合(S505でYES)には、表示欄6
5において「y]を入力する。これにより、パーツリン
ク情報、英語パーツ情報、日本語パーツ情報のリストが
プリンタ2dから出力される。例えば、英文61および
邦文62中に過去の学習例において対応づけがなされて
いないパーツがあった場合には、パーツリンク情報63
において<<3:with ****>>のような表示が
なされる。オペレータはこの表示を見ることにより、対
応づけがなされていないパーツを把握することが可能と
なる。
On the other hand, when the operator determines that the parts link information 63 is not correctly generated (NO in S504), the processes of S505 and thereafter are executed. S50
5, when the operator determines that the parts link list is displayed (YES in S505), the display column 6
5. Input "y" in 5. By this, a list of parts link information, English parts information, and Japanese parts information is output from the printer 2d. For example, English sentence 61 and Japanese sentence 62 are associated with each other in past learning examples. If there is a part that has not been checked, the parts link information 63
In, a display such as <<< 3: with *** >>> is made. By looking at this display, the operator can grasp the parts that have not been associated.

【0098】パーツリンクリストを出力しない場合(S
505でNO)においても、英語パーツ情報66および
日本語パーツ情報67は表示部2cに表示される(S5
07、S508)。オペレータは、これらの表示もしく
はプリントアウトされたリストを見ながら修正事項を把
握し、英語パーツと日本語パーツとをどのように対応づ
けるかを対訳学習部212に指示する(S509)。図
6の表示例においては、[3:with]、[13:mea
sured 14:as]の対応づけがなされていない。
したがって、オペレータは[3:with]のパーツの順
序番号「3」を入力し、このパーツに対応する[16:厚
さ 17:で]のパーツの順序番号「16、17」を入力
する(符号68)。同様に、[13:measured 1
4:as]のパーツの順序番号「13、14」を入力し、
このパーツに対応する[3:計測 4:方法 5:により]の
順序番号「3、4、5」を入力する(符号69)。
When the parts link list is not output (S
Even in the case of NO in 505), the English parts information 66 and the Japanese parts information 67 are displayed on the display unit 2c (S5).
07, S508). The operator grasps the correction items while looking at the displayed or printed list, and instructs the parallel translation learning unit 212 how to associate the English parts with the Japanese parts (S509). In the display example of FIG. 6, [3: with], [13: mea
[sured 14: as] is not associated.
Therefore, the operator inputs the sequence number "3" of the part of [3: with], and the sequence number "16, 17" of the part of [16: thickness 17:] corresponding to this part (reference numeral 68). Similarly, [13: measured 1
Enter the sequence number "13, 14" of the part of [4: as],
The sequence number "3, 4, 5" of [3: measurement 4: method 5:] corresponding to this part is input (reference numeral 69).

【0099】このようにして、パーツリンク情報63の
修正が終了するまで(S510でYES)、S509の
処理を繰り返し実行する。表示されたパーツリンク情報
63の修正が終了した後、S503以降の処理を繰り返
すことにより修正後のパーツリンク情報の表示、登録等
の処理を行う。
In this way, the process of S509 is repeatedly executed until the modification of the parts link information 63 is completed (YES in S510). After the correction of the displayed parts link information 63 is completed, the processes after S503 are repeated to display and register the corrected parts link information.

【0100】(英日翻訳の詳細)図23は、英日翻訳
(図17のS202)の詳細を表すフローチャートであ
る。オペレータは、入力部2bを介してメインフレーム
2aに翻訳対象となる英文ファイル名を入力する(S6
01)。メインフレーム2aは英文ファイルを内部メモ
リの作業領域に読み込み(S602)、読み込んだ英文
ファイルを表示部2cに表示する(S603)。
(Details of English-Japanese Translation) FIG. 23 is a flowchart showing the details of English-Japanese translation (S202 of FIG. 17). The operator inputs the English file name to be translated into the mainframe 2a via the input unit 2b (S6).
01). The main frame 2a reads the English text file into the work area of the internal memory (S602), and displays the read English text file on the display unit 2c (S603).

【0101】オペレータは、コマンドをメインフレーム
2aに入力し(S604)、一文毎の翻訳あるいは一括
翻訳のいずれを行うかを英日翻訳部221に指示する。
原文を一文毎に翻訳する場合(S605でYES)に
は、S606の処理により一文の翻訳を行った後、S6
04以降の処理を繰り返す。
The operator inputs a command into the mainframe 2a (S604) and instructs the English-Japanese translation section 221 whether to translate each sentence or batch translation.
When the original sentence is translated for each sentence (YES in S605), the sentence is translated by the process of S606, and then S6 is performed.
The processing from 04 is repeated.

【0102】一方、原文を一括して翻訳する場合には
(S607でYES)には、オペレータは、翻訳を開始
する文番号(翻訳開始文番号)と翻訳を終了する文番号
(翻訳終了文番号)とを英日翻訳部221に指示する
(S608)。英日翻訳部221は、先ず翻訳開始文番
号の一文を日本語に翻訳する(S609)。そして、英
日翻訳部221は翻訳終了文番号の英文の翻訳が終了し
たか否かを判断し(S610)、終了した場合(S61
0でYES)には、S604以降の処理を繰り返し実行
する。翻訳終了文番号の英文の翻訳が終了していない場
合(S610でNO)には、第2文の英文を表示し(S
611)、S609以降の処理を繰り返し実行する。こ
のようにして、翻訳開始文番号から翻訳終了文番号まで
の複数の英文を一括して邦文に翻訳することができる。
On the other hand, in the case of translating the original sentence in a batch (YES in S607), the operator starts the translation (translation start sentence number) and the translation end sentence number (translation end sentence number). ) And are sent to the English-Japanese translation unit 221 (S608). The English-Japanese translation unit 221 first translates one sentence of the translation start sentence number into Japanese (S609). Then, the English-Japanese translation unit 221 determines whether or not the translation of the English sentence with the translation end sentence number is completed (S610), and if it is completed (S61).
If YES, the process from S604 is repeated. When the translation of the English sentence with the translation end sentence number is not completed (NO in S610), the English sentence of the second sentence is displayed (S
611) and the processing from S609 are repeatedly executed. In this way, a plurality of English sentences from the translation start sentence number to the translation end sentence number can be collectively translated into a Japanese sentence.

【0103】S607において、一括翻訳を行わないと
オペレータが判断した場合(S607)には、翻訳結果
を印字するか否かを判断する(S612)。翻訳結果を
印字する場合(S612でYES)には、オペレータ
は、印字開始文番号と印字終了文番号とを英日翻訳印書
部223に指示する。英日翻訳印書部223は印字開始
文番号の第1文の対訳(英文および邦文)をプリンタ2
dに出力し、プリンタ2dは第1文の対訳を所定の書式
で印字する(S614)。英日翻訳印書部223は、印
字終了文番号の対訳の印字が終了するまで(S615で
YES)、印字を続ける。印字終了文番号の対訳の印字
が終了すると(S615でYES)、S604以降の処
理を繰り返し実行する。
When the operator determines in S607 that the batch translation is not performed (S607), it is determined whether or not the translation result is printed (S612). When printing the translation result (YES in S612), the operator instructs the English-Japanese translation stamp section 223 of the print start sentence number and the print end sentence number. The English-Japanese translation printing unit 223 prints the parallel translation (English and Japanese) of the first sentence of the printing start sentence number.
Then, the printer 2d prints the parallel translation of the first sentence in a predetermined format (S614). The English-Japanese translation stamp unit 223 continues printing until the printing of the parallel translation of the print end sentence number is completed (YES in S615). When the printing of the parallel translation of the print end sentence number is completed (YES in S615), the processing of S604 and thereafter is repeatedly executed.

【0104】S612において、印字を行わないとオペ
レータが判断した場合(S612でNO)には、訳文を
ファイルに出力するか否かを判断する(S617)。訳
文をファイルに出力するとオペレータが判断した場合
(S617でYES)には、訳文をファイルに出力し、
図17のフローチャートに戻る。
When the operator determines in S612 that the printing is not performed (NO in S612), it is determined whether or not the translated sentence is output to the file (S617). When the operator determines that the translated text is to be output to the file (YES in S617), the translated text is output to the file,
Returning to the flowchart of FIG.

【0105】図24は、上述したS606、S609の
一文翻訳の処理を表すフローチャートである。先ず、英
日翻訳部221は、翻訳対象として与えられた原文のキ
ーデータを生成する(S651)。キーデータは対訳デ
ータベース246検索用のデータである。英日翻訳部2
21は、このキーデータに従い対訳データベース246
上の対訳データのうち、原文に最も類似した英文を有す
る対訳データを検索し(S652)、この対訳データを
読み込む(S653)。
FIG. 24 is a flow chart showing the above-described one-sentence translation processing in S606 and S609. First, the English-Japanese translation unit 221 generates key data of an original sentence given as a translation target (S651). The key data is data for searching the parallel translation database 246. English-Japanese translation department 2
21 is a parallel translation database 246 according to this key data.
Of the above bilingual data, the bilingual data having an English sentence most similar to the original sentence is searched (S652), and this bilingual data is read (S653).

【0106】例えば、図13に示されるように、[Wh
en I fell into the river
he came to my aid.]という原文1
31が与えられたとする。英日翻訳部221は、対訳デ
ータベース246の中から原文131に最も類似した英
文を備えた対訳データ132を検索する。すなわち、英
文[When it came to voting,
he abstained]を備えた対訳データ132
が検索される。
For example, as shown in FIG. 13, [Wh
en I fell into the river
he came to my aid. ] 1
Suppose 31 is given. The English-Japanese translation unit 221 searches the parallel translation database 246 for the parallel translation data 132 including the English sentence most similar to the original sentence 131. In other words, the English sentence [When it came to voting,
parallel translation data 132 including “he abtained”
Will be searched.

【0107】英日翻訳部221は、対訳データ132の
パーツのうち、原文131のパーツと一致するものを調
べる。すなわち、対訳データ132のパーツのうち、原
文131の翻訳に使用可能なパーツが存在するか否かを
判断する(S654)。判断の結果、使用可能なパーツ
が対訳データ132中に存在する場合(S654でYE
S)には、このパーツを内部メモリ上の作業領域の取り
込む(S655)。対訳データ132のパーツのうち、
使用可能なパーツは[When][he]の2つのパー
ツである。
The English-Japanese translation unit 221 checks the parts of the parallel translation data 132 that match the parts of the original sentence 131. That is, it is determined whether or not there is a part that can be used for translating the original sentence 131 among the parts of the parallel translation data 132 (S654). As a result of the judgment, if usable parts exist in the parallel translation data 132 (YES in S654).
In S), this part is loaded into the work area on the internal memory (S655). Of the parts of the parallel translation data 132,
Available parts are [When] and [he].

【0108】次に、英日翻訳部221は、原文131中
の全てのパーツが揃ったか否かを判断する(S65
7)。このとき、原文131のパーツのうち、[I f
ellinto my river][came][t
o my aid]のパーツが揃っていない(訳がなさ
れていない)ため(S657でNO)、英日翻訳部22
1は、原文131に2番目に類似した英文を有する対訳
データ133を対訳データベース246から読み出す
(S658)。対訳データ133のパーツリンク情報の
うち、[came][to my aid]の2つのパ
ーツが原文131のパーツと一致している(S65
4)。したがって、英日翻訳部221はこれらの2つの
パーツを作業領域に取り込み(S655)、さらに原文
131のパーツが揃ったか否かを判断する(S65
7)。このとき、原文131のパーツのうち[I fe
ll into my aid]のパーツが揃っていな
いため(S657でNO)、英日翻訳部221は、原文
131に3番目に類似した英文を有する対訳データ13
4を読み込む(S658)。
Next, the English-Japanese translation section 221 determines whether or not all the parts in the original sentence 131 are prepared (S65).
7). At this time, among the parts of the original sentence 131, [If
ellinto my river] [came] [t
o my aid] parts are not available (not translated) (NO in S657), English-Japanese translation section 22
1 reads out from the bilingual translation database 246 the bilingual translation data 133 having an English sentence second most similar to the original sentence 131 (S658). In the parts link information of the bilingual data 133, two parts [came] [to my aid] match the parts of the original sentence 131 (S65).
4). Therefore, the English-Japanese translation unit 221 takes these two parts into the work area (S655), and further determines whether the parts of the original sentence 131 are complete (S65).
7). At this time, of the parts of the original sentence 131, [I fe
[ll into my aid] is not available (NO in S657), the English-Japanese translation unit 221 determines that the bilingual translation data 13 having an English sentence third similar to the original sentence 131.
4 is read (S658).

【0109】対訳データ134(図15)のパーツリン
ク情報のうち、[I]のみが原文131のパーツに一致
し、原文131の[fell into my ai
d]のパーツは未だ一致したものが検索されていない。
さらに、英日翻訳部221は、原文131に4番目に類
似した英文を有する対訳データ135を読み込み、使用
可能なパーツを探す。この結果、原文131の全てのパ
ーツが揃い、原文131の英文の各パーツに対応した日
本語の各パーツ136が生成される。英日翻訳部221
は、日本語のパーツ136を並べ変え、訳文137を生
成および表示する(S659、S660)。
Of the parts link information of the parallel translation data 134 (FIG. 15), only [I] matches the parts of the original sentence 131, and [fell into my ai of the original sentence 131 is displayed.
The parts of d] have not been searched for a match yet.
Further, the English-Japanese translation unit 221 reads the parallel translation data 135 having an English sentence similar to the fourth sentence of the original sentence 131, and searches for usable parts. As a result, all parts of the original sentence 131 are gathered, and Japanese parts 136 corresponding to the English parts of the original sentence 131 are generated. English-Japanese translation department 221
Generates a translated sentence 137 by rearranging the Japanese parts 136 (S659, S660).

【0110】一方、S654において、読み込まれた対
訳データについてのパーツリンク情報中に使用可能なパ
ーツが存在せず(S654でNO)、かつ、原文131
に類似した英文を有する対訳データが存在しない場合
(S656でYES)には、英和辞書241に基づき和
訳を行う(S661)。すなわち、英日翻訳部221
は、原文131のパーツのうち、対訳が検索されていな
いパーツ(単語)の和訳を英和辞書241から読み込
み、原文131の訳文を完成する。以上の処理により、
原文131の訳文が完成すると、図23のフローチャー
トに戻る。
On the other hand, in S654, there is no usable part in the part link information about the parallel translation data read (NO in S654), and the original sentence 131
If there is no parallel translation data having an English sentence similar to (YES in S656), the Japanese translation is performed based on the English-Japanese dictionary 241 (S661). That is, the English-Japanese translation section 221
Reads, from the English-Japanese dictionary 241, a Japanese translation of a part (word) whose parallel translation has not been searched among the parts of the original sentence 131, and completes the translated sentence of the original sentence 131. By the above processing,
When the translated sentence of the original sentence 131 is completed, the process returns to the flowchart of FIG.

【0111】(日英翻訳の詳細)図25は、日英翻訳
(図17のS206)の詳細を表すフローチャートであ
る。このフローチャートに示された日英翻訳の処理は、
図23のフローチャートに示された英日翻訳の処理と略
同様である。
(Details of Japanese-English Translation) FIG. 25 is a flowchart showing the details of Japanese-English translation (S206 in FIG. 17). The processing of Japanese-English translation shown in this flowchart is
The process is substantially the same as the English-Japanese translation process shown in the flowchart of FIG.

【0112】すなわち、オペレータは、入力部2bを介
してメインフレーム2aに翻訳対象となる邦文ファイル
名を入力する(S701)。メインフレーム2aは邦文
ファイルを内部メモリの作業領域に読み込み(S70
2)、読み込んだ邦文ファイルを表示部2cに表示する
(S703)。
That is, the operator inputs a Japanese file name to be translated into the mainframe 2a via the input unit 2b (S701). The mainframe 2a reads the Japanese file into the work area of the internal memory (S70
2) The read Japanese file is displayed on the display unit 2c (S703).

【0113】オペレータは、コマンドをメインフレーム
2aに入力し(S704)、一文毎の翻訳あるいは一括
翻訳のいずれを行うかを日英翻訳部222に指示する。
原文を一文毎に翻訳する場合(S705でYES)に
は、S706の処理により一文の翻訳を行った後、S7
04以降の処理を繰り返す。
The operator inputs a command to the mainframe 2a (S704), and instructs the Japanese-English translation unit 222 whether to translate each sentence or batch translation.
When the original sentence is translated for each sentence (YES in S705), the sentence is translated by the process of S706, and then S7 is performed.
The processing from 04 is repeated.

【0114】一方、原文を一括して翻訳する場合には
(S707でYES)には、オペレータは、翻訳を開始
する文番号(翻訳開始文番号)と翻訳を終了する文番号
(翻訳終了文番号)とを日英翻訳部222に指示する
(S708)。日英翻訳部222は、先ず翻訳開始文番
号の一文を英語に翻訳する(S709)。そして、日英
翻訳部222は翻訳終了文番号の邦文の翻訳が終了した
か否かを判断し(S710)、終了した場合(S710
でYES)には、S704以降の処理を繰り返し実行す
る。翻訳終了文番号の邦文の翻訳が終了していない場合
(S710でNO)には、第2文の邦文を表示し(S7
11)、S709以降の処理を繰り返し実行する。この
ようにして、翻訳開始文番号から翻訳終了文番号までの
複数の邦文を一括して英文に翻訳することができる。
On the other hand, in the case of translating the original sentence all at once (YES in S707), the operator starts the sentence number (translation start sentence number) and the translation end sentence number (translation end sentence number). ) And are sent to the Japanese-English translation unit 222 (S708). First, the Japanese-English translation unit 222 translates one sentence of the translation start sentence number into English (S709). Then, the Japanese-English translation unit 222 determines whether or not the translation of the Japanese sentence with the translation end sentence number is completed (S710), and if it is completed (S710).
If YES), the processing after S704 is repeatedly executed. If the translation of the Japanese sentence with the translated sentence number has not been completed (NO in S710), the Japanese sentence of the second sentence is displayed (S7).
11), the processing from S709 is repeatedly executed. In this way, a plurality of Japanese sentences from the translation start sentence number to the translation end sentence number can be collectively translated into English.

【0115】S707において、一括翻訳を行わないと
オペレータが判断した場合(S707)には、翻訳結果
を印字するか否かを判断する(S712)。翻訳結果を
印字する場合(S712でYES)には、オペレータ
は、印字開始文番号と印字終了文番号とを日英翻訳印書
部224に指示する。日英翻訳印書部224は印字開始
文番号の第1文の対訳(英文および邦文)をプリンタ2
dに出力し、プリンタ2dは第1文の対訳を所定の書式
で印字する(S714)。日英翻訳印書部224は、印
字終了文番号の対訳の印字が終了するまで(S715で
YES)、印字を続ける。印字終了文番号の対訳の印字
が終了すると(S715でYES)、S704以降の処
理を繰り返し実行する。
When the operator determines in S707 that the batch translation is not performed (S707), it is determined whether or not the translation result is printed (S712). When printing the translation result (YES in S712), the operator instructs the Japanese-English translated print section 224 with the print start sentence number and the print end sentence number. The Japanese-English translation printing unit 224 prints a parallel translation (English and Japanese) of the first sentence of the print start sentence number in the printer 2.
Then, the printer 2d prints the parallel translation of the first sentence in a predetermined format (S714). The Japanese-English translation stamp unit 224 continues printing until the printing of the parallel translation of the print end sentence number is completed (YES in S715). When the printing of the parallel translation of the print end sentence number is finished (YES in S715), the processes of S704 and thereafter are repeatedly executed.

【0116】S712において、印字を行わないとオペ
レータが判断した場合(S712でNO)には、訳文を
ファイルに出力するか否かを判断する(S717)。訳
文をファイルに出力するとオペレータが判断した場合
(S717でYES)には、訳文をファイルに出力し、
図17のフローチャートに戻る。
In S712, when the operator determines that the printing is not performed (NO in S712), it is determined whether or not the translated sentence is output to the file (S717). When the operator determines that the translated text is to be output to the file (YES in S717), the translated text is output to the file,
Returning to the flowchart of FIG.

【0117】図26は、上述したS706、S709の
一文翻訳の処理を表すフローチャートである。この処理
は、上述した図24の処理と略同様のものである。すな
わち、先ず、日英翻訳部222は、翻訳対象として与え
られた原文のキーデータを生成する(S751)。日英
翻訳部222は、このキーデータに従い対訳データベー
ス246上の対訳データのうち、原文に最も類似した邦
文を有する対訳データを検索し(S752)、この対訳
データを読み込む(S753)。
FIG. 26 is a flow chart showing the above-described one-sentence translation processing in S706 and S709. This process is substantially the same as the process of FIG. 24 described above. That is, first, the Japanese-English translation unit 222 generates key data of the original sentence given as the translation target (S751). The Japanese-English translation unit 222 searches the bilingual data on the bilingual database 246 according to the key data for bilingual data having a Japanese sentence most similar to the original sentence (S752), and reads this bilingual data (S753).

【0118】例えば、図7に示されるように、[ボンデ
ィング部分に・・・・施されていること]という原文7
1が与えられたとする。日英翻訳部222は、対訳デー
タベース246の中から、原文71に最も類似した邦文
を備えた対訳データ73を検索する。日英翻訳部222
は、対訳データ73のパーツのうち、原文71のパーツ
と一致するものを調べる。すなわち、対訳データ73の
パーツのうち、原文71の翻訳に使用可能なパーツが存
在するか否かを判断する(S754)。使用可能なパー
ツが対訳データ73中に存在する場合(S754でYE
S)には、このパーツを内部メモリ上の作業領域の取り
込む(S755)。なお、使用不可能なパーツ[15
0][計測方法により][項の][6.3.1の]につ
いては、使用不可能を表すマーク、例えば<****>
が付加される。
For example, as shown in FIG. 7, the original sentence 7
Suppose 1 is given. The Japanese-English translation unit 222 searches the parallel translation database 246 for the parallel translation data 73 including the Japanese sentence most similar to the original sentence 71. Japanese-English Translation Department 222
Examines the parts of the parallel translation data 73 that match the parts of the original sentence 71. That is, it is determined whether or not there is a part that can be used for translation of the original sentence 71 among the parts of the parallel translation data 73 (S754). If usable parts exist in the parallel translation data 73 (YE in S754
In S), this part is loaded into the work area on the internal memory (S755). In addition, unusable parts [15
0] [By measurement method] [of item] [6.3.1], a mark indicating unusable, eg <***>
Is added.

【0119】この例では、対訳データ73を構成するパ
ーツにより原文71のすべてのパーツを訳することがで
きるので、その結果を翻訳結果として出力する。仮に、
原文71の全パーツが揃っていない場合(S757でN
O)には、日英翻訳部222は、原文71に2番目に類
似した邦文を有する対訳データを対訳データベース24
6から読み出す(S758)。そして、日英翻訳部22
2は、S754以降の処理を繰り返し実行し、対訳デー
タの中から使用可能なパーツを探し出す。対訳データベ
ース246から、原文71に類似した対訳データを検索
し尽くした場合(S756でYES)には、和英辞書2
42に基づき和訳を行う(S761)。和英辞書242
から検索された単語の人称、時制等は、原文71に合わ
せられる(S762)。このようにして検索されたパー
ツ(単語)は、所定の順序に並べ変えられ、原文71の
訳文76が完成する。完成した訳文76は表示部2cに
表示される(S760)。以上の処理が終了すると、図
25の処理に戻る。
In this example, since all the parts of the original sentence 71 can be translated by the parts forming the parallel translation data 73, the result is output as the translation result. what if,
If all parts of original sentence 71 are not available (N in S757)
In O), the Japanese-English translation unit 222 stores the bilingual data having the Japanese sentence second similar to the original sentence 71 in the bilingual database 24.
It is read from 6 (S758). And Japanese-English translation department 22
In step 2, the processes from S754 onward are repeatedly executed to search the bilingual data for usable parts. When the bilingual data similar to the original sentence 71 is completely searched from the bilingual database 246 (YES in S756), the Japanese-English dictionary 2
Japanese translation is performed based on 42 (S761). Japanese-English dictionary 242
The personal name, tense, etc. of the word retrieved from are matched with the original sentence 71 (S762). The parts (words) thus searched are rearranged in a predetermined order, and the translated sentence 76 of the original sentence 71 is completed. The completed translated sentence 76 is displayed on the display unit 2c (S760). When the above process ends, the process returns to the process of FIG.

【0120】(辞書データベース送受信の詳細)図27
〜図30は、辞書データベース24の送受信の処理(図
18のS312)の詳細を表すフローチャートである。
(Details of Dictionary Database Transmission / Reception) FIG.
30. FIG. 30 is a flowchart showing details of the process of transmitting / receiving the dictionary database 24 (S312 in FIG. 18).

【0121】図27のフローチャートにおいて、オペレ
ータは表示部2cに表示されたメニューを見ながら辞書
データベースの送信あるいは受信のいずれを行うかを選
択する。送信処理が選択された場合(S801でYE
S)には、辞書データベース送受信部236はS803
以降の処理を実行し、受信処理が選択された場合(S8
02でYES)には辞書データベース送受信部236は
S901(図29)以降の処理を実行する。
In the flowchart of FIG. 27, the operator selects either transmission or reception of the dictionary database while looking at the menu displayed on the display unit 2c. When the transmission process is selected (YES in S801)
In S), the dictionary database transmission / reception unit 236 executes S803.
When the following processing is executed and the reception processing is selected (S8
If YES in 02), the dictionary database transmitting / receiving unit 236 executes the processing from S901 (FIG. 29).

【0122】辞書データベースの送信処理 オペレータが送信処理を選択した場合(S801でYE
S)には、さらに図19に示す辞書データベース送信メ
インメニューの中から所望の処理を選択する。オペレー
タが英和辞書の送信処理を選択した場合(S803でY
ES)には、辞書データベース送受信部236は英和辞
書241から英和辞書データを1件分取り出す(S80
4)。そして、辞書データベース送受信部236は、取
り出したデータを送信用ファイルに書き込む(S80
5)。このようにして、英和辞書241からの全ての辞
書データの読み込みが終了するまで(S806でYE
S)、S804〜S805の処理を繰り返し実行する。
全ての辞書データの読み込みが終了すると(S806で
YES)、辞書データベース送受信部236は送信用フ
ァイル内の辞書データを通信系2eを介して他のワーク
ステーションに送信する。以上により、英和辞書データ
の送信処理が終了し、図18のフローチャートに戻る。
Dictionary database transmission processing When the operator selects transmission processing (YES in S801)
In S), desired processing is further selected from the dictionary database transmission main menu shown in FIG. When the operator selects the processing for transmitting the English-Japanese dictionary (Y in S803)
In ES), the dictionary database transmitting / receiving unit 236 extracts one English-Japanese dictionary data from the English-Japanese dictionary 241 (S80).
4). Then, the dictionary database transmitting / receiving unit 236 writes the extracted data in the transmission file (S80).
5). In this way, until reading of all the dictionary data from the English-Japanese dictionary 241 is completed (YE at S806).
S) and S804 to S805 are repeatedly executed.
When reading of all the dictionary data is completed (YES in S806), the dictionary database transmission / reception unit 236 transmits the dictionary data in the transmission file to another workstation via the communication system 2e. With the above, the processing of transmitting the English-Japanese dictionary data ends, and the process returns to the flowchart of FIG.

【0123】オペレータが和英辞書の送信処理を選択し
た場合(S810でYES)には、辞書データベース送
受信部236は和英辞書242から和英辞書データを1
件分取り出す(S811)。そして、辞書データベース
送受信部236は、取り出したデータを送信用ファイル
に書き込む(S812)。このようにして、和英辞書2
42からの全ての辞書データの読み込みが終了するまで
(S813でYES)、S811〜S812の処理を繰
り返し実行する。全ての辞書データの読み込みが終了す
ると(S813でYES)、辞書データベース送受信部
236は送信用ファイル内の辞書データを通信系2eを
介して他のワークステーションに送信する。以上によ
り、和英辞書データの送信処理が終了し、図18のフロ
ーチャートに戻る。
When the operator selects the processing for transmitting the Japanese-English dictionary (YES in S810), the dictionary database transmitting / receiving unit 236 sets the Japanese-English dictionary data to 1 from the Japanese-English dictionary 242.
The case is taken out (S811). Then, the dictionary database transmitting / receiving unit 236 writes the retrieved data in the transmission file (S812). In this way, the Japanese-English dictionary 2
The processes of S811 to S812 are repeatedly executed until the reading of all the dictionary data from 42 is completed (YES in S813). When reading of all the dictionary data is completed (YES in S813), the dictionary database transmission / reception unit 236 transmits the dictionary data in the transmission file to another workstation via the communication system 2e. With the above, the processing of transmitting the Japanese-English dictionary data ends, and the process returns to the flowchart of FIG.

【0124】オペレータが英語形態素解析辞書の送信処
理を選択した場合(図28のS821でYES)には、
辞書データベース送受信部236は英語形態素解析辞書
243内のデータを送信用ファイルに取り込む(S82
2〜S824)。そして、辞書データベース送受信部2
36は送信用ファイル内の辞書データを他のワークステ
ーションに送信し、図18のフローチャートに戻る。以
下、同様に日本語形態素解析辞書244、対訳パーツ解
析辞書245、対訳データベース246の送信処理が実
行される。すなわち、日本語形態素解析辞書244の送
信を行う場合には辞書データベース送受信部236はS
826〜S830の処理を実行し、対訳パーツ解析辞書
245の送信を行う場合にはS831〜S835の処理
を実行する。また、対訳データベース246の送信を行
う場合には辞書データベース送受信部236はS836
〜S840の処理を実行する。以上により、辞書データ
ベース24の各種データを他のワークステーションに送
信することが可能となる。
When the operator selects the transmission process of the English morphological analysis dictionary (YES in S821 of FIG. 28),
The dictionary database transmission / reception unit 236 takes in the data in the English morphological analysis dictionary 243 to the transmission file (S82).
2 to S824). Then, the dictionary database transmitting / receiving unit 2
36 transmits the dictionary data in the transmission file to another workstation, and returns to the flowchart of FIG. Thereafter, similarly, the transmission processing of the Japanese morphological analysis dictionary 244, the parallel translation parts analysis dictionary 245, and the parallel translation database 246 is executed. That is, when transmitting the Japanese morphological analysis dictionary 244, the dictionary database transmission / reception unit 236 performs S
When the processes of 826 to S830 are executed and the bilingual part analysis dictionary 245 is transmitted, the processes of S831 to S835 are executed. Further, when transmitting the parallel translation database 246, the dictionary database transmitting / receiving unit 236 performs S836.
~ The process of S840 is executed. As described above, various data in the dictionary database 24 can be transmitted to other workstations.

【0125】辞書データベースの受信処理 オペレータが受信処理を選択した場合(S802でYE
S)には、辞書データベース受信メインメニューの中か
ら所望の処理を選択する。オペレータが英和辞書の受信
処理を選択したとする(S901でYES)。この後、
他のワークステーションから辞書データが通信系2eを
介して当該ワークステーションに送信され、辞書データ
が英和辞書受信ファイルに蓄えられる。辞書データベー
ス送受信部236は英和辞書受信ファイルから1件分の
辞書データを取り出し(S902)、取り出した辞書デ
ータと同一のものが英和辞書241に存在するか否かを
判断する(S903)。同一の辞書データが英和辞書2
41に存在しない場合(S903でNO)には、辞書デ
ータベース送受信部236はこの辞書データを英和辞書
241に追加する。一方、同一の辞書データが英和辞書
241に存在する場合(S903でYES)には、辞書
データベース送受信部236は辞書データの追加(S9
04)を行うことなく、S905の処理を実行する。
Receiving Process of Dictionary Database When the operator selects the receiving process (Y in S802)
In S), a desired process is selected from the dictionary database reception main menu. It is assumed that the operator selects the receiving process of the English-Japanese dictionary (YES in S901). After this,
Dictionary data is transmitted from another workstation to the workstation via the communication system 2e, and the dictionary data is stored in the English-Japanese dictionary reception file. The dictionary database transmitting / receiving unit 236 extracts one item of dictionary data from the English-Japanese dictionary reception file (S902), and determines whether the same dictionary data as the extracted dictionary data exists in the English-Japanese dictionary 241 (S903). The same dictionary data is English-Japanese dictionary 2
If it does not exist in 41 (NO in S903), the dictionary database transmitting / receiving unit 236 adds this dictionary data to the English-Japanese dictionary 241. On the other hand, if the same dictionary data exists in the English-Japanese dictionary 241 (YES in S903), the dictionary database transmitting / receiving unit 236 adds the dictionary data (S9).
The processing of S905 is executed without performing 04).

【0126】S905において、辞書データベース送受
信部236は英和辞書受信ファイル中に辞書データが残
っているか否かを判断し、辞書データが残っている場合
(S905でNO)には、S902〜S904の処理を
繰り返す。そして、英和辞書受信ファイル中の辞書デー
タを全て取り出した場合(S905でYES)には、図
27のフローチャートを介して図18のフローチャート
に戻る。
In step S905, the dictionary database transmission / reception unit 236 determines whether or not dictionary data remains in the English-Japanese dictionary reception file. If dictionary data remains (NO in step S905), the processing in steps S902 to S904 is performed. repeat. Then, when all the dictionary data in the English-Japanese dictionary reception file has been extracted (YES in S905), the process returns to the flowchart of FIG. 18 through the flowchart of FIG.

【0127】以下、同様に和英辞書242、英語形態素
解析辞書243、日本語形態素解析辞書244、対訳パ
ーツ解析辞書245の受信処理が実行される。すなわ
ち、和英辞書242の受信を行う場合にはS906〜S
910の処理を実行し、英語形態素解析辞書243の受
信を行う場合にはS911〜S915の処理を実行す
る。また、対訳パーツ解析辞書245の受信を行う場合
にはS916〜S920の処理を実行し、日本語形態素
解析辞書244の受信を行う場合にはS921〜S92
5の処理を実行する。
Thereafter, similarly, the receiving process of the Japanese-English dictionary 242, the English morphological analysis dictionary 243, the Japanese morphological analysis dictionary 244, and the bilingual parts analysis dictionary 245 is executed. That is, when receiving the Japanese-English dictionary 242, S906 to S906
When the processing of 910 is executed and the English morphological analysis dictionary 243 is received, the processing of S911 to S915 is executed. When receiving the bilingual parts analysis dictionary 245, the processes of S916 to S920 are executed, and when receiving the Japanese morphological analysis dictionary 244, S921 to S92.
Process 5 is executed.

【0128】対訳データベースの受信を行う場合(S9
26でYES)には、S927〜S931の処理を実行
する。先ず、他のワークステーションから対訳データ等
が通信系2eを介して当該ワークステーションに送信さ
れ、これらのデータが対訳データベース受信ファイルに
蓄えられたとする。辞書データベース送受信部236は
対訳データベース受信ファイルから1件分のデータを取
り出し(S927)、取り出したデータと同一のものが
対訳データベース246に存在するか否かを判断する
(S928)。同一のデータが対訳データベース246
に存在しない場合(S928でNO)には、辞書データ
ベース送受信部236はこのデータの対訳文番号を生成
する(S929)。そして、辞書データベース送受信部
236は受信したデータを対訳文番号とともに対訳デー
タベース246に追加する(S930)。
When the bilingual database is received (S9
If YES in S26, the processes in S927 to S931 are executed. First, it is assumed that the parallel translation data or the like is transmitted from another workstation to the workstation via the communication system 2e, and these data are stored in the parallel translation database reception file. The dictionary database transmitting / receiving unit 236 extracts one item of data from the parallel translation database reception file (S927), and determines whether the same data as the extracted data exists in the parallel translation database 246 (S928). The same data is translated database 246
If it does not exist (NO in S928), the dictionary database transmitting / receiving unit 236 generates a parallel translation sentence number of this data (S929). Then, the dictionary database transmitting / receiving unit 236 adds the received data together with the bilingual sentence number to the bilingual database 246 (S930).

【0129】一方、同一のデータが対訳データベース2
46に存在する場合(S928でYES)には、辞書デ
ータベース送受信部236はデータの追加(S929、
S930)を行うことなく、S931の処理を実行す
る。S931においては、辞書データベース送受信部2
36は対訳データベース受信ファイル中にデータが残っ
ているか否かを判断し、データが残っている場合(S9
31でNO)には、S927〜S930の処理を繰り返
す。そして、対訳データベース受信ファイル中のデータ
を全て取り出した場合(S931でYES)には、図2
7のフローチャートを介して図18のフローチャートに
戻る。
On the other hand, the same data is stored in the parallel translation database 2.
46 (YES in S928), the dictionary database transmitting / receiving unit 236 adds the data (S929,
The process of S931 is executed without performing S930). In S931, the dictionary database transmitting / receiving unit 2
36 determines whether or not data remains in the parallel translation database reception file, and if data remains (S9
If NO in S31, the processes of S927 to S930 are repeated. Then, when all the data in the parallel translation database reception file has been extracted (YES in S931),
It returns to the flowchart of FIG. 18 through the flowchart of 7.

【0130】以上の処理により、他のワークステーショ
ンにおいて登録された辞書および学習登録された対訳デ
ータ等を受信し、辞書データベース24上に追加するこ
とが可能となる。これにより、複数のワークステーショ
ン間において辞書データベースを共有化することが可能
となる。
By the above processing, it becomes possible to receive the dictionary registered in another workstation, the parallel translation data registered for learning, etc., and add them to the dictionary database 24. This makes it possible to share a dictionary database among a plurality of workstations.

【0131】なお、本発明は、上述した実施例に限定さ
れることなく、本発明の趣旨を逸脱しない範囲において
実施可能である。例えば、対訳データベースの検索を行
うために、並列処理型のプロセッサ等を用いてもよい。
これにより、短時間で検索を行うことができ、翻訳速度
を大幅に向上させることが可能となる。また、翻訳例を
OCR(光学的読み取り装置)を用いて読み取ることに
より、大量の翻訳例を効率よく入力することができる。
The present invention is not limited to the above-mentioned embodiments, but can be carried out within the scope of the present invention. For example, a parallel processing type processor or the like may be used to search the parallel translation database.
As a result, the search can be performed in a short time, and the translation speed can be significantly improved. Further, by reading the translation examples using the OCR (optical reading device), a large number of translation examples can be efficiently input.

【0132】[0132]

【発明の効果】以上説明してきたように、本発明によれ
ば、以下の効果を得ることが可能である。
As described above, according to the present invention, the following effects can be obtained.

【0133】第1に、オペレータによって翻訳能力を向
上させることが可能である。すなわち、対訳データ登録
および対訳学習(パーツリンク情報生成)を行うことに
より、翻訳例を学習させることができる。したがって、
ユーザが所望の翻訳例を機械翻訳システムに学習させる
ことにより、ユーザ自身によって機械翻訳システムの翻
訳能力を向上させることが可能である。また、過去の学
習例(対訳パーツ)に基づき自動的に学習登録を行うこ
とができるため、学習登録におけるオペレータの作業負
担を軽減することができる。
First, the translation ability can be improved by the operator. That is, translation examples can be learned by registering parallel translation data and performing parallel translation learning (part link information generation). Therefore,
By allowing the user to learn a desired translation example in the machine translation system, it is possible for the user himself to improve the translation capability of the machine translation system. Further, since the learning registration can be automatically performed based on the past learning examples (translation parts), the work load on the operator in the learning registration can be reduced.

【0134】第2に、本発明によれば、文法規則を追加
せずに翻訳品質を向上させることができるため、追加さ
れた文法規則同士が干渉し合うことによる翻訳品質の低
下を回避することが可能となる。
Secondly, according to the present invention, since the translation quality can be improved without adding the grammatical rule, it is possible to avoid the deterioration of the translation quality due to the interference between the added grammatical rules. Is possible.

【0135】第3に、自然な翻訳を行うことが可能とな
る。すなわち、本発明によれば、文法規則によらずに過
去の翻訳例に基づき翻訳例を行っているため、文法規則
から離れた慣用的な表現等に対して自然な訳を出力する
ことが可能である。また、本発明にあっては、一般のE
BMT方式による機械翻訳システムと異なり、原文と、
原文に類似した翻訳例とをパーツ毎に比較しながら原文
の各パーツの訳を行っている。これにより、原文の各パ
ーツを文法規則によらずに、翻訳することができ、より
自然な訳を出力することが可能となる。
Thirdly, it becomes possible to perform natural translation. That is, according to the present invention, since the translation example is performed based on the past translation example without depending on the grammar rule, it is possible to output a natural translation for an idiomatic expression or the like that is apart from the grammar rule. Is. Further, in the present invention, general E
Unlike the machine translation system by BMT method,
Each part of the original sentence is translated while comparing each example with a translation example similar to the original sentence. As a result, each part of the original sentence can be translated regardless of the grammatical rules, and a more natural translation can be output.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の機械翻訳システムの機能ブロック図で
ある。
FIG. 1 is a functional block diagram of a machine translation system of the present invention.

【図2】本発明の一実施例に係る機械翻訳システムの概
要を表す図である。
FIG. 2 is a diagram showing an outline of a machine translation system according to an embodiment of the present invention.

【図3】本発明の一実施例に係る機械翻訳システムの機
能ブロック図である。
FIG. 3 is a functional block diagram of a machine translation system according to an embodiment of the present invention.

【図4】本発明の一実施例に係る対訳登録時の表示画面
を表す図である。
FIG. 4 is a diagram showing a display screen during parallel translation registration according to an embodiment of the present invention.

【図5】本発明の一実施例に係る対訳登録時の表示画面
を表す図である。
FIG. 5 is a diagram showing a display screen during parallel translation registration according to an embodiment of the present invention.

【図6】本発明の一実施例に係る対訳学習時の表示画面
を表す図である。
FIG. 6 is a diagram showing a display screen during parallel translation learning according to an embodiment of the present invention.

【図7】本発明の一実施例に係る翻訳処理の概要を表す
図である。
FIG. 7 is a diagram showing an outline of a translation process according to an embodiment of the present invention.

【図8】本発明の一実施例に係る対訳の一例を表す図で
ある。
FIG. 8 is a diagram showing an example of parallel translation according to an embodiment of the present invention.

【図9】本発明の一実施例に係る単語リンク情報等の一
例を表す図である。
FIG. 9 is a diagram showing an example of word link information and the like according to an embodiment of the present invention.

【図10】本発明の一実施例に係る英日翻訳例を表す図
である。
FIG. 10 is a diagram illustrating an English-Japanese translation example according to an embodiment of the present invention.

【図11】本発明の一実施例に係る日英翻訳例を表す図
である。
FIG. 11 is a diagram illustrating a Japanese-English translation example according to an embodiment of the present invention.

【図12】本発明の一実施例に係る辞書データベースの
送受信の概念図である。
FIG. 12 is a conceptual diagram of transmission / reception of a dictionary database according to an embodiment of the present invention.

【図13】本発明の一実施例に係る翻訳処理の概要を表
す図である。
FIG. 13 is a diagram showing an outline of a translation process according to an embodiment of the present invention.

【図14】本発明の一実施例に係る翻訳処理の概要を表
す図である。
FIG. 14 is a diagram showing an outline of a translation process according to an embodiment of the present invention.

【図15】本発明の一実施例に係る機械翻訳システムの
作用を表すメインフローチャートである。
FIG. 15 is a main flowchart showing the operation of the machine translation system according to the embodiment of the present invention.

【図16】本発明の一実施例に係る対訳学習登録の処理
を表すメインフローチャートである。
FIG. 16 is a main flowchart showing a bilingual learning registration process according to an embodiment of the present invention.

【図17】本発明の一実施例に係る翻訳の処理を表すメ
インフローチャートである。
FIG. 17 is a main flowchart showing a translation process according to an embodiment of the present invention.

【図18】本発明の一実施例に係る辞書管理の処理を表
すメインフローチャートである。
FIG. 18 is a main flowchart showing a dictionary management process according to an embodiment of the present invention.

【図19】本発明の一実施例に係る辞書データベース送
信メインメニューの表示例である。
FIG. 19 is a display example of a dictionary database transmission main menu according to an embodiment of the present invention.

【図20】本発明の一実施例に係る対訳データ登録の処
理の詳細を表すフローチャートである。
FIG. 20 is a flowchart showing details of parallel translation data registration processing according to an embodiment of the present invention.

【図21】本発明の一実施例に係る対訳データ登録の処
理の詳細を表すフローチャートである。
FIG. 21 is a flowchart showing details of parallel translation data registration processing according to an embodiment of the present invention.

【図22】本発明の一実施例に係る対訳学習の処理の詳
細を表すフローチャートである。
FIG. 22 is a flowchart showing details of parallel translation learning processing according to an embodiment of the present invention.

【図23】本発明の一実施例に係る英日翻訳の処理の詳
細を表すフローチャートである。
FIG. 23 is a flowchart showing details of the English-Japanese translation processing according to the embodiment of the present invention.

【図24】本発明の一実施例に係る英日翻訳の処理の詳
細を表すフローチャートである。
FIG. 24 is a flowchart showing details of processing of English-Japanese translation according to an embodiment of the present invention.

【図25】本発明の一実施例に係る日英翻訳の処理の詳
細を表すフローチャートである。
FIG. 25 is a flowchart showing details of processing of Japanese-English translation according to an embodiment of the present invention.

【図26】本発明の一実施例に係る日英翻訳の処理の詳
細を表すフローチャートである。
FIG. 26 is a flowchart showing details of the processing of Japanese-English translation according to the embodiment of the present invention.

【図27】本発明の一実施例に係る辞書データベース送
受信の処理の詳細を表すフローチャートである。
FIG. 27 is a flow chart showing details of a dictionary database transmission / reception process according to an embodiment of the present invention.

【図28】本発明の一実施例に係る辞書データベース送
受信の処理の詳細を表すフローチャートである。
FIG. 28 is a flow chart showing details of a dictionary database transmission / reception process according to an embodiment of the present invention.

【図29】本発明の一実施例に係る辞書データベース送
受信の処理の詳細を表すフローチャートである。
FIG. 29 is a flow chart showing details of a dictionary database transmission / reception process according to an embodiment of the present invention.

【図30】本発明の一実施例に係る辞書データベース送
受信の処理の詳細を表すフローチャートである。
FIG. 30 is a flow chart showing details of a dictionary database transmission / reception process according to an embodiment of the present invention.

【図31】従来の構文変換方式の機械翻訳システムの処
理の概要を説明するための図である。
FIG. 31 is a diagram for explaining an outline of processing of a conventional machine translation system using a syntax conversion method.

【図32】従来のEBMT方式の機械翻訳システムの処
理の概要を説明するための図である。
[Fig. 32] Fig. 32 is a diagram for explaining the outline of the processing of a conventional EBMT machine translation system.

【符号の説明】[Explanation of symbols]

2b 入力手段(対話入力手段) 2c 表示手段 21 対訳データ登録手段 22 翻訳手段 24 辞書データベース 25 文書ファイル(第1言語文字列入力手段、第2言
語文字列入力手段) 211 対訳データ登録部(登録手段) 243 英語形態素解析辞書(第1言語辞書、第2言語
辞書) 244 日本語形態素解析辞書(第1言語辞書、第2言
語辞書) 246 対訳データベース
2b input means (dialogue input means) 2c display means 21 parallel translation data registration means 22 translation means 24 dictionary database 25 document files (first language character string input means, second language character string input means) 211 parallel translation data registration unit (registration means ) 243 English morphological analysis dictionary (first language dictionary, second language dictionary) 244 Japanese morphological analysis dictionary (first language dictionary, second language dictionary) 246 Bilingual database

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 第1言語で表された複数の第1言語文字
列、および、当該複数の第1言語文字列を第2言語に訳
した複数の第2言語文字列が登録された対訳データベー
スと、 第1言語で表された原文字列に最も類似の、若しくは、
同一の第1言語文字列を対訳データベースから検索し、
検索された第1言語文字列に対応する第2言語文字列に
基づき原文字列を第2言語に翻訳する翻訳手段とを備え
た機械翻訳システムにおいて、 第1言語文字列を入力する第1言語文字列入力手段と、 第1言語文字列を第2言語に訳した第2言語文字列を入
力する第2言語文字列入力手段と、 第1言語文字列および第2言語文字列を表示する表示手
段と、 表示手段にそれぞれ表示された第1言語文字列および第
2言語文字列を対応付ける対応付け手段と、 対応付けがなされた第1言語文字列および第2言語文字
列を上記対訳データベースに登録する登録手段とを備え
たことを特徴とする機械翻訳システム。
1. A bilingual database in which a plurality of first language character strings represented in a first language and a plurality of second language character strings obtained by translating the plurality of first language character strings into a second language are registered. And most similar to the original string expressed in the first language, or
Search the same first language character string from the bilingual database,
In a machine translation system including a translation unit that translates an original character string into a second language based on a searched second language character string corresponding to the first language character string, a first language for inputting the first language character string Character string input means, second language character string input means for inputting a second language character string obtained by translating the first language character string into a second language, and display for displaying the first language character string and the second language character string Means, associating means for associating the first language character string and the second language character string respectively displayed on the display means, and the associated first language character string and the second language character string are registered in the parallel translation database. A machine translation system comprising:
【請求項2】 第1言語で表された単語が登録された第
1言語辞書と、 第2言語で表された単語が登録された第2言語辞書と、
を備え、 上記表示手段に表示された第1言語文字列に、第1言語
辞書に未登録の単語が含まれている場合、または、上記
表示手段に表示された第2言語文字列に、第2言語辞書
に未登録の単語が含まれている場合には、当該未登録の
単語を上記表示手段に表示することを特徴とする請求項
1記載の機械翻訳システム。
2. A first language dictionary in which words in a first language are registered, and a second language dictionary in which words in a second language are registered.
When the first language character string displayed on the display means includes an unregistered word in the first language dictionary, or the second language character string displayed on the display means is 2. The machine translation system according to claim 1, wherein when the bilingual dictionary includes an unregistered word, the unregistered word is displayed on the display means.
【請求項3】 請求項1記載の登録手段は、対応付けが
なされた第1言語文字列および第2言語文字列ととも
に、対訳番号を対訳データベースに登録することを特徴
とする機械翻訳システム。
3. The machine translation system, wherein the registration means according to claim 1 registers the parallel translation number in the parallel translation database together with the associated first language character string and second language character string.
【請求項4】 表示手段にそれぞれ表示された第1言語
文字列および第2言語文字列を指し示す対話入力手段を
備え、対応付け手段は、指し示された第1言語文字列お
よび第2言語文字列を対応付けることを特徴とする請求
項1記載の機械翻訳システム。
4. The interactive input means for pointing the first language character string and the second language character string respectively displayed on the display means, and the associating means, the first language character string and the second language character pointed to. The machine translation system according to claim 1, wherein the columns are associated with each other.
【請求項5】 請求項1に記載の上記第1言語文字列入
力手段および上記第2言語文字列入力手段は、異なるフ
ァイルから文字列を入力することを特徴とする機械翻訳
システム。
5. The machine translation system according to claim 1, wherein the first language character string input means and the second language character string input means input character strings from different files.
【請求項6】 請求項1に記載の第1言語文字列入力手
段および第2言語文字列入力手段は、同一のファイルか
ら文字列を入力することを特徴とする機械翻訳システ
ム。
6. The machine translation system according to claim 1, wherein the first language character string input means and the second language character string input means input character strings from the same file.
JP6070135A 1994-03-15 1994-03-15 Machine translation system Pending JPH07253981A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP6070135A JPH07253981A (en) 1994-03-15 1994-03-15 Machine translation system
US08/403,958 US5659765A (en) 1994-03-15 1995-03-14 Machine translation system
EP95301677A EP0672989A3 (en) 1994-03-15 1995-03-14 Machine translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6070135A JPH07253981A (en) 1994-03-15 1994-03-15 Machine translation system

Publications (1)

Publication Number Publication Date
JPH07253981A true JPH07253981A (en) 1995-10-03

Family

ID=13422828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6070135A Pending JPH07253981A (en) 1994-03-15 1994-03-15 Machine translation system

Country Status (1)

Country Link
JP (1) JPH07253981A (en)

Similar Documents

Publication Publication Date Title
US5659765A (en) Machine translation system
JP3960562B2 (en) How to learn machine translation
US5675815A (en) Language conversion system and text creating system using such
US4821230A (en) Machine translation system
EP0370774B1 (en) Machine translation system
EP0247395B2 (en) Machine translation system
GB2175718A (en) A translating apparatus
US7346488B2 (en) Automatic translator and computer-readable storage medium having automatic translation program recorded thereon
JP3657338B2 (en) Translation device
KR900008402B1 (en) Machine translation system
JPH0332106B2 (en)
JPH07253981A (en) Machine translation system
JPH07253984A (en) Machine translation systems
JPH07253983A (en) Machine translation system
JPH07253982A (en) Machine translation system
JP2626722B2 (en) Japanese generator
JPH0410665B2 (en)
JPS6180360A (en) Translation system
JP2752977B2 (en) Machine translation method
JPS63136265A (en) Mechanical translating device
JP2726416B2 (en) Translation apparatus and translation method
JPH0778166A (en) Translating method and machine translation system
JPH01245358A (en) Machine translator
JPS6180361A (en) Translation display system
JPH02294779A (en) Machine translation system