JPH07192000A - Machine translation method equipped with summary function - Google Patents

Machine translation method equipped with summary function

Info

Publication number
JPH07192000A
JPH07192000A JP5348536A JP34853693A JPH07192000A JP H07192000 A JPH07192000 A JP H07192000A JP 5348536 A JP5348536 A JP 5348536A JP 34853693 A JP34853693 A JP 34853693A JP H07192000 A JPH07192000 A JP H07192000A
Authority
JP
Japan
Prior art keywords
sentence
translation
unit
language
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5348536A
Other languages
Japanese (ja)
Other versions
JP3352799B2 (en
Inventor
Etsuo Ito
悦雄 伊藤
Koichi Nomura
浩一 野村
Kimito Takeda
公人 武田
Seiji Miike
誠司 三池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP34853693A priority Critical patent/JP3352799B2/en
Publication of JPH07192000A publication Critical patent/JPH07192000A/en
Application granted granted Critical
Publication of JP3352799B2 publication Critical patent/JP3352799B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To easily reflect the layout information of the original sentence to the translated one by comparing the length of the sentence before and after the translation and summarizing the translated sentence as short as the original one when it becomes longer than the original one. CONSTITUTION:A control part 108 accepts the translation request from an input part 101 such as a keyboard and sends the original sentence to a translation part 105. The part 105 decides the grammatical role of the phrases comprising the input original sentence by performing the morpheme analysis and the syntax analysis and finds out the proper word from the translation dictionary based on the result. Then,and executing a drying operation, based on a result calculated by a time counting means and a variation rate calculating means. CONSTITUTION:A motor 18 and a heater 13 are connected to a microcomputer 25 through a motor driving circuit 26 and a heater driving circuit 27 integrated into a controller 21, the cloth quantity of an object to be dried is calculated from the time required until an output of a drying degree detecting device 20 becomes a certain prescribed value after the operation is started, and the cloth qger than the original.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、第一言語を第二言語に
効率良く翻訳する機械翻訳装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation device for efficiently translating a first language into a second language.

【0002】[0002]

【従来の技術】近年、コンピュータシステムを使用して
第一言語の文章を第二言語の文章に自動的に翻訳する機
械翻訳装置が注目されている。従来の機械翻訳装置で
は、形態素解析や構文解析などにより入力原文を構成す
る語句の文法的な役割を決定し、この結果に基づいて訳
語を翻訳辞書から見出し、これを所定の規則にしたがっ
て結合することによって訳文を作成している。
2. Description of the Related Art In recent years, attention has been focused on a machine translation device that automatically translates a sentence in a first language into a sentence in a second language using a computer system. In the conventional machine translation device, the grammatical role of the words constituting the input original sentence is determined by morphological analysis or syntactic analysis, the translated word is found from the translation dictionary based on the result, and this is combined according to a predetermined rule. The translated text is created by doing so.

【0003】さらに、そういった翻訳システムで翻訳し
た訳文に対し、原文のレイアウトを反映し原文のイメー
ジを保持したままの翻訳結果を得る技術も開発されてい
る(特開平4−259057号など)。しかし、翻訳の
前後で文章の長さが異なる場合が多く、原文のレイアウ
トをそのまま反映することができないことがあった。こ
の様な場合、例えば原文ではA4の書式で1ページの資
料が訳文では2ページになってしまうなど不具合が発生
している。この解決のために、文字の大きさや行間・文
字間を変えて無理に元のレイアウトに復元する技術も開
発されている(特開昭60−20283号)。しかし、
この方法ではかえって文章を読みにくする場合が多い。
Further, there has been developed a technique for a translated text translated by such a translation system to obtain a translation result while the layout of the original text is reflected and the image of the original text is retained (Japanese Patent Laid-Open No. 4-259057 and the like). However, the length of the sentence is often different before and after translation, and the layout of the original sentence may not be reflected as it is. In such a case, there is a problem that, for example, the original document has one page of A4 format material and the translated document has two pages. To solve this problem, a technique has been developed in which the size of characters, line spacing, and character spacing are changed to restore the original layout (Japanese Patent Laid-Open No. 60-20283). But,
In this method, sentences are often hard to read.

【0004】また、文章を要約する技術もある(特願平
05−186570など)。この技術を用いて翻訳結果
を要約し短くすることも可能であるが、従来は翻訳結果
を一旦テキストベースに変換し、その後要約システムに
入力していたため、操作が繁雑であるだけでなく、レイ
アウトの復元が困難であったり、適切な要約割合の設定
が困難であったりするなどの問題があった。従って、単
に従来の機械翻訳装置と文章要約装置を組み合わせて使
用するだけでは、満足する結果を得ることはできなかっ
た。
There is also a technique for summarizing sentences (Japanese Patent Application No. 05-186570, etc.). Although it is possible to summarize and shorten the translation result using this technology, in the past, since the translation result was once converted into a text base and then input into the summarization system, not only was the operation complicated, but the layout However, there were problems such as the difficulty of restoring and the difficulty of setting an appropriate summarization ratio. Therefore, it is not possible to obtain a satisfactory result simply by using the conventional machine translation device and the sentence summarizing device in combination.

【0005】一方、文書データベースから希望の文書を
検索する機能はすでに開発されている。しかし、ユーザ
ーが文書データベースより必要な情報を入手する際、検
索結果が母国語(そのユーザーが母国語と同様の容易さ
で使用できる言語を含む。以下、同様。)でない場合に
はそれを読むのに時間がかかる。このため検索後、翻訳
してからユーザーに提示する方法も考案されている。し
かし、通常データベース検索では本当に必要なものの他
に必要でない情報も検索されてしまうので、それらを全
部読んで必要であるか否かの判断をするのにも労力を要
するなどの問題がある上、本来不要であるデータまです
べて翻訳しなければならず、無駄が多かった。
On the other hand, a function for retrieving a desired document from a document database has already been developed. However, when the user obtains the necessary information from the document database, if the search result is not in his / her native language (including a language that the user can use as easily as his / her native language, the same applies below), read it. Takes time. For this reason, a method of presenting it to the user after translation after translation is also devised. However, in a database search, not only information that is really needed but also information that is not needed are searched, so there is a problem in that it takes a lot of effort to read all of them and determine whether they are necessary. There was a lot of waste because we had to translate all the unnecessary data.

【0006】[0006]

【発明が解決しようとする課題】このように、従来の機
械翻訳装置における機械翻訳方法では、翻訳の前後で文
章の長さが異なることが多く、原文のレイアウトをその
まま反映することができないという問題があった。本発
明は、上記課題を解決するためになされたものであり、
翻訳結果の文章がその原文の文章より長くなった場合に
同じ長さになるように要約する機能を有する機械翻訳方
法を提供することを第1の目的とする。
As described above, in the conventional machine translation method in the machine translation apparatus, the sentence length is often different before and after the translation, and the layout of the original sentence cannot be reflected as it is. was there. The present invention has been made to solve the above problems,
It is a first object of the present invention to provide a machine translation method having a function of summarizing a sentence resulting from a translation so that the sentence has the same length when the sentence becomes longer than the original sentence.

【0007】また、従来の検索機能を備えた機械翻訳装
置で使用する機械翻訳方法では、本来不要であるデータ
まですべて翻訳しなければならず無駄が多いという問題
があった。また、ユーザーは検索結果が必要であるか否
かの判断をおこなために文献全体を読まなければなら
ず、効率が悪いと言う問題があった。本発明は、上記課
題を解決するためになされたものであり、検索によって
得られた文献データのうち要約された部分あるいは構造
上重要な部分のみの翻訳結果をユーザーに提示すること
ができる機械翻訳方法を提供することを第2の目的とす
る。
Further, in the machine translation method used in the conventional machine translation apparatus having the search function, there is a problem in that all unnecessary data must be translated, which is wasteful. In addition, the user has to read the entire document in order to determine whether or not the search result is necessary, which is a problem of poor efficiency. The present invention has been made to solve the above problems, and is capable of presenting a translation result of only a summarized portion or a structurally important portion of document data obtained by a search to a user. A second object is to provide a method.

【0008】[0008]

【課題を解決するための手段】上記第1の目的を達成す
るために、本発明(請求項1)に係る機械翻訳方法で
は、第一言語の文章を第二言語の文章に翻訳する翻訳ス
テップと、翻訳前の第一言語の文章の長さとその翻訳結
果である第二言語の文章の長さとを比較する長さ比較ス
テップと、第一言語の翻訳結果たる第二言語の文章がそ
の原文である第一言語の文章より長くなった場合に、該
第二言語の文章を該第一言語の文章とほぼ同じ長さにな
るように要約する要約ステップとを有することを特徴と
する。
In order to achieve the first object, in the machine translation method according to the present invention (claim 1), a translation step for translating a sentence in a first language into a sentence in a second language. And a length comparison step for comparing the length of the sentence in the first language before translation with the length of the sentence in the second language that is the translation result, and the sentence in the second language that is the translation result of the first language is the original sentence. And a summarizing step of summarizing the sentence of the second language so as to have a length substantially the same as that of the sentence of the first language when the sentence becomes longer than the sentence of the first language.

【0009】一方、上記第2の目的を達成するために、
本発明(請求項2)に係る機械翻訳方法では、第一の言
語で記述された文書データベースより文書を検索する検
索ステップと、この検索ステップで検索された文章を要
約する要約ステップと、この要約ステップで要約された
文書を第二言語に翻訳する翻訳ステップとを有すること
を特徴とする。
On the other hand, in order to achieve the second object,
In the machine translation method according to the present invention (Claim 2), a search step for searching a document from a document database described in the first language, a summarization step for summarizing the sentences searched by this search step, and this summarization step. A translation step of translating the document summarized in the step into a second language.

【0010】なお、上記構成の代わりに、第一の言語で
記述された文書データベースより文書を検索する検索ス
テップと、この検索ステップで検索された文章を第二言
語に翻訳する翻訳ステップと、この翻訳ステップで翻訳
された文書を要約する要約ステップとを有することを特
徴としても良い。
Instead of the above configuration, a search step for searching a document from a document database described in a first language, a translation step for translating the text searched in this search step into a second language, And a summarizing step of summarizing the document translated in the translating step.

【0011】また、上記第2の目的を達成するための他
の手段としては、第一の言語で記述された文書データベ
ースより文書を検索する検索ステップと、この検索ステ
ップで検索された文章の論理構造を解析する論理構造解
析ステップと、この論理構造解析ステップによる論理構
造解析結果に従い、構造上重要である部分のみを第二言
語に翻訳するステップとを有することを特徴としても良
い。
As another means for achieving the second object, a search step for searching a document from a document database written in the first language and a logic of the text searched in this search step are provided. It may be characterized by having a logical structure analysis step of analyzing a structure and a step of translating only a structurally important portion into a second language according to the logical structure analysis result of this logical structure analysis step.

【0012】[0012]

【作用】本発明(請求項1)の機械翻訳方法によれば、
翻訳前の第一言語の文章の長さとその翻訳結果である第
二言語の文章の長さとを比較し、該第一言語の文章より
長くなった場合に、該第二言語の文章を該第一言語の文
章とほぼ同じ長さになるように要約するので、翻訳結果
を原文とほぼ同じ長さにできる。このため、原文のレイ
アウト情報などを訳文に容易に反映することができる。
According to the machine translation method of the present invention (Claim 1),
The length of the sentence in the first language before translation is compared with the length of the sentence in the second language, which is the translation result, and when it becomes longer than the sentence in the first language, the sentence in the second language is changed to the first sentence. Since it is summarized so that it is almost the same length as a sentence in one language, the translation result can be made almost the same length as the original sentence. Therefore, the layout information of the original sentence can be easily reflected in the translated sentence.

【0013】本発明(請求項2)の機械翻訳方法によれ
ば、文書データベースより検索された第一の言語で記述
された文章を、要約してから第二言語に翻訳するので、
母国語以外のデータベース検索において、検索結果の要
約を母国語で読むことができる。このため、文書検索を
効率良く、容易に行うことができる。
According to the machine translation method of the present invention (claim 2), the sentences described in the first language retrieved from the document database are summarized and then translated into the second language.
In database searches other than the native language, the summary of search results can be read in the native language. Therefore, the document search can be performed efficiently and easily.

【0014】[0014]

【実施例】以下、図面を参照しながら本発明の各実施例
を説明する。まず、本発明の第1の実施例について説明
する。図1は、本実施例に関わる機械翻訳装置の概略的
な構成を示すブロック図である。図1に示されるよう
に、この機械翻訳装置は、入力部101、表示部10
2、記録部103、編集部104、翻訳部105、長さ
比較部106、要約部107および制御部108を有す
る構成となっている。
Embodiments of the present invention will be described below with reference to the drawings. First, a first embodiment of the present invention will be described. FIG. 1 is a block diagram showing a schematic configuration of a machine translation device according to this embodiment. As shown in FIG. 1, the machine translation device includes an input unit 101 and a display unit 10.
2, a recording unit 103, an editing unit 104, a translation unit 105, a length comparison unit 106, a summarization unit 107, and a control unit 108.

【0015】入力部101は、文章等のデータや翻訳要
求等のコマンドなどを入力するためものであり、通常キ
ーボードなどが用いられる。表示部102は、入力部1
01から入力されたデータや翻訳結果などを表示するた
めのものであり、ビットマップディスプレイなどが用い
られる。記録部103は、入力部101から入力された
データや翻訳結果などを記録するためのものである。
The input unit 101 is for inputting data such as sentences and commands such as a translation request, and is usually a keyboard or the like. The display unit 102 is the input unit 1
This is for displaying data input from 01, translation results, etc., and a bitmap display or the like is used. The recording unit 103 is for recording the data input from the input unit 101, the translation result, and the like.

【0016】編集部104は、入力部101から入力さ
れたデータや記録部103に記録されているデータに対
する編集処理を行う。翻訳部105は、形態素解析や構
文解析などにより入力原文を構成する語句の文法的な役
割を決定し、この結果に基づいて訳語を翻訳辞書から見
出し、これを所定の規則にしたがって結合することによ
って訳文を作成する。
The editing unit 104 performs an editing process on the data input from the input unit 101 and the data recorded in the recording unit 103. The translation unit 105 determines the grammatical role of the words constituting the input original sentence by morphological analysis, syntactic analysis, etc., finds a translated word from the translation dictionary based on the result, and combines the translated words according to a predetermined rule. Create a translation.

【0017】長さ比較部106は、原文と訳文の長さを
比較する。要約部107は、長さ比較部106による原
文と訳文の長さ比較結果に従い、原文より訳文の方が長
い時には、訳文を原文の長さに要約する。制御部108
は、これらの各部の制御やデータの転送を行うためのも
のである。
The length comparison unit 106 compares the lengths of the original sentence and the translated sentence. The summarizing unit 107 summarizes the translated sentence into the length of the original sentence according to the length comparison result of the original sentence and the translated sentence by the length comparing unit 106 when the translated sentence is longer than the original sentence. Control unit 108
Is for controlling these units and transferring data.

【0018】図2は、本実施例に関わる機械翻訳装置の
制御部108の動作例を示すフローチャートである。ま
ず、制御部108は、翻訳要求が発生すると原文Aを翻
訳部105に転送し翻訳結果Bを得る(ステップS20
1)。次に、原文Aと翻訳結果Bとを長さ比較部106
に転送し長さの比cを得る(ステップS202)。
FIG. 2 is a flowchart showing an operation example of the control unit 108 of the machine translation device according to this embodiment. First, when a translation request is issued, the control unit 108 transfers the original sentence A to the translation unit 105 and obtains a translation result B (step S20).
1). Next, the length comparison unit 106 compares the original sentence A and the translation result B.
To obtain the length ratio c (step S202).

【0019】この長さの比cが1より大きいか否か(す
なわち訳文の方が原文より長いか否か)を判定し(ステ
ップS203)、長さの比cが1より大きい場合には、
長さの比cと翻訳結果Bを要約部107に転送し、翻訳
結果Bを1/cの長さに要約する(ステップS20
4)。以上の動作により、原文Aと同じ長さの翻訳結果
B´を得ることができる。
Whether the length ratio c is greater than 1 (that is, whether the translated sentence is longer than the original sentence) is determined (step S203). If the length ratio c is greater than 1,
The length ratio c and the translation result B are transferred to the summarizing unit 107, and the translation result B is summarized into a length of 1 / c (step S20).
4). With the above operation, the translation result B ′ having the same length as the original sentence A can be obtained.

【0020】ここで、ステップS202における長さの
比較は、文章全体を比較対象とすることもできるし、章
や節などの論理構造単位、パラグラフやページなどの物
理構造単位で比較することもできる。また、表やコラム
など、文字の記入できる最大長が規定される場合には、
その最大長と比較することもできる。長さの単位は文章
データの文字数の他、バイト数、その言語の文字の平均
横幅と文字数の積などを用いても良い。例えば、日本語
を英語に翻訳した場合、英語の文字(アルファベット)
は日本語の文字(かな、漢字)の半分の幅で表現される
ことが多いため、文字数が2倍以上になった場合に始め
て英文の方が長いとすることもできる。
Here, in the length comparison in step S202, the entire sentence can be compared, or the comparison can be performed in logical structure units such as chapters and sections, and physical structure units such as paragraphs and pages. . In addition, when the maximum length of characters that can be entered is specified for tables and columns,
It can also be compared to its maximum length. As the unit of length, in addition to the number of characters of the text data, the number of bytes, the product of the average width of the characters of the language and the number of characters, or the like may be used. For example, when Japanese is translated into English, English characters (alphabet)
Is often expressed in half the width of Japanese characters (kana, kanji), so an English sentence can be said to be longer when the number of characters doubles or more.

【0021】ここで、文の長さの調整処理では、フルス
ペルで記述されているものを略号に変更する方法を含ん
でも良い。この方法について、「機械翻訳」という語句
を日英翻訳する場合を例にして説明する。図3は、日英
翻訳における原文中に「機械翻訳」という語句が出現
し、「機械翻訳」の約語として、「MT」、「mach
ine translation」、「natural
language translation sys
tem」がある場合の例を示している。図4は、訳語の
長さの調整を行うためのデータベースの例を図3に示す
例で示したものである。このデータベースでは、それぞ
れの訳語に、訳語を生成する文字列の長さを同時に記録
している。図5には、図3および図4に示す例を用い
て、訳文の長さを調整する翻訳システムにおいて、訳語
の選択を行う動作の例を示す。なお、このフローチャー
ト中、パラメータiは、長さ調整する文章中に並ぶ語句
のうち、処理対象となる語句の先頭からの順序を表す。
まず、訳語の選択は原文の各単語に対して行うため、原
文の先頭の単語に着目する(ステップS301)。その
単語に対応する訳語が1つしか無い場合は訳語の選択の
余地がないため、次の原文の単語に注目語を移す(ステ
ップS303〜S304)。複数の訳語が存在する場合
には(ステップS303)、各訳語の長さを調整する。
このため、訳語長さを調整しないときに出力される翻訳
結果では希望する出力文の長さより短くなる場合には、
長さを調整しないときに出力される訳語より長い訳語を
選択し、一方長くなる場合には、短い単語を選択する
(ステップS305)。そして、処理対象の語句を、こ
の選択した語句に置き換える(ステップS306)。こ
の選択により出力される文の長さが希望する長さと比較
し許容範囲に含まれる場合には(ステップS307)、
もはや長さを調整する必要がないので、処理を終える。
長さの差が許容範囲を越える場合には(ステップS30
7)、さらに調整を行うために、次の単語に注目する語
を移動し(ステップS304)、これを文の最後の単語
まで繰り返す。
Here, the sentence length adjusting process may include a method of changing what is written in full spelling into abbreviations. This method will be described by taking the case of translating the word "machine translation" into English. In FIG. 3, the word "machine translation" appears in the original text in Japanese-English translation, and "MT" and "mach" are the abbreviations for "machine translation".
ine translation "," natural "
Langue translation system
An example in which "tem" is present is shown. FIG. 4 shows an example of the database for adjusting the length of the translated word in the example shown in FIG. In this database, for each translated word, the length of the character string for generating the translated word is recorded at the same time. FIG. 5 shows an example of an operation of selecting a translated word in the translation system that adjusts the length of a translated sentence, using the examples shown in FIGS. 3 and 4. In this flowchart, the parameter i represents the order of the words to be processed from the beginning among the words arranged in the sentence whose length is to be adjusted.
First, since the translated word is selected for each word of the original sentence, attention is paid to the first word of the original sentence (step S301). When there is only one translated word corresponding to the word, there is no room for selecting the translated word, and therefore the focused word is moved to the next word of the original sentence (steps S303 to S304). When there are a plurality of translated words (step S303), the length of each translated word is adjusted.
Therefore, if the translation result that is output when the translated word length is not adjusted is shorter than the desired output sentence length,
A translated word that is longer than the translated word that is output when the length is not adjusted is selected, and if the translated word is longer, the short word is selected (step S305). Then, the word or phrase to be processed is replaced with the selected word or phrase (step S306). If the length of the sentence output by this selection is compared with the desired length and is within the allowable range (step S307),
Since there is no need to adjust the length anymore, the process ends.
If the difference in length exceeds the allowable range (step S30
7) Then, for further adjustment, move the word of interest to the next word (step S304) and repeat this until the last word of the sentence.

【0022】このように、翻訳を行った結果に対して長
さの調整を行うと、原文と調整前の翻訳結果のずれ(長
さの差)が容易に分かるため、どの程度の長さ調整(要
約)をおこなえば良いのかの判断がしやすく、効率的な
長さ調整を行うことができる。
In this way, when the length is adjusted for the translated result, the difference (length difference) between the original sentence and the translated result before the adjustment can be easily found. It is easy to determine whether (summary) should be performed, and the length can be adjusted efficiently.

【0023】さらに、長さの比較は、文章中にキーワー
ドが出現する位置を基準に行い、文頭からその位置まで
の長さ同士を比較しても良い。例えば、図面を参照する
文字列(“fig.1”、“第1図”など)の位置が翻
訳前後で同じになるように要約する長さを調整すること
により、参照箇所と被参照箇所の位置関係が原文と訳文
で同じになり、読み易い翻訳結果を得ることができる。
この例を図6、図7および図8に示す。図6に示すよう
な翻訳の原文となる文書を、従来の翻訳システムを用い
て翻訳し、レイアウト復元を行うと図7のように2ペー
ジとなってしまい、さらに図面の参照箇所が2ページ目
になってしまっている。これに対して、本実施例に関わ
る機械翻訳装置で翻訳を行うと図8のように原文とほぼ
同様のレイアウトとなり、読みやすい翻訳結果が得られ
る。
Further, the lengths may be compared based on the position where the keyword appears in the sentence, and the lengths from the beginning of the sentence to the positions may be compared. For example, by adjusting the summary length so that the positions of the character strings ("fig.1", "Fig. 1", etc.) that refer to the drawings are the same before and after translation, Since the positional relationship between the original sentence and the translated sentence is the same, an easy-to-read translation result can be obtained.
Examples of this are shown in FIGS. 6, 7 and 8. When the original document for translation as shown in FIG. 6 is translated using the conventional translation system and the layout is restored, the page becomes 2 pages as shown in FIG. 7, and the reference point of the drawing is the 2nd page. Has become. On the other hand, when the machine translation device according to the present embodiment performs translation, the layout becomes almost the same as the original sentence as shown in FIG. 8, and a readable translation result is obtained.

【0024】次に、本発明の第2の実施例について説明
する。図9は、本実施例に関わる機械翻訳装置の概略的
な構成を示すブロック図である。図9に示されるよう
に、この機械翻訳装置は、入力部601、表示部60
2、記録部603、編集部604、検索部605、文書
データベース606、要約部607、翻訳部608およ
び制御部609を有する構成となっている。
Next, a second embodiment of the present invention will be described. FIG. 9 is a block diagram showing a schematic configuration of the machine translation device according to the present embodiment. As shown in FIG. 9, this machine translation device includes an input unit 601 and a display unit 60.
2, a recording unit 603, an editing unit 604, a search unit 605, a document database 606, a summary unit 607, a translation unit 608, and a control unit 609.

【0025】入力部601は、データや検索開始等のコ
マンドなどを入力するためものであり、通常キーボード
などが用いられる。表示部602は、入力部601から
入力されたデータや翻訳結果などを表示するためのもの
でありビットマップディスプレイなどが用いられる。記
録部603は、入力部601から入力されたデータや翻
訳結果などを記録するためのものである。
The input unit 601 is for inputting data, a command for starting search, etc., and is usually a keyboard or the like. The display unit 602 is for displaying the data input from the input unit 601, the translation result, and the like, and a bitmap display or the like is used. The recording unit 603 is for recording the data input from the input unit 601, the translation result, and the like.

【0026】編集部604は、入力部601から入力さ
れたデータや記録部に記録されているデータに対する編
集処理を行う。検索部605は、指示された条件に合致
するデータを文書データベース606より検索する。要
約部607は、検索部605で検索されたデータを要約
する。
The editing unit 604 performs an editing process on the data input from the input unit 601 and the data recorded in the recording unit. The search unit 605 searches the document database 606 for data that matches the specified conditions. The summarizing unit 607 summarizes the data retrieved by the retrieval unit 605.

【0027】翻訳部608は、要約部607で要約され
たデータを翻訳したり、必要な場合には検索部605で
検索されたデータをすべて翻訳する。制御部609は、
これらの各部の制御やデータの転送を行う。図10は、
本実施例に関わる機械翻訳装置の制御部609の動作を
示すフローチャートである。
The translation unit 608 translates the data summarized by the summarization unit 607 and, if necessary, translates all the data retrieved by the retrieval unit 605. The control unit 609
It controls each of these parts and transfers data. Figure 10
It is a flow chart which shows operation of control part 609 of a machine translation device concerning this example.

【0028】まず、制御部609は、入力部601より
検索開始コマンドが入力されると動作を開始し、検索条
件Aを検索部605へ転送し検索結果Bを得る(ステッ
プS701)。この検索結果Bが複数文書であった場合
には、その中から必要な文書を選択するために各文書の
記述内容を確認する必要があるため、オペレータにどの
文書から中身の確認を行うかの選択をさせ、その文書を
Cとする(ステップS702、703)。一方、検索結
果Bが単一文書である場合には、その記述内容から検索
結果Bが希望の文書であるか否かを確認する必要がある
ため、これをCとする(ステップS704)。
First, the control unit 609 starts its operation when a search start command is input from the input unit 601, transfers the search condition A to the search unit 605, and obtains the search result B (step S701). If the search result B is a plurality of documents, it is necessary to confirm the description content of each document in order to select a required document from the documents, so which document should be confirmed from the operator. The document is selected, and the document is designated as C (steps S702 and 703). On the other hand, when the search result B is a single document, it is necessary to confirm whether the search result B is a desired document or not from the description content, and this is designated as C (step S704).

【0029】次に、文書Cを要約部607へ転送し、要
約結果Dを得る。要約結果Dがあらかじめ登録されてい
たオペレータの母国語で記述されているか否かを確認し
(ステップS706)、母国語でなければ要約結果Dを
翻訳部605へ転送し、翻訳結果Eを得る(ステップS
707)。母国語の場合は要約結果DをそのままEとす
る(ステップS708)。そして、Eをオペレータに提
示して動作を終了する(ステップS709)。
Next, the document C is transferred to the summarizing unit 607, and the summarizing result D is obtained. It is confirmed whether or not the summary result D is written in the mother language of the operator who has been registered in advance (step S706). If it is not the mother tongue, the summary result D is transferred to the translation unit 605 to obtain the translation result E ( Step S
707). In the case of the mother tongue, the summary result D is directly set to E (step S708). Then, E is presented to the operator to end the operation (step S709).

【0030】ここで、図11に、本実施例における画面
表示の一例を示す。図11において、最上部は検索条件
入力領域であり、ここでは「computer」という
キーワードでの検索要求がなされている。図11の中段
は上記検索条件で検索された文書のタイトルのリストが
表示されており、no.2の文書の内容確認が指示され
ている。また、下部には内容が提示されているが、要約
後翻訳された結果が表示されているので、ユーザは母国
語である日本語でこの文書の要旨だけを読むことができ
る。
Here, FIG. 11 shows an example of the screen display in this embodiment. In FIG. 11, the uppermost part is a search condition input area, and a search request is made with the keyword “computer” here. In the middle of FIG. 11, a list of titles of documents searched by the above search conditions is displayed. It is instructed to confirm the contents of the second document. Further, although the contents are presented in the lower part, since the translated and translated result is displayed, the user can read only the abstract of this document in the native language of Japanese.

【0031】なお、上記構成の代わりに、翻訳後に要約
を行う構成を採用することも可能である。ただし、要約
後翻訳を行う構成を採用する場合は、要旨以外の部分を
翻訳する手間が省かれているため処理時間を短くするこ
とができる、という利点がある。次に、本発明の第3の
実施例について説明する。
It should be noted that instead of the above configuration, it is also possible to employ a configuration in which a summary is made after translation. However, when adopting a configuration that performs post-summary translation, there is an advantage that the processing time can be shortened because labor for translating parts other than the gist is omitted. Next, a third embodiment of the present invention will be described.

【0032】図12は、本実施例に関わる機械翻訳装置
の概略的な構成を示すブロック図である。図12に示さ
れるように、この機械翻訳装置は、入力部901、表示
部902、記録部903、編集部904、検索部90
5、文書データベース906、文書構造解析部907、
翻訳部908および制御部909を有する構成となって
いる。
FIG. 12 is a block diagram showing a schematic configuration of a machine translation device according to this embodiment. As shown in FIG. 12, this machine translation device includes an input unit 901, a display unit 902, a recording unit 903, an editing unit 904, and a search unit 90.
5, document database 906, document structure analysis unit 907,
It is configured to have a translation unit 908 and a control unit 909.

【0033】入力部901は、データや検索開始等のコ
マンドなどを入力するためものであり、通常キーボード
などが用いられる。表示部902は、入力部901から
入力されたデータや翻訳結果などを表示するためのもの
であり、ビットマップディスプレイなどが用いられる。
記録部903は、入力部901から入力されたデータや
翻訳結果などを記録するためのものである。
The input unit 901 is for inputting data, a command for starting search, etc., and is usually a keyboard or the like. The display unit 902 is for displaying the data input from the input unit 901, the translation result, and the like, and a bitmap display or the like is used.
The recording unit 903 is for recording the data input from the input unit 901, the translation result, and the like.

【0034】編集部904は、入力部901から入力さ
れたデータや記録部903に記録されているデータに対
する編集処理を行う。検索部905は、指示された条件
に合致するデータを文書データベース906より検索す
る。
The editing unit 904 performs an editing process on the data input from the input unit 901 and the data recorded in the recording unit 903. The search unit 905 searches the document database 906 for data that matches the instructed condition.

【0035】文書構造解析部907は、検索部905で
検索された文書データの構造解析をするためのものであ
り、例えば文献“A Discouse Struct
ure Analyser for japanese
Text”(K.Sumita, Int. con
f. on Fifth Generation co
mputer ´92)などに記載された手法により文
書の構造を得る。
The document structure analysis unit 907 is for analyzing the structure of the document data retrieved by the retrieval unit 905, and is, for example, the document “A Discosure Struct”.
ure Analyzer for Japanese
Text "(K. Sumita, Int. Con
f. on Fifth Generation co
The structure of the document is obtained by the method described in Mputer '92).

【0036】翻訳部908は、文書構造解析部907で
解析され、重要であると判断された箇所のデータを翻訳
したり、必要な場合には検索部905で検索されたデー
タをすべて翻訳する。制御部909は、これらの各部の
制御やデータの転送を行う。図13は、本実施例に関わ
る機械翻訳装置の制御部909の動作を示すフローチャ
ートである。
The translation unit 908 translates the data of the portion which is analyzed by the document structure analysis unit 907 and is determined to be important, and translates all the data retrieved by the retrieval unit 905 when necessary. The control unit 909 controls each of these units and transfers data. FIG. 13 is a flowchart showing the operation of the control unit 909 of the machine translation device according to this embodiment.

【0037】まず、制御部909は、入力部901より
検索開始コマンドが入力されると動作を開始し、検索条
件Aを検索部905へ転送し検索結果Bを得る(ステッ
プS1001)。この検索結果Bが複数文書であった場
合には、その中から必要な文書を選択するために各文書
の記述内容を確認する必要があるため、オペレータにど
の文書から中身の確認を行うかの選択をさせ、その文書
をCとする(ステップS1002、1003)。一方、
検索結果Bが単一文書である場合には、その記述内容か
ら検索結果Bが希望の文書であるか否かを確認する必要
があるため、これをCとする(ステップS1004)。
First, the control unit 909 starts operation when a search start command is input from the input unit 901, transfers the search condition A to the search unit 905, and obtains a search result B (step S1001). If the search result B is a plurality of documents, it is necessary to confirm the description content of each document in order to select a required document from the documents, so which document should be confirmed from the operator. The document is selected, and the document is designated as C (steps S1002 and 1003). on the other hand,
If the search result B is a single document, it is necessary to confirm whether the search result B is a desired document or not from the description content, and this is designated as C (step S1004).

【0038】次に、文書Cを文書構造解析部907へ転
送し、構造解析結果Dを得る。そして、構造解析結果D
より構造上重要であると判断された部分を抽出しこれを
Eとする(ステップS1006)。Eがあらかじめ登録
されていたオペレータの母国語で記述されているか否か
を確認し(ステップS1007)、母国語でなければE
を翻訳部へ転送し、翻訳結果Fを得る(ステップS10
08)。母国語の場合はEをそのままFとする(ステッ
プS1009)。そして、Fをオペレータに提示して動
作を終了する(ステップS1010)。
Next, the document C is transferred to the document structure analysis unit 907, and the structure analysis result D is obtained. And the structural analysis result D
A portion judged to be more important in structure is extracted and set as E (step S1006). It is confirmed whether E is described in the native language of the operator registered in advance (step S1007). If it is not the native language, E
Is transferred to the translation section, and the translation result F is obtained (step S10).
08). In the case of the mother tongue, E is directly set to F (step S1009). Then, F is presented to the operator to end the operation (step S1010).

【0039】ここで、図14に、文書構造解析部907
による構造解析の結果の一例を示す。図14において
“<”および“>”で囲まれた部分が解析された結果の
役割を示す部分であり、それに続いてその役割を果たす
文章が続く。ステップS1006における構造上重要で
あるか否かの判断は、例えば、文章の結論部分である
か、タイトルであるかなどで行い、例えば、結論部分だ
けを抽出し翻訳してオペレータに提示することができ
る。この判断基準はオペレータの指示で変更してもよ
い。
Here, in FIG. 14, the document structure analysis unit 907 is shown.
An example of the result of the structural analysis by is shown. In FIG. 14, the part enclosed by "<" and ">" is a part showing the role of the analysis result, and the sentence which plays the role follows. Whether or not it is structurally important in step S1006 is determined based on, for example, the conclusion part of the sentence or the title. For example, only the conclusion part can be extracted, translated, and presented to the operator. it can. This criterion may be changed by an operator's instruction.

【0040】なお、上記実施例は日本語を母国語として
説明しているが、それ以外の言語でも良い。ようする
に、本発明はその主旨を逸脱しない範囲において種々変
更して実施することができる、
In the above embodiment, Japanese is described as the native language, but other languages may be used. Thus, the present invention can be implemented with various modifications without departing from the scope of the invention.

【0041】[0041]

【発明の効果】本発明(請求項1)の機械翻訳方法によ
れば、翻訳結果と原文が同じ長さになるため、原文のレ
イアウト情報などを訳文に容易に反映することができ
る。また、本発明(請求項2)の機械翻訳方法によれ
ば、母国語以外のデータベース検索において、検索結果
の要約を母国語で読むことができるため、文書検索を効
率良く、容易に行うことができる。
According to the machine translation method of the present invention (Claim 1), since the translation result and the original sentence have the same length, the layout information of the original sentence and the like can be easily reflected in the translated sentence. Further, according to the machine translation method of the present invention (Claim 2), when searching a database other than the native language, since the summary of the search results can be read in the native language, the document search can be performed efficiently and easily. it can.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例に関わる要約機能付き機
械翻訳装置の概略構成を示すブロック図
FIG. 1 is a block diagram showing a schematic configuration of a machine translation device with a summary function according to a first embodiment of the present invention.

【図2】図1の機械翻訳装置の動作の流れを示すフロー
チャート
FIG. 2 is a flowchart showing a flow of operation of the machine translation device of FIG.

【図3】日英翻訳において原文の単語に対応する訳語が
複数ある例を示す図
FIG. 3 is a diagram showing an example in which there are multiple translated words corresponding to original words in Japanese-English translation.

【図4】訳語の長さの調整を行うためのデータベースの
一例を示す図
FIG. 4 is a diagram showing an example of a database for adjusting the length of a translated word.

【図5】訳語の選択を行う動作の一例を示すフローチャ
ート
FIG. 5 is a flowchart showing an example of an operation of selecting a translated word.

【図6】同実施例を適用する原文の一例を示す図FIG. 6 is a diagram showing an example of an original sentence to which the embodiment is applied.

【図7】従来の機械翻訳方法による翻訳結果の一例を示
す図
FIG. 7 is a diagram showing an example of a translation result by a conventional machine translation method.

【図8】同実施例による翻訳結果の一例を示す図FIG. 8 is a diagram showing an example of a translation result according to the same embodiment.

【図9】本発明の第2の実施例に関わる検索・要約機能
付き機械翻訳装置の概略構成を示すブロック図
FIG. 9 is a block diagram showing a schematic configuration of a machine translation device with a search / summary function according to a second embodiment of the present invention.

【図10】図9の機械翻訳装置の動作の流れを示すフロ
ーチャート
10 is a flowchart showing a flow of operation of the machine translation device of FIG.

【図11】同実施例による画面表示例を示す図FIG. 11 is a diagram showing a screen display example according to the same embodiment.

【図12】本発明の第2の実施例に関わる検索・構造解
析機能付き機械翻訳装置の概略構成を示すブロック図
FIG. 12 is a block diagram showing a schematic configuration of a machine translation device with a search / structure analysis function according to a second embodiment of the present invention.

【図13】図12の機械翻訳装置の動作の流れを示すフ
ローチャート
FIG. 13 is a flowchart showing a flow of operation of the machine translation device of FIG.

【図14】同実施例による構造解析結果の一例を示す図FIG. 14 is a diagram showing an example of a structural analysis result according to the example.

【符号の説明】[Explanation of symbols]

101…入力部 102…
表示部 103…記録部 104…
編集部 105…翻訳部 106…
長さ比較部 107…要約部 108…
制御部 601…入力部 602…
表示部 603…記録部 604…
編集部 605…検索部 606…
文書データベース 607…要約部 608…
翻訳部 609…制御部 901…
入力部 902…表示部 903…
記録部 904…編集部 905…
検索部 906…文書データベース 907…
文書構造解析部 908…翻訳部 909…
制御部
101 ... Input unit 102 ...
Display unit 103 ... Recording unit 104 ...
Editing unit 105 ... Translation unit 106 ...
Length comparison unit 107 ... Summary unit 108 ...
Control unit 601 ... Input unit 602 ...
Display unit 603 ... Recording unit 604 ...
Editing unit 605 ... Search unit 606 ...
Document database 607 ... Summary section 608 ...
Translation unit 609 ... Control unit 901 ...
Input unit 902 ... Display unit 903 ...
Recording unit 904 ... Editing unit 905 ...
Search unit 906 ... Document database 907 ...
Document structure analysis unit 908 ... Translation unit 909 ...
Control unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 三池 誠司 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Seiji Miike 1 Komukai Toshiba-cho, Sachi-ku, Kawasaki-shi, Kanagawa Incorporated Toshiba Research and Development Center

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】第一言語の文章を第二言語の文章に翻訳す
る翻訳ステップと、 翻訳前の第一言語の文章の長さとその翻訳結果である第
二言語の文章の長さとを比較する長さ比較ステップと、 第一言語の翻訳結果たる第二言語の文章がその原文であ
る第一言語の文章より長くなった場合に、該第二言語の
文章を該第一言語の文章とほぼ同じ長さになるように要
約する要約ステップとを有することを特徴とする機械翻
訳方法。
1. A translation step of translating a sentence in a first language into a sentence in a second language, and comparing the length of the sentence in the first language before translation with the length of the sentence in the second language as a result of the translation. Length comparison step, and when the sentence of the second language which is the translation result of the first language is longer than the sentence of the original first language, the sentence of the second language is almost the same as the sentence of the first language. And a summarizing step for summarizing to have the same length.
【請求項2】第一の言語で記述された文書データベース
より文書を検索する検索ステップと、 この検索ステップで検索された文章を要約する要約ステ
ップと、 この要約ステップで要約された文書を第二言語に翻訳す
る翻訳ステップとを有することを特徴とする機械翻訳方
法。
2. A retrieval step for retrieving a document from a document database described in a first language, a summary step for summarizing sentences retrieved by this retrieval step, and a second document for the document summarized by this summary step. A machine translation method comprising a translation step of translating into a language.
JP34853693A 1993-12-27 1993-12-27 Machine translation method and machine translation device Expired - Fee Related JP3352799B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34853693A JP3352799B2 (en) 1993-12-27 1993-12-27 Machine translation method and machine translation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34853693A JP3352799B2 (en) 1993-12-27 1993-12-27 Machine translation method and machine translation device

Publications (2)

Publication Number Publication Date
JPH07192000A true JPH07192000A (en) 1995-07-28
JP3352799B2 JP3352799B2 (en) 2002-12-03

Family

ID=18397676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34853693A Expired - Fee Related JP3352799B2 (en) 1993-12-27 1993-12-27 Machine translation method and machine translation device

Country Status (1)

Country Link
JP (1) JP3352799B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005821A (en) * 1999-06-18 2001-01-12 Nippon Telegr & Teleph Corp <Ntt> Device and method for generating topic type summary and computer readable recording medium recording relevant method
JP2001134601A (en) * 1999-11-08 2001-05-18 Nippon Telegr & Teleph Corp <Ntt> Display device for simply browsing text content and storage medium with its processing program stored therein
WO2002003241A1 (en) * 2000-07-05 2002-01-10 Iis Inc. Method for performing multilingual translation through a communication network and a communication system and information recording medium for the same method
JP2007034430A (en) * 2005-07-22 2007-02-08 Fuji Xerox Co Ltd Translation device, translation method, and program
JP2007087056A (en) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd Translation device and program
JP2012173785A (en) * 2011-02-17 2012-09-10 Nec Corp Translation result display method, translation result display system, translation result creation device and translation result display program
JP2013122747A (en) * 2011-08-08 2013-06-20 Canon Inc Image processing apparatus, image processing method, and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230067321A (en) * 2021-11-09 2023-05-16 삼성전자주식회사 Electronic device and controlling method of electronic device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005821A (en) * 1999-06-18 2001-01-12 Nippon Telegr & Teleph Corp <Ntt> Device and method for generating topic type summary and computer readable recording medium recording relevant method
JP2001134601A (en) * 1999-11-08 2001-05-18 Nippon Telegr & Teleph Corp <Ntt> Display device for simply browsing text content and storage medium with its processing program stored therein
WO2002003241A1 (en) * 2000-07-05 2002-01-10 Iis Inc. Method for performing multilingual translation through a communication network and a communication system and information recording medium for the same method
US7139696B2 (en) 2000-07-05 2006-11-21 Iis Inc. Method for performing multilingual translation through a communication network and a communication system and information recording medium for the same method
JP2007034430A (en) * 2005-07-22 2007-02-08 Fuji Xerox Co Ltd Translation device, translation method, and program
JP2007087056A (en) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd Translation device and program
JP2012173785A (en) * 2011-02-17 2012-09-10 Nec Corp Translation result display method, translation result display system, translation result creation device and translation result display program
JP2013122747A (en) * 2011-08-08 2013-06-20 Canon Inc Image processing apparatus, image processing method, and program
US9245357B2 (en) 2011-08-08 2016-01-26 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium

Also Published As

Publication number Publication date
JP3352799B2 (en) 2002-12-03

Similar Documents

Publication Publication Date Title
JP2783558B2 (en) Summary generation method and summary generation device
EP0370774B1 (en) Machine translation system
US4831529A (en) Machine translation system
JPH0433069B2 (en)
JPS62287336A (en) Electronic dictionary
JPH05158401A (en) Document fast reading support/display system and document processor and document retrieving device
JP3352799B2 (en) Machine translation method and machine translation device
JPH0315980A (en) Different description and synonym developing method for retrieving character string
JP2848729B2 (en) Translation method and translation device
JPH08129554A (en) Relation expression extracting device and retrieval device for relation expression
JP3034295B2 (en) Machine translation method and machine translation device
JPH0561902A (en) Mechanical translation system
JPH06266753A (en) Word processor
JPH0821038B2 (en) Electronic dictionary search device
JPH01126767A (en) Dictionary referring device
JPH06149790A (en) Document processor
JP3147947B2 (en) Machine translation equipment
JPH05165889A (en) Document retrieval device
JP2786211B2 (en) Post-editing device in machine translation equipment
JPH1145280A (en) Other-language-document retrieval system, storage medium wehre other-language-retrieval program is stored, and other-language-document retrieving method
JPH10134054A (en) Document preparation support device
JPH04323770A (en) Machine translation system
JPH04137070A (en) Electronic book device
JPS6366665A (en) Document analyzing/shaping device
JPH04158477A (en) Machine translation device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070920

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080920

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080920

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090920

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090920

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100920

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100920

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110920

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120920

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120920

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130920

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees