JP2006244236A - Machine translation program, and machine translation device - Google Patents

Machine translation program, and machine translation device Download PDF

Info

Publication number
JP2006244236A
JP2006244236A JP2005060582A JP2005060582A JP2006244236A JP 2006244236 A JP2006244236 A JP 2006244236A JP 2005060582 A JP2005060582 A JP 2005060582A JP 2005060582 A JP2005060582 A JP 2005060582A JP 2006244236 A JP2006244236 A JP 2006244236A
Authority
JP
Japan
Prior art keywords
phrase
word
language
translated
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005060582A
Other languages
Japanese (ja)
Other versions
JP4016037B2 (en
Inventor
Miwako Shimazu
美和子 島津
Yumiko Yoshimura
裕美子 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2005060582A priority Critical patent/JP4016037B2/en
Publication of JP2006244236A publication Critical patent/JP2006244236A/en
Application granted granted Critical
Publication of JP4016037B2 publication Critical patent/JP4016037B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To substantially reduce a load of a user for obtaining a proper corrected translation in a machine translation program and a machine translation device translating a natural language into another natural language. <P>SOLUTION: A sentence of a first language to be translated, and a translated sentence of a second language are prepared. Each translation in the translated sentence of the second language is coordinated with each word equivalent to the translation in the sentence of the first language to be translated. It is determined whether or not each of the coordinated word of the first language is a compound word. Words determined not to be compound words are compared with each other, words determined to be compound words are compared with each other, and the words determined not to be compound words are compared with the words determined to be compound words. In comparison pairs of the words, words matching at least partially are extracted, and words of the first language by the coordination including the extracted words are displayed along with the translations coordinated with respect to the words. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、自然言語を他の自然言語に翻訳する機械翻訳プログラムおよび機械翻訳装置に係り、特に、使用者が適切な修正訳を得るための負担を減ずるのに好適な機械翻訳プログラムおよび機械翻訳装置に関する。   The present invention relates to a machine translation program and a machine translation apparatus for translating a natural language into another natural language, and in particular, a machine translation program and a machine translation suitable for reducing a burden for a user to obtain an appropriate correction translation. Relates to the device.

技術の進展とともに様々な文書が電子化されるようになり、それに付随して大規模の翻訳辞書(対訳辞書)が次々と開発・構築されている。見出し語に立てられる語も日々増えている。見出し語数の多さが辞書の質の指標の一つとなっていることが、その増加の一因であるが、最近では、単なる数の多さはかえって弊害があることも指摘されるようになった。   With the progress of technology, various documents have been digitized, and accompanying this, large-scale translation dictionaries (parallel translation dictionaries) have been developed and constructed one after another. The number of words that can be used as headwords is increasing every day. The increase in the number of headwords is one of the indicators of the quality of the dictionary, which contributes to the increase. Recently, however, it has been pointed out that the mere number is rather harmful. It was.

第1に、辞書は通常複数の人々によって編纂されるので、関連する見出し語同士とその訳語の間の整合性は必ずしもとられていない。したがって、辞書の使用者はそれらの調整を行う必要がある。複数の種類の辞書を用いればこの問題は倍増する。第2に、以前ならば主見出しの用例としてあげられていた表現(文字列)が見出しに立てられることにより、その文字列を必要以上に優先して文の意味を解釈してしまい、正しい解釈が得られないという弊害も出てきた。   First, since a dictionary is usually compiled by a plurality of people, consistency between related headwords and their translations is not necessarily taken. Thus, the dictionary user needs to make these adjustments. Using multiple types of dictionaries doubles this problem. Secondly, the expression (character string) that was previously given as an example of the main heading is placed in the heading, so that the meaning of the sentence is interpreted with priority over that character string, and the correct interpretation The evil that it was not possible has come out.

例えば、通常の場面では文字通り解釈されるある単語の並び(単語列)が、専門分野や特定の場面では限定された意味になる場合に、この単語列を見出し語に立て、その特殊な意味での訳語しか載せていなければ、初学者はこの訳語を使って文を解釈しようとし、結局意味がとれずに終わってしまうということがある。こういった大規模辞書を機械翻訳が用いる際も同様の問題が生じる。しかし、人間による柔軟な調整が入らないため、問題はより深刻である。上記で述べた第2の問題は、当該外国語にある程度通じている人であれば、解決されることが多い。すなわち、ある見出し語の語義では文脈に合わないと判断すれば、個々の単語の意味を総合して文字通りの解釈を試みるであろうと予測されるからである。しかし、機械翻訳では無条件に見出し後の訳語が優先される。   For example, if a sequence of words (word strings) that are interpreted literally in a normal scene has a limited meaning in a specialized field or a specific scene, this word string is used as a headword, and its special meaning If only the translated word is listed, the beginner may try to interpret the sentence using this translated word and end up with no meaning. Similar problems arise when machine translation uses such a large dictionary. However, the problem is more serious because there is no flexible adjustment by humans. The second problem described above is often solved by a person who is familiar with the foreign language to some extent. That is, if it is determined that the meaning of a certain headword does not match the context, it is predicted that the meaning of each word will be combined and a literal interpretation will be attempted. However, in machine translation, the translated word after the heading is unconditionally given priority.

また、ユーザが構築した辞書を併用すれば、こういった問題は倍増する。なぜなら、ユーザは、通常ならば見出し語にならないような表現を見出し語に立て、それに対し、訳を一つしかあてないのが普通であるからである。ところが、この訳語は登録の必要をユーザが感じた箇所以外では有用な訳語とはいえない可能性がある。   In addition, if a dictionary constructed by the user is used together, these problems are doubled. This is because the user usually puts an expression that would not normally be a headword as a headword and, on the other hand, has only one translation. However, there is a possibility that this translated word is not a useful translated word except where the user feels the necessity of registration.

一方、インターネット上でWWW(world wide web)を通じて情報獲得を頻繁に行うようになった。こうしたインターネットの上で得られる情報は大部分が英語であり、英語が母国語でなく不得手の場合、利用者は典型的には、機械翻訳を行って原文の意味を理解しようと努めてきた。一般的に当該外国語から日本語に変換する機械翻訳の質はまずまず耐えるレベルに達しつつあり、少なくとも構文的には正しい文が出力できることが通常となってきた。   On the other hand, information is frequently acquired on the Internet through the WWW (world wide web). Most of the information available on the Internet is in English, and if English is not your native language and you are not good at it, users have typically tried to do machine translation to understand the meaning of the original text. . In general, the quality of machine translation that translates from foreign language to Japanese language has reached a level that can be tolerated, and it has become normal to output sentences that are syntactically correct.

しかし、解釈の点では人手の翻訳に劣ることがある。その一つの要因は指示対象の不明確さである。文の中の語の間の「結びつき」(coherence, cohesion)は指示詞だけでなく、用語の使われ方によって保たれている。後者は、具体的には例えばある同じ用語が繰り返し用いられているという状態を指す。しかし、翻訳辞書(対訳辞書)を用いてこの文書を翻訳した場合、同じ用語であってもそれとその周辺の語が複合語見出しとしてあげられていれば、以下の原因からそちらの訳語が適用され、単独で生起した場合と同じ訳語で訳されるとは限らない。   However, it may be inferior to human translation in terms of interpretation. One factor is the ambiguity of the target. "Coherence, cohesion" between words in a sentence is maintained not only by directives but also by how the terms are used. The latter specifically refers to a state where, for example, the same term is used repeatedly. However, when this document is translated using a translation dictionary (parallel translation dictionary), even if it is the same term and its surrounding word is listed as a compound word heading, the translated word is applied for the following reasons. , It is not always translated with the same translation as when it occurred alone.

すなわち、機械翻訳では構文解析の効率化のために、まず複合語(慣用句を含む)の辞書を引き(A)、そのあと残った部分の解析を行い、訳をあてていく(B)。そこでは複合語の訳は一意に決められる。続くBの作業はAとは独立に行われるため、Aの対象となる部分とBの対象となる部分の訳の関連性が機械処理では失われることが多くなる。   That is, in machine translation, in order to increase the efficiency of syntax analysis, a dictionary of compound words (including idiomatic phrases) is first drawn (A), and then the remaining part is analyzed and assigned (B). There, the translation of the compound word is uniquely determined. Since the subsequent operation of B is performed independently of A, the relevance of the translation between the portion to be A and the portion to be B is often lost in machine processing.

原文を参照しないでこの機械翻訳の出力のみを読むと、こういった関連性が失われやすくなり、解釈に支障をきたすことになる。したがって、より分かりやすい訳文を作成するには、文章内に出現する調整の必要な単語列を抽出し、網羅的なチェックをし、調整を加えることが必要である。しかし、これをもれなく人手で行うことは翻訳者にとって多大な負担となる。訳語の決定という真に知的な作業に翻訳者が専念できるような機構が求められているのである。   If you read only the output of this machine translation without referring to the original text, it will be easy to lose this relevance and hinder interpretation. Therefore, in order to create a translation that is easier to understand, it is necessary to extract a word string that needs to be adjusted that appears in the sentence, perform an exhaustive check, and make adjustments. However, it is a great burden for translators to do all this manually. There is a need for a mechanism that allows translators to devote themselves to the truly intelligent task of determining translations.

翻訳結果文の見直しを容易にするための試みは確かに存在する。しかし、それは問題となる第1言語の表現(A)に対し複数の訳が可能な場合に、Aの訳語が異なっている場合のみを問題にしている。例えば下記特許文献1(特開2001−282787)があるが、これは使用者が表示された翻訳結果文の一部に別訳語を選択すると、その別訳語が選択されている部分を目立つように表示するものである。つまり、本願が扱う異なる見出し語同士の関係は問題にしていない。   There are certainly attempts to make it easier to review the translation results. However, it is a problem only when the translation of A is different when a plurality of translations are possible for the expression (A) in the first language in question. For example, there is the following Patent Document 1 (Japanese Patent Laid-Open No. 2001-282787). This is so that when a user selects a translation into a part of the displayed translation result sentence, the part where the translation is selected stands out. To display. That is, the relationship between different headwords handled by the present application is not a problem.

また、似たような試みとして、単語をリスト形式で表示するというものがある。これは広く「単語帳」という名で知られ、各種の市販の電子辞書、機械翻訳システムでは公知例となっている。しかし、これらにおいてリストの候補となるのは未知語や参照した単語であって、本願での対象とは異なる。   A similar attempt is to display words in list form. This is widely known as a “word book” and is a well-known example in various commercially available electronic dictionaries and machine translation systems. However, in these cases, the candidates for the list are unknown words or referenced words, which are different from the subject in the present application.

総括すると、従来では機械翻訳において原文内では存在した用語間の結びつきが必ずしも訳文に反映されなかった。人手の翻訳においても、一度翻訳したものを見直さない限り、訳語の一貫性は必ずしも保証されない。加えて、訳語の調整がもれなく、しかも翻訳者に多大な負担をかけることなく行われるような機構も提供されていなかった。このように現状では、訳文の修正に必要十分な情報を分かりやすく提示するという利用者のニーズには十分応えられていない。
特開2001−282787号公報
In summary, the link between terms that existed in the original text in machine translation has not always been reflected in the translation. Even in manual translation, the consistency of translated words is not always guaranteed unless the translations are reviewed once. In addition, no translation mechanism has been provided, and no mechanism has been provided that can be performed without imposing a heavy burden on the translator. As described above, at present, the user's needs for presenting information necessary for correcting the translation in an easy-to-understand manner are not sufficiently satisfied.
JP 2001-282787 A

このように従来の機械翻訳では、第1言語の語同士、それに対応する訳語同士の関係を考慮せず、翻訳を行っていたために、読み手となる利用者は訳文の理解に制約を感じていた。また、これを改善するために必要な修正のための適切な枠組みも提供されていなかった。   Thus, in conventional machine translation, translation was performed without considering the relationship between words in the first language and the corresponding translations, so the user who became the reader felt restrictions on understanding the translation. . Nor did it provide an appropriate framework for the necessary modifications to improve this.

本発明は、上記の事情を考慮してなされたもので、自然言語を他の自然言語に翻訳する機械翻訳プログラムおよび機械翻訳装置において、使用者が適切な修正訳を得るための負担を大きく減ずることができる機械翻訳プログラムおよび機械翻訳装置を提供することを目的とする。   The present invention has been made in consideration of the above-described circumstances, and in a machine translation program and machine translation apparatus that translates a natural language into another natural language, the burden on the user to obtain an appropriate corrected translation is greatly reduced. An object of the present invention is to provide a machine translation program and a machine translation apparatus capable of performing the same.

上記の課題を解決するため、本発明の第1の態様に係る機械翻訳プログラムは、翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1のステップと、前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2のステップと、前記対応づけがされた第1言語の語句がそれぞれ複合語であるか否かを判断する第3のステップと、前記判断により複合語ではないとされた語句同士、前記判断により複合語であるとされた語句同士、または前記判断により複合語ではないとされた語句と前記判断により複合語であるとされた語句とを比較する第4のステップと、前記語句の比較対において、少なくとも部分的に一致する語句を抽出する第5のステップと、前記抽出された語句を含む前記対応づけによる第1言語の語句を、当該語句に対する前記対応づけられた訳語とともに表示する第6のステップとをコンピュータに実行させることを特徴とする。   In order to solve the above problem, a machine translation program according to a first aspect of the present invention includes a first step of preparing a sentence in a first language to be translated and a sentence in a second language to be translated, A second step of associating each translated word in the translated second language sentence with each of the phrases corresponding to the translated word in the first language sentence to be translated; and A third step of determining whether or not each word is a compound word; words and phrases determined not to be compound words by the determination; words and phrases determined to be compound words by the determination; or compounded by the determination A fourth step of comparing a phrase determined not to be a word and a phrase determined to be a compound word by the determination; and a fifth step of extracting a phrase that at least partially matches in the comparison pair of the phrases. And flop, the phrase in the first language by the association which includes the extracted word, characterized in that to execute a sixth step of displaying together with the correlated obtained translation for that word to the computer.

すなわち、この機械翻訳プログラムでは、翻訳すべき第1言語の語句の中で、対応訳のある複合語の場合に特に注目し、複合語の部分的な語句を含めて第1言語の文中に共通に現れる語句が抽出される。そして、その抽出された語句を含む第1言語の語句(例えば見出し語)を、対応づけられた訳語とともに表示することができる。したがって、第1言語においては共通の語句とそれらの対応する訳との対比が容易になり、使用者は訳を修正するなどの作業を容易に行うことができる。   That is, this machine translation program pays particular attention to compound words with corresponding translations among the first language words to be translated, and is common to the first language sentences including partial words of the compound words. Phrases appearing in are extracted. And the phrase (for example, headword) of the 1st language containing the extracted phrase can be displayed with the matched translation. Therefore, in the first language, it becomes easy to compare common phrases with their corresponding translations, and the user can easily perform operations such as correcting the translations.

また、本発明の第2の態様に係る機械翻訳プログラムは、翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1のステップと、前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2のステップと、前記翻訳すべき第1言語の文について任意の語句の指定をユーザに促す第3のステップと、前記指定された語句を含むまたは当該語句の活用種もしくは派生形の語句を含む前記対応づけによる第1言語の語句を、当該第1言語の語句に対応づけられた前記訳語とともに表示する第4のステップとをコンピュータに実行させることを特徴とする。   The machine translation program according to the second aspect of the present invention provides a first step of preparing a sentence in a first language to be translated and a sentence in a second language to be translated, and the translated second language. A second step of associating each translated word in the sentence with each of the phrases corresponding to the translated word in the sentence in the first language to be translated, and designation of an arbitrary phrase for the sentence in the first language to be translated A third language prompting the user and a word in the first language by the correspondence including the specified word or phrase, or a utilization type or derivative of the word, are associated with the word in the first language. And causing the computer to execute a fourth step of displaying together with the translated word.

すなわち、この機械翻訳プログラムでは、翻訳すべき第1言語の語句として任意のものを指定することができる。そして、その指定された語句(さらにその活用形や派生形の語句)を含む第1言語の語句(例えば見出し語)を、対応づけられた訳語とともに表示することができる。したがって、第1言語においては共通の語句とそれらの対応する訳との対比が容易になり、使用者は訳を修正するなどの作業を容易に行うことができる。   That is, in this machine translation program, an arbitrary one can be designated as the first language phrase to be translated. Then, it is possible to display a phrase (for example, a headword) in the first language including the designated phrase (further utilization and derivative forms) together with the corresponding translated word. Therefore, in the first language, it becomes easy to compare common phrases with their corresponding translations, and the user can easily perform operations such as correcting the translations.

また、本発明の第3の態様に係る機械翻訳プログラムは、翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1のステップと、前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2のステップと、前記翻訳された第2言語の文について任意の語句の指定をユーザに促す第3のステップと、前記指定された語句を含むまたは当該語句の活用形もしくは派生形の語句を含む前記対応づけによる第2言語の語句を、当該第2言語の語句に対応づけられた前記第1言語の語句とともに表示する第4のステップとをコンピュータに実行させることを特徴とする。   The machine translation program according to the third aspect of the present invention includes a first step of preparing a sentence in a first language to be translated and a sentence in a second language to be translated, and the translated second language. A second step of associating each translated word in the sentence with each of the words corresponding to the translated word in the sentence in the first language to be translated, and specifying an arbitrary phrase for the translated sentence in the second language A third step of prompting the user, and the second language phrase by the correspondence including the specified phrase or the utilization form or derivative form of the phrase is associated with the second language phrase And causing the computer to execute a fourth step of displaying together with the phrase of the first language.

すなわち、この機械翻訳プログラムでは、翻訳された第2言語の語句として任意のものを指定することができる。そして、その指定された語句(さらにその活用形や派生形の語句)を含む第2言語の語句(例えば見出し語)を、対応づけられた第1言語の語句とともに表示することができる。したがって、第2言語においては共通の語句とそれらの対応する第1言語の語句との対比が容易になり、使用者は訳を修正するなどの作業を容易に行うことができる。つまりこの機械翻訳プログラムは、上記の「別の機械翻訳プログラム」とは、指定できる語句が翻訳前後という意味で逆になっている。   That is, in this machine translation program, an arbitrary one can be designated as the translated second language phrase. Then, it is possible to display a second language phrase (for example, a headword) including the designated phrase (further utilized or derived phrase) together with the associated first language phrase. Therefore, in the second language, it becomes easy to compare the common words and phrases with the corresponding words in the first language, and the user can easily perform operations such as correcting the translation. In other words, this machine translation program is opposite to the above-mentioned “another machine translation program” in that the words that can be specified are before and after translation.

また、本発明に係る機械翻訳装置は、翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1の手段と、前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2の手段と、前記対応づけがされた第1言語の語句がそれぞれ複合語であるか否かを判断する第3の手段と、前記判断により複合語ではないとされた語句同士、前記判断により複合語であるとされた語句同士、または前記判断により複合語ではないとされた語句と前記判断により複合語であるとされた語句とを比較する第4の手段と、前記語句の比較対において、少なくとも部分的に一致する語句を抽出する第5の手段と、前記抽出された語句を含む前記対応づけによる第1言語の語句を、当該語句に対する前記対応づけられた訳語とともに表示する第6の手段とを具備することを特徴とする。   The machine translation apparatus according to the present invention also includes a first means for preparing a first language sentence to be translated and a translated second language sentence, and each translated word in the translated second language sentence. And a second means for associating each phrase corresponding to the translated word in the sentence of the first language to be translated, and whether or not the phrase of the first language thus correlated is a compound word. A third means for determining, words determined not to be compound words by the determination, words determined to be compound words by the determination, or words determined to be not compound words by the determination and the determination A fourth means for comparing a phrase determined to be a compound word; a fifth means for extracting a phrase that matches at least partially in the comparison pair of the phrases; and the correspondence including the extracted phrase 1st language Phrases and characterized by comprising a sixth means for displaying together with the correlated obtained translation for that word.

また、本発明に係る別の機械翻訳装置は、翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1の手段と、前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2の手段と、前記翻訳すべき第1言語の文について任意の語句の指定をユーザに促す第3の手段と、前記指定された語句を含むまたは当該語句の活用形もしくは派生形の語句を含む前記対応づけによる第1言語の語句を、当該第1言語の語句に対応づけられた前記訳語とともに表示する第4の手段とを具備することを特徴とする。   Another machine translation device according to the present invention provides a first means for preparing a sentence in a first language to be translated and a sentence in a second language to be translated, and a sentence in the translated second language. A second means for associating each translated word with each phrase corresponding to the translated word in the sentence in the first language to be translated, and prompting the user to specify an arbitrary phrase for the sentence in the first language to be translated The translation of the third language and the translation of the first language word including the designated word or phrase, or the first language phrase by the correspondence including the utilization form or derivative form of the word, with the word of the first language. And a fourth means for displaying together.

また、本発明に係るさらに別の機械翻訳装置は、翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1の手段と、前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2の手段と、前記翻訳された第2言語の文について任意の語句の指定をユーザに促す第3の手段と、前記指定された語句を含むまたは当該語句の活用形もしくは派生形の語句を含む前記対応づけによる第2言語の語句を、当該第2言語の語句に対応づけられた前記第1言語の語句とともに表示する第4の手段とを具備することを特徴とする。   Still another machine translation device according to the present invention provides a first means for preparing a first language sentence to be translated and a translated second language sentence, and the translated second language sentence. A second means for associating each translated word in the sentence with each of the words corresponding to the translated word in the sentence in the first language to be translated, and designation of an arbitrary word or phrase for the translated sentence in the second language to the user A third means for urging and the second language phrase by the association including the specified word or phrase, or a phrase of the inflected form or derivative of the word, associated with the second language phrase And a fourth means for displaying together with the phrase of the first language.

これらの機械翻訳装置も、上記の機械翻訳プログラムそれぞれと同様な作用・効果を有する。なお、機械翻訳装置が具備する各手段は、例えばマイクロプロセッサやメモリ、ハードディスクなどのハードウエアと、これらのハードウエア上で動作するオペレーティングシステム等の基本ソフトウエアやアプリケーションプログラムなどとによって構成することが可能である。   These machine translation devices also have the same operations and effects as the above machine translation programs. Each unit included in the machine translation device may be configured by hardware such as a microprocessor, a memory, and a hard disk, and basic software such as an operating system operating on the hardware, an application program, and the like. Is possible.

本発明によれば、自然言語を他の自然言語に翻訳する機械翻訳プログラムおよび機械翻訳装置において、使用者が適切な修正訳を得るための負担を大きく減ずることができる。   According to the present invention, in a machine translation program and a machine translation apparatus that translate a natural language into another natural language, a burden for a user to obtain an appropriate corrected translation can be greatly reduced.

本発明における第1の態様の機械翻訳プログラムの実施態様として、前記判断により複合語であるとされた語句について、複合語を分割するステップと、前記分割された語句それぞれおよび前記判断により複合語でないとされた語句を原形の語句に変換して原形の単語列を得るステップとをさらにコンピュータに実行させ、前記第4のステップが、前記得られた原形の単語列を、前記判断により複合語であるとされた語句または前記判断により複合語ではないとされた語句に代えて用い、前記第6のステップが、前記抽出された語句の活用形の語句を含む前記対応づけによる第1言語の語句を、当該語句に対する前記対応づけられた訳語とともに表示するものである、とすることが可能である。これにより、第1言語において活用形が異なるるもののこれを除けば共通である語句とそれらの対応する訳との対比が容易になる。なお、ここで、「単語列」には1つの単語しかない場合も含まれる。   As an embodiment of the machine translation program according to the first aspect of the present invention, for the word / phrase determined to be a compound word by the determination, a step of dividing the compound word, each of the divided words and the compound word not determined by the determination And converting the obtained word / phrase into an original word / phrase to obtain an original word string, and causing the computer to execute the step, wherein the fourth step converts the obtained original word string into a compound word according to the determination. A word in the first language by the correspondence, in which the sixth step includes a phrase in the utilization form of the extracted phrase, which is used instead of a phrase determined to be present or a phrase which is not a compound word by the determination Can be displayed together with the corresponding translation for the word. This makes it easy to compare the common phrases and their corresponding translations except for the utilization forms in the first language. Note that the “word string” includes a case where there is only one word.

また、同様の場合の実施態様として、前記判断により複合語であるとされた語句について、複合語を分割するステップと、前記分割された語句それぞれおよび前記判断により複合語でないとされた語句を派生前の語句に変換して派生前単語列を得るステップとをさらにコンピュータに実行させ、前記第4のステップが、前記得られた派生前単語列を、前記判断により複合語であるとされた語句または前記判断により複合語ではないとされた語句に代えて用い、前記第6のステップが、前記抽出された語句の派生種の語句を含む前記対応づけによる第1言語の語句を、当該語句に対する前記対応づけられた訳語とともに表示するものである、とすることが可能である。これにより、第1言語において派生形が異なるるもののこれを除けば共通である語句とそれらの対応する訳との対比が容易になる。なお、ここでも「単語列」には1つの単語のみの場合が含まれる。   Further, as an embodiment in the same case, for the word / phrase determined to be a compound word by the determination, a step of dividing the compound word, and each of the divided words and the word / phrase determined not to be a compound word by the determination are derived. Converting the previous word / phrase to obtain a word string before derivation, further causing the computer to execute the word / phrase, wherein the fourth step determines that the obtained word string before derivation is a compound word by the determination. Alternatively, it is used instead of a word that is determined not to be a compound word according to the judgment, and the sixth step uses a word in the first language by the association including a word derived from the extracted word as the corresponding word. It is possible to display it together with the associated translated words. This makes it easy to compare the common phrases and their corresponding translations except for the derivative forms in the first language. Here, the “word string” includes the case of only one word.

また、同様の場合の実施態様として、前記翻訳された第2言語の文における訳語それぞれについて、訳語のタイプを取得するステップをさらにコンピュータに実行させ、前記第3のステップが、前記対応づけがされた第1言語の語句に対応する第2言語の訳語が前記取得された訳語のタイプにおいて特定の訳語のタイプになっているときのみ、複合語であるか否かをそれぞれ判断するものである、とすることができる。これによれば、第1言語においては共通の語句とそれらの対応する訳との対比の必要性が特に高いときを、自動的に選択してユーザに提示することができる。   Further, as an embodiment in a similar case, for each translation in the translated second language sentence, the computer further executes a step of acquiring a translation type, and the third step is the association. Only when the translation of the second language corresponding to the phrase of the first language is a specific translation type in the acquired translation type, it is determined whether or not it is a compound word. It can be. According to this, in the first language, it is possible to automatically select and present to the user when there is a particularly high necessity for comparison between common phrases and their corresponding translations.

ここで、前記特定の訳語のタイプは、音訳、一対一対応訳、部分対応訳、または説明調である場合を例示することができる。   Here, the specific translation type may be a transliteration, a one-to-one translation, a partial translation, or an explanatory note.

また、同様の場合の実施態様として、前記第6のステップが、当該第1言語の語句および当該第1言語の語句に対する前記対応づけられた訳語とともに、当該第1言語の語句が用いられた文を表示するものである、とすることができる。文をも表示することでユーザにより分かりやすい表示になる。   Further, as an embodiment in the same case, the sixth step includes a sentence in which the phrase of the first language is used together with the phrase of the first language and the translation corresponding to the phrase of the first language. Can be displayed. By displaying the sentence, the display becomes easier to understand for the user.

ここで、当該第1言語の語句が用いられた文の前記表示は、当該第1言語の語句がキーワードであることの表示を含む、とすることができる。このような表示によれば、ユーザにさらに分かりやすい表示になる。   Here, the display of the sentence in which the phrase of the first language is used can include an indication that the phrase of the first language is a keyword. According to such a display, the display becomes easier to understand for the user.

また、本発明における第2の態様のプログラムの実施態様として、前記第4のステップは、前記指定された語句が、前記訳語において特定の訳である場合には機能しない、としてもよい。対比の必要のない場合の表示をあらかじめ取り止めるための態様である。   As an embodiment of the program according to the second aspect of the present invention, the fourth step may not function when the specified word / phrase is a specific translation in the translated word. This is a mode for canceling display in advance when no comparison is necessary.

また、本発明における第3の態様のプログラムの実施態様として、前記第4のステップは、前記指定された語句が、前記第1の言語への対応づけで特定の語句である場合には機能しない、としてもよい。これも対比の必要のない場合の表示をあらかじめ取り止めるための態様である。   As an embodiment of the program according to the third aspect of the present invention, the fourth step does not function when the designated phrase is a specific phrase in association with the first language. It is good also as. This is also a mode for canceling the display when the comparison is not necessary.

以上を踏まえ、以下では本発明の実施形態を図面を参照しながら説明する。
(第1の実施形態)
図1は、本発明の一実施形態に係る機械翻訳装置の構成を示すブロック図である。この機械翻訳装置は機械翻訳プログラムを備え、これにより、同図に示すように、入力部11、システム制御部12、編集部13、翻訳部14、翻訳辞書部15、表示部16、文書記憶部17の各部が機能する。機械翻訳プログラムと機械翻訳装置の関係については以下の各実施形態でも同様である。以下では、他の実施形態も含めて、例として第1言語を英語語、第2言語を日本語語として説明を行う。
Based on the above, embodiments of the present invention will be described below with reference to the drawings.
(First embodiment)
FIG. 1 is a block diagram showing a configuration of a machine translation apparatus according to an embodiment of the present invention. This machine translation apparatus is provided with a machine translation program, whereby, as shown in the figure, an input unit 11, a system control unit 12, an editing unit 13, a translation unit 14, a translation dictionary unit 15, a display unit 16, a document storage unit Each part of 17 functions. The relationship between the machine translation program and the machine translation apparatus is the same in the following embodiments. In the following description, including other embodiments, the first language is described as English and the second language is described as Japanese.

入力部11は、インターネットなどの通信手段やキーボード等を通じて、翻訳すべき第1言語の文や文章を入力するものである。また、機械翻訳装置としての動作を指示するためのコマンドなどを入力するものである。入力された文やコマンドなどはシステム制御部12に送られる。   The input unit 11 inputs sentences and sentences in the first language to be translated through communication means such as the Internet, a keyboard, and the like. Also, a command for instructing an operation as a machine translation device is input. The input sentence or command is sent to the system control unit 12.

システム制御部12は、この機械翻訳装置全体を統括的に制御するものである。例えば、入力部11から得た文や文章を、表示部16に表示すべく表示部16に送る、編集すべく編集部13に送る、翻訳すべく翻訳部14に送る、記憶すべく文書記憶部17に送るなどの動作を行う。また、入力部11からのコマンドに従い編集部13、翻訳部14、翻訳辞書部15、文書記憶部17、表示部16の動作を制御する。例えば、翻訳辞書部15のデータを取り出して各部に送ったり、コマンドに従い入力された文章から翻訳する文を選択したり翻訳辞書部15が有する辞書のうちから働かせるものを選択したりする。   The system control unit 12 controls the entire machine translation apparatus in an integrated manner. For example, a sentence or sentence obtained from the input unit 11 is sent to the display unit 16 for display on the display unit 16, sent to the editing unit 13 for editing, sent to the translation unit 14 for translation, or a document storage unit for storage. 17 and so on. Further, the operations of the editing unit 13, the translation unit 14, the translation dictionary unit 15, the document storage unit 17, and the display unit 16 are controlled in accordance with commands from the input unit 11. For example, data in the translation dictionary unit 15 is taken out and sent to each unit, a sentence to be translated is selected from a sentence input according to a command, or a dictionary to be worked out is selected from the dictionary of the translation dictionary unit 15.

編集部13は、システム制御部12で選択された第1言語の文に対する編集の他、表示部16に表示された対象の編集、すなわち入力部11から入力されたコマンドなどの指示に応じて表示上でのカーソルの移動、翻訳部14における翻訳処理によって得られた訳文の、システム制御部12を介する表示部16での表示等の制御を行うものである。   In addition to editing the sentence in the first language selected by the system control unit 12, the editing unit 13 displays the target editing displayed on the display unit 16, that is, in response to an instruction such as a command input from the input unit 11. It controls the movement of the cursor above and the display of the translated text obtained by the translation processing in the translation unit 14 on the display unit 16 via the system control unit 12.

翻訳部14は、システム制御部12で選択された第1言語による文に対して、システム制御部12で選択された翻訳辞書部15の辞書を参照しながら翻訳処理を行うものである。翻訳辞書部15は、翻訳部14が翻訳処理を行う際に使用する各種辞書を格納・保持するものである。翻訳辞書部15が有する各種辞書の内容については後述する。   The translation unit 14 performs translation processing on the sentence in the first language selected by the system control unit 12 while referring to the dictionary of the translation dictionary unit 15 selected by the system control unit 12. The translation dictionary unit 15 stores and holds various dictionaries used when the translation unit 14 performs translation processing. The contents of various dictionaries included in the translation dictionary unit 15 will be described later.

表示部16は、システム制御部12の制御の下、入力部11から入力された第1言語の文章(原文)や、翻訳部14により訳出された第2言語の文章(訳文)等を表示するものである。文書記憶部17は、システム制御部12の制御の下、第1言語の文章と第2言語の文章とを独立して記憶・保持するとともに、第1言語とその翻訳結果としての第2言語のデータを所定に対応付けて記憶・保持するものである。   The display unit 16 displays, under the control of the system control unit 12, a first language sentence (original sentence) input from the input unit 11, a second language sentence (translation sentence) translated by the translation unit 14, and the like. Is. The document storage unit 17 stores and holds the first language sentence and the second language sentence independently under the control of the system control unit 12, and also stores the first language and the second language as a result of the translation. Data is stored and held in association with a predetermined data.

翻訳辞書部15は、図示するように、活用変化辞書15a、解析文法辞書15b、単語・熟語辞書15c、変換文法辞書15d、生成文法辞書15e、形態素生成文法辞書15fを有する。活用変化辞書15aは、第1言語について、語尾等に変化のある単語・熟語をその原形に変換するための辞書である。解析文法辞書15bは、第1言語を解析するための文法が記憶された辞書である。単語・熟語辞書15cは、第1言語の単語・熟語に対応する第2言語の訳語がその品詞情報とともに記憶された辞書である。変換文法辞書15dは、第1言語と第2言語との構造変換規則が記憶された辞書である。生成文法辞書15eは、第2言語の文の構造を決定するための辞書である。形態素生成文法辞書15fは、第2言語の語尾等の語形を変化させて翻訳文を完成させるための辞書である。   As illustrated, the translation dictionary unit 15 includes a utilization change dictionary 15a, an analysis grammar dictionary 15b, a word / idiom dictionary 15c, a conversion grammar dictionary 15d, a generation grammar dictionary 15e, and a morpheme generation grammar dictionary 15f. The utilization change dictionary 15a is a dictionary for converting words and idioms whose endings and the like are changed into original forms of the first language. The analysis grammar dictionary 15b is a dictionary in which a grammar for analyzing the first language is stored. The word / idiom dictionary 15c is a dictionary in which translated words in the second language corresponding to the words / idioms in the first language are stored together with the part of speech information. The conversion grammar dictionary 15d is a dictionary in which structure conversion rules between the first language and the second language are stored. The generation grammar dictionary 15e is a dictionary for determining the structure of the second language sentence. The morpheme generation grammar dictionary 15f is a dictionary for completing a translated sentence by changing the word form such as the end of the second language.

次に、図2を参照して、図1に示した機械翻訳装置の動作を説明する。図2は、図1に示した機械翻訳装置の動作フローを示す流れ図である。まず、原文(翻訳すべき第1言語の文章)を入力部11を用いてこの機械翻訳装置に取り込む(ステップ21)。取り込まれた文章は、システム制御部12により表示部16に表示されかつ文章記憶部17に記憶・保持される。   Next, the operation of the machine translation apparatus shown in FIG. 1 will be described with reference to FIG. FIG. 2 is a flowchart showing an operation flow of the machine translation apparatus shown in FIG. First, an original sentence (a sentence in a first language to be translated) is taken into this machine translation apparatus using the input unit 11 (step 21). The captured text is displayed on the display unit 16 by the system control unit 12 and stored / held in the text storage unit 17.

表示部16に第1言語の文章が表示されたら、次に、その文章のうち翻訳すべき文にカーソルを位置させる(ステップ22)。最初は通常第1文である。次に、利用者は入力部11からイベントの実行を指示するコマンドを入力する(ステップ23)。入力されたコマンドが「終了」、「翻訳」でない場合には、そのコマンドに応じた処理を実行し(ステップ29)、再びコマンドの入力がされ得る状態、ステップ23に戻る。入力されたコマンドが「終了」の場合は(ステップ24のY)、後述する「対訳リスト」作成の動作に移行する(ステップ30からステップ33)。入力されたコマンドが「翻訳」の場合は(ステップ25のY)、翻訳処理(ステップ26)に移行する。   When the first language sentence is displayed on the display unit 16, the cursor is then positioned on the sentence to be translated (step 22). The first is usually the first sentence. Next, the user inputs a command for instructing execution of an event from the input unit 11 (step 23). If the input command is not “end” or “translation”, the processing corresponding to the command is executed (step 29), and the process returns to step 23 where the command can be input again. When the input command is “end” (Y in step 24), the process proceeds to an operation for creating a “translation list” described later (from step 30 to step 33). If the input command is “translation” (Y in step 25), the process proceeds to a translation process (step 26).

翻訳対象を指示するカーソルの移動は、第1文から順にその文の翻訳が終わったら次の文に移動として自動的に移動する。これ以外に、カーソルの移動をコマンドによって指定することもできる。この場合には、ステップ29の処理を実行することでカーソルが移動する。内部的には、編集部13がコマンドに応じてシステム制御部12を介して表示部16上のカーソルを移動させる。この実施形態では、カーソルが位置する一文(例えばカーソルをその先頭に位置させる)が翻訳のコマンドが指示された際の翻訳対象である。このようなカーソルの移動は、原文を翻訳しようとする際に、現在のカーソル位置の文ではなく、その前後の文を翻訳したいときなどに対応するためである。   The movement of the cursor that designates the translation target is automatically moved to the next sentence when the translation of the sentence is completed in order from the first sentence. In addition, the movement of the cursor can be specified by a command. In this case, the cursor moves by executing the process of step 29. Internally, the editing unit 13 moves the cursor on the display unit 16 via the system control unit 12 according to the command. In this embodiment, a sentence in which the cursor is positioned (for example, the cursor is positioned at the head thereof) is a translation target when a translation command is instructed. This is because the movement of the cursor corresponds to, for example, when it is desired to translate not only the sentence at the current cursor position but also the sentence before and after the original sentence.

翻訳処理(ステップ26)はシステム制御部12が統括して行う。この翻訳処理自体は公知の処理を適用することができる。ただし、翻訳処理とともに、第1言語の文の語句と翻訳された第2言語の文の語句との対応関係を導出し、この対応関係をも文書記憶部17に記憶・保存しておく。これらの処理が終わると翻訳処理結果が表示部16に表示される(ステップ27)。また、翻訳対象を指定するカーソルを次の文に移動させる(ステップ28)。そして再びコマンドの入力がされ得る状態、ステップ23に戻る。以下同様の流れにより翻訳処理を進めることができる。   The translation processing (step 26) is performed by the system control unit 12 in an integrated manner. A known process can be applied to the translation process itself. However, along with the translation process, a correspondence relationship between the phrase of the first language sentence and the translated phrase of the second language sentence is derived, and this correspondence relationship is also stored and stored in the document storage unit 17. When these processes are completed, the translation process result is displayed on the display unit 16 (step 27). Further, the cursor for designating the translation target is moved to the next sentence (step 28). Then, the process returns to step 23 where the command can be input again. Thereafter, the translation process can proceed in the same flow.

具体例を図3、図4を参照して説明する。図3は、図1に示した機械翻訳装置上における原文および訳文の表示例を示す図である。図4は、図3に示す原文および訳文における、原文の語句と訳文の語句との対応を示す図である。図3(a)に示す原文(第1言語)の表示において、その第1文が翻訳処理された状態では、翻訳辞書15の利用により、“For | the | stability | of | light-weight | composite blades | , | the | low | centrifugal force | requires | a | large | diameter | bearing | .”のように句読点を除いて14の要素に分割される。ここで複数の単語からなる“composite blades”と“centrifugal force”がそれぞれ1単位として扱われているのは、これら(ただし原形)が、複合語として翻訳辞書の見出し語に登録されているためである。   A specific example will be described with reference to FIGS. FIG. 3 is a diagram showing a display example of the original sentence and the translated sentence on the machine translation apparatus shown in FIG. FIG. 4 is a diagram showing the correspondence between the original sentence and the translated sentence in the original sentence and the translated sentence shown in FIG. In the display of the original sentence (first language) shown in FIG. 3A, in the state where the first sentence has been translated, “For | the | stability | of | light-weight | composite low | centrifugal force | requires | a | large | diameter | bearing |. ”is divided into 14 elements, excluding punctuation. Here, “composite blades” and “centrifugal force” consisting of multiple words are treated as one unit each because they are registered as compound words in the translation dictionary headwords. is there.

次に、ここで分割された14の要素のうち、前置詞、冠詞などの機能語ではない内容語に関して、どのような辞書の見出し語が適用され、どのような訳語が当てられたかをその品詞情報と併せて、それぞれを対にした形のデータとして生成する。このとき、さらにこの内容語に対して、複合語(合成語)か否かの情報を付与しておく。これは英語ではスペースやハイフンの存在によって複合語であると判断することができる。   Next, of the 14 elements divided here, with respect to content words that are not function words such as prepositions and articles, what kind of dictionary headwords are applied and what translations are applied are part of speech information. In addition, the data is generated as a pair of data. At this time, information indicating whether or not the content word is a compound word (composite word) is further given. This can be judged as a compound word in English due to the presence of spaces and hyphens.

上記例では“for, the, of, a”の4語が機能語、“stability, light-weight, composite blades, low, centrifugal force, requires, large, diameter, bearing”の8語が内容語となる。このうち、“light-weight, composite blades, centrifugal force”が複合語であり、さらに、これらの内容語のうち、“composite blades”と“requires”の2語は参照した見出し語が異なる(原形が存在する)ことも記憶しておく。すなわち、前者は名詞の複数形であるので“composite blade”、後者は動詞の3人称単数現在であるので原形の“require”をそれぞれ参照している。   In the above example, 4 words “for, the, of, a” are function words, and 8 words “stability, light-weight, composite blades, low, centrifugal force, requires, large, diameter, bearing” are content words. . Among these, “light-weight, composite blades, centrifugal force” are compound words, and among these content words, the two headwords “composite blades” and “requires” have different headwords (the original form is different). It also remembers that it exists. That is, since the former is a plural form of a noun, “composite blade” is referred to, and since the latter is the third person singular of the verb, the original form “require” is referred to.

なお、ここでいう複合語は一般に複合語と理解されているものよりも広い意味で用いており、見出し語が複数の単語からなるということを指す。したがって、“full of beans”(元気一杯の)のような慣用句・イディオムも含めている。なぜなら、一般に慣用句・固有名詞は慣用句・イディオムとしての語義で解釈してよいが、場合によっては文字通りの意味で解釈しなければならないこともあるためである。先の例でいえば、文書内に“bean”単独でも生起すればその可能性は高い。また、その特有の意味と文字通りの意味と両方が必要となることもある。これは、ことば遊びの一種(pun)であり、文学などでみられる現象である。   In addition, the compound word here is used in a broader meaning than what is generally understood as a compound word, and indicates that the headword consists of a plurality of words. Therefore, it includes idioms and idioms such as “full of beans”. This is because, in general, idioms and proper nouns may be interpreted as meanings as idioms or idioms, but in some cases they must be interpreted literally. In the previous example, if a “bean” alone occurs in a document, the possibility is high. Also, both its unique meaning and literal meaning may be required. This is a kind of word play (pun), a phenomenon seen in literature.

以上のような処理により、図4(a)に示すような対応づけのリストを生成することができる。このリストは、文書記憶部17に文番号とともに送られ記憶・保存される。図3(a)に示す最初の文について以上の処理が終了すると、図3(b)の第1文のような当該文の翻訳結果が表示部16に表示される(ステップ27)。次に、カーソルが次の文に移動され(ステップ28)、この文に対する翻訳処理が行なわれる。   By the processing as described above, a correspondence list as shown in FIG. 4A can be generated. This list is sent to the document storage unit 17 together with the sentence number and stored / saved. When the above processing is completed for the first sentence shown in FIG. 3A, the translation result of the sentence such as the first sentence in FIG. 3B is displayed on the display unit 16 (step 27). Next, the cursor is moved to the next sentence (step 28), and translation processing for this sentence is performed.

ここで以下同様に、構文解析により、“Thus | , | strict | quality control | is maintained | on | the | bearing geometry | .”のように分解される。このうち内容語は“thus, strict, quality control, is maintained, bearing geometry”の5語である。さらに、“is maintained”は動詞の受動態であるため、原形に直し、“maintain”という一単語の見出し語から訳語を得ている。したがって、“quality control”と“bearing geometry”の2語のみが複合語であると判断される。   Here, as in the following, parsing is performed as follows: “Thus |, | strict | quality control | is maintained | on | the | Of these, the five content words are “thus, strict, quality control, is maintained, bearing geometry”. Furthermore, since “is maintained” is a passive voice of the verb, it is converted to its original form and the translation is obtained from the one word “maintain”. Therefore, only two words “quality control” and “bearing geometry” are determined to be compound words.

このようにして得られた対応づけのリストは例えば図4(b)に示すようになる。このリストは、図4(a)のリストと同様に文書記憶部17に記憶・保存される。図3(a)中に示す第2文の翻訳が終了すると、例えば図3(b)中に示す第2文のような当該文の翻訳結果が表示される。そして、この具体例の場合は、これ以降の文がないのでステップ24で終了のコマンドが入力される。   The association list obtained in this way is as shown in FIG. 4B, for example. This list is stored and saved in the document storage unit 17 as in the list of FIG. When the translation of the second sentence shown in FIG. 3A is completed, a translation result of the sentence such as the second sentence shown in FIG. 3B is displayed. In the case of this specific example, since there is no sentence after this, an end command is input in step 24.

以上の処理が終了すると、この翻訳装置はユーザに対し「対訳リスト」作成の要否を尋ねる(なお尋ねることなく自動的に次の処理に移行してもよい)。「対訳リスト」は以下のようにして作成される。再び図2をも参照して説明する。まず、翻訳の過程で文書記憶部17に蓄積しておいた対応づけのリストの中から、複合語(ただし原形)を取り出し、単語単位に分割する(ステップ30)。   When the above processing is completed, this translation apparatus asks the user whether or not it is necessary to create a “translation list” (you may automatically shift to the next processing without asking). The “translation list” is created as follows. This will be described with reference to FIG. 2 again. First, a compound word (however, the original form) is taken out from the correspondence list accumulated in the document storage unit 17 during the translation process, and divided into words (step 30).

図3、図4に示した例では、“light-weight, composite blade, centrifugal force, quality control, bearing geometry”の5語が対象になり、“light-weight”は“light”と“weight”の2語、“composite blade”は“composite”と“blade”の2語、“centrifugal force”は“centrifugal”と“force”の2語、“quality control”は“quality”と“control”の2語、“bearing geometry”は“bearing”と“geometry”の2語に分割される。これにより、“light, weight, composite, blade, centrifugal, force, quality, control, bearing, geometry”の計10の単語を得る。   In the example shown in FIG. 3 and FIG. 4, the five words “light-weight, composite blade, centrifugal force, quality control, bearing geometry” are targeted, and “light-weight” is “light” and “weight”. “Composite blade” is two words “composite” and “blade”, “centrifugal force” is two words “centrifugal” and “force”, “quality control” is two words “quality” and “control” “Bearing geometry” is divided into two words “bearing” and “geometry”. This gives a total of 10 words: “light, weight, composite, blade, centrifugal, force, quality, control, bearing, geometry”.

次に複合語以外のもの、すなわち一単語よりなる語句(ただし原型)を取り出す(ステップ31)。ここでは“stability, low, require, large, diameter, bearing, thus, strict, maintain”の9語が対象となる。次いで、このステップ31で得た個々の単語がステップ30で取り出した集合の中に存在するか否か、すなわち少なくとも部分的に一致する語句があるか否かを既知のいずれかのパターンマッチング技術を使って検索・抽出する(ステップ32)。   Next, a word other than the compound word, that is, a phrase (however, a prototype) composed of one word is taken out (step 31). Here, nine words “stability, low, require, large, diameter, bearing, thus, strict, maintain” are targeted. Then, any known pattern matching technique is used to determine whether the individual words obtained in step 31 are present in the set extracted in step 30, that is, whether there are at least partially matching words. Search and extract using (step 32).

図3、図4に示す例では、“bearing”が双方に含まれている。したがって、“bearing”が抽出され、第1文の“bearing”と“bearing”を構成要素に持った第2文の“bearing feature”とが例えば図5に示すような「対訳リスト」として作成・表示される(ステップ33)。これによりユーザは“bearing”という単語が、同一文書内で「軸受」と「ベアリング」と二通りに訳されていることが分かる。この表示を見て、ユーザが訳語の調整が必要であるかを判断することができる。なお、図5に示した表示以外に、それが生起した文を同時に表示させるようにしてもよい。訳語の調整は文脈を見ながらの方がやりやすいことが多いためである。   In the example shown in FIGS. 3 and 4, “bearing” is included in both. Therefore, “bearing” is extracted, and “bearing feature” of the second sentence having “bearing” of the first sentence and “bearing” as a component is created as a “translation list” as shown in FIG. It is displayed (step 33). As a result, the user can understand that the word “bearing” is translated into “bearing” and “bearing” in the same document. By viewing this display, the user can determine whether the translation needs to be adjusted. In addition to the display shown in FIG. 5, the sentence in which it occurs may be displayed simultaneously. This is because it is often easier to adjust the translation while looking at the context.

上記の例では、比較の対は第1言語の一単語の集合と複合語の集合とであったが、一単語同士、複合語同士の比較とすることも意味がある。まず、一単語の集合内の比較について図6に示す例文を使って説明する。図6は、図1に示した機械翻訳装置上で用意された原文および訳文の表示の別の例を示す図である。背景説明として、機械翻訳では同じ一単語見出しが引かれても、その見出し語に対し、共起した他の単語を参照して訳語を決定する種々の翻訳規則をもっているので、同一訳語が付与されないことがある。   In the above example, the comparison pair is a set of one word and a set of compound words in the first language. However, it is also meaningful to compare one word and compound words. First, comparison within a set of one word will be described using the example sentence shown in FIG. FIG. 6 is a diagram showing another example of the display of the original text and the translation text prepared on the machine translation apparatus shown in FIG. As a background explanation, even if the same one-word heading is drawn in machine translation, the same translation is not given because the translation has various translation rules for determining the translation with reference to the other words that co-occurred for that headword. Sometimes.

図6(a)に示す原文は、“Gears | are mounted | on | a | shaft | . | This | machine | contains | four | connecting rods | arranged | at | right angles | , | driven | by | eccentric | shafts | and | large | gears | .”のように分割されて、図7に示すような対応づけのリストが文書記憶部17に記憶・保存されている。   The original text shown in Fig. 6 (a) is “Gears | are mounted | on | a | shaft |. | This | .. ”and a correspondence list as shown in FIG. 7 is stored and stored in the document storage unit 17.

そこで、ステップ30では複合語(ただし原形)を単語単位に分割し、ステップ31では一単語からなる語句(ただし原形)を取り出した後、ステップ32では一単語の集合(“gear, shaft, machine, contain, arrange, drive, large, gear”)の中の頻度を調べ、頻度が2以上のものを抽出する。この例では“gear”がそれに相当する。そして、図7に示す対応づけのリストを参照し、これらに異なる訳語が振られている場合に表示対象とする(ステップ33)。図6(a)中の“gear”は、図7、図6(b)にあるように「歯車」「ギア」と2通りの訳語が使われているため表示対象となる。この場合の「対訳リスト」の表示は、例えば図8に示すようになる。図8は、図7に示す対応づけから得られた対訳リスト(一単語同士の比較による)の表示例を示す図である。   Therefore, in step 30, the compound word (however, the original form) is divided into word units, and in step 31, after extracting a word (however, original form) consisting of one word, in step 32, a set of one word (“gear, shaft, machine, “contain, arrange, drive, large, gear”) are examined, and those having a frequency of 2 or more are extracted. In this example, “gear” corresponds to that. Then, the correspondence list shown in FIG. 7 is referred to, and when different translations are assigned to these, the list is set as a display target (step 33). “Gear” in FIG. 6A is a display target because two translations of “gear” and “gear” are used as shown in FIGS. 7 and 6B. In this case, the “translation list” is displayed as shown in FIG. 8, for example. FIG. 8 is a diagram showing a display example of a bilingual list (by comparing one word) obtained from the correspondence shown in FIG.

次に複合語同士の比較について説明する。具体例として、同一文書内に“capacity increase”と“standard capacity”という単語列が含まれ、これらは辞書の見出し語と一致し、それぞれ、「能力アップ」「標準操業度」という訳語が割り当てられた場合を例に説明する。この場合、ステップ30において一単語に分割すると、“capacity, increase, standard, capacity”の4語を得る。次に、このうち一単語の頻度が2以上のものを取り出す。ここでは“capacity”がこれに該当する。そこでこのcapacityという単語を含む複合語、すなわち“capacity increase”と“standard capacity”が表示対象となる。   Next, comparison between compound words will be described. As a specific example, the word strings “capacity increase” and “standard capacity” are included in the same document, which match the dictionary headwords, and are assigned the translations of “capacity increase” and “standard capacity”, respectively. An example will be described. In this case, when divided into one word in step 30, four words “capacity, increase, standard, capacity” are obtained. Next, one having a frequency of 2 or more for one word is extracted. Here, “capacity” corresponds to this. Therefore, a compound word including the word “capacity”, that is, “capacity increase” and “standard capacity” are displayed.

さらに、この2文以降にも文が後続し、“capacity increase”が再び出現したとする。そこでの訳語が同じなら、例えば図9(a)に示すように、違う場合は例えば図9(b)に示すように「対訳リスト」を表示する。図9は、図7に示す対応づけのリストから得られた対訳リスト(複合語同士の比較による)の表示例を示す図である。図9(b)では、見出し語“capacity increase”の末尾に数字の2が挙げられており、これは「能力アップ」「能力増強」という2つの訳語が存在したことを示している。   Furthermore, it is assumed that a sentence continues after these two sentences and "capacity increase" appears again. If the translated words there are the same, for example, as shown in FIG. 9A, if they are different, for example, as shown in FIG. 9B, a “translation list” is displayed. FIG. 9 is a diagram showing a display example of a bilingual list (by comparison between compound words) obtained from the association list shown in FIG. In FIG. 9B, the numeral 2 is listed at the end of the headword “capacity increase”, which indicates that there are two translated words “capacity increase” and “capacity increase”.

図8、図9に示すような「対訳リスト」によっても、ユーザは、訳語の調整が必要であるかを容易に判断することができる。   The user can easily determine whether the translation needs to be adjusted by using the “translation list” as shown in FIGS.

(第2の実施形態)
次に、本発明の第2実施形態について説明する。第1実施形態でもすでに説明したが、抽出対象を原形の単語の完全一致とすることにより、抽出対象を活用形にまで拡大させることができる。このような活用語を含む抽出の例を第2の実施形態のひとつとしてまず補足・説明する。この処理のためには、翻訳辞書部15の中のうち、語尾等に変化のある単語・熟語をその原形に変換するための活用変化辞書15aを特に必要とする。
(Second Embodiment)
Next, a second embodiment of the present invention will be described. As already described in the first embodiment, the extraction object can be expanded to the utilization form by making the extraction object a complete match of the original word. An example of extraction including such words is first supplemented and described as one of the second embodiments. In order to perform this processing, a utilization change dictionary 15a is particularly required for converting a word / idiom having a change in the end of the translation dictionary unit 15 into its original form.

一例として、同一文書内に“communications service”と“communication speed”という単語列が含まれ、これらは辞書の見出し語と一致し、それぞれ、「コミュニケーションサービス」「通信速度」という訳語が対応づけられているとする。このとき、ステップ30で単語単位に分割すると、“communications, service, communication, speed”の4語が得られる。さらにこれらのうち、原形となっていないものは活用変化辞書15aを参照して原形に直す。本例では“communications”が名詞複数形になっているため、単数形の“communication”に変換される。   As an example, the word “communications service” and “communication speed” are included in the same document, and these match the dictionary headwords, and the translations “communication service” and “communication speed” are associated respectively. Suppose that At this time, if words are divided in step 30, four words “communications, service, communication, speed” are obtained. Further, among these, those that are not in the original form are converted into the original form with reference to the utilization change dictionary 15a. In this example, “communications” is a noun plural, so it is converted to the singular “communication”.

そこで、検索対象は“communication, service, communication, speed”の4語となるので、このうち頻度が2以上のものを取り出し語句の抽出を行う。ここでは“communication”が該当する。よって、“communication”を用いた複合語、すなわち“communications service”と“communication speed”が表示対象となる。図10はその表示例である。図10は、活用前の語句の比較によって得られた「対訳リスト」の表示例を示す図である。なお、活用語には、名詞の複数・単数の他にも、名詞の所有形(例: Avogadro numberとAvogadro’s number)、現在分詞、過去分詞などの動詞の活用形が挙げられる。   Therefore, since the search target is four words “communication, service, communication, speed”, those having a frequency of 2 or more are extracted and words are extracted. Here, “communication” is applicable. Therefore, a compound word using “communication”, that is, “communications service” and “communication speed” are displayed. FIG. 10 shows an example of the display. FIG. 10 is a diagram illustrating a display example of a “translation list” obtained by comparing phrases before use. In addition to the plural and singular nouns, inflection words include possession forms of nouns (eg, Avogadro number and Avogadro ’s number), conjugation forms of verbs such as present participle and past participle.

次に、活用語の場合と同様の考え方による派生語を対象に含めて抽出を行うようにした実施形態を説明する。この処理のためには、新たに第1言語の単語の語源(etymology, derivation)を記した語源辞書15g(不図示)が必要となる。   Next, a description will be given of an embodiment in which a derivative word based on the same concept as in the case of a usage word is included and extracted. For this process, a word source dictionary 15g (not shown) in which word words (etymology, derivation) of words in the first language are newly written is necessary.

例えば、同一文書内に“managerial technique”と“management approach”という単語列が含まれ、これらは辞書の見出し語と一致し、それぞれ、「管理技術」「マネージメント・アプローチ」という訳語が対応づけられているとする。このとき、ステップ30で単語単位に分割すると、“managerial, technique, management, approach”の4語が得られる。次に、語源辞書15gを用いて各語句の語源を調べると、“managerial”は動詞“manage”から派生した名詞“manager”を形容詞化したものであること、“management”は動詞“manage”を名詞化したものであるといった情報を得ることができる。こうして、“managerial”と“management”は同じ語源を持つ語であることが分かる。そこで、“manage”を仲介として“managerial technique”と“management approach”とは、「対訳リスト」に挙げるべき表示対象となる。   For example, the word “managerial technique” and “management approach” are included in the same document, and these match the dictionary headwords, and the translations of “management technology” and “management approach” are associated respectively. Suppose that At this time, if words are divided in step 30, four words “managerial, technique, management, approach” are obtained. Next, when the etymology of each phrase is examined using the etymology dictionary 15g, “managerial” is an adjective of the noun “manager” derived from the verb “manage”, and “management” is the verb “manage”. Information such as a nounization can be obtained. Thus, it is understood that “managerial” and “management” are words having the same etymology. Therefore, “managerial technique” and “management approach” are displayed on the “translation list” with “manage” as an intermediary.

もう1例として一単語内での同様の処理が挙げられる。例えば、同一文書内に“establish, reestablish”という2語が出現し、両者とも辞書の見出し語として挙がっており、それぞれ「確立する」「再建する」という訳語が対応づけられているとする。ここで、語源辞書15gを用いると、“reestablish”は動詞“establish”に“re”という接頭辞が付与されて派生した語であることが示される。これにより“establish”は“reestablish”の派生元の語であることが分かるので、これらは「対訳リスト」に挙げるべき表示対象となる。   Another example is similar processing within one word. For example, it is assumed that two words “establish, reestablish” appear in the same document, both of which are listed as dictionary headwords, and translated into “establish” and “rebuild”, respectively. Here, using the etymology dictionary 15g, “reestablish” indicates that the verb “establish” is prefixed with “re” and is derived. As a result, it is understood that “establish” is a word from which “reestablish” is derived, so these are the display objects to be listed in the “translation list”.

なお、派生のタイプはここで説明以外にも多様のものがある。接尾辞ひとつをとっても、動詞の派生語で特に造語力が高い、形容詞化の接尾辞-able, -ible (受動の意味で他動詞に付け「…できる」「…するに適する」「…するに値する」「…しやすい」の意味となるもの)、名詞化する接尾辞-er(「…する人」「…するもの」「…するためのもの」といった意味)など数多い。   There are various types of derivatives other than those described here. Even if it takes a single suffix, it is a derivative of the verb and has a particularly strong coining power. -Able, -ible (deserved to be passive ... ”(Which means“ ... easy to do ”), and the suffix-er (which means“ ... person ”,“ ... thing ”,“ ... thing ”), etc.

また、派生語として異表記も含めるようにすることができる。これは具体的には、英綴対米綴(例:colorとcolour; organizeとorganise)、大文字対小文字(Babbitt metalとbabbitt metal、social security numberとSocial Security number)、「語頭全部が小文字」対「語頭全部が大文字」、「語頭全部が小文字」対「語頭の一部の語句が大文字」などといったものがある。このように考慮することで本実施形態は、対象とする活用・派生の種類を限定されずに適用可能である。   Also, different notations can be included as derivatives. This includes English spelling vs. American spelling (eg color and colour; organize and organize), capital letters vs small letters (Babbitt metal and babbitt metal, social security number and Social Security number), There are things such as “all initial capital letters”, “all initial capital letters in lower case” vs. “a part of initial words in capital letters”. By considering in this way, the present embodiment can be applied without limiting the types of utilization / derivation to be targeted.

(第3の実施形態)
次に、本発明の第3、第4の実施形態について説明する。第3、4実施形態に係る機械翻訳装置の構成は、図1に示す第1の実施形態の構成と一点を除いて同一である。この違いは、図11に示すように、対訳リスト作成をすべきかどうかを制御する対訳リスト作成可否制御部(「編集部+対訳リスト作成可否制御部」13Aの一部として)をもっている点である。図11は、本発明の別の実施形態に係る機械翻訳装置の構成を示すブロック図である。第3、第4の実施形態では、第1実施形態の通りに翻訳を行い、この対訳リスト作成可否制御部13Aが「可」とした文字列に対して、第1実施形態で説明した「対訳リスト」作成を行う。
(Third embodiment)
Next, third and fourth embodiments of the present invention will be described. The configuration of the machine translation apparatus according to the third and fourth embodiments is the same as that of the first embodiment shown in FIG. 1 except for one point. This difference is that, as shown in FIG. 11, there is a bilingual list creation availability control unit (as part of the “editing unit + translation list creation availability control unit” 13A) that controls whether or not a bilingual list should be created. . FIG. 11 is a block diagram showing a configuration of a machine translation apparatus according to another embodiment of the present invention. In the third and fourth embodiments, translation is performed in the same manner as in the first embodiment, and the “translation” described in the first embodiment is applied to the character string that the parallel translation list creation availability control unit 13A sets “permitted”. Create a "list".

この実現には、大枠で2つのものが考えられる。一つはこの対訳リスト作成可否の制御を機械翻訳装置が行う判定の結果に基づいて行うことであり、もう一つはこの制御を外部からの指示によって行うものである。以下、前者を第3の実施形態、後者を第4の実施形態として説明する。   There are roughly two possibilities for this realization. One is to control whether or not the bilingual list is created based on the result of the determination performed by the machine translation apparatus, and the other is to perform this control by an instruction from the outside. Hereinafter, the former will be described as a third embodiment, and the latter will be described as a fourth embodiment.

第3の実施形態は、第2言語の活用変化辞書および解析文法辞書をも使って、第1言語の見出し語とその訳語がどのように対応しているかを判断して、一原語に対する訳語のタイプを解析し、これに基づき「対訳リスト」を作成するか否かを判断していることを特徴とする。   The third embodiment uses the second language utilization change dictionary and the analysis grammar dictionary to determine how the first language headwords correspond to the translations of the first language, and It is characterized by analyzing the type and determining whether or not to create a “translation list” based on this.

この実施形態に係る機械翻訳装置の動作について図12ないし図14をも参照して説明する。図12は、図11に示した機械翻訳装置の動作フローを示す流れ図、図13は、図12中に示したステップ300の詳細なフローを示す流れ図、図14は、図12中に示したステップ350の詳細なフロー示す流れ図である。図12においてすでに図2で説明したステップには同一符号を付してあり、そのステップの説明は重複するので省略する。   The operation of the machine translation apparatus according to this embodiment will be described with reference to FIGS. 12 is a flowchart showing an operation flow of the machine translation apparatus shown in FIG. 11, FIG. 13 is a flowchart showing a detailed flow of step 300 shown in FIG. 12, and FIG. 14 is a step shown in FIG. 3 is a flowchart showing a detailed flow of 350. In FIG. 12, the steps already described in FIG. 2 are denoted by the same reference numerals, and the description of those steps is omitted because it is duplicated.

動作の仕方は言語対によって異なるが、ここでは名詞(句)の英日翻訳において一単語(原語)とその複合語とが出現する場合を例にとって説明を行う。具体例として、一単語の“cylinder”に着目して、見出し語“cylinder rod”と訳語「シリンダロッド」の対、見出し語“cylinder“と訳語「シリンダー」の対、見出し語“brass cylinder assembly”と訳語「黄銅円筒組立品」の対、見出し語“graduated cylinder”と訳語「目盛り付きの円筒状の液体容積測定器」の対、見出し語“gas cylinder”と訳語「ボンベ」の対が同一文書内に出現する場合を考える。   Although the method of operation differs depending on the language pair, here, an example will be described in which one word (original word) and its compound word appear in English-Japanese translation of a noun (phrase). As a specific example, focusing on the single word “cylinder”, the headword “cylinder rod” and the translated word “cylinder rod”, the headword “cylinder” and the translated word “cylinder”, the headword “brass cylinder assembly” And the translation "brass cylinder assembly" pair, the entry "graduated cylinder" and the translation "cylindrical cylindrical liquid volume measuring instrument" pair, the entry "gas cylinder" and the translation "bomb" are the same document Consider the case of appearing inside.

ステップ300における解析においては、まず、これらの“ ”内の英語語句の訳語が単語・熟語辞書15cにより得られている状態において、原語の英語綴りからもっともらしいカタカナの音訳を得る(ステップ301)。なお、原語とカタカナ文字列の照合技術はすでに確立されているのでそれを用いる。この例では、“cylinder”から「シリンダー」または「シリンダ」、“rod”から「ロッド」、“brass”から「ブラス」、“assembly”から「アセンブリー」または「アセンブリ」、“graduated”から「グラデュエーテッド」、“gas”から「ガス」がそれぞれ導出される。   In the analysis in step 300, first, a plausible katakana transliteration is obtained from the English spelling of the original word in a state where the translation of the English phrase in “” is obtained from the word / idiom dictionary 15c (step 301). In addition, since the collation technique of an original language and a katakana character string is already established, it will be used. In this example, “cylinder” to “cylinder” or “cylinder”, “rod” to “rod”, “brass” to “brass”, “assembly” to “assembly” or “assembly”, “graduated” to “grass” “Gas” is derived from “duated” and “gas”, respectively.

次に訳語とカタカナ置換後の文字列を照合し、一致した場合は(ステップ302のY)、音訳であると判断する。この例では“cylinder rod”と「シリンダロッド」の対がこれに相当し、後述するように構成素同士も“cylinder”と「シリンダ」、“rod”と「ロッド」のように一対一対応している。一方、一致がみられなかった場合は(ステップ302のN)、まず、活用変化辞書15aと、第1言語を解析するための文法が記憶された解析文法辞書15bとを用いて、当該の語句が分割できるかどうかを判定する(ステップ304)。   Next, the translated word and the character string after the katakana replacement are collated, and if they match (Y in step 302), it is determined that the transliteration. In this example, a pair of “cylinder rod” and “cylinder rod” corresponds to this, and as will be described later, the constituent elements have a one-to-one correspondence such as “cylinder” and “cylinder”, and “rod” and “rod”. ing. On the other hand, if no match is found (N in step 302), first, using the utilization change dictionary 15a and the analysis grammar dictionary 15b in which the grammar for analyzing the first language is stored, It is determined whether or not can be divided (step 304).

分割が終了すると、それぞれの語句に関して単語・熟語辞書15cを検索し、可能な訳語を調べる(ステップ306)。次に、分割前の語句の訳語を目的言語(日本語)の活用変化辞書(不図示)と解析文法辞書(不図示)を用いて解析し、名詞、動詞といった内容語を抽出する(ステップ307)。これらの内容語と先に抽出された可能な訳語との比較対を作り、その一致度を見る(ステップ308)。   When the division is completed, the word / idiom dictionary 15c is searched for each word and a possible translation is checked (step 306). Next, the translated words of the word before division are analyzed using a target language (Japanese) utilization change dictionary (not shown) and an analysis grammar dictionary (not shown) to extract content words such as nouns and verbs (step 307). ). A comparison pair of these content words and the previously extracted possible translation words is created, and the degree of coincidence is observed (step 308).

過不足なく一致すれば、一対一対応訳語であると判定する(ステップ309)。上記では「黄銅」(“brass”)「円筒」(“cylinder”)「組立品」(“assembly”)と分割できる「黄銅円筒組立品」と“brass cylinder assembly”の対がこの分類に入る。部分的に一致する場合は、部分対応訳語と判定し(ステップ310)、その一致箇所を記憶・保存しておく。ここでは“graduated cylinder”の訳がこれに相当する。“graduated cylinder”を分解すると、“graduated”の訳語として、「目盛りを付けた、階級をつけた、累進の」といった訳語があることより「目盛り付きの」と一致し、cylinderは「円筒」と一致する一方、「液体容積測定器」のように一致しない部分もあるためである。   If they match without excess or deficiency, it is determined that the translation is a one-to-one correspondence (step 309). In the above, “brass”, “cylinder”, “assembly” and “brass cylinder assembly” and “brass cylinder assembly” pairs that fall into this category fall into this category. If it partially matches, it is determined as a partially corresponding translation (step 310), and the matching location is stored and saved. Here is the translation of “graduated cylinder”. When “graduated cylinder” is disassembled, the translation of “graduated” coincides with “graduated” because there is a translation of “graduated, graded, progressive” and cylinder is “cylinder”. This is because there is a portion that does not match, such as “liquid volume measuring device”.

全く一致しない場合は、非対応訳語と判定し(ステップ311)、一致度0であることを記憶・保存しておく。これは“gas cylinder”とそれ以上分割できない「ボンベ」のように典型的には原語の形態素(単語)の数が訳語の形態素(単語)の数を上回るケースである。   If they do not match at all, it is determined as a non-corresponding translated word (step 311), and the fact that the matching degree is 0 is stored and stored. This is typically the case where the number of morphemes (words) in the original word exceeds the number of morphemes (words) in the translated word, such as a “gas cylinder” and a “bomb” that cannot be further divided.

なお、ステップ304で行う分割が成功しなかった場合は、訳語のタイプは判定不能とする(ステップ305)。この場合は後述するように「対訳リスト」の表示対象とする。   If the division performed in step 304 is not successful, the type of translated word cannot be determined (step 305). In this case, as described later, the “translation list” is displayed.

以上のように訳語のタイプ分けが完了すると、そのタイプ分けの結果を訳語に付与する(ステップ312)。なお、以上のタイプ分けの処理(ステップ300)は、すでに単語・熟語辞書15cに訳語の種類(例えば音訳、説明調、一対一対応訳といった分類が考えられる)で与えられている場合は省略できる。   When the type classification of the translation word is completed as described above, the result of the type classification is given to the translation word (step 312). Note that the above type classification process (step 300) can be omitted if the word / idiom dictionary 15c has already been given the type of translation (for example, classification such as transliteration, explanatory note, and one-to-one correspondence). .

以上の処理がされた状態において、ステップ24において「終了」が入力されると、この翻訳装置はユーザに対し「対訳リスト」作成の要否を尋ねたうえで(なお尋ねることなく自動的に次の処理に移行してもよい)、「対訳リスト」の作成ステップ350に進む。   In the state where the above processing is performed, when “end” is input in step 24, the translation apparatus asks the user whether or not it is necessary to create a “translation list” (the next automatically without asking The process proceeds to step 350 for creating a “translation list”.

ステップ350では、図14に示すように、まず、訳語に、音訳、一対一対応訳語、部分対応訳語があるかどうかを判断する(ステップ351)。これらタイプの訳語がある場合には、「複合語について単語単位に分割」(ステップ352)、「一単語からなる語句を取り出す」(ステップ353)の各処理を行う。これらの処理は、図2におけるステップ30、ステップ31とそれぞれ同じである。   In step 350, as shown in FIG. 14, first, it is determined whether the translation includes a transliteration, a one-to-one correspondence translation, and a partial correspondence translation (step 351). If these types of translations exist, the processes of “divide compound words into words” (step 352) and “take out words consisting of one word” (step 353) are performed. These processes are the same as steps 30 and 31 in FIG.

次に、複合語の各語句、または一単語からなる語句を比較し、少なくとも部分的に一致する語句を「注目語」として抽出する(ステップ355)。具体例では、“cylinder”が抽出される。これにより、“cylinder rod”からは「シリンダ」、“cylinder”からは「シリンダー」、“brass cylinder assembly”と“graduated cylinder”からは「円筒」が内部的に得られる。つまり、同じ“cylinder”に対し、「シリンダ」「シリンダー」「円筒」の3種の訳が存在することが分かる。もし訳がひとつしか存在しなければ(ステップ355のY)、この実施形態では「対訳リスト」の作成をせず(ステップ357)、その対象語がないことをユーザに通知する。   Next, each word of the compound word or a word consisting of one word is compared, and an at least partially matching word is extracted as a “word of interest” (step 355). In the specific example, “cylinder” is extracted. As a result, “cylinder” is obtained internally from “cylinder rod”, “cylinder” from “cylinder”, and “cylinder” from “brass cylinder assembly” and “graduated cylinder”. That is, it can be seen that there are three types of translations of “cylinder”, “cylinder”, and “cylinder” for the same “cylinder”. If there is only one translation (Y in Step 355), the “translation list” is not created in this embodiment (Step 357), and the user is notified that there is no target word.

一方、上記のように、複数の訳語が存在したり(ステップ355のN)、判定不能語等が存在した場合は(ステップ351のNからステップ358のY)、この実施形態では「対訳リスト」の作成がされる。なお、ステップ358で判定不能語および非対応訳語がない場合は(ステップ358のN)、「対訳リスト」は作成されない(ステップ360)。   On the other hand, as described above, when there are a plurality of translated words (N in Step 355), or indeterminate words or the like (N in Step 351 to Y in Step 358), in this embodiment, the “translation list” Is made. If there are no undecidable words and non-corresponding translated words in step 358 (N in step 358), the “translation list” is not created (step 360).

具体例として作成される「対訳リスト」は図15に示すようになる。図15は、図11に示した機械翻訳装置で得られる対訳リストの表示例を示す図である。この表示例では、図示するように、対応関係が抽出できたものについては下線を付したりなど見やすくするなどの工夫が可能である。さらに、仮に“cylinder”を含む複合語があり、“cylinder”の訳相当語がその訳語に存在し、かつそれが単独の場合の訳である「シリンダー」と同一の場合、「対訳リスト」表示の対象から外すようにしてもよい。また、判定不能語が存在した場合も(ステップ358のY)、この実施形態では「対訳リスト」作成の対象としている(ステップ359)。   A “translation list” created as a specific example is as shown in FIG. FIG. 15 is a view showing a display example of a parallel translation list obtained by the machine translation apparatus shown in FIG. In this display example, as shown in the figure, it is possible to devise such that the correspondence can be extracted, for example, underlined or easy to see. In addition, if there is a compound word that includes “cylinder”, the translation equivalent of “cylinder” exists in that translation, and if it is the same as “cylinder”, which is the translation when it is alone, the “translation list” is displayed. You may make it remove from the object of. In addition, even when an undecidable word exists (Y in Step 358), in this embodiment, it is a target for creating a “translation list” (Step 359).

ユーザは、図15に示すような「対訳リスト」を見ながら、訳文に対して必要な修正を容易に行うことができる。例えば、同一文内、または近傍に“cylinder”単独と“brass cylinder assembly”が現れた場合、この“cylinder”は同一物を指す可能性がかなり高いため、前者の訳語は「シリンダー」でなく、「円筒」に変更するなど、訳語をそろえるほうが理解しやすい文になることが分かる。   The user can easily make necessary corrections to the translated text while viewing the “translation list” as shown in FIG. For example, if “cylinder” alone and “brass cylinder assembly” appear in or near the same sentence, this “cylinder” is very likely to refer to the same thing, so the former translation is not “cylinder” You can see that it is easier to understand if you use the same translation, such as changing to "Cylinder".

本具体例のように、“brass cylinder assembly”に対し、同一文書内で“cylinder”がどのように訳出されているかを見ることは、辞書の見出しに挙がっている「黄銅円筒組立品」とは違う新たな訳をユーザが考える上で役立つ。さらに、「シリンダー」と「シリンダ」のように異表記の存在も容易に検出でき、これらは特別の理由がない限り、統一するのが望ましいであろう。日本語では長音記号以外にも中点の有無、カタカナ語表記によるばらつきがある。英語でも、同様に、複合語に関して、一語にするか(例:“broadband”)、二語にするか(ハイフンでつなぐか(例:broad-band)、スペースのままとするか(例:broad band)で揺れがある。市販辞書、機械翻訳辞書いずれも同一辞書内で表記が必ずしも統一されていないのが現状である。そこで、辞書適用後の文書内における表記の調整は必然となっている。   To see how “cylinder” is translated in the same document for “brass cylinder assembly” as in this specific example, what is the “brass cylinder assembly” listed in the dictionary heading? It helps users think about new and different translations. Furthermore, the presence of different notations such as “cylinder” and “cylinder” can be easily detected, and it would be desirable to unify these unless there is a specific reason. In Japanese, in addition to the long clef symbols, there are also midpoints and variations in katakana notation. Similarly, in English, for compound words, whether to use one word (eg “broadband”), two words (connect with a hyphen (eg broad-band), or leave a space (eg: The current situation is that notation is not necessarily unified in the same dictionary in both the commercial dictionary and the machine translation dictionary, so adjustment of the notation in the document after applying the dictionary is inevitable. Yes.

さらに、本具体例の文書内で一単語cylinderの見出し語の訳語が付与された中には、前後の要素を加えて、複合語の見出しとして辞書に新たに加えるべきものも含まれている可能性がある。このための辞書登録の作業を容易にするため、次のような機能を提供することも可能である。このためにはまず、「用いられた文」の項は、図15(b)に示すように、KWIC(キーワード・イン・コンテキスト)表示にする。また、翻訳処理過程で得られた句構造から、句の範囲(ここでは名詞句)を、図15(b)に下線で図示するように、明示する。この部分の名詞句の訳はデフォルト訳であり、望ましい訳とは限らないが、参考として現状訳を近傍に表示する。この結果を参照しながらユーザは必要に応じて辞書登録をスムーズに行うことができる。   Furthermore, the translation of one-word cylinder headwords in the document of this specific example may include the ones that should be added to the dictionary as headings of compound words by adding the preceding and following elements. There is sex. In order to facilitate the dictionary registration work for this purpose, it is also possible to provide the following functions. For this purpose, first, the “used sentence” item is displayed as KWIC (keyword in context) as shown in FIG. Further, from the phrase structure obtained in the translation processing process, the range of phrases (here, noun phrases) is clearly shown as shown by the underline in FIG. The translation of this part of the noun phrase is a default translation, which is not always desirable, but the current translation is displayed in the vicinity for reference. While referring to this result, the user can smoothly perform dictionary registration as necessary.

(第4の実施形態)
次に、本発明の第4実施形態について図16を参照して説明する。図16は、本発明のさらに別の実施形態に係る機械翻訳装置の構成を示すブロック図である。同図に示すように、この機械翻訳装置は、図1に示した機械翻訳装置の構成要素の他に、前編集部(「編集部+前編集部」13Bの一部として)が追加されている。この前編集部は、翻訳結果を所望の形に近づけるためにユーザが翻訳の前に文書に対し行う編集処理のためのものである。例えば、その一つには、長文を分割したり、受身文を能動文にしたりなどの書き換えや訳文においても原語のまま表示したい語句の指定がある。さらに、この実施形態では、この前編集部が、「対訳リスト」を作成すべき語句の指定にも用いられる。その態様を以下説明する。
(Fourth embodiment)
Next, a fourth embodiment of the present invention will be described with reference to FIG. FIG. 16 is a block diagram showing a configuration of a machine translation apparatus according to still another embodiment of the present invention. As shown in the figure, this machine translation apparatus has a pre-editing unit (as part of “editing unit + pre-editing unit” 13B) in addition to the components of the machine translation device shown in FIG. Yes. This pre-editing unit is for an editing process that the user performs on the document before translation in order to bring the translation result closer to a desired shape. For example, one of them is rewriting such as dividing a long sentence or making a passive sentence into an active sentence, or specifying a phrase to be displayed as it is in a translated sentence. Furthermore, in this embodiment, this pre-editing unit is also used for designating a phrase for which a “translation list” is to be created. This aspect will be described below.

まず、翻訳の前準備としてユーザは前編集部を通じて、入力部11を用い「対訳リスト」を付与すべき語句を指定する。ここでは具体例として第3実施形態の説明で使用した“cylinder”という単語に対し、そのような指定を行ったとする。指定を行うには、例えば図17に示すような対訳リスト作成対象指定のための画面を用い、対訳リストの対象や書式を指示するよう構成することができる。図17は、図16中に示した「編集部+前編集部」のはたらきによって表示部に表示される、ユーザに任意の語句の指定を促すための画面の例を示す図である。これにより指示がされると、機械翻訳装置は、それに基づいた「対訳リスト」の作成処理を実行させる。   First, as a pre-translation preparation, the user designates a word / phrase to be given a “translation list” using the input unit 11 through the pre-editing unit. Here, as a specific example, it is assumed that such a designation is made for the word “cylinder” used in the description of the third embodiment. For the designation, for example, a bilingual list creation target designation screen as shown in FIG. 17 may be used to instruct the bilingual list target and format. FIG. 17 is a diagram illustrating an example of a screen for prompting the user to specify an arbitrary phrase that is displayed on the display unit by the function of “editing unit + pre-editing unit” illustrated in FIG. 16. When instructed in this way, the machine translation device executes a process of creating a “translation list” based on the instruction.

図17に示す選択肢としては、1.として、複合語のみとするか((ア)−1)、単独のみとするか((ア)−2)、いずれも対象に含めるか((ア)−3)の3種のうちから指定できる。具体例では、((ア)−1)を選択すれば“cylinder”単独は対象外になり、((ア)−2)は逆に“cylinder”単独のみが対象となり、((ア)−3)は双方が対象となる。   The options shown in FIG. Can be specified from among three types: (a) -1), only a single word ((a) -2), or whether all are included in the target ((a) -3) . In a specific example, if ((a) -1) is selected, “cylinder” alone is excluded, and ((a) -2) is conversely only “cylinder” alone, ((a) -3 ) Is for both.

また、2.として、派生語・活用語を含めるか否かでは含めるとした場合、“cylinder”以外に“cylindrical”(形容詞), “cylindrically”(副詞), “cylindricality”(名詞), “cylinder-like”(形容詞)も検索され、加えて、“cylinder”は名詞から派生した動詞もあるため、“cylindering”や“cylindered”も検索対象にできる。なお、一部の派生語、活用語の検索のみを希望する場合は、その品詞の指定または語そのものの指定により、検索対象を限定する枠組みも設けている。これは全ての派生語を扱うと出力件数が非常に多くなる場合などに有用である。   In addition, 2. As a result, in addition to “cylinder”, “cylindrical” (adjective), “cylindrically” (adverb), “cylindricality” (noun), “cylinder-like” ( Adjectives) are also searched, and in addition, because “cylinder” is a verb derived from a noun, “cylindering” and “cylindered” can also be searched. In addition, when only a search for a part of the derivative words and the use words is desired, a framework for limiting the search target by designating the part of speech or designating the word itself is provided. This is useful when dealing with all derivatives and the number of output is very large.

以上は原語側での限定であるが、3.として、訳語側での制御もこの実施形態では可能である。ここで訳語を指定すれば、その語が対応する訳語となっているものを表示対象から外すことができる。例えば、“equipment”が検索語である場合、訳語が例えば「装置」であるものは除くといったように指定できる。すると、文書内に“semiconductor processing equipment”「半導体処理装置」、“electronic equipment”「電子装置」、“airborne equipment”「航空機搭載機器」があった場合、前者2つは除外される。これは、特許文書における「装置」など、特定の語が繰り返し出現することがあらかじめ分かっている文書に対して適用すると有効である。   The above is the limitation on the original language side. In this embodiment, control on the translated word side is also possible. If a translated word is designated here, it is possible to remove from the display object the corresponding translated word. For example, when “equipment” is a search word, it is possible to specify that the translated word is, for example, “device”. Then, when “semiconductor processing equipment”, “semiconductor processing equipment”, “electronic equipment”, “electronic equipment”, “airborne equipment”, “aircraft equipment” are included in the document, the former two are excluded. This is effective when applied to a document in which it is known in advance that a specific word repeatedly appears, such as “apparatus” in a patent document.

また、4.として、ユーザが要求する関連情報を選択できるようにしている。例えば、原語、訳語の品詞、訳語のタイプ(音訳、一対一対応訳語、部分対応訳語、説明調、その他)、生起した文といった項目が挙げられる。   4. The related information requested by the user can be selected. For example, items such as the original language, the part of speech of the translation, the type of translation (transliteration, one-to-one correspondence translation, partial correspondence translation, explanatory tone, etc.), and the sentence that occurred are included.

以上の説明は、原文を参照して、ユーザが「対訳リスト」の作成を希望するか否かを指定しているが、訳文を参照しながら「対訳リスト」希望か否かを入力できるようにしてもよい。換言すると、上記の例は、翻訳者が「対訳リスト」の必要性を判断するケースだが、この例は翻訳文書の読者が「対訳リスト」の必要性を判断するケースという見方もできる。このような場合動作について、次に説明する。   The above description refers to the original text and specifies whether or not the user wishes to create a “translation list”, but allows the user to input whether or not he wishes to create a “translation list” while referring to the translation. May be. In other words, the above example is a case where the translator determines the necessity of the “translation list”, but this example can also be regarded as a case where the reader of the translation document determines the necessity of the “translation list”. The operation in such a case will be described next.

このような場合は、上記で述べた実施形態の「前編集部」が機能的に「後編集部」となる。まず、翻訳終了後、ユーザは後編集部を通じて、入力部11を用い「対訳リスト」を付与すべき語句を指定する。例えばここでは原語“heat”に対応する「放熱」を指定したとする。このような指定も、図17に示すような対訳リスト作成形式指定のための画面を利用することができる。ただし、図17における「単独、複合語」、「派生語、活用語」はいずれも訳語側のそれを指し、「表示対象からはずす訳語」は「表示対象からはずす原語」となる。   In such a case, the “pre-editing unit” in the embodiment described above is functionally a “post-editing unit”. First, after the translation is completed, the user uses the input unit 11 through the post-editing unit to specify a word / phrase to which the “translation list” is to be assigned. For example, it is assumed here that “heat radiation” corresponding to the original word “heat” is designated. For such designation, a screen for designating a translation list creation format as shown in FIG. 17 can be used. However, “single, compound word” and “derivative word, utilization word” in FIG. 17 indicate those on the translation side, and “translation word to be removed from display object” is “original word to be removed from display object”.

この例で例えば、「単独、複合語双方」、「派生語、活用語」を限定せずに対象とし、原語の制限も設けない場合、「放熱」以外にその複合語である「放熱回路」「放熱源」「放熱特性」に加え、活用語、関連語である「放熱する」「放熱可能」も検索対象とすることができる(ただし、これらが文書内に使われていることを前提とする。)。処理終了後には、例えば図18のような「対訳リスト」が作成・表示される。このようにすることで、訳語をキーにソートすることにより、逆方向(ここでは日英)の辞書登録作業をも軽減することができる。   In this example, for example, in the case where “single and compound words”, “derivative words, and usage words” are not limited and there is no restriction on the original language, the compound word “heat dissipation circuit” other than “heat dissipation” is used. In addition to “Heat dissipation source” and “Heat dissipation characteristics”, you can also search for usage words and related terms “Heat dissipation” and “Heat dissipation possible” (provided that these are used in the document) To do.) After the processing is completed, for example, a “translation list” as shown in FIG. 18 is created and displayed. By doing so, the dictionary registration work in the reverse direction (in this case, Japanese-English) can be reduced by sorting the translated words as keys.

なお、以上述べた実施形態は、次のように種々変更して実現することも可能である。例えば、上記実施形態は、「対訳リスト」作成に必要な処理の一部を本文の翻訳と並列して行うようにしているが、その段階では「対訳リスト」作成に必要な処理は全くせずに機械翻訳を一通り行ってから、「対訳リスト」作成の処理に入るようにすることも可能である。   Note that the embodiment described above can be implemented with various modifications as follows. For example, in the above embodiment, a part of the processing necessary for creating the “translation list” is performed in parallel with the translation of the text, but at that stage, the processing necessary for creating the “translation list” is not performed at all. It is also possible to go through the process of creating a “translation list” after performing machine translation.

また、「対訳リスト」作成の指定を、翻訳の前あるいは後に一括して行うようにしているが、対話翻訳として、語句ごとに対訳リスト希望の旨を指示するようにしてもよい。また、上記実施形態は訳文として機械翻訳の出力を用いているが、人手で翻訳したものを電子化したものを使ってもよい。ただし、この場合大きな相違点がある。すなわち、機械翻訳の場合、単独語と複合語の区別があるが、後者にはない。同一文内の用語はもちろんのこと、文単位でも必ずしも1対1対応しているとは限らない。   In addition, the designation of creating the “translation list” is collectively performed before or after the translation, but it may be instructed that the translation list is desired for each word as interactive translation. Moreover, although the said embodiment uses the output of machine translation as a translation, you may use what digitized what was translated manually. However, there are significant differences in this case. That is, in the case of machine translation, there is a distinction between a single word and a compound word, but not in the latter. Not only terms in the same sentence but also sentence units do not always correspond one-to-one.

そこで、この場合は、機械処理にて対応関係がとれた表現について、上記実施形態のような処理を行う。なお、対訳文書の対応関係自動抽出の方法は、文献:「高橋大和、白井諭、大山芳史「日英新聞記事の対応コーパス自動生成」言語処理学会第3回年次大会、pp.127−130, 1997」、文献:「松本賢司、柏岡秀紀、田中英輝「分野固有の情報を利用した日英対訳記事コーパスの構築」情報処理学会第63回全国大会、vol. 2, pp. 251−252, 2001」、または特開2004−102481号公報を始めとして各種考案されているので、それらの技術を利用することができる。   Therefore, in this case, the processing as in the above-described embodiment is performed for expressions that have a corresponding relationship in the machine processing. The method for automatically extracting the correspondence relationship of bilingual documents is described in the literature: “Yamato Takahashi, Satoshi Shirai, Yoshifumi Oyama“ Automatic Generation of Corresponding Corpus of Japanese-English Newspapers ”The 3rd Annual Conference of the Language Processing Society, pp. 127-130, 1997 ”, literature:“ Kenji Matsumoto, Hideki Sasaoka, Hideki Tanaka “Construction of Japanese-English Bilingual Corpus Using Field-Specific Information”, Information Processing Society of Japan 63rd National Convention, vol. 2, pp. Since various devices such as “251-252, 2001” or Japanese Patent Application Laid-Open No. 2004-102481 have been devised, these techniques can be used.

対応関係がたとえ部分的にしか得られないとしても、本実施形態の人手翻訳への適用は、機械翻訳では起こりにくいが人手翻訳では起こりやすい現象を検出するのに役立つ。すなわち、人手翻訳の場合、本来は同じように訳すべき原語表現に対して、不注意、記憶違いなどにより、場所によって違った訳語をあててしまうことがある。本実施形態によれば、そうした可能性のある箇所を網羅的に検出できる。なお、以上の説明は、英日翻訳を例に説明してきたが、英日のみならず日英にも応用することができる。   Even if the correspondence is obtained only partially, the application of the present embodiment to human translation is useful for detecting a phenomenon that is unlikely to occur in machine translation but is likely to occur in human translation. In other words, in the case of manual translation, there are cases where different translations are applied to different places depending on places due to carelessness and memory differences with respect to the original language expressions that should be translated in the same way. According to this embodiment, it is possible to comprehensively detect such a possibility. Although the above description has been described by taking English-Japanese translation as an example, it can be applied to not only English-Japanese but also Japanese-English.

以上説明のように、各実施形態によれば、第1言語内で関連のある語とその訳語の異なる組み合わせを抽出、表示し、この表示結果を参照しながら、訳文の修正を行ったり、また、その抽出結果をもとに翻訳辞書(対訳辞書)に対し修正や追加を行ったりすることが容易になる。   As described above, according to each embodiment, a different combination of a related word and its translation in the first language is extracted and displayed, and the translation is corrected while referring to the display result. Then, it becomes easy to correct or add to the translation dictionary (parallel translation dictionary) based on the extraction result.

より具体的には、主に4つの効果が期待できる。第1に、指示対象物が不明確であった訳出表現を洗い出し、効率的な修正が可能となる。すなわち同一物を指すのに違った訳語が付与されているという問題である。訳語同士が第2言語では同義語でない場合、これは特に深刻な問題である。第2に、現状の機械辞書内における表現の統一や訳語候補の追加により、辞書の質を向上させることができる。   More specifically, four main effects can be expected. First, it is possible to find out the translated expression in which the object to be pointed is unclear and to make an efficient correction. That is, it is a problem that different translations are given to indicate the same thing. This is a particularly serious problem if the translations are not synonyms in the second language. Second, the quality of the dictionary can be improved by unifying expressions in the current machine dictionary and adding translation candidates.

第3に、辞書編纂専門家ではないユーザによって作成されたユーザ辞書の弊害を緩和できる。この弊害とはある限られた文のみを見て、本来は見出し語に立てるべきでない語を辞書の見出しとしてしまい、その文字列と訳が必要以上に優先されてしまうというものである。第4に、検索対象に派生語も含めているため、“radiation heat, radiative heat, radiant heat”のように意味的には近いが、従来は別扱いとされがちであった表現が関連づけられるようになる。   Third, it is possible to mitigate the negative effects of a user dictionary created by a user who is not a dictionary editor. This problem is that only a limited sentence is seen, words that should not be used as headwords are used as dictionary headlines, and their character strings and translations are prioritized more than necessary. Fourth, because the search target includes derivative terms, expressions that are close in meaning, such as “radiation heat, radiative heat, radiant heat” but have been apt to be treated separately in the past, are related. become.

本発明の一実施形態に係る機械翻訳装置の構成を示すブロック図。1 is a block diagram showing a configuration of a machine translation apparatus according to an embodiment of the present invention. 図1に示した機械翻訳装置の動作フローを示す流れ図。The flowchart which shows the operation | movement flow of the machine translation apparatus shown in FIG. 図1に示した機械翻訳装置上で用意された原文および訳文の表示例を示す図。The figure which shows the example of a display of the original sentence and translation which were prepared on the machine translation apparatus shown in FIG. 図3に示す原文および訳文における、原文の語句と訳文の語句との対応を示す図。The figure which shows a response | compatibility with the phrase of an original sentence, and the phrase of a translation sentence in the original sentence and translation which are shown in FIG. 図4に示す対応づけから得られた対訳リストの表示例を示す図。The figure which shows the example of a display of the bilingual list obtained from the matching shown in FIG. 図1に示した機械翻訳装置上で用意された原文および訳文の表示の別の例を示す図。The figure which shows another example of the display of the original sentence and translation which were prepared on the machine translation apparatus shown in FIG. 図6に示す原文および訳文における、原文の語句と訳文の語句との対応を示す図。The figure which shows a response | compatibility with the phrase of an original sentence, and the phrase of a translated sentence in the original sentence and translation which are shown in FIG. 図7に示す対応から得られた対訳リスト(一単語同士の比較による)の表示例を示す図。The figure which shows the example of a display of the bilingual list (by comparison of one word) obtained from the correspondence shown in FIG. 図7に示す対応から得られた対訳リスト(複合語同士の比較による)の表示例を示す図。The figure which shows the example of a display of the bilingual list (by the comparison of compound words) obtained from the correspondence shown in FIG. 活用前の語句の比較によって得られた対訳リストの表示例を示す図。The figure which shows the example of a display of the bilingual list obtained by the comparison of the words before utilization. 本発明の別の実施形態に係る機械翻訳装置の構成を示すブロック図。The block diagram which shows the structure of the machine translation apparatus which concerns on another embodiment of this invention. 図11に示した機械翻訳装置の動作フローを示す流れ図。12 is a flowchart showing an operation flow of the machine translation apparatus shown in FIG. 11. 図12中に示したステップ300の詳細なフローを示す流れ図。The flowchart which shows the detailed flow of step 300 shown in FIG. 図12中に示したステップ350の詳細なフロー示す流れ図。The flowchart which shows the detailed flow of step 350 shown in FIG. 図11に示した機械翻訳装置で得られる対訳リストの表示例を示す図。The figure which shows the example of a display of the bilingual list obtained with the machine translation apparatus shown in FIG. 本発明のさらに別の実施形態に係る機械翻訳装置の構成を示すブロック図。The block diagram which shows the structure of the machine translation apparatus which concerns on another embodiment of this invention. 図16中に示した「編集部+前編集部」のはたらきによって表示部に表示される、ユーザに任意の語句の指定を促すための画面の例を示す図。FIG. 17 is a diagram showing an example of a screen for prompting the user to specify an arbitrary phrase that is displayed on the display unit by the function of “editing unit + pre-editing unit” shown in FIG. 16. 図16に示した機械翻訳装置で得られる対訳リストの表示例を示す図。The figure which shows the example of a display of the bilingual list obtained with the machine translation apparatus shown in FIG.

符号の説明Explanation of symbols

11…入力部、12…システム制御部、13…編集部、13A…編集部+対訳リスト作成可否制御部、13B…編集部+前編集部、14…翻訳部、15…翻訳辞書部、15a…活用変化辞書(第1言語)、15b…解析文法辞書(第1言語)、15c…単語・熟語辞書、15d…変換文法辞書、15e…生成文法辞書(第2言語)、15f…形態素生成文法辞書(第2言語)、16…表示部、17…文書記憶部。   DESCRIPTION OF SYMBOLS 11 ... Input part, 12 ... System control part, 13 ... Editing part, 13A ... Editing part + Parallel list creation availability control part, 13B ... Editing part + Pre-editing part, 14 ... Translation part, 15 ... Translation dictionary part, 15a ... Utilization change dictionary (first language), 15b ... analysis grammar dictionary (first language), 15c ... word / idiom dictionary, 15d ... conversion grammar dictionary, 15e ... generated grammar dictionary (second language), 15f ... morpheme generation grammar dictionary (Second language), 16... Display unit, 17... Document storage unit.

Claims (22)

翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1のステップと、
前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2のステップと、
前記対応づけがされた第1言語の語句がそれぞれ複合語であるか否かを判断する第3のステップと、
前記判断により複合語ではないとされた語句同士、前記判断により複合語であるとされた語句同士、または前記判断により複合語ではないとされた語句と前記判断により複合語であるとされた語句とを比較する第4のステップと、
前記語句の比較対において、少なくとも部分的に一致する語句を抽出する第5のステップと、
前記抽出された語句を含む前記対応づけによる第1言語の語句を、当該語句に対する前記対応づけられた訳語とともに表示する第6のステップと
をコンピュータに実行させるための機械翻訳プログラム。
Preparing a first language sentence to be translated and a translated second language sentence;
A second step of associating each translated word in the translated second language sentence with each phrase corresponding to the translated word in the first language sentence to be translated;
A third step of determining whether or not the words in the first language associated with each other are compound words;
Phrases determined not to be compound words by the determination, phrases determined to be compound words by the determination, or phrases determined not to be compound words by the determination and phrases determined to be compound words by the determination A fourth step of comparing
A fifth step of extracting at least partially matching phrases in the phrase comparison pair;
A machine translation program for causing a computer to execute a sixth step of displaying a phrase in the first language by the association including the extracted phrase together with the translated word corresponding to the phrase.
前記判断により複合語であるとされた語句について、複合語を分割するステップと、
前記分割された語句それぞれおよび前記判断により複合語でないとされた語句を原形の語句に変換して原形の単語列を得るステップとをさらにコンピュータに実行させ、
前記第4のステップが、前記得られた原形の単語列を、前記判断により複合語であるとされた語句または前記判断により複合語ではないとされた語句に代えて用い、
前記第6のステップが、前記抽出された語句の活用形の語句を含む前記対応づけによる第1言語の語句を、当該語句に対する前記対応づけられた訳語とともに表示するものであること
を特徴とする請求項1記載の機械翻訳プログラム。
Dividing the compound word with respect to the phrase determined to be a compound word by the determination;
Further converting each of the divided words and the words determined to be non-compound words by the determination into original words to obtain an original word string;
The fourth step uses the obtained original word string in place of a word that is determined to be a compound word by the determination or a word that is determined not to be a compound word by the determination;
The sixth step is to display a phrase in the first language by the association including a phrase in the utilization form of the extracted phrase together with the translated word corresponding to the phrase. The machine translation program according to claim 1.
前記判断により複合語であるとされた語句について、複合語を分割するステップと、
前記分割された語句それぞれおよび前記判断により複合語でないとされた語句を派生前の語句に変換して派生前単語列を得るステップとをさらにコンピュータに実行させ、
前記第4のステップが、前記得られた派生前単語列を、前記判断により複合語であるとされた語句または前記判断により複合語ではないとされた語句に代えて用い、
前記第6のステップが、前記抽出された語句の派生形の語句を含む前記対応づけによる第1言語の語句を、当該語句に対する前記対応づけられた訳語とともに表示するものであること
を特徴とする請求項1記載の機械翻訳プログラム。
Dividing the compound word with respect to the phrase determined to be a compound word by the determination;
Further converting each of the divided words and the phrase determined not to be a compound word by the determination to a word before derivation to obtain a word string before derivation,
The fourth step uses the obtained pre-derivation word string in place of the phrase determined to be a compound word by the determination or the phrase determined not to be a compound word by the determination,
The sixth step is to display a phrase in the first language by the association including a phrase derived from the extracted phrase together with the associated translation for the phrase. The machine translation program according to claim 1.
前記翻訳された第2言語の文における訳語それぞれについて、訳語のタイプを取得するステップをさらにコンピュータに実行させ、
前記第3のステップが、前記対応づけがされた第1言語の語句に対応する第2言語の訳語が前記取得された訳語のタイプにおいて特定の訳語のタイプになっているときのみ、それぞれ複合語であるか否かを判断するものであること
を特徴とする請求項1記載の機械翻訳プログラム。
For each translation in the translated second language sentence, further causing the computer to execute a step of obtaining a translation type,
The third step is a compound word only when the second language translation corresponding to the associated first language phrase is a specific translation type in the acquired translation type. The machine translation program according to claim 1, wherein the machine translation program determines whether or not.
前記特定の訳語のタイプが、音訳、一対一対応訳、部分対応訳、または説明調であることを特徴とする請求項4記載の機械翻訳プログラム。   5. The machine translation program according to claim 4, wherein the type of the specific translation is a transliteration, a one-to-one correspondence translation, a partial correspondence translation, or an explanatory note. 前記第6のステップが、当該第1言語の語句および当該第1言語の語句に対する前記対応づけられた訳語とともに、当該第1言語の語句が用いられた文を表示するものであることを特徴とする請求項1記載の機械翻訳プログラム。   The sixth step is to display a sentence in which the phrase of the first language is used together with the phrase of the first language and the translation corresponding to the phrase of the first language. The machine translation program according to claim 1. 当該第1言語の語句が用いられた文の前記表示が、当該第1言語の語句がキーワードであることの表示を含むことを特徴とする請求項6記載の機械翻訳プログラム。   The machine translation program according to claim 6, wherein the display of the sentence in which the phrase in the first language is used includes an indication that the phrase in the first language is a keyword. 翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1のステップと、
前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2のステップと、
前記翻訳すべき第1言語の文について任意の語句の指定をユーザに促す第3のステップと、
前記指定された語句を含むまたは当該語句の活用形もしくは派生形の語句を含む前記対応づけによる第1言語の語句を、当該第1言語の語句に対応づけられた前記訳語とともに表示する第4のステップと
をコンピュータに実行させるための機械翻訳プログラム。
Preparing a first language sentence to be translated and a translated second language sentence;
A second step of associating each translated word in the translated second language sentence with each phrase corresponding to the translated word in the first language sentence to be translated;
A third step for prompting the user to specify an arbitrary phrase for the sentence in the first language to be translated;
Displaying a word in the first language by the correspondence including the designated word or phrase, or a phrase in a utilization form or a derivative of the word, together with the translated word associated with the word in the first language A machine translation program for causing a computer to execute steps and.
前記第4のステップが、前記指定された語句が、前記訳語において特定の訳である場合には機能しないことを特徴とする請求項8記載の機械翻訳プログラム。   9. The machine translation program according to claim 8, wherein the fourth step does not function when the designated phrase is a specific translation in the translated word. 翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1のステップと、
前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2のステップと、
前記翻訳された第2言語の文について任意の語句の指定をユーザに促す第3のステップと、
前記指定された語句を含むまたは当該語句の活用形もしくは派生形の語句を含む前記対応づけによる第2言語の語句を、当該第2言語の語句に対応づけられた前記第1言語の語句とともに表示する第4のステップと
をコンピュータに実行させるための機械翻訳プログラム。
Preparing a first language sentence to be translated and a translated second language sentence;
A second step of associating each translated word in the translated second language sentence with each phrase corresponding to the translated word in the first language sentence to be translated;
A third step for prompting the user to specify an arbitrary phrase for the translated second language sentence;
Displaying the second language phrase by the correspondence including the specified phrase or the utilization form or derivative form of the phrase together with the first language phrase associated with the second language phrase A machine translation program for causing a computer to execute the fourth step.
前記第4のステップが、前記指定された語句が、前記第1の言語への対応づけで特定の語句である場合には機能しないことを特徴とする請求項10記載の機械翻訳プログラム。   The machine translation program according to claim 10, wherein the fourth step does not function when the designated phrase is a specific phrase in association with the first language. 翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1の手段と、
前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2の手段と、
前記対応づけがされた第1言語の語句がそれぞれ複合語であるか否かを判断する第3の手段と、
前記判断により複合語ではないとされた語句同士、前記判断により複合語であるとされた語句同士、または前記判断により複合語ではないとされた語句と前記判断により複合語であるとされた語句とを比較する第4の手段と、
前記語句の比較対において、少なくとも部分的に一致する語句を抽出する第5の手段と、
前記抽出された語句を含む前記対応づけによる第1言語の語句を、当該語句に対する前記対応づけられた訳語とともに表示する第6の手段と
を具備することを特徴とする機械翻訳装置。
First means for preparing a first language sentence to be translated and a translated second language sentence;
A second means for associating each translated word in the translated second language sentence with each phrase corresponding to the translated word in the first language sentence to be translated;
A third means for determining whether or not the phrase of the first language associated with each other is a compound word;
Phrases determined not to be compound words by the determination, phrases determined to be compound words by the determination, or phrases determined not to be compound words by the determination and phrases determined to be compound words by the determination A fourth means for comparing
Fifth means for extracting at least partially matching phrases in the phrase comparison pair;
A machine translation apparatus comprising: a sixth means for displaying a phrase in the first language by the association including the extracted phrase together with the translated word corresponding to the phrase.
前記判断により複合語であるとされた語句について、複合語を分割する手段と、
前記分割された語句それぞれおよび前記判断により複合語でないとされた語句を原形の語句に変換して原形の単語列を得る手段とをさらに具備し、
前記第4の手段が、前記得られた原形の単語列を、前記判断により複合語であるとされた語句または前記判断により複合語ではないとされた語句に代えて用い、
前記第6の手段が、前記抽出された語句の活用種の語句を含む前記対応づけによる第1言語の語句を、当該語句に対する前記対応づけられた訳語とともに表示するものであること
を特徴とする請求項12記載の機械翻訳装置。
Means for dividing the compound word with respect to the phrase determined to be a compound word by the determination;
Means for converting each of the divided phrases and the phrase determined not to be a compound word by the determination into an original word phrase to obtain an original word string;
The fourth means uses the obtained original word string in place of the phrase determined to be a compound word by the determination or the phrase determined not to be a compound word by the determination,
The sixth means is characterized in that the phrase in the first language by the correspondence including the phrase of the utilization type of the extracted phrase is displayed together with the corresponding translated word for the phrase. The machine translation apparatus according to claim 12.
前記判断により複合語であるとされた語句について、複合語を分割する手段と、
前記分割された語句それぞれおよび前記判断により複合語でないとされた語句を派生前の語句に変換して派生前単語列を得る手段とをさらに具備し、
前記第4の手段が、前記得られた派生前単語列を、前記判断により複合語であるとされた語句または前記判断により複合語ではないとされた語句に代えて用い、
前記第6の手段が、前記抽出された語句の派生形の語句を含む前記対応づけによる第1言語の語句を、当該語句に対する前記対応づけられた訳語とともに表示するものであること
を特徴とする請求項12記載の機械翻訳装置。
Means for dividing a compound word with respect to a phrase determined to be a compound word by the determination;
Means for converting each of the divided words and a word that is determined not to be a compound word by the determination into a word before derivation to obtain a word string before derivation;
The fourth means uses the obtained pre-derivation word string in place of the phrase determined to be a compound word by the determination or the phrase determined not to be a compound word by the determination,
The sixth means is characterized by displaying a phrase in the first language by the association including a phrase derived from the extracted phrase together with the associated translation for the phrase. The machine translation apparatus according to claim 12.
前記翻訳された第2言語の文における訳語それぞれについて、訳語のタイプを取得する手段をさらに具備し、
前記第3の手段が、前記対応づけがされた第1言語の語句に対応する第2言語の訳語が前記取得された訳語のタイプにおいて特定の訳語のタイプになっているときのみ、それぞれ複合語であるか否かをそれぞれ判断するものであること
を特徴とする請求項12記載の機械翻訳装置。
For each translation in the translated second language sentence, further comprising means for obtaining a translation type,
Each of the third means is a compound word only when the translation of the second language corresponding to the word / phrase of the associated first language is a specific translation type in the acquired translation type. The machine translation device according to claim 12, wherein each of the machine translation devices determines whether or not.
前記特定の訳語のタイプが、音訳、一対一対応訳、部分対応訳、または説明調であることを特徴とする請求項15記載の機械翻訳装置。   16. The machine translation apparatus according to claim 15, wherein the type of the specific translation word is a transliteration, a one-to-one correspondence translation, a partial correspondence translation, or an explanatory tone. 前記第6の手段が、当該第1言語の語句および当該第1言語の語句に対する前記対応づけられた訳語とともに、当該第1言語の語句が用いられた文を表示するものであることを特徴とする請求項12記載の機械翻訳装置。   The sixth means displays a sentence in which the phrase of the first language is used together with the phrase of the first language and the associated translation for the phrase of the first language. The machine translation apparatus according to claim 12. 当該第1言語の語句が用いられた文の前記表示が、当該第1言語の語句がキーワードであることの表示を含むことを特徴とする請求項17記載の機械翻訳装置。   18. The machine translation device according to claim 17, wherein the display of the sentence using the phrase in the first language includes an indication that the phrase in the first language is a keyword. 翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1の手段と、
前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2の手段と、
前記翻訳すべき第1言語の文について任意の語句の指定をユーザに促す第3の手段と、
前記指定された語句を含むまたは当該語句の活用形もしくは派生形の語句を含む前記対応づけによる第1言語の語句を、当該第1言語の語句に対応づけられた前記訳語とともに表示する第4の手段と
を具備することを特徴とする機械翻訳装置。
First means for preparing a first language sentence to be translated and a translated second language sentence;
A second means for associating each translated word in the translated second language sentence with each phrase corresponding to the translated word in the first language sentence to be translated;
Third means for prompting the user to specify an arbitrary phrase for the sentence in the first language to be translated;
Displaying a word in the first language by the correspondence including the designated word or phrase, or a phrase in a utilization form or a derivative of the word, together with the translated word associated with the word in the first language And a machine translation device.
前記第4の手段が、前記指定された語句が、前記訳語において特定の訳である場合には機能しないことを特徴とする請求項19記載の機械翻訳装置。   20. The machine translation apparatus according to claim 19, wherein the fourth means does not function when the designated phrase is a specific translation in the translated word. 翻訳すべき第1言語の文と翻訳された第2言語の文とを準備する第1の手段と、
前記翻訳された第2言語の文における訳語それぞれと、前記翻訳すべき第1言語の文における前記訳語に相当する語句それぞれとを対応づける第2の手段と、
前記翻訳された第2言語の文について任意の語句の指定をユーザに促す第3の手段と、
前記指定された語句を含むまたは当該語句の活用種もしくは派生種の語句を含む前記対応づけによる第2言語の語句を、当該第2言語の語句に対応づけられた前記第1言語の語句とともに表示する第4の手段と
を具備することを特徴とする機械翻訳装置。
First means for preparing a first language sentence to be translated and a translated second language sentence;
A second means for associating each translated word in the translated second language sentence with each phrase corresponding to the translated word in the first language sentence to be translated;
A third means for prompting the user to specify an arbitrary phrase for the translated second language sentence;
Displaying the second language phrase by the correspondence including the specified word or phrase utilizing or deriving from the phrase together with the first language phrase associated with the second language phrase A machine translation apparatus comprising: a fourth means configured to:
前記第4の手段が、前記指定された語句が、前記第1の言語への対応づけで特定の語句である場合には機能しないことを特徴とする請求項21記載の機械翻訳装置。   The machine translation apparatus according to claim 21, wherein the fourth means does not function when the designated word / phrase is a specific word / phrase associated with the first language.
JP2005060582A 2005-03-04 2005-03-04 Machine translation program, machine translation device Active JP4016037B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005060582A JP4016037B2 (en) 2005-03-04 2005-03-04 Machine translation program, machine translation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005060582A JP4016037B2 (en) 2005-03-04 2005-03-04 Machine translation program, machine translation device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007213438A Division JP4198737B2 (en) 2007-08-20 2007-08-20 Machine translation program, machine translation device

Publications (2)

Publication Number Publication Date
JP2006244236A true JP2006244236A (en) 2006-09-14
JP4016037B2 JP4016037B2 (en) 2007-12-05

Family

ID=37050583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005060582A Active JP4016037B2 (en) 2005-03-04 2005-03-04 Machine translation program, machine translation device

Country Status (1)

Country Link
JP (1) JP4016037B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932233A (en) * 2017-05-23 2018-12-04 松下知识产权经营株式会社 Literary generation method is translated, literary generating means are translated and translates text and generates program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932233A (en) * 2017-05-23 2018-12-04 松下知识产权经营株式会社 Literary generation method is translated, literary generating means are translated and translates text and generates program
CN108932233B (en) * 2017-05-23 2024-01-09 松下知识产权经营株式会社 Translation document generation method, translation document generation device, and translation document generation program

Also Published As

Publication number Publication date
JP4016037B2 (en) 2007-12-05

Similar Documents

Publication Publication Date Title
US8041557B2 (en) Word translation device, translation method, and computer readable medium
JPH1011447A (en) Translation method and system based upon pattern
KR100530154B1 (en) Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system
US8655641B2 (en) Machine translation apparatus and non-transitory computer readable medium
GB2417103A (en) Natural language translation system
US8219381B2 (en) Dictionary registration apparatus, dictionary registration method, and computer product
JPS6140673A (en) Method and machine for translation for foreign language composition
JP2017199363A (en) Machine translation device and computer program for machine translation
Wu et al. Learning to find English to Chinese transliterations on the web
CN104331397B (en) A kind of machine translation method and system
JP4198737B2 (en) Machine translation program, machine translation device
JP4016037B2 (en) Machine translation program, machine translation device
JP2006201873A (en) Device for automatically extracting unregistered word and program, and device for automatically registering unregistered word and program
JP5185343B2 (en) Machine translation apparatus and machine translation program
JP4843596B2 (en) Machine translation apparatus and machine translation program
JP5148583B2 (en) Machine translation apparatus, method and program
WO2009144890A1 (en) Pre-translation rephrasing rule generating system
Seretan et al. Tools for syntactic concordancing
JP4881399B2 (en) Bilingual information creation device, machine translation device, and program
Amtrup et al. Rapid development of translation tools
JP2005267117A (en) Machine translation program, machine translation method, and machine translation system
JP2004264960A (en) Example-based sentence translation device and computer program
WO2008123081A1 (en) Character data processing method, computer program, and character data processing system
JP6221339B2 (en) Translation apparatus and translation method
JP3014746B2 (en) Machine translation equipment

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070619

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070914

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100921

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4016037

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100921

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110921

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120921

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120921

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130921

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350