JPH11238062A - Machine translating method/device and machine-readable medium to record program - Google Patents

Machine translating method/device and machine-readable medium to record program

Info

Publication number
JPH11238062A
JPH11238062A JP10055923A JP5592398A JPH11238062A JP H11238062 A JPH11238062 A JP H11238062A JP 10055923 A JP10055923 A JP 10055923A JP 5592398 A JP5592398 A JP 5592398A JP H11238062 A JPH11238062 A JP H11238062A
Authority
JP
Japan
Prior art keywords
word
acronym
original
translated
input sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10055923A
Other languages
Japanese (ja)
Inventor
Kiyoshi Yamahata
潔 山端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10055923A priority Critical patent/JPH11238062A/en
Publication of JPH11238062A publication Critical patent/JPH11238062A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To permit a user to easily judge what a head word means even if the head word is not registered in a machine translation device. SOLUTION: A head word recognition part 4 recognizes a head word appearing in an input sentence being a translation object. An original word retrieval part 5 retrieves the word of a full spelling, which corresponds to the head word, from the input sentence, sets the retrieved word of the full spelling and the head word as a group and stores it in a retrieval result storage part 6. A translation part 2 not only translates the word of the full spelling which corresponds to the head word in the input sentence, but inserts the spelling of the word of the full spelling into a translated sentence by associating the word with its translation.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、機械翻訳技術に関
し、特に、頭字語(acronym) が意味するところをユーザ
が容易に理解できるようにする機械翻訳技術に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation technology, and more particularly, to a machine translation technology that enables a user to easily understand what an acronym (acronym) means.

【0002】[0002]

【従来の技術】英語等のアルファベットで表記される言
語では、複合語を、構成単語の頭文字を並べた頭字語と
して略記することが多い。Read Only Memory(読み出し
専用メモリ)をROMと略記したり、Information Retr
ieval (情報検索)をIRと略記するのはその一例であ
る。
2. Description of the Related Art In a language represented by an alphabet such as English, a compound word is often abbreviated as an acronym in which initials of constituent words are arranged. Read Only Memory is abbreviated as ROM or Information Retr.
IEval (information search) is abbreviated as IR, for example.

【0003】翻訳の際に、このような頭字語を原文表記
のまま訳出すると、その意味をあらかじめ了解している
一部のユーザ以外には、頭字語が何を意味しているのか
了解できない結果となる。従来の機械翻訳システムで
は、このような頭字語は、翻訳用辞書に登録しておき、
必要に応じてフルスペルで訳出することでこの課題に対
処していた。例えば、特開平5−282358号公報に
は、略語とそのフルスペルの訳語を対訳辞書に登録して
おき、略語を略語のまま訳出するか、フルスペルの訳で
訳出するかをユーザが指示できる機械翻訳装置が示され
ている。例えば、対訳辞書で、見出し語「OS」に対す
る訳語記述が「OS、オペレーティングシステム」とな
っている場合、ユーザの指示に従って、原文中の“O
S”をいう単語を、「OS」として訳出したり、「オペ
レーティングシステム」として訳出したりすることがで
きる。
When such an acronym is translated in its original form at the time of translation, a result cannot be understood by some users who understand the meaning in advance except what the acronym means. Becomes In conventional machine translation systems, such acronyms are registered in a translation dictionary,
This issue was addressed by translating full spells as needed. For example, Japanese Patent Application Laid-Open No. 5-282358 discloses a machine translation system in which an abbreviation and its full spelling are registered in a bilingual dictionary, and a user can specify whether to translate the abbreviation as an abbreviation or to translate it with a full spelling. The device is shown. For example, in the bilingual dictionary, when the translated word description for the headword “OS” is “OS, operating system”, “O
The word "S" can be translated as "OS" or as "operating system".

【0004】[0004]

【発明が解決しようとする課題】上述した従来技術に
は、頭字語とその訳が対訳辞書に登録されていなければ
ならないという制限があった。頭字語が対訳辞書の見出
しにない場合、一般の辞書未登録語の処理が行われるの
で、頭字語は原語綴りのまま、すなわち頭字語のまま訳
出される。予備知識を持ち合わせていないユーザは、そ
の頭字語が何を意味するのか、意味や文脈知識を用いて
推測するという困難な仕事をしなければならない。例え
ば、従来技術の機械翻訳システムで図20に示す以下の
英文(原文)を翻訳すると、その次に示した結果(訳
例)が得られるであろう。但し、頭字語"FAA" と"NTSB"
は、対訳辞書には登録されていないものとする。以下
は、図20からの引用である。
The prior art described above has a limitation that acronyms and their translations must be registered in a bilingual dictionary. If the acronym is not included in the heading of the bilingual dictionary, a general dictionary unregistered word is processed, so the acronym is translated as it is in the original language, that is, as an acronym. Users who do not have prior knowledge have to do the difficult task of guessing what the acronym means using meaning and contextual knowledge. For example, if the following English sentence (original sentence) shown in FIG. 20 is translated by a conventional machine translation system, the following result (translation example) will be obtained. However, the acronyms "FAA" and "NTSB"
Is not registered in the bilingual dictionary. The following is a quotation from FIG.

【0005】原文)The Federal Aviation Administrat
ion ordered an immediate change in fuel pumps and
the wiring.Although the director of the FAA's airc
raft certification service said there is no eviden
ce,the agency believed it was important to make th
e changes.The National Transportation Safety Board
hasconcluded that the flight was destroyed when t
he center wing tank ignited.The NTSB has not recom
mended the changes announced Wednesday.In fact,it
has been pushing for a far more ambitious action.
[0005] The Federal Aviation Administrat
ion ordered an immediate change in fuel pumps and
the wiring.Allow the director of the FAA's airc
raft certification service said there is no eviden
ce, the agency believed it was important to make th
e changes.The National Transportation Safety Board
hasconcluded that the flight was destroyed when t
he center wing tank ignited.The NTSB has not recom
mended the changes announced Wednesday.In fact, it
has been pushing for a far more ambitious action.

【0006】訳例)連邦航空局はポンプと配線における
即時の変更を命令した。FAA の航空機証明サービスのデ
ィレクターは証拠はないと言ったが、エージェンシーは
変更することが重要だと信じている。国家運輸安全ボー
ドはフライトは中央翼タンクが発火した時に破壊された
と結論づけた。NTSBは水曜にアナウンスされた変更を推
奨していない。実は、それはさらに野心的な行動を要求
している。
[0006] The Federal Aviation Administration ordered immediate changes in pumps and wiring. The director of the FAA's aircraft certification service said there was no evidence, but the agency believes it is important to change. The National Transportation Safety Board concluded that the flight was destroyed when the central wing tank ignited. The NTSB does not recommend changes announced on Wednesday. In fact, it calls for more ambitious behavior.

【0007】この訳例では、"FAA" や"NTSB"という頭字
語に始めて接するユーザは、これが何を指すのか、訳文
から理解することは難しい。実際には、"FAA" は連邦航
空局と訳されたFederal Aviation Administration の頭
字語であり、"NTSB"は国家運輸安全委員会(訳文中では
「国家運輸安全ボード」と訳されている)の頭字語であ
るが、ユーザに何らかの予備知識がない限り、これらの
語の対応関係を確実性を持って認識することは難しい。
In this translation, it is difficult for a user who first comes into contact with the acronyms "FAA" and "NTSB" to understand what this means from the translation. In practice, "FAA" is the acronym for Federal Aviation Administration, translated as Federal Aviation Administration, and "NTSB" is the National Transport Safety Board (translated as "National Transport Safety Board"). Although they are acronyms, it is difficult to reliably recognize the correspondence between these words unless the user has some prior knowledge.

【0008】頭字語の数が少なければ、全てを辞書登録
すれば良い。しかし、頭字語は、しばしば、新しい技術
分野に伴うテクニカルターム、規格や組織名などを表す
ために用いられる。そのため、頭字語は、これら技術や
組織の変遷とともに新しく作られたり消えたり、新陳代
謝が非常に激しく、辞書登録により全てに対処するのは
実質的に無理である。頭字語は、新技術のキーテクノロ
ジや新組織等を表す重要キーワードであることが多いた
め、これが何の略なのかを判断しやすいようにユーザに
示すことはきわめて重要である。
If the number of acronyms is small, all of them need to be registered in a dictionary. However, acronyms are often used to indicate technical terms, standards, organization names, etc. associated with new technical fields. Therefore, acronyms are newly created or disappear with the change of these technologies and organizations, and the metabolism is very intense, and it is virtually impossible to deal with all by dictionary registration. Since the acronym is often an important keyword that represents a key technology of a new technology, a new organization, and the like, it is extremely important that the acronym is indicated to the user so that it is easy to determine what it stands for.

【0009】以上説明したように、従来技術の機械翻訳
装置には、辞書登録されていない頭字語が原文中にある
場合、それが何を意味するのかをユーザが訳文から判断
するのが困難であるという問題がある。
As described above, in the prior art machine translation apparatus, when an acronym not registered in the dictionary is present in the original text, it is difficult for the user to determine what that means from the translated text. There is a problem that there is.

【0010】そこで、本発明の目的は、上述した従来技
術の問題点を解決するために、辞書登録されていない頭
字語に対しても、その意味するところをユーザが理解し
やすい形で出力するようにすることにある。
Therefore, an object of the present invention is to output an acronym not registered in a dictionary in a form that is easy for a user to understand, even in the case of an acronym that is not registered in a dictionary. Is to do so.

【0011】[0011]

【課題を解決するための手段】上述した従来技術の問題
点を解決するため、本発明の機械翻訳方法は、翻訳対象
の入力文中に存在する頭字語を認定する頭字語認定処理
と、該頭字語認定処理で認定した頭字語と対応するフル
スペルの語を、前記入力文中から検索する原単語検索処
理と、前記入力文に対する訳文を生成する際、前記原単
語検索処理で検索されたフルスペルの語の原語綴りを、
その語の訳語と関連付けて出力する翻訳処理とを含んで
いる。
In order to solve the above-mentioned problems of the prior art, a machine translation method according to the present invention uses an acronym recognition process for determining an acronym existing in an input sentence to be translated, and an acronym recognition process. An original word search process for searching the input sentence for a full spelling word corresponding to the acronym recognized in the word recognition process, and a full spelling word searched for in the original word search process when generating a translated sentence for the input sentence The original spelling of
And a translation process for outputting the word in association with the translation of the word.

【0012】また、上述した従来技術の問題点を解決す
るため、本発明の機械翻訳装置は、翻訳対象の入力文中
に存在する頭字語を認定する頭字語認定部と、該頭字語
認定部で認定した頭字語と対応するフルスペルの語を、
前記入力文中から検索する原単語検索部と、前記入力文
に対する訳文を生成する際、前記原単語検索部で検索さ
れたフルスペルの語の原語綴りを、その語の訳語と関連
付けて出力する翻訳部とを備えている。
Further, in order to solve the above-mentioned problem of the prior art, the machine translation apparatus of the present invention comprises an acronym recognition section for certifying an acronym present in an input sentence to be translated, and an acronym recognition section for locating the acronym. Full-spelled words that correspond to certified acronyms,
An original word search unit that searches from the input sentence, and a translation unit that, when generating a translated sentence for the input sentence, outputs the original spelling of the full spelled word searched by the original word search unit in association with the translated word of the word And

【0013】この構成においては、入力文中に現れる頭
字語を、頭字語認定部が認定し、これに対応するフルス
ペルの単語が入力文中に現れているか否かを原単語検索
部がチェックする。そして、フルスペルの単語が現れて
いる場合、これを単に翻訳するだけでなく、原語のフル
スペルの綴り自体をも出力する。ユーザは、この原語の
フルスペルを見ることにより、頭字語が何の略であり、
どのような訳語に翻訳されたのかを、一目で了解するこ
とができる。
In this configuration, an acronym appearing in an input sentence is recognized by an acronym recognition unit, and an original word search unit checks whether a corresponding full-spelled word appears in the input sentence. When a full-spelled word appears, it not only translates it but also outputs the full-spelled spelling of the original language. By looking at the full spelling of this source word, the user can see what the acronym stands for,
You can see at a glance what translation was translated.

【0014】図13の例で説明する。ここでは、原文中
に頭字語"FAA" が現れている。これが頭字語であること
が、頭字語認定部で認定されたとしよう。一方、"Feder
al Aviation Administration" という単語が別の場所に
現れている。後者が前者に対応するフルスペルの単語で
ある可能性が高いことは、後者の各単語の先頭文字が大
文字であること、これらの先頭文字を並べると前者にな
ること、などの手がかりから容易に判断することができ
るので、原単語検索部がそのように判断する。尚、この
判断方法は、種々考えられるが、事前に辞書登録する必
要のない方法であればどのような方法であっても良い。
さて、このように判断した場合、本発明では、フルスペ
ルの単語を単に訳出するだけでなく、同時に原語でのフ
ルスペルをも訳文中に含めて訳文を作る。この例では、
フルスペルの原語綴りを訳語の直後に括弧で囲んで出力
するものとする。更に、"NTSB"と"National Transporta
tion Safety Board"についても同様の判断と処理を行
い、例えば、図13(b)に示す訳文が得られる。以下
は、図13(b)から引用した。
An example will be described with reference to FIG. Here, the acronym "FAA" appears in the original text. Suppose that this is an acronym, which has been certified by the Acronym Certification Department. On the other hand, "Feder
al Aviation Administration "appears elsewhere. It is likely that the latter is the full-spelling word corresponding to the former, because the first letter of each latter word is capitalized, and Can be easily determined based on clues such as the former being arranged, and so on. The original word search unit makes such a determination. Various determination methods are conceivable, but it is necessary to register in a dictionary in advance. Any method may be used as long as there is no method.
When the above determination is made, in the present invention, not only the full spelling word is translated but also the full spelling in the original language is included in the translation to create a translation. In this example,
The full spelled original spelling is output in parentheses immediately after the translated word. "NTSB" and "National Transporta"
The same determination and processing are performed for the "Action Safety Board" to obtain, for example, the translation shown in FIG. 13B. The following is quoted from FIG. 13B.

【0015】連邦航空局(Federal Aviation Administra
tion) はポンプと配線における即時の変更を命令した。
FAA の航空機証明サービスのディレクターは証拠はない
と言ったが、エージェンシーは変更することが重要だと
信じている。国家運輸安全ボード(National Transporta
tion Safety Board)はフライトは中央翼タンクが発火し
た時に破壊されたと結論づけた。NTSBは水曜にアナウン
スされた変更を推奨していない。実は、それはさらに野
心的な行動を要求している。
[0015] Federal Aviation Administra
option) ordered immediate changes in pumps and wiring.
The director of the FAA's aircraft certification service said there was no evidence, but the agency believes it is important to change. National Transporta Board
The Action Safety Board concluded that the flight was destroyed when the central wing tank ignited. The NTSB does not recommend changes announced on Wednesday. In fact, it calls for more ambitious behavior.

【0016】この訳文から"FAA" が「連邦航空局」とし
て訳出された単語(Federal Aviation Administration)
の頭字語であること、および"NTSB"が「国家運輸安全ボ
ード」として訳出された単語(National Transportation
Safety Board)に対応することが明らかであり、予備知
識を持たないユーザでも容易に頭字語を理解できるもの
となっている。
[0016] From this translation, the word "FAA" translated as "Federal Aviation Administration" (Federal Aviation Administration)
Acronym for "NTSB" and the word "NTSB" translated as "National Transportation Safety Board"
It is clear that the acronym corresponds to the Safety Board, and users without prior knowledge can easily understand the acronym.

【0017】ここで、システムは、訳語と原語フルスペ
ルとを関連付けて示すことで、あくまで手がかりを与え
ているに過ぎないことに注意してほしい。これらの対応
関係を判断するのは、あくまでユーザである。このた
め、システムが、頭字語と対応するフルスペルの語の対
応関係を誤って認定しても、余分な語に対応するフルス
ペルが示されるだけで、訳文自体に誤りをもたらすこと
はない。この頑健性は本発明の特徴的な効果の一つであ
る。
Here, it should be noted that the system merely gives clues by indicating the translated word and the original full spell in association with each other. It is up to the user to determine these correspondences. For this reason, even if the system incorrectly recognizes the correspondence between the acronym and the corresponding full spelling word, only the full spelling corresponding to the extra word is indicated, without causing an error in the translation itself. This robustness is one of the characteristic effects of the present invention.

【0018】一般に、頭字語の意味が分かりにくいのは
翻訳に特有の問題ではない。原文を直接読む場合におい
ても、いきなり頭字語が出てくれば、一部の読者を除き
その意味を了解できないのは当然である。従って、新聞
や雑誌など不特定多数の読者を相手とする記事では、頭
字語を使う場合、それが何の略かをユーザに分かりやす
く示すのが慣習となっている。例えば、記事中最初に現
れたところではフルスペルを用い、2回目以降から頭字
語を用いるようにするとか、あるいは、最初から頭字語
を用いるが、最初に現れたところで同格や括弧でフルス
ペルを併記してあるのが普通である。このように配慮し
てあるので、原文の読者は、頭字語の意味を容易に了解
できるのである。ところが、一旦これを別言語に翻訳し
てしまうと、このような配慮が無意味になってしまう。
フルスペルの単語自身が訳されて、綴りの情報を失うた
め、頭字語との対応関係が了解できなくなってしまうの
である。本発明の機械翻訳装置は、このような配慮をも
って書かれた原文に対しては、頭字語に対応するフルス
ペルの単語を訳出する際に原語での綴りも訳文中に含め
ることにより、フルスペルと頭字語との対応関係を、原
文のみならず訳文からも、読者が容易に汲み取れるよう
にするものである。
In general, it is not a problem specific to translation that the meaning of an acronym is difficult to understand. Even when reading the original text directly, if the acronym suddenly appears, it is natural that the meaning can not be understood except for some readers. Therefore, when articles such as newspapers and magazines are intended for an unspecified number of readers, it is customary to show the user abbreviations when using acronyms. For example, use the full spelling at the first appearance in the article and use the acronym from the second time onward, or use the acronym from the beginning, but write the full spelling with the same case or parentheses at the first occurrence. It is normal that there is. With this in mind, the reader of the original text can easily understand the meaning of the acronym. However, once this is translated into another language, such considerations become meaningless.
Because the full spelling words themselves are translated and lose spelling information, the correspondence with the acronyms cannot be understood. The machine translator according to the present invention, when translating a full spelling word corresponding to an acronym for an original sentence written with such considerations, also includes the spelling in the original language in the translation, so that the full spelling and acronym It is intended to make it easy for readers to find correspondences between words not only in the original text but also in the translated text.

【0019】また、本発明の機械翻訳装置は、きわめて
一般的な頭字語に対するフルスペルが訳文中に挿入され
て訳文が見にくくなることを防ぐと共に、翻訳処理に要
する時間を短くするため、前記頭字語認定部は、頭字語
となるための条件が格納された頭字語パターン格納部
と、頭字語として扱わない方が良い単語が格納されて頭
字語抑制リストと、前記頭字語パターン格納部に格納さ
れている条件を満たし、且つ前記頭字語抑制リストに格
納されていない単語を頭字語と認定する頭字語パターン
適用エンジンとを備えている。
Further, the machine translation apparatus of the present invention prevents the full spelling of a very common acronym from being inserted into a translation and makes it difficult to see the translation, and shortens the time required for the translation process. The certification unit stores an acronym pattern storage unit in which conditions for being an acronym are stored, an acronym suppression list in which words that should not be treated as acronyms are stored, and is stored in the acronym pattern storage unit. An acronym pattern application engine that satisfies the conditions described above and that recognizes words that are not stored in the acronym suppression list as acronyms.

【0020】この構成においては、頭字語パターン格納
部に格納されている条件を満たす単語であっても、頭字
語抑制リストに格納されている単語は、頭字語と認定さ
れない。従って、頭字語抑制リストにきわめて一般的な
“USA”,“TV”等の単語を格納しておくことによ
り、それらが原文中に現れ、且つ原文中にそれらに対応
するフルスペルの語が現れた場合でも、訳文中にフルス
ペルが挿入され、訳文が見にくくなることはない。更
に、“USA”,“TV”等については、フルスペルの
検索処理が行われなくなるので、翻訳処理に要する時間
を短くすることができる。
In this configuration, even if the word satisfies the condition stored in the acronym pattern storage, the word stored in the acronym suppression list is not recognized as an acronym. Therefore, by storing words such as "USA" and "TV" which are very common in the acronym suppression list, they appear in the original sentence, and the corresponding full-spelled words appear in the original sentence. Even in this case, the full spell is inserted in the translation, and the translation is not difficult to see. Further, for "USA", "TV", and the like, the full spelling search processing is not performed, so that the time required for the translation processing can be shortened.

【0021】また、本発明の機械翻訳装置は、既存の翻
訳部を使用できるようにするため、翻訳対象の入力文中
に存在する頭字語を認定する頭字語認定部と、該頭字語
認定部で認定した頭字語と対応するフルスペルの語を、
前記入力文中から検索する原単語検索部と、該原単語検
索部で検索されたフルスペルの語が、前記入力文の翻訳
時に、その語の訳語に関連して訳文中に挿入されるよう
に、前記入力文をプリエディットする入力文編集部と、
該入力文編集部でプリエディットされた後の入力文を翻
訳する翻訳部とを備えている。
Further, the machine translation apparatus of the present invention includes an acronym recognition section for certifying an acronym existing in an input sentence to be translated, and an acronym recognition section for using the existing translation section. Full-spelled words that correspond to certified acronyms,
An original word search unit to be searched from the input sentence, and a full spelled word searched by the original word search unit is inserted into a translation in association with a translation of the word when the input sentence is translated. An input sentence editing unit for pre-editing the input sentence,
A translation unit for translating the input sentence after being preedited by the input sentence editing unit.

【0022】この構成においては、原単語検索部で検索
されたフルスペルの語が、入力文の翻訳時に、その語の
訳語と関連して訳文中に挿入されるように、入力文編集
部が入力文をプリエディットする。
In this configuration, the input sentence editing unit inputs the full spelled word searched by the original word search unit so as to be inserted into the translated sentence in association with the translated word of the input sentence when the input sentence is translated. Pre-edit the statement.

【0023】[0023]

【発明の実施の形態】次に本発明の実施の形態について
図面を参照して詳細に説明する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0024】本発明の第1の実施の形態を図1に示す。
図1に示す本発明の第1の実施の形態は、翻訳対象とな
る原文が入力される入力部1と、入力文の翻訳を行う翻
訳部2と、翻訳結果を出力する出力部3と、入力文中に
現れる頭字語を認定する頭字語認定部4と、頭字語に対
応するフルスペルの単語を入力文中から探す原単語検索
部5と、頭字語に対応するフルスペル原単語を格納する
検索結果格納部6とから構成されている。尚、図1にお
いて、L12,L23,L24,L25,L46,L56,L62,L
65は通信線を示している。
FIG. 1 shows a first embodiment of the present invention.
The first embodiment of the present invention shown in FIG. 1 includes an input unit 1 for inputting an original sentence to be translated, a translation unit 2 for translating the input sentence, an output unit 3 for outputting a translation result, An acronym recognition unit 4 that recognizes an acronym appearing in the input sentence; an original word search unit 5 that searches for a full spelling word corresponding to the acronym from the input sentence; and a search result storage that stores the full spelling original word corresponding to the acronym. 6. In FIG. 1, L12, L23, L24, L25, L46, L56, L62, L
65 indicates a communication line.

【0025】この第1の実施の形態の動作について図
1,図2を参照して説明する。
The operation of the first embodiment will be described with reference to FIGS.

【0026】入力部1に原文が入力されると(図2のス
テップS1)、頭字語認定部4が、入力文中の頭字語を
検出・認定し、検索結果格納部6に格納する(ステップ
S2)。
When an original sentence is input to the input unit 1 (step S1 in FIG. 2), the acronym recognition unit 4 detects and recognizes an acronym in the input sentence and stores it in the search result storage unit 6 (step S2). ).

【0027】頭字語認定処理が終了し検出された全ての
頭字語が検索結果格納部6に格納されると、原単語検索
部5が起動され、入力文を対象として、各頭字語に対応
するフルスペルの単語列を検索する(ステップS3)。
検索結果として得られたフルスペルの単語列は、検索結
果格納部6に頭字語と対応付けられて格納される(ステ
ップS4)。
When the acronym recognition process is completed and all detected acronyms are stored in the search result storage unit 6, the original word search unit 5 is activated, and the input sentence is targeted for each acronym. A full spelling word string is searched (step S3).
The full spelling word string obtained as a search result is stored in the search result storage unit 6 in association with the acronym (step S4).

【0028】検索処理が終わると、翻訳部2において翻
訳が実行される(ステップS5)。翻訳処理では、検索
結果格納部6にフルスペルで格納されている単語列に対
しては、対応する訳語を生成するだけではなく、訳語の
直後に翻訳前の原語の綴りをも生成する。
When the search processing is completed, translation is performed in the translation unit 2 (step S5). In the translation process, for the word string stored in the search result storage unit 6 in full spelling, not only a corresponding translated word is generated, but also a spelling of the original word before translation is generated immediately after the translated word.

【0029】翻訳処理が終わると、出力部3より結果を
出力し(ステップS6)、全体の処理を終了する。
When the translation process ends, the result is output from the output unit 3 (step S6), and the entire process ends.

【0030】次に、本発明の第2の実施の形態について
説明する。図3を参照すると、本発明の第2の実施の形
態は、入力装置A1と、コンピュータから構成されるデ
ータ処理装置A2と、出力装置A3と、記憶装置A4
と、機械翻訳プログラムを記録した記録媒体A5とを備
える。記録媒体A5は、磁気ディスク,磁気テープ,半
導体メモリその他の記録媒体である。
Next, a second embodiment of the present invention will be described. Referring to FIG. 3, a second embodiment of the present invention is directed to an input device A1, a data processing device A2 including a computer, an output device A3, and a storage device A4.
And a recording medium A5 on which a machine translation program is recorded. The recording medium A5 is a magnetic disk, a magnetic tape, a semiconductor memory, or another recording medium.

【0031】機械翻訳プログラムは、記録媒体A5から
データ処理装置A2に読み込まれ、データ処理装置A2
の動作を制御する。データ処理装置A2は、機械翻訳プ
ログラムの制御により以下の処理を行う。
The machine translation program is read from the recording medium A5 into the data processing device A2, and is read from the data processing device A2.
Control the operation of. The data processing device A2 performs the following processing under the control of the machine translation program.

【0032】入力装置A1から入力文が与えられると、
記憶装置A4内の頭字語認定部4が入力文中の頭字語を
検出・認定し、記憶装置A4内の検索結果格納部6に格
納する。
When an input sentence is given from the input device A1,
The acronym recognition unit 4 in the storage device A4 detects and recognizes the acronym in the input sentence, and stores it in the search result storage unit 6 in the storage device A4.

【0033】頭字語認定処理が終了し検出された全ての
頭字語が記憶装置A4内の検索結果格納部6に格納され
ると、記憶装置A4内の原単語検索部5が起動され、入
力文を対象として、各頭字語に対応するフルスペルの単
語列を検索する。検索結果として得られたフルスペルの
単語列は、検索結果格納部6に頭字語と対応付けられて
格納される。
When the acronym recognition process is completed and all the detected acronyms are stored in the search result storage unit 6 in the storage device A4, the original word search unit 5 in the storage device A4 is activated and the input sentence is input. Search for a full-spelled word string corresponding to each acronym. The full spelling word string obtained as a search result is stored in the search result storage unit 6 in association with the acronym.

【0034】検索処理が終わると、記憶装置A4内の翻
訳部2が起動される。翻訳処理では、検索結果格納部6
にフルスペルで格納されている単語列に対しては、対応
する訳語を生成するだけでなく、訳語の直後に翻訳前の
原語での綴りをも生成する。
When the search processing is completed, the translation unit 2 in the storage device A4 is started. In the translation process, the search result storage unit 6
For a word string stored in full spelling, a corresponding translated word is generated, and immediately after the translated word, a spelling in the original word before translation is generated.

【0035】翻訳処理が終わると、翻訳結果が出力装置
A3から出力され、入力文の翻訳処理が終了する。
When the translation process ends, the translation result is output from the output device A3, and the translation process of the input sentence ends.

【0036】[0036]

【実施例】次に本発明の実施例について図面を参照して
説明する。図4に示す本発明の第1の実施例は、英日機
械翻訳システムとして実現されており、英語原文入力を
受け付ける入力部1と、入力部1から入力された全入力
文を一旦格納する入力文バッファ7と、翻訳部2と、出
力部3と、入力文バッファ7から頭字語を検索し認定す
る頭字語認定部4と、入力文バッファ7から頭字語に対
応するフルスペル単語列を検索する原単語検索部5と、
検索された頭字語やフルスペル単語列を互いに対応付け
て格納する検索結果格納部6とを有して構成されてい
る。
Next, an embodiment of the present invention will be described with reference to the drawings. The first embodiment of the present invention shown in FIG. 4 is realized as an English-Japanese machine translation system, and has an input unit 1 for receiving an English original sentence input, and an input for temporarily storing all input sentences inputted from the input unit 1. A sentence buffer 7, a translation unit 2, an output unit 3, an acronym recognition unit 4 for searching and certifying an acronym from the input sentence buffer 7, and a full spelling word string corresponding to the acronym from the input sentence buffer 7 is searched. An original word search unit 5;
A search result storage unit 6 stores the searched acronyms and full spelling word strings in association with each other.

【0037】更に、翻訳部2は、英日の単語対訳を格納
した英日対訳辞書24と、英日間の翻訳に必要な文法規
則等を格納した英日翻訳ルール25と、英日対訳辞書2
4を参照して英語形態素解析を行う英語形態素解析部2
1と、英日の構文変換により翻訳の主たる処理を受け持
つ英日構文変換部22と、日本語形態素の活用等を行い
最終的な訳文を生成する日本語形態素生成部23とを有
して構成されている。
The translation unit 2 further includes an English-Japanese bilingual dictionary 24 storing English-Japanese bilingual translations, an English-Japanese bilingual translation rule 25 storing grammatical rules required for English-Japanese translations, and an English-Japanese bilingual dictionary 2.
English morphological analyzer 2 that performs English morphological analysis with reference to 4
1 and an English-Japanese syntax conversion unit 22 responsible for the main processing of translation by English-Japanese syntax conversion, and a Japanese morpheme generation unit 23 for utilizing Japanese morphemes and generating a final translated sentence Have been.

【0038】次に本実施例の動作について、詳細に説明
する。
Next, the operation of this embodiment will be described in detail.

【0039】図5は本実施例の動作例を表す流れ図であ
る。先ず、入力部1から原文が入力される(ステップS
1)。その際、本実施例では、全入力文が通信線L17を
介して入力文バッファ7に一旦格納される。
FIG. 5 is a flowchart showing an operation example of this embodiment. First, an original sentence is input from the input unit 1 (step S
1). At this time, in this embodiment, all input sentences are temporarily stored in the input sentence buffer 7 via the communication line L17.

【0040】次に、頭字語認定部4が起動される。これ
により、頭字語認定部4は、通信線L74を介して入力文
バッファ7に格納されている原文中の頭字語を検索・認
定し、通信線L46を介して検索結果格納部6に頭字語を
格納する(ステップS2)。
Next, the acronym recognition unit 4 is activated. Thus, the acronym recognition unit 4 searches and recognizes the acronym in the original sentence stored in the input sentence buffer 7 via the communication line L74, and stores the acronym in the search result storage unit 6 via the communication line L46. Is stored (step S2).

【0041】この処理が終わると、原単語検索部5が起
動される。これにより、原単語検索部5は、検索結果格
納部6に格納されている各頭字語を通信線L65を介して
読み込み、読み込んだ各頭字語それぞれについてのフル
スペルの単語列を、通信線L75を介して入力文バッファ
7中の原文を検索することにより探す(ステップS
3)。検索に成功した場合、選りすぐられたフルスペル
の原単語は頭字語と対応付けられ、通信線L56を介して
検索結果格納部6に格納される(ステップS4)。
When this process ends, the original word search section 5 is started. As a result, the original word search unit 5 reads each acronym stored in the search result storage unit 6 via the communication line L65, and stores a full spelling word string for each read acronym in the communication line L75. (Step S)
3). If the search is successful, the selected full spelling original word is associated with the acronym and stored in the search result storage unit 6 via the communication line L56 (step S4).

【0042】検索結果格納部6の全ての頭字語に対して
この処理が終わったら、翻訳部2が起動される(ステッ
プS5)。翻訳部2では、先ず、英語形態素解析部21
が通信線L72を介して入力文バッファ7から原文を入力
し、形態素解析を行う(ステップS51)。解析結果
は、通信線L2122を介して英日構文変換部22に送られ
る。これにより、英日構文変換部22は、英日対訳辞書
24と英日翻訳ルール25とを参照して英日の構文変換
を行い(ステップS52)、結果を通信線L2223を介し
て日本語形態素生成部23に送る。日本語形態素生成部
23では、日本語形態素生成処理や、訳文へのフルスペ
ルの挿入処理を行い(ステップS53)、訳文ができあ
がったら、出力部3より出力する(ステップS6)。
When this process is completed for all acronyms in the search result storage unit 6, the translation unit 2 is started (step S5). In the translation unit 2, first, the English morphological analysis unit 21
Inputs an original sentence from the input sentence buffer 7 via the communication line L72 and performs morphological analysis (step S51). The analysis result is sent to the English-Japanese syntax conversion unit 22 via the communication line L2122. Thereby, the English-Japanese syntax conversion unit 22 performs English-Japanese syntax conversion with reference to the English-Japanese bilingual dictionary 24 and the English-Japanese translation rule 25 (step S52), and transmits the result to the Japanese morpheme via the communication line L2223. It is sent to the generation unit 23. The Japanese morpheme generation unit 23 performs a Japanese morpheme generation process and a process of inserting a full spell into a translated sentence (step S53), and when the translated sentence is completed, outputs it from the output unit 3 (step S6).

【0043】次に、頭字語認定部4の構成と動作につい
て、図6〜図8を参照して詳細に説明する。
Next, the configuration and operation of the acronym recognition unit 4 will be described in detail with reference to FIGS.

【0044】図6に示すように、本実施例における頭字
語認定部4は、頭字語か否かをチェックする対象文字列
(単語)を格納している頭字語候補格納部41と、頭字
語となるための条件を正規表現として記述した頭字語パ
ターンを格納している頭字語パターン格納部42と、頭
字語パターン格納部42に格納されている条件は満たす
が、実際には頭字語ではない、或いは頭字語として扱わ
ない方が良い単語のリストを格納した頭字語抑制リスト
44と、頭字語候補格納部41に格納された単語に対し
て、頭字語パターン格納部42中の正規表現パターンを
適用してマッチングの可否を判断し、マッチングに成功
した場合は、更に上記単語が頭字語抑制リスト44中に
存在するか否かを判断することにより頭字語の認定を行
う頭字語パターン適用エンジン43とを有して構成され
ている。
As shown in FIG. 6, an acronym recognition unit 4 in this embodiment includes an acronym candidate storage unit 41 storing a character string (word) to be checked for an acronym, and an acronym candidate storage unit 41. The acronym pattern storage unit 42 storing an acronym pattern that describes a condition for becoming as a regular expression, and the condition stored in the acronym pattern storage unit 42 is satisfied, but is not actually an acronym Alternatively, for the words stored in the acronym candidate storage unit 41 and the acronym suppression list 44 that stores a list of words that should not be treated as acronyms, the regular expression pattern in the acronym pattern storage unit 42 is used. An acronym pattern for determining whether an acronym can be recognized by determining whether or not the word is present in the acronym suppression list 44 if the matching is successful. It is configured to include a use engine 43.

【0045】頭字語候補格納部41には、入力文バッフ
ァ7より通信線L74が伸びており、入力文バッファ7中
の単語が順次この通信線L74を介して送られてくる。ま
た、頭字語パターン適用エンジン43からは検索結果格
納部6へと通信線L46が伸びており、最終的に頭字語と
認定された単語は、この通信線L46を介して検索結果格
納部6に送られ格納される。
A communication line L74 extends from the input sentence buffer 7 to the acronym candidate storage unit 41, and the words in the input sentence buffer 7 are sequentially transmitted via the communication line L74. Further, a communication line L46 extends from the acronym pattern application engine 43 to the search result storage unit 6, and the word finally identified as an acronym is stored in the search result storage unit 6 via the communication line L46. Sent and stored.

【0046】図7は頭字語パターン格納部42の内容の
一部を示したものである。ここには、2つのパターンが
記述されているが、何れも表層文字列に対する正規表現
パターンである。第1のパターンは、英大文字1文字と
ピリオド1つの組が2回以上繰り返されている文字列と
マッチする。第2のパターンは、英大文字が2文字以上
繰り返すパターンとマッチする。
FIG. 7 shows a part of the contents of the acronym pattern storage section 42. Here, two patterns are described, both of which are regular expression patterns for the surface character string. The first pattern matches a character string in which a set of one uppercase letter and one period is repeated twice or more. The second pattern matches a pattern in which uppercase letters repeat two or more characters.

【0047】次にこれらの構成要素の動作について、図
8を参照して説明する。
Next, the operation of these components will be described with reference to FIG.

【0048】頭字語認定部4は、入力文バッファ7から
単語を1つずつ取得しながら、その単語が頭字語か否か
の判断処理を繰り返す(ステップS200)。全ての単
語に対して判断処理を行うと、全体処理を終了する。
The acronym recognition section 4 acquires words one by one from the input sentence buffer 7 and repeats the process of determining whether or not the word is an acronym (step S200). When the determination process is performed on all the words, the entire process ends.

【0049】先ず、通信線L74を介して入力文バッファ
7から取得した単語を頭字語候補格納部41に格納する
(ステップS201)。
First, the words acquired from the input sentence buffer 7 via the communication line L74 are stored in the acronym candidate storage section 41 (step S201).

【0050】次に、頭字語パターン適用エンジン43が
起動し、通信線L4143を介して取得した頭字語候補格納
部41中の単語と、通信線L4243を介して取得した頭字
語パターン格納部42に格納された頭字語パターンのマ
ッチングを行う(ステップS202)。頭字語パターン
適用エンジン43は、一般的な、文字列に対する正規表
現マッチャとして実現されている。
Next, the acronym pattern application engine 43 is started, and the words in the acronym candidate storage unit 41 obtained via the communication line L4143 and the acronym pattern storage unit 42 obtained via the communication line L4243 are stored in the acronym pattern storage unit 42. Matching of the stored acronym pattern is performed (step S202). The acronym pattern application engine 43 is realized as a general regular expression matcher for a character string.

【0051】マッチングに失敗すれば(ステップS20
3でNo)、単語は頭字語でないと見做し、次のループ
をスタートさせる。マッチングに成功すれば(ステップ
S203でYes)、単語を頭字語抑制リスト44の内
容と比較する(ステップS204)。
If the matching fails (step S20)
No in 3), the word is not considered an acronym, and the next loop is started. If the matching is successful (Yes in step S203), the word is compared with the contents of the acronym suppression list 44 (step S204).

【0052】頭字語抑制リスト44には、頭字語パター
ンにマッチしても処理を行いたくない単語、例えば、
“TV”のように略語ではあるが、現在は頭字語とは見
做せないような単語や、“USA”のようにきわめて一
般的なためフルスペルの原単語が存在してもあえてスペ
ルを示さない方が良いと思われる単語のリストが格納さ
れている。
In the acronym suppression list 44, words that do not want to be processed even if they match the acronym pattern, for example,
Words that are abbreviations such as “TV”, but cannot be considered as acronyms at present, or that are so common as “USA” that the full spelling of the original word exists, but spelling is indicated. Contains a list of words that would not be better.

【0053】比較の結果、頭字語抑制リスト44中の何
れかの単語と一致していれば(ステップS204でYe
s)、頭字語と見做さずに次の単語の処理を行うために
次の繰り返しを開始する。何れの単語とも一致していな
ければ(ステップS204でNo)、頭字語候補格納部
41中の単語を頭字語と認定し、通信線L46を介して検
索結果格納部6に送付し格納する(ステップS20
5)。その後、ステップS200の次の繰り返しに入
る。
As a result of the comparison, if it matches any of the words in the acronym suppression list 44 (Yes in step S204)
s) Start the next iteration to process the next word without considering it as an acronym. If it does not match any of the words (No in step S204), the word in the acronym candidate storage unit 41 is recognized as an acronym, and sent to the search result storage unit 6 via the communication line L46 and stored (step S204). S20
5). Thereafter, the process enters the next repetition of step S200.

【0054】図9は原単語検索部5の構成例を示したブ
ロック図である。同図に示すように、原単語検索部5
は、全体の制御を行う検索制御部51、検索キーとなる
頭字語を格納する頭字語バッファ52、マッチングの対
象となっている文を一時的に格納する文バッファ53、
マッチング処理の最中に頭字語バッファ52中のどの文
字に注目しているかを示している注目文字位置ポインタ
54、文バッファ53中の単語列のどの位置からマッチ
ングを始めたかを保持しておく注目単語開始位置ポイン
タ55、および現在注目対象となっている単語位置を保
持している注目単語現在位置ポインタ56を有して構成
される。
FIG. 9 is a block diagram showing an example of the configuration of the original word search section 5. As shown in FIG.
Is a search control unit 51 that performs overall control, an acronym buffer 52 that stores an acronym serving as a search key, a sentence buffer 53 that temporarily stores a sentence to be matched,
A focused character position pointer 54 indicating which character in the acronym buffer 52 is focused on during the matching process, and a focus which holds from which position in the word string in the sentence buffer 53 the matching is started. It is configured to include a word start position pointer 55 and an attention word current position pointer 56 which holds the word position of the current attention target.

【0055】頭字語バッファ52は、検索結果格納部6
より検索キーとする頭字語を受け取るための通信線L6
5と結ばれ、文バッファ53は、入力文を格納している
入力文バッファ7と通信回線L75で結ばれると共に、検
索されたフルスペルの原単語列を検索結果格納部6に送
付するための通信線L56を有する。
The acronym buffer 52 stores the search result storage 6
Communication line L6 for receiving an acronym as a search key
5, the sentence buffer 53 is connected to the input sentence buffer 7 storing the input sentence via the communication line L75, and transmits the searched full spelling original word string to the search result storage unit 6. It has a line L56.

【0056】次に、この原単語検索部5の動作について
図10を参照して詳細に説明する。原単語検索部5の目
的は、与えられた頭字語に対して、そのフルスペルであ
るような単語列を入力文の中に見つけることである。そ
のために、図5のステップS2で検索結果格納部6に格
納された頭字語の各々に対して、以下の処理を繰り返す
(図10,ステップS300)。
Next, the operation of the original word search section 5 will be described in detail with reference to FIG. The purpose of the original word search unit 5 is to find a word string that is the full spelling of the given acronym in the input sentence. For this purpose, the following processing is repeated for each acronym stored in the search result storage unit 6 in step S2 of FIG. 5 (FIG. 10, step S300).

【0057】先ず、通信線L65を介して検索結果格納部
6から処理対象とする頭字語を1つ得て、これを頭字語
バッファ52に格納する(ステップS301)。次に、
入力文バッファ7中の各文に対して以下の処理を繰り返
す(ステップS302)。
First, one acronym to be processed is obtained from the search result storage unit 6 via the communication line L65, and is stored in the acronym buffer 52 (step S301). next,
The following processing is repeated for each sentence in the input sentence buffer 7 (step S302).

【0058】先ず、通信線L75を介して入力文バッファ
7より一文を得て、これを文バッファ53に格納する
(ステップS303)。次に、注目単語開始位置ポイン
タ55を0に初期化し、文バッファ53中の文の先頭の
単語を指すようにする。そして、注目単語開始位置ポイ
ンタ55を1ずつ増やしながら、この位置から始まる単
語列が頭字語に対応するフルスペル原単語列であるか否
かをチェックしていく(ステップS304)。
First, one sentence is obtained from the input sentence buffer 7 via the communication line L75 and stored in the sentence buffer 53 (step S303). Next, the noticed word start position pointer 55 is initialized to 0, and points to the first word of the sentence in the sentence buffer 53. Then, while incrementing the attention word start position pointer 55 by one, it is checked whether or not the word string starting from this position is the full spelling original word string corresponding to the acronym (step S304).

【0059】ステップS305において、注目単語開始
位置ポインタ55の位置から始まる単語列が、頭字語の
フルスペルと見做せるか否かをチェックする。比較の結
果、フルスペルと見做せると判断した場合(ステップS
306でYes)、注目単語開始位置から始まりフルス
ペルと見做される範囲の単語列(比較終了時の注目単語
現在位置ポインタ56の指す直前の単語まで)を通信線
L56を介して検索結果格納部6に送る(ステップS30
7)。そして、その頭字語に対する処理は終え、次の頭
字語の処理(ステップS300の次の繰り返し)を行
う。一方、ステップS306で比較結果がNoとなった
場合は、ステップS304の次の繰り返しを行い、注目
単語開始位置ポインタ55を+1して右隣の位置から始
まる単語列に対する比較を行う。
In step S305, it is checked whether or not the word string starting from the position of the attention word start position pointer 55 can be regarded as the full spelling of the acronym. As a result of the comparison, when it is determined that the full spell can be considered (step S
(Yes in 306), a search result storage unit via the communication line L56 for a word string in the range starting from the target word start position and regarded as full spelling (up to the word immediately before the target word current position pointer 56 at the end of comparison). 6 (Step S30)
7). Then, the process for the acronym is completed, and the process for the next acronym (the next repetition of step S300) is performed. On the other hand, if the comparison result is No in step S306, the next repetition of step S304 is performed, and the target word start position pointer 55 is incremented by 1 to compare the word string starting from the right adjacent position.

【0060】図11は、ステップS305における、単
語列と頭字語の比較のステップの詳細な処理例を示す流
れ図である。このステップでは、文バッファ53に格納
された文において、注目単語開始位置ポインタ55が指
す位置から始まる単語列が、頭字語バッファ52に格納
された頭字語に対応するフルスペルの単語列であるか否
かを判定する。具体的には、単語列中の単語の先頭文字
を順に並べると、頭字語文字列と一致するか否かをチェ
ックしている。但し、頭字語中のピリオドは、チェック
の際に無視する。
FIG. 11 is a flowchart showing a detailed processing example of the step of comparing a word string with an acronym in step S305. In this step, in the sentence stored in the sentence buffer 53, it is determined whether the word string starting from the position pointed to by the attention word start position pointer 55 is a full spelling word string corresponding to the acronym stored in the acronym buffer 52. Is determined. Specifically, it is checked whether or not the first characters of the words in the word string are aligned with the acronym character string in order. However, periods in acronyms are ignored during the check.

【0061】先ず、準備として、ステップS30601 にお
いて、注目単語現在位置ポインタ56に、注目単語開始
位置ポインタ55が指し示している注目単語開始位置を
代入すると共に、注目文字位置ポインタ54を0で初期
化し、双方の先頭から比較が始まるようにする。
First, as a preparation, in step S30601, the target word start position indicated by the target word start position pointer 55 is substituted for the target word current position pointer 56, and the target character position pointer 54 is initialized to 0. Make the comparison start at the beginning of both.

【0062】次に、注目文字位置ポインタ54が頭字語
バッファ52中の頭字語文字列の末尾を超えているか否
かをチェックする(ステップS30602)。もし超えていれ
ば(ステップS30602 でYes)、頭字語文字列の全て
に対して比較が成功裏に終了したということなので、成
功としてリターンする(ステップS30607)。超えていな
ければ(ステップS30602 でNo)、比較すべき文字が
残っているので比較を続ける。
Next, it is checked whether the target character position pointer 54 is beyond the end of the acronym character string in the acronym buffer 52 (step S30602). If it exceeds (Yes in step S30602), it means that the comparison has been successfully completed for all of the acronym character strings, and the process returns as success (step S30607). If not exceeded (No in step S30602), the comparison is continued because characters to be compared remain.

【0063】先ず、注目文字位置ポインタ54が指す頭
字語中の文字がピリオドか否かをチェックする。ピリオ
ドであれば(ステップS30603 でYes)、比較すべき
頭字語の次の文字なので、注目文字位置ポインタ54を
+1して(ステップS30606)、ステップS30602 に戻
る。
First, it is checked whether or not the character in the acronym indicated by the target character position pointer 54 is a period. If it is a period (Yes in step S30603), since it is the next character of the acronym to be compared, the target character position pointer 54 is incremented by 1 (step S30606), and the process returns to step S30602.

【0064】一方、ピリオドでなければ(ステップS30
603 でNo)、実際の比較を行う。具体的には、注目単
語現在位置ポインタ56の指す単語の先頭文字と、注目
文字位置ポインタ54の指す文字が、大文字・小文字を
区別した上で一致しているか否かをチェックする(ステ
ップS30604)。
On the other hand, if it is not a period (step S30)
(No at 603), an actual comparison is made. Specifically, it is checked whether or not the first character of the word pointed by the current word pointer 56 of interest and the character indicated by the current character position pointer 54 match, distinguishing between uppercase and lowercase characters (step S30604). .

【0065】一致していれば(ステップS30604 でYe
s)、その文字に関しては比較に成功したので、注目文
字位置ポインタ54および注目単語現在位置ポインタ5
6をそれぞれ+1して(ステップS30605)、ステップS
30602 に戻って比較を続行する。これに対して、一致し
ていなければ(ステップS30604 でNo)、比較失敗と
してリターンする(ステップS30608)。
If they match (Yes in step S30604)
s) Since the comparison of the character is successful, the target character position pointer 54 and the target word current position pointer 5
6 is incremented by 1 (step S30605), and step S30605 is executed.
Return to 30602 to continue the comparison. On the other hand, if they do not match (No in step S30604), the process returns as a comparison failure (step S30608).

【0066】図12は図5に示したステップS53で行
う日本語形態素生成処理の詳細な処理例を示す流れ図で
ある。日本語形態素生成処理では、訳文を構成する日本
語形態素が前後の形態素と制約を守って接続するように
活用変形を行う等の処理を行うが、ここでは更に、訳文
中の検索結果格納部6に収められたフルスペルの原単語
から訳出された部分に原語でのスペリングを訳文中に併
せて出力する処理も行う。
FIG. 12 is a flowchart showing a detailed processing example of the Japanese morpheme generation processing performed in step S53 shown in FIG. In the Japanese morpheme generation processing, processing such as performing inflection transformation so that the Japanese morpheme constituting the translated sentence is connected to the preceding and succeeding morphemes while observing the constraints is performed. Also, a process of outputting the spelling of the original word to the portion translated from the original word of the full spelling stored in the translation together with the translated sentence is performed.

【0067】具体的には、一般的な形態素接続規則に伴
う活用変形処理(ステップS5302)の後、これに対応す
る原語が、検索結果格納部6に格納された単語であるか
否かをチェックして(ステップS5303)、そうである場
合(ステップS5304でYes)、その原単語を括弧で囲
んで訳語の直後に文字列として連結する(ステップS53
05)。その結果、元の日本語単語列の直後にこの原単語
文字列が訳出されることになる。更に、この処理が同じ
単語が別の位置に現れた場合に再度重複して行われない
ようにするために、原単語を検索結果格納部6から削除
する(ステップS5306)。この処理は、本質的ではない
が、同じ語の原語でのフルスペルが複数回現れると、訳
文が読みにくくなるからである。一方、ステップS5304
でNoの場合は特に何もせず次の形態素の処理を継続す
る。こうして生成された形態素列は、連結されて出力部
3から出力され、訳文となる。
Specifically, after the inflection processing (step S5302) associated with a general morphological connection rule, it is checked whether or not the corresponding original word is a word stored in the search result storage unit 6. (Step S5303), and if so (Yes in Step S5304), the original word is enclosed in parentheses and connected as a character string immediately after the translated word (Step S53).
05). As a result, this original word character string is translated immediately after the original Japanese word string. Furthermore, in order to prevent this processing from being repeated again when the same word appears at another position, the original word is deleted from the search result storage unit 6 (step S5306). This process is not essential, but if the full spelling of the same word in the original word occurs more than once, the translated sentence becomes difficult to read. On the other hand, step S5304
In the case of No, the processing of the next morpheme is continued without doing anything. The morpheme strings generated in this way are connected and output from the output unit 3 to become a translated sentence.

【0068】こうして、検索結果格納部6に格納された
頭字語に対応するフルスペルの原単語は、その訳語が訳
文中に初めて現れた時点で、その訳語と関係付けられて
現れることになる。結果として、頭字語がどのようなス
ペルリングから作られたものか、ユーザは容易に了解す
ることができる。
As described above, the full-spelled original word corresponding to the acronym stored in the search result storage unit 6 appears when the translated word first appears in the translated sentence, in relation to the translated word. As a result, the user can easily understand what spelling the acronym was made from.

【0069】次に、図13(a)の入力文から同図
(b)の出力が得られるまでの処理を追ってみる。
Next, the processing from the input sentence of FIG. 13A to the output of FIG. 13B will be described.

【0070】先ず、原文は入力文バッファ7に格納され
る。次に、頭字語認定部4が図5のステップS2にて入
力文中の頭字語を見つけ出す。ここでは、"FAA" と"NTS
B"という二つの単語が頭字語パターン格納部42中の第
2のパターン「英大文字二つ以上の連続」とマッチし、
且つ頭字語抑制リスト44に載っていないので、頭字語
と認定され、検索結果格納部6に送られ格納される。頭
字語認定部4の処理(ステップS2)が終わった時点
で、検索結果格納部6の内容は図14に示すように、頭
字語格納バッファ部に"FAA" と"NTSB"が格納された状態
となっている。対応する原単語(頭字語に対応するフル
スペル単語列)は、この時点では、原単語格納バッファ
部には格納されていない。
First, the original sentence is stored in the input sentence buffer 7. Next, the acronym recognition unit 4 finds an acronym in the input sentence in step S2 of FIG. Here, "FAA" and "NTS"
The two words "B" match the second pattern "continuation of two or more capital letters" in the acronym pattern storage unit 42,
Since it is not listed on the acronym suppression list 44, it is recognized as an acronym and is sent to the search result storage unit 6 and stored. At the time when the processing of the acronym recognition unit 4 (step S2) is completed, the contents of the search result storage unit 6 are such that "FAA" and "NTSB" are stored in the acronym storage buffer unit as shown in FIG. It has become. At this point, the corresponding original word (full spelling word string corresponding to the acronym) has not been stored in the original word storage buffer unit.

【0071】次に、図5のステップS3にて原単語検索
部5が、検索結果格納部6に格納された頭字語"FAA" お
よび"NTSB"に対応するフルスペル原単語を見つけ出す。
先ず、図10のステップS301にて、"FAA" が原単語
検索部5の頭字語バッファ52にロードされる。次にス
テップS303にて文バッファ53に先ず第一文がロー
ドされる。注目単語位置を0としてステップS305を
実行するが、第一文の先頭単語が"The" であるのに対し
頭字語の第一文字目は"F" なので比較に失敗し、ステッ
プS306でNoに進む。
Next, in step S 3 of FIG. 5, the original word search unit 5 finds full spelled original words corresponding to the acronyms “FAA” and “NTSB” stored in the search result storage unit 6.
First, “FAA” is loaded into the acronym buffer 52 of the original word search unit 5 in step S301 of FIG. Next, the first sentence is first loaded into the sentence buffer 53 in step S303. Step S305 is executed with the target word position set to 0, but the comparison fails because the first word of the first sentence is "The" while the first character of the acronym is "F", and the process proceeds to No in Step S306. .

【0072】次は、注目単語開始位置ポインタ55が1
増やされ、第一文の第二単語"Federal" を指した状態で
ステップS305の比較ステップが呼び出される。する
と、単語列が“Federal Aviation Administration orde
red an …”であり、先頭文字を順に並べると、“FAAo
a …”となるのに対し、頭字語は"FAA" なので、比較に
成功してリターンしてくる。そして、ステップS306
でYesに分岐し、比較に成功した部分単語列、第一単
語から第三単語までが対応する原単語列として検索結果
格納部6に送信される。
Next, the attention word start position pointer 55 is set to 1
The comparison step of step S305 is called with the second word "Federal" of the first sentence pointed to. Then, the word string becomes “Federal Aviation Administration orde
red an… ”. If the first characters are arranged in order,“ FAAo
a… ”, whereas the acronym is“ FAA ”, the comparison is successful and the program returns.
Then, the process branches to Yes, and the partial word string that has been successfully compared, and the first to third words are transmitted to the search result storage unit 6 as the corresponding original word strings.

【0073】"NTSB"についても同様に第三文の第二単語
からの比較で成功する。その結果、原単語検索部5の処
理(ステップS3)が終了した時点で、検索結果格納部
6の内容は図15に示すように、頭字語"FAA" に対応し
て原単語列“Federal Aviation Administration"が、頭
字語"NTSB"に対応して原単語列"National Transportati
on Safety Board"が格納された状態となっている。
Similarly, for "NTSB", the comparison from the second word of the third sentence succeeds. As a result, when the processing of the original word search section 5 (step S3) is completed, the contents of the search result storage section 6 correspond to the acronym "FAA" and the original word string "Federal Aviation" as shown in FIG. Administration "corresponds to the acronym" NTSB "and the original word string" National Transportati
on Safety Board "is stored.

【0074】この状態で、図5の英語形態素解析(ステ
ップS51)、英日翻訳(ステップS52)が行われ、
日本語形態素生成(ステップS53)が起動される。
In this state, the English morphological analysis of FIG. 5 (step S51) and the English-Japanese translation (step S52) are performed.
The Japanese morpheme generation (step S53) is activated.

【0075】ステップS53では、“Federal Aviation
Administration"に対応する訳語「連邦航空局」の処理
を行う際に、この原語である“Federal Aviation Admin
istration"が検索結果格納部6に"FAA" に対する原単語
列として格納されていることをチェックする。そして、
「連邦航空局」の直後に原単語“Federal Aviation Adm
inistration"を括弧で囲んで文字列として連結する結
果、当初の「連邦航空局」という日本語文字列は、「連
邦航空局(Federal Aviation Administration)」という
文字列となって訳文中に現れることになる。
In step S53, "Federal Aviation
When processing the translation "Federal Aviation Administration" corresponding to "Administration", this original "Federal Aviation Admin
It is checked that "istration" is stored in the search result storage 6 as the original word string for "FAA".
The original word “Federal Aviation Adm” immediately follows “Federal Aviation Administration”.
Inistration "is enclosed in parentheses and concatenated as a character string. As a result, the original Japanese character string" Federal Aviation Administration "will appear in the translated text as" Federal Aviation Administration ". Become.

【0076】"National Transportation Safety Board"
の訳である「国家運輸安全ボード」についても同様に、
表層文字列が連結されて「国家運輸安全ボード(Nation
al Transportation Safety Board) 」となる結果、図1
3(b)に示す出力文が得られることになる。この訳文
では、"FAA" と"NTSB"が何の略語であり、どの訳語に対
応しているかは、ユーザにとってはきわめて明瞭であ
る。
"National Transportation Safety Board"
Similarly, for the National Transport Safety Board,
The surface character strings are concatenated to form the "National Transport Safety Board (Nation
al Transportation Safety Board) "
The output sentence shown in FIG. 3 (b) is obtained. In this translation, it is quite clear to the user what abbreviations "FAA" and "NTSB" are and which translations they correspond to.

【0077】次に、図16を参照して本発明の第2の実
施例について説明する。第2の実施例と第1の実施例と
の違いは、第2の実施例には第1の実施例には存在しな
い入力文編集部8が存在する点、検索結果格納部6と入
力文編集部8とを結ぶ通信線L68が存在する点、入力文
バッファ7と入力文編集部8とを結ぶ通信線L78が存在
する点、翻訳部2の代わりに翻訳部2Aを備えた点、お
よび検索結果格納部6と日本語形態素生成部23が通信
線L62で結ばれていない点である。更に、翻訳部2A
は、原文をプリエディットすることにより、まとまりと
非翻訳区間の指定ができるものとする。これらの相違
は、第1の実施例では、頭字語に対応するフルスペルの
原単語の綴りを訳文中に生成する処理を日本語形態素生
成部23が行っているのに対し、第2の実施例では、入
力文編集部8が入力文をプリエディットすることで行う
ためである。具体的には、対象となる単語列の周囲にマ
ーカーを挿入して、まとまりと非翻訳指定を行うことで
目的を達成している。
Next, a second embodiment of the present invention will be described with reference to FIG. The difference between the second embodiment and the first embodiment is that the second embodiment has an input sentence editing unit 8 which does not exist in the first embodiment, the search result storage unit 6 and the input sentence A communication line L68 connecting the editing unit 8; a communication line L78 connecting the input sentence buffer 7 and the input sentence editing unit 8; a translation unit 2A instead of the translation unit 2; The point is that the search result storage unit 6 and the Japanese morpheme generation unit 23 are not connected by the communication line L62. Further, the translation unit 2A
Can be specified as a unit and a non-translated section by pre-editing the original sentence. The difference is that in the first embodiment, the Japanese morpheme generation unit 23 performs the process of generating the spelling of the full-spelled original word corresponding to the acronym in the translated sentence, whereas the second embodiment This is because the input sentence editing unit 8 performs the pre-editing of the input sentence. Specifically, a marker is inserted around the target word string, and the target is achieved by specifying the unit and non-translation.

【0078】本実施例の動作は、図17の流れ図で示さ
れるように、第1の実施例とほぼ同じである。異なるの
は、頭字語に対応するフルスペル原単語列が検索され、
検索結果格納部6に格納されるステップS4の直後、翻
訳ステップS5の直前に、フルスペル語の情報を用いて
入力文を書き換えるステップS4Aが設けられているこ
とである。この入力書き換えステップの動作について、
図18を参照して詳細に説明する。入力として図13
(a)に示す英文が与えられたものとする。
The operation of this embodiment is almost the same as that of the first embodiment, as shown in the flowchart of FIG. The difference is that the full spelling word sequence corresponding to the acronym is searched,
Immediately after step S4 stored in the search result storage unit 6 and immediately before translation step S5, step S4A for rewriting the input sentence using the information of the full spelling word is provided. Regarding the operation of this input rewriting step,
This will be described in detail with reference to FIG. FIG. 13 as input
It is assumed that the English sentence shown in FIG.

【0079】ステップS4Aが開始された時点で、入力
文バッファ7には、この英文がそのまま入っており、検
索結果格納部6には図15に示す内容が格納されてい
る。検索結果格納部6に格納されている原単語列の各々
に対してS4A01以下の処理が繰り返される。
When the step S4A is started, the input sentence buffer 7 contains the English sentence as it is, and the search result storage section 6 stores the contents shown in FIG. The processing of S4A01 and subsequent steps is repeated for each of the original word strings stored in the search result storage unit 6.

【0080】先ず、原単語列を"Federal Aviation Admi
nistration" として、この単語列が入力文バッファ7か
ら検索される(ステップS4A02)。最初に見つかる
のは第一文の第二単語の位置である。すると、この単語
列の両端に、機械翻訳のプリエディットのための記号で
ある「まとまり指定」が挿入される(ステップS4A0
3)。更に、この単語列の直後に、非翻訳記号で挟ま
れ、更に括弧で挟まれた上記単語列の複製が挿入される
(ステップS4A04)。
First, the original word string is referred to as “Federal Aviation Admi”.
This word string is retrieved from the input sentence buffer 7 as "nistration" (step S4A02). The first word found is the position of the second word in the first sentence. A "designation of unity" which is a symbol for pre-editing is inserted (step S4A0).
3). Further, immediately after this word string, a copy of the word string sandwiched between non-translated symbols and further enclosed in parentheses is inserted (step S4A04).

【0081】この語の処理を終えると、もう一つの原単
語列"National Transportation Safety Board"について
も同様の処理を繰り返す。その結果、ステップS4A終
了時点での入力文バッファ7の内容は図19に示すもの
となる。第一文中の"FederalAviation Administration"
がプリエディットされて、[[Federal Aviation Admini
stration <<(Federal Aviation Administration)>>]]
となっていること、および第三文の"National Transpor
tation Safety Board"がプリエディットされて、[[Nati
onal Transportation Safety Board<<(National Transp
ortation Safety Board)>>]]注意してほしい。ここで、
[[…]]で囲まれた区間は、後の翻訳ステップでまとまり
として扱い、<<…>>で囲まれた区間は翻訳せず原表記の
まま出力するという指定を表す記号であり、何れも、ス
テップS4Aで挿入されたものである。これらのまとま
り指定と非翻訳記号に従って翻訳処理を進めることよ
り、最終的に図13(b)にある文が出力される。
When the processing of this word is completed, the same processing is repeated for another original word string “National Transportation Safety Board”. As a result, the contents of the input sentence buffer 7 at the end of step S4A are as shown in FIG. "FederalAviation Administration" in the first sentence
Was pre-edited and [[Federal Aviation Admini
stration << (Federal Aviation Administration) >>]]
And the third sentence "National Transpor
tation Safety Board "is pre-edited and [[Nati
onal Transportation Safety Board << (National Transp
ortation Safety Board) >>]] Please be careful. here,
The section enclosed by [[…]] is a symbol indicating that the section enclosed by <<… >> is to be output as it is in the original notation without translation, and the section enclosed by <<… >> Are also inserted in step S4A. By performing the translation process in accordance with the designation of the unit and the untranslated symbols, the sentence shown in FIG. 13B is finally output.

【0082】本発明は、上記に説明した以外にも種々に
変形して実施することができる。
The present invention can be implemented in various modifications other than those described above.

【0083】先ず、フルスペル単語と頭字語の対応関係
の示し方について、実施例に示した方法(フルスペル単
語の直後に括弧で囲んだ原語のフルスペルを示す)以外
にも、例えば、訳文中の訳語に*等の記号をふって脚注
に*とともに原語綴りを示す、フルスペル単語の訳語選
択の一選択肢として、ユーザが訳語表示を指定した場合
に元の綴りを見せる、元の綴りを訳文のルビとして見せ
る、訳語と原語綴りとを関連付けて訳文表示用のウィン
ドウとは別のウィンドウに表示するなど様々な変形は発
明の本旨に影響することなしに容易に実施できる。
First, in addition to the method shown in the embodiment (showing the full spelling of the original word enclosed in parentheses immediately after the full spelling word), for example, the method of indicating the correspondence between full spelling words and acronyms Indicate the spelling of the original language with * in the footnote by adding a symbol such as * to the footnote. As an option for selecting the translation of the full spelling word, show the original spelling when the user specifies the translation display, the original spelling as the ruby of the translation Various modifications, such as showing the translated word and the original spelling in association with each other and displaying the translated word in a window different from the translation display window, can be easily implemented without affecting the gist of the invention.

【0084】また、頭字語の認定方法についても、実施
例では、文字列の正規表記パターンと抑制リストによる
方法を示したが、パターン記述に品詞等文字列以外の属
性を用いたり、一般のプログラムとして表現するなど様
々な認定方法を用いて実施できる。
In the embodiment, the method of identifying acronyms has been described using a regular expression pattern of character strings and a suppression list. However, an attribute other than a character string, such as a part of speech, may be used for pattern description, or a general program may be used. It can be implemented using various recognition methods such as expressing as.

【0085】更に、実施例では、頭字語の認定と対応す
るフルスペルの原単語列の検索は、入力文の文字列の上
で行うようになっているが、この処理を、入力文を形態
素解析し品詞等の文法属性を推定したデータ、更には、
構文解析を行ったデータを対象として処理することによ
り、頭字語認定と原単語の検索・認定をより高精度に行
うように実装することも容易である。例えば、フルスペ
ル原単語として、構文解析で複合名詞句として認定され
た単位だけを許すようにするなどの変形が考えられる
が、これも従来の機械翻訳技術の枠内で容易に実装する
ことができる。
Further, in the embodiment, the search for the full spelling original word string corresponding to the recognition of the acronym is performed on the character string of the input sentence. Data with estimated grammatical attributes such as part of speech,
By processing the parsed data, it is easy to implement the acronym recognition and the original word search and recognition with higher accuracy. For example, as a full spelling original word, a modification such as allowing only a unit recognized as a compound noun phrase in syntactic analysis can be considered, but this can also be easily implemented within the framework of conventional machine translation technology .

【0086】更に、頭字語が対訳辞書に登録されている
場合については、実施例では触れなかったが、対訳辞書
に登録されている頭字語は、辞書に基づいて翻訳を行う
ようにする、或いは、対訳辞書に基づいて翻訳するか、
本発明の方法を使って処理するかをユーザが自由に選べ
る、などの変形はやはり容易に実施できる。以上説明し
たように、本発明は、発明の範囲内で様々に変形して実
施できる。
Further, the case where the acronym is registered in the bilingual dictionary is not described in the embodiment, but the acronym registered in the bilingual dictionary is translated based on the dictionary, or , Translate based on a bilingual dictionary,
Modifications such as the user being able to freely select whether to use the method of the present invention or the like can also be easily implemented. As described above, the present invention can be variously modified and implemented within the scope of the invention.

【0087】[0087]

【発明の効果】本発明によれば、訳文中にユーザにとっ
て不明な頭字語が含まれている場合でも、原文中に頭字
語に対応するフルスペルの単語が現れているならば、ユ
ーザは訳文を読むだけで頭字語の意味するところを容易
に理解することができる。頭字語が辞書登録されていな
い場合でも、有効であるという本願発明の特徴は、頭字
語の新陳代謝が非常に激しいことを鑑みると、辞書登録
が必要な従来技術と比較して大きな利点となっている。
According to the present invention, even when an acronym unknown to the user is included in a translation, if a full-spelled word corresponding to the acronym appears in the original text, the user can delete the translation. You can easily understand what the acronym means simply by reading. Even if the acronym is not registered in the dictionary, the feature of the present invention that it is effective is a great advantage compared with the conventional technology that requires dictionary registration, in view of the fact that the metabolism of the acronym is very intense. I have.

【0088】更に、本発明の別の利点と効果として、頭
字語とフルスペルの単語との対応関係を誤って認定した
場合でも、訳文が破壊されないという頑強性がある。こ
の場合、本発明では、余計な、頭字語とは無関係な単語
に原文表記が付随して出力されるだけで、訳文自体は本
発明のベースとなる機械翻訳部が出力したものと何ら変
わりがないからである。つまり、単に無用な手がかりが
示されているだけであり、訳文自体に誤りが入り込むこ
とはない。ユーザは、そのような手がかりを無視して正
しく頭字語を解釈することができる。この利点は、本質
的には、頭字語に対応するフルスペルの語の出力を工夫
するという本発明の特徴に由来する。一方、例えば、頭
字語をフルスペルの原単語と読み替えて翻訳し出力する
システムなど、頭字語の訳出方法を工夫する方法の場
合、この対応関係の認定を誤ると、即誤った訳出につな
がってしまい、ユーザが正しく解釈する余地を奪ってし
まう。このように、本発明には、頭字語と原単語の関係
認定の誤りに対して頑健であるという大きな利点と効果
がある。
Further, as another advantage and effect of the present invention, there is a robustness that a translated sentence is not destroyed even when a correspondence between an acronym and a full spelling word is incorrectly recognized. In this case, in the present invention, only the extra words that are not related to the acronym are output with the original sentence notation, and the translated text itself is no different from that output by the machine translation unit that is the base of the present invention. Because there is no. In other words, only unnecessary clues are shown, and the translation itself does not contain errors. The user can ignore such cues and interpret the acronym correctly. This advantage essentially comes from the inventive feature of devising the output of full-spelled words corresponding to acronyms. On the other hand, in the case of a method of devising the translation of an acronym, such as a system that reads and translates an acronym with the full spelling of the original word and outputs it, erroneous recognition of this correspondence leads to an incorrect translation immediately. This leaves the user with no room for correct interpretation. As described above, the present invention has a great advantage and effect that it is robust against an error in identifying the relation between an acronym and an original word.

【0089】更に、本発明の機械翻訳装置は、頭字語パ
ターン格納部に格納されている、頭字語となるための条
件を満たし、且つ頭字語抑制リストに格納されていない
単語を頭字語と認定するようにしているので、きわめて
一般的な“USA”等の頭字語に対するフルスペルが訳
文中に挿入されて訳文が見にくくなることを防ぐことが
できると共に、翻訳処理に要する時間を短くすることが
できる。
Further, the machine translation apparatus of the present invention recognizes a word stored in the acronym pattern storage unit that satisfies the condition for becoming an acronym and is not stored in the acronym suppression list as an acronym. As a result, it is possible to prevent the full spelling of an acronym such as "USA", which is very common, from being inserted into the translated sentence, thereby making it difficult to see the translated sentence, and to shorten the time required for the translation process. .

【0090】更に、本発明の機械翻訳装置は、原単語検
索部で検索されたフルスペルの語が、入力文の翻訳時
に、その語の訳語に関連して訳文中に挿入されるよう
に、入力文をプリエディットする入力文編集部を備えて
いるので、既存の翻訳部を使用できる。
Further, the machine translation apparatus according to the present invention is arranged such that the full spelled word searched for in the original word search section is inserted into the translation in association with the translation of the input sentence when the input sentence is translated. Since an input sentence editing unit for pre-editing a sentence is provided, an existing translation unit can be used.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施の形態に係る機械翻訳装置
の構成を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of a machine translation device according to a first embodiment of the present invention.

【図2】本発明の第1の実施の形態に係る機械翻訳装置
の処理を示す流れ図である。
FIG. 2 is a flowchart showing processing of the machine translation device according to the first embodiment of the present invention.

【図3】本発明の第2の実施の形態に係る機械翻訳装置
の構成を示すブロック図である。
FIG. 3 is a block diagram illustrating a configuration of a machine translation device according to a second embodiment of the present invention.

【図4】本発明の第1の実施例に係る機械翻訳装置の構
成を示すブロック図である。
FIG. 4 is a block diagram illustrating a configuration of a machine translation apparatus according to the first embodiment of the present invention.

【図5】本発明の第1の実施例に係る機械翻訳装置の処
理を示す流れ図である。
FIG. 5 is a flowchart showing processing of the machine translation apparatus according to the first embodiment of the present invention.

【図6】頭字語認定部4の構成例を示すブロック図であ
る。
FIG. 6 is a block diagram showing a configuration example of an acronym recognition unit 4.

【図7】頭字語パターン格納部42の内容例を示す図で
ある。
FIG. 7 is a diagram showing an example of contents of an acronym pattern storage unit 42.

【図8】頭字語認定部4の処理例を示す流れ図である。FIG. 8 is a flowchart showing a processing example of the acronym recognition unit 4;

【図9】原単語検索部5の構成例を示すブロック図であ
る。
FIG. 9 is a block diagram illustrating a configuration example of an original word search unit 5;

【図10】原単語検索部5全体の処理例を示す流れ図で
ある。
FIG. 10 is a flowchart showing a processing example of the entire original word search unit 5;

【図11】原単語検索部5が行う単語列と頭字語の比較
ステップの詳細な処理例を示した流れ図である。
FIG. 11 is a flowchart showing a detailed processing example of a word string and acronym comparison step performed by an original word search unit 5;

【図12】日本語形態素生成部23の処理例を示す流れ
図である。
FIG. 12 is a flowchart showing a processing example of a Japanese morpheme generation unit 23;

【図13】機械翻訳装置の入出力の一例を示す図であ
る。(a)は入力文を示し、(b)は出力文を示す。
FIG. 13 is a diagram illustrating an example of input and output of the machine translation device. (A) shows an input sentence, and (b) shows an output sentence.

【図14】頭字語認定部4の処理が終了した直後の検索
結果格納部の内容を例示する図である。
FIG. 14 is a diagram exemplifying the contents of a search result storage unit immediately after the processing of the acronym recognition unit 4 is completed.

【図15】原単語検索部5の処理が終了した直後の検索
結果格納部の内容を例示する図である。
FIG. 15 is a diagram exemplifying the contents of a search result storage unit immediately after the processing of the original word search unit 5 is completed.

【図16】本発明の第2の実施例に係る機械翻訳装置の
構成を示すブロック図である。
FIG. 16 is a block diagram illustrating a configuration of a machine translation device according to a second embodiment of the present invention.

【図17】第2の実施例に係る機械翻訳装置の処理例を
示す流れ図である。
FIG. 17 is a flowchart illustrating a processing example of the machine translation device according to the second embodiment.

【図18】入力文編集部8の処理例を示す流れ図であ
る。
FIG. 18 is a flowchart showing a processing example of the input sentence editing unit 8;

【図19】入力バッファ7の内容例を示す図である。FIG. 19 is a diagram showing an example of the contents of an input buffer 7;

【図20】従来技術の機械翻訳装置における入出力の例
を示す図である。
FIG. 20 is a diagram illustrating an example of input and output in a conventional machine translation apparatus.

【符号の説明】[Explanation of symbols]

1…入力部 2,2A…翻訳部 3…出力部 4…頭字語認定部 5…原単語検索部 6…検索結果格納部 7…入力文バッファ 8…入力文編集部 21…英語形態素解析部 22…英日構文変換部 23…日本語形態素生成部 24…英日対訳辞書 25…英日翻訳ルール 41…頭字語候補格納部 42…頭字語パターン格納部 43…頭字語パターン適用エンジン 44…頭字語抑制リスト 51…検索制御部 52…頭字語バッファ 53…文バッファ 54…注目文字位置ポインタ 55…注目単語開始位置ポインタ 56…注目単語現在位置ポインタ A1…入力装置 A2…データ処理装置 A3…出力装置 A4…記憶装置 A5…記録媒体 DESCRIPTION OF SYMBOLS 1 ... Input part 2, 2A ... Translation part 3 ... Output part 4 ... Acronym recognition part 5 ... Original word search part 6 ... Search result storage part 7 ... Input sentence buffer 8 ... Input sentence editing part 21 ... English morphological analysis part 22 ... English-Japanese syntax conversion unit 23 ... Japanese morpheme generation unit 24 ... English-Japanese bilingual dictionary 25 ... English-Japanese translation rule 41 ... Acronym candidate storage unit 42 ... Acronym pattern storage unit 43 ... Acronym pattern application engine 44 ... Acronym Suppression list 51 Search control unit 52 Acronym buffer 53 Sentence buffer 54 Attention character position pointer 55 Attention word start position pointer 56 Attention word current position pointer A1 Input device A2 Data processing device A3 Output device A4 ... Storage device A5 ... Recording medium

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 翻訳対象の入力文中に存在する頭字語を
認定する頭字語認定処理と、 該頭字語認定処理で認定した頭字語と対応するフルスペ
ルの語を、前記入力文中から検索する原単語検索処理
と、 前記入力文に対する訳文を生成する際、前記原単語検索
処理で検索されたフルスペルの語の原語綴りを、その語
の訳語と関連付けて出力する翻訳処理とを含むことを特
徴とする機械翻訳方法。
1. An acronym recognition process for recognizing an acronym existing in an input sentence to be translated, and an original word for searching a full spelling word corresponding to the acronym recognized in the acronym recognition process from the input sentence Generating a translated sentence for the input sentence, including a translation process of outputting the original spelling of the full spelled word searched for in the original word search process in association with the translated word of the word; Machine translation method.
【請求項2】 前記翻訳処理においては、前記原単語検
索処理で検索されたフルスペルの語の原語綴りを、その
語の訳語の直後に挿入することを特徴とする請求項1記
載の機械翻訳方法。
2. The machine translation method according to claim 1, wherein in the translation processing, the original spelling of the full spelled word searched in the original word search processing is inserted immediately after the translated word of the word. .
【請求項3】 翻訳対象の入力文中に存在する頭字語を
認定する頭字語認定処理と、 該頭字語認定処理で認定した頭字語と対応するフルスペ
ルの語を、前記入力文中から検索する原単語検索処理
と、 該原単語検索処理で検索されたフルスペルの語が、前記
入力文の翻訳時に、その語の訳語に関連して訳文中に挿
入されるように、前記入力文をプリエディットする入力
文編集処理と、 該入力文編集処理でプリエディットされた後の入力文を
翻訳する翻訳処理とを含むことを特徴とする機械翻訳方
法。
3. An acronym recognition process for recognizing an acronym existing in an input sentence to be translated, and an original word for searching the input sentence for a full spelling word corresponding to the acronym recognized in the acronym recognition process. An input for pre-editing the input sentence so that the full-spelled word searched for in the original word search process is inserted into the translated sentence in translation of the input sentence when the input sentence is translated. A machine translation method comprising: a sentence editing process; and a translation process for translating an input sentence that has been preedited in the input sentence editing process.
【請求項4】 翻訳対象の入力文中に存在する頭字語を
認定する頭字語認定部と、 該頭字語認定部で認定した頭字語と対応するフルスペル
の語を、前記入力文中から検索する原単語検索部と、 前記入力文に対する訳文を生成する際、前記原単語検索
部で検索されたフルスペルの語の原語綴りを、その語の
訳語と関連付けて出力する翻訳部とを備えたことを特徴
とする機械翻訳装置。
4. An acronym recognition unit that recognizes an acronym existing in an input sentence to be translated, and an original word that searches the input sentence for a full spelling word corresponding to the acronym recognized by the acronym recognition unit. A search unit, and a translation unit that, when generating a translated sentence for the input sentence, outputs the original spelling of the full-spelled word searched for by the original word search unit in association with the translated word of the word. Machine translation equipment.
【請求項5】 前記翻訳部は、前記原単語検索部で検索
されたフルスペルの語の原語綴りを、その語の訳語の直
後に挿入する構成を備えたことを特徴とする請求項4記
載の機械翻訳装置。
5. The apparatus according to claim 4, wherein the translating unit inserts the original spelling of the full-spelled word searched by the original word searching unit immediately after the translated word of the word. Machine translation device.
【請求項6】 前記頭字語認定部は、 頭字語となるための条件が格納された頭字語パターン格
納部と、 頭字語として扱わない方が良い単語が格納された頭字語
抑制リストと、 前記頭字語パターン格納部に格納されている条件を満た
し、且つ前記頭字語抑制リストに格納されていない単語
を頭字語と認定する頭字語パターン適用エンジンとを備
えたことを特徴とする請求項4記載の機械翻訳装置。
6. An acronym recognition unit, comprising: an acronym pattern storage unit in which a condition for being an acronym is stored; an acronym suppression list in which words that should not be treated as acronyms are stored; 5. An acronym pattern application engine that satisfies the conditions stored in the acronym pattern storage unit and identifies words that are not stored in the acronym suppression list as acronyms. Machine translation equipment.
【請求項7】 翻訳対象の入力文中に存在する頭字語を
認定する頭字語認定部と、 該頭字語認定部で認定した頭字語と対応するフルスペル
の語を、前記入力文中から検索する原単語検索部と、 該原単語検索部で検索されたフルスペルの語が、前記入
力文の翻訳時に、その語の訳語に関連して訳文中に挿入
されるように、前記入力文をプリエディットする入力文
編集部と、 該入力文編集部でプリエディットされた後の入力文を翻
訳する翻訳部とを備えたことを特徴とする機械翻訳装
置。
7. An acronym recognition unit that recognizes an acronym present in an input sentence to be translated, and an original word that searches the input sentence for a full spelling word corresponding to the acronym recognized by the acronym recognition unit. A search unit; and an input for preediting the input sentence so that the full-spelled word searched for by the original word search unit is inserted into the translated sentence in translation of the input sentence in relation to the translated word. A machine translation device comprising: a sentence editing unit; and a translating unit that translates an input sentence that has been pre-edited by the input sentence editing unit.
【請求項8】 コンピュータに、 翻訳対象の入力文中に存在する頭字語を認定する頭字語
認定処理、 該頭字語認定処理で認定した頭字語と対応するフルスペ
ルの語を、前記入力文中から検索する原単語検索処理、 前記入力文に対する訳文を生成する際、前記原単語検索
処理で検索されたフルスペルの語の原語綴りを、その語
の訳語と関連付けて出力する翻訳処理を実行させるため
のプログラムを記録した機械読み取り可能な記録媒体。
8. An acronym recognition process for recognizing an acronym existing in an input sentence to be translated by a computer, and a full spelling word corresponding to the acronym recognized in the acronym recognition process is searched from the input sentence. An original word search process, when generating a translated sentence for the input sentence, a program for executing a translation process for outputting the original spelling of the full spelled word searched for in the original word search process in association with the translated word of the word A recorded machine-readable recording medium.
【請求項9】 コンピュータに、 翻訳対象の入力文中に存在する頭字語を認定する頭字語
認定処理、 該頭字語認定処理で認定した頭字語と対応するフルスペ
ルの語を、前記入力文中から検索する原単語検索処理、 前記入力文に対する訳文を生成する際、前記原単語検索
処理で検索されたフルスペルの語の原語綴りを、その語
の訳語と関連付けて訳文中に挿入する翻訳処理、 前記入力文に対する訳文を生成する際、前記原単語検索
処理で検索されたフルスペルの語の原語綴りを、その語
の訳語の直後に挿入する翻訳処理を実行させるためのプ
ログラムを記録した機械読み取り可能な記録媒体。
9. An acronym recognition process for recognizing an acronym existing in an input sentence to be translated by a computer, and a full spelling word corresponding to the acronym recognized in the acronym recognition process is searched from the input sentence. An original word search process, when generating a translation for the input sentence, a translation process for associating the original spelling of a full spelled word searched for in the original word search process with a translation of the word and inserting it into a translation, the input sentence Machine-readable recording medium storing a program for executing a translation process of inserting the original spelling of a full-spelled word searched for in the original word search process immediately after the translated word when generating a translated sentence for the word .
JP10055923A 1998-02-20 1998-02-20 Machine translating method/device and machine-readable medium to record program Pending JPH11238062A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10055923A JPH11238062A (en) 1998-02-20 1998-02-20 Machine translating method/device and machine-readable medium to record program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10055923A JPH11238062A (en) 1998-02-20 1998-02-20 Machine translating method/device and machine-readable medium to record program

Publications (1)

Publication Number Publication Date
JPH11238062A true JPH11238062A (en) 1999-08-31

Family

ID=13012638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10055923A Pending JPH11238062A (en) 1998-02-20 1998-02-20 Machine translating method/device and machine-readable medium to record program

Country Status (1)

Country Link
JP (1) JPH11238062A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006073012A (en) * 2004-09-02 2006-03-16 Microsoft Corp System and method of managing information by answering question defined beforehand of number decided beforehand
JP2010272079A (en) * 2009-05-25 2010-12-02 Toshiba Corp Machine translation device, method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006073012A (en) * 2004-09-02 2006-03-16 Microsoft Corp System and method of managing information by answering question defined beforehand of number decided beforehand
JP2010272079A (en) * 2009-05-25 2010-12-02 Toshiba Corp Machine translation device, method, and program

Similar Documents

Publication Publication Date Title
US4873634A (en) Spelling assistance method for compound words
JP4544674B2 (en) A system that provides information related to the selected string
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US6424983B1 (en) Spelling and grammar checking system
KR100530154B1 (en) Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system
US8219381B2 (en) Dictionary registration apparatus, dictionary registration method, and computer product
JPH07325828A (en) Grammar checking system
JPH0361220B2 (en)
JP2002215617A (en) Method for attaching part of speech tag
Chen et al. A joint model to identify and align bilingual named entities
US10120843B2 (en) Generation of parsable data for deep parsing
JP2020190970A (en) Document processing device, method therefor, and program
CN100474291C (en) System for distinguishing names in Asian language writing system
US8041556B2 (en) Chinese to english translation tool
JPH0211934B2 (en)
EP0316743B1 (en) Method for removing enclitic endings from verbs in romance languages
US20050267735A1 (en) Critiquing clitic pronoun ordering in french
JPH11238062A (en) Machine translating method/device and machine-readable medium to record program
JP2000250913A (en) Example type natural language translation method, production method and device for list of bilingual examples and recording medium recording program of the production method and device
JPH07325825A (en) English grammar checking system device
JP3949874B2 (en) Translation translation learning method, translation translation learning device, storage medium, and translation system
JPH087046A (en) Document recognition device
Chen et al. Chinese Spelling Check based on Neural Machine Translation
JP2723886B2 (en) Machine translation apparatus and translation rule creation method
JP3378267B2 (en) Machine translation equipment