JP5039114B2 - Machine translation apparatus and program - Google Patents

Machine translation apparatus and program Download PDF

Info

Publication number
JP5039114B2
JP5039114B2 JP2009260525A JP2009260525A JP5039114B2 JP 5039114 B2 JP5039114 B2 JP 5039114B2 JP 2009260525 A JP2009260525 A JP 2009260525A JP 2009260525 A JP2009260525 A JP 2009260525A JP 5039114 B2 JP5039114 B2 JP 5039114B2
Authority
JP
Japan
Prior art keywords
translation
translated
difference
word
similar example
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009260525A
Other languages
Japanese (ja)
Other versions
JP2011107852A (en
Inventor
晶 佐々木
裕美子 吉村
貴志 澁谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2009260525A priority Critical patent/JP5039114B2/en
Publication of JP2011107852A publication Critical patent/JP2011107852A/en
Application granted granted Critical
Publication of JP5039114B2 publication Critical patent/JP5039114B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、第1言語文と第2言語文との対訳からなる翻訳用例を用いて翻訳対象の第1言語の原文を第2言語の訳文に翻訳する機械翻訳装置及びプログラムに関する。   The present invention relates to a machine translation apparatus and a program for translating an original sentence of a first language to be translated into a translated sentence of a second language using an example of translation consisting of a parallel translation of a first language sentence and a second language sentence.

国際化の進行に伴い、外国語を用いた迅速な情報交換を実現するツールとして、機械翻訳装置は大いに期待されている。現状では、現在の機械翻訳技術による翻訳結果は、人手による手直しが全く不要なレベルにあるとはいえないため、人の手で訳された翻訳結果をデータベース化して活用するための翻訳支援ツールが開発されている。これらのツールでは、第1言語の原文と第2言語の訳文との対訳とからなる翻訳用例をあらかじめ翻訳用例データベースに複数蓄積しておき、入力された翻訳対象の原文に原文が類似している翻訳用例(以下、類似用例という)を検索・表示する。そして、検索された類似用例の原文が翻訳対象の原文と完全一致していない場合には、検索された翻訳用例の訳文を一部編集して、翻訳対象の原文の翻訳結果とするものである。   With the progress of internationalization, machine translation devices are highly expected as tools for realizing rapid information exchange using foreign languages. At present, the results of translation by the current machine translation technology cannot be said to be at a level that does not require any manual retouching. Therefore, there is a translation support tool that can be used to create a database of translation results that have been translated manually. Has been developed. In these tools, a plurality of translation examples composed of a translation of the first language source text and the second language translation text are stored in advance in the translation example database, and the source text is similar to the input source text to be translated. Search and display translation examples (hereinafter referred to as similar examples). If the original text of the retrieved similar example does not completely match the original text to be translated, a part of the translated text of the retrieved translation example is edited to obtain a translation result of the original text to be translated. .

このような翻訳用例を用いた機械翻訳装置では、ユーザによる編集箇所の判断や訳語の選択などの手間を軽減するため、上記編集を自動的に行うものも提案されている(例えば、特許文献1参照)。この場合、翻訳対象の原文と検索された類似用例の原文との相違箇所(以下差分)を語句単位で判定し、類似用例において原文中の差分に対応する訳文中の語句を判定し、当該語句を翻訳対象原文中の差分に対応する訳語に置き換えた合成文を作成し、翻訳対象原文の訳文とする。   In the machine translation apparatus using such a translation example, there is also proposed a machine translation apparatus that automatically performs the editing in order to reduce the user's trouble of determining an edit location and selecting a translation (for example, Patent Document 1). reference). In this case, a difference (hereinafter, difference) between the original text to be translated and the retrieved original text of the similar example is determined in terms of words, and in the similar example, the phrase in the translation corresponding to the difference in the original text is determined, and the phrase A synthesized sentence in which is translated into a translation corresponding to the difference in the translation target original is created and used as a translation of the translation target original.

特開2006−11842号公報JP 2006-11842 A

しかし、特許文献1で想定されている類似用例中の差分には、単一の単語(眼鏡、スーツケースなど)が想定されているが、合成語が差分に相当する場合が含まれていないのが現状である。実際には複数の語から構成された合成語が差分に相当する場合があり、このような場合、翻訳対象の原文中の差分に対応する類似用例の訳文中の語句の判定がうまくいかない場合がある。例えば、表1に示す例で説明する。表1の例は、翻訳対象の原文を翻訳用例(類似用例の原文、類似用例の訳文)を用いて翻訳する場合である。

Figure 0005039114
However, the difference in the similar example assumed in Patent Document 1 is assumed to be a single word (glasses, suitcase, etc.), but does not include the case where the synthesized word corresponds to the difference. Is the current situation. In practice, a compound word composed of a plurality of words may correspond to a difference, and in such a case, determination of a phrase in the translation of the similar example corresponding to the difference in the original sentence to be translated may not be successful. . For example, an example shown in Table 1 will be described. The example of Table 1 is a case where the original text to be translated is translated using the translation example (similar example original sentence, similar example translation).
Figure 0005039114

この例において、翻訳対象の原文と検索された類似用例の原文との差分は「遠隔」であると見なし、類似用例において原文中の「遠隔」に対応する訳文中の語を探そうとしても、「遠隔」に直接対応する単語が見つからないという問題があった。この例の「遠隔治療」が「遠隔」と「治療」から構成される合成語であるため、「遠隔」、「治療」、「teletherapy」との間に1対1対応の関係があるとは判定されないことが問題の原因であり、その結果、原文中の差分に対応する訳文中の語句が見つからず、訳語の置き換えに失敗していた。   In this example, it is assumed that the difference between the original text to be translated and the original text of the similar example searched is “remote”, and even if an attempt is made to find a word in the translation corresponding to “remote” in the original text in the similar example, There was a problem that a word directly corresponding to "remote" could not be found. Since “remote treatment” in this example is a compound word composed of “remote” and “treatment”, there is a one-to-one correspondence relationship between “remote”, “treatment”, and “teletherapy”. Not being judged is the cause of the problem. As a result, the phrase in the translation corresponding to the difference in the original sentence cannot be found, and the replacement of the translation has failed.

このように従来の技術では、類似用例を用いた翻訳において、翻訳対象原文と類似用例原文との差分を語句単位で判定し、類似用例の原文中の差分に対応する類似用例訳文の語句を判定する際に、原文中の差分に1対1で対応する類似用例の訳文中の語句の判定に失敗する場合があった。   As described above, in the translation using the similar example, in the conventional technique, the difference between the original text to be translated and the similar example original is determined in units of words, and the phrase of the similar example translation corresponding to the difference in the original of the similar example is determined. In this case, there is a case where the determination of the word or phrase in the translation of the similar example corresponding one-to-one with the difference in the original sentence fails.

本発明の目的は、翻訳対象原文と翻訳用例原文との差分が翻訳用例訳文に含まれない合成語の場合であっても訳文中の対応する訳語の範囲を確定できる機械翻訳装置及びプログラムを提供することを目的とする。   An object of the present invention is to provide a machine translation apparatus and a program capable of determining the range of corresponding translation words in a translation even when the difference between the translation target text and the translation example text is a compound word not included in the translation example translation The purpose is to do.

本発明に係わる機械翻訳装置は、機械翻訳プログラム、翻訳対象の第1言語を翻訳目的の第2言語に翻訳するための機械翻訳辞書、翻訳対象の第1言語の文と翻訳目的の第2言語の文との対訳からなる翻訳用例を類似用例原文及び類似用例訳文の対として蓄積した翻訳用例データベースを記憶した記憶装置と、翻訳対象である第1言語の文章データを入力する入力装置と、翻訳後の第2言語の訳文を出力する出力装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えた機械翻訳装置において、前記入力装置から入力された翻訳対象の第1言語の文章データを受け付け前記記憶装置に記憶させる入力処理部と、前記入力処理部で受け付けた第1言語の文章データを1文単位に分割し翻訳対象原文を得る文分割部と、前記文分割部で得られた翻訳対象原文を前記機械翻訳辞書を参照して解析するとともに第2言語に翻訳を行う原文解析・翻訳部と、前記翻訳対象原文に類似する翻訳用例を類似用例原文及び類似用例訳文の対として前記翻訳用例データベースから検索する翻訳用例検索部と、前記翻訳用例検索部で検索された前記類似用例原文と前記翻訳対象原文との差分を判定するともに当該差分に対応する前記類似用例訳文中の語句と前記翻訳対象原文中の語句とを対応付ける差分対応付け部と、前記差分対応付け部において差分と判定した語句および類似用例中で1対1の対応付けに失敗した語句に対してそれぞれの語句の範囲を拡大して再度対応付けを行う再対応付け可能判定部と、前記差分対応付け部によって対応付けられた前記翻訳対象原文中の差分の語句に対して前記機械翻訳辞書を参照して対応する第2言語による訳語を取得する差分語句訳語取得部と、前記差分対応付け部によって対応付けられた類似用例訳文中の語句を前記差分語句訳語取得部によって取得した訳語に置き換えて訳文を生成する訳語置換部とを備えたことを特徴とする。
A machine translation apparatus according to the present invention includes a machine translation program, a machine translation dictionary for translating a first language to be translated into a second language for translation, a sentence in the first language to be translated and a second language for translation. A translation example consisting of parallel translations with a similar example original sentence and a translation example database stored as a pair of similar example translations, an input device for inputting sentence data of a first language to be translated, and a translation A machine translation apparatus comprising: an output device that outputs a translated sentence in a later second language; and an arithmetic control device that executes the machine translation program. The sentence data of the first language to be translated input from the input device An input processing unit that accepts and stores it in the storage device, a sentence division unit that divides sentence data of the first language received by the input processing unit into one sentence unit, and obtains a translation target original sentence, and the sentence division A source sentence analysis / translation unit that analyzes the translation target text obtained in step 1 with reference to the machine translation dictionary and translates it into a second language, a translation example similar to the translation target text, and a similar example translation a translation example search unit searches from the translation example database as pairs of the similar example together corresponding to the difference between the determined difference between the translation example search section the similar example textual retrieved in said translated original text A difference associating unit for associating a phrase in a translated sentence with a phrase in the original text to be translated, a phrase determined as a difference in the difference associating unit, and a phrase that failed to be matched one-to-one in similar examples A re-association determination unit that expands the range of each word and re-associates, and a difference word in the original text to be translated that is associated by the difference association unit A differential word / phrase translation acquisition unit that acquires a translation in a corresponding second language with reference to the machine translation dictionary, and acquires a difference phrase / phrase translation of a phrase in a similar example translation translated by the difference correlation unit A translation replacement unit that generates a translation by replacing the translation acquired by the translation unit.

本発明によれば、翻訳対象原文と翻訳用例原文との差分が翻訳用例訳文に含まれない合成語の場合であっても訳文中の対応する訳語の範囲を確定できる。   According to the present invention, it is possible to determine the range of corresponding translation words in a translation even if the difference between the translation target sentence and the translation example original is a compound word that is not included in the translation example translation.

本発明の実施の形態に係わる機械翻訳装置の機能ブロック図。The functional block diagram of the machine translation apparatus concerning embodiment of this invention. 本発明の実施の形態に係わる機械翻訳装置のハードウエア構成を示すブロック構成図。The block block diagram which shows the hardware constitutions of the machine translation apparatus concerning embodiment of this invention. 本発明の実施の形態に係わる機械翻訳装置の処理内容を示すフローチャート。The flowchart which shows the processing content of the machine translation apparatus concerning embodiment of this invention. 表1に示した翻訳対象原文に対して図3のステップS305での言語解析処理を行った解析結果の一例のツリー構造図。FIG. 4 is a tree structure diagram illustrating an example of an analysis result obtained by performing language analysis processing in step S305 of FIG. 3 on the translation target original text illustrated in Table 1. 図3のステップS308の対応付け再試行処理を含む差分対応付け処理の内容を示すフローチャート。The flowchart which shows the content of the difference matching process including the matching retry process of step S308 of FIG. 表1に示した類似用例原文に対して図5のステップS401での言語解析処理を行った解析結果の一例のツリー構造図。FIG. 6 is a tree structure diagram illustrating an example of an analysis result obtained by performing language analysis processing in step S401 of FIG. 5 on the similar example original document shown in Table 1. 表1に示した類似用例訳文に対して図5のステップS402での言語解析処理を行った解析結果の一例のツリー構造図。FIG. 6 is a tree structure diagram showing an example of an analysis result obtained by performing language analysis processing in step S402 of FIG. 5 on the similar example translations shown in Table 1.

以下、本発明の実施の形態を説明する。図1は本発明の実施の形態に係わる機械翻訳装置11の機能ブロック図、図2は本発明の実施の形態に係わる機械翻訳装置のハードウエア構成を示すブロック構成図である。   Embodiments of the present invention will be described below. FIG. 1 is a functional block diagram of a machine translation apparatus 11 according to the embodiment of the present invention, and FIG. 2 is a block configuration diagram showing a hardware configuration of the machine translation apparatus according to the embodiment of the present invention.

まず、本発明の実施の形態に係わる機械翻訳装置のハードウエア構成について説明する。   First, the hardware configuration of the machine translation apparatus according to the embodiment of the present invention will be described.

図2において、機械翻訳装置11は、例えば一般的なコンピュータに機械翻訳プログラムなどのソフトウェアプログラムがインストールされ、そのソフトウェアプログラムが演算制御装置12のプロセッサ13において実行されることにより実現される。   In FIG. 2, the machine translation device 11 is realized by installing a software program such as a machine translation program in a general computer and executing the software program in the processor 13 of the arithmetic control device 12.

演算制御装置12は機械翻訳に関する各種演算を行うものであり、演算制御装置12はプロセッサ13とメモリ14とを有し、メモリ14には翻訳に関する機械翻訳プログラム15が記憶され、プロセッサ13により処理が実行される際には作業エリア16が用いられる。演算制御装置12の演算結果等は出力装置17である表示装置18に表示出力され、また、通信制御装置19を介して通信ネットワークに出力される。   The arithmetic control device 12 performs various arithmetic operations related to machine translation. The arithmetic control device 12 has a processor 13 and a memory 14. A memory translation program 15 is stored in the memory 14, and the processor 13 performs processing. When executed, the work area 16 is used. Calculation results and the like of the calculation control device 12 are displayed and output on the display device 18 that is the output device 17 and also output to the communication network via the communication control device 19.

入力装置20は演算制御装置12に情報を入力するものであり、例えば、マウス21、キーボード22、ディスクドライブ23、通信制御装置19から構成され、例えば、マウス21やキーボード22は表示装置18を介して演算制御装置12に各種指令を入力し、キーボード22、ディスクドライブ23、通信制御装置19は翻訳対象の文書を入力する。   The input device 20 is used to input information to the arithmetic control device 12, and includes, for example, a mouse 21, a keyboard 22, a disk drive 23, and a communication control device 19. For example, the mouse 21 and the keyboard 22 are connected via the display device 18. Then, various commands are input to the arithmetic and control unit 12, and the keyboard 22, the disk drive 23, and the communication control unit 19 input a document to be translated.

すなわち、ディスクドライブ23は翻訳対象の文書のファイルを記憶媒体に入出力するものであり、通信制御装置19は機械翻訳装置11をインターネットやLANなどの通信ネットワークに接続するものである。通信制御装置19はLANカードやモデムなどの装置であり、通信制御装置19を介して通信ネットワークと送受信したデータは入力信号又は出力信号として演算制御装置12に送受信される。さらに、演算制御装置12の演算結果や翻訳に必要な知識・規則を蓄積した翻訳辞書等を記憶するハードディスクドライブ(HDD)24が設けられている。   That is, the disk drive 23 inputs / outputs a file of a document to be translated to / from a storage medium, and the communication control device 19 connects the machine translation device 11 to a communication network such as the Internet or a LAN. The communication control device 19 is a device such as a LAN card or a modem, and data transmitted / received to / from the communication network via the communication control device 19 is transmitted / received to / from the arithmetic control device 12 as an input signal or an output signal. Further, a hard disk drive (HDD) 24 is provided for storing a calculation dictionary of the calculation control device 12 and a translation dictionary storing knowledge and rules necessary for translation.

次に、本発明の実施の形態に係わる機械翻訳装置11の機能構成について説明する。図1において、演算制御装置12内の各機能ブロックは、上述の機械翻訳プログラム15を構成する各プログラムに対応する。すなわち、プロセッサ13が機械翻訳プログラム15を構成する各プログラムを実行することで、演算制御装置12は、各機能ブロックとして機能することとなる。また、記憶装置25の各ブロックは、演算制御装置12内のメモリ14及びハードディスクドライブ24の記憶領域に対応する。   Next, a functional configuration of the machine translation apparatus 11 according to the embodiment of the present invention will be described. In FIG. 1, each functional block in the arithmetic control device 12 corresponds to each program constituting the machine translation program 15 described above. That is, when the processor 13 executes each program constituting the machine translation program 15, the arithmetic control device 12 functions as each functional block. Each block of the storage device 25 corresponds to a storage area of the memory 14 and the hard disk drive 24 in the arithmetic control device 12.

入力処理部26は、入力装置20から入力された第1言語の文章データを受け付け、記憶装置25に記憶させるものである。例えば、文章データがユーザ自身によりキーボード22等から直接入力されたり、記憶媒体を介してディスクドライブ23から入力されたときに、文章データを演算制御装置12内のメモリ14や記憶装置25内に入力し記憶するものである。   The input processing unit 26 receives text data in the first language input from the input device 20 and stores it in the storage device 25. For example, when text data is directly input by the user from the keyboard 22 or the like, or is input from the disk drive 23 via a storage medium, the text data is input into the memory 14 or the storage device 25 in the arithmetic control device 12. To remember.

文分割部27は、入力処理部26で受け付け記憶装置25に記憶した第1言語の文章データを文単位に分割し、翻訳対象原文としてメモリ14の作業エリア16に格納するものである。1文単位で分割された原文は、制御部28に受け渡される。   The sentence division unit 27 divides the sentence data of the first language received by the input processing unit 26 and stored in the storage device 25 into sentence units, and stores them in the work area 16 of the memory 14 as original sentences to be translated. The original text divided in units of one sentence is transferred to the control unit 28.

制御部28は、原文解析・翻訳部29、翻訳用例検索部30、差分対応付け部31、再対応付け可能判定部32、差分語句訳語取得部33、訳語置換部34、機械翻訳辞書35、翻訳用例データベース36、出力処理部37を制御するものである。   The control unit 28 includes an original text analysis / translation unit 29, a translation example search unit 30, a difference association unit 31, a reassociation determination unit 32, a difference word / phrase translation acquisition unit 33, a translation replacement unit 34, a machine translation dictionary 35, a translation The example database 36 and the output processing unit 37 are controlled.

原文解析・翻訳部29は、入力処理部26から入力され、文分割部27によって1文単位に分割された翻訳対象原文に対して、機械翻訳辞書35を参照しながら文の解析を行うとともに、翻訳を行うものである。   The source text analysis / translation unit 29 analyzes the text with reference to the machine translation dictionary 35 with respect to the source text to be translated, which is input from the input processing unit 26 and divided into single sentences by the text division unit 27, Translates.

翻訳用例検索部30は、文分割部27にて1文単位に分割されて入力された翻訳対象原文を検索キーとして翻訳用例データベース36から翻訳対象原文に類似する翻訳用例を類似用例原文及び用例訳文の対として検索するものである。   The translation example search unit 30 uses the translation target original text divided and input by the sentence splitting unit 27 as a search key as a search key from the translation example database 36 and uses the similar example original sentence and the example translation sentence. Search as a pair.

差分対応付け部31は、原文解析・翻訳部29による解析結果に基づいて、検索された類似用例原文と翻訳対象原文との差分を対応付けるとともに、当該差分に対応する類似用例訳文中の語句と翻訳対象原文中の語句とを対応付けるものである。   The difference associating unit 31 associates the difference between the searched similar example original and the translation target original based on the analysis result by the original sentence analyzing / translating unit 29, and translates the words and phrases in the similar example translated sentence corresponding to the difference. This is associated with a word or phrase in the target original text.

再対応付け可能判定部32は、差分対応付け部31において類似用例原文と翻訳対象原文との差分に1対1で対応する類似用例訳文中の語句の判定に失敗した場合に、前記差分対応付け部が差分と判定した類似用例原文中の語句、翻訳対象原文中の語句および類似用例訳文中で1対1の対応付けに失敗した語句に対して、それぞれの語句の範囲を拡大して再度対応付けを行うものである。   The reassociation determination unit 32 determines the difference association when the difference association unit 31 fails to determine a phrase in the similar example translation that corresponds one-to-one to the difference between the similar example original and the translation target text. For the words in the similar example source text that the part has determined to be the difference, the words in the source text to be translated, and the words that failed to be matched one-to-one in the similar example translation, expand the range of each word and respond again It is a thing to do.

差分語句訳語取得部33は、差分対応付け部31または再対応付け可能判定部32によって特定された原文中の差分に対応する第2言語による訳語を機械翻訳辞書35を参照して取得するものである。   The difference word / phrase translation acquisition unit 33 acquires a translation in the second language corresponding to the difference in the original text specified by the difference association unit 31 or the reassociation determination unit 32 with reference to the machine translation dictionary 35. is there.

訳語置換部34は、差分対応付け部31または再対応付け可能判定部32によって特定された類似用例訳文中の語句を、差分語句訳語取得部33によって取得した訳語で置き換えて訳文を生成するものである。   The translation replacement unit 34 generates a translation by replacing the phrase in the similar example translation specified by the difference association unit 31 or the reassociation determination unit 32 with the translation acquired by the difference phrase translation acquisition unit 33. is there.

機械翻訳辞書35は、入力した第1言語の原文の解析及び第二言語への翻訳に必要な語彙・規則を格納するものであり、記憶装置25内に形成されている。翻訳に必要な語彙・規則は、機械翻訳辞書35の語彙部35a、形態素解析規則部35b、構文解析規則部35c、変換規則部35d、生成規則部35eに格納されている。類似用例は翻訳用例データベース36に格納されている。   The machine translation dictionary 35 stores vocabulary and rules necessary for analyzing the input original text in the first language and translating it into the second language, and is formed in the storage device 25. Vocabulary / rules necessary for translation are stored in the vocabulary part 35a, morpheme analysis rule part 35b, syntax analysis rule part 35c, conversion rule part 35d, and generation rule part 35e of the machine translation dictionary 35. Similar examples are stored in the translation example database 36.

出力処理部37は、原文解析・翻訳部29によって生成された翻訳の結果を出力装置17に出力するものである。例えば、出力装置17としての表示装置13に表示出力する。出力装置17は表示装置13だけでなく、表示装置13による出力に代え、あるいは、表示装置13による出力に加えて、音声により音声出力装置に出力するようにしてもよいし、印刷装置に印刷出力するようにしてもよいし、ディスクドライブ23を介して記録媒体に出力するようにしてもよい。   The output processing unit 37 outputs the result of translation generated by the original text analysis / translation unit 29 to the output device 17. For example, display is output to the display device 13 as the output device 17. The output device 17 is not limited to the output from the display device 13 but may be output to the audio output device by voice in addition to the output from the display device 13 or in addition to the output from the display device 13 or may be output to the printing device. Alternatively, it may be output to a recording medium via the disk drive 23.

次に、本発明の実施の形態に係わる機械翻訳装置11での翻訳処理の内容について、日英翻訳を例にして説明する。図3は本発明の実施の形態に係わる機械翻訳装置の処理内容を示すフローチャートである。   Next, the contents of the translation processing in the machine translation apparatus 11 according to the embodiment of the present invention will be described using Japanese-English translation as an example. FIG. 3 is a flowchart showing the processing contents of the machine translation apparatus according to the embodiment of the present invention.

ユーザが入力装置20から翻訳対象の第1言語の文章データを入力すると、まず、入力処理部26は翻訳対象の文章データを受け付ける(S301)。入力された翻訳対象の文章データはメモリ14または記憶装置25に記憶される。   When the user inputs sentence data of the first language to be translated from the input device 20, first, the input processing unit 26 receives the sentence data to be translated (S301). The input sentence data to be translated is stored in the memory 14 or the storage device 25.

次に、文分割部27は、メモリ14または記憶装置25から翻訳対象の文章データを読み出して1文単位に分割する(S302)。分割された翻訳対象の文章データの1文である翻訳対象原文に対して、制御部28は、変数Iに「1」をセットし(S303)、I番目の翻訳対象原文を取り出す(S304)。I番目の翻訳対象原文はメモリ14の作業エリア16に取り出される。   Next, the sentence division unit 27 reads the sentence data to be translated from the memory 14 or the storage device 25 and divides it into one sentence unit (S302). For the translation target text that is one sentence of the divided text data to be translated, the control unit 28 sets “1” to the variable I (S303), and extracts the I th translation target text (S304). The I-th original text to be translated is taken out to the work area 16 of the memory 14.

次に、取り出されたI番目の翻訳対象原文に対して、原文解析・翻訳部29は、機械翻訳辞書35を参照して言語解析処理を行う(S305)。すなわち、原文解析・翻訳部29は機械翻訳辞書35の語彙部35a及び形態素解析規則部35bを参照して翻訳対象原文の形態素解析処理を行い、構文解析規則部35cを参照して構文解析処理を行い、翻訳対象原文を構成する各語の品詞、構文に関する情報を取得する。なお、ここで用いる構文解析処理その他の技術は、本発明に固有のものではなく、言語処理に関わる一般的な技術である。   Next, the original sentence analysis / translation unit 29 performs a language analysis process with reference to the machine translation dictionary 35 with respect to the taken-out original sentence to be translated (S305). That is, the source sentence analysis / translation unit 29 performs morpheme analysis processing of the translation target original sentence with reference to the vocabulary part 35a and the morpheme analysis rule part 35b of the machine translation dictionary 35, and performs syntax analysis processing with reference to the syntax analysis rule part 35c. To obtain information on the part of speech and syntax of each word constituting the original text to be translated. The parsing process and other techniques used here are not specific to the present invention, but are general techniques related to language processing.

図4は、表1に示した翻訳対象原文に対して図3のステップS305での言語解析処理を行った解析結果の一例のツリー構造図である。実線で囲まれた語句は形態素解析によって得られた文を構成する各要素であり、これら各要素をつなぐ線によって、各要素同士の構文上のつながり方が表現されている。このように文を構成する各語句の構文上のつながりを表した図はツリー構造と呼ばれる。   FIG. 4 is a tree structure diagram illustrating an example of an analysis result obtained by performing the language analysis processing in step S305 of FIG. 3 on the translation target original text shown in Table 1. Words and phrases surrounded by solid lines are each element constituting a sentence obtained by morphological analysis, and a syntactic connection between the elements is expressed by a line connecting these elements. A diagram showing the syntactical connection between the words constituting the sentence is called a tree structure.

続いて、翻訳用例検索部30は翻訳対象原文を検索キーとして翻訳用例データベース36から翻訳対象原文と同一または類似している翻訳用例を検索する(S306)。類似用例の検索は、翻訳対象原文を構成する各単語と一致する単語の割合から算出される文の一致度、その他の属性の一致などを考慮して行われる。   Subsequently, the translation example search unit 30 searches the translation example database 36 for a translation example that is the same as or similar to the translation target original text using the translation target original text as a search key (S306). The search for similar examples is performed in consideration of the degree of matching of sentences calculated from the ratio of words that match each word constituting the original text to be translated, the matching of other attributes, and the like.

なお、単語の一致の判定を行うに当たり、ステップS305で取得した言語処理の結果を用いて、表記の揺れは違いと見なさない処理を行うこともできる。表記の揺れとは、長音記号の有無などのカタカナ表記や送り仮名の表記の揺れや、漢字表記とひらがな表記の揺れ、送り仮名の有無の揺れなどを指している。もちろん、表記の揺れは吸収しない完全一致の翻訳用例のみを検索結果とする構成も可能である。また、文字・単語上の違いがあっても、違いの割合が特定の値以下の場合は違いを無視するというように、差異文字数ないしは差異単語数の割合の下限値を設けて検索の可否を制御する構成であってもよい。これにより、語句・文字の使われ方が類似した翻訳用例を抽出することもできる。この場合は、用例検索(ステップS306)のタイミングを原文言語解析(ステップS305)の後にする必要はない。辞書引き処理・形態素解析の結果を必要としないからである。   Note that in determining whether words match, it is possible to perform processing in which the fluctuation of the notation is not regarded as a difference, using the result of the language processing acquired in step S305. The notation of katakana refers to katakana notation such as the presence or absence of a long clef symbol, the shaking of a kana notation, the shaking of kanji and hiragana notation, the shaking of the presence or absence of a kana. Of course, it is also possible to employ a configuration in which only completely matching translation examples that do not absorb the fluctuation of the notation are used as search results. In addition, even if there is a difference between characters and words, if the difference ratio is less than a specific value, the difference is ignored. The structure to control may be sufficient. This makes it possible to extract translation examples that are similar in terms and phrases. In this case, the timing of the example search (step S306) need not be after the source language analysis (step S305). This is because the result of dictionary lookup / morpheme analysis is not required.

翻訳用例検索部30での用例検索では、複数の類似用例が検索される場合もあるが、最終的には類似度が最も高い用例を絞り込み処理対象とする。複数の類似用例から優先度の最も高い用例を決定するには、例えば、類似度、類似度が同じである場合には用例の登録者や登録日時などの基準を用いて行うのが一般的である。   In the example search in the translation example search unit 30, a plurality of similar examples may be searched, but the example having the highest similarity is finally selected as a target for narrowing down processing. In order to determine an example having the highest priority from a plurality of similar examples, for example, when the similarity and the similarity are the same, it is generally performed using criteria such as the registrant of the example and the registration date and time. is there.

制御部28は、類似用例が検索されたかどうかを判定し(S307)、翻訳用例検索部30により類似用例が検索された場合には、制御部28は類似用例をメモリ14の類似用例記憶エリアに記憶する。続いて、差分対応付け部31及び再対応付け可能判定部32は、処理対象の類似用例に対して対応付け再試行処理を含む差分対応付け処理を行う(S308)。   The control unit 28 determines whether or not a similar example has been searched (S307). When the similar example is searched by the translation example searching unit 30, the control unit 28 stores the similar example in the similar example storage area of the memory 14. Remember. Subsequently, the difference association unit 31 and the reassociation determination unit 32 perform difference association processing including association retry processing on the similar example to be processed (S308).

すなわち、ステップS308において、まず、差分対応付け部31は類似用例(類似用例原文と類似用例訳文)及び翻訳対象原文に対して差分対応付け処理を行い、差分対応付け部31における類似用例の原文中の差分に1対1に対応する類似用例訳文中の語句の判定に失敗した場合には、再対応付け可能判定部32は、差分と判定した語句及び類似用例中で1対1の対応付けに失敗した語句の範囲を拡大して、対応付け再試行処理を行う。このステップS308の詳細な処理内容については後述する。   That is, in step S308, first, the difference associating unit 31 performs difference associating processing on the similar example (similar example original sentence and similar example translated sentence) and the translation target original sentence. When the determination of the words in the similar example translation that corresponds one-to-one with the difference between the words fails, the re-association determination unit 32 performs the one-to-one association between the words determined to be the difference and the similar examples. The range of failed words is expanded and the association retry process is performed. Details of the processing in step S308 will be described later.

差分対応付け部31または再対応付け可能判定部32によって判定された翻訳対象原文中の差分語句に対して、差分語句訳語取得部33は機械翻訳辞書35の語彙部35aを参照してその訳語を取得する差分語句訳語取得処理を行う(S309)。その後、訳語置換部34は、差分語句訳語取得部33が取得した訳語を用いて、差分対応付け部31または再対応付け可能判定部32によって判定済みの差分語句に対応する類似用例訳文中の語句を置き換える訳語置換処理を行う(S310)。そして、訳語置換処理の結果得られた訳文をI番目の翻訳対象原文の翻訳結果とする。   For the difference word / phrase in the original text to be translated determined by the difference association unit 31 or the re-association determination unit 32, the difference word / phrase translation acquisition unit 33 refers to the vocabulary part 35a of the machine translation dictionary 35 and translates the translated word. A difference word / phrase translation acquisition process is performed (S309). Thereafter, the translation replacement unit 34 uses the translation acquired by the differential phrase translation acquisition unit 33 and uses the translation in the similar example translation corresponding to the differential phrase determined by the differential association unit 31 or the reassociation determination unit 32. A translated word replacement process is performed (S310). Then, the translation obtained as a result of the translation replacement process is taken as the translation result of the original translation target sentence.

一方、ステップS307の判定で、類似用例はないと判定された場合は、原文解析・翻訳部29は翻訳対象原文の翻訳処理を行う(S311)。すなわち、差分関連の処理を行わず(S308〜S310)を省略してステップS311に移行し、原文解析・翻訳部29によるI番目の原文1文の翻訳処理が行われる(S311)。   On the other hand, if it is determined in step S307 that there is no similar example, the source text analysis / translation unit 29 performs translation processing of the source text to be translated (S311). That is, the process related to the difference is not performed (S308 to S310), and the process proceeds to step S311. The original sentence analysis / translation unit 29 performs the translation process of the I-th original sentence (S311).

そして、出力処理部37は、ステップS310やステップS311の処理によって得られた翻訳結果を表示する(S312)。すなわち、出力処理部37は表示装置17に翻訳結果を表示する。表示装置17に表示される内容については、ステップS307で類似用例が検出されなかった場合には、ステップS311で得られた翻訳結果が表示される。ステップS307で類似用例が見つかり、かつステップS308の対応付け再試行処理を含む差分対応付け処理にて類似用例の原文中の差分に1対1対応する類似用例の訳文中の語句の判定が成功している場合には、類似用例訳文に対して、ステップS309で得られた翻訳対象原文の差分に対応する訳語を置き換えた訳文が表示される。   Then, the output processing unit 37 displays the translation result obtained by the processing of step S310 or step S311 (S312). That is, the output processing unit 37 displays the translation result on the display device 17. Regarding the content displayed on the display device 17, if no similar example is detected in step S307, the translation result obtained in step S311 is displayed. In step S307, a similar example is found, and in the difference association process including the association retry process in step S308, the phrase in the translation of the similar example corresponding one-to-one to the difference in the original text of the similar example is successfully determined. If it is, the translated text obtained by replacing the translation corresponding to the difference of the translation target original text obtained in step S309 is displayed for the similar example translated text.

ステップS307で類似用例が検出されてはいたが、ステップS308の対応付け再試行処理を含む差分対応付け処理にて類似用例原文中の差分に1対1対応する類似用例訳文中の語句の判定に失敗している場合には、ステップS307で検出された類似用例訳文が参考訳文として表示される。   Although a similar example was detected in step S307, in the difference association process including the association retry process in step S308, the phrase in the similar example translation that corresponds one-to-one with the difference in the similar example original sentence is determined. If it has failed, the similar example translation detected in step S307 is displayed as a reference translation.

そして、翻訳対象のすべての文章データについて処理が終了したかどうか、つまり全文章処理が終了かどうかを判定し(S313)、翻訳対象のすべての文章データに対する処理が終了している場合は処理を終了し、原文のすべての文に対する処理が終了していない場合には、変数Iに「1」を加算して(I=I+1)とし(S314)、ステップS304に戻る。   Then, it is determined whether or not processing has been completed for all text data to be translated, that is, whether or not all text processing has been completed (S313). If processing has been completed for all text data to be translated, processing is performed. When the processing is finished and the processing for all the original sentences is not finished, “1” is added to the variable I (I = I + 1) (S314), and the process returns to step S304.

図5は、図3のステップS308の対応付け再試行処理を含む差分対応付け処理の内容を示すフローチャートである。原文解析・翻訳部29は、類似用例原文と翻訳対象原文とをメモリ14の作業エリア16に取り出し、翻訳用例検索部30によって取得された類似用例原文に対して、言語解析処理を行う(S401)。   FIG. 5 is a flowchart showing the contents of the difference association process including the association retry process in step S308 of FIG. The original sentence analysis / translation unit 29 takes out the similar example original sentence and the translation target original sentence into the work area 16 of the memory 14, and performs a language analysis process on the similar example original sentence acquired by the translation example search part 30 (S401). .

図6は表1に示した類似用例原文に対して図5のステップS401での言語解析処理を行った解析結果の一例のツリー構造図である。実線で囲まれた語句は形態素解析によって得られた文を構成する各要素であり、これら各要素をつなぐ線によって、各要素同士の構文上のつながり方が表現されている。また、破線で囲まれた語句は、類似用例原文を構成する各要素に対する第2言語の訳語候補として語彙部35aに登録されている訳語候補のリストである。   FIG. 6 is a tree structure diagram showing an example of an analysis result obtained by performing the language analysis processing in step S401 of FIG. 5 on the similar example original text shown in Table 1. Words and phrases surrounded by solid lines are each element constituting a sentence obtained by morphological analysis, and a syntactic connection between the elements is expressed by a line connecting these elements. The words surrounded by a broken line are a list of candidate words registered in the vocabulary part 35a as second word candidate words for each element constituting the similar example original.

同様に、原文解析・翻訳部29は、類似用例訳文に対して言語解析処理を行う(S402)。図7は、表1に示した類似用例訳文に対して図5のステップS402での言語解析処理を行った解析結果の一例のツリー構造図である。実線で囲まれた語句は形態素解析によって得られた文を構成する各要素であり、これら各要素をつなぐ線によって、各要素同士の構文上のつながり方が表現されている。また、破線で囲まれた語句は、類似用例訳文を構成する各要素に対する第1言語の訳語候補として語彙部35aに登録されている訳語候補のリストである。訳語が複数あるものはコンマで区切って列挙し、訳語がないものについては「Φ」で表している。   Similarly, the source text analysis / translation unit 29 performs language analysis processing on the similar example translation (S402). FIG. 7 is a tree structure diagram showing an example of an analysis result obtained by performing the language analysis processing in step S402 of FIG. 5 on the similar example translations shown in Table 1. Words and phrases surrounded by solid lines are each element constituting a sentence obtained by morphological analysis, and a syntactic connection between the elements is expressed by a line connecting these elements. The words surrounded by a broken line are a list of candidate words registered in the vocabulary part 35a as candidate words of the first language for each element constituting the similar example translation. Items with multiple translations are listed separated by commas, and those with no translation are represented by “Φ”.

差分対応付け部31は、図3のステップS305において得られた言語解析結果(図4)と、図5のステップS401とにおいて得られた言語解析結果(図6)とを用いて、翻訳対象原文と類似用例原文との差分の判定を行う(S403)。これは、図4と図6とのツリー構造のマッチングにより、翻訳対象原文と類似用例原文の差分を判定する。これにより、表1の例の場合には、差分は以下の[1]のように判定される。これは、文字列の情報から判定された差分である。   The difference association unit 31 uses the language analysis result (FIG. 4) obtained in step S305 of FIG. 3 and the language analysis result (FIG. 6) obtained in step S401 of FIG. And the difference from the similar example original is determined (S403). This determines the difference between the translation target original and the similar example original by matching the tree structure between FIG. 4 and FIG. Thereby, in the case of the example of Table 1, a difference is determined like the following [1]. This is a difference determined from character string information.

[1]翻訳対象原文:(該当なし)−−類似用例原文:形容詞的名詞「遠隔」
差分対応付け部31は、当該差分に対応する類似用例原文中の語句と類似用例訳文中の語句との対応付けを行う(S404)。これは、図6と図7とのツリー構造を参照して行う。すなわち、類似用例原文と類似用例訳文との語句は以下の[A]により対応付けることにより行われる。差分対応付け部31は、差分対応付け処理として類似用例原文の構成要素ごとに行う(S404)。
[1] Original text to be translated: (N / A)-Similar example Original text: Adjective noun “remote”
The difference associating unit 31 associates the phrase in the similar example original text corresponding to the difference with the phrase in the similar example translation (S404). This is done with reference to the tree structure of FIGS. That is, the words of the similar example original sentence and the similar example translated sentence are associated by the following [A]. The difference associating unit 31 performs the difference associating process for each constituent element of the similar example original (S404).

[A−1]類似用例原文を構成する語句(第1言語)に対して、類似用例訳文(第2言語)を構成する各語句の訳語(第1言語)から一致するものを検索し、一致する訳語を持つ類似用例訳文の構成語を、類似用例原文の構成語に対応する類似用例訳文の対応語候補(第2言語)として抽出する。候補が複数存在すれば複数の候補を抽出する。 [A-1] For a phrase (first language) constituting a similar example original sentence, a search is made for a match from the translated words (first language) of each word constituting the similar example translation (second language), and a match is found. The constituent word of the similar example translation sentence having the translation word to be extracted is extracted as a corresponding word candidate (second language) of the similar example translation sentence corresponding to the constituent word of the similar example original sentence. If there are a plurality of candidates, a plurality of candidates are extracted.

[A−2]類似用例訳文を構成する各語句(第2言語)に対して、類似用例原文(第1言語)を構成する各語句の訳語(第2言語)から一致するものを検索し、一致する訳語を持つ類似用例原文の構成語を、類似用例訳文の構成語に対応する類似用例原文の対応語候補(第1言語)として抽出する。候補が複数存在すれば複数の候補を抽出する。 [A-2] For each word (second language) constituting the similar example translation, search for a match from the translation (second language) of each word constituting the similar example original (first language), The constituent words of the similar example original sentence having the matching translation are extracted as corresponding word candidates (first language) of the similar example original sentence corresponding to the constituent words of the similar example translated sentence. If there are a plurality of candidates, a plurality of candidates are extracted.

そして、差分対応付け部31は、類似用例原文の語句と類似用例訳文の語句とが1対1対応かどうかを判定し(S405)、1対1に対応が決まる場合には、対応付けられた語句を対応語句として確定し、これにより差分と類似用例訳文の語句の対応付けが確定する(S406)。   Then, the difference association unit 31 determines whether or not the words in the similar example original text and the words in the similar example translation sentence have a one-to-one correspondence (S405). The phrase is determined as the corresponding phrase, and thereby the correspondence between the difference and the phrase of the similar example translation sentence is determined (S406).

表1の例の場合には、類似用例原文の「使用する」は類似用例訳文の「use」、類似用例原文の「医療器具」は類似用例訳文の「medical device」、類似用例原文の「この」は類似用例訳文の「this」、類似用例原文の「脳内出血」は類似用例訳文の「cerebral hemorrhage」、類似用例原文の「遠隔治療」は類似用例訳文の「teletherapy」にそれぞれ対応付けられる。従って、類似用例原文中の差分「遠隔」は類似用例訳文中の語句に1対1の対応付けができないので、ステップS405の判定では、1対1の対応付けに失敗したことになる。   In the case of the example in Table 1, “Use” in the similar example source text is “use” in the similar example source text, “Medical device” in the similar example source text is “medical device” in the similar example source text, “This” in the similar example source text. ”Corresponds to the similar example translation“ this ”, the similar example original“ cerebral hemorrhage ”corresponds to the similar example translation“ cerebral hemorrhage ”, and the similar example original“ teletherapy ”corresponds to the similar example translation“ teletherapy ”. Accordingly, since the difference “remote” in the similar example original text cannot be correlated one-to-one with the words in the similar example translation, the one-to-one correlation has failed in the determination in step S405.

差分対応付け部31による差分の類似用例訳文中の語句への1対1の対応付けに失敗した場合には、再対応付け可能判定部32は、対応付けを行う語句の範囲の拡大が可能かどうか、つまり対応範囲拡大可能かどうかを判断する(S407)。   If the difference association unit 31 fails to associate one-to-one with the words in the similar example translation of the difference, can the reassociation determination unit 32 expand the range of the words to be associated? It is determined whether or not the corresponding range can be expanded (S407).

再対応付け可能判定部32は、1対1に対応が決まらない場合、以下の方法で対応付ける語句の範囲の拡大を試みる。対応付けの範囲が拡大可能かどうかは、下記の範囲拡大可能条件[B]を満たすかどうかで判定される。   The re-association determining unit 32 tries to expand the range of the words to be associated with each other by the following method when the one-to-one correspondence is not determined. Whether or not the range of correspondence can be expanded is determined by whether or not the following range expansion enabling condition [B] is satisfied.

[B]範囲拡大可能条件:検出された語句と構造ツリー上で連続している語句であり、かつ検出された語句と同じ品詞属性を持つか、または検出された語句を修飾可能な品詞であるものとする。 [B] Range expandable condition: a phrase that is continuous with the detected phrase on the structure tree, and has the same part of speech attribute as the detected phrase, or a part of speech that can modify the detected phrase Shall.

表1の例では、検索対象である「遠隔」は、「治療」及び「脳内出血」と構造ツリー上で連続しており、「名詞」という同じ品詞属性を持つので、再対応付け可能判定部32は範囲拡大可能条件を満たすと判定する。   In the example of Table 1, “remote” as the search target is continuous with “treatment” and “intracerebral hemorrhage” on the structure tree, and has the same part-of-speech attribute of “noun”. It is determined that 32 satisfies the range expansion enabling condition.

再対応付け可能判定部32は、範囲拡大可能条件を満たすと判定すると対応範囲を拡大する(S408)。範囲拡大は以下の条件で行われる。   When the re-association determination unit 32 determines that the range expansion enable condition is satisfied, the re-association determination unit 32 expands the corresponding range (S408). The range expansion is performed under the following conditions.

[B−1]類似用例原文を構成する語句(第1言語)に対して、類似用例訳文(第2言語)を構成する各語句の訳語(第1言語)から部分的に一致するものを検索し、見つかった訳語のうち一致していない部分を切り出し、その部分を訳語としてもつ類似用例原文の構成要素を検索する。 [B-1] Search for partially matching words (first language) constituting the similar example original sentence from the translated words (first language) of each word constituting the similar example translated sentence (second language) Then, an unmatched portion of the found translated word is cut out, and the constituent elements of the similar example original sentence having the portion as the translated word are searched.

[B−2]類似用例訳文を構成する語句(第2言語)に対して、類似用例原文(第1言語)を構成する各語句の訳語(第2言語)から部分的に一致するものを検索し、見つかった訳語のうち一致していない部分を切り出し、その部分を訳語としてもつ類似用例原文の構成要素を検索する。 [B-2] With respect to a phrase constituting the similar example translation (second language), a search is performed for a partial match from the translation (second language) of each phrase constituting the similar example original (first language). Then, an unmatched portion of the found translated word is cut out, and the constituent elements of the similar example original sentence having the portion as the translated word are searched.

表1に示した例では、類似用例原文の構成要素「治療」と、類似用例訳文の構成要素「teletherapy」の訳語である「遠隔治療」とは“治療”の部分が一致している。この場合、「遠隔治療」の一致していない部分である“遠隔”を切り出し、“遠隔”を訳語として持つ類似用例原文の構成要素が存在するかどうかを検索する。   In the example shown in Table 1, the component “treatment” of the similar example original text and the “teletherapy” which is the translated word of the component “teletherapy” of the similar example translation match the “treatment” portion. In this case, “remote”, which does not match “remote treatment”, is cut out, and a search is performed as to whether or not a similar example original sentence component having “remote” as a translated word exists.

または、類似用例原文のツリー構造において、「治療」に連続しておりかつ「治療」と同一の属性を持つ品詞または「治療」を修飾する語と連結し、その結果作成された合成語が「遠隔治療」と一致するかどうかを判定する。   Alternatively, in the tree structure of the original text of the similar example, the part of speech or the word that modifies “treatment” that is connected to “treatment” and has the same attribute as “treatment” is connected, and the resultant composite word is “ It is determined whether or not it matches “teletherapy”.

この結果、訳語に「tele-」を持つ、「治療」を修飾可能な語(形容詞的名詞)である「遠隔」が検出される。最終的に、類似用例原文の「治療」から、「遠隔」+「治療」へと対応範囲が拡大される。   As a result, “distant”, which is a word (adjective noun) that can modify “treatment” having “tele-” as a translation, is detected. Finally, the corresponding range is expanded from “treatment” in the original text of similar examples to “remote” + “treatment”.

そして、ステップS408に戻り、差分対応付け部31は、再対応付け可能判定部32で拡大された類似用例原文の「遠隔」+「治療」を基に、差分を以下の[2]のように判定する。   Then, the process returns to step S408, and the difference associating unit 31 sets the difference as [2] below based on the similar example original “remote” + “treatment” expanded by the re-association determining unit 32. judge.

[2]翻訳対象原文:名詞「治療」−−類似用例原文:形容詞的名詞「遠隔」+名詞「治療」
表1の例では、差分と判定された語が名詞を修飾する語である場合は、修飾されている名詞にまで範囲を拡大した差分の別候補[2]も差分として判定する。これにより、差分対応付け部31のステップS404の判定で、類似用例原文の「遠隔治療」と類似用例訳文の「teletherapy」とが対応付けられる。つまり、以上の対応付け処理によって、類似用例原文と類似用例訳文とを構成する各語句の間に以下の対応関係が得られる。
[2] Original text to be translated: noun "treatment" --- similar example
In the example of Table 1, when the word determined to be a difference is a word that modifies a noun, another candidate for difference [2] whose range has been expanded to a modified noun is also determined as a difference. Accordingly, the “remote treatment” of the similar example original text and the “teletherapy” of the similar example translation text are associated with each other in the determination in step S404 of the difference associating unit 31. In other words, the following correspondence is obtained between the words constituting the similar example original sentence and the similar example translated sentence by the above association processing.

使用する−−use
医療器具−−medical device
この−−this
脳内出血−−cerebral hemorrhage
遠隔治療−−teletherapy
ステップS405で類似用例原文の語句と類似用例訳文の語句とが1対1対応であると判定され、対応付けられた語句を対応語句として確定する。これにより差分「治療」と類似用例訳文の語句「teletherapy」との対応付けが確定する(S406)。なお、上記のような条件が設定してあるため、例えば、類似用例原文の「医療器具」に「治療用」という修飾語が付いていたとしても、ツリー構造上かけ離れた位置に存在するため検索対象にはならない。
Use --use
Medical device--medical device
This --this
Cerebral hemorrhage
Teletherapy--teletherapy
In step S405, it is determined that the phrase of the similar example original sentence and the phrase of the similar example translation have a one-to-one correspondence, and the associated phrase is determined as the corresponding phrase. As a result, the correspondence between the difference “treatment” and the phrase “teletherapy” of the similar example translation is determined (S406). In addition, since the conditions as described above are set, for example, even if the modifier “therapeutic” is added to the “medical device” in the similar example original text, the search is performed because it exists in a position far away on the tree structure. Not subject.

以上の結果を用いて、差分語句訳語取得部33は、翻訳対象原文、類似用例原文、類似用例訳文の3者間で、以下のような1対1対応が取れていると判定する。なお、差分[1]では、3者間の1対1対応は取れないため、この場合採用されたのは差分[2]である。   Using the above results, the difference word / phrase translation acquisition unit 33 determines that the following one-to-one correspondence is obtained among the translation target original sentence, the similar example original sentence, and the similar example translated sentence. In addition, since the one-to-one correspondence between the three parties cannot be obtained in the difference [1], the difference [2] is adopted in this case.

翻訳対象原文「治療」−−類似用例原文「遠隔治療」−−類似用例訳文「teletherapy」
以上の判定結果を用いて、差分語句訳語取得部33は、翻訳対象原文の差分である「治療」の訳語を語彙部35aを参照して取得する(S309)。図6の中に記述してある通り、語彙部35aに登録されている「治療」の訳語候補には「treatment」、「therapy」等がある。これらの訳語候補のうち、最初に登録されている「treatment」を用いて、類似用例訳文の差分語句に対応する類似用例訳文中の語句「teletherapy」を訳語置換部34が置き換える(S310)。これにより、表1の例では表2に示すような類似用例訳文が得られる。

Figure 0005039114
Original text "Treatment"-Similar example Original text "Teletherapy"-Similar example translation "teletherapy"
Using the above determination results, the difference word / phrase translation acquisition unit 33 acquires the translation of “treatment”, which is the difference of the translation target original text, with reference to the vocabulary unit 35a (S309). As described in FIG. 6, candidate words for “treatment” registered in the vocabulary part 35 a include “treatment” and “therapy”. Of these candidate translations, the word “teletherapy” in the similar example translation corresponding to the difference phrase of the similar example translation is replaced by the translation replacement unit 34 using “treatment” registered first (S310). Thereby, in the example of Table 1, similar example translations as shown in Table 2 are obtained.
Figure 0005039114

次に、語句の範囲を拡大する際の条件については、前述した範囲拡大可能条件[B]以外にも、「文字種を限定する」という条件を設定することもできる。すなわち、文字種が範囲拡大の元となる語句と同じであるか、ひらがなを含まない文字種で構成されている(カタカナ、アルファベット、漢字のみから構成されている)という条件を設定することもできる。この条件の下では、語彙部35aに登録されていない未知語に対しても、範囲拡大の対象とすることができる。例えば、類似用例原文中に「ビービー・エイジェンシー」という語句が存在しており、「ビービー」は語彙部35aの日英辞書には未登録だが、英日辞書には登録されている(「BB device」の訳語として「BB agency」が登録されている)ような場合には、原文の「BB」の品詞が不明でも、文字種にひらがなを含まない語であることから、範囲拡大の対象とすることができる。   Next, as a condition for expanding the range of a word / phrase, in addition to the above-described range expansion enabling condition [B], a condition “limit character type” may be set. That is, it is possible to set a condition that the character type is the same as the word from which the range is expanded, or is composed of a character type that does not include hiragana (consisting only of katakana, alphabet, and kanji). Under this condition, an unknown word that is not registered in the vocabulary part 35a can be targeted for range expansion. For example, the phrase “BB Agency” exists in the original text of the similar example, and “BB” is not registered in the Japanese-English dictionary of the vocabulary part 35a but is registered in the English-Japanese dictionary (“BB device” "BB agency" is registered as a translation of ")", the word type does not contain hiragana even if the part of speech of the original "BB" is unknown. Can do.

以上説明したように、本発明の実施の形態では、翻訳対象原文と類似用例原文との差分を判定し、判定された差分に対する類似用例訳文中の語句の1対1での対応付けに失敗した場合に、対応付け処理を再試行することができる。再試行を行うことによって、対応付け失敗の確率を小さくすることができる。   As described above, in the embodiment of the present invention, the difference between the translation target text and the similar example original text is determined, and the one-to-one correspondence between the phrase in the similar example translation and the determined difference fails. In this case, the association process can be retried. By performing the retry, the probability of association failure can be reduced.

再試行の際には、差分と判定した語句の前後の単語を対象に、品詞等に関する特定の条件に基づいて差分の範囲を拡大するので、類似用例の原文と訳文を構成する各語句の対応付けの候補の中から、構文上つながりがあり、ひとつの合成語とみなせる候補を正確に絞り込むことができる。また、機械翻訳の機械翻訳辞書に登録のない未知語であり、品詞などの属性が不明でも、語句拡大の対象とすることができる。   When retrying, the range of differences is expanded based on specific conditions related to parts of speech, etc., for the words before and after the word determined to be a difference, so the correspondence between the original sentence of the similar example and each word constituting the translated sentence Among the candidate candidates, there is a syntactic connection, and the candidates that can be regarded as one compound word can be accurately narrowed down. Also, an unknown word that is not registered in the machine translation dictionary of machine translation, and even if an attribute such as a part of speech is unknown, the word can be expanded.

なお、本発明の実施の形態では、日英翻訳について説明したが、日英翻訳だけでなく、英日翻訳及び他の言語間での翻訳、例えば中日翻訳や日中翻訳にも適用可能であることは言うまでもない。   In the embodiment of the present invention, Japanese-English translation has been described. However, it is applicable not only to Japanese-English translation but also to English-Japanese translation and translation between other languages, such as Chinese-Japanese translation and Japanese-Chinese translation. Needless to say.

11…機械翻訳装置、12…演算制御装置、13…プロセッサ、14…メモリ、15…機械翻訳プログラム、16…作業エリア、17…出力装置、18…表示装置、19…通信制御装置、20…入力装置、21…マウス、22…キーボード、23…ディスクドライブ、24…ハードディスクドライブ、25…記憶装置、26…入力処理部、27…文分割部、28…制御部、29…原文解析・翻訳部、30…翻訳用例検索部、31…差分対応付け部、32…再対応付け可能判定部、33…差分語句訳語取得部、34…訳語置換部、35…機械翻訳辞書、35a…語彙部、35b…形態素解析規則部、35c…構文解析規則部、
35d…変換規則部、35e…生成規則部、36…翻訳用例データベース、37…出力処理部
DESCRIPTION OF SYMBOLS 11 ... Machine translation apparatus, 12 ... Operation control apparatus, 13 ... Processor, 14 ... Memory, 15 ... Machine translation program, 16 ... Work area, 17 ... Output device, 18 ... Display apparatus, 19 ... Communication control apparatus, 20 ... Input Device: 21 ... Mouse, 22 ... Keyboard, 23 ... Disk drive, 24 ... Hard disk drive, 25 ... Storage device, 26 ... Input processing unit, 27 ... Sentence division unit, 28 ... Control unit, 29 ... Original text analysis / translation unit, DESCRIPTION OF SYMBOLS 30 ... Translation example search part, 31 ... Difference matching part, 32 ... Re-association possible judgment part, 33 ... Difference word phrase translation acquisition part, 34 ... Translation word replacement part, 35 ... Machine translation dictionary, 35a ... Vocabulary part, 35b ... Morphological analysis rule part, 35c ... Syntax analysis rule part,
35d ... Conversion rule part, 35e ... Generation rule part, 36 ... Example database for translation, 37 ... Output processing part

Claims (4)

機械翻訳プログラム、翻訳対象の第1言語を翻訳目的の第2言語に翻訳するための機械翻訳辞書、翻訳対象の第1言語の文と翻訳目的の第2言語の文との対訳からなる翻訳用例を類似用例原文及び類似用例訳文の対として蓄積した翻訳用例データベースを記憶した記憶装置と、翻訳対象原文を入力する入力装置と、翻訳後の第2言語の訳文を出力する出力装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えた機械翻訳装置において、前記入力装置から入力された翻訳対象原文を前記機械翻訳辞書を参照して解析するとともに第2言語に翻訳を行う原文解析・翻訳部と、前記翻訳対象原文に類似する翻訳用例を類似用例原文及び類似用例訳文の対として前記翻訳用例データベースから検索する翻訳用例検索部と、前記原文解析・翻訳部による解析結果に基づいて、前記翻訳用例検索部で検索された前記類似用例原文と前記翻訳対象原文との差分を判定するともに当該差分に対応する前記類似用例訳文中の語句と前記翻訳対象原文中の語句とを対応付ける差分対応付け部と、前記差分対応付け部において差分と判定した類似用例原文中の語句、翻訳対象原文中の語句および類似用例訳文中で1対1の対応付けに失敗した語句に対して、それぞれの語句の範囲を拡大して再度対応付けを行う再対応付け可能判定部と、前記差分対応付け部及び前記再対応付け可能判定部によって対応付けられた前記翻訳対象原文中の差分の語句に対して前記機械翻訳辞書を参照して対応する第2言語による訳語を取得する差分語句訳語取得部と、前記差分対応付け部及び前記再対応付け可能判定部によって対応付けられた類似用例訳文中の語句を前記差分語句訳語取得部によって取得した訳語に置き換えて訳文を生成する訳語置換部とを備えたことを特徴とする機械翻訳装置。 Machine translation program, machine translation dictionary for translating a first language to be translated into a second language for translation, translation example comprising a translation of a sentence in the first language to be translated and a sentence in the second language to be translated A storage device storing a translation example database that stores a similar example original and a similar example translation as a pair, an input device that inputs a translation target original, an output device that outputs a translated second language translation, and the machine In a machine translation device comprising a calculation control device for calculating and executing a translation program, a source text analysis / analysis for analyzing a source text input from the input device with reference to the machine translation dictionary and translating into a second language A translation example, a translation example search unit that searches the translation example database as a pair of a translation example of a similar example and a translation example of a similar example, and the source solution - based on the analysis result obtained by the translation unit, the phrase of the similar example in translation together corresponding to the difference between the determined difference between the Translation example search section the similar example textual retrieved in said translated original text A one-to-one correspondence between a difference association unit that associates words in a translation target original, a word in a similar example original determined as a difference in the difference association unit, a phrase in a translation target original, and a similar example translation The re-association determination unit that expands the range of each word and re-associates with the words that failed, and the translation associated with the difference association unit and the re-association determination unit A difference word / phrase translation acquisition unit that acquires a translation in a second language corresponding to a difference word / phrase in the target original text by referring to the machine translation dictionary, the difference association unit, and the reassociation Possible determination unit machine translation apparatus is characterized in that a translation replacement unit for generating a translated sentence by replacing the word similar example in translation associated with the translation obtained by the difference word translation acquisition unit by. 前記再対応付け可能判定部は、前記語句の範囲を拡大して再度対応付けを行う条件として、その語句と構造ツリー上で連続しており、その語句と同じ品詞属性を持つか、またはその語句を修飾可能な品詞であることを条件とすることを特徴とする請求項1記載の機械翻訳装置。 The re-association determination unit expands the range of the word as a condition for re-association, and is continuous with the word on the structure tree and has the same part-of-speech attribute as the word or the word 2. The machine translation apparatus according to claim 1, wherein: 前記再対応付け可能判定部は、前記語句の範囲を拡大して再度対応付けを行う条件として、その語句と構造ツリー上で連続しており、文字種がその語句と同じであるか、ひらがなを含まない文字種から構成されることを条件とすることを特徴とする請求項1記載の機械翻訳装置。 The re-association determination unit, as a condition for re-associating by expanding the range of the word, the word is continuous on the structure tree and the character type is the same as the word or includes hiragana 2. The machine translation apparatus according to claim 1, wherein the machine translation apparatus is provided on the condition that it is composed of no character type. 機械翻訳プログラム、翻訳対象の第1言語を翻訳目的の第2言語に翻訳するための機械翻訳辞書、翻訳対象の第1言語の文と翻訳目的の第2言語の文との対訳からなる翻訳用例を類似用例原文及び類似用例訳文の対として蓄積した翻訳用例データベースを記憶した記憶装置と、翻訳対象原文を入力する入力装置と、翻訳後の第2言語の訳文を出力する出力装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えた機械翻訳装置として機能させるためのコンピュータにおいて、コンピュータに、前記入力装置から入力された翻訳対象原文を前記機械翻訳辞書を参照して解析するとともに第2言語に翻訳を行う機能と、前記翻訳対象原文に類似する翻訳用例を類似用例原文及び類似用例訳文の対として前記翻訳用例データベースから検索する機能と、前記翻訳対象原文の解析結果に基づいて、前記検索された前記類似用例原文と前記翻訳対象原文との差分を判定するともに当該差分に対応する前記類似用例訳文中の語句と前記翻訳対象原文中の語句とを対応付ける機能と、前記差分と判定した類似用例原文中の語句、翻訳対象原文中の語句および類似用例訳文中で1対1の対応付けに失敗した語句に対してそれぞれの語句の範囲を拡大して再度対応付けを行う機能と、対応付けられた前記翻訳対象原文中の差分の語句に対して前記機械翻訳辞書を参照して対応する第2言語による訳語を取得する機能と、対応付けられた類似用例訳文中の語句を前記取得した訳語に置き換えて訳文を生成する機能とを実現させるための機械翻訳プログラム。 Machine translation program, machine translation dictionary for translating a first language to be translated into a second language for translation, translation example comprising a translation of a sentence in the first language to be translated and a sentence in the second language to be translated A storage device storing a translation example database that stores a similar example original and a similar example translation as a pair, an input device that inputs a translation target original, an output device that outputs a translated second language translation, and the machine In a computer for causing a computer to function as a machine translation device having a computation control device for computing and executing a translation program, the computer analyzes the original text to be translated input from the input device with reference to the machine translation dictionary and The translation example database as a pair of a translation example similar to the translation target sentence and a similar example original sentence and a similar example translation sentence. A function to search, on the basis of the translated textual analysis results, the phrase of the similar example in translation together corresponding to the difference between determining the difference between the the retrieved the similar example original and the translated original text A function for associating a phrase in the original text to be translated with a phrase in the similar example original sentence determined to be the difference, a phrase in the original text to be translated, and a phrase that failed to correspond one-to-one in the similar example translation sentence A function for expanding the range of each word and re-associating, and referring to the machine translation dictionary for the corresponding difference word in the original text to be translated, and acquiring a translation in the corresponding second language And a function for generating a translation by replacing a word / phrase in a corresponding similar example translation with the acquired translation.
JP2009260525A 2009-11-14 2009-11-14 Machine translation apparatus and program Expired - Fee Related JP5039114B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009260525A JP5039114B2 (en) 2009-11-14 2009-11-14 Machine translation apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009260525A JP5039114B2 (en) 2009-11-14 2009-11-14 Machine translation apparatus and program

Publications (2)

Publication Number Publication Date
JP2011107852A JP2011107852A (en) 2011-06-02
JP5039114B2 true JP5039114B2 (en) 2012-10-03

Family

ID=44231268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009260525A Expired - Fee Related JP5039114B2 (en) 2009-11-14 2009-11-14 Machine translation apparatus and program

Country Status (1)

Country Link
JP (1) JP5039114B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11048886B2 (en) 2017-02-07 2021-06-29 Panasonic Intellectual Property Management Co., Ltd. Language translation by dividing character strings by fixed phases with maximum similarity

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4643183B2 (en) * 2004-06-25 2011-03-02 シャープ株式会社 Translation apparatus and translation program
JP4845857B2 (en) * 2007-11-06 2011-12-28 株式会社東芝 Machine translation apparatus and machine translation program
KR20100134618A (en) * 2008-02-29 2010-12-23 샤프 가부시키가이샤 Information processing device, method, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11048886B2 (en) 2017-02-07 2021-06-29 Panasonic Intellectual Property Management Co., Ltd. Language translation by dividing character strings by fixed phases with maximum similarity

Also Published As

Publication number Publication date
JP2011107852A (en) 2011-06-02

Similar Documents

Publication Publication Date Title
JP4504555B2 (en) Translation support system
JP2006012168A (en) Method for improving coverage and quality in translation memory system
JP2008262587A (en) Example based machine translation system
JPH03185561A (en) Method for inputting european word
JP2013206397A (en) Machine translation device, machine translation method, and machine translation program
JP2018055670A (en) Similar sentence generation method, similar sentence generation program, similar sentence generation apparatus, and similar sentence generation system
JP2007072594A (en) Translation device, translation method, translation program and medium
JP5025603B2 (en) Machine translation apparatus, machine translation program, and machine translation method
JP5039114B2 (en) Machine translation apparatus and program
JP5298834B2 (en) Example sentence matching translation apparatus, program, and phrase translation apparatus including the translation apparatus
JP2007087157A (en) Translation system, translation device, translation method, and program
JP5148583B2 (en) Machine translation apparatus, method and program
JP5909123B2 (en) Machine translation apparatus, machine translation method and program
JP4845857B2 (en) Machine translation apparatus and machine translation program
JP5302784B2 (en) Machine translation method and system
JP4881399B2 (en) Bilingual information creation device, machine translation device, and program
JP2006024114A (en) Mechanical translation device and mechanical translation computer program
JP3999771B2 (en) Translation support program, translation support apparatus, and translation support method
JP2009116585A (en) Machine translation device and machine translation program
JP2009059290A (en) Device, method, and program for supporting preparation of foreign language document
JP5032453B2 (en) Machine translation apparatus and machine translation program
JP2006252290A (en) Machine translation device and computer program
JP3244286B2 (en) Translation processing device
JP2011210193A (en) Machine translation device and machine translation program
JP3884001B2 (en) Language analysis system and method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120706

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5039114

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees