JP4643183B2 - Translation apparatus and translation program - Google Patents

Translation apparatus and translation program Download PDF

Info

Publication number
JP4643183B2
JP4643183B2 JP2004188259A JP2004188259A JP4643183B2 JP 4643183 B2 JP4643183 B2 JP 4643183B2 JP 2004188259 A JP2004188259 A JP 2004188259A JP 2004188259 A JP2004188259 A JP 2004188259A JP 4643183 B2 JP4643183 B2 JP 4643183B2
Authority
JP
Japan
Prior art keywords
sentence
language
translation
example sentence
bilingual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004188259A
Other languages
Japanese (ja)
Other versions
JP2006011842A (en
Inventor
毅 九津見
いち子 佐田
直子 篠崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004188259A priority Critical patent/JP4643183B2/en
Publication of JP2006011842A publication Critical patent/JP2006011842A/en
Application granted granted Critical
Publication of JP4643183B2 publication Critical patent/JP4643183B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

この発明は、翻訳装置および翻訳プログラムに関し、より詳細には、第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置および翻訳プログラムに関する。   The present invention relates to a translation apparatus and a translation program, and more specifically, a translation that translates from a first language to a second language using a first language example sentence and a second language example sentence corresponding to the first language example sentence. The present invention relates to an apparatus and a translation program.

翻訳装置として従来から広く使われている手法は、原語(第1言語)の文章を構成する規則を、訳文言語(第2言語)の規則と対応させ、規則に基づいて翻訳文(第2言語)を生成する、いわゆる規則主導型翻訳装置である。標準的な構文を持つ文章にこの手法を適用した場合は違和感のない翻訳ができるが、やや例外的な構文を持つ文章に対しては不自然な表現になりやすかった。   A technique that has been widely used as a translation device in the past is that a rule that constitutes a sentence of a source language (first language) is made to correspond to a rule of a translated language (second language), and a translated sentence (second language) is based on the rule. ) Is a so-called rule-driven translation device. When this method is applied to a sentence with a standard syntax, it can be translated without any sense of incongruity, but it tends to be an unnatural expression for a sentence with a somewhat unusual syntax.

この欠点を改善するために、人間の翻訳成果や実際の第2言語文の用例をデータベース化して訳文生成に使用する、例文主導型もしくは蓄積例文利用型と呼ばれる翻訳支援装置が知られている。   In order to remedy this drawback, there is known a translation support device called an example sentence-driven type or an accumulated example sentence use type, which is used to generate a translation by creating a database of examples of human translation results and actual second language sentences.

そのような翻訳装置の一例として、用例を用例データベースに蓄積しておくと共に言語の単語を意味の類似性に基づいて木構造に階層化した辞書データベースを用い、原文(入力文)と用例の類似性を数値計算して、その数値が最小である用例を検索し、検索結果に従って翻訳する用例主導型翻訳装置が知られている(例えば、特許文献1参照)。さらに、入力文を構文単位に分割してからマッチングを行う手法が知られている(例えば、特許文献2参照)。あるいは、原文に類似する例文の訳文を編集可能に表示し、ユーザが表示された類似の訳文を編集して原文を翻訳するようにした翻訳支援装置が知られている(例えば、特許文献3参照)。また、それに基づいて第1言語と第2言語の対訳文を蓄積した対訳データベースの検索によって翻訳を行う翻訳メモリ装置を備え、機械翻訳装置で翻訳した対訳情報と翻訳メモリ装置で翻訳した対訳情報を相互に取り込んで連携させ、翻訳作業の自動化を高める翻訳支援装置が知られている(例えば、特許文献4参照)。
特許第2609173号公報 特開平10−21243号公報 特開平09−245040号公報 特開2002−278964号公報
As an example of such a translation device, use of a dictionary database in which examples are stored in an example database and words of a language are hierarchized into a tree structure based on similarity in meaning, the similarity between the original sentence (input sentence) and the example 2. Description of the Related Art An example-driven translation device is known in which a numerical value is calculated, an example having the smallest value is searched, and translation is performed according to the search result (see, for example, Patent Document 1). Furthermore, a technique is known in which matching is performed after an input sentence is divided into syntax units (see, for example, Patent Document 2). Alternatively, a translation support device is known in which a translation of an example sentence similar to the original sentence is displayed in an editable manner, and the user translates the original sentence by editing the similar translated sentence displayed (see, for example, Patent Document 3). ). In addition, a translation memory device that performs translation by searching a bilingual database that stores bilingual sentences in the first language and the second language based on the translation information, the bilingual information translated by the machine translation device and the bilingual information translated by the translation memory device are provided. There is known a translation support device that captures and cooperates with each other to improve automation of translation work (see, for example, Patent Document 4).
Japanese Patent No. 2609173 JP-A-10-21243 JP 09-2445040 A JP 2002-278964 A

しかしながら、用例データベースと共に木構造に階層化した辞書データベースを用いる手法は、用例と辞書との両方をデータベースとして備える必要があり、膨大なデータを作成する必要がある。このため、開発に要する作業工数とコストの面の負担が大きい。類似の例文を表示してユーザが編集する手法はユーザの負担が大きい。また、入力文を構文単位に分割する手法は、構文解析手段を必要とし、用例データベースと構文解析辞書を用意する作業工数とコストの負担が大きい。翻訳メモリ装置と機械翻訳装置を備える手法もそれらの両方を用意するための作業工数とコスト面の負担が大きい。   However, a method using a dictionary database hierarchized in a tree structure together with an example database needs to include both the example and the dictionary as a database, and it is necessary to create a huge amount of data. For this reason, the burden of the work man-hour and cost which are required for development is large. The method of displaying similar example sentences and editing by the user places a heavy burden on the user. Moreover, the method of dividing the input sentence into syntax units requires syntax analysis means, and the burden of working man-hours and cost for preparing the example database and the syntax analysis dictionary is large. A technique including a translation memory device and a machine translation device also has a large work man-hour and cost burden for preparing both of them.

この発明が解決しようとする問題点は、大規模なデータベースを必要とせず、しかも用例データベースのみに基づいて自然で質のよい翻訳を自動的に行うことができる翻訳装置を提供することである。   The problem to be solved by the present invention is to provide a translation apparatus that does not require a large-scale database and can automatically perform natural and high-quality translation based only on the example database.

この発明は、第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、翻訳すべき第1言語の原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第1言語例文中の前記相違箇所に対応する第2言語例文の語句を抽出し当該第2言語の語句を原文中の前記相違箇所の第1言語の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該第1言語の語句に対応する第2言語の訳語で置換した訳文を作成する訳文生成部と、原文、原文に類似する第1言語例文、前記第1言語例文に対応する第2言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備える翻訳装置を提供する。   The present invention is a translation device that translates from a first language to a second language using a first language example sentence and a second language example sentence corresponding to the first language example sentence, the first language example sentence, Information related to the composition of phrases in one language example sentence, second language example sentences corresponding to the first language example sentences, information related to the composition of words in the second language example sentences, phrases in the first language example sentences and phrases in the second language example sentences A bilingual example sentence storage unit for storing a plurality of sets of bilingual example sentences including information on correspondence with the text, and a bilingual example sentence search unit for retrieving a first language example sentence similar to the original sentence of the first language to be translated from a plurality of sets of bilingual example sentences And a difference part determination unit for determining a difference part between the original sentence and the first-language example sentence of the searched bilingual example sentence, and a phrase of the second language example sentence corresponding to the difference part in the first language example sentence is extracted. And the second language phrase is the first word of the difference in the original text. A synthesizing unit that creates a synthesized sentence that is replaced with the phrase of the above; a translation generating unit that creates a translated sentence in which a phrase in the original sentence included in the synthesized sentence is replaced with a translated word of the second language corresponding to the phrase of the first language; There is provided a translation apparatus including an original sentence, a first language example sentence similar to the original sentence, a second language example sentence corresponding to the first language example sentence, an output part that outputs at least one of a synthesized sentence and a translated sentence.

また、この発明は、第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、第1言語の原文を入力する入力部と、第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成部と、生成された訳文を出力する出力部とを備える翻訳装置を提供する。   The present invention is also a translation device for translating from a first language to a second language using a first language example sentence and a second language example sentence corresponding to the first language example sentence, wherein the original text of the first language A first language example sentence, information about the configuration of the phrase of the first language example sentence, a second language example sentence corresponding to the first language example sentence, information about the configuration of the phrase of the second language example sentence, A bilingual example sentence storage unit for storing a plurality of sets of bilingual example sentences including information on correspondence between the phrases of the first language example sentences and the phrases of the second language example sentences, and a plurality of sets of bilingual example sentences of first language example sentences similar to the original sentence A bilingual example sentence search unit for searching from, a difference part determining unit for determining a difference between the original sentence and the first language example sentence of the searched bilingual example sentence, and a bilingual example sentence related to the phrase of the difference part in the original sentence Translation is determined based on information obtained from And a translation generation unit that creates a translation by substituting a phrase of the second language example sentence corresponding to the difference in the first language example sentence with the determined translation, and an output unit that outputs the generated translation A translation device is provided.

この発明の翻訳装置は、翻訳すべき第1言語の原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第1言語例文中の前記相違箇所に対応する第2言語例文の語句を抽出し当該第2言語の語句を原文中の前記相違箇所の第1言語の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該第1言語の語句に対応する第2言語の訳語で置換した訳文を作成する訳文生成部とを備えて合成文あるいは訳文を作成するので、合成文の生成に際して対訳例文記憶部に記憶された複数組の対訳例文、即ち用例データベース以外に構文解析辞書などの大規模なデータベースを必要とせず、しかも用例データベースに基づいて質のよい翻訳支援情報を出力することができる。   The translation apparatus of the present invention includes a parallel example sentence search unit that searches a plurality of pairs of parallel example sentences for a first language example sentence similar to the original sentence of the first language to be translated, a first language example sentence of the parallel sentence example searched for the original sentence, A difference portion determination unit that determines a difference portion of each word and a second language example sentence corresponding to the difference portion in the first language example sentence, and extracts the second language phrase of the difference portion in the original sentence A synthesis unit for creating a synthesized sentence replaced with words in the first language, and a translation generation for creating a translated sentence in which words in the original sentence included in the synthesized sentence are replaced with translated words in the second language corresponding to the words in the first language Since a composite sentence or a translated sentence is created with a part, a large-scale database such as a parsing dictionary is required in addition to a plurality of pairs of parallel example sentences stored in the parallel example sentence storage section when generating a composite sentence, that is, an example database. In addition, the example Can output a good translation support quality information based on the database.

さらに、この発明の翻訳装置は、原文、原文に類似する第1言語例文、前記第1言語例文に対応する第2言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備えるので、原文、最終的な翻訳結果が作成される過程の参考情報および訳文を、ユーザの意向に添った態様で提示することができ、これによって、訳文が適切でなかった場合でもユーザは例文や合成文を翻訳支援情報として得ることができる。   Furthermore, the translation apparatus of the present invention includes an output unit that outputs at least one of an original sentence, a first language example sentence similar to the original sentence, a second language example sentence corresponding to the first language example sentence, a synthesized sentence, and a translated sentence. Therefore, it is possible to present the original text, reference information on the process of creating the final translation result, and the translation in a manner according to the user's intention, so that even if the translation is not appropriate, the user can And synthesized text can be obtained as translation support information.

また、この発明の翻訳装置は、原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成部とを備えるので、訳文の生成に際して対訳例文記憶部に記憶された複数組の対訳例文、即ち用例データベース以外に構文解析辞書などの大規模なデータベースを必要とせず、しかも用例データベースに基づいて自然な表現の翻訳を実現することができる。従って、データベース開発に要する工数やコストが少なく、またデータベースを保持する記憶容量も小さくでき、質のよい翻訳が可能な翻訳装置を安価に提供することができる。   In addition, the translation device of the present invention includes a translation determination unit that determines a translation based on information obtained from a parallel translation example sentence related to the phrase of the difference in the original sentence, and the translation of the first language example sentence with the determined translation word A translation generation unit that creates a translation by replacing words of the second language example sentence corresponding to the difference portion, so that in addition to a plurality of pairs of translation example sentences stored in the translation example sentence storage unit when generating the translation, that is, the example database A large-scale database such as a parsing dictionary is not required, and a natural expression can be translated based on an example database. Therefore, it is possible to provide a translation apparatus that can reduce the man-hours and costs required for database development, reduce the storage capacity for storing the database, and perform high-quality translation at low cost.

この発明の翻訳装置は、第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、翻訳すべき第1言語の原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第1言語例文中の前記相違箇所に対応する第2言語例文の語句を抽出し当該第2言語の語句を原文中の前記相違箇所の第1言語の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該第1言語の語句に対応する第2言語の訳語で置換した訳文を作成する訳文生成部と、原文、原文に類似する第1言語例文、前記第1言語例文に対応する第2言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備えることを特徴とする。   A translation device according to the present invention is a translation device that translates from a first language to a second language using a first language example sentence and a second language example sentence corresponding to the first language example sentence, wherein the first language example sentence Information about the composition of the phrases of the first language example sentences, second language example sentences corresponding to the first language example sentences, information about the composition of the phrases of the second language example sentences, phrases and second languages of the first language example sentences A bilingual example sentence storage unit for storing a plurality of sets of bilingual example sentences including information on correspondence with phrases of example sentences, and a bilingual search for a first language example sentence similar to the original sentence of the first language to be translated from a plurality of sets of bilingual example sentences An example sentence search unit; a difference part determination part that determines a difference between the original sentence and the first-language example sentence of the searched parallel example sentence; and a second-language example sentence corresponding to the difference part in the first-language example sentence Extract the phrase and replace the phrase in the second language with the difference A synthesis unit that creates a synthetic sentence that is replaced with a phrase in the first language, and a translation that creates a translation in which a phrase in the original sentence included in the synthetic sentence is replaced with a translation in the second language corresponding to the phrase in the first language A generating unit; and an output unit that outputs at least one of an original sentence, a first language example sentence similar to the original sentence, a second language example sentence corresponding to the first language example sentence, a synthesized sentence, and a translated sentence, To do.

ここで、言語とは広義に解釈されるものであって、情報を伝達するための規則であれば異国語に限らず、方言や同一の言語であってもよい。あるいは、人間が会話をする言語に限らずコンピュータ処理用の言語などであってもよい。
また、例文の形態は、単文に限らず、語、句や複数の文から成るものを含んでいてもよい。
出力部からの出力は文字として表示されてもよいが、それに限らず例えば情報として記憶装置に記憶される態様や、音声などの態様であってもよい。
Here, the language is interpreted in a broad sense, and as long as it is a rule for transmitting information, it is not limited to foreign languages but may be dialects or the same language. Alternatively, the language is not limited to the language in which humans talk, and may be a language for computer processing.
The form of the example sentence is not limited to a single sentence, and may include a word, a phrase, or a plurality of sentences.
The output from the output unit may be displayed as characters, but is not limited thereto, and may be, for example, an aspect stored in the storage device as information, an aspect such as sound.

また、この発明の翻訳装置は、第1言語の原文を入力する入力部と、複数組の対訳例文を記憶する対訳例文記憶部と、対訳例文検索部と、相違箇所判定部と、原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成部と、生成された訳文を出力する出力部とを備えることを特徴とする。
ここで、入力部からの入力はこの発明の翻訳装置が処理可能な情報に変換されるものであれば文字に限らず、例えば音声などであってもよい。
In addition, the translation device of the present invention includes an input unit for inputting a source text in a first language, a parallel example sentence storage unit for storing a plurality of sets of parallel translation example sentences, a parallel example sentence search unit, a difference part determination unit, A translated word determining unit that determines a translated word based on information obtained from a parallel translated example sentence related to the phrase of the different part, and a phrase of the second language example sentence corresponding to the different part in the first language example sentence with the determined translated word It is characterized by comprising a translation generation unit that creates a translation by replacement, and an output unit that outputs the generated translation.
Here, the input from the input unit is not limited to characters as long as it is converted into information that can be processed by the translation apparatus of the present invention, and may be, for example, speech.

前述の翻訳装置は、単独の装置として構成されてもよいが、それに限られず、たとえばパーソナルコンピュータなどの汎用処理装置にインストールするソフトウェアとして提供され、そのソフトウェアの処理を実行することによって翻訳装置として機能するものであってもよい。   The translation device described above may be configured as a single device, but is not limited thereto. For example, the translation device is provided as software installed in a general-purpose processing device such as a personal computer, and functions as a translation device by executing processing of the software. You may do.

訳語決定部が、原文中の相違箇所の語句と原文中の他の語句との共起の度合いを考慮して訳語を決定するように構成されていてもよい。このようにすれば、訳語の候補が複数ある場合に、それらの候補の中から適切な訳語を選択することができる。
また、対訳例文記憶部とは異なる記憶部を検索して翻訳を行う機械翻訳部をさらに備え、機械翻訳による訳文を出力させるかあるいはさせないかを選択可能に構成されていてもよい。
さらにまた、出力された文をユーザが編集するための編集部をさらに備えていてもよい。このようにすれば、翻訳装置から出力された前記の文を参考にしながら、その内容をユーザが自由に編集することができ、ユーザの意図に沿う最終的な訳文の作成を支援することができる。
前記語句が、単語および連語であってもよい。
The translated word determining unit may be configured to determine the translated word in consideration of the degree of co-occurrence between a phrase at a different location in the original sentence and another phrase in the original sentence. In this way, when there are a plurality of translation candidates, an appropriate translation can be selected from those candidates.
In addition, a machine translation unit that searches and translates a storage unit that is different from the bilingual example sentence storage unit may be configured to select whether or not to output a translation by machine translation.
Furthermore, you may further provide the edit part for a user to edit the output sentence. In this way, the user can freely edit the content while referring to the sentence output from the translation device, and can support the creation of a final translated sentence that meets the user's intention. .
The phrase may be a word and a collocation.

また、第1言語例文から当該例文の語句の構成に関する語句情報を作成し、各第1言語例文に対応する第2言語例文から当該例文の語句の構成に関する語句情報を作成し、作成された語句情報から第1言語の語句と第2言語の語句との対応に関する対応情報を作成して対訳例文記憶部に格納する語句対応付け部をさらに備えていてもよい。このようにすれば、ユーザは、第1言語と第2言語の対応する例文を入力するだけで付加情報を入力することなく対訳例文を作成し、あらかじめ登録された対訳例文に加えて、登録された対訳例文を用いて翻訳を行うことができる。従って、よく使う分野の対訳例文を自分で作成して登録したり、パッケージ化された専門分野の対訳例文を入手して追加登録することが容易にでき、これによって、特定分野の対訳例文を充実させるなどしてより適切な翻訳を行うことが容易にできる。   Further, phrase information relating to the composition of the phrase of the example sentence is created from the first language example sentence, phrase information relating to the composition of the phrase of the example sentence is created from the second language example sentence corresponding to each first language example sentence, and the created phrase The information processing apparatus may further include a word / phrase association unit that creates correspondence information on correspondence between the first language word / phrase and the second language word / phrase from the information and stores the correspondence information in the bilingual example sentence storage unit. In this way, the user can create a bilingual example sentence without inputting additional information just by inputting corresponding example sentences in the first language and the second language, and can add the registered example sentence in addition to the previously registered bilingual example sentence. Translations can be performed using translated example sentences. Therefore, it is easy to create and register bilingual example sentences for frequently used fields by yourself, or to obtain and register additional bilingual example sentences for specialized fields. This makes it easier to translate more appropriately.

さらにまた、対訳例文検索部は、検索の結果該当する対訳例文がない場合に原文を構成する語句について複数組の対訳例文を検索し、出力部は当該語句についての検索結果を出力するように構成されていてもよい。このようにすれば、入力文に近い文が対訳例文データベースに存在しない場合でも、機械翻訳及び部分的な言い回しを組み合わせてユーザによる訳文の作成を支援することができる。   Furthermore, the bilingual example sentence search unit is configured to search for a plurality of sets of bilingual example sentences for the words constituting the original sentence when the corresponding bilingual example sentence does not exist as a result of the search, and the output unit outputs the search result for the word or phrase. May be. In this way, even when a sentence close to the input sentence does not exist in the bilingual example sentence database, it is possible to support the creation of the translated sentence by the user by combining machine translation and partial wording.

また、この発明は、第1言語の原文を入力させる入力処理と、対訳例文記憶部に記憶された複数組の対訳例文であって、第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の中から原文に類似する第1言語例文を検索する対訳例文検索処理と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定処理と、原文中の前記相違箇所の語句について複数組の対訳例文を検索した結果に基づいて訳語を決定する訳語決定処理と、決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成処理と、生成された訳文を出力する出力処理とをコンピュータに実行させる翻訳プログラムを提供する。
以下、図面に示す実施形態に基づいてこの発明を詳述する。
The present invention also relates to an input process for inputting an original sentence in a first language, and a plurality of sets of parallel example sentences stored in a parallel example sentence storage unit, the first language example sentence and the configuration of the phrases of the first language example sentence Information, a second language example sentence corresponding to the first language example sentence, information about a configuration of a phrase of the second language example sentence, and information about a correspondence between the phrase of the first language example sentence and the phrase of the second language example sentence A bilingual example sentence search process for searching a first language example sentence similar to the original sentence from the bilingual example sentence; a difference part determining process for determining a difference part between the original sentence and the first language example sentence of the searched bilingual example sentence by phrase unit; A translation determination process for determining a translation word based on a result of searching a plurality of sets of parallel translation example sentences for the phrase of the difference part in the original sentence, and a second language corresponding to the difference part in the first language example sentence with the determined translation word Replace words in example sentences and translate Providing a clean up process for forming a translation program for executing an output process on the computer to output the generated translation.
Hereinafter, the present invention will be described in detail based on embodiments shown in the drawings.

(装置の構成例)
図1は、この発明の翻訳装置の構成の一例を示すブロック図である。
図1の入力部300は、翻訳すべき原文、処理翻訳に関する指示、訳文の編集に関する内容を入力する手段であり、例えばキーボードやマウスボタンで構成されるが、これに限らずタブレットやタッチパネルなどであってもよい。
(Example of device configuration)
FIG. 1 is a block diagram showing an example of the configuration of the translation apparatus of the present invention.
The input unit 300 in FIG. 1 is a means for inputting an original sentence to be translated, instructions relating to processing translation, and contents relating to translation editing. For example, the input part 300 includes a keyboard and a mouse button. There may be.

記憶部900は、共通の意味を持つ複数言語の文と、その文を構成する語の言語間の対応とを含む用例データベースを記憶する手段である。図11は、対訳例文データベースに格納する各対訳例文のデータ形式の一例を示す説明図である。対訳例文データベースの詳細については、後述する。記憶部900は、ハードディスクを用いて構成することができるが、それにかぎらずフラッシュメモリや光磁気ディスクなどの書き換え可能な記憶手段であってもよく、あるいはマスクROMやCDなどの書き換え不可能な記憶手段であってもよい。また、記憶部は装置本体に着脱自在に構成されて交換可能であってもよく、本体に固定されて交換不可能であってもよい。   The storage unit 900 is a unit that stores an example database including sentences in a plurality of languages having a common meaning and correspondence between languages of words constituting the sentence. FIG. 11 is an explanatory diagram showing an example of a data format of each bilingual example sentence stored in the bilingual example sentence database. Details of the bilingual example sentence database will be described later. The storage unit 900 can be configured using a hard disk, but may be a rewritable storage unit such as a flash memory or a magneto-optical disk, or a non-rewritable storage such as a mask ROM or CD. It may be a means. Further, the storage unit may be configured to be detachable from the apparatus main body and exchangeable, or may be fixed to the main body and not exchangeable.

入力部300からの入力データもしくは指示、記憶部900から読み出したデータの処理は、CPU100によって実行される。前記の記憶部900や入力部300またはCPU100とバスなどの転送部200を介して接続されている。あるいは、転送部200は少なくともその一部にネットワークを含んでいてもよい。   The CPU 100 executes processing of input data or instructions from the input unit 300 and data read from the storage unit 900. The storage unit 900, the input unit 300, or the CPU 100 is connected to the transfer unit 200 such as a bus. Alternatively, the transfer unit 200 may include a network at least in part.

翻訳メモリプログラムモジュール700は、CPU100が実行する処理のプログラムを記憶する記憶手段である。翻訳メモリプログラムモジュール700は、フラッシュメモリを用いて構成することができるが、それにかぎらずハードディスクや光磁気ディスクなどの書き換え可能な記憶手段であってもよく、あるいはマスクROMやCDなどの書き換え不可能な記憶手段であってもよい。   The translation memory program module 700 is a storage unit that stores a program for processing executed by the CPU 100. The translation memory program module 700 can be configured using a flash memory, but is not limited thereto, and may be a rewritable storage means such as a hard disk or a magneto-optical disk, or a mask ROM, CD, or the like is not rewritable. It may be a storage means.

制御プログラムモジュール500は、翻訳装置が実行すべき翻訳メモリの処理以外の処理に関するプログラムが格納されている。例えば、訳文候補の文字列を編集するための処理や、入力や出力の制御に関する処理である。制御プログラムモジュール500は、フラッシュメモリを用いて構成することができるが、それにかぎらずハードディスクや光磁気ディスクなどの書き換え可能な記憶手段であってもよく、あるいはマスクROMやCDなどの書き換え不可能な記憶手段であってもよい。   The control program module 500 stores a program related to processing other than the processing of the translation memory to be executed by the translation apparatus. For example, a process for editing a translation candidate character string, and a process related to input and output control. The control program module 500 can be configured using a flash memory, but is not limited thereto, and may be a rewritable storage unit such as a hard disk or a magneto-optical disk, or a mask ROM, a CD, or the like that cannot be rewritten. It may be storage means.

動作用メインメモリ800は、CPUが一時的に使用するデータを記憶する高速のメモリである。メインメモリ800には、例えば、原文の内容を一時的に保持する原文バッファ810や、翻訳メモリに関するデータを保持する翻訳メモリ関連バッファ820などが含まれる。   The main operation memory 800 is a high-speed memory that stores data temporarily used by the CPU. The main memory 800 includes, for example, an original sentence buffer 810 that temporarily holds the contents of the original sentence and a translation memory related buffer 820 that holds data related to the translation memory.

この発明は、従来の規則主導型翻訳装置と併用することが可能であり、その場合は、機械翻訳プログラムモジュール600に規則主導型翻訳処理のプログラムがこのモジュールに格納される。点線で描いているのは、前記モジュールがこの発明の必須構成要素でないことを示すためである。また、機械翻訳プログラムモジュール600を装置に含む場合は、動作用メインメモリ800中に、図示しない規則主導型翻訳処理に関連するバッファを確保する。
出力部400は、訳文や訳文候補、編集の結果を出力する手段であり、LCDなどを用いた表示装置から構成されてもよいが、これに限らず、CRTなどの他の表示デバイスであってもよく、あるいはインクジェット方式などのプリンタ、外部の装置へデータを出力する出力I/F部が含まれていてもよい。
The present invention can be used in combination with a conventional rule-driven translation apparatus. In this case, a rule-driven translation processing program is stored in the machine translation program module 600. The dotted line is drawn to show that the module is not an essential component of the present invention. When the machine translation program module 600 is included in the apparatus, a buffer related to rule-driven translation processing (not shown) is secured in the operation main memory 800.
The output unit 400 is a means for outputting a translation, translation candidate, and editing result. The output unit 400 may be composed of a display device using an LCD or the like, but is not limited to this, and is another display device such as a CRT. Alternatively, an output I / F unit that outputs data to a printer such as an ink jet method or an external device may be included.

(データ処理の観点からの構成)
図2は、この発明の翻訳装置の構成の一例を翻訳の過程で処理されるデータの観点から示したブロック図である。図において、翻訳のための原文は、入力部300を介してユーザによって入力されるか、あるいは原文のデータが記憶された原文記憶部10から読み込まれる。これらの入力に関する指示は、ユーザ・インタフェース15によって管理される。ユーザ・インタフェース15によって、入力操作に関する画面が出力部400に表示され、ユーザは画面表示の内容から所望の入力方法を入力部300を用いて指示し、指示された内容をユーザ・インタフェース部15が判断してユーザの選択に応じた所定の処理が実行される。そして、ユーザが行った操作や翻訳の結果が出力部400に表示され、あるいは翻訳結果が翻訳結果記憶部11に格納される。
(Configuration from the viewpoint of data processing)
FIG. 2 is a block diagram showing an example of the configuration of the translation apparatus according to the present invention from the viewpoint of data processed in the translation process. In the figure, the original text for translation is input by the user via the input section 300 or read from the original text storage section 10 in which the original text data is stored. Instructions regarding these inputs are managed by the user interface 15. A screen related to the input operation is displayed on the output unit 400 by the user interface 15, and the user instructs a desired input method from the contents of the screen display using the input unit 300, and the user interface unit 15 indicates the instructed content. Predetermined processing is executed according to the determination and the user's selection. Then, the operation performed by the user and the result of translation are displayed on the output unit 400, or the translation result is stored in the translation result storage unit 11.

また、ユーザは出力部400に表示された翻訳結果を編集することができる。編集に関する処理は編集部40が行う。
入力された原文は、対訳例文検索処理部31に入力される。対訳例文検索処理部31は、入力された原文と類似する例文を、対訳例文記憶部51に記憶された対訳例文データベースを参照して抽出する。対訳例文データベースは、翻訳装置の中に予め用意されている用例のほかに、ユーザが登録した対訳例文を含んでいてもよい。対訳例文検索処理部31は、一定の類似度以上の例文の第1言語とそれに対応する第2言語の例文およびそれらの文を構成する語の言語間での対応に関するデータと、原文と例文との相違点に関するデータとを訳文合成・生成処理部30へ送る。
In addition, the user can edit the translation result displayed on the output unit 400. The editing unit 40 performs processing related to editing.
The input original text is input to the bilingual example sentence search processing unit 31. The parallel translation example sentence search processing unit 31 extracts an example sentence similar to the input original sentence with reference to the parallel translation example sentence database stored in the parallel translation example sentence storage unit 51. The bilingual example sentence database may include bilingual example sentences registered by the user in addition to the examples prepared in advance in the translation apparatus. The bilingual example sentence search processing unit 31 includes data on correspondence between the first language of example sentences having a certain degree of similarity or more, example sentences in the second language corresponding thereto, and words constituting the sentences, and the original sentence and example sentence. And the data related to the difference between them are sent to the translation composition / generation processing unit 30.

訳文合成・生成処理部30は、送られたデータに基づいて、抽出された例文の原文との相違点を第2言語で表わした文、抽出された第2言語の例文を原文との相違箇所のみ第1言語で置換した文を生成する。また、対訳例文検索処理部31を介して対訳例文データベースを参照し、前記相違箇所を補完した訳文を生成する。
このようにして生成した訳文と、前記の翻訳過程の文とをユーザ・インタフェースを介して出力部400へ出力する。
Based on the sent data, the translation composition / generation processing unit 30 is a sentence that shows the difference between the extracted example sentence in the second language and the extracted example sentence in the second language that is different from the original sentence. Only the sentence substituted with the first language is generated. In addition, the translated example sentence database 31 is referred to via the parallel example sentence search processing unit 31 to generate a translated sentence that complements the difference.
The translated sentence generated in this way and the sentence of the translation process are output to the output unit 400 via the user interface.

ユーザが対訳例文を登録する場合は、ユーザが入力した対訳例文は語・句対応付け処理部50へ送られる。語・句対応付け処理部50は、例文を解析して語・句の構成と対応情報を付加するために対訳辞書引き処理部52を介して対訳辞書53を参照する。このようにして語・句の構成と対応付けに関する情報を付加して対訳例文データベースと同じ形式を持つ登録対訳例文は、対訳例文記憶部51に記憶され、以降の翻訳処理では、先に記憶されている対訳例文と同様に参照される。
なお、規則主導型翻訳装置を併用する場合、その装置の翻訳辞書21を対訳辞書53と共用してもかまわない。また、機械翻訳処理部20の一部を対訳辞書引き処理部52と共用してもかまわない。
When the user registers a bilingual example sentence, the bilingual example sentence input by the user is sent to the word / phrase association processing unit 50. The word / phrase association processing unit 50 refers to the bilingual dictionary 53 via the bilingual dictionary lookup processing unit 52 in order to analyze the example sentence and add the word / phrase configuration and correspondence information. In this way, the registered bilingual example sentences having the same format as the bilingual example sentence database with the addition of the information on the word / phrase structure and association are stored in the bilingual example sentence storage unit 51, and are stored in advance in the subsequent translation processing. It is referenced in the same way as the parallel translation example.
When a rule-driven translation device is used in combination, the translation dictionary 21 of the device may be shared with the bilingual dictionary 53. Further, a part of the machine translation processing unit 20 may be shared with the bilingual dictionary lookup processing unit 52.

(概略の処理手順)
図3は、この発明の翻訳装置の概略の処理手順の一例を示すフローチャートである。図3に示すように、翻訳すべき原文をユーザに入力させ(Step s11)て図1の原文バッファ810に格納した後、さらに訳文を生成する指示を入力させる(Step s12)。規則主導型翻訳処理を併用する場合は、その処理を実行する(Step s13)。規則主導型翻訳装置は本願発明の必須構成要素ではなく、そのことを示すために、s13を点線で描いている。規則主導型翻訳を行わない場合、ルーチンはs12を実行した後s14へ移る。また、その処理手順は公知であるので、この明細書ではこれ以上の説明を行わない。次に、ルーチンは、対訳例文データベースを検索して訳文の合成・生成処理を行う(Step s14)。この処理の詳細は図5に記載されており、図5の説明として後述する。そして、ルーチンは、前記の処理を行った結果を出力して表示する(Step s15)。この処理の詳細については、さらに後述する。ユーザは、表示された訳文や翻訳の途中経過のデータを必要に応じて編集したり、ユーザが利用しやすい形態に変換したりする(Step s16)。この処理の詳細については、さらに後述する。
ここで、s12〜s14の処理は、必ずしも図のとおりの手順で行う必要はなく、例えばs13とs14を同時に行ってもよく、またs14をs13より先に行ってもよい。
(Outline processing procedure)
FIG. 3 is a flowchart showing an example of a schematic processing procedure of the translation apparatus of the present invention. As shown in FIG. 3, the user inputs the original sentence to be translated (Step s11) and stores it in the original sentence buffer 810 of FIG. 1, and then inputs an instruction for generating a translated sentence (Step s12). When the rule-driven translation process is used in combination, the process is executed (Step s13). The rule-driven translation device is not an essential component of the present invention, and s13 is drawn with a dotted line to indicate that. When rule-driven translation is not performed, the routine proceeds to s14 after executing s12. Further, since the processing procedure is known, no further explanation will be given in this specification. Next, the routine searches the bilingual example sentence database to perform translation composition / generation processing (Step s14). The details of this process are described in FIG. 5 and will be described later as an explanation of FIG. Then, the routine outputs and displays the result of the above processing (Step s15). Details of this processing will be described later. The user edits the displayed translated text or the data in the middle of translation as necessary, or converts the data into a form that is easy for the user to use (Step s16). Details of this processing will be described later.
Here, the process of s12-s14 does not necessarily need to be performed in the procedure as shown in the figure. For example, s13 and s14 may be performed simultaneously, or s14 may be performed before s13.

図4は、ユーザが対訳例文の登録を行う場合の概略の処理手順の一例を示すフローチャートである。図4に示すように、第1及び第2言語を含んだ登録すべき対訳例文をユーザに入力させた(Step s31)後、さらに登録の指示を入力させる(Step s32)。指示が入力されたら、対訳例文に対する語句の構成と対応付けの情報を付加する(Step s33)。この処理によって、既に登録されている対訳例文と同じ形式に整えた後に対訳例文をデータベースに登録する(Step s34)。   FIG. 4 is a flowchart illustrating an example of a schematic processing procedure when the user registers a bilingual example sentence. As shown in FIG. 4, the user inputs a bilingual example sentence to be registered including the first and second languages (Step s31), and further inputs a registration instruction (Step s32). When the instruction is input, information on the composition and correspondence of the phrase for the bilingual example sentence is added (Step s33). By this processing, the translated example sentences are registered in the database after being arranged in the same format as the already translated example sentences (Step s34).

(対訳例文の検索と合成・生成処理−概要)
以降の説明では、具体的な文を例に挙げながら各部の詳細な処理を説明する。ここで、「第1言語」が日本語、「第2言語」が英語であるとする。また、「△」は空白文字を表わす記号であるとする。
(Bilingual example sentence search and composition / generation processing-overview)
In the following description, detailed processing of each unit will be described using specific sentences as examples. Here, it is assumed that the “first language” is Japanese and the “second language” is English. Further, “Δ” is a symbol representing a blank character.

図5は、図3のStep s14に示した対訳例文の検索と合成・生成処理の詳細を示すフローチャートである。図3のStep 11でユーザによって入力された原文が、
「私の眼鏡が見つかりません。」
という日本語の文であるとする。これが図1の原文バッファ810に格納されている。図12は、前述の原文が原文バッファ810に格納された様子を模式的に示した説明図である。図12に示すように、原文は、各文字の文字位置が識別可能に構成された原文バッファ810に、13文字からなる文として格納される。ここで、原文バッファの長さは固定されておらず、例文よりも長い文も短い文も格納できる。後述する他のバッファに関しても同様である。
FIG. 5 is a flowchart showing details of the bilingual example sentence search and composition / generation processing shown in Step s14 of FIG. The original text input by the user in Step 11 of FIG.
"I can't find my glasses."
Is a Japanese sentence. This is stored in the original text buffer 810 of FIG. FIG. 12 is an explanatory diagram schematically showing how the above-described original text is stored in the original text buffer 810. As shown in FIG. 12, the original sentence is stored as a sentence composed of 13 characters in an original sentence buffer 810 configured so that the character position of each character can be identified. Here, the length of the original sentence buffer is not fixed, and a sentence longer or shorter than the example sentence can be stored. The same applies to other buffers described later.

また、図11は、対訳例文データベースのデータ構造の一例を示す説明図である。図11は、以下のことを示している。
まず、図11(a)は、対訳例文データベースが「第1言語文データ」を含むことと、そのデータの一例を示している。即ち、対訳例文の日本語文(第1言語文)が、17文字からなる「私のスーツケースが見つかりません。」であることを示している。
次に、図11(b)は、対訳例文データベースが「第1言語文の単語情報データ」を含むことと、そのデータの一例を示している。図11(b)に示すように、第1言語文の単語情報データは、対訳例文データベースに含まれる前述の対訳例文の日本語文の単語区切りが「私」「の」「スーツケース」「が」「見つかり」「ませ」「ん」「。」の間の7箇所であること、文が8単語からなること、そして各単語の文字数を示している。
さらに、図11(c)は、対訳例文データベースが「第2言語文データ」を含むことと、そのデータの一例を示している。即ち、対訳例文の英語文(第2言語文)が「I can't find my suitcase.」の全部で25文字からなる英文であることを示している。
そして、図11(d)は、対訳例文データベースが「第2言語文の単語情報データ」を含むことと、そのデータの一例を示している。図11(d)に示すように、第2言語文は、その単語区切りが「I」「can」「't」「find」「my」「suitcase」「.」の間の6箇所であること、全部で7単語からなること、そして各単語の文字数を示している。
最後に、図11(e)は、対訳例文データベースが「対応関係データ」を含むことと、そのデータの一例を示している。図11(e)に示すように、対応関係データは、第1言語文と第2言語文との単語の対応関係が4つの組からなり、それぞれの組の対応が以下のような対応関係であることを、それぞれの単語番号を用いて示している。
「私の――が見つかりません」−「I can't find my」
(ここで、日本語文中の「――」は、省略記号でなく、その部分に何かの語または句が挿入されることを示しており、いわば穴あき箇所である)
「私の」−「 my」
「スーツケース」−「suitcase」
「が見つかりません」−「I can't find」
図5のStep s141で示す類似文検索処理は、次の手順で行う。
FIG. 11 is an explanatory diagram showing an example of the data structure of the bilingual example sentence database. FIG. 11 shows the following.
First, FIG. 11A shows that the bilingual example sentence database includes “first language sentence data” and an example of the data. In other words, the Japanese sentence (first language sentence) of the bilingual example sentence is “My suitcase is not found” consisting of 17 characters.
Next, FIG. 11B shows that the bilingual example sentence database includes “word information data of the first language sentence” and an example of the data. As shown in FIG. 11 (b), the word information data of the first language sentence includes words “I”, “no”, “suitcase”, and “ga” in the Japanese sentence of the above-described parallel translation example sentence included in the parallel translation example sentence database. It shows that there are 7 places between “Find”, “Not”, “N”, “.”, That the sentence consists of 8 words, and the number of characters of each word.
Further, FIG. 11C shows that the bilingual example sentence database includes “second language sentence data” and an example of the data. That is, the English sentence (second language sentence) of the parallel translation example sentence is an English sentence including “I can't find my suitcase” in total of 25 characters.
FIG. 11D shows that the bilingual example sentence database includes “word information data of the second language sentence” and an example of the data. As shown in FIG. 11 (d), the second language sentence has 6 word breaks between “I”, “can”, “'t”, “find”, “my”, “suitcase” and “.”. , Consisting of 7 words in total, and the number of characters in each word.
Finally, FIG. 11E shows that the bilingual example sentence database includes “correspondence data” and an example of the data. As shown in FIG. 11 (e), the correspondence data consists of four pairs of word correspondences between the first language sentence and the second language sentence, and the correspondence of each pair is as follows. This is shown using each word number.
"I can't find"-"I can't find my"
(Here, "-" in a Japanese sentence is not an ellipsis, but indicates that a word or phrase is inserted in that part, so to speak, it is a perforated part)
"My"-"my"
"Suitcase"-"suitcase"
"Cannot find"-"I can't find"
The similar sentence search process shown in Step s141 of FIG. 5 is performed according to the following procedure.

(対訳例文の検索と合成・生成処理−類似文検索処理)
まず、「私の眼鏡が見つかりません。」をキーとして、日本語が類似する対訳例文を図1の対訳例文データベース51中から検索する(Step s141)。対訳例文データベース51は、例えば、第1言語「見つかりません」の語句を用いた例文として、以下の例文を記憶している。即ち、
対訳例文の例1
第1言語例文:「私のスーツケースが見つかりません。」と、
第2言語例文:「I can't find my suitcase.」の組、
対訳例文の例2
第1言語例文:「探している商品が見つかりません。」と、
第2言語例文:「I can't find the thing I want.」の組、
対訳例文の例3
第1言語例文:「ニューヨーク中電話しましたが、その本は見つかりませんでした。」と、
第2言語例文:「Although we have telephoned all over New York , we have been unable to find copies.」の組、
対訳例文の例4
第1言語例文「それが見つかるまでの間、どうにかしてもらえませんか。」と、
第2言語例文「What will you do for me until you find it?」の組
の5組である。
(Parallel translation example sentence search and composition / generation process-similar sentence search process)
First, using the "My glasses are not found" key, a parallel example sentence similar in Japanese is searched from the parallel example sentence database 51 of FIG. 1 (Step s141). The bilingual example sentence database 51 stores the following example sentences as example sentences using the phrase of the first language “not found”, for example. That is,
Example 1 of bilingual example sentences
First language example sentence: “My suitcase is not found”
Second language example sentence: "I can't find my suitcase."
Example 2 of bilingual example sentences
First language example sentence: “The product you are looking for is not found.”
Second language example sentence: “I can't find the thing I want.”
Example 3 of bilingual example sentences
First language example sentence: “I called in New York, but I couldn't find the book.”
Second language example: “Although we have telephoned all over New York, we have been unable to find copies.”
Example 4 of parallel translation example sentences
In the first language example sentence, "Can you manage it until it is found?"
There are five pairs of second language example sentences “What will you do for me until you find it?”.

また、対訳例文データベース51は、第2言語「atmosphere」の語句を用いた例文として、
対訳例文の例5
第2言語例文「I like the homey atmosphere of that restaurant.」と、
第1言語例文「あのレストランの家庭的な雰囲気が好きだ」の組、
対訳例文の例6
第2言語例文「bad atmosphere engulfed the city」と、
第1言語例文「町はひどい大気に包まれた」の組、
の2組の例文を記憶している。
In addition, the bilingual example sentence database 51 includes example sentences using the phrase of the second language “atmosphere”.
Example 5 of bilingual example sentences
Second language example sentence "I like the homey atmosphere of that restaurant."
First language example sentence “I like the restaurant's homey atmosphere”,
Example 6 of bilingual example sentences
Second language example sentence "bad atmosphere engulfed the city"
A set of example sentences in the first language, “The town is in a terrible atmosphere”
The two sets of example sentences are memorized.

図29は、これらの対訳例文の例1、2のデータ構造を示す説明図である。図29に示す対訳例文の例1のデータ構造は、「第1言語文の単語情報データ」の単語区切りが、「私」「の」「スーツケース」「が」「見つかり」「ませ」「ん」「。」の8単語であり、「第2言語の単語情報データ」は、英語文の単語区切りが「I」「can」「't」「find」「my」「suitcase」「.」の7単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「私の――が見つかりません」−「I can't find my」
ここで、前述のように日本語文中の「――」は、省略記号でなく、いわば穴あき箇所を示す。
対応2: 「私の」−「 my」
対応3: 「スーツケース」−「suitcase」
対応4: 「が見つかりません」−「I can't find」
FIG. 29 is an explanatory diagram showing the data structure of Examples 1 and 2 of these parallel translation example sentences. The data structure of Example 1 of the bilingual example sentence shown in FIG. 29 is that the word breaks of the “word information data of the first language sentence” are “I”, “NO”, “Suitcase”, “GA”, “Find”, “Not”, “N” ”“. ”, And“ word information data in the second language ”has English word breaks of“ I ”,“ can ”“ 't ”“ find ”“ my ”“ suitcase ”“. ” Indicates 7 words. “Correspondence relationship data” indicates that the word correspondence information is as follows.
Action 1: “I ca n’t find my”-“I can't find my”
Here, as mentioned above, “—” in the Japanese sentence indicates not a ellipsis but a so-called perforated part.
Response 2: "My"-"my"
Action 3: "suitcase"-"suitcase"
Action 4: “Cannot find”-“I can't find”

また、対訳例文の例2のデータ構造は、「第1言語文の単語情報データ」の単語区切りが「探し」「ている」「商品」「が」「見つかり」「ませ」「ん」「。」の8単語であり、「第2言語の単語情報データ」は、英語文の単語区切りが「I」「can」「't」「find」「the」「thing」「I」「want」「.」の9単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「探している商品」−「the thing I want」
対応2: 「探している」−「I want」
対応3: 「商品」−「thing」
対応4: 「が見つかりません」−「I can't find」
Also, the data structure of Example 2 of the bilingual example sentence is “searching” “having” “product” “ga” “finding” “not” “n” “in the word information data of the first language sentence”. "Word information data in the second language" has English word breaks of "I""can""'t""find""the""thing""I""want"" . ”Indicates 9 words. “Correspondence relationship data” indicates that the word correspondence information is as follows.
Response 1: "Product you are looking for"-"the thing I want"
Response 2: “I want” – “I want”
Action 3: "Product"-"thing"
Action 4: “Cannot find”-“I can't find”

さらに図30は、対訳例文の例3、4のデータ構造を示す説明図である。対訳例文の例3のデータ構造は、「第1言語文の単語情報データ」の単語区切りが「ニューヨーク」「中」「電話」「しました」「が」「、」「その」「本」「は」「見つかり」「ませ」「ん」「でした」「。」の14単語であり、「第2言語の単語情報データ」は、英語文の単語区切りが「Although」「we」「have」「telephoned」「all」「over」「New」「York」「,」「we」「have」「been」「unable」「to」「find」「copies」「.」の17単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「ニューヨーク」−「New York」
対応2: 「ニューヨーク中」−「all over New York」
対応3: 「電話し」−「telephoned」
対応4: 「電話しました」−「we have telephoned」
対応5: 「が」−「Although」
対応6: 「その本」−「copies」
対応7: 「は見つかりませんでした」−「we have been unable to find」
対応8: 「ませんでした」−「we have been unable to」
Further, FIG. 30 is an explanatory diagram showing the data structure of Example 3 and 4 of the parallel translation example sentence. The data structure of Example 3 of the bilingual example sentence is that the word breaks of “word information data of the first language sentence” are “New York”, “Medium”, “Telephone”, “Shi”, “Ga”, “That”, “Book”, “ “Is”, “not found”, “not”, “n”, “was”, “.”, And “word information data in the second language” have word separators of English sentences “Although” “we” “have” “Telephoned” “all” “over” “New” “York” “,” “we” “have” “been” “unable” “to” “find” “copies” “.” . “Correspondence relationship data” indicates that the word correspondence information is as follows.
Response 1: "New York"-"New York"
Action 2: “New York”-“all over New York”
Action 3: "Call"-"telephoned"
Response 4: “We have telephoned”-“we have telephoned”
Action 5: “Ga”-“Although”
Action 6: “The book”-“copies”
Response 7: “We could not find”-“we have been unable to find”
Action 8: “We didn't”-“we have been unable to”

また、対訳例文の例4のデータ構造は、「第1言語文の単語情報データ」の単語区切りが「それ」「が」「見つかる」「まで」「の」「間」「どうにか」「して」「もらえませんか」「。」の10単語であり、「第2言語の単語情報データ」は、英語文の単語区切りが「What」「will」「you」「do」「for」「me」「until」「you」「find」「it」「?」の11単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「それ」−「it」
対応2: 「が見つかるまでの間」−「until you find」
対応3: 「てもらえませんか」−「will you」
対応4: 「どうにかしてもらえませんか」―「What will you do for me」
In addition, the data structure of the example sentence 4 of the parallel translation example is that the word breaks of the word information data of the first language sentence are “it”, “ga”, “found”, “until”, “no”, “between”, “how” ”“ Can you get it ”or“. ”, And the“ word information data in the second language ”has the word delimiters in English sentences“ What ”“ will ”“ you ”“ do ”“ for ”“ me ” “Until” “you” “find” “it” “?” Indicates 11 words. “Correspondence relationship data” indicates that the word correspondence information is as follows.
Action 1: “It”-“it”
Action 2: “Until you find it”-“until you find”
Action 3: “Can you please”-“will you”
Response 4: “Can you help me?”-“What will you do for me”

さらに図31は、対訳例文の例5、6のデータ構造を示す説明図である。対訳例文の例5のデータ構造は、「第2言語文の単語情報データ」の単語区切りが「I」「like」「the」「homey」「atmosphere」「of」「that」「restaurant」「.」の9単語であり、「第1言語の単語情報データ」は、単語区切りが「あの」「レストラン」「の」「家庭的な」「雰囲気」「が」「好き」「だ」「。」の9単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「I like」−「が好きだ」
対応2: 「homey」−「家庭的な」
対応3: 「atmosphere」−「雰囲気」
対応4: 「of that restaurant」−「あのレストランの」
対応5: 「restaurant」−「レストラン」
Further, FIG. 31 is an explanatory diagram showing a data structure of examples 5 and 6 of the parallel translation example sentences. The data structure of Example 5 of the bilingual example sentence is “I” “like” “the” “homey” “atmosphere” “of” “that” “restaurant” “. "Word information data in the first language" has word breaks of "that""restaurant""no""homely""atmosphere""ga""like""da""." Indicates that it is 9 words. “Correspondence relationship data” indicates that the word correspondence information is as follows.
Response 1: "I like"-"I like"
Response 2: "homey"-"homely"
Action 3: "atmosphere"-"atmosphere"
Response 4: “of that restaurant”-“that restaurant”
Action 5: "restaurant"-"restaurant"

また、対訳例文の例6のデータ構造は、「第1言語文の単語情報データ」の単語区切りが「Bad」「atmosphere」「engulfed」「the」「city」「.」の6単語であり、「第2言語の単語情報データ」は、単語区切りが「町」「は」「ひどい」「大気」「に」「包まれた」「。」の7単語であることを示す。そして、「対応関係データ」は、単語対応情報が以下のようであることを示す。
対応1: 「Bad」−「ひどい」
対応2: 「atmosphere」−「大気」
対応3: 「the city」−「町」
Moreover, the data structure of Example 6 of the bilingual example sentence is 6 words of “Bad”, “atmosphere”, “engulfed”, “the”, “city”, “.” As word separators of “word information data of the first language sentence”, “Second-word word information data” indicates that the word break is 7 words of “town”, “ha”, “bad”, “atmosphere”, “in”, “wrapped”, and “.”. “Correspondence relationship data” indicates that the word correspondence information is as follows.
Response 1: "Bad"-"Terrible"
Action 2: "atmosphere"-"atmosphere"
Action 3: "the city"-"town"

図6は、この類似文検索処理(Step s141)の詳細な手順の一例を示すフローチャートである。図6に示すように、ルーチンは、対訳例文データベース51から一組の対訳例文を読み込んで(Step s1411)、その対訳例文と原文との類似度を求める(Step s1412)。類似文の検索は公知の技術を用いて実現することができる。また、原文と例文との類似度も、公知の方法で求められるので、ここでは、これ以上の説明は行わない。そして、求めた類似度が所定の値(閾値)以上であるかどうかを調べ(Step s1413)、閾値以上である場合は、読み込んだ対訳例文を対訳例文検索結果バッファ822に格納する。その後、ルーチンはStep s1415へ進む。一方、求めた類似度が所定の値未満であった場合は、前述の処理を行わずにStep s1415へ進む。Step s1415では、まだ読み込んでいない対訳例文があるかどうかを調べ、読み込んでいない対訳例文がある場合、ルーチンは、次に読み込む一組の対訳例文を選択してから最初のStep s1411へ戻り、選択した対訳例文に関して前述の処理を繰り返す。このように、すべての対訳例文をチェックし、残りの対訳例文がなくなった場合、ルーチンは類似文検索処理を終了し、図5のStep s142へと進む。   FIG. 6 is a flowchart showing an example of a detailed procedure of the similar sentence search process (Step s141). As shown in FIG. 6, the routine reads a pair of parallel example sentences from the parallel example sentence database 51 (Step s1411), and obtains the similarity between the parallel example sentence and the original sentence (Step s1412). The retrieval of similar sentences can be realized using a known technique. Further, since the similarity between the original text and the example sentence is also obtained by a known method, further explanation will not be given here. Then, it is checked whether or not the obtained similarity is equal to or greater than a predetermined value (threshold) (Step s1413), and if it is equal to or greater than the threshold, the read bilingual example sentence is stored in the bilingual example sentence search result buffer 822. Thereafter, the routine proceeds to Step s1415. On the other hand, if the obtained similarity is less than the predetermined value, the process proceeds to Step s1415 without performing the above-described processing. In step s1415, it is checked whether or not there is a bilingual example sentence that has not been read. If there is a bilingual example sentence that has not been read, the routine selects a pair of parallel example sentences to be read next, and then returns to the first step s1411 to select it. The above processing is repeated for the translated example sentence. In this way, all the parallel translation example sentences are checked, and when there are no remaining parallel translation example sentences, the routine ends the similar sentence search process and proceeds to Step s142 in FIG.

図14は、検索された対訳例文を格納する対訳例文検索結果バッファ822の例を示す説明図である。図14では、2つの検索結果が対訳例文検索結果バッファ822に格納されている。そのうちの1つ目の第1言語文は、「私のスーツケースが見つかりません。」であり、2つ目の第1言語文は「探している商品が見つかりません。」である。これらのデータの他に、第1言語の単語情報、第2言語文、第2言語の単語情報が対訳例文データベースからコピーされて格納され、さらに前述の類似文検索処理で求めた原文と対訳例文との類似度が格納される。   FIG. 14 is an explanatory diagram illustrating an example of the parallel translation example sentence search result buffer 822 that stores the retrieved parallel translation example sentences. In FIG. 14, two search results are stored in the bilingual example sentence search result buffer 822. The first language sentence of the first is “My suitcase is not found.” The second first language sentence is “The product you are looking for is not found.” In addition to these data, the first language word information, the second language sentence, and the second language word information are copied and stored from the bilingual example sentence database, and further, the original sentence and the bilingual example sentence obtained by the similar sentence retrieval process described above. Is stored.

ここで、原文と検索する対訳例文との類似度判定の閾値を下げると、「見つかりません」の語句を有する前記対訳例文の例3の「ニューヨーク中電話しましたが、その本は見つかりませんでした。」や、対訳例文の例4の「それが見つかるまでの間、どうにかしてもらえませんか。」が検索される。ここでは、かかる類似度の閾値を「50%」と設定しており、類似度「87%」の対訳例文の例1の「私のスーツケースが見つかりません。」と類似度「58%」の対訳例文の例2の「探している商品が見つかりません。」の2文が検索の結果として得られる。   Here, when the threshold for determining the similarity between the original text and the bilingual example sentence to be searched is lowered, the above-mentioned bilingual example sentence with the phrase “not found” is called “In New York, but the book was not found. Or “translation example sentence example 4“ can you help me until it is found? ”. Here, the similarity threshold is set to “50%”, and “My suitcase is not found” in Example 1 of the parallel translation example with similarity “87%” and similarity “58%”. As a result of the search, two sentences “Example of the product you are looking for.

(対訳例文の検索と合成・生成処理−第1言語相違箇所決定処理)
次に、ルーチンは、第1言語における相違箇所を決定する(図5のStep s142)。図7は、この第1言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。図7に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1421)。そして、処理対象とする類似対訳の第1言語文と、原文との相違箇所を判定する(Step s1422)。相違箇所の判定は、公知の技術を用いて実現することができる。
(Bilingual example sentence search and composition / generation process-first language difference determination process)
Next, the routine determines the difference in the first language (Step s142 in FIG. 5). FIG. 7 is a flowchart showing an example of a detailed procedure of the process for determining the first language difference portion. As shown in FIG. 7, the routine initializes a counter for sequentially processing all similar parallel translations searched from the parallel translation example sentence database 51 (Step s1421). Then, a difference between the first language sentence of the similar parallel translation to be processed and the original sentence is determined (Step s1422). The determination of the difference portion can be realized using a known technique.

相違箇所の決定後、ルーチンはStep s1423へ進み、検索された全ての類似対訳に対して相違箇所の判定を行ったかどうかを調べ(Step s1423)、また判定していない類似対訳がある場合、ルーチンは、次の類似対訳を選択して(Step s1424)相違箇所の判定を繰り返す。全ての類似対訳について相違箇所の判定を行った場合、ルーチンは第1言語相違箇所決定処理を終了し、図5のStep s143へと進む。   After the difference is determined, the routine proceeds to step s1423, where it is determined whether or not the difference is determined for all the similar parallel translations searched (step s1423). Selects the next parallel translation (Step s1424) and repeats the determination of the difference. When the difference portion is determined for all the similar parallel translations, the routine ends the first language difference portion determination process and proceeds to Step s143 in FIG.

図15は、前述の処理によって決定された第1言語の相違箇所の結果を格納する相違箇所データバッファ825のデータ構造とデータの一例を示す説明図である。相違箇所データバッファ825は、検索された類似対訳毎のデータを格納する場合、対訳例文検索結果バッファ822の構造体の一部としてバッファ構造を定義してもよい。図15は、以下のことを示している。   FIG. 15 is an explanatory diagram showing an example of the data structure and data of the different location data buffer 825 that stores the result of the different location in the first language determined by the above-described processing. The difference portion data buffer 825 may define a buffer structure as a part of the structure of the bilingual example sentence search result buffer 822 when storing data for each searched similar parallel translation. FIG. 15 shows the following.

入力文「私の眼鏡が見つかりません。」と、検索結果1の対訳候補の日本語文「私のスーツケースが見つかりません。」の、第1番目の相違箇所について、
「相違箇所番号」は、原文と類似対訳との相違箇所が1箇所であることを示している。
「入力文文字位置」と「入力文文字数」とは、原文「私の眼鏡が見つかりません。」と類似対訳との相違箇所は、原文の3番目の文字から2文字である。そして、図12の原文バッファ810を参照することにより、相違箇所は「眼鏡」であることがわかる。
「第1言語文単語番号」と「第1言語文単語数」とは、対訳候補の日本語文「私のスーツケースが見つかりません。」における相違箇所が、3番目の単語から1単語であることを示している。そして、図14の「検索結果1」の「第1言語文の単語情報バッファ」ならびに「第1言語文バッファ」を参照することにより、相違箇所は「スーツケース」であることがわかる。
なお、図15の例では、入力文「私の眼鏡が見つかりません。」と検索結果1の対訳候補の日本語文「私のスーツケースが見つかりません。」との相違箇所の個数は、1カ所だけであるので、相違箇所データバッファ825のデータ列数は1列である。一般に、相違箇所が複数有る場合はこのデータ列数が複数になり、「相違箇所番号」は1から1ずつ昇順の整数の値をとる。
Regarding the first difference between the input sentence “My glasses are not found” and the Japanese sentence “My suitcase is not found.”
The “difference part number” indicates that there is one difference between the original text and the similar translation.
The difference between the “input sentence character position” and the “input sentence character number” between the original sentence “My glasses are not found” and the similar parallel translation is two characters from the third letter of the original sentence. Then, by referring to the original text buffer 810 in FIG. 12, it can be seen that the difference is “glasses”.
The difference between the "first language sentence word number" and the "first language sentence word number" is one word from the third word in the Japanese sentence "My suitcase is not found." It is shown that. Then, by referring to the “word information buffer of the first language sentence” and the “first language sentence buffer” of “search result 1” in FIG. 14, it is understood that the difference is the “suitcase”.
In the example of FIG. 15, the number of differences between the input sentence “My glasses are not found” and the Japanese sentence “My suitcase is not found” in the parallel translation candidate of the search result 1 is 1 Since there are only two locations, the number of data columns in the difference data buffer 825 is one column. In general, when there are a plurality of different parts, the number of data strings is plural, and the “difference part number” takes an integer value in ascending order from 1 to 1.

(対訳例文の検索と合成・生成処理−第2言語相違箇所決定処理)
続いて、ルーチンは、原文に対する類似対訳の第2言語における相違箇所を決定する(図5のStep s143)。
図8は、この第2言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。図8に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1431)。そして、処理対象とする類似対訳の第1言語文の相違箇所に対応する第2言語文の相違箇所を判定する(Step s1432)。相違箇所の判定は、第1言語の相違箇所を示す相違箇所データバッファ825の内容、第1言語文と第2言語文との語の対応関係を示す対応関係バッファの内容、第2言語文の単語情報バッファの内容および第2言語文バッファの内容を用いて処理することができる。
(Search for bilingual example sentences and synthesis / generation processing-second language difference determination processing)
Subsequently, the routine determines a difference portion in the second language of the similar parallel translation with respect to the original sentence (Step s143 in FIG. 5).
FIG. 8 is a flowchart showing an example of a detailed procedure of the process for determining the second language difference portion. As shown in FIG. 8, the routine initializes a counter for sequentially processing all similar parallel translations retrieved from the parallel translation example sentence database 51 (Step s1431). Then, the difference portion of the second language sentence corresponding to the difference portion of the first language sentence of the similar parallel translation to be processed is determined (Step s1432). The determination of the difference part is performed by determining the contents of the difference part data buffer 825 indicating the difference part of the first language, the contents of the correspondence buffer indicating the correspondence relation between the first language sentence and the second language sentence, and the second language sentence. Processing can be performed using the contents of the word information buffer and the contents of the second language sentence buffer.

相違箇所の判定後、ルーチンはStep s1433へ進み、検索された全ての類似対訳に対して相違箇所の判定を行ったかどうかを調べ、また判定していない類似対訳がある場合、ルーチンは、次の類似対訳を選択して(Step s1434)相違箇所の判定を繰り返す。全ての類似対訳について相違箇所の判定を行った場合、ルーチンは第2言語相違箇所決定処理を終了し、図5のStep s144へと進む。   After the determination of the difference portion, the routine proceeds to step s1433 to check whether the difference portion determination has been performed for all the similar parallel translations that have been searched. A similar parallel translation is selected (Step s1434), and the determination of the difference is repeated. When the difference portion is determined for all the similar parallel translations, the routine ends the second language difference portion determination process and proceeds to Step s144 in FIG.

図16は、前述の処理によって決定された第2言語の相違箇所を第1言語と合成するための合成文単語情報データバッファと、合成された文を格納する合成文バッファ823のデータ構造とデータの一例を示す説明図である。これらのデータバッファは、検索された類似対訳毎のデータを格納する場合、対訳例文検索結果バッファ822の構造体の一部としてバッファ構造を定義してもよい。図16は、以下のことを示している。
「対訳例文単語番号」の欄は、対訳候補の英語文「I can't find my suitcase.」における相違箇所は、6番目の単語から1単語「suitcase」であることを示している。そして、「相違箇所番号」の欄は、この相違箇所が、原文と検索結果1の対訳候補の日本語文の第1番目の相違箇所に関するものであることを示している。
「言語フラグ」の欄は、その単語番号の単語が第1言語のものか第2言語のものかを示す情報であるが、ある単語番号の単語が第1言語(原語)のものであることと、その単語番号の「相違箇所番号」の欄に有効な値が格納されていること、すなわち対訳の第2言語文に第1言語が合成されていることとは同じことなので、「言語フラグ」と「相違箇所番号」の両欄を兼用させてもよい。
FIG. 16 shows a data structure and data of a synthesized sentence word information data buffer for synthesizing a difference portion of the second language determined by the above processing with the first language, and a synthesized sentence buffer 823 for storing the synthesized sentence. It is explanatory drawing which shows an example. These data buffers may define a buffer structure as a part of the structure of the parallel translation example sentence search result buffer 822 when storing data for each similar parallel translation searched. FIG. 16 shows the following.
The column of “translation example sentence word number” indicates that the difference in the English sentence “I can't find my suitcase.” Of the translation candidate is one word “suitcase” from the sixth word. The column of “difference part number” indicates that the difference part relates to the first difference part between the original sentence and the Japanese sentence of the translation candidate of the search result 1.
The column “Language flag” is information indicating whether the word with the word number is in the first language or the second language, but the word with a certain word number is in the first language (original language). Since a valid value is stored in the column of “difference part number” of the word number, that is, the first language is synthesized with the second language sentence of the parallel translation, ”And“ difference part number ”may be used together.

(対訳例文の検索と合成・生成処理−合成文作成処理)
次に、ルーチンは、原文に対する類似対訳の第2言語における相違箇所を原文(第1言語)で置換した合成文を作成する(図5のStep s144)。
図9は、この第2言語相違箇所を原文で置換した合成文を作成する処理の詳細な手順の一例を示すフローチャートである。図9に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1441)。そして、処理対象とする類似対訳の第2言語文の相違箇所に原文の語をあてはめた合成文を作成する(Step s1442)。相違箇所の置換は、原文に対する類似対訳の第2言語における相違箇所を示す合成単語情報バッファの内容、第2言語文の単語情報バッファの内容および第2言語文バッファの内容を用いて処理することができる。
(Bilingual example sentence search and composition / generation process-compound sentence creation process)
Next, the routine creates a composite sentence in which the difference in the second language of the similar parallel translation to the original sentence is replaced with the original sentence (first language) (Step s144 in FIG. 5).
FIG. 9 is a flowchart showing an example of a detailed procedure of a process for creating a synthesized sentence in which the second language difference portion is replaced with an original sentence. As shown in FIG. 9, the routine initializes a counter for sequentially processing all similar parallel translations retrieved from the parallel translation example sentence database 51 (Step s1441). Then, a synthesized sentence in which the original word is applied to a different part of the second language sentence of the similar parallel translation to be processed is created (Step s1442). The replacement of the difference portion is processed using the contents of the synthesized word information buffer indicating the difference portion in the second language of the similar parallel translation to the original sentence, the contents of the word information buffer of the second language sentence, and the contents of the second language sentence buffer. Can do.

合成文作成後、ルーチンはStep s1443へ進み、検索された全ての類似対訳に対して相違箇所の判定を行ったかどうかを調べ、また判定していない類似対訳がある場合、ルーチンは、次の類似対訳を選択して(Step s1444)合成文の作成を繰り返す。全ての類似対訳について相違箇所の判定を行った場合、ルーチンは第2言語合成文の作成処理を終了し、図5のStep s145へと進む。   After the compound sentence is created, the routine proceeds to step s1443, where it is checked whether or not a difference portion has been determined for all the similar parallel translations that have been searched, and if there is a similar parallel translation that has not been determined, the routine The parallel translation is selected (Step s1444), and the composite sentence is repeatedly created. When it is determined that there are different parts for all the similar translations, the routine ends the process of creating the second language compound sentence, and proceeds to Step s145 in FIG.

図16に、合成された文を格納する合成文バッファ823のデータ構造とデータの一例を示す。図16の合成文バッファ823は、以下のことを示している。
「対訳例文文字番号」の欄は、対訳候補の英語(第2言語)文「I can't find my suitcase.」における相違箇所が、17番目と18番目であり、19番目の文字は、対訳例文の第2言語文の25番目の文字であることを示している。
「相違箇所番号」の欄は、17,18番目の文字の相違箇所が、入力文と検索結果1の対訳候補の日本語文の第1番目の相違箇所に関するものであることを示している。
「言語フラグ」の欄は、その単語番号の単語が第1言語のものか第2言語のものかを示す情報であり、17,18番目の文字が第1言語であり、その他の文字は第2言語であることを示している。
FIG. 16 shows an example of the data structure and data of the synthesized sentence buffer 823 that stores the synthesized sentence. The composite statement buffer 823 in FIG. 16 indicates the following.
The column of “translation example sentence character number” is the 17th and 18th differences in the English (second language) sentence “I can't find my suitcase.”, And the 19th character is the translation This indicates the 25th character of the second language sentence of the example sentence.
The column of “difference part number” indicates that the difference part of the 17th and 18th characters relates to the first difference part between the input sentence and the Japanese sentence of the translation candidate of the search result 1.
The column of “Language flag” is information indicating whether the word of the word number is in the first language or the second language, the 17th and 18th characters are the first language, and the other characters are the first language. It shows that it is 2 languages.

(対訳例文の検索と合成・生成処理−第2言語文生成処理)
最後に、ルーチンは、合成文の第1言語を適切な第2言語に置換した訳文を生成する(図5のStep S145)。
図10は、合成文の第1言語を適切な第2言語に置換する第2言語文生成処理の詳細な手順の一例を示すフローチャートである。図10に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1451)。そして、処理対象とする合成文の第1言語の合成箇所に適当な第2言語の語をあてはめた第2言語文を作成する(Step s1452)。ここで、合成文の第1言語の合成箇所に適当な第2言語の語をあてはめるために、相違箇所の第1言語、即ち「眼鏡」の語について対訳例文の検索をおこなう。検索した結果から、もっとも適切な語を判定し、それに対応する第2言語の語を合成文に当てはめる。この例では「眼鏡」の語であるが、複数の語からなる句であってもよい。この処理の詳細については、後述する。
(Bilingual example sentence search and composition / generation process-second language sentence generation process)
Finally, the routine generates a translated sentence in which the first language of the synthesized sentence is replaced with an appropriate second language (Step S145 in FIG. 5).
FIG. 10 is a flowchart illustrating an example of a detailed procedure of second language sentence generation processing for replacing the first language of the synthesized sentence with an appropriate second language. As shown in FIG. 10, the routine initializes a counter for sequentially processing all similar parallel translations searched from the parallel translation example sentence database 51 (Step s1451). Then, a second language sentence in which an appropriate second language word is applied to the synthesized portion of the first language of the synthesized sentence to be processed is created (Step s1452). Here, in order to apply an appropriate second language word to the synthesized part of the first sentence of the synthesized sentence, a bilingual example sentence is searched for the first language of the different part, that is, the word “glasses”. The most appropriate word is determined from the search result, and the corresponding second language word is applied to the synthesized sentence. In this example, the word “glasses” is used, but a phrase composed of a plurality of words may be used. Details of this processing will be described later.

合成文作成後、ルーチンはStep s1453へ進み、検索された全ての合成文に対して第2言語文の生成を行ったかどうかを調べ、また生成していない合成文がある場合、ルーチンは、次の類似対訳を選択して(Step s1454)第2言語文の作成を繰り返す。全ての類似対訳について第2言語文の生成を行った場合、ルーチンは第2言語文生成処理を終了し、図5のStep s145、即ち図1のStep s14の処理を終了してStep s15の処理へ進む。   After creating the synthesized sentence, the routine proceeds to step s1453, where it is checked whether the second language sentence has been generated for all the retrieved synthesized sentences. If there is a synthesized sentence that has not been generated, the routine The similar parallel translation is selected (Step s1454), and the creation of the second language sentence is repeated. When the second language sentence is generated for all the similar parallel translations, the routine ends the second language sentence generation process, ends the process of Step s145 of FIG. 5, that is, the process of Step s14 of FIG. 1, and performs the process of Step s15. Proceed to

図17は、前述の処理によって第2言語文を生成するために用いる相違箇所第1言語単語バッファ、相違箇所言語変換結果バッファおよび生成された第2言語文を格納する生成文バッファ824のデータ構造とデータの一例を示す説明図である。これらのデータバッファは、検索された類似対訳毎のデータを格納する場合、対訳例文検索結果バッファ822の構造体の一部としてバッファ構造を定義してもよい。図17は、以下のことを示している。   FIG. 17 shows the data structure of a different sentence first language word buffer, a different part language conversion result buffer, and a generated sentence buffer 824 that stores the generated second language sentence used to generate the second language sentence by the above-described processing. It is explanatory drawing which shows an example of data. These data buffers may define a buffer structure as a part of the structure of the parallel translation example sentence search result buffer 822 when storing data for each similar parallel translation searched. FIG. 17 shows the following.

まず、相違箇所第1言語単語バッファの「文字」欄は、入力文と検索結果1との第1の相違箇所が「眼鏡」であることを示している。そして、「相違箇所番号」の欄は、この相違箇所が第1の相違箇所であることを示している。さらに、「合成文単語番号」の欄は、前記の合成文単語情報バッファの相違箇所番号欄から合成文の単語番号の「6」が相違箇所であることを求め、その結果を格納している。また、前述のように相違箇所の第1言語「眼鏡」の語について対訳例文データベースの検索を行った結果、対応する第2言語の適切な表現が「glasses」であると得られた場合に、その結果を相違箇所言語変換結果バッファに格納している。そして、図16の合成文単語情報バッファの内容と前述の相違箇所言語変換結果バッファの内容とから、第2言語文を求め、その結果を図17の生成文バッファ824に格納する。あるいは、相違箇所言語変換結果バッファの内容のままでなく、活用形を適用して第2言語文を生成するようにしてもよい。そのような活用形は、言語処理に関する解析手法を用いて導出することができる。 First, the “character” column of the difference portion first language word buffer indicates that the first difference portion between the input sentence and the search result 1 is “glasses”. The column of “difference part number” indicates that this difference part is the first difference part. Further, the “synthetic sentence word number” field obtains that the word number “6” of the synthetic sentence is a different part from the different part number field of the synthetic sentence word information buffer, and stores the result. . In addition, as a result of searching the bilingual example sentence database for the word of the first language “glasses” at the different location as described above, when the appropriate expression of the corresponding second language is “glasses”, The result is stored in the difference language conversion result buffer. Then, a second language sentence is obtained from the contents of the synthesized sentence word information buffer of FIG. 16 and the contents of the above-described difference language conversion result buffer, and the result is stored in the generated sentence buffer 824 of FIG. Or you may make it produce | generate a 2nd language sentence not only with the content of a different location language conversion result buffer but with a utilization form. Such a utilization form can be derived using an analysis technique related to language processing.

生成文バッファ824の内容は、以下のことを示している。
「文字」欄は、第2言語生成文が「I can't find my glasses.」であることを示している。
「言語フラグ」欄は、第2言語合成文の第17〜25文字の「glasses」が、原文との相違箇所に由来することを示している。
「相違箇所番号」の欄は、第2言語合成文の第17〜25文字の「glasses」が、図14の相違箇所データバッファ825に示す第1番目の相違箇所に由来することを示している。
「対訳例文文字番号」の欄によれば、第2言語生成文のうち、第1〜16文字の「I can't find my 」と、第24文字の「.」が、図14の検索結果1の第2言語文バッファ中の第1〜第16文字と、第25文字に由来することを示している。
「言語フラグ」欄と「相違箇所番号」欄は、第2言語生成文を表示する際に、相違箇所を異なった態様で示すための情報として用いることができる。
以上が、図3のフローチャートのs14に示した対訳例文検索・合成・生成処理の詳細な処理手順の説明である。
The contents of the generated sentence buffer 824 indicate the following.
The “character” column indicates that the second language generation sentence is “I can't find my glasses.”.
The “Language Flag” column indicates that the “glasses” of the 17th to 25th characters of the second language synthesized sentence is derived from a difference from the original sentence.
The column of “difference part number” indicates that “glasses” of the 17th to 25th characters of the second language compound sentence is derived from the first difference part shown in the difference part data buffer 825 of FIG. .
According to the column of “translation example sentence character number”, in the second language generation sentence, the first to sixteenth characters “I can't find my” and the twenty-fourth character “.” Are the search results of FIG. It is derived from the first to sixteenth characters and the twenty-fifth character in one second language sentence buffer.
The “language flag” field and the “difference part number” field can be used as information for indicating the different part in different modes when displaying the second language generation sentence.
The above is the detailed processing procedure of the bilingual example sentence search / combination / generation processing shown in s14 of the flowchart of FIG.

(結果表示処理)
次に、ルーチンは図3のフローチャートのs15に示す結果表示処理を実行する。
図18は、結果表示の態様の一例を示す説明図である。g110の対訳検索結果表示部は、この発明の翻訳装置の原文、翻訳の途中経過および結果を表示する領域である。対訳検索結果表示部g110中、g111の表示「私の眼鏡が見つかりません。」は、図12の原文バッファ810の内容が表示されたものである。また、g112の「私のスーツケースが見つかりません。」は、図14に示す検索結果1の第1言語文バッファの内容が表示されたものである。g113の「I can’t find my suitcase.」は、図14に示す検索結果1の第2言語文バッファの検索結果1が表示されたものである。また、g114の「I can’t find my 眼鏡.」は、図16に示す第1検索結果の合成文バッファ823の内容が表示されたものである。そして、g115の「I can’t find my glasses.」は、図17の生成文バッファ824の内容が表示されたものである。
また、これらの下に以下の内容が表示されている
私の眼鏡が見つかりません。
探している商品が見つかりません。
I can’t find the thing I want.
I can’t find 私の眼鏡.
I can’t find my glasses.
これらの表示は、図14に示す検索結果2の対訳例文に関する内容であり、各表示は、前述した検索結果1の対訳例文に関する表示g111〜g115に対応するものである。
(Result display processing)
Next, the routine executes a result display process indicated by s15 in the flowchart of FIG.
FIG. 18 is an explanatory diagram illustrating an example of a result display mode. The parallel translation search result display section of g110 is an area for displaying the original text of the translation apparatus of the present invention, the progress of translation, and the results. In the bilingual search result display part g110, the display “gear my glasses is not found” in g111 is the one in which the contents of the original text buffer 810 in FIG. 12 are displayed. In addition, the content of the first language sentence buffer of the search result 1 shown in FIG. 14 is displayed in g112 “My suitcase is not found.” “I can't find my suitcase.” of g113 displays the search result 1 of the second language sentence buffer of the search result 1 shown in FIG. Also, “I can't find my glasses.” Of g114 is the one in which the contents of the synthesized sentence buffer 823 of the first search result shown in FIG. 16 are displayed. Then, “I can't find my glasses.” In g115 indicates the contents of the generated sentence buffer 824 in FIG.
Also, the following contents are displayed below these. My glasses are not found.
The product you are looking for is not found.
I can't find the thing I want.
I can't find my glasses.
I can't find my glasses.
These displays are the contents related to the bilingual example sentences of the search result 2 shown in FIG. 14, and each display corresponds to the above-described displays g111 to g115 related to the parallel example sentences of the search result 1.

ユーザは、入力文に対する各結果に関して、上記の5種類の文を表示するか否かを個別に選択することができる。図18の出力画面例は、上記の5つの文すべてを表示した場合の例である。これに対し、図21は、上記の1〜3番目の文のみを表示し、4、5番目の文は表示させないようにした出力画面例を示す説明図である。各文の表示・非表示は、処理結果表示フラグバッファ850の各欄の値によって決定される。その例を図19に示す。図19は、「原文」、「第1言語文」、「第2言語文」、の欄の値が表示され、「第2言語合成文」、「第2言語生成文」の欄の値が「非表示」になっているので、それに対応して、1から3番目のみが表示されて図21のような画面が表示される。
処理結果表示フラグバッファ850の初期値は、本装置の動作開始時に、所定の値に定められてもよいし、ユーザがその値を変更できるように構成されてもよい。
The user can individually select whether or not to display the above five types of sentences for each result for the input sentence. The example of the output screen in FIG. 18 is an example when all the above five sentences are displayed. On the other hand, FIG. 21 is an explanatory view showing an example of an output screen in which only the first to third sentences are displayed and the fourth and fifth sentences are not displayed. The display / non-display of each sentence is determined by the value in each column of the processing result display flag buffer 850. An example is shown in FIG. In FIG. 19, the values in the columns of “original text”, “first language sentence”, and “second language sentence” are displayed, and the values in the fields of “second language synthesized sentence” and “second language generation sentence” are displayed. Since “non-display” is selected, only the first to third items are displayed and a screen as shown in FIG. 21 is displayed.
The initial value of the processing result display flag buffer 850 may be set to a predetermined value when the operation of the apparatus starts, or may be configured so that the user can change the value.

図20は、結果表示処理(図3のStep s15の処理)の詳細を示すフローチャートである。図18の出力画面例にある各文の表示選択指示欄(g121, g122, g123, g124, g125)をユーザが操作した際の処理を表している。なお、以下の説明並びにフローチャート中に「クリック」とあるのは、装置の設計の一例であって、他の操作法であってもかまわない。
まず、その時点における処理結果表示フラグバッファの各欄の値に基づいて、各検索結果におけるg111〜g115の各文の表示・非表示を決定する(s1502〜s1511)、そして、決定した内容に従って画面の描画を行う(s1514)。
描画処理を終えたら、ルーチンは、ユーザの操作待ちで待機する(s1515)。図18の表示選択指示欄のいずれか(g121, g122, g123, g124, g125)がユーザによってクリックされると、それに応じて処理結果表示フラグバッファ850の内容が変更され、処理結果表示フラグバッファ850が再チェックされて各文の表示・非表示が決め直され、出力画面が再描画される。ユーザの操作待ち状態から、この状態を脱するような操作がユーザによってなされる(s1516)(たとえば、ウィンドウが閉じられるなど)まで、この状態が続く。このような処理によって、原文、最終的な翻訳結果が作成される過程の参考情報および訳文を、ユーザの意向に添った態様で提示することができる。
以上が、図3のStep s15の結果表示処理の詳細な処理手順の説明である。
FIG. 20 is a flowchart showing details of the result display process (the process of Step s15 in FIG. 3). 18 shows processing when the user operates the display selection instruction column (g121, g122, g123, g124, g125) of each sentence in the output screen example of FIG. Note that “click” in the following description and flowcharts is an example of the design of the apparatus, and may be another operation method.
First, display / non-display of each sentence of g111 to g115 in each search result is determined based on the value of each column of the processing result display flag buffer at that time (s1502 to s1511), and the screen is displayed according to the determined content Is drawn (s1514).
When the drawing process is completed, the routine waits for a user operation (s1515). When any of the display selection instruction fields (g121, g122, g123, g124, g125) in FIG. 18 is clicked by the user, the contents of the processing result display flag buffer 850 are changed accordingly, and the processing result display flag buffer 850 is changed. Is rechecked, the display / non-display of each sentence is determined, and the output screen is redrawn. This state continues from the state waiting for the user's operation until the user performs an operation to exit this state (s1516) (for example, the window is closed). By such processing, the original text, reference information on the process of creating the final translation result, and the translated text can be presented in a manner according to the user's intention.
The above is the detailed processing procedure of the result display process in Step s15 of FIG.

(表示内容の編集)
次に、ルーチンは図3のStep s16に示す表示内容の編集処理を実行する。図23は、この表示内容の編集処理の際の表示態様の一例を示す説明図である。この処理は、図18や図21のように対訳例文検索結果が表示され、あるいは併用する機械翻訳の結果が表示されている状態から、所望に応じてユーザが表示内容を編集することができる機能を提供する。
(Edit display contents)
Next, the routine executes a display content editing process shown in Step s16 of FIG. FIG. 23 is an explanatory diagram illustrating an example of a display mode in the editing process of the display content. This processing is a function that allows the user to edit the display contents as desired from the state in which bilingual example sentence search results are displayed as shown in FIG. 18 or FIG. 21, or the results of machine translation to be used together are displayed. I will provide a.

図22は、ユーザによる編集・利用に関する処理(図3のStep s16)の詳細を示すフローチャートである。
このモードの処理に入ると、まず、翻訳結果の一例として、前述の検索結果1の第2言語生成文「I can’t find my glasses.」が、g102(出力結果表示・編集部)に転写されて(s1601)ユーザの操作待ち状態(Step s1602)に入る。なお、この初期動作は、この発明の翻訳装置の一実施形態であって、これに限るものではない。
ユーザの操作待ち状態においては、操作に応じて以下のような動作がなされる。
図18に示すg110(対訳検索結果表示部)内をクリックした場合、ルーチンはStep s1603へ進み、クリックした位置にある文を強調表示する(Step s1604)。なお、その時点で、クリックした位置にある文以外の文が既に強調表示されている場合は、その文を通常表示に戻す。すなわち、g110領域内で強調表示される文は1文のみに制御される。そしてユーザの操作待ち状態に戻る。
FIG. 22 is a flowchart showing details of the processing related to editing / use by the user (Step s16 in FIG. 3).
When entering this mode, first, as an example of the translation result, the second language generation sentence “I can't find my glasses.” Of the search result 1 described above is transferred to g102 (output result display / editing unit). (S1601) and enters the user operation waiting state (Step s1602). This initial operation is an embodiment of the translation apparatus of the present invention, and is not limited to this.
In the user operation waiting state, the following operation is performed according to the operation.
When the user clicks in g110 (translation search result display section) shown in FIG. 18, the routine proceeds to Step s1603, and highlights the sentence at the clicked position (Step s1604). If a sentence other than the sentence at the clicked position is already highlighted at that time, the sentence is returned to the normal display. That is, the sentence highlighted in the g110 region is controlled to only one sentence. And it returns to a user's operation waiting state.

また、図18のg132(対訳検索結果の転写指示ボタン)をクリックした場合、ルーチンはs1605へ進み、g110領域内で強調表示されている文を、g102(出力結果表示・編集部)の領域に追加的に転写する(Step s1606)。そしてユーザの操作待ち状態に戻る。
あるいは、図18のg131(機械翻訳結果の転写指示ボタン)をクリックした場合、ルーチンはs1607へ進み、g103領域に表示されている機械翻訳結果の文字列(図13の機械翻訳文バッファ830に格納されている内容)を、g102の領域に追加的に転写する(Step s1608)。 そしてユーザの操作待ち状態に戻る。
あるいはまた、図18のg102(出力結果表示・編集部)の領域内をクリックした場合、ルーチンはStep s1609へ進み、g102の領域がテキストエディタとして動作するようになる(Step s1610)。そして、ユーザは、既に存在している文を参考にしながら、その内容を自由に編集することができる。テキストエディタの動作の詳細は公知の技術であるので詳細な説明は略す。ここで、g102の領域外のどこかをユーザがクリックすれば、テキストエディタモードを抜け、ユーザの待ち状態に戻る。
また、図18のg133(出力結果確定指示ボタン)をクリックした場合、ルーチンはs1611へ進み、その時点でg102(出力結果表示・編集部)領域に存在している文字列を確定させる。たとえば、クリップボードにコピーしたり、連動して動く他のアプリケーションプログラムに入力したりする(Step s1612)。そして編集動作を終了する。
If the user clicks on g132 (translation instruction button for bilingual search result) in FIG. 18, the routine proceeds to s1605, and the sentence highlighted in the g110 area is displayed in the area of g102 (output result display / editing unit). In addition, transcription is performed (Step s1606). And it returns to a user's operation waiting state.
Alternatively, when g131 (machine translation result transfer instruction button) in FIG. 18 is clicked, the routine proceeds to s1607, and the character string of the machine translation result displayed in the g103 area (stored in the machine translation sentence buffer 830 in FIG. 13). Content) is additionally transferred to the region of g102 (Step s1608). And it returns to a user's operation waiting state.
Alternatively, when the area in g102 (output result display / editing unit) in FIG. 18 is clicked, the routine proceeds to Step s1609, and the area of g102 operates as a text editor (Step s1610). The user can freely edit the content while referring to the existing sentence. Details of the operation of the text editor are well-known techniques, and thus detailed description thereof is omitted. If the user clicks anywhere outside the area of g102, the text editor mode is exited and the user is returned to the waiting state.
When the g133 (output result confirmation instruction button) in FIG. 18 is clicked, the routine proceeds to s1611, and the character string existing in the g102 (output result display / editing unit) area at that time is confirmed. For example, it is copied to the clipboard or input to another application program that moves in conjunction with the clipboard (Step s1612). Then, the editing operation ends.

図23は、図21の状態から、図20に示すg132(機械翻訳結果の転写指示ボタン)をクリックした後の状態を示す説明図である。これによって、g103(機械翻訳結果表示部)の領域に表示されている機械翻訳文「My glasses aren’t found.」が、g102(出力結果表示・編集部)に元からあった第2言語生成文「I can’t find my glasses.」の後に追加された状態を示している。
この機能によって、ユーザは、機械が提示する情報を利用しながら編集を行うことにより最終的な訳文を作成することもできる。訳文が適切で、編集の必要がなければこの機能を利用する必要はない。
FIG. 23 is an explanatory diagram showing a state after clicking g132 (transfer instruction button for machine translation result) shown in FIG. 20 from the state shown in FIG. As a result, the machine translation sentence “My glasses aren't found.” Displayed in the area of g103 (machine translation result display section) is generated in the second language originally in g102 (output result display / edit section). It shows the state added after the sentence "I can't find my glasses."
With this function, the user can also create a final translation by performing editing while using information presented by the machine. You don't need to use this feature if the translation is appropriate and you don't need to edit it.

(語・句検索モードへの自動移行)
前述したような処理を行うことによって、対訳例文データベースを用いた翻訳を行うことができるが、入力した原文と類似する対訳例文を対訳例文データベースから検索した際に、所定の閾値以上の類似度を持つ例文が存在しなかった場合が考えられる。このような場合に、入力文を語・句に分割して、分割された各々の語・句について対訳例文データベースを検索し、その結果を出力させるようにしてもよい。これによって、最適な訳文が見つからなかった場合でも、参考情報を出力してユーザの翻訳を支援することができる。
(Automatic transition to word / phrase search mode)
By performing the processing as described above, translation using the bilingual example sentence database can be performed. However, when a bilingual example sentence similar to the input original sentence is searched from the bilingual example sentence database, a similarity degree equal to or higher than a predetermined threshold is obtained. There may be a case where there is no example sentence. In such a case, the input sentence may be divided into words / phrases, the bilingual example sentence database is searched for each divided word / phrase, and the result may be output. As a result, even when the optimum translation is not found, the reference information can be output to assist the user's translation.

図24は、このような機能を含む翻訳装置の全体の処理を示すフローチャートである。図24に示す処理のうち、Step s205の分岐の左側の処理の流れ、すなわち、START→s201→s202→s203→s204→s205→s211→s212→s213→s214→s215→s216に至る流れは、前述の説明と同様に、入力された原文と類似の文を対訳例文データベースから検索して、その結果に基づいて訳文を生成するものである。すなわち、s201は図3のs11、s202は図3のs12、s203は図3のs13、s204は図5のs141に、それぞれ相当する。また、s205の判定は、図6のStep s1412の類似度判定と同様であり、また、図6に示す処理のようにすべての対訳文について順次検索処理を行う。そして、入力文との類似度がある閾値以上の対訳例文が、1組も存在しない場合、ルーチンはs221に進むが、1組以上存在した場合は、ルーチンはs211へ進む。s211は図5のs142、s212は図5のs143、s213は図5のs144、s214は図5のs145、s215は図3のs15、s216は図3のs16に、それぞれ相当する。   FIG. 24 is a flowchart showing the overall processing of the translation apparatus including such a function. 24, the flow of processing on the left side of the branch of Step s205, that is, the flow from START → s201 → s202 → s203 → s204 → s205 → s211 → s212 → s213 → s214 → s215 → s216 is described above. In the same manner as described above, a sentence similar to the input original sentence is searched from the parallel translation example sentence database, and a translated sentence is generated based on the result. That is, s201 corresponds to s11 in FIG. 3, s202 corresponds to s12 in FIG. 3, s203 corresponds to s13 in FIG. 3, and s204 corresponds to s141 in FIG. The determination at s205 is the same as the similarity determination at Step s1412 of FIG. 6, and the search processing is sequentially performed for all the parallel translations as in the processing shown in FIG. If there is no pair of translated example sentences whose similarity to the input sentence is equal to or greater than a threshold, the routine proceeds to s221, but if there are one or more pairs, the routine proceeds to s211. 5 corresponds to s142 in FIG. 5, s212 corresponds to s143 in FIG. 5, s213 corresponds to s144 in FIG. 5, s214 corresponds to s145 in FIG. 5, s215 corresponds to s15 in FIG. 3, and s216 corresponds to s16 in FIG.

以下、図24に示す処理で入力文との類似度がある閾値以上の対訳例文が1組も存在しない場合の処理について、説明する。今、入力された原文が「最近、われわれは、マーケットで電子辞書の新型製品を紹介した。」であるとし、この入力文に対して類似度がある閾値以上の対訳例文が1組も存在しないとする。その場合、Step s205での判定で、ルーチンはStep s221に進み、前記の原文を語・句に分割する。分割の具体的な判定方法としては、たとえば形態素解析手段(公知技術)と単語辞書とを用いる方法がある。この場合、辞書が必要になるが、その辞書は、第1言語の単言語辞書でよく、対訳辞書である必要はない。たとえば入力文が日本語の場合、日本語の単語を集積し整理したものでよく、日本語の見出しに英語の訳語がついている必要はない。あるいは、他の方法として、スペースの位置で区切る方法がある。この場合、辞書が不要であり、英語などのように、単語間にスペースを空けて書く言語の場合に使うことができる。さらに、上記の2つの方法と異なる手法として、文字種が切り替わる位置で区切る方法がある。この場合も、辞書は不要である。たとえば日本語の場合、文字種を漢字・ひらがな・カタカナ・英字・数字・記号などに分類した場合の、文字種の異なっている文字境界で区切る。日本語のように、使われる文字が大まかに何種類かに大別され、それぞれの文字種の使われ方に一定の傾向があるような言語の場合に使うことができる。   In the following, a process when there is no pair of parallel example sentences having a similarity with the input sentence equal to or higher than a threshold in the process shown in FIG. Now, assuming that the original text entered is “We recently introduced a new electronic dictionary product on the market.”, There is no pair of translated example sentences that have a similarity above the threshold. And In that case, the routine proceeds to Step s221 in the determination at Step s205, and the original text is divided into words and phrases. As a specific determination method for division, for example, there is a method using a morphological analysis means (a known technique) and a word dictionary. In this case, a dictionary is required, but the dictionary may be a monolingual dictionary of the first language and does not need to be a bilingual dictionary. For example, if the input sentence is Japanese, it is sufficient that Japanese words are collected and organized, and it is not necessary that the Japanese translation has an English translation. Alternatively, as another method, there is a method of dividing by a space position. In this case, a dictionary is not necessary, and it can be used in the case of a language such as English where there is a space between words. Further, as a method different from the above two methods, there is a method of dividing at a position where the character type is switched. In this case, a dictionary is not necessary. For example, in the case of Japanese, when character types are classified into kanji, hiragana, katakana, alphabetic characters, numbers, symbols, etc., they are separated by character boundaries with different character types. It can be used for languages such as Japanese, where the characters used are roughly divided into several types and each character type has a certain tendency.

このようにして、原文を語・句に分割し、これらの日本語(第1言語)の語・句のうち、検索して意味のあるものを用いて、対訳例文データベースが検索し(Step s222)、検索した語・句を第1言語に含む対訳例文を検索結果として得る。ここで、たとえば日本語の文を語・句に分割する方法や、それらの語・句から検索して意味のあるものを選択する方法、日本語文を格納したデータベースを日本語の語・句によって検索する方法は公知の技術を用いて実現することができる。
そして、前記の検索結果を出力する(Step s223)。図25及び図26は、検索結果の出力態様の一例を示す説明図である。図25は、前述の図18と同様のウインドウであるが、入力文との類似度がある閾値以上の対訳例文が存在しないので、その旨が対訳検索結果表示部に表示されている状態を示している。また、出力結果表示・編集部には、《検索結果1》の《第2言語生成文》の代わりに、併用する機械翻訳処理による訳文「Recently, we introduced the new model of the electronic dictionary in the market.」が自動的に転写されている。ただし、これはあくまでも本装置の設計の一例であり、他にも様々な処理方針が考えられる。そして、同時に図26のような画面が、たとえば、マルチウィンドウシステムを用いて表示される。図26の画面には、原文から分割された語・句と、それを用いて検索された対訳例文が表示されている。図26の、語・句検索モードの出力画面例において、g201(入力文表示部)領域には、入力された原文「最近、われわれは、マーケットで電子辞書の新型製品を紹介した。」が自動的に転写されている。g204の検索結果表示部およびg207の検索語句リスト表示部には、入力文から分割された語・句(g205及びg207)が表示されている。これらのg205またはg207の語・句をクリックすると、g204の領域におけるそれらの語・句の下側に、g206に示すように、それらの語・句によって検索された対訳例文が表示される。
In this way, the original sentence is divided into words / phrases, and the bilingual example sentence database is searched using those Japanese (first language) words / phrases that are meaningful by searching (Step s222). ), A bilingual example sentence including the searched word / phrase in the first language is obtained as a search result. Here, for example, a method of dividing a Japanese sentence into words / phrases, a method of searching from those words / phrases and selecting a meaningful one, and a database storing Japanese sentences by Japanese words / phrases The searching method can be realized using a known technique.
Then, the search result is output (Step s223). 25 and 26 are explanatory diagrams illustrating an example of an output mode of search results. FIG. 25 is a window similar to FIG. 18 described above, but shows a state in which there is no parallel translation example sentence whose similarity to the input sentence exceeds a threshold value, and that fact is displayed on the parallel translation search result display unit. ing. In addition, the output result display / editing section will display the translated text “Recently, we introduced the new model of the electronic dictionary in the market” instead of “Second Language Generated Text” in “Search Result 1”. Is automatically transcribed. However, this is only an example of the design of this apparatus, and various other processing policies can be considered. At the same time, a screen as shown in FIG. 26 is displayed using, for example, a multi-window system. In the screen of FIG. 26, words / phrases divided from the original sentence and parallel example sentences searched using the words / phrases are displayed. In the output screen example of the word / phrase search mode of FIG. 26, the input original sentence “We recently introduced a new electronic dictionary product at the market” is automatically displayed in the g201 (input sentence display part) area. Is being transcribed. In the search result display part of g204 and the search word list display part of g207, words / phrases (g205 and g207) divided from the input sentence are displayed. When these words / phrases of g205 or g207 are clicked, bilingual example sentences searched by these words / phrases are displayed below the words / phrases in the region of g204, as indicated by g206.

また、g201の入力文表示部は、ユーザが編集することも可能であり、ユーザによって書き換えられた文に基づいて語・句に分割して対訳例文を検索することも可能である。その場合には、g202の検索指示ボタンをクリックすることにより、改めて語・句による検索の指示を明示的に行う。
g204の領域では、対訳例文が表示されている際に、対訳例文が表示されている箇所をクリックすると、その箇所の対訳例文が強調表示される。強調表示される対訳例文は高々1組であり、ある対訳例文が強調表示されている時に、別の対訳例文の箇所がクリックされれば、新たにクリックされた箇所の対訳例文が強調表示され、それまで強調表示されていた対訳例文は通常表示に戻る。
Further, the input sentence display section of g201 can be edited by the user, and it is also possible to search for parallel translated example sentences by dividing into words / phrases based on the sentence rewritten by the user. In that case, by clicking the search instruction button of g202, a search instruction by word / phrase is explicitly performed again.
In the area of g204, when a bilingual example sentence is displayed, if a part where the bilingual example sentence is displayed is clicked, the bilingual example sentence at that part is highlighted. There is at most one pair of translated example sentences that are highlighted, and when one translated example sentence is highlighted, if a part of another translated example sentence is clicked, the translated example sentence at the newly clicked part is highlighted. The bilingual example sentences that have been highlighted until then return to normal display.

前述のように検索結果の表示を行った後、ユーザにこれらの検索結果を編集させ、あるいは編集せずにその一部または全部を利用させるための処理を実行する(Step s224)。すなわち、図26の語・句検索モードの出力画面において、g204の領域内のある対訳例文が強調表示されている際に、g203の「検索結果の転写指示ボタン」をクリックすると、そのとき強調表示されている対訳例文の第2言語文が、図25の画面の出力結果表示・編集部に追加的に転写され、同時に図26の語・句検索モードの出力画面が閉じられる。その結果、元の出力画面は図27のようになる。図27の画面では、出力結果表示・編集部には、機械翻訳文「Recently, we introduced the new model of the electronic dictionary in the market.」に加えて、語・句により検索された文「I’d like to show you our new line of electronic goods.」が格納されている。図27の画面で、ユーザは、出力結果表示・編集部に表示された文を元に、編集をすることができる。   After the search results are displayed as described above, a process for causing the user to edit these search results or to use part or all of them without editing (Step s224) is executed. That is, when a bilingual example sentence in the region of g204 is highlighted on the output screen of the word / phrase search mode of FIG. The second language sentence of the translated bilingual example sentence is additionally transferred to the output result display / editing section of the screen of FIG. 25, and at the same time, the output screen of the word / phrase search mode of FIG. 26 is closed. As a result, the original output screen is as shown in FIG. In the screen of FIG. 27, the output result display / editing section includes the sentence “I ′” retrieved by the word / phrase in addition to the machine translation sentence “Recently, we introduced the new model of the electronic dictionary in the market.” d like to show you our new line of electronic goods. " In the screen of FIG. 27, the user can edit based on the sentence displayed in the output result display / editing unit.

前述の機能により、この発明の翻訳装置は、入力文に近い文が対訳例文データベースに存在しない場合でも、機械翻訳及び部分的な言い回しを組み合わせてユーザによる訳文(第2言語)の作成を支援することができる。
なお、前述した処理は、あくまでもこの発明の翻訳装置における一つの実施形態であり、たとえば、g207の検索語句リスト表示部をg204と別に設けることをせず、検索結果と検索語句リストと一つの表示部に表示するなど、種々の異なる実施形態が考えられる。そして、それらの態様は、この発明の範疇に含まれる。
With the above-described function, the translation apparatus of the present invention supports the creation of a translation (second language) by the user by combining machine translation and partial wording even when a sentence close to the input sentence does not exist in the parallel translation example sentence database. be able to.
Note that the processing described above is merely one embodiment of the translation apparatus of the present invention. For example, the search result list, search word list, and one display are not provided separately from the g204 search word list display unit. Various different embodiments are possible, such as displaying on the part. And those aspects are included in the category of this invention.

(ユーザによる対訳例文の登録)
この発明の翻訳装置は、翻訳に用いる対訳例文をユーザが登録でき、あらかじめ登録された対訳例文に加えて、登録された対訳例文を用いた翻訳を行うことができる。これにより、ユーザは、よく使う分野の対訳例文を自分で作成して登録したり、パッケージ化された専門分野の対訳例文を入手して追加登録したりでき、これによって特定の分野の対訳例文を充実させて翻訳をより適切に行うことができる。
(Registration of bilingual example sentences by the user)
The translation apparatus of the present invention allows a user to register a bilingual example sentence to be used for translation, and can perform translation using a registered bilingual example sentence in addition to a pre-registered bilingual example sentence. This allows the user to create and register bilingual example sentences for frequently used fields, or to obtain and register bilingual example sentences for specialized fields that have been packaged. It can be enriched and translated more appropriately.

また、この発明によれば、新規の対訳例文をユーザ登録する際に、ユーザに登録させた複数言語の文の組を単に文として登録するだけでなく、各言語の文をそれぞれの語・句に分割し、分割された語・句の言語間の対応付けを行い、それらの語・句の分割および対応付けに関する情報を付加して登録する。従って、ユーザ登録された対訳例文は、予め登録されている対訳例文と同じ情報を有し、予め登録されている対訳例文に対して何ら遜色なく、翻訳に利用され、質のよい翻訳が提供される。   Further, according to the present invention, when a new bilingual example sentence is registered as a user, not only a sentence set of a plurality of languages registered by the user is registered as a sentence but also a sentence in each language is assigned to each word / phrase. Are divided into words, and the divided words / phrases are associated with each other, and information regarding the division and association of the words / phrases is added and registered. Therefore, the bilingual example sentence registered by the user has the same information as the pre-registered bilingual example sentence, and is used for translation without any inferiority to the pre-registered bilingual example sentence, and a high-quality translation is provided. The

図4は、ユーザによる対訳例文の登録の処理の流れを示すフローチャートである。図4に示すように、まずユーザによって新規の対訳例文が入力される(Step s31)。 図2でいうと、ユーザ・インタフェース15の制御のもと、入力部300または原文ファイル10から、対訳例文が入力される。   FIG. 4 is a flowchart showing the flow of the process of registering the bilingual example sentences by the user. As shown in FIG. 4, first, a new bilingual example sentence is input by the user (Step s31). In FIG. 2, a bilingual example sentence is input from the input unit 300 or the original text file 10 under the control of the user interface 15.

いま、登録しようとする対訳例文の組が、2つの言語からなり、
第1言語文(日本語):探している商品が見つかりません。
第2言語文(英語): I can’t find the thing I want.
であるとする。もっとも、入力される対訳例文は、このように対応する複数言語の文の文字列(いわゆるプレーンテキスト)に限られるものではなく、他の「翻訳メモリ」装置(例文検索型翻訳支援装置)で用いられている対訳例文のデータ形式をそのまま取り込む機能を含んでいてもよい。
The pair of example sentences to be registered now consists of two languages.
First language sentence (Japanese): The product you are looking for is not found.
Second language sentence (English): I can't find the thing I want.
Suppose that However, the input bilingual example sentences are not limited to the character strings (so-called plain texts) of the sentences in a plurality of languages, and are used in other “translation memory” devices (example sentence search type translation support devices). It may include a function of directly importing the data format of the translated example sentence.

対訳例文の入力の後、ユーザにより「登録」の指示がされる(Step s32)。図2でいうと、ユーザ・インタフェース15の制御のもと、入力部300から登録指示が入力される。   After inputting the parallel translation example sentence, the user instructs “registration” (Step s32). In FIG. 2, a registration instruction is input from the input unit 300 under the control of the user interface 15.

そして、ユーザの登録指示に応じて、入力された対訳例文を、文を構成する語・句に分割し、分割した語・句について言語間の対応付けの処理を行う(Step s33)。本実施例における対訳例文それぞれの語・句への分割、及び対訳例文相互の語・句の対応付け処理は、図2に示すように、語・句対応付け処理部50が、対訳辞書53およびそれを検索するための対訳辞書引き処理部52を用いて行う。   Then, in response to the user's registration instruction, the input bilingual example sentence is divided into words / phrases constituting the sentence, and the process of associating the languages with the divided words / phrases is performed (Step s33). In the present embodiment, the bilingual example sentences are divided into words / phrases and the word / phrase association processing between the bilingual example sentences is performed by the word / phrase association processing unit 50, as shown in FIG. This is performed by using the parallel dictionary lookup processing unit 52 for searching for it.

今、登録しようとする対訳例文が前述の文の組であるので、語・句対応付け処理部50が、まず、これらの文を以下のような語に分割する。
第1言語文(日本語):「探し」「ている」「商品」「が」「見つかり」「ませ」「ん」「。」
第2言語文(英語): 「I」「can」「’t」「find」「the」「thing」「I」「want」「.」
そして、言語間の語・句の対応情報を、以下のように決する。
対応1: 「探している商品」−「the thing I want」
対応2: 「探している」−「I want」
対応3: 「商品」−「thing」
対応4: 「が見つかりません」−「I can’t find」
対応5: 「探している――が見つかりません」−「I can’t find ―― I want」
ここで、文中の「――」で示した箇所は、省略記号でなく、その部分に何かの語または句が挿入されることを示しており、いわば穴あき箇所である。
Since the bilingual example sentences to be registered are the above-described sentence pairs, the word / phrase association processing unit 50 first divides these sentences into the following words.
First language sentence (Japanese): "Looking""Iam""Product""Ga""Find""Not""N""."
Second language sentence (English): "I""can""'t""find""the""thing""I""want""."
Then, the correspondence information of words / phrases between languages is determined as follows.
Response 1: "Product you are looking for"-"the thing I want"
Response 2: “I want” – “I want”
Action 3: "Product"-"thing"
Action 4: “Cannot find”-“I can't find”
Action 5: "I'm looking for-I can't find"-"I can't find-I want"
Here, the part indicated by “-” in the sentence is not an ellipsis, but indicates that a word or phrase is inserted into the part, which is a perforated part.

入力された対訳例文と、前述の処理とによって得られる語・句情報ならびに語・句の対応に関する情報から、図14の検索結果2に示した各バッファのうち、「入力文との類似度バッファ」を除くバッファに格納する情報がすべて得られる。   Based on the input bilingual example sentence, the word / phrase information obtained by the above-described processing, and the information on the correspondence between the words / phrases, among the buffers shown in the search result 2 of FIG. All the information stored in the buffer except "" is obtained.

前述の語・句対応付け処理の後、対訳例文の登録を行う(Step s34)。図2でいうと、対訳例文データベース51に、前述の対訳例文及びそれに付加する語・句情報や語・句の対応情報を登録する。これらの各情報を格納するバッファと、その内容は図14の検索結果2に示すとおりである。ただし、図14の検索結果2中の「入力文との類似度バッファ」は除く。   After the above-described word / phrase association processing, a bilingual example sentence is registered (Step s34). Referring to FIG. 2, the above-described bilingual example sentence, word / phrase information to be added thereto, and word / phrase correspondence information are registered in the bilingual example sentence database 51. The buffer for storing these pieces of information and the contents thereof are as shown in the search result 2 of FIG. However, “similarity buffer with input sentence” in search result 2 of FIG. 14 is excluded.

なお、この実施例の説明では、ユーザが入力した対訳文の語・句を分割し、分割した語・句を言語間で対応付ける手段として、対訳辞書53およびそれを検索する対訳辞書引き処理部52を用いるようにしたが、対訳文の語・句の対応付けの手段はこれに限られるものではない。たとえば、既に対訳例文データベースに登録されている語・句対応付け済みの対訳例文から情報を獲得して、新規に入力した対訳例文の語・句対応付けを行うという方法も考えられる。また、機械翻訳を併用する場合、語・句対応付け処理部50、対訳辞書引き処理部52および対訳辞書53の一部を機械翻訳処理と共用するように構成してもよい。   In the description of this embodiment, the bilingual dictionary 53 and the bilingual dictionary lookup processing unit 52 that searches the bilingual dictionary 53 as means for dividing the bilingual sentence / phrase inputted by the user and associating the divided word / phrase between languages. However, the means for associating words / phrases in the bilingual sentence is not limited to this. For example, a method is also conceivable in which information is acquired from a bilingual example sentence already registered in a bilingual example sentence database and word / phrase association of a newly input bilingual example sentence is performed. When machine translation is used together, a part of the word / phrase association processing unit 50, the bilingual dictionary lookup processing unit 52, and the bilingual dictionary 53 may be shared with the machine translation processing.

(適切な訳語選択による訳文生成)
この発明の例文主導型翻訳装置は、図2の訳文合成・生成処理部30が、合成文の相違箇所である第1言語の語・句を第2言語に置換する。この処理は、図5のフローチャートにおいてはStep s145の処理で示されている。この第2言語への置換、即ち訳文生成処理は、置換すべき適切な訳語を選択する高度なものである。この処理に関して、さらに説明する。
(Translation generation by selecting appropriate translations)
In the example sentence-driven translation device of the present invention, the translated sentence synthesis / generation processing unit 30 in FIG. 2 replaces words / phrases in the first language, which are different parts of the synthesized sentence, with the second language. This process is indicated by the process of Step s145 in the flowchart of FIG. The replacement to the second language, that is, the translation generation process is an advanced one that selects an appropriate translation to be replaced. This process will be further described.

以下の説明においては、原語(第1言語)が英語、第2言語が日本語の場合であって、入力された原文が、
That restaurant offers a good atmosphere.
の場合を例にあげて説明する。これは、説明のための一例であって、他の文であっても、第1言語が日本語で第2原語が英語の場合であっても、あるいはそのいずれか一方または両方が日本語および英語以外の言語であってもかまわない。
In the following description, when the original language (first language) is English and the second language is Japanese, the input original sentence is
That restaurant offers a good atmosphere.
This case will be described as an example. This is an example for explanation, even if it is another sentence, even if the first language is Japanese and the second original language is English, or one or both of them are Japanese and A language other than English may be used.

この原文に類似する対訳例文の検索結果として、以下の対訳例文の組が挙がったとする。
第1言語(英語): That restaurant offers a good service.
第2言語(日本語): そのレストランはサービスがいい。
この場合、第1言語相違箇所の決定処理(図5のStep s142)の結果、原文と対訳例文の第1言語における相違箇所は、原文では「atmosphere」であり、対訳例文の第1言語文では「service」であると判定される。
Assume that the following pairs of parallel example sentences are listed as search results for parallel example sentences similar to the original sentence.
First language (English): That restaurant offers a good service.
Second language (Japanese): The restaurant has good service.
In this case, as a result of the determination process of the first language difference part (Step s142 in FIG. 5), the difference part in the first language between the original sentence and the translated example sentence is “atmosphere” in the original sentence, and in the first language sentence of the translated example sentence. Determined to be “service”.

そして、その後の第2言語相違箇所の決定処理(図5のStep s143)では、対訳例文の第2言語文における相違箇所が「サービス」であると判定される。以上の処理がなされた状態で、第2言語合成文の合成処理(図5のStep S144)を行い、合成文として
「そのレストランはatmosphereがいい。」
を得る。
Then, in the subsequent determination process of the second language difference portion (Step s143 in FIG. 5), it is determined that the difference portion in the second language sentence of the bilingual example sentence is “service”. In the state where the above processing has been performed, the synthesis process of the second language compound sentence (Step S144 in FIG. 5) is performed, and the compound sentence “The restaurant is good at atmosphere.”
Get.

第2言語生成文の生成処理(図5のStep s145)では、合成文のうち第1言語
(英語)が挿入された相違箇所「atmosphere」を第2言語(日本語)に変換する。前述の
ように、図2の訳文合成・生成処理部30は、相違箇所の「atmosphere」をキーワードに
対訳例文データベース51を検索する。いま、検索の結果、「atmosphere」を含む対訳例文
の組として、以下のような例を含む対訳例文の組が複数個見いだされたとする。

前記の対訳例文の例5
英語例文 「I like the homey atmosphere of that restaurant. 」と
日本語例文「あのレストランの家庭的な雰囲気が好きだ。」の組

前記の対訳例文の例6
英語例文 「bad atmosphere engulfed the city」と、
日本語例文「町はひどい大気に包まれた」の組、

そして、図31に示した、これらの対訳例文のデータに含まれている対応関係データによって、
対訳例文の例5では「atmosphere」−「雰囲気」が対応づけられていることがわかり、
対訳例文の例6では「atmosphere」−「大気」が対応づけられていることがわかる。
このようにして、「atmosphere」に対応する日本語として「雰囲気」と「大気」とが見出されたとする。訳文合成・生成処理部30は、これらの検索結果の日本語表現中、最も適切な語を選んでひとつの語に決定する必要がある。これを実現するために、訳文合成・生成処理部30は、次の処理を行う。
上記のように、検索した対訳例文の第1言語(英語)文について、入力文にある他の単語(例えば「restaurant」、「offers」および「good」)との共起の度合いを求める。ここで、共起の対象となる語は、原文に含まれるすべての語であってもよいが、所定の規則に従って対象とする語を絞り込むようにしてもよい。その詳細については、後述する。
In the generation process of the second language generation sentence (Step s145 in FIG. 5), the difference portion “atmosphere” in which the first language (English) is inserted in the synthesized sentence is converted into the second language (Japanese). As described above, the translation composition / generation processing unit 30 in FIG. 2 searches the bilingual example sentence database 51 using the keyword “atmosphere” at the difference. As a result of the search, it is assumed that a plurality of pairs of translated example sentences including the following examples are found as a pair of translated example sentences including “atmosphere”.

Example 5 of the above parallel translation example sentence
English example sentence “I like the homey atmosphere of that restaurant.” And Japanese example sentence “I like the restaurant's homey atmosphere.”

Example 6 of the above parallel translation example sentence
English example "bad atmosphere engulfed the city"
A set of Japanese example sentences, “The town is in a terrible atmosphere”

And by the correspondence data contained in the data of these parallel translation example sentences shown in FIG.
In Example 5 of the parallel translation example, it can be seen that "atmosphere"-"atmosphere" are associated,
In the example 6 of the parallel translation example, it is understood that “atmosphere” − “atmosphere” is associated.
Assume that “atmosphere” and “atmosphere” are found as Japanese corresponding to “atmosphere” in this way. The translation composition / generation processing unit 30 needs to select the most appropriate word from the Japanese expressions of these search results and determine it as one word. In order to realize this, the translation composition / generation processing unit 30 performs the following processing.
As described above, the degree of co-occurrence with the other words (for example, “restaurant”, “offers”, and “good”) in the input sentence is obtained for the first language (English) sentence of the retrieved bilingual example sentence. Here, the words to be co-occurrence may be all the words included in the original text, but the words to be targeted may be narrowed down according to a predetermined rule. Details thereof will be described later.

前述のようにして共起の度合いを求めた結果、「atmosphere」−「雰囲気」が対応づけられている対訳例文の方が、入力文にある単語と共起度が高いと算出されたとする。この場合、合成文の相違箇所「atmosphere」を置換する訳語は、「雰囲気」であると判定され、その結果生成される第2言語の訳文は、
「そのレストランは雰囲気がいい。」
が得られる。
As a result of obtaining the degree of co-occurrence as described above, it is assumed that the bilingual example sentence in which “atmosphere” − “atmosphere” is associated with the word in the input sentence has a higher degree of co-occurrence. In this case, the translation that replaces the difference “atmosphere” in the synthesized sentence is determined to be “atmosphere”, and the translation of the second language generated as a result is
“The restaurant has a good atmosphere.”
Is obtained.

この機能によって、この発明の翻訳装置は、原文と対訳例文との相違箇所を置換すべき第2言語の候補が複数あっても、それらの候補の中から適切な訳語を選択することができる。   With this function, the translation apparatus of the present invention can select an appropriate translated word from among the candidates of the second language to be replaced with the difference between the original sentence and the parallel translation example sentence.

ここで、共起の対象となる語を絞り込む規則を以下に説明する。たとえば、共起の度合いを調べる上で対象から除外すべき語を予め定義しておくことができる。この実施例のように、第1言語が英語の場合、冠詞、代名詞、助動詞、be動詞、前置詞などの品詞を除外対象とすればよい。このような語は、語単独で独立した意味をもつことが少ないからである。図28は、除外対象語のリストの一例を示す説明図である。図28のような除外対象語のリストを作成しておき、原文の語にこれらが含まれる場合、それらの語を除いて共起の度合いを調べるようにすれば、訳文生成のための処理の量を減らすことができる。   Here, the rules for narrowing down the words to be co-occurrence will be described below. For example, words to be excluded from the target when examining the degree of co-occurrence can be defined in advance. As in this embodiment, when the first language is English, parts of speech such as articles, pronouns, auxiliary verbs, be verbs and prepositions may be excluded. This is because such words rarely have independent meanings. FIG. 28 is an explanatory diagram of an example of a list of exclusion target words. If a list of words to be excluded as shown in FIG. 28 is created and these are included in the original text, the degree of co-occurrence is checked by excluding those words, and the process for generating the translated text The amount can be reduced.

この発明の翻訳装置の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the translation apparatus of this invention. この発明の翻訳装置の構成の一例を翻訳の過程で処理されるデータの観点から示したブロック図である。It is the block diagram which showed an example of the structure of the translation apparatus of this invention from the viewpoint of the data processed in the process of translation. この発明の翻訳装置の概略の処理手順の一例を示すフローチャートである。It is a flowchart which shows an example of the schematic process sequence of the translation apparatus of this invention. ユーザが対訳例文の登録を行う場合の概略の処理手順の一例を示すフローチャートである。It is a flowchart which shows an example of the rough process sequence in case a user registers a bilingual example sentence. 図3のStep s14に示した対訳例文の検索と合成・生成処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the search of a translation example sentence shown to Step s14 of FIG. 3, and a synthesis | combination / production | generation process. この発明の実施形態において、類似文検索処理の手順の一例を示すフローチャートである。In this embodiment of this invention, it is a flowchart which shows an example of the procedure of a similar sentence search process. この発明の実施形態において、第1言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。In this embodiment of this invention, it is a flowchart which shows an example of the detailed procedure of the process which determines a 1st language difference location. この発明の実施形態において、第2言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。In this embodiment of this invention, it is a flowchart which shows an example of the detailed procedure of the process which determines a 2nd language difference location. この発明の実施形態において、第2言語相違箇所を原文で置換した合成文を作成する処理の詳細な手順の一例を示すフローチャートである。In this embodiment of this invention, it is a flowchart which shows an example of the detailed procedure of the process which produces the synthetic sentence which replaced the 2nd language difference part with the original sentence. この発明の実施形態において、合成文の第1言語を適切な第2言語に置換する第2言語文生成処理の詳細な手順の一例を示すフローチャートである。In this embodiment of this invention, it is a flowchart which shows an example of the detailed procedure of the 2nd language sentence production | generation process which replaces the 1st language of a synthetic sentence with the appropriate 2nd language. この発明の翻訳装置において、対訳例文データベースに格納する各対訳例文のデータ形式の一例を示す説明図である。In the translation apparatus of this invention, it is explanatory drawing which shows an example of the data format of each bilingual example sentence stored in a bilingual example sentence database. 原文を格納する原文バッファの構造を模式的に示した説明図である。It is explanatory drawing which showed typically the structure of the original sentence buffer which stores an original sentence. この発明の翻訳装置における機械翻訳文バッファの構造を模式的に示した説明図である。It is explanatory drawing which showed typically the structure of the machine translation sentence buffer in the translation apparatus of this invention. この発明の翻訳装置において、検索された対訳例文を格納する対訳例文検索結果バッファの構造を示す説明図である。It is explanatory drawing which shows the structure of the parallel translation example sentence search result buffer which stores the parallel translation example sentence searched in the translation apparatus of this invention. この発明の翻訳装置において、第1言語の相違箇所の結果を格納する相違箇所データバッファの構造を示す説明図である。In the translation apparatus of this invention, it is explanatory drawing which shows the structure of the different location data buffer which stores the result of the different location of a 1st language. 第2言語の相違箇所を第1言語と合成するための合成文単語情報データバッファと、合成された文を格納する合成文バッファの構造を示す説明図である。It is explanatory drawing which shows the structure of the synthetic sentence word information data buffer for synthesize | combining the difference part of a 2nd language with a 1st language, and the synthetic sentence buffer which stores the synthesized sentence. 第2言語文を生成するために用いる相違箇所第1言語単語バッファと、相違箇所言語変換結果バッファおよび生成された第2言語文を格納する生成文バッファの構造を示す説明図である。It is explanatory drawing which shows the structure of the generation sentence buffer which stores the difference part 1st language word buffer used in order to produce | generate a 2nd language sentence, a difference part language conversion result buffer, and the produced | generated 2nd language sentence. この発明の翻訳装置における、結果表示の態様の一例を示す説明図である。It is explanatory drawing which shows an example of the aspect of a result display in the translation apparatus of this invention. この発明の翻訳装置における、結果表示の態様の異なる一例を示す説明図である。It is explanatory drawing which shows an example from which the aspect of a result display differs in the translation apparatus of this invention. この発明の翻訳装置における、結果表示処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of a result display process in the translation apparatus of this invention. この発明の翻訳装置における、結果表示の態様のさらに異なる一例を示す説明図である。It is explanatory drawing which shows another example of the aspect of a result display in the translation apparatus of this invention. この発明の翻訳装置における、ユーザによる編集・利用に関する処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the process regarding the edit and utilization by a user in the translation apparatus of this invention. この発明の翻訳装置における、表示内容の編集処理の際の表示態様の一例を示す説明図である。It is explanatory drawing which shows an example of the display mode in the case of the edit process of a display content in the translation apparatus of this invention. この発明の翻訳装置における、語・句検索モードへの自動移行機能を含む全体の処理を示すフローチャートである。It is a flowchart which shows the whole process including the automatic transfer function to word and phrase search mode in the translation apparatus of this invention. この発明の翻訳装置における、検索結果の出力態様の一例を示す説明図である。It is explanatory drawing which shows an example of the output mode of a search result in the translation apparatus of this invention. この発明の翻訳装置における、検索結果の出力態様の異なる一例を示す説明図である。It is explanatory drawing which shows an example from which the output mode of a search result differs in the translation apparatus of this invention. この発明の翻訳装置における、検索結果の出力態様のさらに異なる一例を示す説明図である。It is explanatory drawing which shows another example of the output aspect of a search result in the translation apparatus of this invention. この発明の翻訳装置における、除外対象語のリストの一例を示す説明図である。It is explanatory drawing which shows an example of the list of exclusion object words in the translation apparatus of this invention. 対訳例文の例1、2のデータ構造を示す説明図である。It is explanatory drawing which shows the data structure of the examples 1 and 2 of a bilingual example sentence. 対訳例文の例3、4のデータ構造を示す説明図である。It is explanatory drawing which shows the data structure of the examples 3 and 4 of a parallel translation example sentence. 対訳例文の例5、6のデータ構造を示す説明図である。It is explanatory drawing which shows the data structure of the examples 5 and 6 of a parallel translation example sentence.

符号の説明Explanation of symbols

10 原文記憶部
11 翻訳結果記憶部
15 ユーザ・インタフェース
20 機械翻訳処理部
21 翻訳辞書
22 文法規則
30 訳文合成・生成処理部
31 対訳例文検索処理部
40 編集部
50 語・句対応付け処理部
51 対訳例文データベース(ユーザ登録対訳例文を含む)
52 対訳辞書引き処理部
53 対訳辞書
100 CPU
200 バスラインまたはネットワーク
300 入力部
400 出力部
500 制御プログラムモジュール
510 文字列編集部
521 機械翻訳文を文字列編集手段に入力する手段
522 第2原語生成文を文字列編集手段に入力する手段
530 表示制御部
531 原文表示選択部
532 対訳例文第1言語文表示選択部
533 対訳例文第2言語文表示選択部
534 第2言語合成文表示選択部
535 第2言語生成文表示選択部
600 機械翻訳プログラムモジュール
610 第1−第2言語辞書検索処理部
700 翻訳メモリプログラムモジュール
710 対訳例文検索処理プログラム
711 類似度判定処理プログラム
712 相違箇所判定処理プログラム
720 第2言語相違箇所判定処理プログラム
730 第2言語文合成処理プログラム
740 第2言語文生成処理プログラム
741 生成のための文法解析処理
750 対訳例文登録処理プログラム
751 対訳語句対応付け処理
800 動作用メインメモリ
810 原文バッファ
820 翻訳メモリ関連バッファ
821 ワークバッファ
822 対訳例文検索結果バッファ
823 合成文バッファ
824 生成文バッファ
825 相違箇所データバッファ
830 機械翻訳文バッファ
840 対訳例文登録関連バッファ
841 ワークバッファ
842 対訳例文バッファ
850 処理結果表示フラグバッファ
900 記憶部
910 語句対応付け済み対訳例文データ
920 第1−第2言語対訳辞書データ
930 第1→第2言語翻訳辞書データ、第1→第2言語翻訳文法規則データ、その他の第1→第2言語翻訳規則データ
940 第2言語生成用規則データ
g102 出力結果表示・編集部
g103 機械翻訳結果部
g110 対訳検索結果表示部
g111 原文バッファ表示部
g112 検索結果第1言語文バッファ表示部
g113 検索結果第2言語文バッファ表示部
g114 合成文バッファ表示部
g115 生成文バッファ表示部
g121〜125 表示選択指示ボックス
g131 機械翻訳結果の転写指示ボタン
g132 対訳検索結果の転写指示ボタン
g133 出力結果確定指示ボタン
DESCRIPTION OF SYMBOLS 10 Original sentence memory | storage part 11 Translation result memory | storage part 15 User interface 20 Machine translation process part 21 Translation dictionary 22 Grammar rule 30 Translation sentence synthesis | combination production | generation part 31 Bilingual example sentence search process part 40 Editing part 50 Word / phrase matching process part 51 Example sentence database (including user-registered bilingual example sentences)
52 Bilingual Dictionary Lookup Processing Unit 53 Bilingual Dictionary 100 CPU
200 Bus line or network 300 Input unit 400 Output unit 500 Control program module 510 Character string editing unit 521 Means for inputting machine translation sentence to character string editing means 522 Means for inputting second source language generated sentence to character string editing means 530 Display Control unit 531 Original sentence display selection part 532 Parallel translation example sentence first language sentence display selection part 533 Parallel translation example sentence second language sentence display selection part 534 Second language synthesized sentence display selection part 535 Second language generation sentence display selection part 600 Machine translation program module 610 First-second language dictionary search processing unit 700 Translation memory program module 710 Bilingual example sentence search processing program 711 Similarity determination processing program 712 Difference portion determination processing program 720 Second language difference portion determination processing program 730 Second language sentence synthesis processing Program 740 Second language Sentence generation processing program 741 Grammar analysis processing for generation 750 Bilingual example sentence registration processing program 751 Bilingual phrase association processing 800 Operation main memory 810 Original sentence buffer 820 Translation memory related buffer 821 Work buffer 822 Bilingual example sentence search result buffer 823 Synthetic sentence buffer 824 Generated sentence buffer 825 Difference part data buffer 830 Machine translation sentence buffer 840 Parallel translation example sentence registration-related buffer 841 Work buffer 842 Parallel translation example sentence buffer 850 Processing result display flag buffer 900 Storage unit 910 Phrase associated parallel translation example sentence data 920 First to second Language bilingual dictionary data 930 First → second language translation dictionary data, first → second language translation grammar rule data, other first → second language translation rule data 940 Second language generation rule data g102 Force result display / editing unit g103 Machine translation result unit g110 Bilingual search result display unit g111 Original buffer display unit g112 Search result first language sentence buffer display unit g113 Search result second language sentence buffer display unit g114 Composite sentence buffer display unit g115 Sentence buffer display parts g121 to 125 Display selection instruction box g131 Machine translation result transfer instruction button g132 Bilingual search result transfer instruction button g133 Output result confirmation instruction button

Claims (4)

第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、
(1)第1言語例文、
(2)該第1言語例文の単語単位の区切り及び各単語の文中での箇所、
(3)該第1言語例文に対応する第2言語例文、
(4)該第2言語例文の単語単位の区切り及び各単語の文中での箇所、並びに
(5)前記第1言語例文の少なくとも一単語からなる語句の箇所と前記第2言語例文の少なくとも一単語からなる語句の箇所とを対応付ける対応付情報
から一組がなる対訳例文の複数組を記憶する対訳例文記憶部と、
翻訳すべき第1言語の原文の少なくとも一部の語句が第1言語例文に含まれ、前記原文と所定の類似度を有する対訳例文を前記対訳例文記憶部から検索する対訳例文検索部と、
前記原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、
第1言語例文中の相違箇所に対応する第2言語例文の語句を前記対応付情報に基づいて取得し該語句を前記原文の語句で置き換えた合成文を作成する合成部と、
前記対訳例文記憶部に記憶された各対訳例文の中から、前記相違箇所判定部により見出された相違箇所の語句と同じ語句を含む対訳例文を検索し、その対訳例文の対応付情報に基づいて合成文に含まれる原文の語句を第2言語で置換した訳文を作成する訳文生成部と、
前記合成文および訳文を少なくとも出力する出力部とを備える翻訳装置。
A translation device for translating from a first language to a second language using a first language example sentence and a second language example sentence corresponding to the first language example sentence,
(1) First language example sentence,
(2) Separation in units of words of the first language example sentence and a place in the sentence of each word,
(3) a second language example sentence corresponding to the first language example sentence;
(4) Separation in units of words of the second language example sentence and locations in the sentence of each word; and (5) location of a phrase composed of at least one word of the first language example sentence and at least one word of the second language example sentence. A bilingual example sentence storage unit that stores a plurality of sets of bilingual example sentences that form a set from association information that associates the location of the phrase consisting of:
A bilingual example sentence search unit that retrieves from the bilingual example sentence storage unit a bilingual example sentence having a predetermined similarity with the original sentence, wherein at least a part of the phrase of the first language original sentence to be translated is included in the first language example sentence;
A difference part determination unit that determines a difference part between the original sentence and the searched bilingual example sentence in the first language example sentence;
A synthesizing unit that obtains a phrase of a second language example sentence corresponding to a different portion in the first language example sentence based on the association information and creates a synthesized sentence in which the phrase is replaced with the original phrase;
A bilingual example sentence that includes the same phrase as the phrase of the different part found by the different part judgment unit is searched from each of the bilingual example sentences stored in the bilingual example sentence storage unit, and based on the correspondence information of the bilingual example sentence A translation generation unit for creating a translation by replacing the original words included in the synthesized sentence with the second language;
A translation apparatus comprising: an output unit that outputs at least the synthesized sentence and the translated sentence.
出力された文をユーザが編集するための編集部をさらに備える請求項1に記載の翻訳装置。   The translation apparatus according to claim 1, further comprising an editing unit for the user to edit the output sentence. 前記語句が、単語および連語である請求項1または2に記載の翻訳装置。   The translation apparatus according to claim 1, wherein the phrase is a word and a collocation. 第1言語の原文を入力させる入力処理と、
対訳例文記憶部に記憶された複数組の対訳例文であって、
(1)第1言語例文、
(2)該第1言語例文の単語単位の区切り及び各単語の文中での箇所、
(3)該第1言語例文に対応する第2言語例文、
(4)該第2言語例文の単語単位の区切り及び各単語の文中での箇所、並びに
(5)前記第1言語例文の少なくとも一単語からなる語句の箇所と前記第2言語例文の少なくとも一単語からなる語句の箇所とを対応付ける対応付情報
から一組がなる対訳例文検索処理と、
前記原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定処理と、
第1言語例文中の相違箇所に対応する第2言語例文の語句を前記対応付情報に基づいて取得し該語句を前記原文の語句で置き換えた合成文を作成する合成処理と、
前記対訳例文記憶部に記憶された各対訳例文の中から、前記相違箇所判定処理により見出された相違箇所の語句と同じ語句を含む対訳例文を検索し、その対訳例文の対応付情報に基づいて合成文に含まれる原文の語句を第2言語で置換した訳文を作成する訳文生成処理と、
前記合成文および訳文を少なくとも出力する出力処理とをコンピュータに実行させる例文主導型翻訳プログラム。
An input process for inputting the original text in the first language;
A plurality of pairs of example sentences stored in the example sentence storage unit,
(1) First language example sentence,
(2) Separation in units of words of the first language example sentence and a place in the sentence of each word,
(3) a second language example sentence corresponding to the first language example sentence;
(4) Separation in units of words of the second language example sentence and locations in the sentence of each word; and (5) location of a phrase composed of at least one word of the first language example sentence and at least one word of the second language example sentence. A bilingual example sentence search process consisting of a set of correspondence information for associating a portion of a phrase consisting of:
A difference part determination process for determining a difference part between the original sentence and the searched bilingual example sentence in the first language example sentence;
A synthesizing process for acquiring a phrase of a second language example sentence corresponding to a different portion in the first language example sentence based on the association information and creating a synthesized sentence in which the phrase is replaced with the original phrase;
From each parallel example sentence stored in the parallel example sentence storage unit, a bilingual example sentence including the same phrase as the phrase of the difference part found by the difference part determination process is searched, and based on the correspondence information of the parallel example sentence A translation generation process for creating a translation by replacing the original phrase included in the synthesized sentence with the second language;
An example sentence-driven translation program that causes a computer to execute output processing for outputting at least the synthesized sentence and the translated sentence.
JP2004188259A 2004-06-25 2004-06-25 Translation apparatus and translation program Expired - Fee Related JP4643183B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004188259A JP4643183B2 (en) 2004-06-25 2004-06-25 Translation apparatus and translation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004188259A JP4643183B2 (en) 2004-06-25 2004-06-25 Translation apparatus and translation program

Publications (2)

Publication Number Publication Date
JP2006011842A JP2006011842A (en) 2006-01-12
JP4643183B2 true JP4643183B2 (en) 2011-03-02

Family

ID=35779041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004188259A Expired - Fee Related JP4643183B2 (en) 2004-06-25 2004-06-25 Translation apparatus and translation program

Country Status (1)

Country Link
JP (1) JP4643183B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4779961B2 (en) * 2006-12-20 2011-09-28 沖電気工業株式会社 Document selection apparatus and document selection program
JP5148583B2 (en) * 2009-10-27 2013-02-20 株式会社東芝 Machine translation apparatus, method and program
JP5039114B2 (en) * 2009-11-14 2012-10-03 株式会社東芝 Machine translation apparatus and program
JP2023145114A (en) * 2022-03-28 2023-10-11 株式会社バンダイ Translation system, translation device, and program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2609173B2 (en) * 1990-03-26 1997-05-14 株式会社エイ・ティ・アール自動翻訳電話研究所 Example-driven machine translation method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2609173B2 (en) * 1990-03-26 1997-05-14 株式会社エイ・ティ・アール自動翻訳電話研究所 Example-driven machine translation method

Also Published As

Publication number Publication date
JP2006011842A (en) 2006-01-12

Similar Documents

Publication Publication Date Title
JP3038079B2 (en) Automatic translation device
WO2003065245A1 (en) Translating method, translated sentence outputting method, recording medium, program, and computer device
JPH07282063A (en) Machine translation device
CN102165438A (en) Information processing device and information processing method
JP4643183B2 (en) Translation apparatus and translation program
JP2006030326A (en) Speech synthesizer
JP2015082204A (en) Machine translation device, machine translation program, and machine translation method
JPH11238051A (en) Chinese input conversion processor, chinese input conversion processing method and recording medium stored with chinese input conversion processing program
JP2838984B2 (en) General-purpose reference device
JP4845857B2 (en) Machine translation apparatus and machine translation program
JP2008171164A (en) Classification support apparatus and method, and program
JP5909123B2 (en) Machine translation apparatus, machine translation method and program
WO2009144890A1 (en) Pre-translation rephrasing rule generating system
JP3952009B2 (en) Translation memory system, translation method, and program for translation memory system
JP3069532B2 (en) Kana-kanji conversion method and device, and computer-readable recording medium storing a program for causing a computer to execute the kana-kanji conversion method
JP2009075748A (en) Machine translation device and program
US20130080144A1 (en) Machine translation apparatus, a method and a non-transitory computer readable medium thereof
JP2023169063A (en) KEARM learning conversion of Japanese input system
JP3313810B2 (en) Aspect processing device
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JP2024021555A (en) KEARM priority conversion of Japanese input system
JPH11232003A (en) Document display device, display method and storage medium
JP5032453B2 (en) Machine translation apparatus and machine translation program
JPH0778166A (en) Translating method and machine translation system
JP2013174958A (en) Text reading aloud device and text reading aloud method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101130

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101202

R150 Certificate of patent or registration of utility model

Ref document number: 4643183

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees