JP2006163768A - User dictionary generating system, user dictionary generating device, and user dictionary generating method and program - Google Patents

User dictionary generating system, user dictionary generating device, and user dictionary generating method and program Download PDF

Info

Publication number
JP2006163768A
JP2006163768A JP2004353789A JP2004353789A JP2006163768A JP 2006163768 A JP2006163768 A JP 2006163768A JP 2004353789 A JP2004353789 A JP 2004353789A JP 2004353789 A JP2004353789 A JP 2004353789A JP 2006163768 A JP2006163768 A JP 2006163768A
Authority
JP
Japan
Prior art keywords
registration
word
user
phrase
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004353789A
Other languages
Japanese (ja)
Inventor
Kyoko Kanehara
京子 金原
Makoto Konno
真 近野
Shoji Shibazaki
庄二 柴崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004353789A priority Critical patent/JP2006163768A/en
Publication of JP2006163768A publication Critical patent/JP2006163768A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To allow a user to easily select question words effective for improving a translation result among the question words as a registration candidate to a user dictionary presented by a user dictionary generating device. <P>SOLUTION: A question portion analysis means 102 extracts an inconsistent part between a mechanical translation with respect to the original text and a reference translation, and extracts the words in the original text corresponding to the inconsistent part as the question words, and a question word appearance frequency analysis means 103 calculates the appearance frequency of the respective question words in the original text. A registration effect analysis means 104 calculates a degree of influence on the translation result based on the appearance frequency and a part of speech for each of the question words. A registration effect display specifying means 105 transmits a registration effect display screen for displaying the inconsistent part and the question words and the degree of influence by associating them to a dictionary user terminal. The user selects the question words as the registration candidate among the question words displayed on the registration effect display screen while considering the degree of influence. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、第1言語の文章を第2言語の文章に翻訳する機械翻訳技術に関し、特に、利用者辞書の作成を支援する技術に関する。   The present invention relates to a machine translation technique for translating a sentence in a first language into a sentence in a second language, and more particularly to a technique for supporting creation of a user dictionary.

近年、コンピュータを利用して第1言語の文章を第2言語の文章に翻訳する機械翻訳システムが盛んに利用されるようになってきている。機械翻訳システムにおいては、一般に、単語辞書,複合語辞書,熟語辞書,構文辞書,語彙の関係を記述したパターン辞書などから構成される、システムに元々備わっている機械翻訳辞書を利用して原文の翻訳を行っている。しかし、システムに元々備わっている機械翻訳辞書だけでは、専門分野の文章などを正しく翻訳することができない場合がある。このため、利用者が扱う専門分野などに特有の語句(単語,句などを含む)に関する辞書データを登録した利用者辞書が従来から利用されている。なお、利用者辞書は、翻訳時において、機械翻訳辞書よりも優先的に利用される。   In recent years, machine translation systems for translating sentences in a first language into sentences in a second language using a computer have been actively used. In general, a machine translation system uses a machine translation dictionary built in the system, which is composed of a word dictionary, a compound word dictionary, a idiom dictionary, a syntax dictionary, a pattern dictionary that describes vocabulary relationships, and the like. We are translating. However, there are cases in which texts in specialized fields cannot be correctly translated using only the machine translation dictionary originally provided in the system. For this reason, a user dictionary in which dictionary data relating to words / phrases (including words, phrases, etc.) peculiar to specialized fields handled by the user is registered. The user dictionary is preferentially used over the machine translation dictionary during translation.

ところで、利用者辞書に辞書データを登録する場合、従来は、一般に、利用者が持っている対訳リストに基づいて人手で辞書データを作成し、この作成した辞書データを機械翻訳システムの登録機能を利用して利用者辞書に登録するようにしている。しかし、この作業は、非常に手間がかかるという問題があった。   By the way, when registering dictionary data in a user dictionary, conventionally, dictionary data is generally created manually based on a bilingual list owned by the user, and the created dictionary data is used as a registration function of a machine translation system. It is used to register in the user dictionary. However, this work has a problem that it is very time-consuming.

そこで、このような問題点を解決するため、従来、原文と、この原文に対する正しい翻訳文とを入力して両者の対応部分を抽出し、抽出した対応部分に基づいて辞書データを作成し、作成した辞書データを翻訳辞書に登録するという辞書作成装置が提案された(例えば、特許文献1,2参照)。
特開2002−366546号公報 特開平7−85056号公報
Therefore, in order to solve such problems, conventionally, the original text and the correct translation of the original text are input to extract the corresponding parts of the two, and dictionary data is created based on the extracted corresponding parts. A dictionary creation device for registering the dictionary data in the translation dictionary has been proposed (see, for example, Patent Documents 1 and 2).
JP 2002-366546 A JP-A-7-85056

上述した従来の辞書作成装置によれば、原文とその原文に対する正しい翻訳文とを入力するだけで、翻訳辞書に辞書データを登録することが可能になる。しかし、従来の辞書作成装置を利用して利用者辞書を作成するようにした場合には、次のような問題点が生じる。即ち、従来の辞書作成装置は、入力された原文および翻訳文に基づいて自動的に辞書データを作成しているため、システムが元々備えている機械翻訳辞書に登録されている辞書データと同一の辞書データを利用者辞書に登録してしまう場合があるという問題が生じる。そして、このような辞書データが利用者辞書に登録された場合には、無駄に記憶資源が消費されてしまう。更に、利用者が利用者辞書の作成を利用者辞書作成事業者に依頼しており、辞書作成料金が登録した辞書データ数に応じたものである場合には、不要な辞書データの登録費用も含んだ辞書作成料金を支払わなければならない。   According to the conventional dictionary creation apparatus described above, it is possible to register dictionary data in the translation dictionary simply by inputting the original sentence and the correct translation sentence for the original sentence. However, when a user dictionary is created using a conventional dictionary creation device, the following problems arise. That is, since the conventional dictionary creation device automatically creates dictionary data based on the input original sentence and translated sentence, it is the same as the dictionary data registered in the machine translation dictionary originally provided in the system. There is a problem that the dictionary data may be registered in the user dictionary. When such dictionary data is registered in the user dictionary, storage resources are wasted. Furthermore, if the user has requested the user dictionary creation company to create a user dictionary and the dictionary creation fee is in accordance with the number of registered dictionary data, the registration cost of unnecessary dictionary data is also included. You have to pay for the included dictionary.

このような問題点を解決するためには、例えば、原文と翻訳文とに基づいて作成した辞書データを利用者に提示し、利用者辞書へ登録する辞書データを利用者に選択させるという方法が考えられる。このようにすることにより、利用者にとって不要な辞書データが利用者辞書に登録されてしまうという問題点は解消することができる。しかし、提示された辞書データの中から利用者辞書に登録する辞書データを選択する場合には、提示された辞書データそれぞれについて、その辞書データが機械翻訳辞書に登録されているか否かを調べたり、その辞書データを利用者辞書に登録すると、翻訳結果がどの程度改善されるかなどを検討する必要があり、この作業は利用者にとって大きな負担となる。   In order to solve such problems, for example, there is a method in which dictionary data created based on the original sentence and the translated sentence is presented to the user, and the user selects dictionary data to be registered in the user dictionary. Conceivable. By doing so, the problem that dictionary data unnecessary for the user is registered in the user dictionary can be solved. However, when selecting dictionary data to be registered in the user dictionary from the presented dictionary data, it is checked whether or not the dictionary data is registered in the machine translation dictionary for each presented dictionary data. When the dictionary data is registered in the user dictionary, it is necessary to consider how much the translation result is improved, and this work is a heavy burden on the user.

〔発明の目的〕
そこで、本発明の目的は、機械翻訳辞書を利用して翻訳を行った際に問題となる問題語句や、この問題語句に対応する辞書データを利用者辞書へ登録を行うことにより、翻訳結果がどの程度改善されるかの目安となる情報も利用者に提示することにより、利用者が利用者辞書に登録する辞書データを選択する際の負担を低減させることにある。
(Object of invention)
Therefore, an object of the present invention is to register a problem word / phrase that becomes a problem when translation is performed using a machine translation dictionary and dictionary data corresponding to the problem word / phrase in a user dictionary, thereby obtaining a translation result. By presenting to the user information indicating how much improvement is to be made, the burden on the user when selecting dictionary data to be registered in the user dictionary is reduced.

本発明にかかる第1の利用者辞書作成システムは、
利用者辞書作成装置と、利用者端末とを含む利用者辞書作成システムであって、
前記利用者辞書作成装置が、
機械翻訳辞書を使用して原文を翻訳する機械翻訳手段と、
該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段と、
前記問題個所分析手段が抽出した問題語句の前記原文における出現頻度を求める問題語句出現頻度分析手段と、
該問題語句出現頻度分析手段で求めた前記問題語句の出現頻度に関連する値であって、前記問題語句が翻訳結果に及ぼす影響度を算出する登録効果分析手段と、
前記問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示すると共に、前記登録効果分析手段が算出した影響度を表示する登録効果表示画面を前記利用者端末へ送信する登録効果表示指定手段とを備え、
前記利用者端末が、
前記登録効果表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択手段を備えたことを特徴とする。
The first user dictionary creation system according to the present invention is:
A user dictionary creation system including a user dictionary creation device and a user terminal,
The user dictionary creation device is
Machine translation means for translating the original text using a machine translation dictionary;
Extracting a mismatched portion between a machine translation sentence when the original sentence is translated by the machine translation means and a reference translation sentence for the original sentence, and extracting a word / phrase in the original sentence corresponding to the extracted mismatched part as a question word / phrase Problem location analysis means,
A problem word appearance frequency analyzing means for obtaining an appearance frequency in the original sentence of the problem word extracted by the problem part analyzing means;
A registration effect analyzing means for calculating an influence degree of the problem word / phrase on the translation result, which is a value related to the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analyzing means;
A registration effect display for displaying a mismatch effect part extracted by the problem location analysis means and a question word in association with each other and transmitting a registration effect display screen displaying the degree of influence calculated by the registration effect analysis means to the user terminal A designation means,
The user terminal is
Registration candidate selection means for transmitting registration candidate selection information indicating a problem word / phrase selected by a user among the question words / phrases displayed on the registration effect display screen to the user dictionary creating device is provided. And

本発明にかかる第2の利用者辞書作成システムは、第1の利用者辞書作成システムにおいて、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞とに基づいて影響度を算出する構成を有することを特徴とする。
A second user dictionary creation system according to the present invention is the first user dictionary creation system,
The registration effect analysis means
The degree of influence is calculated based on the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analyzing means and the part of speech of the problem word / phrase.

本発明にかかる第3の利用者辞書作成システムは、第1の利用者辞書作成システムにおいて、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞と、前記問題語句に対応する不一致部分が発生した要因とに基づいて影響度を算出する構成を有することを特徴とする。
A third user dictionary creation system according to the present invention is the first user dictionary creation system,
The registration effect analysis means
The degree of influence is calculated on the basis of the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analysis means, the part of speech of the problem word / phrase, and the factor that caused the mismatched part corresponding to the problem word / phrase. It is characterized by.

本発明にかかる第4の利用者辞書作成システムは、第1〜第3の利用者辞書作成システムにおいて、
前記利用者辞書作成装置が、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段と、
登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備え、
前記利用者端末が、
登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報を前記利用者辞書作成装置へ送信する登録対象選択手段を備えたことを特徴とする。
The 4th user dictionary creation system concerning the present invention is the 1st-3rd user dictionary creation system,
The user dictionary creation device is
For each problem word specified by the registration candidate selection information, a registration candidate cost display screen for calculating a registration cost according to the part of speech of the problem word and displaying the calculated registration cost and the corresponding problem word Registration candidate / cost confirmation means to be transmitted to the user terminal,
A bilingual dictionary list creating means for creating a bilingual dictionary list including a problem word specified by registration target selection information and a word and phrase corresponding to the problem word in the reference translation sentence;
Dictionary registration means for registering the bilingual dictionary list created by the bilingual dictionary list creating means in a user dictionary;
The user terminal is
Registration object selection means for transmitting registration object selection information for specifying a problem word / phrase selected by the user among the problem words / phrases displayed on the registration candidate cost display screen to the user dictionary creation device is provided. Features.

本発明にかかる第5の利用者辞書作成システムは、第4の利用者辞書作成システムにおいて、
前記登録候補・費用確定手段の代わりに、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段を備えたことを特徴とする。
A fifth user dictionary creation system according to the present invention is the fourth user dictionary creation system,
Instead of the registration candidate / cost determination means,
For each problem word specified by the registration candidate selection information, calculate the registration cost according to the part of speech of the problem word and the factor that caused the mismatched part corresponding to the problem word, and the calculated registration cost A registration candidate / cost determination means for transmitting a registration candidate cost display screen for displaying a corresponding problem word / phrase to the user terminal is provided.

本発明にかかる第6の利用者辞書作成システムは、第4,第5の利用者辞書作成システムにおいて、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段を備えたことを特徴とする。
A sixth user dictionary creation system according to the present invention is the fourth and fifth user dictionary creation system,
The apparatus further comprises cost billing means for creating a bill including the problem word / phrase registered in the user dictionary and the registration cost for the problem word / phrase calculated by the registration candidate / cost determination means.

本発明にかかる第7の利用者辞書作成システムは、第1〜第6の利用者辞書作成システムにおいて、
前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする。
The seventh user dictionary creation system according to the present invention is the first to sixth user dictionary creation systems,
The reference translated sentence is a translated sentence instructed by the user with respect to the original sentence.

本発明にかかる第8の利用者辞書作成システムは、第1〜第6の利用者辞書作成システムにおいて、
前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする。
The 8th user dictionary creation system concerning the present invention is the 1st-6th user dictionary creation system,
The reference translation sentence is a translation sentence created using a translation memory.

本発明にかかる第1の利用者辞書作成装置は、
機械翻訳辞書を使用して原文を翻訳する機械翻訳手段と、
該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段と、
前記問題個所分析手段が抽出した問題語句の前記原文における出現頻度を求める問題語句出現頻度分析手段と、
該問題語句出現頻度分析手段で求めた前記問題語句の出現頻度に関連する値であって、前記問題語句が翻訳結果に及ぼす影響度を算出する登録効果分析手段と、
前記問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示すると共に、前記登録効果分析手段が算出した影響度を表示する登録効果表示画面を利用者端末へ送信する登録効果表示指定手段とを備えたことを特徴とする。
The first user dictionary creation device according to the present invention is:
Machine translation means for translating the original text using a machine translation dictionary;
Extracting a mismatched portion between a machine translation sentence when the original sentence is translated by the machine translation means and a reference translation sentence for the original sentence, and extracting a word / phrase in the original sentence corresponding to the extracted mismatched part as a question word / phrase Problem location analysis means,
A problem word appearance frequency analyzing means for obtaining an appearance frequency in the original sentence of the problem word extracted by the problem part analyzing means;
A registration effect analyzing means for calculating an influence degree of the problem word / phrase on the translation result, which is a value related to the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analyzing means;
A registration effect display designation for displaying a mismatch effect part extracted by the problem location analysis means and a question word in association with each other and transmitting a registration effect display screen displaying the degree of influence calculated by the registration effect analysis means to the user terminal Means.

本発明にかかる第2の利用者辞書作成装置は、第1の利用者辞書作成装置において、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞とに基づいて影響度を算出する構成を有することを特徴とする。
A second user dictionary creation device according to the present invention is the first user dictionary creation device,
The registration effect analysis means
The degree of influence is calculated based on the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analyzing means and the part of speech of the problem word / phrase.

本発明にかかる第3の利用者辞書作成装置は、第1の利用者辞書作成装置において、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞と、前記問題語句に対応する不一致部分が発生した要因とに基づいて影響度を算出する構成を有することを特徴とする。
A third user dictionary creation device according to the present invention is the first user dictionary creation device,
The registration effect analysis means
The degree of influence is calculated on the basis of the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analysis means, the part of speech of the problem word / phrase, and the factor that caused the mismatched part corresponding to the problem word / phrase. It is characterized by.

本発明にかかる第4の利用者辞書作成装置は、第1〜第3の利用者辞書作成装置において、
前記利用者端末から前記前記登録効果表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す前記登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段と、
前記利用者端末から前記登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報が送られてきたとき、該登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備えたことを特徴とする。
The 4th user dictionary creation device concerning the present invention is the 1st-3rd user dictionary creation device,
When the registration candidate selection information indicating the problem word / phrase selected by the user among the question words / phrases displayed on the registration effect display screen is sent from the user terminal, the registration candidate selection information For each problem word specified, a registration cost corresponding to the part of speech of the problem word is calculated, and a registration candidate cost display screen for displaying the calculated registration cost and the corresponding problem word is transmitted to the user terminal. Registration candidate / cost determination means,
When registration object selection information for specifying a problem word / phrase selected by the user among the problem words / phrases displayed on the registration candidate cost display screen is sent from the user terminal, the registration object selection information A bilingual dictionary list creating means for creating a bilingual dictionary list including a specified problem word and the word corresponding to the problem word in the reference translation sentence;
And a dictionary registration unit for registering the bilingual dictionary list created by the bilingual dictionary list creating unit in a user dictionary.

本発明にかかる第5の利用者辞書作成装置は、第4の利用者辞書作成装置において、
前記登録候補・費用確定手段の代わりに、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段を備えたことを特徴とする。
A fifth user dictionary creation device according to the present invention is the fourth user dictionary creation device,
Instead of the registration candidate / cost determination means,
For each problem word specified by the registration candidate selection information, calculate the registration cost according to the part of speech of the problem word and the factor that caused the mismatched part corresponding to the problem word, and the calculated registration cost A registration candidate / cost determination means for transmitting a registration candidate cost display screen for displaying a corresponding problem word / phrase to the user terminal is provided.

本発明にかかる第6の利用者辞書作成装置は、第4,第5の利用者辞書作成装置において、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段を備えたことを特徴とする。
A sixth user dictionary creation device according to the present invention is the fourth and fifth user dictionary creation device,
The apparatus further comprises cost billing means for creating a bill including the problem word / phrase registered in the user dictionary and the registration cost for the problem word / phrase calculated by the registration candidate / cost determination means.

本発明にかかる第7の利用者辞書作成装置は、第1〜第6の利用者辞書作成装置において、
前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする。
The seventh user dictionary creation device according to the present invention is the first to sixth user dictionary creation devices,
The reference translated sentence is a translated sentence instructed by the user with respect to the original sentence.

本発明にかかる第8の利用者辞書作成装置は、第1〜第6の利用者辞書作成装置において、
前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする。
An eighth user dictionary creation device according to the present invention is the first to sixth user dictionary creation devices,
The reference translation sentence is a translation sentence created using a translation memory.

本発明にかかる第1の利用者辞書作成方法は、
利用者辞書作成装置が、
機械翻訳辞書を使用して原文を翻訳する機械翻訳ステップと、
該機械翻訳ステップで前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析ステップと、
前記問題個所分析ステップで抽出した問題語句の前記原文における出現頻度を求める問題語句出現頻度分析ステップと、
該問題語句出現頻度分析ステップで求めた前記問題語句の出現頻度に関連する値であって、前記問題語句が翻訳結果に及ぼす影響度を算出する登録効果分析ステップと、
前記問題個所分析ステップで抽出した不一致部分と問題語句とを対応付けて表示すると共に、前記登録効果分析ステップで算出した影響度を表示する登録効果表示画面を前記利用者端末へ送信する登録効果表示指定ステップとを実行し、
前記利用者端末が、
前記登録効果表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択ステップを実行することを特徴とする。
A first user dictionary creation method according to the present invention includes:
User dictionary creation device
A machine translation step for translating the original text using a machine translation dictionary;
Extracting a mismatched portion between the machine translation sentence when the original sentence was translated in the machine translation step and a reference translation sentence for the original sentence, and extracting a phrase in the original sentence corresponding to the extracted mismatched part as a problem phrase Problem location analysis step,
A problem word appearance frequency analysis step for obtaining an appearance frequency in the original sentence of the problem word extracted in the problem part analysis step;
A registration effect analysis step for calculating an influence degree of the problem word / phrase on the translation result, which is a value related to the appearance frequency of the problem word / phrase obtained in the problem word / phrase appearance frequency analysis step;
A registration effect display for displaying a mismatch effect part extracted in the problem location analysis step and a question word in association with each other and transmitting a registration effect display screen displaying the degree of influence calculated in the registration effect analysis step to the user terminal Execute the specified step,
The user terminal is
A registration candidate selection step of transmitting registration candidate selection information indicating a problem word / phrase selected by a user among the question words / phrases displayed on the registration effect display screen to the user dictionary creation device is executed. And

本発明にかかる第2の利用者辞書作成方法は、第1の利用者辞書作成方法において、
前記登録効果分析ステップが、
前記問題語句出現頻度分析ステップで求めた前記問題語句の出現頻度と、前記問題語句の品詞とに基づいて影響度を算出することを特徴とする。
A second user dictionary creation method according to the present invention is the first user dictionary creation method,
The registration effect analysis step comprises:
The degree of influence is calculated based on the appearance frequency of the question word and the part of speech of the question word obtained in the question word appearance frequency analyzing step.

本発明にかかる第3の利用者辞書作成方法は、第1の利用者辞書作成方法において、
前記登録効果分析ステップが、
前記問題語句出現頻度分析ステップで求めた前記問題語句の出現頻度と、前記問題語句の品詞と、前記問題語句に対応する不一致部分が発生した要因とに基づいて影響度を算出することを特徴とする。
A third user dictionary creation method according to the present invention is the first user dictionary creation method,
The registration effect analysis step comprises:
The degree of influence is calculated based on the appearance frequency of the question word / phrase obtained in the question word / phrase appearance frequency analysis step, the part of speech of the question word / phrase, and the factor that caused the mismatched part corresponding to the question word / phrase. To do.

本発明にかかる第4の利用者辞書作成方法は、第1〜第3の利用者辞書作成方法において、
前記利用者辞書作成装置が、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定ステップと、
登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成ステップと、
該対訳辞書リスト作成ステップで作成された対訳辞書リストを利用者辞書に登録する辞書登録ステップとを実行し、
前記利用者端末が、
登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報を前記利用者辞書作成装置へ送信する登録対象選択ステップを実行することを特徴とする。
A fourth user dictionary creation method according to the present invention is the first to third user dictionary creation methods,
The user dictionary creation device is
For each problem word specified by the registration candidate selection information, a registration candidate cost display screen for calculating a registration cost according to the part of speech of the problem word and displaying the calculated registration cost and the corresponding problem word Registration candidate / cost confirmation step to be transmitted to the user terminal,
A bilingual dictionary list creating step of creating a bilingual dictionary list including a problem word specified by registration target selection information and a word and phrase corresponding to the problem word in the reference translation sentence;
A dictionary registration step of registering the bilingual dictionary list created in the bilingual dictionary list creating step in a user dictionary;
The user terminal is
Executing a registration object selection step of transmitting registration object selection information for specifying a problem word selected by the user among the problem words displayed on the registration candidate cost display screen to the user dictionary creation device; Features.

本発明にかかる第5の利用者辞書作成方法は、第4の利用者辞書作成方法において、
前記登録候補・費用確定ステップの代わりに、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定ステップを実行することを特徴とする。
A fifth user dictionary creation method according to the present invention is the fourth user dictionary creation method,
Instead of the registration candidate / cost determination step,
For each problem word specified by the registration candidate selection information, calculate the registration cost according to the part of speech of the problem word and the factor that caused the mismatched part corresponding to the problem word, and the calculated registration cost A registration candidate / cost determination step for transmitting a registration candidate cost display screen for displaying a corresponding problem word to the user terminal is executed.

本発明にかかる第6の利用者辞書作成方法は、第4,第5の利用者辞書作成方法において、
前記利用者辞書作成装置が、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求ステップを実行することを特徴とする。
A sixth user dictionary creation method according to the present invention is the fourth or fifth user dictionary creation method,
The user dictionary creation device is
A cost billing step is performed for creating a bill including a problem word registered in the user dictionary and a registration cost for the problem word calculated by the registration candidate / cost determination unit.

本発明にかかる第7の利用者辞書作成方法は、第1〜第6の利用者辞書作成方法において、
前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする。
The seventh user dictionary creation method according to the present invention is the first to sixth user dictionary creation methods,
The reference translated sentence is a translated sentence instructed by the user with respect to the original sentence.

本発明にかかる第8の利用者辞書作成方法は、第1〜第6の利用者辞書作成方法において、
前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする。
An eighth user dictionary creation method according to the present invention is the first to sixth user dictionary creation methods,
The reference translation sentence is a translation sentence created using a translation memory.

本発明にかかる第1のプログラムは、
コンピュータを、
機械翻訳辞書を使用して原文を翻訳する機械翻訳手段、
該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段、
前記問題個所分析手段が抽出した問題語句の前記原文における出現頻度を求める問題語句出現頻度分析手段、
該問題語句出現頻度分析手段で求めた前記問題語句の出現頻度に関連する値であって、前記問題語句が翻訳結果に及ぼす影響度を算出する登録効果分析手段、
前記問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示すると共に、前記登録効果分析手段が算出した影響度を表示する登録効果表示画面を利用者端末へ送信する登録効果表示指定手段として機能させる。
The first program according to the present invention is:
Computer
Machine translation means for translating the original text using a machine translation dictionary,
Extracting a mismatched portion between a machine translation sentence when the original sentence is translated by the machine translation means and a reference translation sentence for the original sentence, and extracting a word / phrase in the original sentence corresponding to the extracted mismatched part as a question word / phrase Problem location analysis means,
A problem word appearance frequency analysis means for obtaining an appearance frequency in the original sentence of the problem word extracted by the problem part analysis means;
Registration effect analysis means for calculating the degree of influence of the problem word / phrase on the translation result, which is a value related to the appearance frequency of the problem word / phrase determined by the problem word / phrase appearance frequency analysis means;
A registration effect display designation for displaying a mismatch effect part extracted by the problem location analysis means and a question word in association with each other and transmitting a registration effect display screen displaying the degree of influence calculated by the registration effect analysis means to the user terminal It functions as a means.

本発明にかかる第2のプログラムは、第1のプログラムにおいて、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞とに基づいて影響度を算出することを特徴とする。
The second program according to the present invention is the first program,
The registration effect analysis means
The degree of influence is calculated based on the appearance frequency of the problem word and the part of speech of the question word obtained by the problem word appearance frequency analysis means.

本発明にかかる第3のプログラムは、第1のプログラムにおいて、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞と、前記問題語句に対応する不一致部分が発生した要因とに基づいて影響度を算出することを特徴とする。
A third program according to the present invention is the first program,
The registration effect analysis means
The degree of influence is calculated based on the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analysis means, the part of speech of the problem word / phrase, and the factor that caused the mismatched part corresponding to the problem word / phrase. To do.

本発明にかかる第4のプログラムは、第1〜第3のプログラムにおいて、
前記コンピュータを、
前記利用者端末から前記前記登録効果表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す前記登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段、
前記利用者端末から前記登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報が送られてきたとき、該登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段として機能させる。
The fourth program according to the present invention is the first to third programs,
The computer,
When the registration candidate selection information indicating the problem word / phrase selected by the user among the question words / phrases displayed on the registration effect display screen is sent from the user terminal, the registration candidate selection information For each problem word specified, a registration cost corresponding to the part of speech of the problem word is calculated, and a registration candidate cost display screen for displaying the calculated registration cost and the corresponding problem word is transmitted to the user terminal. Registration candidate / cost determination means,
When registration object selection information for specifying a problem word / phrase selected by the user among the problem words / phrases displayed on the registration candidate cost display screen is sent from the user terminal, the registration object selection information A bilingual dictionary list creating means for creating a bilingual dictionary list including the specified problem word and the word corresponding to the problem word in the reference translation sentence;
The bilingual dictionary list created by the bilingual dictionary list creating means functions as a dictionary registering means for registering in the user dictionary.

本発明にかかる第5のプログラムは、第4のプログラムにおいて、
前記登録候補・費用確定手段が、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する構成を有することを特徴とする。
A fifth program according to the present invention is the fourth program,
The registration candidate / cost determination means is
For each problem word specified by the registration candidate selection information, calculate the registration cost according to the part of speech of the problem word and the factor that caused the mismatched part corresponding to the problem word, and the calculated registration cost It has the structure which transmits the registration candidate expense display screen which displays a corresponding problem word to the said user terminal.

本発明にかかる第6のプログラムは、第4,第5のプログラムにおいて、
前記コンピュータを、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段として機能させる。
The sixth program according to the present invention is the fourth and fifth programs,
The computer,
It is made to function as a cost billing means for creating a bill including the problem word / phrase registered in the user dictionary and the registration cost for the problem word / phrase calculated by the registration candidate / cost determination means.

〔作用〕
利用者によって翻訳対象にする原文が指定されると、利用者辞書作成装置内の、機械翻訳手段が、機械翻訳辞書を利用して上記原文に対する機械翻訳文を生成し、問題個所分析手段が、上記機械翻訳文と上記原文に対する参考翻訳文(例えば、利用者によって指定された正確な翻訳文や、翻訳メモリなどを使用して生成したほぼ正確な翻訳文など)との不一致部分を抽出すると共に、抽出した不一致部分に対応する上記原文中の語句を問題語句として抽出する。その後、問題語句出現頻度分析手段が、各問題語句の原文における出現頻度を求め、登録効果分析手段が、各問題語句毎に、その出現頻度に関連する値であって、その問題語句が翻訳結果に影響を及ぼす度合いを示す影響度を算出する。ここで、出現頻度の高い語句は、キーワードとなる語句であるため、出現頻度に関連する値である影響度は、利用者が利用者辞書に登録する語句を選択する際の目安となる。登録効果表示指定手段は、問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示すると共に、登録効果分析手段が算出した各問題語句の影響度を表示する登録効果表示画面を利用者端末へ送信する。
[Action]
When the original text to be translated is specified by the user, the machine translation means in the user dictionary creation device generates a machine translation sentence for the original text using the machine translation dictionary, and the problem location analysis means Extracting inconsistencies between the machine translation and the reference translation for the original (for example, an accurate translation specified by the user or a nearly accurate translation generated using a translation memory, etc.) Then, the phrase in the original text corresponding to the extracted inconsistent part is extracted as the question phrase. Thereafter, the problem word appearance frequency analysis means obtains the appearance frequency of each problem word in the original text, and the registration effect analysis means has a value related to the appearance frequency for each problem word phrase, and the problem word phrase is a translation result. The influence degree which shows the degree which influences is calculated. Here, since a phrase having a high appearance frequency is a phrase that is a keyword, the influence level, which is a value related to the appearance frequency, is a guideline for the user to select a phrase to be registered in the user dictionary. The registered effect display designation means uses a registration effect display screen that displays the inconsistent portion extracted by the problem location analysis means and the problem word in association with each other and displays the degree of influence of each problem word calculated by the registration effect analysis means. To the user terminal.

利用者端末の利用者は、利用者辞書作成装置から登録効果表示画面が送られてくると、画面上に表示されている影響度を参考にして、利用者辞書への登録候補にする問題語句を選択する。これにより、利用者端末内の登録候補選択手段が、登録効果表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を利用者辞書作成装置へ送信する。   When the registration effect display screen is sent from the user dictionary creation device, the user of the user terminal refers to the degree of influence displayed on the screen and refers to the problem words that are candidates for registration in the user dictionary. Select. Thereby, the registration candidate selection means in the user terminal sends the registration candidate selection information indicating the problem word / phrase selected by the user among the problem words / phrases displayed on the registration effect display screen to the user dictionary creation device. Send.

利用者辞書作成装置内の登録候補・費用確定手段は、辞書利用者端末からの登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する。   The registration candidate / cost determination means in the user dictionary creation device calculates a registration cost corresponding to the part of speech of the question word for each question word specified by the registration candidate selection information from the dictionary user terminal. A registration candidate cost display screen for displaying the registered cost and the corresponding problem word is transmitted to the user terminal.

利用者端末の利用者は、利用者辞書作成装置から登録候補費用表示画面が送られてくると、画面上に表示されている登録費用を考慮して、利用者辞書への登録対象にする問題語句を選択する。これにより、利用者辞書内の登録対象選択手段が、利用者によって選択された問題語句を示す登録対象選択情報を利用者辞書作成装置へ送信する。   When the user terminal user receives the registration candidate cost display screen from the user dictionary creation device, the registration cost displayed on the screen is taken into consideration and the problem of making it a target for registration in the user dictionary. Select a phrase. Thereby, the registration object selection means in the user dictionary transmits registration object selection information indicating the problem word / phrase selected by the user to the user dictionary creating apparatus.

利用者辞書作成装置内の対訳辞書リスト作成手段は、登録対象選択情報によって示される問題語句と、参考翻訳文中の上記問題語句と対応する語句とを含む対訳辞書リストを作成し、辞書登録手段が、対訳辞書リストの内容を利用者辞書に登録する。   The bilingual dictionary list creating means in the user dictionary creating device creates a bilingual dictionary list including the problem word / phrase indicated by the registration target selection information and the word / phrase corresponding to the problem word / phrase in the reference translation sentence. The contents of the bilingual dictionary list are registered in the user dictionary.

本発明によれば、利用者辞書作成装置よって提示された利用者辞書への登録候補とする問題語句の中から、翻訳結果を改善するのに有効にな問題語句を利用者が容易に選択することが可能になる。その理由は、原文に対する機械翻訳文と参考翻訳文との不一致部分と、問題語句と、影響度(問題語句の原文中の出現頻度に関連した値であり、翻訳結果へ及ぼす度合いを示す)とを対応付けて表示する登録効果表示画面を利用者端末へ送信するようにしているからである。即ち、利用者は、機械翻訳文と参考翻訳文との不一致部分に基づいて、機械翻訳辞書に登録されている辞書データでは正しい翻訳結果が得られないことを認識し、影響度に基づいて翻訳結果に及ぼす影響を認識することができるので、利用者辞書へ登録すべき問題語句を容易に選択することが可能になる。   According to the present invention, the user can easily select a problem word / phrase effective for improving the translation result from the problem words / phrases to be registered in the user dictionary presented by the user dictionary creation device. It becomes possible. The reason for this is the mismatch between the machine translation and the reference translation for the original text, the problem word, and the degree of influence (value related to the frequency of occurrence of the problem word in the original text, indicating the degree of influence on the translation result). This is because a registration effect display screen for displaying the information in association with each other is transmitted to the user terminal. That is, the user recognizes that correct translation results cannot be obtained with dictionary data registered in the machine translation dictionary based on the mismatched portion between the machine translation sentence and the reference translation sentence, and translates based on the degree of influence. Since the influence on the result can be recognized, it becomes possible to easily select a problem word / phrase to be registered in the user dictionary.

次に本発明の実施の形態について図面を参照して詳細に説明する。   Next, embodiments of the present invention will be described in detail with reference to the drawings.

図1を参照すると、本発明にかかる利用者辞書作成システムの第1の実施の形態は、利用者辞書作成装置1と、利用者辞書作成装置1の運営者に対して利用者辞書の作成を依頼している利用者(辞書利用者)の辞書利用者端末2と、利用者辞書作成装置1の運営者の辞書作成者端末3とから構成されており、それらはインターネット等のネットワーク4を介して相互に接続されている。   Referring to FIG. 1, a first embodiment of a user dictionary creation system according to the present invention creates a user dictionary for a user dictionary creation device 1 and an operator of the user dictionary creation device 1. It consists of the dictionary user terminal 2 of the requesting user (dictionary user) and the dictionary creator terminal 3 of the operator of the user dictionary creation device 1, which are connected via a network 4 such as the Internet. Are connected to each other.

利用者辞書作成装置1は、コンピュータ等によって実現されるものであり、例えば、図2のブロック図に示すような構成を有する。図2を参照すると、利用者辞書作成装置1は、機械翻訳手段101と、問題個所分析手段102と、問題語句出現頻度分析手段103と、登録効果分析手段104と、登録効果表示指定手段105と、問題難易度分析手段106と、登録候補・費用確定手段107と、対訳辞書リスト作成手段108と、辞書登録手段109と、費用請求手段110と、送受信手段111と、機械翻訳辞書112と、原文データベース(DB)114,訳文DB115および対訳DB116が格納された利用者文書格納部113と、問題DB117と、翻訳変化度DB118と、辞書難易度DB119と、単価DB120と、課金情報DB121と、作成対象となる利用者辞書122と、辞書利用者DB123と、キーボード等の入力部124と、LCDなどの表示部125とから構成されている。尚、図2では、利用者文書格納部113を1つしか図示していないが、利用者が複数存在する場合には、各利用者毎に利用者文書格納部113を用意する。また、利用者文書格納部113は、必ずしも利用者辞書作成装置1上に配置する必要はなく、ネットワークを介して利用者辞書作成装置1からアクセス可能な他のコンピュータ上に配置しても良い。   The user dictionary creation device 1 is realized by a computer or the like, and has, for example, a configuration as shown in the block diagram of FIG. Referring to FIG. 2, the user dictionary creation device 1 includes a machine translation unit 101, a problem location analysis unit 102, a problem word appearance frequency analysis unit 103, a registration effect analysis unit 104, and a registration effect display designation unit 105. Problem difficulty level analysis means 106, registration candidate / cost determination means 107, bilingual dictionary list creation means 108, dictionary registration means 109, cost billing means 110, transmission / reception means 111, machine translation dictionary 112, original text User document storage unit 113 in which database (DB) 114, translation DB 115 and parallel translation DB 116 are stored, problem DB 117, translation change degree DB 118, dictionary difficulty DB 119, unit price DB 120, billing information DB 121, and creation target User dictionary 122, dictionary user DB 123, input unit 124 such as a keyboard, LCD, etc. And a display unit 125.. In FIG. 2, only one user document storage unit 113 is shown, but when there are a plurality of users, a user document storage unit 113 is prepared for each user. Further, the user document storage unit 113 is not necessarily arranged on the user dictionary creating apparatus 1 but may be arranged on another computer accessible from the user dictionary creating apparatus 1 via a network.

機械翻訳辞書112には、単語辞書,複合語辞書,熟語辞書,構文辞書,語彙の関係を記述したパターン辞書やルール辞書など、機械翻訳手段101が機械翻訳を行う上で必要になる各種辞書が含まれている。更に、機械翻訳辞書112には、翻訳メモリも含まれている。   The machine translation dictionary 112 includes various dictionaries necessary for the machine translation unit 101 to perform machine translation, such as a word dictionary, a compound word dictionary, a idiom dictionary, a syntax dictionary, and a pattern dictionary and a rule dictionary that describe vocabulary relationships. include. Further, the machine translation dictionary 112 includes a translation memory.

原文DB114には、辞書利用者端末2の利用者によって指定された翻訳対象となる原文が格納される。訳文DB115には、利用者によって指定された翻訳文が格納される。対訳DB116には、利用者によって指定された原文と、その原文に対する正しい翻訳文が格納される。なお、対訳DB116に格納する原文と翻訳文との対は、市販の辞書の対訳例文に基づいて作成したり、ネットワーク上の日本語サイト,英文翻訳サイトから収集した原文,翻訳文に基づいて作成することができる。   The original sentence DB 114 stores the original sentence to be translated designated by the user of the dictionary user terminal 2. The translated sentence DB 115 stores the translated sentence designated by the user. The parallel translation DB 116 stores an original sentence designated by the user and a correct translation sentence for the original sentence. In addition, the pair of the original sentence and the translation sentence stored in the parallel translation DB 116 is created based on the parallel translation example sentence of a commercially available dictionary, or based on the original sentence and the translation sentence collected from the Japanese site and the English translation site on the network. can do.

機械翻訳手段101は、原文DB114や対訳DB116に登録されている原文の内の、辞書利用者端末2から指定された原文を、機械翻訳辞書112を利用して翻訳し、その翻訳結果(機械翻訳文)を問題個所分析手段102に渡す機能を有する。尚、機械翻訳手段101が、英日機械翻訳および日英機械翻訳というような2種類の翻訳機能を有している場合には、原文DB114が訳文DBとなり、訳文DB115が原文DBとなる場合もある。   The machine translation means 101 translates the original text designated by the dictionary user terminal 2 out of the original text registered in the original text DB 114 and the parallel translation DB 116 using the machine translation dictionary 112, and the translation result (machine translation). Sentence) to the problem part analysis means 102. If the machine translation means 101 has two types of translation functions such as English-Japanese machine translation and Japanese-English machine translation, the original sentence DB 114 may be a translated sentence DB and the translated sentence DB 115 may be an original sentence DB. is there.

問題個所分析手段102は、機械翻訳手段101から渡された原文に対する機械翻訳文と上記原文に対する参考翻訳文との不一致部分を抽出すると共に、抽出した不一致部分に対応する原文中の語句(単語,句など)を問題語句として抽出する機能などを有する。例えば、原文が「The power turns off.」、機械翻訳文が「パワーが切れます。」、参考翻訳文が「電源が切れます。」であれば、不一致部分として「パワー」「電源」を抽出し、問題語句として「power」を抽出する。なお、参考翻訳文は、辞書利用者端末2から指定された原文が対訳DB116に登録されているものである場合には、その原文に対応付けて登録されている正しい翻訳文とすることができる。また、辞書利用者端末2から指定された原文が原文DB114に登録されているものである場合には、翻訳メモリやパターン辞書などを使用して生成した翻訳文とすることができる。例えば、翻訳メモリを利用して参考翻訳文を作成する場合には、翻訳メモリに登録されている原文の中から、利用者によって指定された原文と最も一致度の高いものを選択し、選択した原文に対応付けて登録されている翻訳文を参考翻訳文とする。   The problem location analysis means 102 extracts a mismatched portion between the machine translation sentence for the original sentence passed from the machine translation means 101 and the reference translation sentence for the original sentence, and also a phrase (word, word) in the original sentence corresponding to the extracted mismatched portion. Etc.) as a problem word. For example, if the original sentence is “The power turns off.”, The machine translation sentence is “Power is turned off.”, And the reference translation sentence is “Power is turned off.”, “Power” and “Power supply” are extracted as mismatched parts. Then, “power” is extracted as a problem word. When the original sentence designated from the dictionary user terminal 2 is registered in the parallel translation DB 116, the reference translation sentence can be a correct translation sentence registered in association with the original sentence. . Further, when the original text specified from the dictionary user terminal 2 is registered in the original text DB 114, it can be a translation text generated using a translation memory, a pattern dictionary, or the like. For example, when creating a reference translation using a translation memory, select the source text registered in the translation memory that has the highest degree of agreement with the source text specified by the user. A translated sentence registered in association with the original sentence is used as a reference translated sentence.

更に、問題個所分析手段102は、抽出した各問題語句毎に、その問題語句固有のデータ番号,その問題語句が含まれる原文中の文章,機械翻訳文,参考翻訳文,問題個所,品詞を問題DB117に登録する機能を有する。図3に問題DB117の内容例を示す。なお、図3中の項目「出現頻度」,「影響度」は、それぞれ、問題語句出現頻度分析手段103,登録効果分析手段104によって設定される。   Further, the problem location analysis means 102 issues, for each extracted problem word, a data number unique to the problem word, a sentence in the original sentence including the problem word, a machine translation sentence, a reference translation sentence, a problem part, and a part of speech. It has a function of registering in the DB 117. FIG. 3 shows an example of the contents of the problem DB 117. Note that the items “appearance frequency” and “influence” in FIG. 3 are set by the problem word appearance frequency analysis unit 103 and the registered effect analysis unit 104, respectively.

問題語句出現頻度分析手段103は、問題個所分析手段102が抽出した各問題語句について、その問題語句の原文における出現頻度を求める機能や、求めた出現頻度を問題DB117に登録する機能を有する。   The problem word appearance frequency analysis means 103 has a function for obtaining the appearance frequency of the question word phrase in the original sentence for each question word phrase extracted by the problem location analysis means 102 and a function for registering the obtained appearance frequency in the problem DB 117.

翻訳変化度DB118には、品詞に対応付けて翻訳変化度が登録されている。翻訳変化度は、後述する翻訳結果への影響度を算出する際に使用する重み係数であり、図4にその一例を示す。同図の例は、名詞,動詞,助動詞,動詞句,動詞慣用句,…の翻訳変化度がそれぞれ1,3,5,8,10,…となっている。なお、翻訳変化度は、辞書作成者が経験的に決定するものである。   In the translation change degree DB 118, translation change degrees are registered in association with parts of speech. The translation change degree is a weighting coefficient used when calculating the influence degree on the translation result described later, and an example thereof is shown in FIG. In the example of the figure, the translational change degrees of nouns, verbs, auxiliary verbs, verb phrases, verb idioms,... Are 1, 3, 5, 8, 10,. The translation change is determined empirically by the dictionary creator.

登録効果分析手段104は、問題個所分析手段102で抽出された各問題語句毎に、問題語句出現頻度分析手段103で求めた問題語句の出現頻度と、問題語句の品詞と、翻訳変化度DB118の内容(翻訳変化度)とに基づいて、問題語句が翻訳結果に及ぼす影響度を算出する機能や、算出した影響度を問題DB117に登録する機能を有する。なお、本実施の形態では、次式(1)に基づいて影響度を算出するものとする。   The registered effect analysis unit 104, for each problem word extracted by the problem location analysis unit 102, the appearance frequency of the problem word obtained by the problem word appearance frequency analysis unit 103, the part of speech of the problem word, and the translation change degree DB 118 Based on the content (translation change degree), it has a function of calculating the degree of influence of the question word on the translation result and a function of registering the calculated degree of influence in the problem DB 117. In the present embodiment, the influence degree is calculated based on the following equation (1).

影響度=(問題語句の出現頻度)×(問題語句の品詞に応じた翻訳変化度) …(1)
なお、問題語句の品詞に応じた翻訳変化度は、翻訳変化度DB118を参照することにより得られるものである。今、例えば、或る問題語句「power」の出現頻度が「125」であり、翻訳変化度DB118の内容が図4に示すものであるとすると、問題語句「power」に対する影響度は、影響度=125×(名詞の翻訳変化度)=125×1=125となる。また、問題語句「could」の出現頻度が「22」であれば、問題語句「could」に対する影響度は、影響度=22×(助動詞の翻訳変化度)=22×5=110となる。
Influence = (Frequency of problem phrase) × (Translation change according to part of speech of problem phrase) (1)
Note that the translation change degree corresponding to the part of speech of the problem phrase is obtained by referring to the translation change degree DB 118. Now, for example, if the appearance frequency of a certain problem phrase “power” is “125” and the contents of the translation change degree DB 118 are as shown in FIG. = 125 × (noun translation change) = 125 × 1 = 125. Also, if the appearance frequency of the question word “could” is “22”, the degree of influence on the question word “could” is influence = 22 × (translation change degree of auxiliary verb) = 22 × 5 = 110.

登録効果表示指定手段105は、問題個所分析手段102が抽出した不一致部分と問題語句と、登録効果分析手段104が算出した影響度とを対応付けて配置した登録効果表示画面であって、利用者辞書122への登録候補とする問題語句を、辞書利用者端末2の利用者が選択できるようにした登録効果表示画面を作成し、辞書利用者端末2へ送信する機能を有する。更に、登録効果表示指定手段105は、辞書利用者端末2の利用者が登録効果表示画面を用いて選択した問題語句に従って問題DB117を更新する機能を有する。   The registered effect display designating means 105 is a registered effect display screen in which the inconsistent part and the question word extracted by the problem location analyzing means 102 and the influence degree calculated by the registered effect analyzing means 104 are arranged in association with each other. It has a function of creating a registration effect display screen that allows the user of the dictionary user terminal 2 to select a problem word / phrase to be registered in the dictionary 122 and transmitting it to the dictionary user terminal 2. Furthermore, the registration effect display designating unit 105 has a function of updating the problem DB 117 according to the problem word / phrase selected by the user of the dictionary user terminal 2 using the registration effect display screen.

図5に登録効果表示画面50の一例を示す。同図を参照すると、登録効果表示画面50は、データ番号部51と、原文部52と、機械翻訳文部53と、参考翻訳文部54と、問題個所部55と、問題語句部56と、品詞部57と、影響度部58と、選択部59とから構成されている。   FIG. 5 shows an example of the registration effect display screen 50. Referring to the figure, the registration effect display screen 50 includes a data number part 51, an original sentence part 52, a machine translation sentence part 53, a reference translation sentence part 54, a problem part 55, a problem word phrase part 56, and a part of speech part. 57, an influence degree unit 58, and a selection unit 59.

データ番号部51には、問題語句固有のデータ番号が設定される。原文部52には、原文が設定され、機械翻訳文部53,参考翻訳文部54には、それぞれ原文に対する機械翻訳文,参考翻訳文が設定される。また、原文部52に設定されている原文中の問題語句は括弧で囲まれ、機械翻訳文部53,参考翻訳文部54に設定されている機械翻訳文,参考翻訳文中の不一致部分も括弧で囲まれ、それらは視覚的に他の部分と区別できるようになっている。問題個所部55には、問題語句が、原文の何語目であるかを示す情報が設定される。問題語句部56には、問題語句が設定される。品詞部57には、問題語句の品詞(名詞,動詞,助動詞,動詞句,動詞慣用句など)が設定される。影響度部58には、登録効果分析手段104が算出した影響度が設定される。選択部59は、利用者が利用者辞書122への登録候補にする問題語句を選択する際に使用する選択欄となる。尚、図5の例では、問題語句および不一致部分を括弧で囲むことにより、それらを視覚的に他の部分と区別できるようにしたが、視覚的に区別できるのであれば、表示色を他の部分と異なるものにする等の他の方法を採用しても良い。   In the data number portion 51, a data number unique to the question word is set. An original sentence is set in the original sentence part 52, and a machine translation sentence and a reference translation sentence for the original sentence are set in the machine translation sentence part 53 and the reference translation sentence part 54, respectively. In addition, problem words and phrases in the original text set in the original text part 52 are enclosed in parentheses, and unmatched parts in the machine translation text and reference translation text set in the machine translation text part 53 and the reference translation text part 54 are also enclosed in parentheses. , They are visually distinguishable from other parts. In the problem part 55, information indicating the word number of the original sentence is set. In the question word / phrase part 56, a question word / phrase is set. In the part of speech part 57, the part of speech (noun, verb, auxiliary verb, verb phrase, verb idiom, etc.) is set. The influence degree 58 is set with the influence degree calculated by the registered effect analysis means 104. The selection unit 59 is a selection column used when the user selects a question word / phrase to be a candidate for registration in the user dictionary 122. In the example of FIG. 5, the problem word and the inconsistent part are enclosed in parentheses so that they can be visually distinguished from other parts. Other methods such as making the part different from the part may be adopted.

辞書難易度DB119には、品詞に対応付けて、その品詞の問題語句を利用者辞書122に登録する際の難易度が登録されている。図6に辞書難易度DB119の一例を示す。同図の例では、名詞,動詞,助動詞,動詞句,動詞慣用句,…の難易度がそれぞれ1,3,5,8,10,…となっている。なお、各品詞の難易度は、例えば、辞書作成者が経験的に得た値とすることができる。   In the dictionary difficulty DB 119, the difficulty level when registering the problem word / phrase of the part of speech in the user dictionary 122 is registered in association with the part of speech. FIG. 6 shows an example of the dictionary difficulty DB 119. In the example of the figure, the difficulty levels of nouns, verbs, auxiliary verbs, verb phrases, verb idioms,... Are 1, 3, 5, 8, 10,. Note that the difficulty level of each part of speech can be, for example, a value empirically obtained by the dictionary creator.

問題難易度分析手段106は、問題DB117に登録されている各問題語句の難易度を辞書難易度DB119から取得し、登録候補・費用確定手段107に渡す機能を有する。   The problem difficulty level analysis unit 106 has a function of acquiring the difficulty level of each question word / phrase registered in the problem DB 117 from the dictionary difficulty level DB 119 and passing it to the registration candidate / cost determination unit 107.

単価DB120には、難易度の1ポイントに対する単価が登録される。図7に単価DB120の内容例を示す。同図の例は、難易度の1ポイントに対する単価が「100円」となっている。   A unit price for one point of difficulty is registered in the unit price DB 120. FIG. 7 shows an example of the contents of the unit price DB 120. In the example of the figure, the unit price for one point of difficulty is “100 yen”.

登録候補・費用確定手段107は、問題難易度分析手段106から渡された各問題語句の難易度と、単価DB120に登録されている単価とに基づいて、各問題語句を利用者辞書122に登録する際に必要になる登録費用を算出する機能を有する。更に、登録候補・費用確定手段107は、問題語句とその語句の登録費用とを対応付けて配置した登録候補費用表示画面であって、利用者辞書122への登録対象にする問題語句を利用者が選択できるようにした登録候補費用表示画面を作成し、それを辞書利用者端末2へ送信する機能を有する。更に、登録候補・費用確定手段107は、辞書利用者端末2の利用者が登録候補費用表示画面を用いて選択した問題語句のリスト(登録対象リスト)を作成する機能や、利用者が選択した問題語句を利用者辞書122に登録する際の登録費用(合計金額)を再計算する機能を有する。   The registration candidate / cost determination unit 107 registers each problem word in the user dictionary 122 based on the difficulty level of each problem word passed from the problem difficulty analysis unit 106 and the unit price registered in the unit price DB 120. It has a function to calculate the registration fee required for Further, the registration candidate / cost determination unit 107 is a registration candidate cost display screen in which the problem word and the registration cost of the word are associated with each other, and the problem word / phrase to be registered in the user dictionary 122 is displayed as a user. A registration candidate cost display screen that can be selected and transmitted to the dictionary user terminal 2. Further, the registration candidate / cost determination unit 107 has a function for creating a list of problem words / phrases (registration target list) selected by the user of the dictionary user terminal 2 using the registration candidate cost display screen, or a user's selection. It has a function of recalculating the registration cost (total amount) when registering the question word / phrase in the user dictionary 122.

図8は登録候補費用表示画面80の一例を示した図であり、データ番号部81と、問題語句部82と、出現頻度部83と、品詞部84と、難易度部85と、語句登録費用部86と、選択部87とを含んでいる。データ番号部81には、各問題語句のデータ番号(このデータ番号によって登録候補費用表示画面80上の各問題語句と、登録効果表示画面50上の各問題語句や問題DB117に登録されている各問題語句とが対応付けられる)が設定される。問題語句部82には、登録効果表示画面50を用いて利用者が選択した、利用者辞書122への登録候補にする問題語句が設定される。出現頻度部83には、問題語句出現頻度分析手段103が求めた出現頻度が設定される。品詞部84には、問題語句の品詞が設定される。難易度部85には、問題語句を利用者辞書122に登録する際の難易度が設定される。語句登録費用部86には、問題語句を利用者辞書122に登録する際に必要になる各問題語句毎の登録費用と、合計金額とが設定される。選択部87は、利用者が利用者辞書122へ登録する問題語句(登録対象問題語句)を選択する際に使用する選択欄となる。   FIG. 8 is a diagram showing an example of the registration candidate cost display screen 80. The data number part 81, the problem word / phrase part 82, the appearance frequency part 83, the part of speech part 84, the difficulty part 85, and the phrase registration cost are shown. A part 86 and a selection part 87 are included. In the data number portion 81, the data number of each question word (each question word / phrase on the registration candidate cost display screen 80, each question word / phrase on the registration effect display screen 50, and each question DB 117 registered by this data number). Is associated with the question word). In the question word / phrase part 82, a question word / phrase to be registered as a candidate for registration in the user dictionary 122 selected by the user using the registration effect display screen 50 is set. In the appearance frequency section 83, the appearance frequency obtained by the problem word / phrase appearance frequency analysis means 103 is set. In the part of speech part 84, the part of speech of the question phrase is set. The difficulty level portion 85 is set with a difficulty level when registering a question word / phrase in the user dictionary 122. In the word / phrase registration cost section 86, a registration fee and a total amount for each question word / phrase required when registering the question / phrase in the user dictionary 122 are set. The selection unit 87 is a selection field used when the user selects a problem word (registration target question word) to be registered in the user dictionary 122.

対訳辞書リスト作成手段108は、利用者によって選択された登録対象問題語句と、利用者辞書122への登録内容とを含んだ対訳辞書リストを、辞書作成者端末3を利用して作成する機能や、作成した対訳辞書リストを辞書利用者端末2へ送信し、利用者に利用者辞書122への登録内容を事前に確認させる機能を有する。   The bilingual dictionary list creating means 108 uses the dictionary creator terminal 3 to create a bilingual dictionary list including the registration target question words selected by the user and the contents registered in the user dictionary 122. The bilingual dictionary list thus created is transmitted to the dictionary user terminal 2 so that the user can confirm the contents registered in the user dictionary 122 in advance.

図9は対訳辞書リスト作成手段108が作成する対訳辞書リスト90の一例を示す図である。同図の例では、問題語句(remove等)に対応付けて、参考翻訳文中の不一致部分に存在する語句(取り外す等の訳語)と、取り得る構文やパターン(SVO等)とが設定されているが、他の情報(例えば、品詞や文法情報など)が設定されていても良い。尚、図9では図示を省略しているが、各問題語句に対応付けてデータ番号も設定されている。   FIG. 9 is a diagram showing an example of the bilingual dictionary list 90 created by the bilingual dictionary list creating means 108. In the example in the figure, the phrase (translation word such as removal) existing in the mismatched part in the reference translation sentence and the possible syntax and pattern (SVO etc.) are set in association with the problem word (remove etc.). However, other information (for example, part of speech or grammatical information) may be set. Although not shown in FIG. 9, a data number is also set in association with each question word.

辞書登録手段109は、対訳辞書リスト90の内容を利用者辞書122に登録する機能を有する。   The dictionary registration unit 109 has a function of registering the contents of the bilingual dictionary list 90 in the user dictionary 122.

辞書利用者DB123には、辞書利用者端末2の利用者の利用者情報(例えば、氏名,住所,会社名,メールアドレス,口座番号等)が登録されている。   In the dictionary user DB 123, user information (for example, name, address, company name, mail address, account number, etc.) of the user of the dictionary user terminal 2 is registered.

費用請求手段110は、課金情報DB120の内容と利用者辞書122への登録内容とに基づいて、請求金額を算出する機能や、辞書利用者DB123に登録されているメールアドレスに、上記請求金額を含む請求書を送信する機能などを有する。図10に利用者に送信する請求書の一例を示す。   The cost billing unit 110 calculates the billing amount based on the contents of the billing information DB 120 and the contents registered in the user dictionary 122 and the billing amount to the mail address registered in the dictionary user DB 123. It has a function of transmitting a bill including it. FIG. 10 shows an example of an invoice sent to the user.

送受信手段111は、ネットワーク4を介してデータを送受信する機能を有する。   The transmission / reception means 111 has a function of transmitting / receiving data via the network 4.

なお、利用者辞書作成装置1をコンピュータによって実現する場合には、例えば、コンピュータを利用者辞書作成装置1として機能させるためのプログラムを記録したディスク,半導体メモリ,その他の記録媒体を用意し、上記プログラムをコンピュータに読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、機械翻訳手段101、問題個所分析手段102、問題語句出現頻度分析手段103、登録効果分析手段104、登録効果表示指定手段105、問題難易度分析手段106、登録候補・費用確定手段107、対訳辞書リスト作成手段108、辞書登録手段109、費用請求手段110、送受信手段111を実現する。   When the user dictionary creation device 1 is realized by a computer, for example, a disk, a semiconductor memory, or other recording medium that records a program for causing the computer to function as the user dictionary creation device 1 is prepared. Have the computer read the program. The computer controls its own operation according to the read program, so that the machine translation means 101, the problem part analysis means 102, the problem word appearance frequency analysis means 103, the registration effect analysis means 104, and the registration effect display designation are performed on the computer. Means 105, problem difficulty level analysis means 106, registration candidate / cost determination means 107, bilingual dictionary list creation means 108, dictionary registration means 109, cost billing means 110, and transmission / reception means 111 are realized.

図11は辞書利用者端末2の構成例を示すブロック図であり、送受信手段21と、登録候補選択手段22と、登録対象選択手段23と、登録内容確認手段24と、キーボード等の入力部25と、LCD等の表示部26とを備えている。   FIG. 11 is a block diagram showing a configuration example of the dictionary user terminal 2. The transmission / reception unit 21, the registration candidate selection unit 22, the registration target selection unit 23, the registration content confirmation unit 24, and an input unit 25 such as a keyboard. And a display unit 26 such as an LCD.

送受信手段21は、ネットワーク4を介してデータを送受信する機能を有する。   The transmission / reception means 21 has a function of transmitting / receiving data via the network 4.

登録候補選択手段22は、利用者辞書作成装置1から送られてきた登録効果表示画面50を表示部26に表示する機能や、登録効果表示画面50に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録候補選択情報を利用者辞書作成装置1へ送信する機能を有する。   The registration candidate selection means 22 is a function for displaying the registration effect display screen 50 sent from the user dictionary creation device 1 on the display unit 26, or the use of the problem words displayed on the registration effect display screen 50. The registration candidate selection information for specifying the problem word / phrase selected by the user is transmitted to the user dictionary creating apparatus 1.

登録対象選択手段23は、利用者辞書作成装置1から送られてきた登録候補費用表示画面80を表示部26に表示する機能や、登録候補費用表示画面80に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報を利用者辞書作成装置1へ送信する機能を有する。   The registration target selection unit 23 has a function of displaying the registration candidate cost display screen 80 sent from the user dictionary creation device 1 on the display unit 26, or a problem word / phrase displayed on the registration candidate cost display screen 80. The registration target selection information for specifying the problem word / phrase selected by the user is transmitted to the user dictionary creating apparatus 1.

登録内容確認手段24は、利用者辞書作成装置1から送られてきた対訳辞書リストを表示部26に表示する機能を有する。更に、利用者が入力部25から入力した削除指示に従って、利用者によって削除指示された問題語句に関する情報を対訳辞書リストから削除する機能や、利用者が入力部25から入力する送信指示に従って編集済みの対訳辞書リスト(利用者が削除指示を入力しなかった場合は、対訳辞書リスト作成手段108から送られてきた対訳辞書リストとなる)を利用者辞書作成装置1へ送信する機能を有する。   The registered content confirmation unit 24 has a function of displaying the bilingual dictionary list sent from the user dictionary creation device 1 on the display unit 26. Further, in accordance with the deletion instruction input by the user from the input unit 25, the information regarding the problem word / phrase instructed to be deleted by the user is deleted from the bilingual dictionary list, or edited according to the transmission instruction input by the user from the input unit 25. The bilingual dictionary list (if the user does not input a deletion instruction, the bilingual dictionary list sent from the bilingual dictionary list creating means 108) is transmitted to the user dictionary creating apparatus 1.

辞書利用者端末2は、コンピュータにより実現可能なものであり、コンピュータによって実現する場合には、例えば、次のようにする。コンピュータを辞書利用者端末2として機能させるためのプログラムを記録したディスク,半導体メモリ,その他の記録媒体を用意し、上記プログラムをコンピュータに読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、送受信手段21、登録候補選択手段22、登録対象選択手段23、登録内容確認手段24を実現する。   The dictionary user terminal 2 can be realized by a computer. When the dictionary user terminal 2 is realized by a computer, for example, the following operation is performed. A disk, a semiconductor memory, and other recording media recording a program for causing the computer to function as the dictionary user terminal 2 are prepared, and the program is read by the computer. The computer controls the operation of the computer according to the read program, thereby realizing the transmission / reception unit 21, the registration candidate selection unit 22, the registration target selection unit 23, and the registered content confirmation unit 24 on the computer.

図12は、辞書作成者端末3の構成例を示すブロック図であり、送受信手段31と、対訳辞書リスト作成支援手段32と、キーボード等の入力部33と、LCD等の表示部34とを備えている。   FIG. 12 is a block diagram showing a configuration example of the dictionary creator terminal 3, which includes a transmission / reception unit 31, a bilingual dictionary list creation support unit 32, an input unit 33 such as a keyboard, and a display unit 34 such as an LCD. ing.

送受信手段31は、ネットワーク4を介してデータを送受信する機能を有する。   The transmission / reception means 31 has a function of transmitting / receiving data via the network 4.

対訳辞書リスト作成支援手段32は、利用者辞書作成装置1内の対訳辞書リスト作成手段108から送られてきた情報(問題DB117に格納されている情報など)を表示部34に表示する機能や、辞書作成者が入力部33を用いて作成した対訳辞書リストを対訳辞書リスト作成手段108へ送信する機能を有する。   The bilingual dictionary list creation support means 32 has a function to display information (such as information stored in the problem DB 117) sent from the bilingual dictionary list creation means 108 in the user dictionary creation device 1 on the display unit 34, The dictionary creator has a function of transmitting the bilingual dictionary list created by using the input unit 33 to the bilingual dictionary list creating means 108.

辞書作成者端末3は、コンピュータによって実現可能なものであり、コンピュータによって実現する場合には、例えば、次のようにする。コンピュータを辞書作成者端末3として機能させるためのプログラムを記録したディスク,半導体メモリ,その他の記録媒体を用意し、上記プログラムをコンピュータに読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に送受信手段31、対訳辞書リスト作成支援手段32を実現する。   The dictionary creator terminal 3 can be realized by a computer. When the dictionary creator terminal 3 is realized by a computer, for example, the following operation is performed. A disk, a semiconductor memory, and other recording media recording a program for causing the computer to function as the dictionary creator terminal 3 are prepared, and the computer reads the program. The computer controls the operation of the computer according to the read program, thereby realizing the transmission / reception unit 31 and the bilingual dictionary list creation support unit 32 on the computer.

〔第1の実施の形態の動作〕
次に、本実施の形態の動作について詳細に説明する。
[Operation of First Embodiment]
Next, the operation of the present embodiment will be described in detail.

機械翻訳手段101は、辞書利用者端末2の利用者或いは辞書作成者端末3の作成者によって翻訳対象にする原文が指定されると、原文DB114或いは対訳DB116から指定された原文(テキスト文書)を取得し(図13のステップS1301)、機械翻訳辞書112を参照しながら機械翻訳文を生成する(ステップS1302)。なお、本実施の形態では、利用者文書格納部113に格納されている原文の中から翻訳対象にする原文を選択するようにしたが、辞書利用者端末2や辞書作成者端末3から翻訳対象にする原文を機械翻訳手段101へ送信するようにしても良い。   When the original text to be translated is designated by the user of the dictionary user terminal 2 or the creator of the dictionary creator terminal 3, the machine translation means 101 reads the original text (text document) designated from the original text DB 114 or the parallel translation DB 116. Acquired (step S1301 in FIG. 13) and generates a machine translation sentence with reference to the machine translation dictionary 112 (step S1302). In the present embodiment, the original text to be translated is selected from the original text stored in the user document storage unit 113. However, the translation target is selected from the dictionary user terminal 2 or the dictionary creator terminal 3. The original text to be transmitted may be transmitted to the machine translation means 101.

機械翻訳手段101が、原文に対する機械翻訳文を生成すると、問題個所分析手段102が、原文に対する参考翻訳文を取得する(ステップS1303)。例えば、原文が対訳DB116に格納されているものである場合には、原文と対応付けて登録されている翻訳文を参考翻訳文とする。また、原文が原文DB114に登録されているものである場合には、翻訳メモリやパターン辞書などを使用して翻訳文を作成し、それを参考翻訳文とする。   When the machine translation means 101 generates a machine translation sentence for the original sentence, the problem part analysis means 102 acquires a reference translation sentence for the original sentence (step S1303). For example, when the original sentence is stored in the parallel translation DB 116, the translation sentence registered in association with the original sentence is set as the reference translation sentence. If the original sentence is registered in the original sentence DB 114, a translation sentence is created using a translation memory, a pattern dictionary, etc., and is used as a reference translation sentence.

その後、問題個所分析手段102は、機械翻訳手段101が生成した機械翻訳文と、ステップS1303で取得した参考翻訳文との対応する部分(例えば、対応する文章など)を比較することにより不一致部分を抽出する(ステップS1304)。次いで、問題個所分析手段102は、不一致部分に対応する原文中の語句を問題語句として抽出すると共に、問題語句が原文中の何語目に存在するのかを示す問題個所および問題語句の品詞を求める(ステップS1305)。その後、原文,機械翻訳文,参考翻訳文,問題個所,問題語句,品詞を対応付けて問題DB117に登録する(ステップS1306)。   After that, the problem part analysis unit 102 compares the corresponding part (for example, the corresponding sentence) between the machine translation sentence generated by the machine translation part 101 and the reference translation sentence acquired in step S1303, thereby identifying the inconsistent part. Extract (step S1304). Next, the problem part analysis means 102 extracts a word / phrase in the original text corresponding to the mismatched part as a problem word / phrase, and obtains a question part / part of speech of the question word / phrase indicating the word in the original text. (Step S1305). Thereafter, the original text, machine translation text, reference translation text, problem location, problem word / phrase, and part of speech are associated and registered in the problem DB 117 (step S1306).

上述したステップS1304〜S1306の処理を詳しく説明すると、次のようになる。今、例えば、原文中の或る文章「The power turns off.」に対する機械翻訳文が「パワーが切れます。」、参考翻訳文が「電源が切れます。」であったとすると、ステップS1304では、不一致部分として「パワー」,「電源」を抽出する。 The process in steps S1304 to S1306 described above will be described in detail as follows. Now, for example, if the machine translation for a sentence “The power turns off.” In the original text is “Power is turned off” and the reference translation is “Power is turned off.” In step S1304, “Power” and “Power supply” are extracted as inconsistent portions.

次のステップS1305では、問題語句「power」,問題個所「2語目」,品詞「名詞」を抽出する。ここで、問題語句「power」の抽出方法としては、例えば、機械翻訳文中の不一致部分「パワー」に対応する語句を機械翻訳辞書112から抽出し、更に、抽出した語句の中から原文中に存在する語句を選択するという方法を採用することができる。また、機械翻訳文を生成する際、機械翻訳時に使用した辞書内容を機械翻訳文と対応付けて内部データとして保存しておき、この内部データから不一致部分「パワー」に対応する語句を抽出し、更に、抽出した語句の中から原文中に存在する語句を選択するという方法を採用することもできる。   In the next step S1305, the question word “power”, the question part “second word”, and the part of speech “noun” are extracted. Here, as a method of extracting the problem word “power”, for example, a word / phrase corresponding to the mismatched part “power” in the machine translation sentence is extracted from the machine translation dictionary 112, and is further present in the original sentence from the extracted word / phrase. A method of selecting a phrase to be performed can be employed. In addition, when generating a machine translation sentence, the dictionary content used at the time of machine translation is stored as internal data in association with the machine translation sentence, and a phrase corresponding to the mismatched portion “power” is extracted from this internal data, Furthermore, a method of selecting a word / phrase existing in the original sentence from the extracted words / phrases can be adopted.

次の、ステップS1306では、原文「The power turns off.」、機械翻訳文「パワーが切れます。」、参考翻訳文「電源が切れます。」、問題個所「2語目」、問題語句「power」、品詞「名詞」を対応付けて問題DB117に登録する(図3参照)。なお、問題語句,不一致部分を明確にするために、問題語句「power」,不一致部分「パワー」,「電源」は括弧で囲むようにする。以上が、ステップS1304〜S1306で行う処理の詳細である。   In the next step S1306, the original sentence “The power turns off.”, The machine translation sentence “The power turns off.”, The reference translation sentence “The power turns off.”, The problem part “second word”, and the problem phrase “power” ”And the part of speech“ noun ”are registered in the problem DB 117 in association with each other (see FIG. 3). In order to clarify the problem word and the mismatched part, the question word “power”, the mismatched part “power”, and “power” are enclosed in parentheses. The above is the details of the processing performed in steps S1304 to S1306.

問題個所分析手段102が、問題DB117に、図3に示すように、各問題語句に関する情報を登録すると、問題語句出現頻度分析手段103は、利用者文書格納部113に登録されている翻訳対象にしている原文を参照することにより、問題DB117に登録されている各問題語句の上記原文における出現頻度を求め、求めた出現頻度を問題DB117に登録する(ステップS1307)。   When the problem location analysis unit 102 registers information on each problem word in the problem DB 117 as shown in FIG. 3, the problem word appearance frequency analysis unit 103 selects the translation target registered in the user document storage unit 113. By referring to the original text, the appearance frequency of each question word registered in the problem DB 117 in the original text is obtained, and the obtained appearance frequency is registered in the problem DB 117 (step S1307).

このステップS1307で行う処理の一例を詳しく説明すると、次のようになる。問題語句出現頻度分析手段103は、問題DB117中の1つのエントリに注目し、そのエントリに出現頻度が登録されているか否かを調べる。今、例えば、図3に示した問題DB117中の第1エントリに注目したとする。現時点では、第1エントリに出現頻度が登録されていないので、利用者文書格納部113を参照することにより、第1エントリに登録されている問題語句「power」の出現頻度を求める。そして、例えば、出現頻度が「125」であれば、その値を第1エントリに設定する。その後、第1エントリに登録されている問題語句「power」と同一の問題語句が登録されているエントリが存在するか否かを調べ、もし存在する場合は、そのエントリにも出現頻度「125」を登録する。これにより、第1エントリに対する処理が終了したので、第2エントリに注目し、出現頻度が登録されているか否かを調べる。問題語句「remove」が登録されている第2エントリには、現時点では出現頻度が登録されていないので、上記した第1エントリと同様の処理が行われる。しかし、もし、第2エントリに問題語句「power」が登録されていたとすると、第1エントリの処理時に、既に出現頻度が登録されているので、出現頻度の算出処理は行わずに、直ちに次のエントリ(第3エントリ)に注目する。以上の処理を、出現頻度が未登録のエントリがなくなるまで、繰り返し行う。以上が、ステップS1307で行う処理の一例である。尚、この例では、問題語句の文字面のみに基づいて出現頻度を求めるようにしたが、問題語句の品詞も考慮し、文字面と品詞との組み合わせ毎に出現頻度を求めるようにしても良い。   An example of the process performed in step S1307 will be described in detail as follows. The problem word / phrase appearance frequency analyzing unit 103 pays attention to one entry in the problem DB 117 and checks whether or not the appearance frequency is registered in the entry. For example, assume that attention is paid to the first entry in the problem DB 117 shown in FIG. At present, since the appearance frequency is not registered in the first entry, the appearance frequency of the problem word “power” registered in the first entry is obtained by referring to the user document storage unit 113. For example, if the appearance frequency is “125”, the value is set in the first entry. Thereafter, it is checked whether or not there is an entry in which the same problem word “power” registered in the first entry is registered. If there is an entry, the appearance frequency “125” is also present in the entry. Register. Thereby, since the processing for the first entry is completed, the second entry is noticed and it is checked whether or not the appearance frequency is registered. Since the appearance frequency is not registered at the present time in the second entry in which the question word “remove” is registered, the same processing as in the first entry described above is performed. However, if the problem word “power” is registered in the second entry, the appearance frequency is already registered at the time of processing the first entry. Focus on the entry (third entry). The above processing is repeated until there are no entries whose appearance frequency is not registered. The above is an example of the process performed in step S1307. In this example, the appearance frequency is obtained based only on the character face of the question word, but the appearance frequency may be obtained for each combination of the character face and the part of speech in consideration of the part of speech of the question word phrase. .

問題語句出現頻度分析手段103が、問題DB117に登録されている各問題語句の出現頻度を抽出すると、登録効果分析手段104は、翻訳変化度DB118に登録されている翻訳変化度と問題語句出現頻度分析手段103が求めた出現頻度とに基づいて、問題DB117に登録されている各問題語句について、翻訳結果への影響度を算出し、算出した影響度を問題DB117に登録する(ステップS1308〜S1310)。   When the problem phrase appearance frequency analysis unit 103 extracts the appearance frequency of each problem word registered in the problem DB 117, the registration effect analysis unit 104 calculates the translation change degree and the problem phrase appearance frequency registered in the translation change degree DB 118. Based on the appearance frequency obtained by the analysis unit 103, the degree of influence on the translation result is calculated for each question word registered in the problem DB 117, and the calculated degree of influence is registered in the problem DB 117 (steps S1308 to S1310). ).

このステップS1308〜S1310で行う処理の一例を詳しく説明すると、次のようになる。登録効果分析手段104は、問題DB117中の1つのエントリに注目し、そのエントリに影響度が登録されているか否かを調べる。登録されている場合は、次のエントリに注目する。   An example of the processing performed in steps S1308 to S1310 will be described in detail as follows. The registered effect analysis unit 104 pays attention to one entry in the problem DB 117 and checks whether or not the influence degree is registered in the entry. If registered, pay attention to the next entry.

これに対して、注目エントリに影響度が登録されている場合は、先ず、注目エントリに登録されている品詞に対応する翻訳変化度を翻訳変化度DB118から取得し、更に、取得した翻訳変化度と注目エントリ中の出現頻度とを乗算することにより、影響度を算出する(ステップS1309)。例えば、注目エントリに登録されている品詞が動詞慣用句であり、その出現頻度が「25」であるとすると、影響度=(動詞慣用句に対応する翻訳変化度)×(出現頻度)=10×25=250となる。なお、注目エントリに複数の品詞が格納されている場合には、本実施の形態では、注目エントリ中の各品詞に対応する翻訳変化度の内の最も大きなものを使用するが、各品詞の翻訳変化度を加算した値を使用するようにしても良い。その後、算出した影響度を注目エントリに登録する。その際、注目エントリと同一の問題語句,品詞が登録されている他のエントリが存在する場合には、そのエントリにも算出した影響度を登録する。以上の処理を影響度が未登録のエントリがなくなるまで繰り返し行う。以上が、ステップS1308〜S1310で行う処理の詳細である。   On the other hand, when the influence degree is registered in the attention entry, first, the translation change degree corresponding to the part of speech registered in the attention entry is obtained from the translation change degree DB 118, and further, the obtained translation change degree is obtained. Is multiplied by the appearance frequency in the entry of interest to calculate the influence degree (step S1309). For example, if the part of speech registered in the entry of interest is a verb idiom and its appearance frequency is “25”, the influence = (translation change corresponding to the verb idiom) × (occurrence frequency) = 10 X25 = 250. When a plurality of parts of speech are stored in the target entry, the present embodiment uses the largest translation change degree corresponding to each part of speech in the target entry. A value obtained by adding the degree of change may be used. Thereafter, the calculated influence degree is registered in the attention entry. At this time, if there is another entry in which the same question word / part of speech as the target entry is registered, the calculated influence degree is also registered in the entry. The above processing is repeated until there are no more unregistered entries. The above is the details of the processing performed in steps S1308 to S1310.

その後、登録効果表示指定手段105が、問題DB117の内容に基づいて、図5に示すような登録効果表示画面50を作成し、辞書利用者端末2へ送信する(ステップS1311)。なお、図5に示した登録効果表示画面50は、あくまで一例であり、利用者が問題語句,原文,参考翻訳文,機械翻訳文,影響度を確認でき、且つ、登録候補にする問題語句を選択することができるものであれば良い。例えば、図5に示した画面に加え、各問題語句の影響度を示す、図15に示すような棒グラフや、図16に示すような円グラフを表示するようにしても良い。   Thereafter, the registration effect display designating unit 105 creates a registration effect display screen 50 as shown in FIG. 5 based on the contents of the problem DB 117 and transmits it to the dictionary user terminal 2 (step S1311). The registration effect display screen 50 shown in FIG. 5 is merely an example, and the user can confirm the problem word / phrase, the original sentence, the reference translation sentence, the machine translation sentence, the influence degree, and the problem words / phrases to be registered as candidates. Anything can be selected. For example, in addition to the screen shown in FIG. 5, a bar graph as shown in FIG. 15 or a pie chart as shown in FIG. 16 showing the degree of influence of each question word may be displayed.

辞書利用者端末2内の登録候補選択手段22は、利用者辞書作成装置1から送られてきた登録効果表示画面50を表示部26に表示する。利用者は、登録効果表示画面50に表示されている各問題語句の影響度を考慮し、利用者辞書120への登録候補とする問題語句を選択する(選択部59をチェックする)。登録候補選択手段22は、選択された問題語句を示す登録候補選択情報(例えば、選択された問題語句のデータ番号を含む)を利用者辞書作成装置1へ送信する(ステップS1312)。   The registration candidate selection means 22 in the dictionary user terminal 2 displays the registration effect display screen 50 sent from the user dictionary creation device 1 on the display unit 26. The user selects a problem word / phrase as a candidate for registration in the user dictionary 120 in consideration of the degree of influence of each problem word / phrase displayed on the registration effect display screen 50 (checks the selection unit 59). The registration candidate selection means 22 transmits registration candidate selection information (for example, including the data number of the selected problem word / phrase) indicating the selected problem word / phrase to the user dictionary creation device 1 (step S1312).

利用者辞書作成装置1内の登録効果表示指定手段105は、辞書利用者端末2から登録候補選択情報が送られてくると、問題DB117に登録されている各問題語句に関連する情報の内、利用者によって選択されたなかった問題語句に関する情報を削除する(ステップS1313)。この処理により、問題DB117内には、利用者によって選択された問題語句に関する情報のみが残る。   When the registration candidate selection information is sent from the dictionary user terminal 2, the registration effect display designating means 105 in the user dictionary creation device 1 includes information related to each question word / phrase registered in the question DB 117. Information on the question phrase that was not selected by the user is deleted (step S1313). As a result of this processing, only the information related to the problem word / phrase selected by the user remains in the problem DB 117.

その後、問題難易度分析手段106が、辞書難易度DB119を参照し、問題DB117に登録されている各問題語句の難易度(品詞に応じた難易度)を取得する(図14のステップS1401,S1402)。その後、登録候補・費用確定手段107が、問題難易度分析手段106によって取得された各問題語句の難易度と、単価DB120に登録されている単価とに基づいて、各問題語句毎に、利用者辞書122への登録費用を算出する(ステップS1403)。例えば、辞書難易度DB119,単価DB120の内容が、それぞれ図6,図7に示すものであるとすると、問題語句「wear」の登録費用は、登録費用=難易度×単価=3×100=300円となる。その後、登録候補・費用確定手段107は、図8に示すような登録候補費用表示画面80を作成し、辞書利用者端末2へ送信する(ステップS1404)。   Thereafter, the problem difficulty level analysis means 106 refers to the dictionary difficulty level DB 119 and acquires the difficulty level (difficulty level according to the part of speech) of each question word registered in the problem DB 117 (steps S1401 and S1402 in FIG. 14). ). Thereafter, the registration candidate / cost determination unit 107 uses the difficulty of each problem word acquired by the problem difficulty analysis unit 106 and the unit price registered in the unit price DB 120 for each problem word / phrase. The registration fee for the dictionary 122 is calculated (step S1403). For example, if the contents of the dictionary difficulty level DB 119 and the unit price DB 120 are as shown in FIGS. 6 and 7, respectively, the registration cost of the problem phrase “wear” is registration cost = difficulty × unit price = 3 × 100 = 300. Yen. Thereafter, the registration candidate / cost determination means 107 creates a registration candidate cost display screen 80 as shown in FIG. 8 and transmits it to the dictionary user terminal 2 (step S1404).

辞書利用者端末2内の登録対象選択手段23は、利用者辞書作成装置1から送られてきた登録候補費用表示画面80を表示部26に表示する。利用者は、登録候補費用表示画面80に表示されている問題語句の中から、登録費用を考慮して、利用者辞書122への登録対象にする問題語句を選択する(選択部87をチェックする)。これにより、登録対象選択手段23は、選択された問題語句を示す登録対象選択情報(例えば、選択された問題語句のデータ番号を含む)を利用者辞書作成装置1へ送信する(ステップS1405)。   The registration object selection means 23 in the dictionary user terminal 2 displays the registration candidate cost display screen 80 sent from the user dictionary creation device 1 on the display unit 26. The user selects a problem word to be registered in the user dictionary 122 from the problem words displayed on the registration candidate cost display screen 80 in consideration of the registration cost (checks the selection unit 87). ). As a result, the registration target selection unit 23 transmits registration target selection information (for example, including the data number of the selected problem word / phrase) indicating the selected problem word / phrase to the user dictionary creation device 1 (step S1405).

登録候補・費用確定手段107は、辞書利用者端末2から登録対象選択情報が送られてくると、利用者によって選択された問題語句のデータ番号と、その語句の登録費用とを対応付けて課金情報DB121に登録する(ステップS1406)。その後、登録候補・費用確定手段107は、利用者が登録対象にした問題語句のデータ番号のリスト(登録対象リスト)を作成し、対訳辞書リスト作成手段108に渡す(ステップS1407)。   When registration target selection information is sent from the dictionary user terminal 2, the registration candidate / cost determination unit 107 charges the data number of the problem word / phrase selected by the user in association with the registration cost of the word / phrase. The information is registered in the information DB 121 (step S1406). Thereafter, the registration candidate / cost determination unit 107 creates a list (data list) of the data numbers of the problem words / phrases that are registered by the user and passes them to the bilingual dictionary list creation unit 108 (step S1407).

対訳辞書リスト作成手段108は、登録候補・費用確定手段107から登録対象リストが渡されると、問題DB117に登録されている各情報の中から、登録対象リストに含まれているデータ番号と対応付けて登録されている情報を取得し、取得した情報を辞書作成者端末3へ送信する。辞書作成者端末3内の対訳辞書リスト作成支援手段32は、利用者辞書作成装置1から送られてきた情報を表示部34に表示する。辞書作成者は、この情報を見て、各問題語句毎に、辞書登録内容を設定した図9に示すような対訳辞書リスト90を作成し、対訳辞書リスト作成手段108に返す。対訳辞書リスト作成手段108は辞書作成者端末3から送られてきた対訳辞書リストを辞書利用者端末2へ送信する(ステップS1408)。尚、本実施の形態では、対訳辞書リスト作成手段108が、登録対象リスト中のデータ番号によって特定される問題DB117中の情報のみを辞書作成者端末3へ送信するようにしたが、それ以外に、機械翻訳辞書112や対訳DB116から対訳辞書リストの作成の手助けになる情報を抽出し、この抽出した情報も辞書作成者端末3へ送信するようにしても良い。   When the registration target list is delivered from the registration candidate / cost determination unit 107, the bilingual dictionary list creation unit 108 associates the data numbers included in the registration target list with each data number registered in the problem DB 117. The registered information is acquired, and the acquired information is transmitted to the dictionary creator terminal 3. The bilingual dictionary list creation support means 32 in the dictionary creator terminal 3 displays the information sent from the user dictionary creation device 1 on the display unit 34. The dictionary creator looks at this information and creates a bilingual dictionary list 90 as shown in FIG. 9 in which dictionary registration contents are set for each question word and returns it to the bilingual dictionary list creating means 108. The bilingual dictionary list creating means 108 sends the bilingual dictionary list sent from the dictionary creator terminal 3 to the dictionary user terminal 2 (step S1408). In the present embodiment, the bilingual dictionary list creation means 108 transmits only the information in the problem DB 117 specified by the data number in the registration target list to the dictionary creator terminal 3. Alternatively, information that helps to create a bilingual dictionary list may be extracted from the machine translation dictionary 112 or the bilingual DB 116, and the extracted information may also be transmitted to the dictionary creator terminal 3.

辞書利用者端末2内の登録内容確認手段24は、利用者辞書作成装置1から送られてきた対訳辞書リストを表示部26に表示する。利用者は、表示された対訳辞書リストを見て、対訳辞書リスト中の全ての問題語句に関する情報を、利用者辞書122に登録することが必要であると判断した場合は、入力部25から送信指示を入力する。これに対して、対訳辞書リスト中に、利用者辞書122への登録は不要な問題語句に関する情報が含まれていると判断した場合は、入力部25から削除指示を入力して該当する問題語句に関する情報を対訳辞書リストから削除した後、入力部25から送信指示を入力する。登録内容確認手段24は、送信指示が入力されると、現在表示されている対訳辞書リストの内容を対訳辞書リスト作成手段108へ送信する(ステップS1409)。   The registered content confirmation unit 24 in the dictionary user terminal 2 displays the bilingual dictionary list sent from the user dictionary creation device 1 on the display unit 26. When the user looks at the displayed bilingual dictionary list and determines that it is necessary to register information about all problem words in the bilingual dictionary list in the user dictionary 122, the user transmits from the input unit 25. Enter instructions. On the other hand, if it is determined that the bilingual dictionary list includes information on a problem word / phrase that is not required to be registered in the user dictionary 122, a deletion instruction is input from the input unit 25 to obtain the corresponding problem word / phrase. After deleting the information on the bilingual dictionary list, a transmission instruction is input from the input unit 25. When the transmission instruction is input, the registered content confirmation unit 24 transmits the content of the currently displayed bilingual dictionary list to the bilingual dictionary list creating unit 108 (step S1409).

対訳辞書リスト作成手段108は、辞書利用者端末2から対訳辞書リストが送られてくると、それを辞書登録手段109に渡す。これにより、辞書登録手段109は、利用者辞書122に対訳辞書リストの内容を登録する(ステップS1410)。その後、費用請求手段110が、ステップS1410において利用者辞書122へ登録された問題語句のデータ番号と、ステップS1406において課金情報DB121に登録された各問題語句(データ番号に対応付けて登録されている)の登録費用と、辞書利用者DB123の内容とに基づいて、図10に示すような請求書を作成し、それを電子メールにより利用者へ送信する(ステップS1411〜S1413)。即ち、利用者辞書122へ登録された各問題語句のデータ番号と、課金情報DB121にデータ番号と対応付けて登録されている各問題語句の登録費用とに基づいて、実際に利用者辞書122へ登録を行った各問題語句の登録費用及びその合計金額を求め、図10に示すような請求書を作成する。   When the bilingual dictionary list is sent from the dictionary user terminal 2, the bilingual dictionary list creating means 108 passes it to the dictionary registering means 109. Thereby, the dictionary registration means 109 registers the contents of the bilingual dictionary list in the user dictionary 122 (step S1410). After that, the cost billing means 110 is registered in association with the data number of the problem word registered in the user dictionary 122 in step S1410 and each problem word (data number registered in the charging information DB 121 in step S1406). ) And the contents of the dictionary user DB 123, a bill as shown in FIG. 10 is created and sent to the user by e-mail (steps S1411 to S1413). That is, based on the data number of each problem word registered in the user dictionary 122 and the registration cost of each problem word registered in the charging information DB 121 in association with the data number, the user dictionary 122 is actually registered. The registration fee and the total amount of each registered problem word are obtained, and an invoice as shown in FIG. 10 is created.

なお、上述した実施の形態では、辞書作成時に、利用者辞書122を利用者辞書作成装置1上に配置するようにしたが、ネットワーク4上の他のコンピュータ上に配置しても良い。また、利用者辞書122の作成作業が完了した後、利用者辞書作成装置1上でそのまま利用しても良いし、或いは利用者専用に機械翻訳手段101と同様の機械翻訳手段を導入したコンピュータ上に移動して利用しても良い。また、上述した本実施の形態では、辞書利用者に請求書を送信するようにしたが、辞書利用者が指定した銀行口座などから登録費用を引き落とすようにしても良い。更に、上述した実施の形態では、問題語句の出現頻度と品詞とに基づいて影響度を算出するようにしたが、出現頻度そのものを影響度としても良い。また、上述した実施の形態では説明しなかったが、登録効果表示画面50に、各問題語句毎の誤訳率(機械翻訳文と参考翻訳文とが不一致であった割合。例えば、問題語句「power」の出現頻度が100で、その内、機械翻訳文と参考翻訳文とが不一致であった部分が80なら誤訳率80%)を表示するようにしても良い。   In the above-described embodiment, the user dictionary 122 is arranged on the user dictionary creating apparatus 1 when creating a dictionary, but may be arranged on another computer on the network 4. Further, after the creation of the user dictionary 122 is completed, the user dictionary 122 may be used as it is on the user dictionary creation device 1 or on a computer in which machine translation means similar to the machine translation means 101 is introduced exclusively for the user. You may move to and use it. In the above-described embodiment, the bill is transmitted to the dictionary user. However, the registration fee may be deducted from a bank account designated by the dictionary user. Furthermore, in the above-described embodiment, the influence degree is calculated based on the appearance frequency and the part of speech of the problem word / phrase, but the appearance frequency itself may be used as the influence degree. Although not explained in the above-described embodiment, the mistranslation rate for each problem word / phrase on the registration effect display screen 50 (the ratio of mismatch between the machine translation sentence and the reference translation sentence. For example, the problem phrase “power ”Is 100, and the portion in which the machine translation and the reference translation do not match is 80, the mistranslation rate may be 80%).

〔第1の実施の形態の効果〕
本実施の形態によれば、利用者辞書作成装置1から提示された問題語句の中から、利用者辞書122に辞書データを登録すべき問題語句を、利用者が容易に選択することが可能になる。その理由は、原文に対する機械翻訳文と参考翻訳文との不一致部分と、問題語句と、影響度(問題語句の原文中の出現頻度および品詞に関連した値であり、翻訳結果へ及ぼす度合いを示す)とを対応付けて表示する登録効果表示画面50を辞書利用者端末2へ送信するようにしているからである。
[Effect of the first embodiment]
According to the present embodiment, it is possible for the user to easily select a problem word / phrase for which dictionary data should be registered in the user dictionary 122 from the problem words / phrases presented by the user dictionary creation device 1. Become. The reason for this is the mismatch between the machine translation and the reference translation for the original text, the problem word, and the influence (value related to the frequency of appearance and part of speech of the problem word in the original text, indicating the degree to which the translation results This is because the registration effect display screen 50 that displays in association with each other is transmitted to the dictionary user terminal 2.

また、本実施の形態によれば、利用者辞書の作成に要する費用を利用者に明確且つ利用者が納得する形で提示することが可能になる。その理由は、各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、この算出した登録費用と問題語句とを対応付けて表示する登録候補費用表示画面80を辞書利用者端末2へ送信する登録候補・費用確定手段107を備えているからである。   Further, according to the present embodiment, it is possible to present to the user the cost required for creating the user dictionary in a form that is clear and convinced by the user. The reason is that, for each problem word / phrase, a registration cost corresponding to the part of speech of the problem word / phrase is calculated, and a registration candidate cost display screen 80 for displaying the calculated registration cost and the problem word / phrase in association with each other is displayed on the dictionary user terminal. This is because a registration candidate / cost determination unit 107 to be transmitted to 2 is provided.

〔第2の実施の形態の構成〕
次に、本発明にかかる利用者辞書作成システムの第2の実施の形態について説明する。本実施の形態は、問題語句の品詞および出現頻度に加えて、問題語句に対応する不一致部分が発生した要因(問題種別)も考慮して翻訳結果への影響度を算出することを特徴とする。
[Configuration of Second Embodiment]
Next, a second embodiment of the user dictionary creation system according to the present invention will be described. The present embodiment is characterized in that, in addition to the part of speech and the appearance frequency of the problem word, the influence on the translation result is calculated in consideration of the factor (problem type) that caused the mismatched part corresponding to the problem word. .

本実施の形態にかかる利用者辞書作成システムは、図1において、利用者辞書作成装置1の代わりに図17に示す利用者辞書作成装置1aを使用することにより実現される。   The user dictionary creation system according to the present embodiment is realized by using the user dictionary creation device 1a shown in FIG. 17 instead of the user dictionary creation device 1 in FIG.

図17に示す本実施の形態で使用する利用者辞書作成装置1aと、図2に示した第1の実施の形態で使用する利用者辞書作成装置1との相違点は、問題個所分析手段102の代わりに問題個所分析手段102aを備えている点、登録効果分析手段104の代わりに登録効果分析手段104aを備えている点、問題難易度分析手段106の代わりに問題難易度分析手段106aを備えている点、登録候補・費用確定手段107の代わりに登録候補・費用確定手段107aを備えている点、機械翻訳辞書112の代わりに機械翻訳辞書112aを備えている点、問題DB117の代わりに問題種別DB117aを備えている点、翻訳変化度DB118の代わりに翻訳変化度DB118aを備えている点、辞書難易度DB119の代わりに辞書難易度DB119aを備えている点、および翻訳知識DB126が追加されている点である。   The difference between the user dictionary creation device 1a used in the present embodiment shown in FIG. 17 and the user dictionary creation device 1 used in the first embodiment shown in FIG. A problem location analysis means 102a instead of the registration effect analysis means 104, a registration effect analysis means 104a instead of the registration effect analysis means 104, and a problem difficulty analysis means 106a instead of the problem difficulty analysis means 106. In addition to the registration candidate / cost determination means 107, the registration candidate / cost determination means 107a is provided, the machine translation dictionary 112a is provided instead of the machine translation dictionary 112, and the problem DB 117 is replaced with a problem. The point that the type DB 117a is provided, the point that the translation change degree DB 118a is provided instead of the translation change degree DB 118, and the dictionary difficulty that is provided instead of the dictionary difficulty degree DB 119 That it includes a DB119a, and translation knowledge DB126 is a point that has been added.

機械翻訳辞書112aは、単語辞書に加えて複合語辞書,構文辞書,語彙の関係を記述したパターン辞書やルール辞書を含む。翻訳知識DB126は、翻訳メモリなどを含む。   The machine translation dictionary 112a includes a compound dictionary, a syntax dictionary, a pattern dictionary describing a vocabulary relationship, and a rule dictionary in addition to a word dictionary. The translation knowledge DB 126 includes a translation memory and the like.

問題個所分析手段102aは、問題個所分析手段102が備えている機能に加え、機械翻訳文と参考翻訳文とに不一致部分が生じた要因(問題種別)を抽出する機能を有している。   The problem location analysis unit 102a has a function of extracting a factor (problem type) that causes a mismatch between the machine translation text and the reference translation text, in addition to the function of the problem location analysis means 102.

翻訳変化度DB118aには、問題語句の品詞に応じた翻訳変化度と、問題種別に応じた翻訳変化度とが登録されている。図18は翻訳変化度DB118aの一例を示す図である。同図を参照すると、翻訳変化度DB118aは、品詞部1181と、問題種別部1182とから構成されている。品詞部1181には、品詞に対応付けて翻訳変化度(品詞翻訳変化度)が登録され、問題種別部1182には、問題種別に対応付けて翻訳変化度(問題種別翻訳変化度)が登録されている。   In the translation change degree DB 118a, a translation change degree corresponding to the part of speech of the problem phrase and a translation change degree corresponding to the problem type are registered. FIG. 18 is a diagram illustrating an example of the translation change DB 118a. Referring to the figure, the translation change degree DB 118a includes a part-of-speech part 1181 and a problem type part 1182. The part of speech part 1181 registers a translation change degree (part of speech translation change degree) in association with the part of speech, and the problem type part 1182 registers a translation change degree (problem type translation change degree) in association with the problem type. ing.

登録効果分析手段104aは、問題語句出現頻度抽出手段103が抽出した各問題語句の出現頻度と、翻訳変化度DB118aに登録されている品詞翻訳変化度,問題種別翻訳変化度とに基づいて、各問題語句の翻訳結果への影響度を算出する機能を有する。   The registration effect analysis unit 104a uses each of the problem phrases extracted by the problem phrase appearance frequency extraction unit 103, the part-of-speech translation change degree, and the problem type translation change degree registered in the translation change degree DB 118a. It has a function of calculating the degree of influence on the translation result of the question word.

辞書難易度DB119aには、問題語句の品詞に応じた難易度と、問題種別に応じた難易度とが登録されている。図19に辞書難易度DB119aの一例を示す。同図に示すように、辞書難易度DB119aは、品詞部1191と、問題種別部1192とから構成されている。品詞部1191には、品詞に対応付けて難易度(品詞難易度)が登録され、問題種別部1192には、問題種別に対応付けて難易度(種別難易度)が登録されている。   In the dictionary difficulty level DB 119a, a difficulty level corresponding to the part of speech of the problem phrase and a difficulty level corresponding to the problem type are registered. FIG. 19 shows an example of the dictionary difficulty DB 119a. As shown in the figure, the dictionary difficulty level DB 119a is composed of a part-of-speech part 1191 and a problem type part 1192. The part-of-speech part 1191 registers the difficulty level (part-of-speech difficulty) in association with the part-of-speech, and the problem type part 1192 registers the difficulty (class difficulty) in association with the problem type.

問題難易度分析手段106aは、辞書難易度DB119aから各問題語句に対する品詞難易度,種別難易度を取得し、登録候補・費用確定手段107aに渡す機能を有する。   The problem difficulty level analysis unit 106a has a function of acquiring the part-of-speech difficulty level and the type difficulty level for each question word phrase from the dictionary difficulty level DB 119a and passing them to the registration candidate / cost determination unit 107a.

登録候補・費用確定手段107aは、各問題語句についての登録費用を、品詞難易度および種別難易度に基づいて算出する機能を有する。   The registration candidate / cost determination means 107a has a function of calculating a registration cost for each question word based on the part-of-speech difficulty level and the type difficulty level.

なお、利用者辞書作成装置1aはコンピュータによって実現可能なものであり、コンピュータによって実現する場合には、例えば、次のようにする。コンピュータを利用者辞書作成装置1aとして機能させるためのプログラムを記録したディスク,半導体メモリ,その他の記録媒体を用意し、上記プログラムをコンピュータに読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、機械翻訳手段101、問題個所分析手段102a、問題語句出現頻度分析手段103、登録効果分析手段104a、登録効果表示指定手段105、問題難易度分析手段106a、登録候補・費用確定手段107a、対訳辞書リスト作成手段108、辞書登録手段109、費用請求手段110、送受信手段111を実現する。   Note that the user dictionary creation device 1a can be realized by a computer, and when realized by a computer, for example, is as follows. A disk, a semiconductor memory, and other recording media on which a program for causing the computer to function as the user dictionary creation device 1a is recorded are prepared, and the program is read by the computer. The computer controls its own operation according to the read program, so that the machine translation unit 101, the problem location analysis unit 102a, the problem word appearance frequency analysis unit 103, the registration effect analysis unit 104a, the registration effect display designation on the computer. Means 105, problem difficulty level analysis means 106a, registration candidate / cost determination means 107a, bilingual dictionary list creation means 108, dictionary registration means 109, cost billing means 110, and transmission / reception means 111 are realized.

〔第2の実施の形態の動作〕
次に、本実施の形態の動作について説明する。機械翻訳手段101は、辞書利用者端末2の利用者或いは辞書作成者端末3の作成者によって翻訳対象にする原文が指定されると、原文DB114或いは対訳DB116から指定された原文(テキスト文書)を取得し(図20のステップS1301)、機械翻訳辞書112aを参照しながら機械翻訳文を生成する(ステップS1302)。
[Operation of Second Embodiment]
Next, the operation of the present embodiment will be described. When the original text to be translated is designated by the user of the dictionary user terminal 2 or the creator of the dictionary creator terminal 3, the machine translation means 101 reads the original text (text document) designated from the original text DB 114 or the parallel translation DB 116. Acquired (step S1301 in FIG. 20) and generates a machine translation sentence with reference to the machine translation dictionary 112a (step S1302).

機械翻訳手段101が、原文に対する機械翻訳文を生成すると、問題個所分析手段102aが、原文に対する参考翻訳文を取得する(ステップS1303)。その後、問題個所分析手段102aは、機械翻訳手段101が生成した機械翻訳文と、ステップS1303で取得した参考翻訳文との対応する部分とを比較することにより、不一致部分を抽出し(ステップS1304)、更に、不一致部分に対応する問題語句,問題個所,品詞および問題種別を求める(ステップS1305a)。このステップS1305aと図13のステップS1305との相違点は、問題種別を求めているか否かである。その後、問題個所分析手段102aは、原文,機械翻訳文,参考翻訳文,問題個所,問題語句,品詞および問題種別を対応付けて問題種別DB117aに登録する(ステップS1306a)。図22に問題種別DB117aの内容例を示す。なお、問題種別DB117a中の項目「出現頻度」,「影響度」は、それぞれ問題語句出現頻度分析手段103,登録効果分析手段104aによって設定される。   When the machine translation means 101 generates a machine translation sentence for the original sentence, the problem part analysis means 102a acquires a reference translation sentence for the original sentence (step S1303). Thereafter, the problem part analysis unit 102a extracts a mismatched portion by comparing the machine translation sentence generated by the machine translation unit 101 with the corresponding part of the reference translation sentence acquired in step S1303 (step S1304). Further, a problem word / phrase, a problem location, a part of speech and a problem type corresponding to the inconsistent portion are obtained (step S1305a). The difference between step S1305a and step S1305 in FIG. 13 is whether or not a question type is obtained. Thereafter, the problem part analysis means 102a associates and registers the original sentence, machine translation sentence, reference translation sentence, problem part, problem word / phrase, part of speech, and problem type in the problem type DB 117a (step S1306a). FIG. 22 shows an example of the contents of the problem type DB 117a. The items “appearance frequency” and “influence” in the problem type DB 117a are set by the problem word / phrase appearance frequency analysis unit 103 and the registered effect analysis unit 104a, respectively.

ここで、ステップS1305aにおいて、どのようにして問題種別を求めているのか、その一例について説明する。問題語句が名詞の場合は、問題種別を「訳語誤り」とする。問題語句が動詞の場合は、対応する訳語が異なっていれば「訳語誤り」とし、構文辞書、パターン辞書、ルール辞書,翻訳メモリから取得するSVOなどの文法情報と訳出された助詞「てにをは」の対応が間違っていれば「構文誤り」、各助詞が取り得る名詞に条件があれば「動詞パターン認定誤り」とする。問題語句が動詞慣用句の場合には、「慣用句認定誤り」とする。以上はあくまで一例であり、他の方法により、問題種別を決定しても良い。   Here, an example of how the problem type is obtained in step S1305a will be described. If the question word is a noun, the question type is “translation error”. If the question word is a verb, if the corresponding translation is different, it will be judged as “translation error”, and grammatical information such as SVO obtained from the syntax dictionary, pattern dictionary, rule dictionary, translation memory, and translated particle “ If the correspondence of “ha” is wrong, it is “syntax error”, and if the noun that each particle can take has a condition, it is “verb pattern recognition error”. If the question word is a verb idiom, it is assumed that the idiom is recognized incorrectly. The above is merely an example, and the problem type may be determined by other methods.

問題個所分析手段102aが、問題種別DB117aに、図22に示すように、各問題語句に関する情報(項目「出現頻度」,「影響度」はこの時点では登録されない)を登録すると、問題語句出現頻度分析手段103は、各問題語句の原文における出現頻度を求め、求めた出現頻度を問題種別DB117aに登録する(ステップS1307)。   When the problem location analysis unit 102a registers information on each question word / phrase (items “appearance frequency” and “influence” are not registered at this time) as shown in FIG. 22 in the problem type DB 117a, the problem word / phrase appearance frequency The analysis unit 103 obtains the appearance frequency of each question word in the original text, and registers the obtained appearance frequency in the problem type DB 117a (step S1307).

問題語句出現頻度分析手段103が、問題種別DB117aに登録されている各問題語句の出現頻度を求めると、登録効果分析手段104aは、翻訳変化度DB118aに登録されている品詞翻訳変化度,問題種別翻訳変化度と、問題語句出現頻度分析手段103が求めた出現頻度とに基づいて、問題種別DB117aに登録されている各問題語句について、翻訳結果への影響度を算出し、算出した影響度を問題種別DB117aに登録する(ステップS1308a〜S1310a)。   When the problem phrase appearance frequency analysis means 103 obtains the appearance frequency of each problem word phrase registered in the problem type DB 117a, the registration effect analysis means 104a displays the part-of-speech translation change degree and problem type registered in the translation change degree DB 118a. Based on the translation change degree and the appearance frequency obtained by the problem word appearance frequency analysis unit 103, the degree of influence on the translation result is calculated for each question word registered in the problem type DB 117a. Registration in the problem type DB 117a (steps S1308a to S1310a).

このステップS1308a〜S1310aで行う処理の一例を詳しく説明すると、次のようになる。登録効果分析手段104aは、問題種別DB117a中の1つのエントリに注目し、そのエントリに影響度が登録されているか否かを調べる。登録されている場合は、次のエントリに注目する。   An example of the processing performed in steps S1308a to S1310a will be described in detail as follows. The registered effect analysis unit 104a pays attention to one entry in the problem type DB 117a, and checks whether or not the influence degree is registered in the entry. If registered, pay attention to the next entry.

これに対して、注目エントリに影響度が登録されている場合は、先ず、注目エントリに登録されている品詞,問題種別に対応する品詞翻訳変化度,問題種別翻訳変化度を翻訳変化度DB118aから取得し、両者を加算する。その後、上記加算結果と、注目エントリに登録されている出現頻度とを乗算することにより、影響度を算出する。即ち、影響度=(品詞翻訳変化度+問題種別翻訳変化度)×出現頻度なる演算を行うことにより、影響度を算出する。例えば、注目エントリに登録されている品詞,問題種別,出現頻度が「名詞」,「訳語誤り」,「125」であれば、影響度=(1+1)×125=250となる。なお、注目エントリに複数の品詞が格納されている場合には、本実施の形態では、注目エントリ中の各品詞に対応する翻訳変化度の内の最も大きなものを使用するようにするが、各品詞に対応する翻訳変化度を加算した値を使用するようにしても良い。その後、算出した影響度を注目エントリに登録する。その際、注目エントリと同一の問題語句,名詞が登録されている他のエントリが存在する場合には、そのエントリにも算出した影響度を登録する。以上の処理を影響度が未登録のエントリがなくなるまで繰り返し行う。以上が、ステップS1308a〜S1310aで行う処理の詳細である。   On the other hand, if the degree of influence is registered in the entry of interest, first, the part of speech registered in the entry of interest, the part of speech translation change corresponding to the problem type, and the problem type translation change are obtained from the translation change degree DB 118a. Acquire and add both. Thereafter, the influence level is calculated by multiplying the addition result by the appearance frequency registered in the entry of interest. That is, the degree of influence is calculated by performing the following calculation: influence degree = (part of speech translation change degree + question type translation change degree) × appearance frequency. For example, if the part of speech, question type, and appearance frequency registered in the entry of interest are “noun”, “translation error”, and “125”, the influence degree = (1 + 1) × 125 = 250. When a plurality of parts of speech are stored in the attention entry, in this embodiment, the largest translation change degree corresponding to each part of speech in the attention entry is used. You may make it use the value which added the translation change corresponding to a part of speech. Thereafter, the calculated influence degree is registered in the attention entry. At this time, if there is another entry in which the same problem word or noun as the target entry is registered, the calculated influence degree is also registered in that entry. The above processing is repeated until there are no more unregistered entries. The above is the details of the processing performed in steps S1308a to S1310a.

その後、登録効果表示指定手段105が、問題種別DB117aの内容(図22参照)に基づいて、図5に示すような登録効果表示画面50を作成し、辞書利用者端末2へ送信する(ステップS1311)。   Thereafter, the registration effect display designating unit 105 creates a registration effect display screen 50 as shown in FIG. 5 based on the contents of the problem type DB 117a (see FIG. 22) and transmits it to the dictionary user terminal 2 (step S1311). ).

辞書利用者端末2内の登録候補選択手段22は、利用者辞書作成装置1から送られてきた登録効果表示画面50を表示部26に表示する。利用者は、登録効果表示画面50に表示されている各問題語句の影響度を考慮して、利用者辞書122への登録候補とする問題語句を選択する(選択部59をチェックする)。登録候補選択手段22は、選択された問題語句を示す登録候補選択情報(例えば、選択された問題語句のデータ番号を含む)を利用者辞書作成装置1へ送信する(ステップS1312)。   The registration candidate selection means 22 in the dictionary user terminal 2 displays the registration effect display screen 50 sent from the user dictionary creation device 1 on the display unit 26. The user selects a question word / phrase to be a candidate for registration in the user dictionary 122 in consideration of the degree of influence of each question word / phrase displayed on the registration effect display screen 50 (checks the selection unit 59). The registration candidate selection means 22 transmits registration candidate selection information (for example, including the data number of the selected problem word / phrase) indicating the selected problem word / phrase to the user dictionary creation device 1 (step S1312).

利用者辞書作成装置1a内の登録効果表示指定手段105は、辞書利用者端末2から登録候補選択情報が送られてくると、問題種別DB117aに登録されている各問題語句に関連する情報の内、利用者によって選択されなかった問題語句に関する情報を削除する(ステップS1313a)。この処理により、問題種別DB117a内には、利用者によって選択された問題語句に関する情報のみが残る。   When registration candidate selection information is sent from the dictionary user terminal 2, the registration effect display designating means 105 in the user dictionary creation device 1a includes information related to each question word / phrase registered in the question type DB 117a. Then, the information on the problem word / phrase that has not been selected by the user is deleted (step S1313a). As a result of this processing, only information relating to the question word / phrase selected by the user remains in the question type DB 117a.

その後、問題難易度分析手段106aが、辞書難易度DB119aを参照し、問題種別DB117aに登録されている各問題語句の品詞難易度および種別難易度を取得する(図21のステップS1401,S1402a)。その後、登録候補・費用確定手段107aが、問題難易度分析手段106aによって取得された各問題語句の品詞難易度および種別難易度と、単価DB120に登録されている単価とに基づいて、各問題語句毎に、利用者辞書122への登録費用を算出する(ステップS1403a)。例えば、辞書難易度DB119a,単価DB120の内容が、それぞれ図19,図7に示すものであり、問題種別DB117aの内容が図22に示すものであるとすると、問題語句「wear」の登録費用は、登録費用=(品詞難易度+種別難易度)×単価=(3+1)×100=400円となる。なお、登録費用の算出方法は、これに限られるものではなく、更に、問題語句の出現頻度も考慮しても良い。即ち、登録費用=(品詞難易度+種別難易度)×出現頻度×単価とするようにしても良い。   Thereafter, the problem difficulty level analysis means 106a refers to the dictionary difficulty level DB 119a, and acquires the part of speech difficulty level and type difficulty level of each question word registered in the problem type DB 117a (steps S1401 and S1402a in FIG. 21). After that, the registration candidate / cost determination means 107a determines each problem word / phrase based on the part-of-speech difficulty and type difficulty of each problem word acquired by the problem difficulty analysis means 106a and the unit price registered in the unit price DB 120. Every time, the registration cost to the user dictionary 122 is calculated (step S1403a). For example, if the contents of the dictionary difficulty level DB 119a and the unit price DB 120 are as shown in FIGS. 19 and 7, respectively, and the contents of the problem type DB 117a are as shown in FIG. 22, the registration cost of the question phrase “wear” is , Registration cost = (part of speech difficulty + class difficulty) × unit price = (3 + 1) × 100 = 400 yen. Note that the registration cost calculation method is not limited to this, and the frequency of occurrence of the problem word may also be considered. That is, registration cost = (part of speech difficulty + class difficulty) × appearance frequency × unit price.

その後、登録候補・費用確定手段107aは、図23に示すような登録候補費用表示画面2300を作成し、辞書利用者端末2へ送信する(ステップS1404)。図23に示すように、登録候補費用表示画面2300は、データ番号部2301と、問題語句部2302と、出現頻度部2303と、品詞部2304と、品詞難易度部2305と、問題種別部2306と、種別難易度部2307と、合計難易度部2308と、登録費用部2309と、選択部2310とを備えている。データ番号部2301には、問題語句に固有のデータ番号が設定される。問題語句部2302には、問題語句が設定される。出現頻度部2302には、問題語句の出現頻度が設定される。品詞部2304には、問題語句の品詞が設定される。品詞難易度部2305には、問題語句の品詞難易度が設定される。問題種別部2306には、問題種別が設定される。種別難易度部2307には、問題語句の種別難易度が設定される。合計難易度2308には、品詞難易度と種別難易度との合計値が設定される。登録費用部2309には、登録費用が設定される。選択部2310は、利用者が利用者辞書122に登録する問題語句を選択する際に使用する選択欄となる。   Thereafter, the registration candidate / cost determination unit 107a creates a registration candidate cost display screen 2300 as shown in FIG. 23 and transmits it to the dictionary user terminal 2 (step S1404). As shown in FIG. 23, the registration candidate cost display screen 2300 includes a data number part 2301, a problem word / phrase part 2302, an appearance frequency part 2303, a part of speech part 2304, a part of speech difficulty part 2305, and a question type part 2306. , A type difficulty level part 2307, a total difficulty level part 2308, a registration cost part 2309, and a selection part 2310. In the data number part 2301, a data number unique to the question word is set. In the question word / phrase part 2302, a question word / phrase is set. In the appearance frequency section 2302, the appearance frequency of the problem word / phrase is set. In the part of speech part 2304, the part of speech of the question word is set. In the part of speech difficulty part 2305, the part of speech difficulty of the question phrase is set. A problem type is set in the problem type section 2306. In the type difficulty level section 2307, the type difficulty level of the question word / phrase is set. In the total difficulty 2308, a total value of the part of speech difficulty and the type difficulty is set. In the registration cost unit 2309, a registration cost is set. The selection unit 2310 is a selection field used when the user selects a problem word / phrase to be registered in the user dictionary 122.

辞書利用者端末2内の登録対象選択手段23は、利用者辞書作成装置1aから送られてきた登録候補費用表示画面2300を表示部26に表示する。利用者は、登録候補費用表示画面2300に表示されている問題語句の中から、登録費用を考慮して、利用者辞書122への登録対象にする問題語句を選択する(選択部2310をチェックする)。これにより、登録対象選択手段23は、選択された問題語句を示す登録対象選択情報を利用者辞書作成装置1aへ送信する(ステップS1405)。   The registration target selection means 23 in the dictionary user terminal 2 displays the registration candidate cost display screen 2300 sent from the user dictionary creation device 1 a on the display unit 26. The user selects a problem word / phrase to be registered in the user dictionary 122 from the problem words / phrases displayed on the registration candidate cost display screen 2300 in consideration of the registration cost (checks the selection unit 2310). ). As a result, the registration target selection unit 23 transmits registration target selection information indicating the selected problem phrase to the user dictionary creation device 1a (step S1405).

登録候補・費用確定手段107aは、辞書利用者端末2から登録対象選択情報が送られてくると、利用者によって選択された問題語句のデータ番号と、その語句の登録費用とを対応付けて課金情報DB121に登録する(ステップS1406)。その後、登録候補・費用確定手段107aは、利用者が登録対象にした問題語句のデータ番号のリスト(登録対象リスト)を作成し、対訳辞書リスト作成手段108に渡す(ステップS1407)。   When the registration candidate selection information is sent from the dictionary user terminal 2, the registration candidate / cost determination unit 107a charges the data number of the problem word / phrase selected by the user in association with the registration cost of the word / phrase. The information is registered in the information DB 121 (step S1406). After that, the registration candidate / cost determination unit 107a creates a list of data numbers (registration target list) of problem words / phrases that are registered by the user and passes them to the bilingual dictionary list creation unit 108 (step S1407).

対訳辞書リスト作成手段108は、登録候補・費用確定手段107aから登録対象リストが渡されると、問題種別DB117aに登録されている各情報の中から、登録対象リストに含まれているデータ番号と対応付けて登録されている情報を取得し、取得した情報を辞書作成者端末3へ送信する。辞書作成者端末3内の対訳辞書リスト作成支援手段32は、利用者辞書作成装置1aから送られてきた情報を表示部34に表示する。辞書作成者は、この情報を見て、各問題語句毎に、辞書登録内容を設定した図9に示すような対訳辞書リスト90を作成し、対訳辞書リスト作成手段108に返す。対訳辞書リスト作成手段108は辞書作成者端末3から送られてきた対訳辞書リストを辞書利用者端末2へ送信する(ステップS1408)。   When the registration target list is passed from the registration candidate / cost determination unit 107a, the bilingual dictionary list creation unit 108 corresponds to the data number included in the registration target list from among the information registered in the problem type DB 117a. The registered information is acquired, and the acquired information is transmitted to the dictionary creator terminal 3. The bilingual dictionary list creation support means 32 in the dictionary creator terminal 3 displays the information sent from the user dictionary creation device 1 a on the display unit 34. The dictionary creator looks at this information and creates a bilingual dictionary list 90 as shown in FIG. 9 in which dictionary registration contents are set for each question word and returns it to the bilingual dictionary list creating means 108. The bilingual dictionary list creating means 108 sends the bilingual dictionary list sent from the dictionary creator terminal 3 to the dictionary user terminal 2 (step S1408).

辞書利用者端末2内の登録内容確認手段24は、利用者辞書作成装置1aから送られてきた対訳辞書リストを表示部26に表示する。利用者は、対訳辞書リストの内容が、正しければ、入力部25から確認OKを入力し、正しくなければ、対訳辞書リストを修正する。登録内容確認手段24は、確認OKが入力された場合には、その旨を対訳辞書リスト作成手段108に通知し、対訳辞書リストが修正された場合は、修正後の対訳辞書リストを対訳辞書リスト作成手段108へ送信する(ステップS1409)。   The registered content confirmation means 24 in the dictionary user terminal 2 displays the bilingual dictionary list sent from the user dictionary creation device 1 a on the display unit 26. If the contents of the bilingual dictionary list are correct, the user inputs confirmation OK from the input unit 25. If the contents are not correct, the user corrects the bilingual dictionary list. When the confirmation OK is input, the registered content confirmation unit 24 notifies the bilingual dictionary list creating unit 108 to that effect. When the bilingual dictionary list is modified, the registered bilingual dictionary list is displayed as the bilingual dictionary list. The message is transmitted to the creating means 108 (step S1409).

対訳辞書リスト作成手段108は、辞書利用者端末2から確認OKが送られてきた場合は、ステップS1408で作成した対訳辞書リストを辞書登録手段109に渡し、修正された対訳辞書リストが送られてきた場合も、それを辞書登録手段109に渡す。これにより、辞書登録手段109は、利用者辞書122に対訳辞書リストの内容を登録する(ステップS1410)。その後、費用請求手段110が、利用者辞書122へ登録を行った問題語句のデータ番号と、課金情報DB121の内容と、辞書利用者DB123の内容とに基づいて、図24に示すような請求書を作成し、それを電子メールにより利用者へ送信する(ステップS1411〜S1413)。   When the confirmation OK is sent from the dictionary user terminal 2, the bilingual dictionary list creation means 108 passes the bilingual dictionary list created in step S1408 to the dictionary registration means 109, and the revised bilingual dictionary list is sent. If it does, it is passed to the dictionary registration means 109. Thereby, the dictionary registration means 109 registers the contents of the bilingual dictionary list in the user dictionary 122 (step S1410). Thereafter, the cost billing means 110 creates a bill as shown in FIG. 24 based on the data number of the problem word / phrase registered in the user dictionary 122, the contents of the charging information DB 121, and the contents of the dictionary user DB 123. Is transmitted to the user by electronic mail (steps S1411 to S1413).

〔第2の実施の形態の効果〕
本実施の形態は、第1の実施の形態が有している効果に加え、影響度をきめ細かく設定することが可能になるという効果を有する。その理由は、問題語句の出現頻度および品詞だけでなく、機械翻訳文と参考翻訳文とに不一致部分が発生した要因(問題種別)も考慮して影響度を算出する登録効果分析手段104aを備えているからである。
[Effects of Second Embodiment]
In addition to the effect of the first embodiment, the present embodiment has an effect that the influence can be set finely. The reason is that the registration effect analysis means 104a for calculating the degree of influence in consideration of not only the appearance frequency and part of speech of the problem phrase but also the factor (problem type) that caused the mismatch between the machine translation sentence and the reference translation sentence is provided. Because.

更に、本実施の形態は、登録費用をきめ細かく設定することが可能になるという効果を有する。その理由は、問題語句の品詞だけでなく、機械翻訳文と参考翻訳文とに不一致部分が発生した要因(問題種別)も考慮して登録費用を算出する登録候補・費用確定手段107aを備えているからである。   Furthermore, this embodiment has an effect that the registration fee can be set finely. The reason is that it includes a registration candidate / cost determination means 107a for calculating a registration cost in consideration of not only the part of speech of the problem phrase but also the factor (problem type) that caused the mismatch between the machine translation and the reference translation. Because.

本発明によれば、機械翻訳システムの利用者辞書開発ビジネスといった用途に適用できる。また、本発明によれば、機械翻訳システムの利用者知識DB開発ビジネスといった用途に適用できる。   According to the present invention, it can be applied to a user dictionary development business of a machine translation system. Moreover, according to this invention, it can apply to uses, such as a user knowledge DB development business of a machine translation system.

本発明にかかる利用者辞書作成システムの第1の実施の形態の構成例を示すブロック図である。It is a block diagram which shows the structural example of 1st Embodiment of the user dictionary creation system concerning this invention. 利用者辞書作成装置1の構成例を示すブロック図である。It is a block diagram which shows the structural example of the user dictionary creation apparatus. 問題DB117の一例を示す図である。It is a figure which shows an example of problem DB117. 翻訳変化度DB118の一例を示す図である。It is a figure which shows an example of translation variation DB118. 登録効果表示画面50の一例を示す図である。5 is a diagram illustrating an example of a registration effect display screen 50. FIG. 辞書難易度DB119の一例を示す図である。It is a figure which shows an example of dictionary difficulty DB119. 単位DB120の一例を示す図である。It is a figure which shows an example of unit DB120. 登録候補費用表示画面80の一例を示す図である。5 is a diagram illustrating an example of a registration candidate cost display screen 80. FIG. 対訳辞書リスト90の一例を示す図である。It is a figure which shows an example of the bilingual dictionary list. 請求書の一例を示す図である。It is a figure which shows an example of an invoice. 辞書利用者端末2の構成例を示すブロック図である。It is a block diagram which shows the structural example of the dictionary user terminal. 辞書作成者端末3の構成例を示すブロック図である。3 is a block diagram illustrating a configuration example of a dictionary creator terminal 3. FIG. 機械翻訳手段101,問題個所分析手段102,問題語句出現頻度分析手段103,登録効果分析手段104,登録効果表示指定手段105の処理例を示すフローチャートである。10 is a flowchart showing a processing example of machine translation means 101, problem location analysis means 102, problem word appearance frequency analysis means 103, registration effect analysis means 104, and registration effect display designation means 105. 問題難易度分析手段106,登録候補・費用確定手段107,対訳辞書リスト作成手段108,辞書登録手段109,費用請求手段110の処理例を示すフローチャートである。7 is a flowchart showing a processing example of a problem difficulty level analysis unit 106, a registration candidate / cost determination unit 107, a bilingual dictionary list creation unit 108, a dictionary registration unit 109, and a cost claim unit 110. 登録効果表示画面における影響度の表示例(棒グラフ)を示す図である。It is a figure which shows the example of a display (bar graph) of the influence degree in a registration effect display screen. 登録効果表示画面における影響度の表示例(円グラフ)を示す図である。It is a figure which shows the example of a display (pie graph) of the influence degree in a registration effect display screen. 本発明の第2の実施の形態で使用する利用者辞書作成装置1aの構成例を示すブロック図である。It is a block diagram which shows the structural example of the user dictionary creation apparatus 1a used by the 2nd Embodiment of this invention. 翻訳変化度DB118aの一例を示す図である。It is a figure which shows an example of translation variation DB118a. 辞書難易度DB119aの一例を示す図である。It is a figure which shows an example of dictionary difficulty DB119a. 機械翻訳手段101,問題個所分析手段102a,問題語句出現頻度分析手段103,登録効果分析手段104a,登録効果表示指定手段105の処理例を示すフローチャートである。10 is a flowchart showing a processing example of a machine translation unit 101, a problem part analysis unit 102a, a problem word / phrase appearance frequency analysis unit 103, a registration effect analysis unit 104a, and a registration effect display designation unit 105. 問題難易度分析手段106a,登録候補・費用確定手段107a,対訳辞書リスト作成手段108,辞書登録手段109,費用請求手段110の処理例を示すフローチャートである。7 is a flowchart showing a processing example of a problem difficulty level analysis unit 106a, a registration candidate / cost determination unit 107a, a bilingual dictionary list creation unit 108, a dictionary registration unit 109, and a cost billing unit 110. 問題種別DB117aの一例を示す図である。It is a figure which shows an example of problem classification DB117a. 登録候補費用表示画面2300の一例を示す図である。It is a figure which shows an example of the registration candidate expense display screen 2300. FIG. 請求書の一例を示す図である。It is a figure which shows an example of an invoice.

符号の説明Explanation of symbols

1,1a…利用者辞書作成装置
101…機械翻訳手段
102,102a…問題個所分析手段
103…問題語句出現頻度分析手段
104,104a…登録効果分析手段
105…登録効果表示指定手段
106,106a…問題難易度分析手段
107,107a…登録候補・費用確定手段
108…対訳辞書リスト作成手段
109…辞書登録手段
110…費用請求手段
111…送受信手段
112,112a…機械翻訳辞書
113…利用者文書格納部
114…原文DB
115…訳文DB
116…対訳DB
117…問題DB
117a…問題種別DB
118,118a…翻訳変化度DB
119,119a…辞書難易度DB
120…単価DB
121…課金情報DB
122…利用者辞書
123…辞書利用者DB
124…入力部
125…表示部
126…翻訳知識DB
2…辞書利用者端末
21…送受信手段
22…登録候補選択手段
23…登録対象選択手段
24…登録内容確認手段
25…入力部
26…表示部
3…辞書作成者端末
31…送受信手段
32…対訳辞書リスト作成支援手段
33…入力部
34…表示部
4…ネットワーク
DESCRIPTION OF SYMBOLS 1,1a ... User dictionary creation apparatus 101 ... Machine translation means 102, 102a ... Problem location analysis means 103 ... Problem word appearance frequency analysis means 104, 104a ... Registration effect analysis means 105 ... Registration effect display designation means 106, 106a ... Problem Difficulty level analysis means 107, 107a ... registration candidate / cost determination means 108 ... bilingual dictionary list creation means 109 ... dictionary registration means 110 ... cost billing means 111 ... transmission / reception means 112, 112a ... machine translation dictionary 113 ... user document storage section 114 ... Original DB
115 ... Translation DB
116 ... Bilingual DB
117 ... Problem DB
117a ... Problem type DB
118, 118a ... Translation change DB
119, 119a ... Dictionary difficulty DB
120 ... Unit price DB
121 ... Billing information DB
122 ... User dictionary 123 ... Dictionary user DB
124 ... Input unit 125 ... Display unit 126 ... Translation knowledge DB
2 ... Dictionary user terminal 21 ... Transmission / reception means 22 ... Registration candidate selection means 23 ... Registration object selection means 24 ... Registration content confirmation means 25 ... Input section 26 ... Display section 3 ... Dictionary creator terminal 31 ... Transmission / reception means 32 ... Bilingual dictionary List creation support means 33 ... input unit 34 ... display unit 4 ... network

Claims (30)

利用者辞書作成装置と、利用者端末とを含む利用者辞書作成システムであって、
前記利用者辞書作成装置が、
機械翻訳辞書を使用して原文を翻訳する機械翻訳手段と、
該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段と、
前記問題個所分析手段が抽出した問題語句の前記原文における出現頻度を求める問題語句出現頻度分析手段と、
該問題語句出現頻度分析手段で求めた前記問題語句の出現頻度に関連する値であって、前記問題語句が翻訳結果に及ぼす影響度を算出する登録効果分析手段と、
前記問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示すると共に、前記登録効果分析手段が算出した影響度を表示する登録効果表示画面を前記利用者端末へ送信する登録効果表示指定手段とを備え、
前記利用者端末が、
前記登録効果表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択手段を備えたことを特徴とする利用者辞書作成システム。
A user dictionary creation system including a user dictionary creation device and a user terminal,
The user dictionary creation device is
Machine translation means for translating the original text using a machine translation dictionary;
Extracting a mismatched portion between a machine translation sentence when the original sentence is translated by the machine translation means and a reference translation sentence for the original sentence, and extracting a word / phrase in the original sentence corresponding to the extracted mismatched part as a question word / phrase Problem location analysis means,
A problem word appearance frequency analyzing means for obtaining an appearance frequency in the original sentence of the problem word extracted by the problem part analyzing means;
A registration effect analyzing means for calculating an influence degree of the problem word / phrase on the translation result, which is a value related to the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analyzing means;
A registration effect display for displaying a mismatch effect part extracted by the problem location analysis means and a question word in association with each other and transmitting a registration effect display screen displaying the degree of influence calculated by the registration effect analysis means to the user terminal A designation means,
The user terminal is
Registration candidate selection means for transmitting registration candidate selection information indicating a problem word / phrase selected by a user among the question words / phrases displayed on the registration effect display screen to the user dictionary creating device is provided. User dictionary creation system.
請求項1記載の利用者辞書作成システムにおいて、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞とに基づいて影響度を算出する構成を有することを特徴とする利用者辞書作成システム。
In the user dictionary creation system according to claim 1,
The registration effect analysis means
A system for creating a user dictionary, characterized in that an influence degree is calculated based on an appearance frequency of the question word / phrase obtained by the question word / phrase appearance frequency analyzing means and a part of speech of the question word / phrase.
請求項1記載の利用者辞書作成システムにおいて、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞と、前記問題語句に対応する不一致部分が発生した要因とに基づいて影響度を算出する構成を有することを特徴とする利用者辞書作成システム。
The user dictionary creation system according to claim 1,
The registration effect analysis means
The degree of influence is calculated on the basis of the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analysis means, the part of speech of the problem word / phrase, and the factor that caused the mismatched part corresponding to the problem word / phrase. A user dictionary creation system characterized by
請求項1、2または3記載の利用者辞書作成システムにおいて、
前記利用者辞書作成装置が、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段と、
登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備え、
前記利用者端末が、
登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報を前記利用者辞書作成装置へ送信する登録対象選択手段を備えたことを特徴とする利用者辞書作成システム。
In the user dictionary creation system according to claim 1, 2, or 3,
The user dictionary creation device is
For each problem word specified by the registration candidate selection information, a registration candidate cost display screen for calculating a registration cost according to the part of speech of the problem word and displaying the calculated registration cost and the corresponding problem word Registration candidate / cost confirmation means to be transmitted to the user terminal,
A bilingual dictionary list creating means for creating a bilingual dictionary list including a problem word specified by registration target selection information and a word and phrase corresponding to the problem word in the reference translation sentence;
Dictionary registration means for registering the bilingual dictionary list created by the bilingual dictionary list creating means in a user dictionary;
The user terminal is
Registration object selection means for transmitting registration object selection information for specifying a problem word / phrase selected by the user among the problem words / phrases displayed on the registration candidate cost display screen to the user dictionary creation device is provided. A featured user dictionary creation system.
請求項4記載の利用者辞書作成システムにおいて、
前記登録候補・費用確定手段の代わりに、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段を備えたことを特徴とする利用者辞書作成システム。
In the user dictionary creation system according to claim 4,
Instead of the registration candidate / cost determination means,
For each problem word specified by the registration candidate selection information, calculate the registration cost according to the part of speech of the problem word and the factor that caused the mismatched part corresponding to the problem word, and the calculated registration cost A user dictionary creation system comprising registration candidate / cost determination means for transmitting a registration candidate cost display screen for displaying a corresponding problem word to the user terminal.
請求項4または5記載の利用者辞書作成システムにおいて、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段を備えたことを特徴とする利用者辞書作成システム。
In the user dictionary creation system according to claim 4 or 5,
User dictionary creation comprising cost billing means for creating a bill including a problem word registered in the user dictionary and a registration cost for the problem word calculated by the registration candidate / cost determination means system.
請求項1乃至6の何れか1項に記載した利用者辞書作成システムにおいて、
前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする利用者辞書作成システム。
In the user dictionary creation system according to any one of claims 1 to 6,
The user dictionary creation system, wherein the reference translated sentence is a translated sentence instructed by the user with respect to the original sentence.
請求項1乃至6の何れか1項に記載した利用者辞書作成システムにおいて、
前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする利用者辞書作成システム。
In the user dictionary creation system according to any one of claims 1 to 6,
The user dictionary creation system, wherein the reference translation is a translation created using a translation memory.
機械翻訳辞書を使用して原文を翻訳する機械翻訳手段と、
該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段と、
前記問題個所分析手段が抽出した問題語句の前記原文における出現頻度を求める問題語句出現頻度分析手段と、
該問題語句出現頻度分析手段で求めた前記問題語句の出現頻度に関連する値であって、前記問題語句が翻訳結果に及ぼす影響度を算出する登録効果分析手段と、
前記問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示すると共に、前記登録効果分析手段が算出した影響度を表示する登録効果表示画面を利用者端末へ送信する登録効果表示指定手段とを備えたことを特徴とする利用者辞書作成装置。
Machine translation means for translating the original text using a machine translation dictionary;
Extracting a mismatched portion between a machine translation sentence when the original sentence is translated by the machine translation means and a reference translation sentence for the original sentence, and extracting a word / phrase in the original sentence corresponding to the extracted mismatched part as a question word / phrase Problem location analysis means,
A problem word appearance frequency analyzing means for obtaining an appearance frequency in the original sentence of the problem word extracted by the problem part analyzing means;
A registration effect analyzing means for calculating an influence degree of the problem word / phrase on the translation result, which is a value related to the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analyzing means;
A registration effect display designation for displaying a mismatch effect part extracted by the problem location analysis means and a question word in association with each other and transmitting a registration effect display screen displaying the degree of influence calculated by the registration effect analysis means to the user terminal And a user dictionary creation device.
請求項9記載の利用者辞書作成装置において、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞とに基づいて影響度を算出する構成を有することを特徴とする利用者辞書作成装置。
In the user dictionary creation device according to claim 9,
The registration effect analysis means
An apparatus for creating a user dictionary, characterized in that an influence degree is calculated based on an appearance frequency of the question word / phrase obtained by the question word / phrase appearance frequency analyzing means and a part of speech of the question word / phrase.
請求項9記載の利用者辞書作成装置において、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞と、前記問題語句に対応する不一致部分が発生した要因とに基づいて影響度を算出する構成を有することを特徴とする利用者辞書作成装置。
In the user dictionary creation device according to claim 9,
The registration effect analysis means
The degree of influence is calculated on the basis of the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analysis means, the part of speech of the problem word / phrase, and the factor that caused the mismatched part corresponding to the problem word / phrase. A user dictionary creation device characterized by
請求項9、10または11記載の利用者辞書作成装置において、
前記利用者端末から前記前記登録効果表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す前記登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段と、
前記利用者端末から前記登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報が送られてきたとき、該登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備えたことを特徴とする利用者辞書作成装置。
The user dictionary creation device according to claim 9, 10 or 11,
When the registration candidate selection information indicating the problem word / phrase selected by the user among the question words / phrases displayed on the registration effect display screen is sent from the user terminal, the registration candidate selection information For each problem word specified, a registration cost corresponding to the part of speech of the problem word is calculated, and a registration candidate cost display screen for displaying the calculated registration cost and the corresponding problem word is transmitted to the user terminal. Registration candidate / cost determination means,
When registration object selection information for specifying a problem word / phrase selected by the user among the problem words / phrases displayed on the registration candidate cost display screen is sent from the user terminal, the registration object selection information A bilingual dictionary list creating means for creating a bilingual dictionary list including a specified problem word and the word corresponding to the problem word in the reference translation sentence;
A user dictionary creation apparatus comprising: a dictionary registration unit for registering a bilingual dictionary list created by the bilingual dictionary list creation unit in a user dictionary.
請求項12記載の利用者辞書作成装置において、
前記登録候補・費用確定手段の代わりに、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段を備えたことを特徴とする利用者辞書作成装置。
The user dictionary creation device according to claim 12,
Instead of the registration candidate / cost determination means,
For each problem word specified by the registration candidate selection information, calculate the registration cost according to the part of speech of the problem word and the factor that caused the mismatched part corresponding to the problem word, and the calculated registration cost A user dictionary creation device comprising registration candidate / cost determination means for transmitting a registration candidate cost display screen for displaying a corresponding problem word to the user terminal.
請求項12または13記載の利用者辞書作成装置において、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段を備えたことを特徴とする利用者辞書作成装置。
The user dictionary creation device according to claim 12 or 13,
User dictionary creation comprising cost billing means for creating a bill including a problem word registered in the user dictionary and a registration cost for the problem word calculated by the registration candidate / cost determination means apparatus.
請求項9乃至14の何れか1項に記載した利用者辞書作成装置において、
前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする利用者辞書作成装置。
The user dictionary creation device according to any one of claims 9 to 14,
The user dictionary creation device, wherein the reference translated sentence is a translated sentence instructed by the user with respect to the original sentence.
請求項9乃至14の何れか1項に記載した利用者辞書作成装置において、
前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする利用者辞書作成装置。
The user dictionary creation device according to any one of claims 9 to 14,
The user dictionary creation apparatus, wherein the reference translation is a translation created using a translation memory.
利用者辞書作成装置が、
機械翻訳辞書を使用して原文を翻訳する機械翻訳ステップと、
該機械翻訳ステップで前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析ステップと、
前記問題個所分析ステップで抽出した問題語句の前記原文における出現頻度を求める問題語句出現頻度分析ステップと、
該問題語句出現頻度分析ステップで求めた前記問題語句の出現頻度に関連する値であって、前記問題語句が翻訳結果に及ぼす影響度を算出する登録効果分析ステップと、
前記問題個所分析ステップで抽出した不一致部分と問題語句とを対応付けて表示すると共に、前記登録効果分析ステップで算出した影響度を表示する登録効果表示画面を前記利用者端末へ送信する登録効果表示指定ステップとを実行し、
前記利用者端末が、
前記登録効果表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択ステップを実行することを特徴とする利用者辞書作成方法。
User dictionary creation device
A machine translation step for translating the original text using a machine translation dictionary;
Extracting a mismatched portion between the machine translation sentence when the original sentence was translated in the machine translation step and a reference translation sentence for the original sentence, and extracting a phrase in the original sentence corresponding to the extracted mismatched part as a problem phrase Problem location analysis step,
A problem word appearance frequency analysis step for obtaining an appearance frequency in the original sentence of the problem word extracted in the problem part analysis step;
A registration effect analysis step for calculating an influence degree of the problem word / phrase on the translation result, which is a value related to the appearance frequency of the problem word / phrase obtained in the problem word / phrase appearance frequency analysis step;
A registration effect display for displaying a mismatch effect part extracted in the problem location analysis step and a question word in association with each other and transmitting a registration effect display screen displaying the degree of influence calculated in the registration effect analysis step to the user terminal Execute the specified step,
The user terminal is
A registration candidate selection step of transmitting registration candidate selection information indicating a problem word / phrase selected by a user among the question words / phrases displayed on the registration effect display screen to the user dictionary creation device is executed. User dictionary creation method.
請求項17記載の利用者辞書作成方法において、
前記登録効果分析ステップが、
前記問題語句出現頻度分析ステップで求めた前記問題語句の出現頻度と、前記問題語句の品詞とに基づいて影響度を算出することを特徴とする利用者辞書作成方法。
The user dictionary creation method according to claim 17,
The registration effect analysis step comprises:
A user dictionary creation method, wherein an influence degree is calculated based on an appearance frequency of the question word / phrase obtained in the question word / phrase appearance frequency analysis step and a part of speech of the question word / phrase.
請求項17記載の利用者辞書作成方法において、
前記登録効果分析ステップが、
前記問題語句出現頻度分析ステップで求めた前記問題語句の出現頻度と、前記問題語句の品詞と、前記問題語句に対応する不一致部分が発生した要因とに基づいて影響度を算出することを特徴とする利用者辞書作成方法。
The user dictionary creation method according to claim 17,
The registration effect analysis step comprises:
The degree of influence is calculated based on the appearance frequency of the question word / phrase obtained in the question word / phrase appearance frequency analysis step, the part of speech of the question word / phrase, and the factor that caused the mismatched part corresponding to the question word / phrase. To create a user dictionary.
請求項17、18または19記載の利用者辞書作成方法において、
前記利用者辞書作成装置が、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定ステップと、
登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成ステップと、
該対訳辞書リスト作成ステップで作成された対訳辞書リストを利用者辞書に登録する辞書登録ステップとを実行し、
前記利用者端末が、
登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報を前記利用者辞書作成装置へ送信する登録対象選択ステップを実行することを特徴とする利用者辞書作成方法。
The user dictionary creation method according to claim 17, 18 or 19,
The user dictionary creation device is
For each problem word specified by the registration candidate selection information, a registration candidate cost display screen for calculating a registration cost according to the part of speech of the problem word and displaying the calculated registration cost and the corresponding problem word Registration candidate / cost confirmation step to be transmitted to the user terminal,
A bilingual dictionary list creating step of creating a bilingual dictionary list including a problem word specified by registration target selection information and a word and phrase corresponding to the problem word in the reference translation sentence;
A dictionary registration step of registering the bilingual dictionary list created in the bilingual dictionary list creating step in a user dictionary;
The user terminal is
Executing a registration object selection step of transmitting registration object selection information for specifying a problem word selected by the user among the problem words displayed on the registration candidate cost display screen to the user dictionary creation device; Characteristic user dictionary creation method.
請求項20記載の利用者辞書作成方法において、
前記登録候補・費用確定ステップの代わりに、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定ステップを実行することを特徴とする利用者辞書作成方法。
The user dictionary creation method according to claim 20,
Instead of the registration candidate / cost determination step,
For each problem word specified by the registration candidate selection information, calculate the registration cost according to the part of speech of the problem word and the factor that caused the mismatched part corresponding to the problem word, and the calculated registration cost A method for creating a user dictionary, comprising: performing a registration candidate / cost determination step of transmitting a registration candidate cost display screen for displaying a corresponding problem word to the user terminal.
請求項20または21記載の利用者辞書作成方法において、
前記利用者辞書作成装置が、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求ステップを実行することを特徴とする利用者辞書作成方法。
The user dictionary creation method according to claim 20 or 21,
The user dictionary creation device is
A user dictionary creation characterized by executing a cost billing step of creating a bill including a problem word registered in the user dictionary and a registration cost for the problem word calculated by the registration candidate / cost determination unit Method.
請求項17乃至22の何れか1項に記載した利用者辞書作成方法において、
前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする利用者辞書作成方法。
The user dictionary creation method according to any one of claims 17 to 22,
The user dictionary creation method, wherein the reference translated sentence is a translated sentence instructed by the user with respect to the original sentence.
請求項17乃至22の何れか1項に記載した利用者辞書作成方法において、
前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする利用者辞書作成方法。
The user dictionary creation method according to any one of claims 17 to 22,
The user dictionary creation method, wherein the reference translation sentence is a translation sentence created using a translation memory.
コンピュータを、
機械翻訳辞書を使用して原文を翻訳する機械翻訳手段、
該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段、
前記問題個所分析手段が抽出した問題語句の前記原文における出現頻度を求める問題語句出現頻度分析手段、
該問題語句出現頻度分析手段で求めた前記問題語句の出現頻度に関連する値であって、前記問題語句が翻訳結果に及ぼす影響度を算出する登録効果分析手段、
前記問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示すると共に、前記登録効果分析手段が算出した影響度を表示する登録効果表示画面を利用者端末へ送信する登録効果表示指定手段として機能させるためのプログラム。
Computer
Machine translation means for translating the original text using a machine translation dictionary,
Extracting a mismatched portion between a machine translation sentence when the original sentence is translated by the machine translation means and a reference translation sentence for the original sentence, and extracting a word / phrase in the original sentence corresponding to the extracted mismatched part as a question word / phrase Problem location analysis means,
A problem word appearance frequency analysis means for obtaining an appearance frequency in the original sentence of the problem word extracted by the problem part analysis means;
Registration effect analysis means for calculating the degree of influence of the problem word / phrase on the translation result, which is a value related to the appearance frequency of the problem word / phrase determined by the problem word / phrase appearance frequency analysis means;
A registration effect display designation for displaying a mismatch effect part extracted by the problem location analysis means and a question word in association with each other and transmitting a registration effect display screen displaying the degree of influence calculated by the registration effect analysis means to the user terminal Program to function as a means.
請求項25記載のプログラムにおいて、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞とに基づいて影響度を算出する構成を有することを特徴とするプログラム。
The program according to claim 25,
The registration effect analysis means
A program characterized in that the degree of influence is calculated based on the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analyzing means and the part of speech of the problem word / phrase.
請求項25記載のプログラムにおいて、
前記登録効果分析手段が、
前記問題語句出現頻度分析手段で求めた前記問題語句の出現頻度と、前記問題語句の品詞と、前記問題語句に対応する不一致部分が発生した要因とに基づいて影響度を算出する構成を有することを特徴とするプログラム。
The program according to claim 25,
The registration effect analysis means
The degree of influence is calculated on the basis of the appearance frequency of the problem word / phrase obtained by the problem word / phrase appearance frequency analysis means, the part of speech of the problem word / phrase, and the factor that caused the mismatched part corresponding to the problem word / phrase. A program characterized by
請求項25、26または27記載のプログラムにおいて、
前記コンピュータを、
前記利用者端末から前記前記登録効果表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す前記登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段、
前記利用者端末から前記登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報が送られてきたとき、該登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段として機能させるためのプログラム。
The program according to claim 25, 26 or 27,
The computer,
When the registration candidate selection information indicating the problem word / phrase selected by the user among the question words / phrases displayed on the registration effect display screen is sent from the user terminal, the registration candidate selection information For each problem word specified, a registration cost corresponding to the part of speech of the problem word is calculated, and a registration candidate cost display screen for displaying the calculated registration cost and the corresponding problem word is transmitted to the user terminal. Registration candidate / cost determination means,
When registration object selection information for specifying a problem word / phrase selected by the user among the problem words / phrases displayed on the registration candidate cost display screen is sent from the user terminal, the registration object selection information A bilingual dictionary list creating means for creating a bilingual dictionary list including the specified problem word and the word corresponding to the problem word in the reference translation sentence;
A program for causing a bilingual dictionary list created by the bilingual dictionary list creating means to function as a dictionary registering means for registering in a user dictionary.
請求項28記載のプログラムにおいて、
前記登録候補・費用確定手段が、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する構成を有することを特徴とするプログラム。
The program according to claim 28,
The registration candidate / cost determination means is
For each problem word specified by the registration candidate selection information, calculate the registration cost according to the part of speech of the problem word and the factor that caused the mismatched part corresponding to the problem word, and the calculated registration cost A program characterized in that a registration candidate cost display screen for displaying a corresponding problem word is transmitted to the user terminal.
請求項28または29記載のプログラムにおいて、
前記コンピュータを、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段として機能させるためのプログラム。
The program according to claim 28 or 29,
The computer,
A program for functioning as a cost billing means for creating a bill including a problem word registered in the user dictionary and a registration cost for the problem word calculated by the registration candidate / cost determination means.
JP2004353789A 2004-12-07 2004-12-07 User dictionary generating system, user dictionary generating device, and user dictionary generating method and program Pending JP2006163768A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004353789A JP2006163768A (en) 2004-12-07 2004-12-07 User dictionary generating system, user dictionary generating device, and user dictionary generating method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004353789A JP2006163768A (en) 2004-12-07 2004-12-07 User dictionary generating system, user dictionary generating device, and user dictionary generating method and program

Publications (1)

Publication Number Publication Date
JP2006163768A true JP2006163768A (en) 2006-06-22

Family

ID=36665723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004353789A Pending JP2006163768A (en) 2004-12-07 2004-12-07 User dictionary generating system, user dictionary generating device, and user dictionary generating method and program

Country Status (1)

Country Link
JP (1) JP2006163768A (en)

Similar Documents

Publication Publication Date Title
JP3813911B2 (en) Machine translation system, machine translation method, and machine translation program
CN107209759B (en) Annotation support device and recording medium
US7020601B1 (en) Method and apparatus for processing source information based on source placeable elements
US5999939A (en) System and method for displaying and entering interactively modified stream data into a structured form
KR101099196B1 (en) adaptive machine translation
JP2002297588A (en) Method, program and apparatus for automatic creation for dictionary of translation example
Blain et al. Qualitative analysis of post-editing for high quality machine translation
Gantar et al. Discovering automated lexicography: The case of the Slovene lexical database
US8442856B2 (en) Translation support apparatus and computer-readable storage medium
Glass et al. A naive salience-based method for speaker identification in fiction books
Moorkens Measuring consistency in translation memories: a mixed-methods case study
JP2006163768A (en) User dictionary generating system, user dictionary generating device, and user dictionary generating method and program
JP2006309377A (en) Document retrieval device, document retrieval method, its program, and recording medium
KR101068073B1 (en) Web-based collaboration system for establishing and editing technical terminology
KR102118322B1 (en) Document translation server and translation method for generating original and translation files individually
JP2006163769A (en) User dictionary generating system, user dictionary generating device, user dictionary generating method and program
KR100831037B1 (en) Method and apparatus for automatically selecting a corresponding translation of a new word using bilingual corpus
Koeling et al. An Evaluation of a Lexicographers’ Workbench: building lexicons for Machine Translation
JP3744136B2 (en) Translation device and storage medium
Prinsloo The role of corpora in future dictionaries
Love Benchmarking the performance of Two Automated Term-extraction systems: LOGOS and ATAO
JP2009059290A (en) Device, method, and program for supporting preparation of foreign language document
JP2928246B2 (en) Translation support device
Ortego-Antón Parallel Corpora for Contrastive and Translation Studies. New Resources and Applications
JPS62177627A (en) Production of parts segmenting program