JP2007080221A - Apparatus, method and program for machine translation - Google Patents
Apparatus, method and program for machine translation Download PDFInfo
- Publication number
- JP2007080221A JP2007080221A JP2005271041A JP2005271041A JP2007080221A JP 2007080221 A JP2007080221 A JP 2007080221A JP 2005271041 A JP2005271041 A JP 2005271041A JP 2005271041 A JP2005271041 A JP 2005271041A JP 2007080221 A JP2007080221 A JP 2007080221A
- Authority
- JP
- Japan
- Prior art keywords
- specialized
- translation
- sentence
- feature vector
- translation target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、翻訳対象文を入力し、辞書データを用いた翻訳を行う機械翻訳装置及び機械翻訳方法に関する。 The present invention relates to a machine translation apparatus and a machine translation method for inputting a translation target sentence and performing translation using dictionary data.
近年、翻訳対象文を入力し、辞書データを用いた翻訳を行う機械翻訳装置が広く普及している。このような機械翻訳装置では、より適切な翻訳を可能とすべく、政治、経済等の専門分野毎に辞書データ(専門辞書データ)が設けられるものがある。この場合、複数の専門辞書データの中から如何にして翻訳対象文に適したものを選択するのかが重要である。 In recent years, machine translation devices that input a translation target sentence and perform translation using dictionary data have become widespread. Some of these machine translation apparatuses are provided with dictionary data (specialized dictionary data) for each specialized field such as politics and economy so as to enable more appropriate translation. In this case, it is important how to select one suitable for the sentence to be translated from among a plurality of specialized dictionary data.
例えば、特許文献1では、辞書データ選択の優先順位が利用者によって設定され、その優先順煮に基づいて辞書データを選択して翻訳を行う技術が提案されている。また、特許文献2では、翻訳対象文に含まれる各基本語に当該基本語がどの専門辞書データに登録されているのかを示す文脈ベクトルを付与し、翻訳対象文を基本語と専門分野とを属性とするテーブルに変換して、このテーブルと専門辞書対応テーブルとに基づいて専門辞書データを選択する技術が提案されている。
しかし、上述した特許文献1の技術では、利用者が手動によって辞書データ選択の優先順位を設定しており、煩雑である。また、特許文献2の技術では、専門辞書対応テーブルの設定には一定の専門知識が必要となる。 However, in the technique of Patent Document 1 described above, the user manually sets the priority order for selecting dictionary data, which is complicated. In the technique disclosed in Patent Document 2, a certain specialized knowledge is required for setting the specialized dictionary correspondence table.
本発明は、上記の点に鑑みてなされたもので、簡易に翻訳対象文に適した辞書データを用いた翻訳が可能な機械翻訳装置、機械翻訳方法及び機械翻訳プログラムを提供することを目的としている。 The present invention has been made in view of the above points, and an object thereof is to provide a machine translation device, a machine translation method, and a machine translation program capable of easily translating using dictionary data suitable for a sentence to be translated. Yes.
本発明に係る、機械翻訳装置は、複数の専門分野のそれぞれに帰属する文の特徴を表す専門分野特徴ベクトルを保持する第1の保持手段と、翻訳対象文に基づいて、該翻訳対象文の特徴を表す翻訳対象特徴ベクトルを作成する第1の作成手段と、前記第1の作成手段により作成された翻訳対象特徴ベクトルと、前記第1の保持手段に保持されている各専門分野特徴ベクトルとに基づいて、前記翻訳対象文が前記専門分野のそれぞれに帰属する可能性を推定する推定手段と、前記翻訳対象文が帰属する可能性が高い専門分野に対応する専門辞書データを優先的に選択する選択手段と、前記選択手段により選択された専門辞書データを用いて、前記翻訳対象文を翻訳する翻訳手段とを有する。 The machine translation device according to the present invention includes a first holding unit that holds a special field feature vector representing a feature of a sentence belonging to each of a plurality of specialized fields, and the translation target sentence based on the translation target sentence. A first creation means for creating a translation target feature vector representing a feature; a translation target feature vector created by the first creation means; and each specialized field feature vector held in the first holding means; Based on the above, the estimation means for estimating the possibility that the translation target sentence belongs to each of the specialized fields, and the specialized dictionary data corresponding to the specialized field to which the translation target sentence is likely to belong are preferentially selected. And a translation unit that translates the sentence to be translated using the specialized dictionary data selected by the selection unit.
これにより、翻訳対象文が帰属する可能性の高い専門分野に対応する専門辞書データが自動的に選択され、その専門辞書データを用いた適切な翻訳が可能となる。 Thereby, specialized dictionary data corresponding to a specialized field to which the translation target sentence is likely to belong is automatically selected, and appropriate translation using the specialized dictionary data becomes possible.
好ましくは、機械翻訳装置は、前記専門辞書データのそれぞれに対応する文に基づいて、前記専門分野特徴ベクトルを作成する第2の作成手段を有する。 Preferably, the machine translation apparatus includes a second creation unit that creates the specialized field feature vector based on a sentence corresponding to each of the specialized dictionary data.
好ましくは、機械翻訳装置は、前記第1の作成手段が、更に、前記翻訳対象文の周辺の文に基づいて、前記翻訳対象特徴ベクトルを作成する。 Preferably, in the machine translation device, the first creation unit further creates the translation target feature vector based on a sentence around the translation target sentence.
好ましくは、機械翻訳装置は、前記翻訳対象文の前記専門分野のそれぞれへの帰属可能性を視認可能に提供する提供手段を有する。 Preferably, the machine translation device includes providing means for providing the possibility of belonging to each of the specialized fields of the translation target sentence so as to be visible.
これにより、利用者は、翻訳対象文がどの専門分野に帰属する可能性があるのかを把握することが可能となる。 As a result, the user can grasp which specialized field the translation target sentence may belong to.
好ましくは、機械翻訳装置は、前記提供手段が、前記翻訳対象文の前記専門分野のそれぞれへの帰属可能性を表すグラフを表示する。 Preferably, in the machine translation apparatus, the providing unit displays a graph representing the possibility of the translation object sentence belonging to each of the specialized fields.
本発明に係る、機械翻訳方法は、翻訳対象文に基づいて、該翻訳対象文の特徴を表す翻訳対象特徴ベクトルを作成する第1の作成ステップと、前記第1の作成ステップにより作成された翻訳対象特徴ベクトルと、複数の専門分野のそれぞれに帰属する文の特徴を表す各専門分野特徴ベクトルとに基づいて、前記翻訳対象文が前記専門分野のそれぞれに帰属する可能性を推定する推定ステップと、前記翻訳対象文が帰属する可能性が高い専門分野に対応する専門辞書データを優先的に選択する選択ステップと、前記選択ステップにより選択された専門辞書データを用いて、前記翻訳対象文を翻訳する翻訳ステップとを有する。 The machine translation method according to the present invention includes a first creation step for creating a translation target feature vector representing a feature of the translation target sentence based on the translation target sentence, and a translation created by the first creation step. An estimation step for estimating a possibility that the translation target sentence belongs to each of the specialized fields based on the target feature vector and each specialized field feature vector representing a feature of the sentence belonging to each of the plurality of specialized fields; The translation step is translated using a selection step that preferentially selects specialized dictionary data corresponding to a specialized field to which the translation subject sentence is likely to belong, and the specialized dictionary data selected in the selection step A translation step.
好ましくは、機械翻訳方法は、前記専門辞書データのそれぞれに対応する文に基づいて、前記専門分野特徴ベクトルを作成する第2の作成ステップを有する。 Preferably, the machine translation method includes a second creation step of creating the specialized field feature vector based on a sentence corresponding to each of the specialized dictionary data.
好ましくは、機械翻訳方法は、前記第1の作成ステップが、更に、前記翻訳対象文の周辺の文に基づいて、前記翻訳対象特徴ベクトルを作成する。 Preferably, in the machine translation method, the first creation step further creates the translation target feature vector based on a sentence around the translation target sentence.
好ましくは、機械翻訳方法は、前記翻訳対象文の前記専門分野のそれぞれへの帰属可能性を視認可能に提供する提供ステップを有する。 Preferably, the machine translation method includes a providing step of providing the possibility of belonging to each of the specialized fields of the translation target sentence so as to be visible.
好ましくは、機械翻訳方法は、前記提供ステップが、前記翻訳対象文の前記専門分野のそれぞれへの帰属可能性を表すグラフを表示する。 Preferably, in the machine translation method, the providing step displays a graph representing the possibility of the translation target sentence belonging to each of the specialized fields.
本発明に係る、機械翻訳プログラムは、翻訳対象文に基づいて、該翻訳対象文の特徴を表す翻訳対象特徴ベクトルを作成する第1の作成ステップと、前記第1の作成ステップにより作成された翻訳対象特徴ベクトルと、複数の専門分野のそれぞれに帰属する文の特徴を表す各専門分野特徴ベクトルとに基づいて、前記翻訳対象文が前記専門分野のそれぞれに帰属する可能性を推定する推定ステップと、前記翻訳対象文が帰属する可能性が高い専門分野に対応する専門辞書データを優先的に選択する選択ステップと、前記選択ステップにより選択された専門辞書データを用いて、前記翻訳対象文を翻訳する翻訳ステップとをコンピュータに実行させる。 A machine translation program according to the present invention includes a first creation step for creating a translation target feature vector representing a feature of a translation target sentence based on the translation target sentence, and a translation created by the first creation step. An estimation step for estimating a possibility that the translation target sentence belongs to each of the specialized fields based on the target feature vector and each specialized field feature vector representing a feature of the sentence belonging to each of the plurality of specialized fields; The translation step is translated using a selection step that preferentially selects specialized dictionary data corresponding to a specialized field to which the translation subject sentence is likely to belong, and the specialized dictionary data selected in the selection step And causing the computer to execute a translation step.
好ましくは、機械翻訳プログラムは、前記専門辞書データのそれぞれに対応する文に基づいて、前記専門分野特徴ベクトルを作成する第2の作成ステップをコンピュータに実行させる。 Preferably, the machine translation program causes the computer to execute a second creation step of creating the specialized field feature vector based on a sentence corresponding to each of the specialized dictionary data.
好ましくは、機械翻訳プログラムは、前記第1の作成ステップが、更に、前記翻訳対象文の周辺の文に基づいて、前記翻訳対象特徴ベクトルを作成する。 Preferably, in the machine translation program, the first creation step further creates the translation target feature vector based on a sentence around the translation target sentence.
好ましくは、機械翻訳プログラムは、前記翻訳対象文の前記専門分野のそれぞれへの帰属可能性を視認可能に提供する提供ステップをコンピュータに実行させる。 Preferably, the machine translation program causes the computer to execute a providing step of providing the possibility of belonging to each of the specialized fields of the translation target sentence so as to be visible.
好ましくは、機械翻訳プログラムは、前記提供ステップが、前記翻訳対象文の前記専門分野のそれぞれへの帰属可能性を表すグラフを表示する。 Preferably, in the machine translation program, the providing step displays a graph representing the possibility of the translation target sentence belonging to each of the specialized fields.
本発明によれば、翻訳対象文の翻訳に適した専門辞書データが自動的に選択されるため、簡易に専門辞書データを用いた適切な翻訳が可能となる。 According to the present invention, specialized dictionary data suitable for translation of a translation target sentence is automatically selected, so that appropriate translation using specialized dictionary data can be easily performed.
以下、本発明を実施するための最良の形態を、図面を参照して説明する。 The best mode for carrying out the present invention will be described below with reference to the drawings.
図1は、本発明の実施例に係る機械翻訳装置の構成を示す図である。図1に示す機械翻訳装置100は、特徴ベクトル作成部10、特徴ベクトル作成部20、専門分野ラベル付コーパスデータベース(DB)30、専門分野代表ベクトル群データベース(DB)40、カテゴリ分類器50、表示部52、専門辞書選択部60及び翻訳モジュール70により構成される。
FIG. 1 is a diagram showing a configuration of a machine translation apparatus according to an embodiment of the present invention. A
特徴ベクトル作成部10は、翻訳対象文を入力する。次に、特徴ベクトル作成部10は、この入力した翻訳対象文について、周知の文書解析手法である形態素解析を行い、当該翻訳対象文を単語に分割する。更に、特徴ベクトル作成部10は、単語毎に出現頻度(TF)をカウントする。そして、特徴ベクトル作成部10は、これら単語毎の出現頻度の数値のそれぞれを、その単語に対応する1つの次元の要素として含み、翻訳対象文の特徴を表すベクトル(翻訳対象特徴ベクトル)を作成する。ここで、翻訳対象特徴ベクトルの次元数と各次元に対応する単語とは、予め定められており、後述する専門分野単一特徴ベクトル及び専門分野代表特徴ベクトルと一致する。
The feature
図2は、翻訳対象特徴ベクトル作成の一例を示す図である。特徴ベクトル作成部10は、翻訳対象文「ブッシュ米大統領とニューヨーク市内のホテルで在日米軍の再編問題について会談した。」を入力すると、当該翻訳対象文について形態素解析を行い、単語に分割する。更に、ここでは、特徴ベクトル作成部10は、形態素解析により得た単語のうち名詞のみを抽出する。すなわち、名詞である単語「ブッシュ」、「米」、「大統領」、「ニューヨーク」、「市内」、「ホテル」、「在日」、「米」、「軍」、「再編」、「問題」が抽出される。
FIG. 2 is a diagram illustrating an example of creating a translation target feature vector. When the feature
次に、特徴ベクトル作成部10は、抽出した単語について、出現頻度をカウントする。ここでは、単語「ブッシュ」、「大統領」、「ニューヨーク」、「市内」、「ホテル」、「在日」、「軍」、「再編」、「問題」が各1回ずつ出現しているため、これら単語については「1」とカウントされ、単語「米」が2回出現しているため、この単語については「2」とカウントされる。
Next, the feature
更に、特徴ベクトル作成部10は、単語「ブッシュ」、「大統領」、「ニューヨーク」、「市内」、「ホテル」、「在日」、「軍」、「再編」、「問題」に対応する次元については要素を「1」とし、単語「米」に対応する次元については要素を「2」とするとともに、これら以外の単語、すなわち、翻訳対象文に出現しない単語に対応する次元については要素を「0」とした翻訳対象特徴ベクトルを作成する。
Further, the feature
なお、特徴ベクトル作成部10は、例えば重要であると考えられる単語等の所定の単語については、出現頻度の数値をそのまま翻訳対象特徴ベクトルの要素とするのではなく、出現頻度の数値に所定の重み付け係数を乗じた値を翻訳対象特徴ベクトルの要素とする等、重み付けを行うようにしてもよい。
Note that the feature
また、翻訳対象文とともに、当該翻訳対象文の周辺の文(周辺文)が入力される場合には、特徴ベクトル作成部10は、翻訳対象文と周辺文の双方からなる文集合について、上述と同様の手法によって翻訳対象特徴ベクトルを作成するようにしてもよい。特徴ベクトル作成部10により作成された翻訳対象特徴ベクトルは、カテゴリ分類器50に送られる。
When a sentence around the translation target sentence (peripheral sentence) is input together with the translation target sentence, the feature
一方、特徴ベクトル作成部20は、専門分野ラベル付コーパスDB30から専門分野ラベル付コーパスを読み出す。専門分野ラベル付コーパスは、政治、経済等の専門分野の文(専門分野文)に、その専門分野の識別情報であるラベルを付加したものである。なお、専門分野ラベル付コーパスDB30は、必ずしも機械翻訳装置10の内部に構成される必要はなく、特徴ベクトル作成部20は、業者による情報提供サービスを利用して取得した専門分野ラベル付コーパスを使用するようにしてもよく、インターネットのサイトから専門分野文を収集し、それにラベルを付加したものを専門分野ラベル付コーパスとして使用してもよい。また、後述する辞書データに単語の解説文が含まれているような場合には、特徴ベクトル作成部20は、その解説文を専門分野文として、それにラベルを付加したものを専門分野ラベル付コーパスとして使用してもよい。
On the other hand, the feature
次に、特徴ベクトル作成部20は、上述した特徴ベクトル作成部10による翻訳対象特徴ベクトルの作成と同様、読み出した専門分野ラベル付コーパス内の専門分野文から当該専門分野文の特徴を表すベクトル(専門分野単一特徴ベクトル)を作成する。すなわち、特徴ベクトル作成部20は、専門分野文について形態素解析を行って単語に分割し、各単語について、出現頻度をカウントする。更に、特徴ベクトル作成部10は、これら単語毎の出現頻度の数値のそれぞれを、その単語に対応する1つの次元の要素として含む専門分野単一特徴ベクトルを作成する。特徴ベクトル作成部20は、作成した専門分野単一特徴ベクトルに、その作成に用いた専門分野ラベル付コーパス内のラベルを付加して、内蔵する記憶部(図示せず)に記憶する。
Next, the feature
更に、特徴ベクトル作成部20は、内蔵する記憶部内の専門分野単一特徴ベクトルを用いて、専門分野毎に、その専門分野に対応する専門分野単一特徴ベクトルを代表する専門分野代表特徴ベクトルを作成し、専門分野代表特徴ベクトル群DB40に登録する。
Further, the feature
具体的には、特徴ベクトル作成部20は、内蔵する記憶部内の専門分野単一特徴ベクトルについて、その専門分野単一特徴ベクトル付加されているラベルに基づいて、専門分野毎に分類する。更に、特徴ベクトル作成部20は、所定の専門分野に対応する専門分野単一特徴ベクトルが1つのみ存在する場合には、その1つの専門分野単一特徴ベクトルを、そのまま専門分野代表特徴ベクトルとして、付加されているラベルとともに、専門分野代表特徴ベクトル群DB40に登録する。
Specifically, the feature
一方、特徴ベクトル作成部20は、所定の専門分野に対応する専門分野単一特徴ベクトルが複数存在する場合には、これら複数の専門分野単一特徴ベクトルを代表する専門分野代表特徴ベクトルを作成する。例えば、特徴ベクトル作成部20は、複数の専門分野単一特徴ベクトルの同一次元の要素について平均値を算出し、これら平均値を要素とした専門分野代表特徴ベクトルを作成する。更に、特徴ベクトル作成部20は、作成した専門分野代表特徴ベクトルについて、その作成に用いた専門分野単一特徴ベクトルに付加されているラベルとともに、専門分野代表特徴ベクトル群DB40に登録する。
On the other hand, when there are a plurality of specialized field single feature vectors corresponding to a predetermined specialized field, the feature
カテゴリ分類器50は、特徴ベクトル作成部10からの翻訳対象特徴ベクトルを入力するとともに、専門分野代表特徴ベクトル群DB40に登録された、各専門分野毎の専門分野代表特徴ベクトルと、その専門分野代表特徴ベクトルに対応するラベルとを読み出す。
The
次に、カテゴリ分類器50は、翻訳対象特徴ベクトルと、各専門分野代表特徴ベクトルとに基づいて、翻訳対象文が専門分野のそれぞれに帰属する可能性を推定する。
Next, the
図3は、カテゴリ分類器50の処理の具体例を示す図である。カテゴリ分類器50は、各専門分野毎に、その専門分野に対応する専門分野代表特徴ベクトルを正例とし、その専門分野以外の専門分野に対応する専門分野代表特徴ベクトルを負例とした分類関数を作成する。この分散関数は、翻訳対象特徴ベクトルと、正例として用いた専門分野代表特徴ベクトルとの近似度、換言すれば、翻訳対象文が当該分類関数に対応する専門分野に帰属する可能性を算出するための関数である。図3では、「スポーツ」、「コンピュータ」、「経済」、「政治」、「歴史」及び「科学」の各専門分野について分類関数が作成される。
FIG. 3 is a diagram illustrating a specific example of the processing of the
次に、カテゴリ分類器50は、各分類関数に翻訳対象特徴ベクトルの要素を代入する。カテゴリ分類器50は、この代入の結果、分類関数の値が正であり、その値が大きいほど、翻訳対象文が当該分類関数に対応する専門分野に帰属する可能性(帰属可能性)が高いと判断し、分類関数の値が負であり、その値が小さいほど、翻訳対象文が当該分類関数に対応する専門分野に帰属する可能性が小さいと判断する。
Next, the
次に、カテゴリ分類器50は、分類関数の値に、その分類関数の作成の際に正例として用いた専門分野代表特徴ベクトルに対応するラベルを付加したカテゴリ分類結果を作成する。更に、カテゴリ分類器50は、カテゴリ分類結果に基づいて、翻訳対象文の各専門分野への帰属可能性を表すグラフを表示部52に表示させる。図3では、翻訳対象文が専門分野「経済」、「政治」、「歴史」、「科学」、「コンピュータ」、「スポーツ」の順に帰属可能性が高いことを示すグラフが表されている。また、カテゴリ分類器50は、カテゴリ分類結果を専門辞書選択部60へ出力する。
Next, the
専門辞書選択部60は、カテゴリ分類器50からのカテゴリ分類結果を入力すると、当該カテゴリ分類結果に含まれる分散関数の値とラベルに基づいて、翻訳対象文の各専門分野への帰属可能性を認識する。更に、専門辞書選択部60は、内蔵する記憶部(図示せず)に記憶されている専門分野毎の辞書データ(専門辞書データ)のうち、翻訳対象文が帰属する可能性が高い専門分野に対応する専門辞書データを優先的に選択する。
When the specialized
図3の例では、選択優先度は、翻訳対象文の帰属可能性の高い専門分野に対応する専門辞書データ順、すなわち、専門分野「経済」の専門辞書データ、「政治」の専門辞書データ、「歴史」の専門辞書データ、「科学」の専門辞書データ、「コンピュータ」の専門辞書データ、「スポーツ」の専門辞書データの順となる。従って、専門辞書選択部60は、専門分野「経済」の専門辞書データを最優先に選択する。
In the example of FIG. 3, the selection priority is the order of specialized dictionary data corresponding to the specialized field to which the translation target sentence is highly likely to belong, that is, specialized dictionary data of the specialized field “economics”, specialized dictionary data of “politics”, The order is "history" specialized dictionary data, "science" specialized dictionary data, "computer" specialized dictionary data, and "sports" specialized dictionary data. Therefore, the specialized
なお、専門辞書選択部60は、複数の専門辞書データを選択するようにしてもよい。例えば、専門辞書選択部60は、分散関数の値の閾値を設け、カテゴリ分類結果に含まれる分散関数の値のうち、閾値以上のものを特定し、その特定した分散関数の値に付加されたラベルに対応する専門分野の専門辞書データを選択する。
The specialized
専門辞書選択部60によって選択された専門辞書データは、翻訳モジュール70に送られる。翻訳モジュール70は、入力した専門辞書データを用いて翻訳対象文の翻訳を行う。
The specialized dictionary data selected by the specialized
このように、機械翻訳装置100では、特徴ベクトル作成部10が、翻訳対象文の特徴を表す翻訳対象特徴ベクトルを作成するとともに、特徴ベクトル作成部20が、専門分野文の特徴を表す専門分野特徴ベクトルを作成する。そして、カテゴリ分類器50は、これらに基づいて、分類関数の値に応じた翻訳対象文の各専門分野への帰属可能性を推定し、専門辞書選択部60は、その推定の結果に基づいて、翻訳対象文の翻訳に適した専門辞書データを選択しており、簡易に翻訳対象文に適した辞書データを用いた翻訳が可能となる。また、翻訳対象文の専門分野のそれぞれへの帰属可能性がグラフ表示されるため、利用者は、翻訳対象文がどの専門分野に帰属する可能性があるのかを把握することが可能となり、例えば、専門辞書選択部60により選択された専門辞書データでは適切に翻訳ができなかった場合に、翻訳対象文が帰属する可能性が高い他の専門分野に対応する専門辞書データに選択しなおすといったことも可能となる。
Thus, in the
以上、説明したように、本発明に係る機械翻訳装置、機械翻訳方法及び機械翻訳プログラムは、簡易に専門辞書データを用いた適切な翻訳が可能であり、機械翻訳装置等として有用である。 As described above, the machine translation device, the machine translation method, and the machine translation program according to the present invention can be easily translated appropriately using specialized dictionary data, and are useful as machine translation devices and the like.
100 機械翻訳装置
10、20 特徴ベクトル作成部
30 専門分野ラベル付コーパスデータベース
40 専門分野代表ベクトル群データベース
50 カテゴリ分類器
52 表示部
60 専門辞書選択部
70 翻訳モジュール
DESCRIPTION OF
Claims (15)
翻訳対象文に基づいて、該翻訳対象文の特徴を表す翻訳対象特徴ベクトルを作成する第1の作成手段と、
前記第1の作成手段により作成された翻訳対象特徴ベクトルと、前記第1の保持手段に保持されている各専門分野特徴ベクトルとに基づいて、前記翻訳対象文が前記専門分野のそれぞれに帰属する可能性を推定する推定手段と、
前記翻訳対象文が帰属する可能性が高い専門分野に対応する専門辞書データを優先的に選択する選択手段と、
前記選択手段により選択された専門辞書データを用いて、前記翻訳対象文を翻訳する翻訳手段とを有することを特徴とする機械翻訳装置。 First holding means for holding special field feature vectors representing features of sentences belonging to each of a plurality of special fields;
First creation means for creating a translation target feature vector representing a feature of the translation target sentence based on the translation target sentence;
The translation target sentence belongs to each of the specialized fields based on the translation target feature vector created by the first creating unit and each specialized field feature vector held in the first holding unit. An estimation means for estimating the possibility;
Selection means for preferentially selecting specialized dictionary data corresponding to a specialized field to which the translation target sentence is likely to belong;
A machine translation apparatus comprising translation means for translating the sentence to be translated using the specialized dictionary data selected by the selection means.
前記第1の作成ステップにより作成された翻訳対象特徴ベクトルと、複数の専門分野のそれぞれに帰属する文の特徴を表す各専門分野特徴ベクトルとに基づいて、前記翻訳対象文が前記専門分野のそれぞれに帰属する可能性を推定する推定ステップと、
前記翻訳対象文が帰属する可能性が高い専門分野に対応する専門辞書データを優先的に選択する選択ステップと、
前記選択ステップにより選択された専門辞書データを用いて、前記翻訳対象文を翻訳する翻訳ステップとを有することを特徴とする機械翻訳方法。 A first creation step of creating a translation target feature vector representing a feature of the translation target sentence based on the translation target sentence;
Based on the translation target feature vector created in the first creation step and each specialized field feature vector representing the feature of the sentence belonging to each of a plurality of specialized fields, the translation target sentence is each of the specialized fields. An estimation step for estimating the likelihood of belonging to,
A selection step of preferentially selecting specialized dictionary data corresponding to a specialized field to which the translation target sentence is likely to belong;
A machine translation method comprising: a translation step of translating the sentence to be translated using the specialized dictionary data selected in the selection step.
前記第1の作成ステップにより作成された翻訳対象特徴ベクトルと、複数の専門分野のそれぞれに帰属する文の特徴を表す各専門分野特徴ベクトルとに基づいて、前記翻訳対象文が前記専門分野のそれぞれに帰属する可能性を推定する推定ステップと、
前記翻訳対象文が帰属する可能性が高い専門分野に対応する専門辞書データを優先的に選択する選択ステップと、
前記選択ステップにより選択された専門辞書データを用いて、前記翻訳対象文を翻訳する翻訳ステップとをコンピュータに実行させることを特徴とする機械翻訳プログラム。 A first creation step of creating a translation target feature vector representing a feature of the translation target sentence based on the translation target sentence;
Based on the translation target feature vector created in the first creation step and each specialized field feature vector representing the feature of the sentence belonging to each of a plurality of specialized fields, the translation target sentence is each of the specialized fields. An estimation step for estimating the likelihood of belonging to,
A selection step of preferentially selecting specialized dictionary data corresponding to a specialized field to which the translation target sentence is likely to belong;
A machine translation program that causes a computer to execute a translation step of translating the sentence to be translated using the specialized dictionary data selected in the selection step.
The machine translation program according to claim 14, wherein the providing step displays a graph representing the possibility of belonging to each of the specialized fields of the translation target sentence.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005271041A JP2007080221A (en) | 2005-09-16 | 2005-09-16 | Apparatus, method and program for machine translation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005271041A JP2007080221A (en) | 2005-09-16 | 2005-09-16 | Apparatus, method and program for machine translation |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007080221A true JP2007080221A (en) | 2007-03-29 |
Family
ID=37940433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005271041A Pending JP2007080221A (en) | 2005-09-16 | 2005-09-16 | Apparatus, method and program for machine translation |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007080221A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010020530A (en) * | 2008-07-10 | 2010-01-28 | Asahi Kasei Corp | Document classification providing device, document classification providing method and program |
JP2016045751A (en) * | 2014-08-25 | 2016-04-04 | 日本電気株式会社 | Machine translation device, machine translation method, machine translation program, and recording medium |
JP2016066174A (en) * | 2014-09-24 | 2016-04-28 | 富士ゼロックス株式会社 | Dictionary selection device, document conversion system, program and document conversion method |
-
2005
- 2005-09-16 JP JP2005271041A patent/JP2007080221A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010020530A (en) * | 2008-07-10 | 2010-01-28 | Asahi Kasei Corp | Document classification providing device, document classification providing method and program |
JP2016045751A (en) * | 2014-08-25 | 2016-04-04 | 日本電気株式会社 | Machine translation device, machine translation method, machine translation program, and recording medium |
JP2016066174A (en) * | 2014-09-24 | 2016-04-28 | 富士ゼロックス株式会社 | Dictionary selection device, document conversion system, program and document conversion method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007226729A (en) | Translation word information output processing program, processing method, and processing apparatus | |
JP2009075791A (en) | Device, method, program, and system for machine translation | |
JP2008077163A (en) | Search system, search method and search program | |
JP2007334534A (en) | Apparatus and method for inputting character string, and program | |
US7684975B2 (en) | Morphological analyzer, natural language processor, morphological analysis method and program | |
JP2005301856A (en) | Method and program for document retrieval, and document retrieving device executing the same | |
JP2007080221A (en) | Apparatus, method and program for machine translation | |
JP5121872B2 (en) | Image search device | |
JP2020004217A (en) | Information display method, information display program and information display apparatus | |
JP2007199966A (en) | Document classification device, document classification method, and document classification program | |
JP2009151390A (en) | Information analyzing device and information analyzing program | |
JP2010198278A (en) | Apparatus, method, and program for classification of reputation information | |
CN108491423B (en) | Sorting method and device | |
JP2001022727A (en) | Method and device for classifying and learning text and storage medium storing text classifying and learning program | |
JP2004246491A (en) | Text mining system and text mining program | |
JP6181890B2 (en) | Literature analysis apparatus, literature analysis method and program | |
JP2008129662A (en) | Device, method and program for extracting information | |
JP2007156932A (en) | Learning method, learning device, search method, and search device | |
JP2019125025A (en) | System, method for managing document data, and program | |
JP2004334699A (en) | Text evaluation device, text evaluation method, program, and storage medium | |
JP2007148630A (en) | Patent analyzing device, patent analyzing system, patent analyzing method and program | |
JP2003345824A (en) | Device, method, and program for document retrieval | |
JP2007011892A (en) | Vocabulary acquisition method and device, program, and storage medium storing program | |
JP2004133510A (en) | Technical literature retrieval system | |
JP2005346560A (en) | Retrieval result presenting method and device and storage medium having retrieval result presenting program stored therein |