JP6459300B2 - 機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体 - Google Patents

機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体 Download PDF

Info

Publication number
JP6459300B2
JP6459300B2 JP2014170082A JP2014170082A JP6459300B2 JP 6459300 B2 JP6459300 B2 JP 6459300B2 JP 2014170082 A JP2014170082 A JP 2014170082A JP 2014170082 A JP2014170082 A JP 2014170082A JP 6459300 B2 JP6459300 B2 JP 6459300B2
Authority
JP
Japan
Prior art keywords
translation
field
dictionary
condition
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014170082A
Other languages
English (en)
Other versions
JP2016045751A (ja
Inventor
貢 三浦
貢 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014170082A priority Critical patent/JP6459300B2/ja
Publication of JP2016045751A publication Critical patent/JP2016045751A/ja
Application granted granted Critical
Publication of JP6459300B2 publication Critical patent/JP6459300B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、翻訳対象文章の分野を推定する機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体に関する。
ある特定の自然言語で書かれた文章を他の自然言語へ翻訳する際、人手による翻訳ではなく、コンピュータを用いて機械的に翻訳を行う機械翻訳が広く使用されている。
この機械翻訳の翻訳精度を向上させる方法の一つに、分野辞書を使用する方法がある。分野辞書は、翻訳対象となる文章が特定の分野について記載されている場合に、訳語を制御するための辞書データを蓄積したものである。たとえば、英語の「court」を日本語へ翻訳する場合、「コート」や「裁判所」など複数の訳語が該当するが、翻訳対象文章の分野が未知の場合には、それらの訳語の中でどれが適切かを決定することができない。しかし、翻訳対象となる文章が「法律」に関するものならば「裁判所」、「スポーツ」に関するものならば「コート」と訳すのが順当である。このような、分野による訳語の制御を行うための辞書データを蓄積したものが、分野辞書である。分野辞書を使用することで、翻訳対象の文章の訳語を分野に応じて適切に選択することが可能になる。
使用する分野辞書を選択する方法については、あらかじめ翻訳対象文章の分野がわかっている場合には、人手で分野を設定して使用する分野辞書を選択する方法が単純である。一方、翻訳対象文章の分野が事前にわかっていない場合や翻訳対象文章が多く存在して人手による分野設定に手間がかかる場合には、機械翻訳時に自動的に分野を推定することができれば便利である。しかし、誤って分野を推定して、本来の翻訳対象文章の分野以外の分野辞書を選択してしまうと、一斉に誤った訳語へ翻訳し、著しく翻訳精度が低下してしまう。
このような問題を解決するための方法で代表的なものに、ベクトル演算を用いて翻訳対象文章の分野を推定する方法がある。たとえば特許文献1には、翻訳対象文章の単語ごとの出現頻度を一つの次元の要素とする多次元特徴ベクトルと各分野の代表特徴ベクトルとの近似度を計算する方法が記載されている。2つのベクトルの近似度の計算には、一般的に、コサイン類似度が使用されることが多い。コサイン類似度とは、2つのベクトルのなす角が小さいほど類似度が高いとする方法である。ベクトルxとベクトルyのなす角θの余弦は、式(1)のように、xとyの内積をxとyの長さ(ノルム)で割ることによって得られる。
Figure 0006459300
また、特許文献2では、翻訳対象文章に含まれる単語の各分野辞書での出現頻度情報を用いている。
特開2007-080221号公報 特開2001-005812号公報
しかし、特許文献1の方法では、特徴ベクトルの要素となる単語数の次元をもつベクトルの近似度を各分野について計算するため、計算量が非常に多く、翻訳速度が遅い。たとえば、近似度としてコサイン類似度を使用する場合、特徴ベクトルの要素となる単語数と分野数を掛けた回数の乗算が必要となる。さらに分野の数が増加したり特徴ベクトルの要素となる単語数が増加したりすると、計算量が増加してしまう。また、翻訳対象文章の単語数が少ない場合は、推定の精度が低下しやすい。
特許文献2の方法では、分野辞書ごとに翻訳対象文章に含まれる単語の出現頻度を求めているため、異なる訳語を持つ単語が異なる分野辞書に多く含まれている場合に推定の精度が低下しやすい。また、翻訳対象文章の単語数が少ない場合にはさらに推定の精度が低下しやすい。
本発明の目的は、翻訳対象文章の翻訳に使用する分野辞書の選択を、高速かつ精度良く行う機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体を提供することにある。
上述の問題を解決するために、本発明の機械翻訳装置は、翻訳条件と分野との対応関係を示す分野対応情報を記憶する分野対応情報記憶部と、前記分野に応じた訳語を保持する複数の分野辞書を記憶する辞書記憶部と、翻訳対象文章内の所定の単位記載と合致する前記翻訳条件と前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定部とを備えることを特徴とする。
また、本発明の機械翻訳装置は、訳語と分野との対応関係を示す分野対応情報を記憶する分野対応情報記憶部と、前記分野に応じた前記訳語を保持する複数の分野辞書を記憶する辞書記憶部と、翻訳条件と前記翻訳条件に対応する前記訳語とを含む前記翻訳規則を記憶する翻訳規則記憶部と、翻訳対象文章内の所定の単位記載と合致する前記翻訳条件に対応する前記訳語と前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定部とを備えることを特徴とする。
また、本発明の機械翻訳方法は、翻訳対象文章内の所定の単位記載と合致する翻訳条件と、前記翻訳条件と分野との対応関係を示す分野対応情報に基づいて、前記分野に応じた訳語を保持する複数の分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定することを特徴とする。
また、本発明の機械翻訳方法は、翻訳条件と前記翻訳条件に対応する訳語とを含む翻訳規則と、翻訳対象文章内の所定の単位記載と合致する前記翻訳条件に対応する前記訳語と分野との対応関係を示す分野対応情報とに基づいて、前記分野に応じた前記訳語を保持する複数の分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定することを特徴とする。
また、本発明の機械翻訳プログラムは、コンピュータに、翻訳条件と分野との対応関係を示す分野対応情報を記憶する分野対応情報記憶機能と、前記分野に応じた訳語を保持する複数の分野辞書を記憶する辞書記憶機能と、翻訳対象文章内の所定の単位記載と合致する前記翻訳条件と前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定機能とを実現させる。
また、本発明の機械翻訳プログラムは、コンピュータに、訳語と分野との対応関係を示す分野対応情報を記憶する分野対応情報記憶機能と、前記分野に応じた前記訳語を保持する複数の分野辞書を記憶する辞書記憶機能と、翻訳条件と前記翻訳条件に対応する前記訳語とを含む前記翻訳規則を記憶する翻訳規則記憶機能と、翻訳対象文章内の所定の単位記載と合致する前記翻訳条件に対応する前記訳語と前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定機能とを実現させる。
本発明の機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体により、翻訳対象文章の翻訳に使用する分野辞書の選択を、高速かつ精度良く行うことが可能になる。
本発明の実施形態の機械翻訳装置の構成例を示す図である。 本発明の実施形態の動作例を示す図である。 本発明の実施形態の機械翻訳装置の他の構成例を示す図である。 本発明の実施形態の他の動作例を示す図である。 辞書記憶部のデータ例を示す図である。 翻訳規則のデータ例を示す図である。 分野対応情報のデータ例を示す図である。 本発明の第二の実施形態の機械翻訳装置の構成例を示す図である。 本発明の第二の実施形態の動作例を示す図である。 分野分類木の作成例を示す図である。 本発明の第四の実施形態の分野対応情報のデータ例を示す図である。 本発明の実施形態の機械翻訳装置の他の構成例を示す図である。 本発明の実施形態の機械翻訳装置の他の構成例を示す図である。
図1に本発明の実施形態の機械翻訳装置の構成例を示す。
機械翻訳装置1は、辞書記憶部11、分野対応情報記憶部12および辞書決定部13から構成される。辞書記憶部11は、複数の分野辞書を記憶した部分である。分野辞書は、翻訳対象となる文章が特定の分野について記載されている場合に、訳語を制御するための辞書データを蓄積したものである。分野対応情報記憶部12は、翻訳規則の条件部(翻訳条件)と分野の対応関係を示す分野対応情報を記憶する部分である。辞書決定部13は、翻訳対象文章2と分野対応情報記憶部12の翻訳条件を比較し、翻訳対象文章2内で合致した翻訳条件と分野対応情報に基づいて、辞書記憶部11の複数の分野辞書から、翻訳対象文章2の翻訳に使用する分野辞書を決定する部分である。
上記のように機械翻訳装置1を構成することによって、翻訳対象文章の翻訳に使用する分野辞書の選択を、高速かつ精度良く行うことが可能になる。
次に、図1の構成における機械翻訳装置1の辞書決定部13の動作の例を図2に示す。
まず、翻訳対象文章2と分野対応情報記憶部12に記憶されている翻訳条件を比較する(S101)。次に、翻訳対象文章2内で合致する翻訳条件と分野対応情報記憶部12の分野対応情報に基づいて、翻訳対象文章2の翻訳に使用する分野辞書を決定する(S102)。
上記のように機械翻訳装置1を動作させることによって、翻訳対象文章の翻訳に使用する分野辞書の選択を、高速かつ精度良く行うことが可能になる。
また、図3に、本発明の実施形態の機械翻訳装置の他の構成例を示す。
図3では、図1に対して、翻訳規則記憶部13を追加している。翻訳規則記憶部13は、翻訳規則の条件(翻訳条件)とその翻訳条件に対応する訳語を含む翻訳規則を記憶する部分である。辞書記憶部11は図1の説明と同様である。分野対応情報記憶部12は、上述の翻訳条件と分野の対応関係ではなく、訳語と分野の対応関係を示す分野対応情報を記憶する部分である。辞書決定部13は、翻訳対象文章2と翻訳規則記憶部13の翻訳条件を比較し、翻訳対象文章2内で合致した翻訳条件に対応する訳語と分野対応情報に基づいて、辞書記憶部11の分野辞書から、翻訳対象文章2の翻訳に使用する分野辞書を決定する部分である。
上記のように機械翻訳装置1を構成することによって、翻訳対象文章の翻訳に使用する分野辞書の選択を、高速かつ精度良く行うことが可能になる。
次に、図3の構成における機械翻訳装置1の辞書決定部13の動作の例を図4に示す。
まず、翻訳対象文章2と翻訳規則記憶部13に記憶されている翻訳条件を比較する(S201)。次に、翻訳対象文章2内で合致する翻訳条件に対応する訳語と分野対応情報記憶部12の分野対応情報に基づいて、翻訳対象文章2の翻訳に使用する分野辞書を決定する(S202)。
上記のように機械翻訳装置1を動作させることによって、翻訳対象文章の翻訳に使用する分野辞書の選択を、高速かつ精度良く行うことが可能になる。
次に、本発明の第一の実施の形態について、具体例を用いて説明する。
まず、構成例は図1と同様である。
辞書記憶部11のデータ例を図5に示す。図5では、「法律」「テニス」「バスケット」の分野辞書それぞれに、2つ、2つ、3つの辞書データが保持されている。この分野辞書を用いると、たとえば、英語の「court」は、「法律」の分野辞書が選択された場合には「法廷」あるいは「裁判所」、「テニス」の分野辞書が選択された場合には「コート」と翻訳されることになる。
なお、分野辞書の保持形式については、図5では、分野ごとに辞書データ(原語訳語ペア)を保持しているが、辞書データ単位に分野情報が付与される形式の分野辞書を使用しても構わない。
次に、分野対応情報記憶部12の説明のために、まず、翻訳規則について説明する。翻訳規則のデータ例を図6に示す。翻訳規則は条件部(翻訳条件)とアクション部から構成され、翻訳対象文章に条件部に合致する部分があった場合に、アクション部の動作を行うことを意味している。図6の場合、2つの翻訳規則が保持されており、それぞれの条件部は「隣接(federal、court)」と「共起(cager、traveling)」である。本実施形態では、「隣接(federal、court)」は「federal」と「court」が翻訳対象文書内に隣接して存在している場合、「共起(cager、traveling)」は「cager」と「traveling」の両方が翻訳対象文書内に存在する場合を意味する。なお、「共起」の判断基準については種々の手法が考えられるため、その手法を適用することも可能である。たとえば、条件部で指定した単語の間の文字数や単語数が所定の数以内である場合、あるいは、指定した単語が翻訳対象文章内に同時にそれぞれ所定の数以上存在する場合を「共起」と判断することも可能である。図6の翻訳規則では、「隣接(federal、court)」を適用する場合、その部分の「federal」を「連邦」、「court」を「裁判所」と翻訳し、また、「共起(cager、traveling)」を適用する場合は、「traveling」を「トラベリング」と翻訳する。
分野対応情報記憶部12の例を図7に示す。この例では、翻訳規則の条件部(翻訳条件)と分野を関連付けたデータを保持しており、「隣接(federal、court)」の翻訳条件には「法律」が、「共起(cager、traveling)」の翻訳条件には「バスケット」が関連付けられている。図7では、1つの翻訳条件に1つの分野を関連付けているが、1つの翻訳条件に対して複数の分野を関連付けることも可能である。
次に、辞書決定部13の動作について説明する。辞書決定部13では、図2のとおり、まず、翻訳対象文章2と分野対応情報記憶部12に記憶されている翻訳条件を比較する(S101)。次に、翻訳対象文章2内で合致する翻訳条件と分野対応情報記憶部12の分野対応情報に基づいて、翻訳対象文章2の翻訳に使用する分野辞書を決定する(S102)。なお、図3のように、図1に対して翻訳規則記憶部13を追加し、図2のS101において、翻訳対象文章2と翻訳規則記憶部13に記憶されている翻訳条件を比較しても、同じ結果が得られる。
簡単のため、図7の分野対応情報のうち「隣接(federal、court)」の翻訳条件のみが翻訳対象文章2内で合致した場合を例に挙げる。このとき、図7の分野対応情報を参照すると、「隣接(federal、court)」の翻訳規則には「法律」分野が関連付けられている。そのため、翻訳対象文章の分野は「法律」であると推定することができる。このように、翻訳対象文章2内で合致した翻訳条件が関連付けられている分野を分野対応情報記憶部12の分野対応情報で調べることにより、分野を推定することが可能になる。このようにして推定した分野の分野辞書を、翻訳対象文章2の翻訳に使用する分野辞書として決定する。
複数の翻訳規則が合致したときの辞書決定方法としては、合致した翻訳条件に関連付けられている分野を分野対応情報記憶部12で調べ、合致した翻訳条件の合致回数から各分野に対する適合度を計算し、適合度が大きい分野を推定分野とする方法が考えられる。適合度の計算には、合致した翻訳条件の合致回数に基づき、合致回数が大きくなると適合度も大きくなる関数であれば、どのような関数を使用しても良い。
例として、各翻訳条件の合致回数に関する一次関数を適合度の計算に使用する場合について説明する。分野対応情報記憶部12に登録されている翻訳条件の数をa、分野の数をbとする。そして、i番目の翻訳条件(1≦i≦a)とj番目の分野(1≦j≦b)の間の重み係数をm(i,j)(m(i,j)≧0)としてあらかじめ決めて、分野対応情報記憶部12等に保持しておく。分野対応情報記憶部12にて関連付けられていない翻訳条件と分野の間の重み係数は0とする。このとき、i番目の翻訳条件の合致回数をxiとすると、適合度は、たとえば、式(2)のような各翻訳条件の合致回数に関する一次関数で計算することができる。
Figure 0006459300
この式(2)の関数を適合度の計算に使用する場合、乗算回数は、分野対応情報記憶部12に登録されている翻訳条件の数と分野数との積(a×b回)となる。しかし、関連付けられていない翻訳条件と分野の間の重み係数は0のため、合致した翻訳条件に関連付けられている分野を分野対応情報記憶部12で調べ、関連付けられていない分野についての乗算(重み係数が0の乗算)を行わないことができる。このようにすることで、乗算回数を減らすことができる。たとえば、図7の分野対応情報のように、各翻訳条件に対して関連付けられている分野が1つの場合、乗算回数は合致した翻訳条件の数(最大a回)となる。翻訳対象文章と分野辞書の特徴ベクトルのコサイン類似度を使用する方法では、特徴ベクトルの要素となる単語数(c)と分野数(b)を掛けた回数(c×b回)の乗算を行う。本実施形態の方法では、特徴ベクトルの要素となる単語数より分野対応情報の翻訳条件の数を小さくすることで、乗算回数を減らすことができる。また、分野対応情報の各翻訳条件に関連付けられている分野数が小さくなれば、さらに乗算回数を減らすことができる。
さらに、式(2)において、各翻訳条件に関連付けられている分野の重み係数をすべて1とすることも可能である。このとき、適合度は、各分野に関連付けられた翻訳条件の合致回数の合計となる。このようにすると、分野ごとに、翻訳条件の合致回数を数えて合計するだけになり、乗算回数が0回になるため、特徴ベクトルのコサイン類似度を計算する方法よりも、大幅に計算量を減らすことができる。
たとえば、図7の分野対応情報の場合、翻訳条件「隣接(federal、court)」の「法律」分野、および、翻訳条件「共起(cager、traveling)」の「バスケット」分野の重み係数を1、それ以外の重み係数を0とする。そして、「隣接(federal、court)」の翻訳条件の合致回数が10回、「共起(cager、traveling)」の翻訳条件の合致回数が3回であったとすると、「法律」分野の適合度は10、「バスケット」分野の適合度は3と計算される。その結果、適合度がより大きい「法律」を翻訳対象文章の分野として推定することになる。また、「隣接(federal、court)」の「法律」分野の重み係数を1、「共起(cager、traveling)」の「バスケット」分野の重み係数を5とすると、「法律」分野の適合度は10、「バスケット」分野の適合度は15となる。その結果、適合度がより大きい「法律」を翻訳対象文章の分野として推定することになる。
なお、翻訳条件の合致回数は、各翻訳条件に合致すると判断した回数とする。本実施形態の場合、「隣接」を条件とする翻訳規則の場合の合致回数は、指定された単語が隣り合って存在した回数となる。「共起」を条件とする翻訳条件の場合の合致回数は、指定された単語の翻訳対象文書内での出現回数の合計となる。
また、翻訳対象文章の推定分野を1つに絞るのではなく、複数の分野を同時に適用し、複数の分野辞書を同時に翻訳時に利用することも可能である。
以上で説明したように、本発明の第一の実施形態では、合致した翻訳条件に対応付けられた分野を分野対応情報で調べて数えるため、特徴ベクトルのコサイン類似度を計算する方法に比べて計算量を少なくでき、分野推定の時間を短縮することが可能になる。また、翻訳対象文章の単語数が少なくても条件が合致する翻訳条件があれば分野を推定することができる。そのため、翻訳対象文章の翻訳に使用する分野辞書の選択を、高速かつ精度良く行うことが可能になる。
なお、決定された分野辞書の訳語と翻訳規則の訳語が異なる場合もあり得る。このような場合の競合関係の処理方法としては、合致回数が多い翻訳条件については翻訳規則の訳語を優先して翻訳する、あるいは、競合する規則を除いて再度分野推定を行う、などの方法が考えられる。しかし、競合解消は、本発明の中核技術ではなく、特に解消手段を確定させる必要はないため、その手法は確定させていない。
次に、本発明の第二の実施の形態について説明する。
本発明の第二の実施形態の構成例を図8に示す。図1に対して、分野辞書管理部15と翻訳規則記憶部13を追加している。翻訳規則記憶部13は、翻訳規則を記憶する部分である。分野辞書管理部15は、翻訳規則記憶部13の翻訳規則と辞書記憶部11の分野辞書とから分野対応情報を生成し、分野対応情報記憶部12に記憶させる部分である。
次に、分野辞書管理部15の動作の例について図9を用いて説明する。
まず、辞書記憶部11の分野辞書から分野分類木を作成する(S301)。分野分類木は、辞書データ(原語訳語ペア)から分野を推定するための条件木である。分野分類木の作成例を図10に示す。分野単位に保持された辞書データを、辞書データに対して分野を関連付ける形式に変換している。
次に、分野分類木から辞書データを一つずつ取り出し、辞書データが翻訳規則記憶部14のアクション部にあるかどうかを確認する(S302〜303)。ある場合には、翻訳条件と分野を連結して、分野対応情報記憶部に登録する(S304〜S306)。これを未確認の翻訳規則がなくなるまで繰り返し(S307)、未確認の翻訳規則がなくなれば、新たな辞書データを一つ取り出す(S302)。そして、S302〜S307のステップを、未確認の辞書データがなくなるまで繰り返す(S308)。
図10の分野分類木の場合、図6の翻訳規則記憶部14の翻訳規則のアクション部に存在する辞書データが見つかるまで、分野分類木から辞書データを取り出していく。「court → 法廷、裁判所」が翻訳規則記憶部14に存在するので、この翻訳規則「隣接(federal、court)」と分野「法律」を連結して分野対応情報記憶部12に登録する。同様に、「traveling → トラベリング」が翻訳規則記憶部14に存在するので、この翻訳規則「共起(cager、traveling)」と「バスケット」を連結して分野対応情報記憶部12に登録する。このようにして、図7の分野対応情報を得ることができる。
ここで、分野辞書管理部15での分野対応情報記憶部12の生成は、翻訳対象文書2が入力された時点で行っても良いが、翻訳対象文書2が入力される以前にあらかじめ生成してデータを保持しておくことで、分野推定にかかる時間を短くすることができる。
以上で説明したように、分野辞書管理部15では、翻訳規則記憶部14の翻訳規則と辞書記憶部11の分野辞書から、翻訳条件と分野を関連付けた分野対応情報を生成することができる。この分野辞書管理部15で生成した分野対応情報を用いることで、第一の実施形態で説明した、辞書決定部13での分野推定を行うことが可能になる。これにより、第一の実施形態と同様に、合致した翻訳条件に対応付けられた分野を分野対応情報で調べて数えるため、ベクトル演算を行う方法に比べて計算量を少なくでき、分野推定の時間を短縮することが可能になる。また、翻訳対象文章の単語数が少なくても合致する翻訳条件があれば分野を推定することができる。そのため、第二の実施形態においても、翻訳対象文章の翻訳に使用する分野辞書の選択を、高速かつ精度良く行うことが可能になる。
次に、本発明の第三の実施形態について説明する。
第一および第二の実施形態では、分野対応情報として、翻訳条件と分野を関連付けたデータ(たとえば図7)を使用したが、第三の実施形態では、辞書データ(原語訳語ペア)と分野を関連付けたデータを使用する。
第三の実施形態の分野対応情報は、第二の実施形態で説明した分野分類木の生成方法と同様に、辞書記憶部11の分野辞書を辞書データに対して分野を関連付ける形式に変換することで生成することができる。たとえば、図10のような分野分類木を分野対応情報として使用することができる。また、さらに、分野分類木の辞書データを、翻訳規則記憶部14の翻訳規則のアクション部に存在するもののみに削減することも可能である。
次に、第三の実施形態における分野推定方法について説明する。第三の実施形態の分野推定方法では、第一および第二の実施形態で使用した翻訳条件の合致回数の代わりに、翻訳規則のアクション部で訳出する辞書データ(原語訳語ペア)の訳出回数を使用する。翻訳条件の合致回数の代わりに辞書データの訳出回数を使用する点以外は、第一および第二の実施形態と同様の方法で分野推定を行うことができる。辞書データの訳出回数は、ある辞書データに対応する翻訳条件の合致回数を合計することで得られる。仮に、ある辞書データに対応する翻訳条件が一つである場合は、辞書データの訳出回数と、その辞書データに対応する翻訳条件の合致回数は同じになる。
式(2)で例に挙げた適合度についても、翻訳条件の代わりに辞書データを使用して計算することができる。つまり、分野対応情報記憶部12に登録されている辞書データの数をa、分野の数をb、i番目の辞書データ(1≦i≦a)とj番目の分野(1≦j≦b)の間の重み係数をm(i,j)(m(i,j)≧0)、i番目の辞書データの訳出回数をxiとして、適合度を計算することができる。
たとえば、図6の翻訳規則のうち「隣接(federal、court)」の翻訳規則の条件部が翻訳対象文章2内で合致したとする。この翻訳規則のアクション部は「訳出(federal → 連邦)」「訳出(court → 裁判所)」となっている。このアクション部の辞書データを図10の分野分類木で確認すると、「court → 裁判所」が「法律」と対応している。式(2)において、対応関係がある辞書データと分野の間の重み係数をたとえば1として適合度を計算すると、「法律」分野の適合度が1、それ以外の分野の適合度が0となる。その結果、「法律」分野を翻訳対象文章2の分野として推定することができる。
以上で説明したように、第三の実施形態では、第一および第二の実施形態における翻訳条件の合致回数の代わりに辞書データの訳出回数を用いることで、第一および第二の実施形態と同様に、分野推定を行うことが可能になる。そのため、第三の実施形態においても、翻訳対象文章の翻訳に使用する分野辞書の選択を、高速かつ精度良く行うことが可能になる。
次に、本発明の第四の実施形態について説明する。
第四の実施形態では、分野対応情報として、翻訳規則のアクション部で訳出した辞書データの訳出回数を入力すると各分野の適合度を出力するニューラルネットワークの発火条件データを使用する。
分野辞書管理部15では、辞書記憶部11の分野辞書から発火条件データの生成を行う。まず、第二の実施形態と同様に、分野辞書から分野分類木を作成する。そして、作成した分野分類木を使用して、辞書データ(原語訳語ペア)と分野とのつながりをニューロン結合としたニューラルネットワークを構成する。図10の分野分類木から得られるニューラルネットワークの例を図11に示す。辞書データの訳出回数を入力すると、決められた発火条件に従って発火が行われ、各分野の適合度が出力されることを示している。m(i,j)は、i番目の辞書データとj番目の分野との間の重み係数である。辞書データの訳出回数と重み係数を掛けたものの総和が、あらかじめ決められている閾値を超えたときに発火したとみなされる。発火すると、辞書データの訳出回数と重み係数を掛けたものの総和が、適合度として出力される。ここで、たとえば、発火条件の閾値を0とすると、適合度は、第三の実施形態の式(2)を計算していることになる。このようにして得られたニューラルネットワークの、辞書データの訳出回数と各分野の適応度の関係を示す発火条件データを分野対応情報記憶部12として保持する。
辞書決定部13では、分野対応情報記憶部12に記憶された発火条件データを使用して、分野推定を行う。発火条件データからニューラルネットワークを構成し、翻訳対象文章2に適用された辞書データの訳出回数をニューラルネットワークに入力することで各分野への適合度を計算し、翻訳対象文章2の分野を推定することができる。たとえば、図6の翻訳規則のうち「隣接(federal、court)」が適用されたとする。この翻訳規則のアクション部は「訳出(federal → 連邦)」「訳出(court → 裁判所)」となっている。このアクション部の辞書データを図11のニューラルネットワークに入力すると、「court → 裁判所」が「法律」と関連しているため、「法律」が分野として推定されることになる。
以上で説明したように、第四の実施形態では、第三の実施形態の訳出回数に関する一次関数(式(2))と同様の適合度の計算を、ニューラルネットワークを使用して行うことができる。また、ここまでの説明では、辞書データの訳出回数から各分野の適合度を導く方法について記載したが、辞書データを翻訳条件に置き換えることで、第一および第二の実施形態と同様に、翻訳条件の合致回数から各分野の適合度を計算することも可能である。
以上で説明したように、第四の実施形態においても、第一、第二および第三の実施形態と同様に、翻訳条件の合致回数から分野を推定することができ、翻訳対象文章の翻訳に使用する分野辞書の選択を、高速かつ精度良く行うことが可能になる。
以上で翻訳対象文章の分野を推定して分野辞書を決定する機械翻訳装置について説明したが、図12のように、翻訳部16を追加して、決定された分野辞書に従って翻訳を行うことが可能である。また、さらに、図13のように。通信部17を追加して、翻訳対象文章2をネットワーク上で入力して、翻訳結果3を通信経由で返信するようにすることも可能である。さらに、機械翻訳装置の各部をネットワーク上に分散配置して使用できるようにすることも可能である。
また、所定の単語の「隣接」及び「共起」を翻訳条件の例として説明したが、単語だけでなく、文章の「隣接」あるいは「共起」等を翻訳条件としてもよい。ここで、前述の単語や文章を単位記載とも呼ぶ。
また、本発明の機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体は、自然言語の翻訳だけでなく、漢字仮名変換や文章への分野タグの自動付与などへ応用することも可能である。
なお、上述する各実施の形態は、本発明の好適な実施の形態であり、本発明の要旨を逸脱しない範囲内において種々変更実施が可能である。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
翻訳条件と分野との対応関係を示す分野対応情報を記憶する分野対応情報記憶部と、
前記分野に応じた訳語を保持する複数の分野辞書を記憶する辞書記憶部と、
翻訳対象文章内の所定の単位記載と合致する前記翻訳条件と前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定部と
を備えることを特徴とする機械翻訳装置。
(付記2)
前記辞書決定部は、さらに、前記翻訳条件の前記翻訳対象文章内での合致回数と前記分野との前記対応関係に基づいて、前記分野ごとの適合度を計算し、前記適合度が大きい前記分野に対応する前記分野辞書を前記翻訳対象文章の翻訳に使用する前記分野辞書として決定する
ことを特徴とする付記1に記載の機械翻訳装置。
(付記3)
前記機械翻訳装置は、さらに、
前記翻訳条件と前記翻訳条件に対応する前記訳語とを含む翻訳規則を記憶する翻訳規則記憶部と、
前記翻訳規則と前記分野辞書とから前記分野対応情報を生成する分野辞書管理部と
を備え、
前記辞書決定部は、さらに、前記分野対応情報を用いて、前記翻訳対象文章内の所定の前記単位記載と合致した前記翻訳条件に対応する前記分野を調べて前記適合度を計算し、
前記適合度は、前記分野に対応する前記翻訳条件の前記合致回数の増加に従って大きくなる
ことを特徴とする付記2に記載の機械翻訳装置。
(付記4)
前記適合度は、さらに、前記翻訳条件の前記合致回数に関する一次関数を計算することによって得られる
ことを特徴とする付記3に記載の機械翻訳装置。
(付記5)
前記適合度は、さらに、前記翻訳条件と前記分野との間の重み係数と、前記翻訳条件の前記合致回数とを乗算したものを、前記分野ごとに合計して計算され、
前記重み係数は、0以上の実数値であり、対応付けられていない前記翻訳条件と前記分野との間の重み係数は0、対応付けられている前記翻訳条件と前記分野との間の重み係数は0より大きい
ことを特徴とする付記4に記載の機械翻訳装置。
(付記6)
対応付けられている前記翻訳条件と前記分野との間の重み係数は1である
ことを特徴とする付記5に記載の機械翻訳装置。
(付記7)
前記分野辞書管理部は、さらに、前記適合度の計算方法をニューラルネットワークの発火条件とした前記発火条件を前記分野対応情報とし、
前記辞書決定部は、さらに、前記翻訳条件の前記合致回数を前記発火条件のニューラルネットワークに入力して前記適合度を計算する
ことを特徴とする付記4から付記6に記載の機械翻訳装置。
(付記8)
訳語と分野との対応関係を示す分野対応情報を記憶する分野対応情報記憶部と、
前記分野に応じた前記訳語を保持する複数の分野辞書を記憶する辞書記憶部と、
翻訳条件と前記翻訳条件に対応する前記訳語とを含む前記翻訳規則を記憶する翻訳規則記憶部と、
翻訳対象文章内の所定の単位記載と合致する前記翻訳条件に対応する前記訳語と前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定部と
を備えることを特徴とする機械翻訳装置。
(付記9)
前記辞書決定部は、さらに、前記翻訳条件が前記翻訳対象文章内で合致した前記翻訳規則で訳出する前記訳語の訳出回数と前記分野との前記対応関係に基づいて、前記分野ごとの適合度を計算し、前記適合度が大きい前記分野に対応する前記分野辞書を前記翻訳対象文章の翻訳に使用する前記分野辞書として決定する
ことを特徴とする付記8に記載の機械翻訳装置。
(付記10)
前記機械翻訳装置は、さらに、
前記分野辞書から前記分野対応情報を生成する分野辞書管理部
を備え、
前記辞書決定部は、さらに、前記分野対応情報を用いて、前記翻訳条件が前記翻訳対象文章内で合致した前記翻訳規則で訳出する前記訳語に対応する前記分野を調べて前記適合度を計算し、
前記適合度は、前記分野に対応する前記訳語の前記訳出回数の増加に従って大きくなる
ことを特徴とする付記9に記載の機械翻訳装置。
(付記11)
前記適合度は、さらに、前記訳語の前記訳出回数に関する一次関数を計算することによって得られる
ことを特徴とする付記10に記載の機械翻訳装置。
(付記12)
前記適合度は、さらに、前記訳語と前記分野との間の重み係数と、前記訳語の前記訳出回数とを乗算したものを、前記分野ごとに合計して計算され、
前記重み係数は、0以上の実数値であり、対応付けられていない前記訳語と前記分野との間の重み係数は0、対応付けられている前記訳語と前記分野との間の重み係数は0より大きい
ことを特徴とする付記11に記載の機械翻訳装置。
(付記13)
対応付けられている前記訳語と前記分野との間の重み係数は1である
ことを特徴とする付記12に記載の機械翻訳装置。
(付記14)
前記分野辞書管理部は、さらに、前記適合度の計算方法をニューラルネットワークの発火条件とした前記発火条件を前記分野対応情報とし、
前記辞書決定部は、さらに、前記訳語の前記訳出回数を前記発火条件のニューラルネットワークに入力して前記適合度を計算する
ことを特徴とする付記11から付記13に記載の機械翻訳装置。
(付記15)
前記機械翻訳装置は、さらに、
前記辞書決定部で決定された前記翻訳対象文章の翻訳に使用する前記分野辞書を使用して翻訳を行う翻訳部
を備えることを特徴とする付記1から付記14に記載の機械翻訳装置。
(付記16)
前記機械翻訳装置は、さらに、
前記翻訳対象文章をネットワーク経由で受信し、翻訳結果を返信するデータ通信部
を備えることを特徴とする付記15に記載の機械翻訳装置。
(付記17)
翻訳対象文章内の所定の単位記載と合致する翻訳条件と、前記翻訳条件と分野との対応関係を示す分野対応情報に基づいて、前記分野に応じた訳語を保持する複数の分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する
ことを特徴とする機械翻訳方法。
(付記18)
前記機械翻訳方法は、さらに、
前記翻訳条件の前記翻訳対象文章内での合致回数と前記分野との前記対応関係に基づいて、前記分野ごとの適合度を計算し、前記適合度が大きい前記分野に対応する前記分野辞書を前記翻訳対象文章の翻訳に使用する前記分野辞書として決定する
ことを特徴とする付記17に記載の機械翻訳方法。
(付記19)
前記機械翻訳方法は、さらに、
前記翻訳条件と前記翻訳条件に対応する前記訳語とを含む翻訳規則と、前記分野辞書とから、前記翻訳条件と前記分野を対応付けた前記分野対応情報を生成し、前記分野対応情報を用いて、前記翻訳対象文章内の所定の前記単位記載と合致した前記翻訳条件に対応する前記分野を調べて前記適合度を計算し、前記適合度は、前記分野に対応する前記翻訳条件の前記合致回数の増加に従って大きくなる
ことを特徴とする付記18に記載の機械翻訳方法。
(付記20)
前記適合度は、さらに、前記翻訳条件の前記合致回数に関する一次関数を計算することによって得られる
ことを特徴とする付記19に記載の機械翻訳方法。
(付記21)
前記適合度は、さらに、前記翻訳条件と前記分野との間の重み係数と、前記翻訳条件の前記合致回数とを乗算したものを、前記分野ごとに合計して計算され、
前記重み係数は、0以上の実数値であり、対応付けられていない前記翻訳条件と前記分野との間の重み係数は0、対応付けられている前記翻訳条件と前記分野との間の重み係数は0より大きい
ことを特徴とする付記20に記載の機械翻訳方法。
(付記22)
対応付けられている前記翻訳条件と前記分野との間の重み係数は1である
ことを特徴とする付記21に記載の機械翻訳方法。
(付記23)
前記機械翻訳方法は、さらに、
前記適合度の計算方法をニューラルネットワークの発火条件とした前記発火条件を前記分野対応情報とし、前記翻訳条件の前記合致回数を前記発火条件のニューラルネットワークに入力して前記適合度を計算する
ことを特徴とする付記20から付記22に記載の機械翻訳方法。
(付記24)
翻訳条件と前記翻訳条件に対応する訳語とを含む翻訳規則と、翻訳対象文章内の所定の単位記載と合致する前記翻訳条件に対応する前記訳語と分野との対応関係を示す分野対応情報とに基づいて、前記分野に応じた前記訳語を保持する複数の分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する
ことを特徴とする機械翻訳方法。
(付記25)
前記機械翻訳方法は、さらに、
前記翻訳条件が前記翻訳対象文章内で合致した前記翻訳規則で訳出する前記訳語の訳出回数と前記分野との前記対応関係に基づいて、前記分野ごとの適合度を計算し、前記適合度が大きい前記分野に対応する前記分野辞書を前記翻訳対象文章の翻訳に使用する前記分野辞書として決定する
ことを特徴とする付記24に記載の機械翻訳方法。
(付記26)
前記機械翻訳方法は、さらに、
前記分野辞書から前記分野対応情報を生成し、前記分野対応情報を用いて、前記翻訳条件が前記翻訳対象文章内で合致した前記翻訳規則で訳出する前記訳語に対応する前記分野を調べて前記適合度を計算し、前記適合度は、前記分野に対応する前記訳語の前記訳出回数の増加に従って大きくなる
ことを特徴とする付記25に記載の機械翻訳方法。
(付記27)
前記適合度は、さらに、前記訳語の前記訳出回数に関する一次関数を計算することによって得られる
ことを特徴とする付記26に記載の機械翻訳方法。
(付記28)
前記適合度は、さらに、前記訳語と前記分野との間の重み係数と、前記訳語の前記訳出回数とを乗算したものを、前記分野ごとに合計して計算され、
前記重み係数は、0以上の実数値であり、対応付けられていない前記訳語と前記分野との間の重み係数は0、対応付けられている前記訳語と前記分野との間の重み係数は0より大きい
ことを特徴とする付記27に記載の機械翻訳方法。
(付記29)
対応付けられている前記訳語と前記分野との間の重み係数は1である
ことを特徴とする付記28に記載の機械翻訳方法。
(付記30)
前記機械翻訳方法は、さらに、
前記適合度の計算方法をニューラルネットワークの発火条件とした前記発火条件を前記分野対応情報として生成し、前記訳語の前記訳出回数を前記発火条件のニューラルネットワークに入力して前記適合度を計算する
ことを特徴とする付記27から付記29に記載の機械翻訳方法。
(付記31)
前記機械翻訳方法は、さらに、
決定された前記翻訳対象文章の翻訳に使用する前記分野辞書を使用して翻訳を行う
ことを特徴とする付記17から付記30に記載の機械翻訳方法。
(付記32)
前記機械翻訳方法は、さらに、
前記翻訳対象文章をネットワーク経由で受信し、翻訳結果を返信する
ことを特徴とする付記31に記載の機械翻訳方法。
(付記33)
コンピュータに、
翻訳条件と分野との対応関係を示す分野対応情報を記憶する分野対応情報記憶機能と、
前記分野に応じた訳語を保持する複数の分野辞書を記憶する辞書記憶機能と、
翻訳対象文章内の所定の単位記載と合致する前記翻訳条件と前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定機能と
を実現させるための機械翻訳プログラム。
(付記34)
前記辞書決定機能は、さらに、前記翻訳条件の前記翻訳対象文章内での合致回数と前記分野との前記対応関係に基づいて、前記分野ごとの適合度を計算し、前記適合度が大きい前記分野に対応する前記分野辞書を前記翻訳対象文章の翻訳に使用する前記分野辞書として決定する
ことを特徴とする付記33に記載の機械翻訳プログラム。
(付記35)
前記機械翻訳プログラムは、コンピュータに、さらに、
前記翻訳条件と前記翻訳条件に対応する前記訳語とを含む翻訳規則を記憶する翻訳規則記憶機能と、
前記翻訳条件と前記分野辞書とから前記分野対応情報を生成する分野辞書管理機能と、
を実現させ、
前記辞書決定機能は、さらに、前記分野対応情報を用いて、前記翻訳対象文章内の所定の前記単位記載と合致した前記翻訳条件に対応する前記分野を調べて前記適合度を計算し、
前記適合度は、前記分野に対応する前記翻訳条件の前記合致回数の増加に従って大きくなる
ことを特徴とする付記34に記載の機械翻訳プログラム。
(付記36)
前記適合度は、さらに、前記翻訳条件の前記合致回数に関する一次関数を計算することによって得られる
ことを特徴とする付記35に記載の機械翻訳プログラム。
(付記37)
前記適合度は、さらに、前記翻訳条件と前記分野との間の重み係数と、前記翻訳条件の前記合致回数とを乗算したものを、前記分野ごとに合計して計算され、
前記重み係数は、0以上の実数値であり、対応付けられていない前記翻訳条件と前記分野との間の重み係数は0、対応付けられている前記翻訳条件と前記分野との間の重み係数は0より大きい
ことを特徴とする付記36に記載の機械翻訳プログラム。
(付記38)
対応付けられている前記翻訳条件と前記分野との間の重み係数は1である
ことを特徴とする付記37に記載の機械翻訳プログラム。
(付記39)
前記分野辞書管理機能は、さらに、前記適合度の計算方法をニューラルネットワークの発火条件とした前記発火条件を前記分野対応情報とし、
前記辞書決定機能は、さらに、前記翻訳条件の前記合致回数を前記発火条件のニューラルネットワークに入力して前記適合度を計算する
ことを特徴とする付記36から付記38に記載の機械翻訳プログラム。
(付記40)
コンピュータに、
訳語と分野との対応関係を示す分野対応情報を記憶する分野対応情報記憶機能と、
前記分野に応じた前記訳語を保持する複数の分野辞書を記憶する辞書記憶機能と、
翻訳条件と前記翻訳条件に対応する前記訳語とを含む前記翻訳規則を記憶する翻訳規則記憶機能と、
翻訳対象文章内の所定の単位記載と合致する前記翻訳条件に対応する前記訳語と前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定機能と
を実現させるための機械翻訳プログラム。
(付記41)
前記辞書決定機能は、さらに、前記翻訳条件が前記翻訳対象文章内で合致した前記翻訳規則で訳出する前記訳語の訳出回数と前記分野との前記対応関係に基づいて、前記分野ごとの適合度を計算し、前記適合度が大きい前記分野に対応する前記分野辞書を前記翻訳対象文章の翻訳に使用する前記分野辞書として決定する
ことを特徴とする付記40に記載の機械翻訳プログラム。
(付記42)
前記機械翻訳プログラムは、コンピュータに、さらに、
前記分野辞書から前記分野対応情報を生成する分野辞書管理機能
を実現させ、
前記辞書決定機能は、さらに、前記分野対応情報を用いて、前記翻訳条件が前記翻訳対象文章内で合致した前記翻訳規則で訳出する前記訳語に対応する前記分野を調べて前記適合度を計算し、
前記適合度は、前記分野に対応する前記訳語の前記訳出回数の増加に従って大きくなる
ことを特徴とする付記41に記載の機械翻訳プログラム。
(付記43)
前記適合度は、さらに、前記訳語の前記訳出回数に関する一次関数を計算することによって得られる
ことを特徴とする付記42に記載の機械翻訳プログラム。
(付記44)
前記適合度は、さらに、前記訳語と前記分野との間の重み係数と、前記訳語の前記訳出回数とを乗算したものを、前記分野ごとに合計して計算され、
前記重み係数は、0以上の実数値であり、対応付けられていない前記訳語と前記分野との間の重み係数は0、対応付けられている前記訳語と前記分野との間の重み係数は0より大きい
ことを特徴とする付記43に記載の機械翻訳装プログラム。
(付記45)
対応付けられている前記訳語と前記分野との間の重み係数は1である
ことを特徴とする付記44に記載の機械翻訳プログラム。
(付記46)
前記分野辞書管理機能は、さらに、前記適合度の計算方法をニューラルネットワークの発火条件とした前記発火条件を前記分野対応情報として生成し、
前記辞書決定機能は、さらに、前記訳語の前記訳出回数を前記発火条件のニューラルネットワークに入力して前記適合度を計算する
ことを特徴とする付記43から付記45に記載の機械翻訳プログラム。
(付記47)
前記機械翻訳プログラムは、コンピュータに、さらに、
前記辞書決定部で決定された前記翻訳対象文章の翻訳に使用する前記分野辞書を使用して翻訳を行う翻訳機能
を実現させるための付記33から付記46に記載の機械翻訳プログラム。
(付記48)
前記機械翻訳プログラムは、コンピュータに、さらに、
前記翻訳対象文章をネットワーク経由で受信し、翻訳結果を返信するデータ通信部
を実現させるための付記47に記載の機械翻訳プログラム。
(付記49)
付記33から付記48に記載の機械翻訳プログラムを記録した、コンピュータ読み取り可能な記録媒体。
1 機械翻訳装置
11 辞書記憶部
12 分野対応情報記憶部
13 辞書決定部
14 翻訳規則記憶部
15 分野辞書管理部
16 翻訳部
17 通信部
2 翻訳対象文章
3 翻訳結果

Claims (10)

  1. 翻訳条件と分野との対応関係を示す所定の分野対応情報を記憶する分野対応情報記憶部と、
    前記分野に応じた原語訳語ペアを保持する複数の分野辞書を記憶する辞書記憶部と、
    翻訳対象文章と前記翻訳条件とを比較し、前記翻訳対象文章内の所定の単位記載と合致する前記翻訳条件と前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定部と
    を備え
    前記翻訳条件は、前記翻訳対象文章内の前記単位記載に対する所定のアクションを実施するために前記単位記載が合致すべき条件である
    ことを特徴とする機械翻訳装置。
  2. 前記辞書決定部は、さらに、前記翻訳条件の前記翻訳対象文章内での合致回数と前記分野との前記対応関係に基づいて、前記分野ごとの適合度を計算し、前記適合度が大きい前記分野に対応する前記分野辞書を前記翻訳対象文章の翻訳に使用する前記分野辞書として決定する
    ことを特徴とする請求項1に記載の機械翻訳装置。
  3. 前記アクションは、前記単位記載に含まれる原語の訳語への訳出を含み、
    前記機械翻訳装置は、さらに、
    前記翻訳条件と前記翻訳条件に対応する前記アクションとを含む翻訳規則を記憶する翻訳規則記憶部と、
    前記分野辞書の前記原語訳語ペアが、前記翻訳規則の前記アクションの前記訳出における前記原語と前記訳語の組み合わせと一致する場合に、当該アクションに対応する前記翻訳条件に当該分野辞書の前記分野を対応付けることによって前記分野対応情報を生成する分野辞書管理部と
    を備え、
    前記辞書決定部は、さらに、前記分野対応情報を用いて、前記翻訳対象文章内の所定の前記単位記載と合致した前記翻訳条件に対応する前記分野を調べて前記適合度を計算し、
    前記適合度は、前記分野に対応する前記翻訳規則の前記合致回数の増加に従って大きくなる
    ことを特徴とする請求項2に記載の機械翻訳装置。
  4. 前記適合度は、さらに、前記翻訳条件の前記合致回数に関する一次関数を計算することによって得られる
    ことを特徴とする請求項3に記載の機械翻訳装置。
  5. 原語訳語ペアと分野との対応関係を示す所定の分野対応情報を記憶する分野対応情報記憶部と、
    前記分野に応じた前記原語訳語ペアを保持する複数の分野辞書を記憶する辞書記憶部と、
    翻訳対象文章内の所定の単位記載に対する所定のアクションを実施するために前記単位記載が合致すべき条件である翻訳条件と前記翻訳条件に対応する前記アクションとを含む翻訳規則を記憶する翻訳規則記憶部と、
    前記翻訳対象文章と前記翻訳条件とを比較し、前記翻訳対象文章内の前記単位記載と合致する前記翻訳条件に対応する前記アクションが訳出である場合の前記訳出における前記原語訳語ペアと前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定部と
    を備えることを特徴とする機械翻訳装置。
  6. 翻訳対象文章と翻訳条件とを比較し、前記翻訳対象文章内の所定の単位記載と合致する前記翻訳条件と、前記翻訳条件と分野との対応関係を示す所定の分野対応情報に基づいて、前記分野に応じた原語訳語ペアを保持する複数の分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定し、
    前記翻訳条件は、前記翻訳対象文章内の前記単位記載に対する所定のアクションを実施するために前記単位記載が合致すべき条件である
    ことを特徴とする機械翻訳方法。
  7. 翻訳対象文章内の所定の単位記載に対する所定のアクションを実施するために前記単位記載が合致すべき条件である翻訳条件と前記翻訳条件に対応する前記アクションとを含む翻訳規則に基づいて前記翻訳対象文章と前記翻訳条件とを比較し、原語訳語ペアと分野との対応関係を示す所定の分野対応情報に基づいて、前記翻訳対象文章内の前記単位記載と合致する前記翻訳条件に対応する前記アクションが訳出である場合の前記訳出における前記原語訳語ペア前記分野との前記対応関係に基づいて、前記分野に応じた前記原語訳語ペアを保持する複数の分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する
    ことを特徴とする機械翻訳方法。
  8. コンピュータに、
    翻訳条件と分野との対応関係を示す所定の分野対応情報を記憶する分野対応情報記憶機能と、
    前記分野に応じた原語訳語ペアを保持する複数の分野辞書を記憶する辞書記憶機能と、
    翻訳対象文章と前記翻訳条件とを比較し、前記翻訳対象文章内の所定の単位記載と合致する前記翻訳条件と前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定機能と
    を実現させ
    前記翻訳条件は、前記翻訳対象文章内の前記単位記載に対する所定のアクションを実施するために前記単位記載が合致すべき条件である
    機械翻訳プログラム。
  9. コンピュータに、
    原語訳語ペアと分野との対応関係を示す所定の分野対応情報を記憶する分野対応情報記憶機能と、
    前記分野に応じた前記原語訳語ペアを保持する複数の分野辞書を記憶する辞書記憶機能と、
    翻訳対象文章内の所定の単位記載に対する所定のアクションを実施するために前記単位記載が合致すべき条件である翻訳条件と前記翻訳条件に対応する前記アクションとを含む翻訳規則を記憶する翻訳規則記憶機能と、
    前記翻訳対象文章と前記翻訳条件とを比較し、前記翻訳対象文章内の前記単位記載と合致する前記翻訳条件に対応する前記アクションが訳出である場合の前記訳出における前記原語訳語ペアと前記分野との前記対応関係に基づいて、複数の前記分野辞書から前記翻訳対象文章の翻訳に使用する前記分野辞書を決定する辞書決定機能と
    を実現させるための機械翻訳プログラム。
  10. 請求項8または請求項9に記載の機械翻訳プログラムを記録した、コンピュータ読み取り可能な記録媒体。
JP2014170082A 2014-08-25 2014-08-25 機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体 Active JP6459300B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014170082A JP6459300B2 (ja) 2014-08-25 2014-08-25 機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014170082A JP6459300B2 (ja) 2014-08-25 2014-08-25 機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2016045751A JP2016045751A (ja) 2016-04-04
JP6459300B2 true JP6459300B2 (ja) 2019-01-30

Family

ID=55636251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014170082A Active JP6459300B2 (ja) 2014-08-25 2014-08-25 機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP6459300B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874262A (zh) * 2017-01-09 2017-06-20 成都佳音多语信息技术有限公司 一种实现领域自适应的统计机器翻译方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH113331A (ja) * 1997-06-11 1999-01-06 Toshiba Corp 文書作成装置、予測入力方法、及び記録媒体
JP2007080221A (ja) * 2005-09-16 2007-03-29 Fuji Xerox Co Ltd 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム

Also Published As

Publication number Publication date
JP2016045751A (ja) 2016-04-04

Similar Documents

Publication Publication Date Title
CN106649288B (zh) 基于人工智能的翻译方法和装置
CN109062937B (zh) 训练描述文本生成模型的方法、生成描述文本的方法及装置
CN111783474B (zh) 一种评论文本观点信息处理方法、装置及存储介质
CN110032641B (zh) 计算机执行的、利用神经网络进行事件抽取的方法及装置
US11669739B2 (en) Name and face matching
CN109829162B (zh) 一种文本分词方法及装置
Heigold et al. An extensive empirical evaluation of character-based morphological tagging for 14 languages
CN110298035B (zh) 基于人工智能的字向量定义方法、装置、设备及存储介质
US10628529B2 (en) Device and method for natural language processing
JP6187877B2 (ja) 同義語抽出システム、方法および記録媒体
CN108875074A (zh) 基于交叉注意力神经网络的答案选择方法、装置和电子设备
CN110704621A (zh) 文本处理方法、装置及存储介质和电子设备
Shah et al. Image captioning using deep neural architectures
US11461613B2 (en) Method and apparatus for multi-document question answering
JP6291443B2 (ja) 接続関係推定装置、方法、及びプログラム
WO2019106965A1 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2019045895A (ja) 生成プログラム、生成方法、生成装置、及び剽窃検知プログラム
US20140236869A1 (en) Interactive variable selection device, interactive variable selection method, and interactive variable selection program
CN112818091A (zh) 基于关键词提取的对象查询方法、装置、介质与设备
CN114021573B (zh) 一种自然语言处理方法、装置、设备及可读存储介质
CN112463989A (zh) 一种基于知识图谱的信息获取方法及系统
US20130202208A1 (en) Information processing device and information processing method
JP6459300B2 (ja) 機械翻訳装置、機械翻訳方法、機械翻訳プログラムおよび記録媒体
JP6586026B2 (ja) 単語ベクトル学習装置、自然言語処理装置、方法、及びプログラム
CN112084776A (zh) 相似文章的检测方法、装置、服务器和计算机存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180424

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181217

R150 Certificate of patent or registration of utility model

Ref document number: 6459300

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150