JP3584026B2 - 原言語・目的言語表現パターン対作成装置 - Google Patents
原言語・目的言語表現パターン対作成装置 Download PDFInfo
- Publication number
- JP3584026B2 JP3584026B2 JP2002064129A JP2002064129A JP3584026B2 JP 3584026 B2 JP3584026 B2 JP 3584026B2 JP 2002064129 A JP2002064129 A JP 2002064129A JP 2002064129 A JP2002064129 A JP 2002064129A JP 3584026 B2 JP3584026 B2 JP 3584026B2
- Authority
- JP
- Japan
- Prior art keywords
- expression pattern
- target language
- source language
- language
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
【発明の属する技術分野】
本発明は、自然言語である原言語の入力文を、該原言語とは異なる自然言語である目的言語に変換する機械翻訳システムで使用される辞書の作成に係り、特に、原言語表現パターンとそれに対応する目的言語表現パターンとの対である表現パターン対の辞書を作成するための装置に関する。
【0002】
【従来の技術】
近年、電子計算機を用いた機械翻訳システムの研究や開発が盛んであるが、例えば、特開昭63−086071号公報「自然言語翻訳方式」に記載のように、結合価パターンの考え方に基づくシステムが有効とされている。これは、原言語の述語とその述語に係る格要素の制約条件とを記述した原言語表現パターンと、その原言語表現パターンに対応する目的言語の表現を記述した目的言語表現パターンとを対にした表現パターン対を辞書に登録しておき、その辞書を用いて原言語の入力文の構文解析、意味解析、及び目的言語への変換を行なうものである。
【0003】
この種の機械翻訳システムの精度を上げるためには、表現パターン対を大量に作成し、辞書に登録する必要がある。しかし、表現パターン対の作成には、膨大な時間と人手がかかる。そこで、従来は、原言語文とその対訳である目的言語文とからなる対訳文書から、表現パターン対などの翻訳規則を獲得する方法が提案されている。なお、これに関連する公知文献としては、例えば、白井論ほか「日英翻訳に必要な結合価パタン対の数とその収集方法」(情報処理学会研究報告NL−110−7,pp.43−50,1995,情報処理学会発行)、特開平8−101837号公報に記載の「機械翻訳における翻訳規則学習方法」などが知られている。
【0004】
【発明が解決しようとする課題】
上記従来の方法で表現パターン対を獲得し辞書を作成する際には、大量の対訳文書を用意する必要があるが、辞書を作成しようとする原言語と目的言語の種類によっては、大量の対訳文書が必ずしも入手できるとは限らない。
【0005】
本発明は、このような事情に鑑みてなされたものであり、その目的は、対訳文書を入手することができない言語対であっても、既存の原言語表現パターン辞書と目的言語文書を利用して新たな表現パターン対を作成することができる原言語・目的言語表現パターン作成装置を提供することにある。
【0006】
【課題を解決するための手段】
本発明の原言語・目的言語表現パターン対作成装置は、対象述語入力部、原言語表現パターン抽出部、目的言語文抽出部、目的言語文意味カテゴリ付与部、対応付け部、表現パターン対作成部及び出力部を備える。
【0007】
対象述語入力部は、表現パターン対を作成しようとする原言語述語と、該原言語述語の対訳である目的言語述語とを入力する。原言語表現パターン抽出部は、原言語の述語と該述語に係る格要素が取り得る単語の制約条件として指定されている意味カテゴリを記述した原言語表現パターンを格納した原言語表現パターン辞書から、前記入力された原言語述語に対する原言語表現パターンを抽出する。目的言語文抽出部は、目的言語文書データベースから、前記入力された目的言語述語を含む目的言語文を抽出する。目的言語文意味カテゴリ付与部は、目的言語の単語とその意味カテゴリとを格納した目的言語単語意味辞書を参照して、前記目的言語文抽出部で抽出された目的言語文中の各単語に対して意味カテゴリを付与する。
【0008】
対応付け部は、前記原言語表現パターン抽出部で抽出された原言語表現パターンにおいて格要素が取り得る単語の制約条件として指定されている意味カテゴリ(以下、条件カテゴリ)と、前記目的言語文意味カテゴリ付与部で目的言語文中の単語に付与された意味カテゴリとを、単語の意味カテゴリ間の関係を記述した意味体系辞書を参照して比較することで、前記原言語表現パターンの各格要素と前記目的言語文中の各単語との対応付けを決定する。表現パターン対作成部は、前記対応付け部で対応付けられた原言語表現パターンの各格要素と目的言語中の格単語との対応付けを参照して、前記原言語表現パターンの格要素の条件カテゴリを当該格要素に対応付けられた目的言語の単語の意味カテゴリで置き 換えて新しい原言語表現パターンを作成し、前記目的言語文中の各単語のうち、前記入力された目的言語述語と、前記原言語表現パターンの格要素に対応付けられた単語の前記目的言語文中の構文情報とから目的言語表現パターンを作成する。出力部は、前記表現パターン対作成部で作成された原言語表現パターンと目的言語表現パターンとの対を表現パターン対として出力する。
【0009】
具体的には、意味体系辞書が、木構造によって単語の意味カテゴリ間の上位、下位関係を記述し、対応付け手段では、原言語表現パターンの各格要素と目的言語文中の各単語とのすべての組合せについて、それぞれ格要素に単語を対応付けて、前記意味体系辞書を参照して、該格要素の意味カテゴリと該単語の意味カテゴリとの階層関係をもとに得点を与え、得点が最大の対応付けを選択する。
【0010】
このように、本発明では、原言語述語とその対訳である目的言語述語とを入力すれば、既存の原言語表現パターン辞書から、入力された原言語述語に対する原言語表現パターンを抽出し、また、既存の目的言語文書データベースから、入力された目的言語述語を含む目的言語文を抽出するため、大量の対訳文書を入手できなくても、抽出された原言語表現パターンと、抽出された目的言語文とから、表現パターン対を作成することができる。
【0011】
また、本発明では、抽出された原言語表現パターンの各格要素と、抽出された目的言語文の各単語との適切な対応付けを決定するため、その対応付けを参照して、抽出された原言語表現パターンと、抽出された目的言語文とから、容易に表現パターン対を作成することができる。
【0012】
さらに、本発明では、格要素が取り得る単語の制約条件として意味カテゴリを指定した原言語表現パターンを格納した原言語表現パターン辞書から原言語表現パターンを抽出し、また、抽出された目的言語文中の各単語に対して意味カテゴリを付与し、原言語表現パターンにおいて格要素に取り得る単語の制約条件として指定されている意味カテゴリと、目的言語文中の単語に付与された意味カテゴリとを、意味体系カテゴリを参照して比較することで、原言語表現パターンの各格要素と目的言語文中の各単語との適切な対応付けを決定し、その対応付けを参照して、抽出された原言語表現パターンと、抽出された目的言語文とから、適切な表現パターン対を作成することができる。
【0013】
【発明の実施の形態】
以下、図面を用いて本発明の一実施の形態を詳細に説明する。
図1は、本発明による原言語・目的言語表現パターン対作成装置の一実施例を示す構成図である。図1において、10は表現パターン対を作成する対象の原言語述語とその対訳である目的言語述語を入力する対象述語入力部、20は既存の原言語表現パターン辞書25から、入力された原言語述語に対する原言語表現パターンを抽出する原言語表現パターン抽出部、30は既存の目的言語文書データベース35から、入力された目的言語述語を含む目的言語文を抽出する目的言語文抽出部である。40は目的言語単語意味辞書45を参照して、目的言語文抽出部30で抽出された目的言語文中の各単語に意味カテゴリを付与する目的言語文意味カテゴリ付与部である。50は、原言語表現パターン抽出部20で抽出された原言語表現パターンにおいて格要素に取り得る単語の制約条件として指定されている意味カテゴリと、目的言語文意味カテゴリ付与部40にて目的言語文中の単語に付与された意味カテゴリとを、意味体系辞書55を参照して比較することで、原言語表現パターンの各格要素と目的言語文中の各単語との最適の対応付けを決定する対応付け部である。60は対応付け部50で決定された原言語表現パターンの各格要素と目的言語中の各単語との対応付けを参照して、抽出された原言語表現パターンと抽出された目的言語文とから新たな表現パターン対を作成する表現パターン対作成部である。70は表現パターン対作成部60で作成された表現パターン対を出力し、表現パターン対辞書80に格納する出力部である。
【0014】
原言語表現パターン辞書25は、原言語の述語ごとに、該原言語の述語と該述語に係る格要素の取り得る単語の制約条件とを記述した既存の原言語表現パターンを格納している。ここでは、該原言語表現パターン辞書25は、述語に係る格要素が取り得る単語の制約条件として意味カテゴリを指定した原言語表現パターンを格納しているとする。目的言語文書データベース35は目的言語文の集合である既存の目的言語文書を格納している。目的言語単語意味辞書45は、単語ごとに、単語とその意味カテゴリとの対応を格納している。
【0015】
意味体系辞書55は、例えば、図3のような木構造を持った意味体系によって、単語の意味カテゴリ間の上位下位関係を記述した辞書である。図3に示した意味体系では、例えば、〈主体〉の下位概念として、〈人〉、〈組識〉があることを表わしている。
【0016】
図2は、図1に示す一実施例の動作の流れを示すフローチャートである。以下に、図2のフローチャートにしたがって図1の実施例の動作を詳しく説明する。
【0017】
対象述語入力部10は、表現パターン対を作成しようとする原言語述語(動詞形容詞名詞および、これらの複数の語から構成される語句など)と、その原言語述語の対訳である目的言語述語とを入力して、原言語述語は原言語表現パターン抽出部20に、また、目的言語述語は目的言語文抽出部30に送る(ST11)。
【0018】
原言語表現パターン抽出部20は、対象述語入力部10から受け取った原言語述語に対する原言語表現パターンを原言語表現パターン辞書25から抽出し、対応付け部50に送る(ST12)。
【0019】
一方、目的言語文抽出部30は、対象述語入力部10から受け取った目的言語述語を含む目的言語文を目的言語文書データベース35から抽出する(ST13)。目的言語文抽出部30では、この抽出された目的言語文を目的言語文意味カテゴリ付与部40に1文ずつ送る。
【0020】
目的言語文意味カテゴリ付与部40は、目的言語単語意味辞書45を参照して、目的言語文抽出部30から受け取った目的言語文中の各単語に意味カテゴリを付与し、意味カテゴリが付与された目的言語文を対応付け部50に送る(ST15)。
【0021】
対応付け部50は、まず、原言語表現パターン抽出部20から受け取った原言語述語に対する原言語表現パターンから、格要素とその格要素で制約条件として指定されている意味カテゴリとのリストである格要素リストを得る(ST16)。また、目的言語文抽出部30から受け取った目的言語述語を含む目的言語文(1文)から、格要素の候補となる単語のリストである格要素候補単語リストを得る(ST17)。次に、対応付け部50は、原言語表現パターンの格要素リスト中の格要素と目的言語文の格要素候補単語リスト中の格要素候補単語とのすべての組合せについて、格要素に格要素候補単語を対応付け、意味体系辞書55を参照して、原言語表現パターンの格要素の意味カテゴリと目的言語文の格要素候補単語の意味カテゴリの階層関係を求め、階層関係に応じた得点を計算する(ST18)。そして、得点の合計が閾値を超える対応付けのものがあるか判定し(ST19)、あれば、そのうちの得点の合計が最も高い対応付けを選択する(ST20)。そして、その対応付けと、その対応付けを与える原言語表現パターンと、目的言語文とを表現パターン対作成部60に送る。一方、得点の合計が閾値を超えるものがなければ、次の目的言語文を目的言語文抽出部30から目的言語文意味カテゴリ付与部40に送り、ST15以降の処理を繰り返す。
【0022】
表現パターン対作成部60は、対応付け部50から受け取った対応付けを参照して、対応付け部50から受け取った原言語表現パターンから新たな原言語表現パターンを作成し(ST21)、また、対応付け部50から受け取った目的言語文から目的言語表現パターンを作成し(ST22)、この作成された原言語表現パターンと目的言語表現パターンとを表現パターン対として出力部70に送る。
【0023】
出力部70では、表現パターン対作成部60から受け取った表現パターン対を出力し(ST23)、例えば、表現パターン対辞書80に新規に登録する。なお、作成された表現パターン対をディスプレィ等に出力し、利用者が確認後、表現パターン対辞書80に登録することでもよい。
【0024】
その後、目的言語文抽出部30にて抽出された目的言語文のすべてについて処理を行ったか判定し(ST14)、未処理のものがあれば、次の目的言語文を目的言語文抽出部30から目的言語文意味カテゴリ付与部40に送って再びST15以降の処理を繰り返し、抽出されたすべての目的言語文に対する処理が完了すると、動作を終了とする。
【0025】
次に、本実施例の動作を具体例でもって説明する。ここでは、日英翻訳を例に原言語を日本語とし、目的言語を英語とする。
【0026】
図4に、日本語表現パターンと英語表現パターンとの対の一例を示す。図4の日本語表現パターンでは、述語「掴む」は、意味カテゴリ<主体>を持つ単語を格要素N1に取ることができるという制約条件を示し、意味カテゴリ<具体物>を持つ単語を格要素N2に取ることができるという制約条件を示している。ここで、N1,N2は、格要素を示すラベルであり、「<」、「>」で括られた表記は意味カテゴリを示す。意味カテゴリとは、単語の意味をいくつかのクラスに分類したもので、図3に示した木構造を持った意味体系によって、それぞれの意味カテゴリ間の上位、下位関係が表される。図1で説明したように、意味体系辞書55には、このような意味体系があらかじめ格納されている。日本語表現パターンに対応する英語表現パターンは、図4に示すように、英語述語と格要素とから構成される。
【0027】
いま、日本語述語「掴む」と英語述語「grasp」とが、対象述語入力部10に入力されたと仮定する(ST11)。原言語表現パターン抽出部20は、対象述語入力部10から受け取った日本語述語「掴む」に対する日本語表現パターンを原言語表現パターン辞書25から抽出する(ST12)。ここでは、図5に示す2組の日本語表現パターンが抽出されたとする。
【0028】
原言語表現パターン辞書25の例としては、日本語では、例えば「日本語語彙大系(岩波書店1997年)」の構文体系や、「計算機用日本語基本動詞辞書(情報処理振興事業協会技術センター編1987年)」などがあげられる。日本語語彙大系には、日本語表現パターンと英語表現パターンとの対が記述されているが、その日本語表現パターン部分を本発明における原言語表現パターン辞書として利用することができる。
【0029】
一方、目的言語文抽出部30は、対象述語入力部10から受け取った英語述語「grasp」を含む目的言語文を目的言語文書データベース35から抽出する(ST13)。その結果、ここでは図6(a)に示す一つの英語文が抽出されたとする。図6(a)は、「The man grasps fish.」という文のそれぞれの単語の品詞が冠詞、名詞、動詞、名詞であることを示している。
【0030】
次に、ST15以降の処理に進む。なお、複数の文が抽出された場合は、それぞれの英語文についてST15以降の処理を行ない、すべての文について処理を行なった後に本実施例の動作が終了する(ST14)。
【0031】
目的言語文意味カテゴリ付与部40は、抽出された英語文中の各単語に、目的言語単語意味辞書45を参照して意味カテゴリを付与する(ST15)。図7は、目的言語単語意味辞書45のエントリの一例である。図6(a)の英語文に意味カテゴリを付与した結果を図6(b)に示す。図6(b)は、単語「the」の意味カテゴリが目的言語単語意味辞書45に無く、単語「man」、「grasp」、「fish」の意味カテゴリが、それぞれ、<男>、<手の動作>、<魚>であることを示している。
【0032】
対応付け部50では、まず、原言語表現パターン抽出部20から受け取った日本語表現パターンから、それぞれの日本語表現パターンごとに、日本語表現パターンが持つ格要素とその格要素で制約条件として指定されている意味カテゴリ(以下、条件カテゴリと呼ぶ)とのリストである格要素リストを得る(ST16)。例えば、図5に示す日本語表現パターンからは、図8に示す格要素リストが得られる。また、対応付け部50では、目的言語文意味カテゴリ付与部40から受け取った意味カテゴリ付の英語文から、格要素の候補となる単語のリストである格要素候補単語リストを得る(ST17)。英語の場合、名詞を格要素候補単語とすると、図6(b)の意味カテゴリの付与された英語文からは、「man」、「fish」が格要素候補単語として得られる。
【0033】
次に、対応付け部50では、格要素リスト中の格要素と格要素候補単語リスト中の格要素候補単語のすべての組合せについて、意味体系辞書55を参照して、格要素の条件カテゴリと格要素候補単語の意味カテゴリとを比較することで、格要素リスト中の格要素に格要素候補単語リスト中の単語を対応付けたときの得点を求める(ST18)。この得点は、ある格要素に対応付けられた格要素候補単語が、その格要素で指定されている制約条件を満たすときにのみ与え、満たさないときは0点とする。ここで、制約条件を満たすとは、条件カテゴリと格要素候補単語の意味力テゴリとが同一であるか、あるいは、意味体系辞書55において格要素候補単語の意味カテゴリが条件カテゴリの下位に属することをいう。意味体系において、条件カテゴリがより下位の意味カテゴリであれば、より具体的な意味を表し厳しい条件となることから、条件カテゴリの意味体系における深さ(根ノードからの距離)が大きいほど高い得点を与えることを考える。ここでは、条件カテゴリの意味体系での深さが0(根ノード)のときに1点、深さが1のときに2点、深さがnのときにn+1点を与えることとする。
【0034】
前述の格要素候補単語「man」、「fish」と図8の格要素リスト中の格要素には、図9に示す「対応付け1」から「対応付け4」までの4通りの組合せがある。例えば、図9の対応付け1では、単語「man」に対して図5の日本語表現パターン1の格要素N1を対応付け、単語「fish」に対して格要素N2を対応付けたときの得点を示している。意味体系の例として図3を参照すれば、<男>が<主体>の下位に属するため格要素の制約条件を満たし、<主体>の意味体系における深さが2であることから、単語「man」と格要素N1の対応付けに対する得点3点が与えられる。また、<魚>が<具体物>の下位に属するため、単語「fish」と格要素N2との対応付けに対する得点3点が与えられる。一方、対応付け2では、単語「man」に対して日本語表現パターン1のN2が対応付けられているが、図3を参照すれば、単語「man」と格要素N2との対応付けに対する得点は0点となる。同様にして、他のすべての対応付けに対しても得点を求めた結果を図9に示す。閾値を0点とすると、対応付け1と対応付け3の得点の合計が閾値を超えている(ST19)。そのうち、対応付け1が、得点の合計(3+3=6点)が最も高いため選択される(ST20)。
【0035】
この結果、図9中の対応付け1と図5中の日本語表現パターン1と図6(b)の英語文とが、対応付け部50から表現パターン対作成部60に送られる。なお、閾値を超える対応付けが無い場合は、ST14のステップに戻り、次の英語文についてST15以降の処理を行なうことになる。
【0036】
表現パターン対作成部60の動作のうち、まず、日本語表現パターンを作成する方法を説明する。対応付け部50から受け取った日本語表現パターン1の格要素の条件カテゴリを、その格要素に対応付けられた英単語の意味カテゴリで置き換えることによって、新たな日本語表現パターンを作成する(ST21)。例えば、図9の対応付け1を参照すれば、単語「man」は、図5の日本語表現パターン1の格要素N1に対応付けられているため、格要素N1の条件カテゴリを単語「man」に付与されている<男>に置き換え、そして、単語「fish」は、図5の日本語表現パターン1の格要素N2に対応付けられているため、格要素N2の条件カテゴリを「fish」に付与されている<魚>に置き換えることによって、図10の日本語表現パターンが作成される。
【0037】
次に、英語表現パターンを作成する方法を説明する。対応付け部50から受け取った英語文中の各単語のうち、対象述語入力部10に入力された英語述語と、日本語表現パターンの格要素に対応付けられた単語の英語文中での構文情報とから、英語表現パターンを作成する(ST22)。ここで、構文情報とは、目的言語において構文を定めるのに必要な情報のことをいい、目的言語ごとに予め決定しておく。例えば、英語の場合、目的言語の構文情報として、各格要素の文中での位置(述語との相対位置、他の格要素との語順など)と、機能語である前置詞とを対象とする。よって、対象述語入力部10に入力された英語述語「grasp」と、図9の対応付け1を参照して、格要素N1に対応付けられた単語「man」、および、格要素N2に対応付けられた単語「fish」の文中での位置とから、図10の英語表現パターンが作成される。
【0038】
以上で作成した表現パターン対を出力部70が出力して(ST23)、図6(a)の英語文についての処理は終了する。その後、ST14のステップに戻り、目的言語文抽出部30で抽出された他の英語文の有無を調べて、他の英語文が有れば次の英語文についてST15以降の処理を行ない、無ければ本実施例の動作は終了する。
【0039】
なお、図1で示した装置における各部の一部もしくは全部の処理機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、あるいは、図2で示した処理手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもない。また、コンピュータでその処理機能を実現するためのプログラム、あるいは、コンピュータにその処理手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、FDや、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、提供したりすることができるとともに、インターネット等のネットワークを通してそのプログラムを配布したりすることが可能である。
【0040】
【発明の効果】
以上の説明から明らかなように、本発明によれば、既存の原言語表現パターン辞書と既存の目的言語文書とから、原言語表現パターンと目的言語表現パターンの対である新たな表現パターン対を作成することができる。また、原言語表現パターン辞書から抽出された原言語表現パターンの各格要素と、目的言語文書から抽出された目的言語文の各単語との適切な対応付けを参照して、原言語表現パターン辞書と目的言語文書とから適切な表現パターン対を作成することができる。さらには、原言語表現パターン辞書から抽出された原言語表現パターンの格要素において制約条件として指定されている意味カテゴリと、目的言語文書から抽出された目的言語文の各単語に付与された意味カテゴリとを比較することで決定した対応付けを参照して、原言語表現パターン辞書と目的言語文書とから表現パターン対を作成することができる。このように、本発明では、辞書作成の対象とする言語対の対訳文書を入手することができない場合であっても表現パターン対を作成することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態を示す構成図である。
【図2】本発明の一実施形態の動作を示すフローチャートである。
【図3】意味体系の一例を示す図である。
【図4】表現パターン対の一例を示す図である。
【図5】日本語述語「掴む」に対する日本語表現パターンの一例を示す図である。
【図6】英語述語「grasp」を含む英語文の一例を示す図である。
【図7】英語における目的言語単語意味辞書のエントリの一例を示す図である。
【図8】格要素リストの一例を示す図である。
【図9】格要素と格要素候補単語との対応付けとその得点の一例を示す図である。
【図10】本発明により作成された表現パターン対の一例を示す図である。
【符号の説明】
10 対象述語入力部
20 原言語表現パターン抽出部
25 原言語表現パターン辞書
30 目的言語文抽出部
35 目的言語文書データベース
40 目的言語文意味カテゴリ付与部
45 目的言語単語意味辞書
50 対応付け部
55 意味体系辞書
60 表現パターン対作成部
70 出力部
80 表現パターン対辞書
Claims (2)
- 原言語の述語と該述語に係る格要素が取り得る単語の制約条件とを記述した原言語表現パターンと、該原言語表現パターンに対応する目的言語の表現を記述した目的言語表現パターンとの対である表現パターン対を作成する原言語・目的言語表現パターン対作成装置において、
表現パターン対を作成しようとする原言語述語と、該原言語述語の対訳である目的言語述語とを入力する対象述語入力部と、
原言語の述語と該述語に係る格要素が取り得る単語の制約条件として指定されている意味カテゴリとを記述した原言語表現パターンを格納した原言語表現パターン辞書から、前記入力された原言語述語に対する原言語表現パターンを抽出する原言語表現パターン抽出部と、
目的言語文書データベースから、前記入力された目的言語述語を含む目的言語文を抽出する目的言語文抽出部と、
目的言語の単語とその意味カテゴリとを格納した目的言語単語意味辞書を参照して、前記目的言語文抽出部で抽出された目的言語文中の各単語に対して意味カテゴリを付与する目的言語文意味カテゴリ付与部と、
前記原言語表現パターン抽出部で抽出された原言語表現パターンにおいて格要素が取り得る単語の制約条件として指定されている意味カテゴリ(以下、条件カテゴリ)と、前記目的言語文意味カテゴリ付与部で目的言語文中の単語に付与された意味カテゴリとを、単語の意味カテゴリ間の関係を記述した意味体系辞書を参照して比較することで、前記原言語表現パターンの各格要素と前記目的言語文中の各単語との対応付けを決定する対応付け部と、
前記対応付け部で対応付けられた原言語表現パターンの各格要素と目的言語中の各単語との対応付けを参照して、前記原言語表現パターンの格要素の条件カテゴリを当該格要素に対応付けられた目的言語の単語の意味カテゴリで置き換えて新しい原言語表現パターンを作成し、前記目的言語文中の各単語のうち、前記入力された目的言語述語と、前記原言語表現パターンの格要素に対応付けられた単語の前記目的言語文中の構文情報とから目的言語表現パターンを作成する表現パターン対作成部と、
前記表現パターン対作成部で作成された原言語表現パターンと目的言語表現パターンとの対を表現パターン対として出力する出力部と、
を有することを特徴とする原言語・目的言語表現パターン対作成装置。 - 請求項1記載の原言語・目的言語表現パターン対作成装置において、
前記意味体系辞書が、木構造によって単語の意味カテゴリ間の上位、下位関係を記述し、
前記対応付け部は、前記原言語表現パターンの各格要素と前記目的言語文中の各単語とのすべての組合せについて、それぞれ格要素に単語を対応付けて、前記意味体系辞書を参照して、該格要素の意味カテゴリと該単語の意味カテゴリとの階層関係をもとに得点を与え、得点が最大の対応付けを選択する、
ことを特徴とする原言語・目的言語表現パターン対作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002064129A JP3584026B2 (ja) | 2002-03-08 | 2002-03-08 | 原言語・目的言語表現パターン対作成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002064129A JP3584026B2 (ja) | 2002-03-08 | 2002-03-08 | 原言語・目的言語表現パターン対作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003263431A JP2003263431A (ja) | 2003-09-19 |
JP3584026B2 true JP3584026B2 (ja) | 2004-11-04 |
Family
ID=29197063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002064129A Expired - Fee Related JP3584026B2 (ja) | 2002-03-08 | 2002-03-08 | 原言語・目的言語表現パターン対作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3584026B2 (ja) |
-
2002
- 2002-03-08 JP JP2002064129A patent/JP3584026B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003263431A (ja) | 2003-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101130444B1 (ko) | 기계번역기법을 이용한 유사문장 식별 시스템 | |
US20060106595A1 (en) | Unsupervised learning of paraphrase/translation alternations and selective application thereof | |
US20060106594A1 (en) | Unsupervised learning of paraphrase/translation alternations and selective application thereof | |
EP1308851A2 (en) | Method of calculating translation relationships among words of different languages | |
WO2005059771A1 (ja) | 対訳判断装置、方法及びプログラム | |
US20150012262A1 (en) | Method and system for generating new entries in natural language dictionary | |
JP2005165958A (ja) | 情報検索システム、情報検索支援システム及びその方法並びにプログラム | |
JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
Şenel et al. | Measuring cross-lingual semantic similarity across European languages | |
KR101757222B1 (ko) | 한글 문장에 대한 의역 문장 생성 방법 | |
JP4401269B2 (ja) | 対訳判断装置及びプログラム | |
Gad-Elrab et al. | Named entity disambiguation for resource-poor languages | |
Li et al. | Chinese frame identification using t-crf model | |
JP3584026B2 (ja) | 原言語・目的言語表現パターン対作成装置 | |
JP2003303194A (ja) | 慣用句辞書作成装置、検索用インデックス作成装置、文書検索装置、それらの方法、プログラム及び記録媒体 | |
Ptaszynski et al. | Detecting emotive sentences with pattern-based language modelling | |
Seresangtakul et al. | Thai-Isarn dialect parallel corpus construction for machine translation | |
JP2003330926A (ja) | 翻訳方法、翻訳装置及び翻訳プログラム | |
KR20210012606A (ko) | 바이오 정보 분석 방법 및 이를 수행하기 위한 프로그램을 저장하는 저장 매체 | |
JP3752535B2 (ja) | 訳語選択装置、及び翻訳装置 | |
Alsudais | Image classification in Arabic: exploring direct English to Arabic translations | |
Sankaravelayuthan et al. | A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam | |
JP2006190072A (ja) | 自動換言装置、自動換言方法及び換言処理プログラム | |
Qamet et al. | Development Kazakh-Turkish machine translation on the base of complete set of endings model | |
JP2000250913A (ja) | 実例型自然言語翻訳方法、対訳用例集作成方法および装置とそのプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040420 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040727 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040730 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080806 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080806 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090806 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090806 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100806 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100806 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110806 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |