JP4114526B2 - 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム - Google Patents

機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP4114526B2
JP4114526B2 JP2003109374A JP2003109374A JP4114526B2 JP 4114526 B2 JP4114526 B2 JP 4114526B2 JP 2003109374 A JP2003109374 A JP 2003109374A JP 2003109374 A JP2003109374 A JP 2003109374A JP 4114526 B2 JP4114526 B2 JP 4114526B2
Authority
JP
Japan
Prior art keywords
translation
sentence
semantic analysis
result
tree structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003109374A
Other languages
English (en)
Other versions
JP2004318344A (ja
Inventor
博 増市
智子 大熊
宏樹 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2003109374A priority Critical patent/JP4114526B2/ja
Publication of JP2004318344A publication Critical patent/JP2004318344A/ja
Application granted granted Critical
Publication of JP4114526B2 publication Critical patent/JP4114526B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、翻訳元言語の入力文を翻訳先言語に変換する機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムに係り、特に、翻訳元言語の入力文に対する意味解析結果を利用して翻訳先言語に変換する機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムに関する。
【0002】
さらに詳しくは、本発明は、Lexical Functional Grammar (LFG)に基づく意味解析結果を利用して翻訳元言語の入力文を翻訳先言語に変換する機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムに係り、特に、LFGの出力するf−structureの持つ言語普遍性を利用してより最適な翻訳結果文を出力する機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムに関する。
【0003】
【従来の技術】
日本語や英語など、人間が日常的なコミュニケーションに使用する言葉のことを「自然言語」と呼ぶ。自然言語は自然発生的な起源を持ち、人類、民族、社会の歴史とともに進化し、現在、多種多様な自然言語が存在している。勿論、人は身振りや手振りなどによっても意思疎通を行なうことが可能であるが、自然言語により最も自然で且つ高度なコミュニケーションを実現することができる。
【0004】
自然言語は、本来抽象的であいまい性が高い性質を持つが、文章を数学的に取り扱うことにより、コンピュータ処理を行なうことができる。この結果、機械翻訳や対話システム、検索システムなど、自動化処理により自然言語に関するさまざまなアプリケーション/サービスが実現される。
【0005】
このうち、「機械翻訳」は、使用する言語の異なる者同士が行なうコミュニケーションを、コンピュータ処理を活用して支援するシステムである。最近では、インターネットの普及や企業のグローバル化が進むにつれ、さまざまな言語で書かれた文書を取り扱う必要性が増し、機械翻訳システムのニーズが高まってきている。
【0006】
しかしながら、既に数多くの言語を対象として種々の機械翻訳システムが製品化されているにもかかわらず、これらのシステムが広く実用的に使われているとは言い難い状況にある。
【0007】
現在製品化されている機械翻訳システムの多くは、ダイレクト方式又はトランスファー方式と呼ばれる方式に基づいている。
【0008】
ダイレクト方式は、基本的に、翻訳元言語で書かれた文の形態素解析結果を利用して、翻訳元言語の単語を翻訳先言語の単語へと単純に置き換えるものである。形態素解析では、文を意味的最小単位である形態素(morpheme)に分節して品詞の認定処理が行なわれる。しかしながら、ダイレクト方式は、日韓翻訳やノルウェー語−スウェーデン語翻訳の場合のように、翻訳元言語と翻訳先言語間で文法が似通っている場合にのみ有効な方式である。
【0009】
一方、トランスファー方式は、解析過程、変換過程、生成過程という3つの過程から成る。ここで言う解析過程では、翻訳元言語で書かれた文を構文解析して、構文構造を生成する。構文解析では、自然言語文を受け取り、文法規則に基づいて単語(文節)間の係り受け関係を決定する処理が行なわれる。翻訳元言語で書かれた文を形態素解析し、さらに構文解析を行ない、木構造を得る。そして、翻訳元言語と翻訳先言語間の木構造変換規則を用いて、翻訳先言語における構文解析木を得る。
【0010】
ここで、「少女が望遠鏡で男を見た。」という日本語文を翻訳元言語の文として、英語に機械翻訳する場合を例にとって、トランスフォー方式について考察してみる。
【0011】
図28には、「少女が望遠鏡で男を見た。」という日本語文の解析過程を経た後の句構造(構文構造)表現を示している。図示の構文解析木は、文のまとめあげ関係を記述した木構造の末端に単語が付されている。続く変換過程は「翻訳元言語の構文構造から翻訳先言語の構文構造への変換」及び「翻訳先言語の訳語の選択」という2種の処理で構成される。図29には、図28に示した日本語構文構造を英語の構文構造に変換し、さらに、適切な訳語を付与した例を示している。構文構造の変換は、基本的には木構造間の対応付けであり、言語間の木構造の対応関係を記述した変換規則を各ノードや部分構造に適用することによって実行される。
【0012】
翻訳先言語の訳語の選択には、翻訳元言語と翻訳先言語の単語の対応関係を記述した対訳辞書を用いる。例えば、対訳辞書中には、上記の日本語文中の「見る」という単語に対応する英語単語として、「see」、「look」、「glance」、「watch」、「gaze」などの訳語候補が記述されている。対訳辞書中の単語候補の中から、文中の他の単語との同時出現確率や木構造中の特定位置での出現確率といった情報を用いて訳語を1つに絞る処理を実行する。
【0013】
続く生成過程は、変換過程で得られた翻訳先言語の構文構造から、翻訳先言語文(翻訳結果)を生成する過程である。生成過程では、翻訳先言語の文としてより自然な表現にするための処理が行なわれる。例えば、上記の日本語文中の「少女」を「the girl」とするか「a girl」とするかを文脈情報などを参照することによって決定する。
【0014】
トランスファー方式を構成する上述した3つの過程の中で、変換過程は大きな誤訳を回避するという点において最も重要なものである。しかしながら、実際には翻訳元言語の構文構造を翻訳先言語の構文構造に変換する変換規則を、すべての構文構造に対して網羅的に記述しておくことは現実的ではない。
【0015】
そこで、既存の機械翻訳システムでは、用例に基づく翻訳(Example−Based Machine Translation:EBMT)と呼ばれる手法を用いている。EBMTに基づく機械翻訳システムでは、人手で書かれた翻訳元言語の文(翻訳元用例文)と翻訳先言語の文(翻訳先用例文)の対訳対をあらかじめ多数用意しておく。そして、EBMTに基づく機械翻訳システムに翻訳元言語の入力文が与えられると、既に存在する翻訳元用例文の中から入力文に最も類似するものを選択し、その翻訳元用例文と対を成す翻訳先用例文を模倣することによって翻訳を行なう。入力文と同一の文が翻訳元用例文集合中に見つかれば、対応する翻訳先用例文をそのまま出力し、入力文とは異なっていても極めて類似度の高い翻訳元用例文が見つかれば、対応する翻訳先用例文の単語あるいはフレーズを一部変更するだけで高い品質の翻訳結果を得ることができる。
【0016】
EBMTに基づく機械翻訳システムの長所は、対訳対を用意するだけで、変換過程で必要な変換規則を詳細に記述することなしに、それと同等の効果を得ることができる点にある。
【0017】
一方で、Lexical Functional Grammar (LFG)やHead−driven Phrase Structure Grammar (HPSG)といった文法理論に基づいた、より深い解析(意味解析)手法を用いて精度の高い機械翻訳を実現しようとする研究が行なわれている。すなわち、翻訳元言語を特定の言語に依存しない中間言語に変換し、その後、中間言語をターゲット言語に変換するという処理が行なわれ、インターリンガ方式とも呼ばれる。
【0018】
前者のLFGでは、ネイティブ・スピーカの言語知識すなわち文法を、コンピュータ処理や、コンピュータの処理動作に影響を及ぼすその他の非文法的な処理パラメータとは切り離したコンポーネントとして構成している(例えば、非特許文献1を参照のこと)。意味解析では、単語(文節)間の係り受け関係に基づいて、文中の格関係を決定する処理が行なわれる。とりわけ、LFGに基づく意味解析では、入力文に対して、その構文構造だけではなく、格構造(主格、目的格など)や、時制、様相、態(受動態、能動態)、話法など、さまざまな情報をfunctional structure(f−structure)と呼ばれる属性と属性値からなるマトリックス構造で出力する。さらにf−structureは、同じ意味を表現する文に対しては、言語が異なっていても基本的に等価な構造として出力されるという特徴を持っている。f−structure中で、言語に固有の単語レベルの情報は異なるが、その他の構造は基本的に等価になる。すなわち、f−structureには言語普遍性があり、インターリンガ方式における中間言語として利用することができる。
【0019】
なお、LFG以外でも、例えばC.J.Fillmoreによって提唱された格文法(case grammar)を、言語普遍性を持つ解析結果を得ることができる文法理論の例として挙げることができる。
【0020】
LFGの出力するf−structureでは、文の単語情報、構文構造を示す格情報、時制、様相などの属性情報のすべてを、属性と属性値のペアの入れ子構造で表現する。すなわち、文を「属性と属性値のペア」の集合で表現し、また、属性値はさらにその入れ子として「属性と属性値のペア」の集合となり得る。この中で、文を構成するそれぞれの単語は、PRED(predicate: 述語)と呼ばれる属性に対応する属性値としてf−structure中に記述されることになる。
【0021】
f−structure中で言語に依存して変化する部分はこのPREDに対応する属性値(単語)のみであり、その他の属性及び属性値は、全言語を通して共通化(標準化)されている。すなわち、LFGの出力するf−structureは言語普遍性を持つ。
【0022】
図30には、日本語文「太郎は花子にプレゼントを渡した。」をLFGにより解析した結果得られるf−structureの例を示している。同図に示すように、属性とそれに対応する属性値は水平の位置に並べることによって表現される。また、属性値はさらにその入れ子として「属性と属性値のペア」の集合として表現される。同図中で下線を引いて示した部分が単語情報(PRED属性に対応する属性値)であり、その他の部分は(表記上は英語で表現されているが)すべての言語に共通の概念である。
【0023】
したがって、翻訳元言語文に対してLFGに基づく意味解析処理を施すことによって翻訳元言語のf−structureを取得し、それを翻訳先言語のf−structureに変換し、得られたf−structureから翻訳先言語の文を生成するという手順でより品質のよい機械翻訳を実現することができる(例えば、非特許文献2を参照のこと)。
【0024】
このようなf−structureを中間言語とする機械翻訳システムの問題点は、翻訳先言語のf−structureから翻訳先言語の文を生成する過程にある。すなわち、f−structureは、文の情報を抽象化して(表層的な情報の一部を捨象して)得られる構造であるため、1つのf−structureから生成可能な文が多数存在する可能性がある。このため、複数の翻訳結果候補の中から翻訳先言語の文として自然な表現を選択するためには、f−structure以外の情報が必要となる。例えば、トランスファー方式(前述)と同様、膨大な量の翻訳先用例文をあらかじめ用意しておき、それらのいずれかと類似する翻訳結果候補を選択するという手法が考えられる。
【0025】
上述したように、EBMTに基づく機械翻訳システムでは、トランスファー方式の変換過程において詳細な変換規則を記述する代わりに、多数の対訳対(用例対)を用意することによって翻訳を実現することができる。ところが、変換規則は言語の文法現象を一般化したものであり、1つの規則で多数の文をカバーできる広い適用範囲を持つという性格を有するのに対して、用例は、そもそもが個々の文に固有の特徴を表現するものに過ぎない。このため、言語現象全体をカバーするためには膨大な数の用例対を用意しておく必要がある。
【0026】
用例対は人手で作成する必要があるため、実際には言語現象全体をカバーするに足る量の用例対を用意することは不可能である。このため、用例対によってカバーできる言語現象の範囲は個々の機械翻訳システムで偏りが生じることになる。ある機械翻訳システムでは、特定の分野あるいは特定の言語現象に対応する用例対が数多く用意され、当該分野あるいは言語現象に関する文の翻訳は高い精度で実現できる反面、そこから外れる文に対する翻訳結果の品質は極めて低いものとなってしまう。別の機械翻訳システムでも同様の状況が起こり、さらに、どの分野あるいは言語現象がその機械翻訳システムにとって得意な範囲であるかは、用例対がたまたま多く用意されていることにのみ依存するため、ユーザが予想することはできない。
【0027】
このように用例の数が増えるほど翻訳精度が向上するというEBMTに基づく現状の機械翻訳システムの性格を勘案すれば、多くの異なる機械翻訳システムを入手し、それらに同一の文を翻訳させることにより、それらの中から品質の高い翻訳結果が得られる可能性は格段に高まることになる。しかしながら、どの翻訳結果の品質が最も高いものであるかは、翻訳結果を人手で読み比べて判断するしかない。このため、多くの機械翻訳システムを用意すればするほど、その比較判断に要するコストが問題となってしまう。
【0028】
【非特許文献1】
R. M. Kaplan及びJ. Bresnan共著“Lexical-Functional Grammar: A Formal System for Grammatical Representation”(The MIT Press, Cambridge (1982). Reprinted in Formal Issues in Lexical-Functional Grammar, pp. 29-130. CSLI publications, Stanford University(1995).)
【非特許文献2】
Frank, A.著“From Parallel Grammar Development towards Machine Translation."(In Proceedings of MT Summit VII, "MT in the Great Translation Era", Singapore, pp. 134-142. (1999))
【0029】
【発明が解決しようとする課題】
本発明の目的は、翻訳元言語の入力文に対する意味解析結果を利用して翻訳結果文を好適に得ることができる、優れた機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムを提供することにある。
【0030】
本発明のさらなる目的は、LFGに基づく意味解析結果を利用して翻訳元言語の入力文を翻訳先言語に好適に変換することができる、優れた機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムを提供することにある。
【0031】
本発明のさらなる目的は、LFGの出力するf−structureの持つ言語普遍性を利用してより最適な翻訳結果文を出力することができる、優れた機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムを提供することにある。
【0032】
【課題を解決するための手段及び作用】
本発明は、上記課題を参酌してなされたものであり、翻訳元言語文を翻訳先言語に変換する機械翻訳システムであって、
翻訳元言語文を翻訳先言語に翻訳する翻訳手段と、
翻訳元言語文を意味解析する第1の意味解析手段と、
前記翻訳手段による翻訳結果文を意味解析する第2の意味解析手段と、
前記第1の意味解析手段による意味解析結果と前記第2の意味解析手段による意味解析結果を比較する翻訳結果文比較手段と、
を具備することを特徴とする機械翻訳システムである。
【0033】
ここで、前記翻訳手段は、翻訳元言語文を翻訳先言語文へ変換する複数の翻訳副手段を備えていてもよい。翻訳副手段は、例えば市販の機械翻訳システムやWeb上で有償又は無償で公開されている翻訳サービスなどである。このような場合、前記第2の意味解析手段は、前記の各翻訳副手段による翻訳結果文をそれぞれ意味解析する。そして、前記翻訳結果文比較手段は、前記の各翻訳副手段による翻訳結果文の意味解析結果を前記第1の意味解析手段による意味解析結果と比較し、例えば翻訳元言語文と類似度の高い意味解析結果を持つ1又はそれ以上の翻訳結果文を最適な翻訳文として出力する。
【0034】
図1には、本発明に係る機械翻訳システムの基本的な機能構成を模式的に示している。前記第1及び第2の意味解析手段は、LFGに基づいて記述された該当する言語に関する文法規則を備え、前記文法規則を参照することにより入力された言語文に対してLFGに基づく解析を施し、functional−structureという言語普遍性のある形式で意味解析結果を出力する。そして、前記翻訳結果文比較手段は、言語普遍性のある意味解析結果を中間言語方式の機械翻訳システムに直接利用するのではなく、翻訳元言語で書かれた入力文と複数の機械翻訳システムから出力される翻訳先言語で書かれた翻訳結果文との比較判断に利用することにより、最も品質の高い翻訳結果を取得することができる。
【0035】
本発明に係る機械翻訳システムは、前記第1及び第2の意味解析手段から得られるfunctional−structureを格関係に基づく木構造に変換する木構造変換手段をさらに備えていてもよい。このような場合、前記翻訳結果文比較手段は、前記木構造変換手段から得られる翻訳元言語文と翻訳結果文についての木構造用いてより効率的に意味解析結果同士の比較を行なうことができる。
【0036】
前記翻訳結果文比較手段は、前記第1の意味解析手段による翻訳元言語文に対する意味解析結果と、前記第2の意味解析手段による前記の各翻訳副手段からの翻訳結果文に対する意味解析結果を比較し、その類似度に応じて前記の各翻訳副結果手段からの翻訳結果文のそれぞれについて翻訳結果の信頼度を付与するようにしてもよい。
【0037】
現状では、LFGやHPSGに基づく意味解析に基づく機械翻訳システムは実用化のレベルに達しているとは言い難い。これは、主に意味解析結果から翻訳先言語文を生成する過程に問題があり、EBMTの手法と同様に、用意することができる用例の数に翻訳品質が依存するという点に由来する。
【0038】
一方、現在実用化されている機械翻訳システムのほとんどは、EBMTに基づくものである。既に述べたようにEBMTに基づく機械翻訳システムでは、変換規則および用例対が大きな役割を果たす。入力文の構文に偶然合致する変換規則が存在する場合、あるいは入力文と類似度の高い用例がたまたま存在する場合には高品質の翻訳結果が得られる反面、変換規則が十分に記述されておらず、入力文と類似度の高い用例が存在しない場合には翻訳結果の品質は極めて低いものになってしまう。
【0039】
このような問題を解決するためには、多数のEBMTに基づく機械翻訳システムを用意して翻訳を実行し、翻訳結果を比較する手法が有効である。ある翻訳元言語と翻訳先言語のペアを対象とする既存のすべての機械翻訳システムを用意して、その中から適切な翻訳結果が選択することができれば、それが現状の技術における最高品質の機械翻訳結果であると推定することができる。
【0040】
本発明によれば、翻訳元言語文に対して多数の既存の機械翻訳システムを用意する。そして、すべての機械翻訳システムを用いて翻訳を実行し、これらの翻訳結果を比較する。比較の際に、翻訳元言語文と翻訳結果の類似性(翻訳結果の正当性)を翻訳品質を計測する尺度として、両者の意味解析結果を利用する。両者の意味解析結果が類似していればしているほど、同じ意味内容を表現している(翻訳結果としての品質が高い)ことになるので、最適な翻訳結果を自動的に選択することが可能となる。
【0041】
意味解析結果から翻訳先言語文を生成することは難しいが(前述)、翻訳元言語文及び翻訳先言語文からそれぞれLFGなどの文法理論に基づいて意味解析結果を生成することは現状の技術においても十分可能である。
【0042】
ここで、入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られないという事態も想定される。このような場合、前記第1及び第2の意味解析手段は、解析可能な部分解析結果又は部分functional−structureの集合を出力し、前記翻訳結果文比較手段は、前記第1及び第2の意味解析手段から出力される解析可能な部分解析結果又は部分functional−structureの集合を比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文を出力するようにすればよい。
【0043】
また、前記第1の意味解析手段から得られる翻訳元言語文についての意味解析結果に基づいて該翻訳元言語文を部分構造に分割する入力文分割手段をさらに備えていてもよい。このような場合、前記翻訳結果文比較手段は、前記入力文分割手段から得られる部分構造に対応する各部分意味解析結果と類似する部分意味解析結果を前記の各翻訳副手段から得られた翻訳結果文についての意味解析結果から抽出し、得られた部分意味解析結果に対応する翻訳先言語で書かれたテキスト部分を出力するようにすればよい。また、前記翻訳結果文比較手段から得られるテキストを組み合わせることにより、翻訳結果文を生成することができる。
【0044】
例えば、入力日本語文のf−structureが最も外側にPARA(後述)の構造を持つ場合(2つ以上の単文が接続詞で単純に結合されている場合)には、入力日本語文を複数の部分構造(単文)に分割し、各単文毎に最適の英語訳を選択する、あるいは、それらの英語訳を結合してユーザに提示する、といった手法を実現することが可能である。
【0045】
また、本発明に係る機械翻訳システムは、翻訳先言語で書かれた複数の用例文を格納する用例文格納手段と、前記用例文格納手段に格納されている用例文を意味解析する第3の意味解析手段をさらに備えていてもよい。このような場合、前記翻訳結果文比較手段は、前記第1の意味解析手段による意味解析結果と、前記第2の意味解析手段による翻訳結果文の意味解析結果あるいは前記第3の意味解析結果による用例文の意味解析結果を比較し、翻訳結果よりも用例文の評価が高い場合には用例文を翻訳結果として採用する。
【0046】
他方、ことわざやその他の慣用句においては、いずれの翻訳副手段による翻訳結果文も翻訳言語文との間で意味解析結果が低いことがある。このような場合には、各翻訳副手段からの翻訳結果文に対する意味解析結果を比較し、翻訳結果文同士で意味解析結果の類似度が高い翻訳結果文を出力するようにしてもよい。
【0047】
また、前記の各翻訳副手段にあらかじめ優先順位を設定しておいてもよい。そして、記翻訳結果文比較手段は、優先順位を参照して、優先順位が上位となる翻訳副手段の翻訳結果を優先的に使用するようにしてもよい。
【0048】
また、前記第1の意味解析手段から得られる翻訳元言語文についてのfunctional−structureを翻訳先言語文の構文構造に従うfunctional−structureに変換するfunctional−structure変換手段をさらに備え、前記木構造変換手段は、前記functional−structure変換手段によって変換されたfunctional−structureを木構造に変換するようにしてもよい。
【0049】
また、本発明の第2の側面は、翻訳元言語文を翻訳先言語に変換する処理をコンピュータ・システム上で執行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
翻訳元言語文を翻訳先言語に翻訳する翻訳ステップと、
翻訳元言語文を意味解析する第1の意味解析ステップと、
前記翻訳手段による翻訳結果文を意味解析する第2の意味解析ステップと、
前記第1の意味解析手段による意味解析結果と前記第2の意味解析ステップによる意味解析結果を比較する翻訳結果文比較ステップと、
を具備することを特徴とするコンピュータ・プログラムである。
【0050】
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第1の側面に係る機械翻訳システムと同様の作用効果を得ることができる。
【0051】
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
【0052】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施形態について詳解する。
【0053】
第1の実施形態:
図2には、本発明の一実施形態に係る機械翻訳システムの機能構成を模式的に示している。機械翻訳システムは、例えばパーソナル・コンピュータ(PC)などの一般的な計算機システム上で機械翻訳アプリケーションを導入するという形態で実現可能である。
【0054】
入力文格納部1は、翻訳の対象となる日本語文を計算機内部に保持する。
【0055】
翻訳機能部2は、複数の翻訳サブブロック21−2nを内部に持つ。翻訳サブブロック21−2nは、独立したn個のプログラム・モジュールであり、それぞれがトランスファー方式によって日本語文を英語文へと翻訳することができる機械翻訳ツールである。翻訳サブブロックが単独の計算機上で動作するプログラムで構成される場合は、入力文格納部1に格納された日本語文を直接受け取り、翻訳結果の英語文を翻訳結果文格納部3に格納する。また、翻訳サブブロックがインターネットを介してアクセスされるWeb上の翻訳システムで構成される場合、入力文格納部1に格納された日本語文を(PUTあるいはPOSTなどのHTMLリクエストの形式で)Web翻訳システムに送信し、翻訳結果として得られた英語文を翻訳結果文格納部3に格納する。
【0056】
翻訳結果文格納部3は、翻訳サブブロック21−2nから得られるn個の翻訳結果としての英語文を計算機内部に保持する手段である。
【0057】
日本語文法規則格納部4は、日本語文に対してLFGに基づく意味解析を施すために必要となる日本語LFG文法規則及び語彙規則を計算機内部に保持する手段である。また、英語文法規則格納部5は、英語に対してLFGに基づく意味解析処理を施すために必要となる英語LFG文法規則及び語彙規則を計算機内部に保持する手段である。なお、LFGによる文法記述の詳細については、例えばDalrymple, M.著の論文“Syntax and Semantics -Lexical Functional Grammar”(Academic Press (2001))を参照されたい。
【0058】
LFG解析部6は、日本語文法規則格納部4に保持されている日本語LFG文法規則及び語彙規則と、英語文法規則格納部5に保持されている英語LFG文法規則及び語彙規則とを用いることにより、入力文格納部1に保持されている日本語文、及び翻訳結果文格納部3に保持されているn個の英語文に対してそれぞれLFGに基づく意味解析処理を施し、対応するf−structureを得る。
【0059】
意味解析では、単語(文節)間の係り受け関係に基づいて、文中の格関係を決定する処理が行なわれる。LFGに基づく意味解析結果であるf−structureでは、入力文の構文構造だけではなく、格構造(主格、目的格、保護、修飾語といった意味理解)や、時制、様相、態(受動態、能動態)、話法などさまざまな情報を、属性と属性値からなるマトリックス構造で出力する。図3には、日本語文「画家が赤い帽子と女性の絵を描いていた。」に対応するf−structureの一例を示している。
【0060】
f−structureは、同じ意味を表現する文に対しては、言語が異なっていても基本的に等価な構造として出力されるという特徴を持っている。なお、LFGによる意味解析結果の詳細については、Dalrymple, M.著の論文"Syntax and Semantics -Lexical Functional Grammar"(Academic Press (2001))を参照されたい。
【0061】
入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られないという事態も想定される。このような場合、LFG解析部6は、解析可能な部分解析結果又は部分f−structureの集合を出力するようにしてもよい。
【0062】
木構造変換部7は、LFG解析部6から得られる日本語文に対応するf−sturucture、並びに英語文に対応するn個のf−structureをそれぞれ木構造に変換する。基本的には、f−structure中のPRED属性に対応する属性値をすべて抽出し、f−structure上で外側のPREDが内側のPREDの親となるように属性値(各単語)を表すノード間を連結することにより、f−structureを木構造に変換することができる。ここで生成される木構造は、文のまとめあげ関係を記述した木構造の末端に単語が付される構文解析木(図29を参照のこと)とは相違する。木構造変換部7における変換のための詳細な手順は以下の通りである。
【0063】
[ステップ1]
f−structure中のPRED属性に対応する属性値をすべて抽出し、それぞれの属性値を木構造を構成するノードとする。但し、PRED属性が「pro」(代名詞)の場合には、同じ属性値内で代名詞の実体を表すPRON−FORM属性に対応する属性値を抽出してノードとし、PRON−FORM属性が存在しない場合はノードとしない。
【0064】
[ステップ2]
f−structure中に存在する属性−属性値ペアの入れ子構造の包含関係を、木構造のノード間の親子関係とみなし、ノードを接続して木構造を作成する。すなわち、あるノードn1に対応するPREDの属性値をv1とし、v1を包含する最も内側の属性値をv2とする。さらに、v2を包含する最も内側の属性値をv3とし、v3が持つPRED属性に対応する属性値をv4とすれば、v4に対応するノードをn1の親ノードn2とする(図4を参照のこと)。
【0065】
このようなノードn1に関する処理を上記の[ステップ1]で得られたすべてのノードに対して再帰的に行なう。但し、f−structure全体も1つの属性値であるとみなして処理を行なう。また、f−structure全体に対応する属性値が持つPRED属性の属性値に対応するノードに関しては、親ノードが存在しないため、木構造の根に対応するノードとみなす。f−structure全体に対応する属性値がPRED属性を持たない場合には、根に対応するノードはNULLの記号を持つものとする。
【0066】
上述した処理によって木構造が得られる(図5を参照のこと)。なお、図5中の「PARA」は並置構造を表現する記号であり、例外的にPREDの属性値が単語とならない。
【0067】
[ステップ3]
n1とn2を結ぶリンクに対して、v2とペアを成す属性を付与する。但し、ペアを成す属性が存在しない場合は何も付与しない。このようなノードn1に関する処理を、上記の[ステップ1]で得られたすべてのノードに対して行なう。但し、木構造の根に対応するノードに対しては処理を行なわない(図6を参照のこと)。
【0068】
[ステップ4]
n1に対して、v2内に存在する属性のうち、その属性とペアを成す属性値内にPREDを持たないものがあれば、その属性及びその属性とペアを成す属性値をn1の属性情報として付与する。このようなノードn1に関する処理を、上記の[ステップ1]で得られたすべてのノードに対して行なう(図7を参照のこと)。但し、あらかじめ設定された「木構造に含める属性のリスト」に従い、翻訳結果の比較に必要な属性のみをノードn1に付与する。
【0069】
日英単語辞書格納部8は、日本語の単語とその英訳単語の対応関係を記述した対訳辞書を計算機内部に保持する。
【0070】
対応ノード決定部9は、木構造変換部7から得られる木構造のうち、入力文格納部1に保持されている日本語文に対応する木構造(以下、「日本語木構造」とする)と、翻訳結果文格納部3に保持されている英語文に対応するn個の木構造(以下、「英語木構造」とする)の各々を比較し、日本語木構造中の各ノード(単語)と英語木構造中の各ノードの対応関係を決定する。ノード間の対応関係を決定する際には、日英単語辞書格納部8に保持されている対訳辞書を用いる。対応関係があると決定された(すなわち、日本語単語とその英訳単語であることが対訳辞書中に記載されていた)日本語木構造中のノードと英語木構造中のノードには、等しい識別子(ノード識別子)を付与する。また、対応関係が決定されなかったノードにはそれぞれ異なる識別子を付与する。
【0071】
翻訳結果文比較選択部10は、元の日本語入力文についての日本語木構造と、各翻訳サブブロックの翻訳結果についてのn個の英語木構造の各々を比較することにより、日本語木構造と最も類似する英語木構造を選択し、その英語木構造に対応する英語文をユーザに提示する。
【0072】
なお、LFG解析部6では、入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られないことがある。このような場合には、解析可能な部分解析結果又は部分functional−structureの集合を出力する(前述)。そして、翻訳結果比較選択部10は、翻訳元言語文や各翻訳サブブロックにおける翻訳結果文についての解析可能な部分解析結果あるいは部分f−structureの集合を比較することによって、最も類似する英語木構造を選択することができる。
【0073】
翻訳結果文比較選択部10において、最も類似する英語木構造を選択するための詳細な手順は以下の通りである。
【0074】
[ステップ1]
日本語木構造T中に存在するノード(ノード識別子)ペア、及びノード又はノード間リンクに付与された属性情報の組(ノード・ペア情報)をすべて抽出する。同様に、ある1つの英語木構造T中に存在するノード・ペア情報をすべて抽出する。
【0075】
[ステップ2]
日本語木構造Tと英語木構造Tの類似度を初期値0に設定する。日本語木構造Tから得られたすべてのノードペア情報と英語木構造Tから得られたすべてのノード・ペア情報を互いに比較する。そして、ノード・ペア情報が一致するものが見つかる毎に、日本語木構造Tと英語木構造Tの類似度に対して1を加算する。得られた類似度を英語木構造T中に存在するノード・ペア情報の数で除したものを新たに類似度とする。
【0076】
ここで、「ノード・ペア情報が一致する」とは、「ノードペア情報に含まれる全ての情報が完全に一致する」ことと定義する。但し、ノード及びノード間リンクに付与された属性に関しては、それらが完全に一致していない場合であっても「ノード・ペア情報が一致する」ものとし、一致しない情報の数をmとすれば、1を加算する代わりに、αを加算する。αは、あらかじめ設定された定数(0<α<1)である。
【0077】
[ステップ3]
以上の、英語木構造Tに対する処理をすべての翻訳サブブロックによる翻訳結果についての英語木構造に対して行ない、各翻訳結果についての日本語木構造Tとの類似度を決定する。日本語木構造Tとの間で最も大きい類似度値を持つ英語木構造Tを選択する。
【0078】
図31には、元の日本語文についての木構造と各翻訳結果の木構造との比較に基づいて最適な翻訳結果を選択するための処理手順をフローチャートの形式で示している。
【0079】
まず、日本語木構造をTJとし、各翻訳サブブロックから得られたn個の翻訳結果についての英語木構造をそれぞれTEx(x=1,2,…,n)とする(ステップS1)。
【0080】
また、日本語木構造TJ中に存在するノード識別子ペア及び属性情報の組(以下では、「ノード・ペア情報」とも呼ぶ)をすべて抽出し、PJy(y=1,2,…,p)とする(ステップS2)。
【0081】
そして、英語木構造のインデックスであるxに初期値1を代入する(ステップS3)。
【0082】
ここで、x番目の英語木構造TEx中に存在するノード識別子ペア及び属性情報についてのノード・ペア情報をすべて抽出し、これをPExz(z=1,2,…,q)とする(ステップS4)。
【0083】
また、日本語木構造TJと英語木構造TExの類似度S(TJ,TEx)を初期値0とし(ステップS5)、さらに変数y及びzに初期値1を代入する(ステップS6)。
【0084】
そして、日本語木構造TJのy番目のノード・ペア情報PJyとx番目の英語木構造TExのz番目のノード・ペア情報PExzに含まれるすべての情報が完全に一致していれば、類似度S(TJ,TEx)に1を加算する。また、ノード識別子ペアが一致しているが属性情報が一致していない場合には、位置していない属性情報の数をmとし、類似度S(TJ,TEx)に1を加算する代わりにαを加算する(ステップS7)。但し、αは、あらかじめ設定された定数(0<α<1)である。
【0085】
次いで、zがx番目の英語木構造TExのノード識別子ペアの総数qに到達したかどうかを判別し(ステップS8)、到達していなければ、zに1だけ加算し(ステップS13)、ステップS7に戻り、次の英語木構造TExのノード識別子ペアについて日本語木構造TJのy番目のノード・ペア情報PJyとの比較を継続して行なう。
【0086】
次いで、yが日本語木構造TJのノード識別子ペアの総数pに到達したかどうかを判別し(ステップS9)、到達していなければ、yに1だけ加算し(ステップS14)、ステップS7に戻り、日本語木構造TJの次のノード識別子ペアPJyについてx番目の英語木構造TExのz番目のノード・ペア情報PExzとの比較を継続して行なう。
【0087】
次いで、x番目の英語木構造TEx中に存在するノード・ペア情報の数で類似度S(TJ,TEx)を除した値を、新たに日本語木構造TJとx番目の英語木構造TExとの類似度S(TJ,TEx)とする(ステップS10)。
【0088】
そして、xが英語木構造の総数nに到達したかどうかを判別し(ステップS11)、到達していなければxに1だけ加算し(ステップS15)、ステップS4に戻り、日本語木構造TJのノード識別子ペアPJyと次の英語木構造TExのz番目のノード・ペア情報PExzとの比較を継続して行なう。
【0089】
一方、xが英語木構造の総数nに到達したならば、日本語木構造TJと最も大きい値を持つ類似度S(TJ,TEx)に対応する英語木構造TExを選択して(ステップS12)、本処理ルーチン全体を終了する。
【0090】
ここで、日本語文「誰が彼が学校へ来ることを知っていますか。」が入力文格納部1に入力された場合を例にとって、本実施形態に係る最適な翻訳文の選択処理について具体的に説明する。
【0091】
各翻訳サブブロック21−24 (n=4の場合)によって上記の日本語文が以下の4通りの英語文(1)〜(4)に訳されたとする。
【0092】
(1)Who knows that it comes to school
he?
(2)Someone you know that he comes to
school?
(3)Who knows he comes to school?
(4)Who knows coming to school for him?
【0093】
LFG解析部6は、日本語文法規則格納部4に保持されている日本語LFG文法規則及び語彙規則を用い入力文格納部1に保持されている日本語文を意味解析するとともに、英語文法規則格納部5に保持されている英語LFG文法規則及び語彙規則を用い翻訳結果文格納部3に保持されている各英語文に対してそれぞれLFGに基づく意味解析処理を施し、対応するf−structureを得る。図8には、LFG解析部6によって元の日本語文から得られるf−structureを示している。また、図9〜図12には、元の日本文を各翻訳サブブロックにより翻訳した英語文(1)〜(4)からLFG解析部6によって得られるf−structureを示している。
【0094】
図9及び図10に示すf−structureは、部分解析結果となっている。すなわち、英語文(1)と(2)は英語文法に従った文とはみなされず、部分的な解析結果のリスト構造となっている。図示の通り、図9及び図10中のFIRST属性及びREST属性は、このようなリスト構造を構成するための特殊な属性である。
【0095】
さらに、木構造変換部7によって、図8及び図9〜図12の各f−structureに対して得られる木構造を、LFG解析部6から得られる日本語文に対応するf−sturucture、並びに英語文に対応するf−structureをそれぞれ木構造に変換する。図13には、元の日本語文から得られるf−structureを木構造変換部7によって木構造に変換した結果を示している。また、図14〜17には、元の日本文を各翻訳サブブロックにより翻訳した英語文(1)〜(4)からLFG解析部6によって得られるf−structureをさらに木構造変換部7によって木構造に変換した結果を示している。なお、本実施形態では、ノードに付与する属性情報として、TENSE属性(現在(pres)などの時制を示す属性)とSTMT−TYPE属性(平常文(decl)、疑問文(int)などの文のタイプを示す属性)のみを選択している。
【0096】
次いで、対応ノード決定部9は、木構造変換部7から得られる日本語木構造と、各翻訳結果についての英語木構造をそれぞれ比較し、日本語木構造中の各ノード(単語)と英語木構造中の各ノードの対応関係を決定する。
【0097】
図18〜図22には、元の日本語文についての日本語木構造と、各翻訳サブブロックにより翻訳した英語文(1)〜(4)についての英語木構造の各ノードに対してノード識別子を付与した例を示している。これは、日英単語辞書格納部8中の対訳辞書により、「知る−know」、「誰−who」、「来る−come」、「彼−he」、「へ−to」、「学校−school」の対応関係が得られた場合の結果であり、対応するノードには等しい識別子が付与され、対応関係が得られなかったノードには互いに異なる識別子が付与されている。
【0098】
次いで、翻訳結果分比較選択部10は、それぞれの英語木構造について日本語木構造との類似度を計算する。ここでは、日本語木構造から得られたすべてのノードペア情報と英語木構造Tから得られたすべてのノード・ペア情報を互いに比較し、ノード・ペア情報が一致するものが見つかる毎に日本語木構造と英語木構造の類似度に対して1を加算する。そして、得られた類似度を英語木構造T中に存在するノード・ペア情報の数で除したものを新たに類似度とする。
【0099】
図18に示した元の日本語文の木構造と、図19〜22に示した各翻訳結果についての英語木構造の間の類似度を計算した結果をそれぞれ図23〜図26に示している。但し、ここでの計算ではα=0.9とした。
【0100】
図18に示した日本語木構造と図19に示した英語木構造を比較した場合、完全一致ノード・ペア情報数が3、非完全一致ノード・ペア情報数が1、全ノード・ペア情報数(リンク数)が7であることから、類似度は(3+0.9)/7=0.56である。また、図18に示した日本語木構造と図20に示した英語木構造を比較した場合、完全一致ノード・ペア情報数が1、非完全一致ノード・ペア情報数が1、全ノード・ペア情報数(リンク数)が6であることから、類似度は(1+0.9)/7=0.30である。また、図18に示した日本語木構造と図21に示した英語木構造を比較した場合、完全一致ノード・ペア情報数が4、非完全一致ノード・ペア情報数が1、全ノード・ペア情報数(リンク数)が5であることから、類似度は(4+0.9)/5=0.98である。また、図18に示した日本語木構造と図22に示した英語木構造を比較した場合、完全一致ノード・ペア情報数が3、非完全一致ノード・ペア情報数が1、全ノード・ペア情報数(リンク数)が6であることから、類似度は(3+0.9)/6=0.62である。
【0101】
これらの結果から、類似度が0.98となる図21に示した木構造が選択される。したがって、対応する英語文“Who knows he comes to school?”が、日本語文「誰が彼が学校へ来ることを知っていますか。」の英語訳として選択されることになる。
【0102】
本実施形態では最も類似度の高い英語文を選択するものとしたが、それぞれ算出された類似度を信頼度とみなし、その値の高いものから順にユーザに示すようにしても構わない。
【0103】
また、本実施形態では、翻訳結果文比較選択部10による比較をノード・ペアの一致数に基づく手法としたが、高橋哲郎、乾健太郎、松本裕治共著「テキストの構文的類似度の評価方法について」(情報処理学会研究報告,2002-NL-150,pp. 163-170(2002))で提案されているような、他の比較手法を用いても同様の効果が得られることを理解されたい。
【0104】
第2の実施形態:
ことわざやその他の慣用句においては、いずれの機械翻訳システムによる翻訳結果文も元の日本語文との間で意味解析結果が低いことがある。本発明の第2の実施形態では、各翻訳サブブロックからの翻訳結果文に対する意味解析結果を比較し、英語文同士で意味解析結果の類似度が高いものを翻訳結果として出力する。
【0105】
本実施形態に係る機械翻訳システムの機能構成は、図2に示したものと略同一である。但し、翻訳結果文比較選択部10における英語木構造の選択手順のみが異なる。すなわち、[ステップ3]において、すべての英語木構造に対して日本語木構造Tとの類似度を決定した後に、以下の処理を継続する。
【0106】
[ステップ4]
[ステップ2]で行った日本語木構造Tと英語木構造Tの間の類似度計算と同様の計算を、英語木構造のすべてのペアに対して行なう。ここで、英語木構造Teaと英語木構造Tebの間の類似度をS(Tea,Teb)とし、また、日本語木構造Tとの類似度をそれぞれS(T,Tea)、S(T,Teb)とする。
【0107】
[ステップ5]
S(T,Tea)<T
S(T,Teb)<T
S(Tea,Teb)>T
を満たす英語木構造Teaと英語木構造Tebの組み合わせがN個以上存在する場合、この条件を満たすすべての英語木構造Tea及び英語木構造Tebを最適な翻訳文についての木構造として選択する。但し、T、Tはあらかじめ値の設定された実数の定数(0<T<T<1)であり、Nはあらかじめ設定された整数の定数である。
【0108】
図32には、元の日本語文についての木構造と各翻訳結果の木構造との比較、並びに翻訳結果の木構造同士の比較に基づいて最適な翻訳結果を選択するための処理手順をフローチャートの形式で示している。
【0109】
ここでは、まず図31に示した処理手順に従って、日本語木構造TJと各翻訳サブブロックからの翻訳結果についての英語木構造TExとの類似度S(TJ,TEx)を求めるとともに、英語木構造TEx及びTEx’同士の類似度S(TEx,TEx’)を求める(ステップS21)。
【0110】
次いで、日本語木構造TJとの類似度が所定の閾値Tを下回るとともに、互いの類似度が所定の閾値Tを上回るような英語木構造の組み合わせTEx及びTEx’を求め、その組の数をtとする(ステップS22)。但し、T、Tはあらかじめ値の設定された実数の定数(0<T<T<1)であり、Nはあらかじめ設定された整数の定数である。
【0111】
次いで、tが所定の整数N以上かどうかを判別する(ステップS23)。tがN以上のときには、日本語木構造TJとの類似度が所定の閾値Tを下回るとともに、互いの類似度が所定の閾値Tを上回るという2つの条件を同時に満たす英語木構造の組み合わせTEx及びTEx’を選択して(ステップS24)、本処理ルーチン全体を終了する。
【0112】
一方、tがNを越えない場合には、最も大きな値を持つ類似度S(TJ,TEx)に対応する英語木構造TExを選択して(ステップS25)、本処理ルーチン全体を終了する。
【0113】
特にことわざや格言の場合では、構文的には全く異なる英文が正しい英訳となることが多い。例えば、日本語文「朱に交われば赤くなる。」の英語訳として英語文“The rotten apple injures its neighbors.”は正しいものであるが、直接表現する意味内容は大きく異なる。
【0114】
EBMTに基づく翻訳システムでは、このような慣用的な表現が用例として収集されていれば、正しく翻訳することが可能である。本実施形態に係る機械翻訳システムは、このような状況に対処するものである。
【0115】
このような慣用的、すなわち、繰り返し使われる表現はEBMTに基づく翻訳システムにおいて、用例対集合の中に既に収集されている可能性が極めて高い。したがって、多くの翻訳サブブロックから類似度の高い英訳文が出力され、且つ、それらが日本語文と類似度が低い場合は、慣用的表現とみなして正しい英語訳であると認定する。
【0116】
第3の実施形態:
図27には、本発明の第3の実施形態に係る機械翻訳システムの機能構成を模式的に示している。同図に示す機械翻訳システムは、翻訳先言語(英語)で書かれた複数の用例文を格納する用例文格納部11をさらに備えている。
【0117】
この場合、LFG解析部6は、日本語文法規則格納部4に保持されている日本語LFG文法規則及び語彙規則を用い入力文格納部1に保持されている日本語文を意味解析し、英語文法規則格納部5に保持されている英語LFG文法規則及び語彙規則を用い翻訳結果文格納部3に保持されている各英語文に対してそれぞれLFGに基づく意味解析するとともに、英語文法規則格納部5に保持されている英語LFG文法規則及び語彙規則を用い用例文格納部11から翻訳先言語(英語)で書かれた複数の用例文を取り出してこれらに意味解析処理を施す。
【0118】
そして、木構造変換部7は、元の日本語文、翻訳結果文、並びに用例分についてのf−structureを木構造に変換するあるいは、各用例文について意味解析処理をあらかじめ施し、これらのf−structure又はその木構造を蓄積し、適宜取り出すようにしてもよい。
【0119】
対応ノード決定部9は、木構造変換部7から得られる日本語木構造と、各翻訳結果についての英語木構造、さらには用例分についての英語木構造をそれぞれ比較し、日本語木構造中の各ノード(単語)と英語木構造中の各ノードの対応関係を決定する。
【0120】
そして、翻訳結果分比較選択部10は、それぞれの英語木構造について日本語木構造との類似度を計算する。
【0121】
このような場合、翻訳結果よりも用例文の評価が高い場合には用例文を翻訳結果として採用することができる。
【0122】
第4の実施形態:
入力された日本語文が複数の部分構造に分割可能な場合には、上述した翻訳、日本語文及び英語文の意味解析、木構造変換、対応ノード決定並びに翻訳結果文の比較処理を部分構造毎に実行する。そして、最も類似度の高い部分英語訳の並びを出力する、あるいは、類似度の高い部分訳を組み合わせることによって翻訳英語文を生成した上でユーザに提示することも可能である。
【0123】
例えば、入力日本語文のf−structureが最も外側にPARAの構造を持つ場合(2つ以上の単文が接続詞で単純に結合されている場合)には、入力日本語文を複数の部分構造(単文)に分割し、各単文毎に最適の英語訳を選択する、あるいは、それらの英語訳を結合してユーザに提示する、といった手法を実現することが可能である。
【0124】
第5の実施形態:
翻訳機能部2内の翻訳サブブロックは、例えば市販の機械翻訳システムやWeb上で有償又は無償で公開されている翻訳サービスなどで構成される。
【0125】
翻訳サブブロックがインターネットを介してアクセスされるWeb上の翻訳システムの場合、入力文格納部1に格納されている文を含むWebページとしてインターネット上に公開する。
【0126】
第6の実施形態:
翻訳元言語文を翻訳先言語文に直接翻訳する翻訳システムが存在しない場合、翻訳元言語から翻訳することが可能な翻訳システムが存在し、且つ、翻訳先言語へと翻訳することが可能な翻訳システムも存在する第3の言語を設定する。
【0127】
この場合、まず第3の言語を本発明に係る機械翻訳システムの翻訳先言語文に設定して、翻訳元言語文を第3の言語へと翻訳した翻訳結果文を得る。そして、さらに第3の言語を本発明に係る機械翻訳システムの翻訳元言語文に設定して、目的とする翻訳先言語文への翻訳結果文を得ることができる。
【0128】
[追補]
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
【0129】
【発明の効果】
以上詳記したように、本発明によれば、LFGに基づく意味解析結果を利用して翻訳元言語の入力文を翻訳先言語に好適に変換することができる、優れた機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムを提供することができる。
【0130】
また、本発明によれば、LFGの出力するf−structureの持つ言語普遍性を利用してより最適な翻訳結果文を出力することができる、優れた機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムを提供することができる。
【0131】
本発明によれば、意味解析技術を中間言語方式の機械翻訳システムに直接利用するのではなく、翻訳元言語で書かれた入力文と複数の機械翻訳システムから出力される翻訳先言語で書かれた翻訳結果文との比較判断に利用することにより、最も品質の高い翻訳結果を取得することができる。
【0132】
本明細書では、日本語から英語への翻訳を行なう実施形態を例として挙げているが、言語の如何に関わらず同等の効果が得られることは明らかである。また、意味解析処理としてLFGに基づく解析を行う実施形態としたが、複数の言語間で比較可能な解析結果を出力するものであればいかなる意味解析の手段を利用しても同等の効果が得られるということを充分理解されたい。
【0133】
要するに、本発明によれば、複数の翻訳システムの翻訳結果から最適な訳を自動選択することが可能となる。既存のすべての機械翻訳システムを用意し、その中から適切な翻訳結果を選択することにより、結果として現状の技術における最高品質の機械翻訳結果を適宜得ることができる。
【図面の簡単な説明】
【図1】本発明に係る機械翻訳システムの基本的な機能構成を模式的に示した図である。
【図2】本発明の一実施形態に係る機械翻訳システムの機能構成を模式的に示した図である。
【図3】日本語文「画家が赤い帽子と女性の絵を描いていた。」に対応するf−structureの一例を示した図である。
【図4】図3に示したf−structureを木構造に変換する処理を説明するための図である。
【図5】図3に示したf−structureを木構造に変換する処理を説明するための図である。
【図6】図3に示したf−structureを木構造に変換する処理を説明するための図である。
【図7】図3に示したf−structureを木構造に変換する処理を説明するための図である。
【図8】LFG解析部6によって元の日本語文「誰が彼が学校へ来ることを知っていますか。」から得られるf−structureを示した図である。
【図9】英語文(1)からLFG解析部6によって得られるf−structureを示した図である。
【図10】英語文(2)からLFG解析部6によって得られるf−structureを示した図である。
【図11】英語文(3)からLFG解析部6によって得られるf−structureを示した図である。
【図12】英語文(4)からLFG解析部6によって得られるf−structureを示した図である。
【図13】元の日本語文「誰が彼が学校へ来ることを知っていますか。」から得られるf−structureを木構造変換部7によって木構造に変換した結果を示した図である。
【図14】英語文(1)からLFG解析部6によって得られるf−structureを木構造変換部7によって木構造に変換した結果さらに示した図である。
【図15】英語文(2)からLFG解析部6によって得られるf−structureを木構造変換部7によって木構造に変換した結果さらに示した図である。
【図16】英語文(3)からLFG解析部6によって得られるf−structureを木構造変換部7によって木構造に変換した結果さらに示した図である。
【図17】英語文(4)からLFG解析部6によって得られるf−structureを木構造変換部7によって木構造に変換した結果さらに示した図である。
【図18】元の日本語文「誰が彼が学校へ来ることを知っていますか。」についての日本語木構造の各ノードに対してノード識別子を付与した例を示した図である。
【図19】19英語文(1)についての英語木構造の各ノードに対してノード識別子を付与した例を示した図である。
【図20】英語文(2)についての英語木構造の各ノードに対してノード識別子を付与した例を示した図である。
【図21】英語文(3)についての英語木構造の各ノードに対してノード識別子を付与した例を示した図である。
【図22】英語文(4)についての英語木構造の各ノードに対してノード識別子を付与した例を示した図である。
【図23】図18に示した日本語木構造と図19に示した英語木構造の間に類似度を計算した結果を示した図である。
【図24】図18に示した日本語木構造と図20に示した英語木構造の間に類似度を計算した結果を示した図である。
【図25】図18に示した日本語木構造と図21に示した英語木構造の間に類似度を計算した結果を示した図である。
【図26】図18に示した日本語木構造と図22に示した英語木構造の間に類似度を計算した結果を示した図である。
【図27】本発明の第3の実施形態に係る機械翻訳システムの機能構成を模式的に示した図である。
【図28】「少女が望遠鏡で男を見た。」という日本語文の句構造(構文構造)表現を示した図である。
【図29】図28に示した日本語構文構造を英語の構文構造に変換し、さらに、適切な訳語を付与した例を示した図である。
【図30】日本語文「太郎は花子にプレゼントを渡した。」をLFGにより解析した結果得られるf−structureの例を示した図である。
【図31】元の日本語文についての木構造と各翻訳結果の木構造との比較に基づいて最適な翻訳結果を選択するための処理手順を示したフローチャートである。
【図32】元の日本語文についての木構造と各翻訳結果の木構造との比較、並びに翻訳結果の木構造同士の比較に基づいて最適な翻訳結果を選択するための処理手順を示したフローチャートである。
【符号の説明】
1…入力文格納部
2…翻訳機能部
21−2n…翻訳サブブロック
3…翻訳結果文格納部
4…日本語文法規則格納部
5…英語文法規則格納部
6…LFG解析部
7…木構造変換部
8…日英単語辞書格納部
9…対応ノード決定部
10…翻訳結果文比較選択部
11…用例文格納部

Claims (21)

  1. 翻訳元言語文を翻訳先言語に変換する機械翻訳システムであって、
    翻訳元言語文を翻訳先言語文へ変換する複数の翻訳副手段を備え、翻訳元言語文を翻訳先言語に翻訳する翻訳手段と、
    翻訳元言語文を意味解析する第1の意味解析手段と、
    前記の各翻訳副手段による翻訳結果文を意味解析する第2の意味解析手段と、
    前記第1及び第2の意味解析手段による意味解析結果を格関係に基づく木構造に変換する木構造変換手段と、
    前記の各翻訳副手段による翻訳結果文の意味解析結果を前記第1の意味解析手段による意味解析結果と比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文を出力する翻訳結果文比較手段と、
    を備え、
    前記第1及び第2の意味解析手段は、意味解析結果として、解析対象の文を、文の単語情報、構文構造を示す格情報、時制、様相を含む属性情報を、属性(PRED)と対応する属性値(単語)のペアの入れ子構造で表現し、
    前記木構造変換手段は、意味解析結果中の属性に対応する属性値をすべて抽出し、入れ子の外側の属性が内側の属性の親になるように属性値(各単語)を表すノード間をリンクで連結するとともに、外側の属性値とペアをなす属性を該リンクに付与して、意味解析結果の木構造を生成し、
    前記翻訳結果文比較手段は、翻訳元言語文及び翻訳結果文それぞれについての意味解析結果の木構造から、ノード・ペア、及びノード又はノード間リンクに付与された属性情報の組からなるノード・ペア情報を抽出し、翻訳元言語文及び翻訳結果文の間で一致するノード・ペア情報の個数に基づいて類似度を算出する、
    ことを特徴とする機械翻訳システム。
  2. 前記第1及び第2の意味解析手段は、Lexical Functional Grammarに基づいて記述された該当する言語に関する文法規則を備え、前記文法規則を参照することにより入力された言語文に対してLexical Functional Grammarに基づく解析を施し、functional−structureを出力し、
    前記翻訳結果文比較手段は、前記第1及び第2の意味解析手段から出力される翻訳元言語文と翻訳結果文のfunctional−structureの木構造を比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文を出力する、
    ことを特徴とする請求項1に記載の機械翻訳システム。
  3. 前記第1及び第2の意味解析手段は、入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られない場合には、解析可能な部分解析結果又は部分functional−structureの集合を出力し、
    前記翻訳結果文比較手段は、前記第1及び第2の意味解析手段から出力される文全体に対応する意味解析結果又はfunctional−structure、あるいは解析可能な部分解析結果又は部分functional−structureの集合を比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文を出力する、
    ことを特徴とする請求項1又は2のいずれかに記載の機械翻訳システム。
  4. 前記第1の意味解析手段から得られる翻訳元言語文についての意味解析結果に基づいて該翻訳元言語文を部分構造に分割する入力文分割手段をさらに備え、
    前記翻訳結果文比較手段は、前記入力文分割手段から得られる部分構造に対応する各部分意味解析結果と類似する部分意味解析結果を前記の各翻訳副手段から得られた翻訳結果文についての意味解析結果から抽出し、得られた部分意味解析結果に対応する翻訳先言語 で書かれたテキスト部分を出力する、
    ことを特徴とする請求項3に記載の機械翻訳システム。
  5. 翻訳先言語で書かれた複数の用例文を格納する用例文格納手段と、
    前記用例文格納手段に格納されている用例文を意味解析する第3の意味解析手段をさらに備え、
    前記翻訳結果文比較手段は、前記第1の意味解析手段による意味解析結果と、前記第2の意味解析手段による翻訳結果文の意味解析結果あるいは前記第3の意味解析結果による用例文の意味解析結果を比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文あるいは用例文を出力する、
    ことを特徴とする請求項1に記載の機械翻訳システム。
  6. 前記翻訳結果文比較手段は、前記第1の意味解析手段による翻訳元言語文に対する意味解析結果と、前記第2の意味解析手段による前記の各翻訳副手段からの翻訳結果文に対する意味解析結果を比較し、前記第1の意味解析手段による翻訳元言語文に対する意味解析結果と各翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度よりも、いずれか2以上の翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度の方が高い場合には、当該2以上の翻訳副手段からの翻訳結果文を最適な翻訳結果として選択する、
    ことを特徴とする請求項1に記載の機械翻訳システム。
  7. 前記第1の意味解析手段から得られる翻訳元言語文についてのfunctional−structureを翻訳先言語文の構文構造に従うfunctional−structureに変換するfunctional−structure変換手段をさらに備え、
    前記木構造変換手段は、前記functional−structure変換手段によって変換されたfunctional−structureを木構造に変換する、
    ことを特徴とする請求項2に記載の機械翻訳システム。
  8. コンピュータを用いて構築される機械翻訳システム上で、翻訳元言語文を翻訳先言語に変換する機械翻訳方法であって、
    前記コンピュータが備える翻訳手段が、翻訳元言語文を翻訳先言語文へ変換する複数の翻訳サブステップにより翻訳元言語文を翻訳先言語にそれぞれ翻訳する翻訳ステップと、
    前記コンピュータが備える第1の意味解析手段が、翻訳元言語文を意味解析する第1の意味解析ステップと、
    前記コンピュータが備える第2の意味解析手段が、前記の各翻訳サブステップによる翻訳結果文をそれぞれ意味解析する第2の意味解析ステップと、
    前記コンピュータが供える木構造変換手段が、前記第1及び第2の意味解析手段による意味解析結果を格関係に基づく木構造に変換する木構造変換ステップと、
    前記コンピュータが備える翻訳結果比較手段が、前記の各翻訳サブステップによる翻訳結果文の意味解析結果を前記第1の意味解析ステップによる意味解析結果と比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文を出力する翻訳結果文比較ステップと、
    を備え、
    前記第1及び第2の意味解析ステップでは、意味解析結果として、解析対象の文を、文の単語情報、構文構造を示す格情報、時制、様相を含む属性情報を、属性(PRED)と対応する属性値(単語)のペアの入れ子構造で表現し、
    前記木構造変換ステップでは、意味解析結果中の属性に対応する属性値をすべて抽出し、入れ子の外側の属性が内側の属性の親になるように属性値(各単語)を表すノード間をリンクで連結するとともに、外側の属性値とペアをなす属性を該リンクに付与して、意味解析結果の木構造を生成し、
    前記翻訳結果文比較ステップでは、翻訳元言語文及び翻訳結果文それぞれについての意 味解析結果の木構造から、ノード・ペア、及びノード又はノード間リンクに付与された属性情報の組からなるノード・ペア情報を抽出し、翻訳元言語文及び翻訳結果文の間で一致するノード・ペア情報の個数に基づいて類似度を算出する、
    を具備することを特徴とする機械翻訳方法。
  9. 前記第1及び第2の意味解析ステップでは、Lexical Functional Grammarに基づいて記述された該当する言語に関する文法規則を参照することにより入力された言語文に対してLexical Functional Grammarに基づく解析を施し、functional−structureを出力し、
    前記翻訳結果文比較ステップでは、前記第1及び第2の意味解析ステップにより得られる翻訳元言語文と翻訳結果文のfunctional−structureを比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文を出力する、
    ことを特徴とする請求項8に記載の機械翻訳方法。
  10. 前記第1及び第2の意味解析ステップでは、入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られない場合には、解析可能な部分解析結果又は部分functional−structureの集合を出力し、
    前記翻訳結果文比較ステップでは、前記第1及び第2の意味解析ステップにより得られる文全体に対応する意味解析結果又はfunctional−structure、あるいは解析可能な部分解析結果又は部分functional−structureの集合を比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文を出力する、
    ことを特徴とする請求項8又は9のいずれかに記載の機械翻訳方法。
  11. 前記第1の意味解析ステップにより得られる翻訳元言語文についての意味解析結果に基づいて該翻訳元言語文を部分構造に分割する入力文分割ステップをさらに備え、
    前記翻訳結果文比較ステップでは、前記入力文分割ステップにより得られる部分構造に対応する各部分意味解析結果と類似する部分意味解析結果を前記の各翻訳サブステップから得られた翻訳結果文についての意味解析結果から抽出し、得られた部分意味解析結果に対応する翻訳先言語で書かれたテキスト部分を出力する、
    ことを特徴とする請求項8に記載の機械翻訳方法。
  12. 翻訳先言語で書かれた複数の用例文を意味解析する第3の意味解析ステップをさらに備え、
    前記翻訳結果文比較ステップでは、前記第1の意味解析ステップによる意味解析結果と、前記第2の意味解析ステップによる翻訳結果文の意味解析結果あるいは前記第3の意味解析ステップによる用例文の意味解析結果を比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文あるいは用例文を出力する、
    ことを特徴とする請求項8に記載の機械翻訳方法。
  13. 前記翻訳結果文比較ステップでは、前記第1の意味解析ステップによる翻訳元言語文に対する意味解析結果と、前記第2の意味解析ステップによる前記の各翻訳副手段からの翻訳結果文に対する意味解析結果を比較し、前記第1の意味解析手段による翻訳元言語文に対する意味解析結果と各翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度よりも、いずれか2以上の翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度の方が高い場合には、当該2以上の翻訳副手段からの翻訳結果文を最適な翻訳結果として選択する、
    ことを特徴とする請求項8に記載の機械翻訳方法。
  14. 前記第1の意味解析ステップにより得られる翻訳元言語文についてのfunctional−structureを翻訳先言語文の構文構造に従うfunctional−st ructureに変換するfunctional−structure変換ステップをさらに備え、
    前記木構造変換ステップでは、前記functional−structure変換ステップによって変換されたfunctional−structureを木構造に変換する、
    ことを特徴とする請求項9に記載の機械翻訳方法。
  15. 翻訳元言語文を翻訳先言語に変換する処理をコンピュータ・システム上で執行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータを、
    翻訳元言語文を翻訳先言語文へ変換する複数の翻訳副手段を備え、翻訳元言語文を翻訳先言語に翻訳する翻訳手段と、
    翻訳元言語文を意味解析する第1の意味解析手段と、
    前記の各翻訳副手段による翻訳結果文を意味解析する第2の意味解析手段と、
    前記第1及び第2の意味解析手段による意味解析結果を格関係に基づく木構造に変換する木構造変換手段と、
    前記の各翻訳副手段による翻訳結果文の意味解析結果を前記第1の意味解析手段による意味解析結果と比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文を出力する翻訳結果文比較手段と、
    として機能させるためのコンピュータ・プログラムであって、
    前記第1及び第2の意味解析手段は、意味解析結果として、解析対象の文を、文の単語情報、構文構造を示す格情報、時制、様相を含む属性情報を、属性(PRED)と対応する属性値(単語)のペアの入れ子構造で表現し、
    前記木構造変換手段は、意味解析結果中の属性に対応する属性値をすべて抽出し、入れ子の外側の属性が内側の属性の親になるように属性値(各単語)を表すノード間をリンクで連結するとともに、外側の属性値とペアをなす属性を該リンクに付与して、意味解析結果の木構造を生成し、
    前記翻訳結果文比較手段は、翻訳元言語文及び翻訳結果文それぞれについての意味解析結果の木構造から、ノード・ペア、及びノード又はノード間リンクに付与された属性情報の組からなるノード・ペア情報を抽出し、翻訳元言語文及び翻訳結果文の間で一致するノード・ペア情報の個数に基づいて類似度を算出する、
    ことを特徴とするコンピュータ・プログラム。
  16. 前記第1及び第2の意味解析手段は、Lexical Functional Grammarに基づいて記述された該当する言語に関する文法規則を備え、前記文法規則を参照することにより入力された言語文に対してLexical Functional Grammarに基づく解析を施し、functional−structureを出力し、
    前記翻訳結果文比較手段は、前記第1及び第2の意味解析手段から出力される翻訳元言語文と翻訳結果文のfunctional−structureの木構造を比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文を出力する、
    ことを特徴とする請求項15に記載のコンピュータ・プログラム。
  17. 前記第1及び第2の意味解析手段は、入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られない場合には、解析可能な部分解析結果又は部分functional−structureの集合を出力し、
    前記翻訳結果文比較手段は、前記第1及び第2の意味解析手段から出力される文全体に対応する意味解析結果又はfunctional−structure、あるいは解析可能な部分解析結果又は部分functional−structureの集合を比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文を出力する、
    ことを特徴とする請求項15又は16のいずれかに記載のコンピュータ・プログラム。
  18. 前記第1の意味解析手段から得られる翻訳元言語文についての意味解析結果に基づいて該翻訳元言語文を部分構造に分割する入力文分割手段をさらに備え、
    前記翻訳結果文比較手段は、前記入力文分割手段から得られる部分構造に対応する各部分意味解析結果と類似する部分意味解析結果を前記の各翻訳副手段から得られた翻訳結果文についての意味解析結果から抽出し、得られた部分意味解析結果に対応する翻訳先言語で書かれたテキスト部分を出力する、
    ことを特徴とする請求項17に記載のコンピュータ・プログラム。
  19. 翻訳先言語で書かれた複数の用例文を格納する用例文格納手段と、
    前記用例文格納手段に格納されている用例文を意味解析する第3の意味解析手段をさらに備え、
    前記翻訳結果文比較手段は、前記第1の意味解析手段による意味解析結果と、前記第2の意味解析手段による翻訳結果文の意味解析結果あるいは前記第3の意味解析結果による用例文の意味解析結果を比較し、該比較結果に基づいて1又はそれ以上の翻訳結果文あるいは用例文を出力する、
    ことを特徴とする請求項15に記載のコンピュータ・プログラム。
  20. 前記翻訳結果文比較手段は、前記第1の意味解析手段による翻訳元言語文に対する意味解析結果と、前記第2の意味解析手段による前記の各翻訳副手段からの翻訳結果文に対する意味解析結果を比較し、前記第1の意味解析手段による翻訳元言語文に対する意味解析結果と各翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度よりも、いずれか2以上の翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度の方が高い場合には、当該2以上の翻訳副手段からの翻訳結果文を最適な翻訳結果として選択する、
    ことを特徴とする請求項15に記載のコンピュータ・プログラム。
  21. 前記第1の意味解析手段から得られる翻訳元言語文についてのfunctional−structureを翻訳先言語文の構文構造に従うfunctional−structureに変換するfunctional−structure変換手段をさらに備え、
    前記木構造変換手段は、前記functional−structure変換手段によって変換されたfunctional−structureを木構造に変換する、
    ことを特徴とする請求項16に記載のコンピュータ・プログラム。
JP2003109374A 2003-04-14 2003-04-14 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム Expired - Fee Related JP4114526B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003109374A JP4114526B2 (ja) 2003-04-14 2003-04-14 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003109374A JP4114526B2 (ja) 2003-04-14 2003-04-14 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2004318344A JP2004318344A (ja) 2004-11-11
JP4114526B2 true JP4114526B2 (ja) 2008-07-09

Family

ID=33470554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003109374A Expired - Fee Related JP4114526B2 (ja) 2003-04-14 2003-04-14 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP4114526B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012185654A (ja) * 2011-03-04 2012-09-27 Fujitsu Ltd 翻訳装置、翻訳プログラムおよび翻訳方法
JP6866615B2 (ja) * 2016-11-09 2021-04-28 株式会社ぐるなび メニュー生成システム、メニュー生成方法及びメニュー生成プログラム
JP2021018442A (ja) * 2019-07-17 2021-02-15 日本電信電話株式会社 文比較装置、文比較方法、及び文比較プログラム
RU2766821C1 (ru) * 2021-02-10 2022-03-16 Общество с ограниченной ответственностью " МЕНТАЛОГИЧЕСКИЕ ТЕХНОЛОГИИ" Способ автоматизированного извлечения смысловых компонентов из сложносочинённых предложений естественно-язычных текстов в системах машинного перевода и устройство для его реализации

Also Published As

Publication number Publication date
JP2004318344A (ja) 2004-11-11

Similar Documents

Publication Publication Date Title
KR101678787B1 (ko) 자동질의응답 방법 및 그 장치
KR101762866B1 (ko) 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
JP5452868B2 (ja) トレーニングおよび復号のためにストリングからツリーへの変換を使うテキスト‐テキスト・アプリケーションのためのトレーニング
US10585924B2 (en) Processing natural-language documents and queries
US20080040095A1 (en) System for Multiligual Machine Translation from English to Hindi and Other Indian Languages Using Pseudo-Interlingua and Hybridized Approach
KR20130123037A (ko) 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법
KR101818598B1 (ko) 자동 번역 엔진 서버 및 자동 번역 방법
JP2006268375A (ja) 翻訳メモリシステム
Baldwin et al. PanLex and LEXTRACT: Translating all words of all languages of the world
JP2017199363A (ja) 機械翻訳装置及び機械翻訳のためのコンピュータプログラム
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
Ell et al. SPARQL query verbalization for explaining semantic search engine queries
Bod Is the end of supervised parsing in sight?
US7401016B2 (en) Communication support system, communication support method, and computer program
De Melo et al. UWN: A large multilingual lexical knowledge base
JPH0261763A (ja) 機械翻訳装置
Aasha et al. Machine translation from English to Malayalam using transfer approach
Choudhury et al. Bridging Bangla to Universal Networking Language-a human language neutral meta-language
JP4114526B2 (ja) 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム
Garje et al. Transmuter: an approach to rule-based English to Marathi machine translation
Alkım et al. Machine translation infrastructure for Turkic languages (MT-Turk)
Atrey et al. Issues in parsing and POS tagging of hybrid language
JP4039205B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Patil et al. A review on implementation of Sandhi Viccheda for Sanskrit words
Salaiwarakul Thai natural language based cultural tourism ontology

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060320

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080407

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130425

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140425

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees