JP4114526B2

JP4114526B2 - 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム

Info

Publication number: JP4114526B2
Application number: JP2003109374A
Authority: JP
Inventors: 博増市; 智子大熊; 宏樹吉村
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2003-04-14
Filing date: 2003-04-14
Publication date: 2008-07-09
Anticipated expiration: 2023-04-14
Also published as: JP2004318344A

Description

【０００１】
【発明の属する技術分野】
本発明は、翻訳元言語の入力文を翻訳先言語に変換する機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムに係り、特に、翻訳元言語の入力文に対する意味解析結果を利用して翻訳先言語に変換する機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムに関する。
【０００２】
さらに詳しくは、本発明は、ＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒ（ＬＦＧ）に基づく意味解析結果を利用して翻訳元言語の入力文を翻訳先言語に変換する機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムに係り、特に、ＬＦＧの出力するｆ−ｓｔｒｕｃｔｕｒｅの持つ言語普遍性を利用してより最適な翻訳結果文を出力する機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムに関する。
【０００３】
【従来の技術】
日本語や英語など、人間が日常的なコミュニケーションに使用する言葉のことを「自然言語」と呼ぶ。自然言語は自然発生的な起源を持ち、人類、民族、社会の歴史とともに進化し、現在、多種多様な自然言語が存在している。勿論、人は身振りや手振りなどによっても意思疎通を行なうことが可能であるが、自然言語により最も自然で且つ高度なコミュニケーションを実現することができる。
【０００４】
自然言語は、本来抽象的であいまい性が高い性質を持つが、文章を数学的に取り扱うことにより、コンピュータ処理を行なうことができる。この結果、機械翻訳や対話システム、検索システムなど、自動化処理により自然言語に関するさまざまなアプリケーション／サービスが実現される。
【０００５】
このうち、「機械翻訳」は、使用する言語の異なる者同士が行なうコミュニケーションを、コンピュータ処理を活用して支援するシステムである。最近では、インターネットの普及や企業のグローバル化が進むにつれ、さまざまな言語で書かれた文書を取り扱う必要性が増し、機械翻訳システムのニーズが高まってきている。
【０００６】
しかしながら、既に数多くの言語を対象として種々の機械翻訳システムが製品化されているにもかかわらず、これらのシステムが広く実用的に使われているとは言い難い状況にある。
【０００７】
現在製品化されている機械翻訳システムの多くは、ダイレクト方式又はトランスファー方式と呼ばれる方式に基づいている。
【０００８】
ダイレクト方式は、基本的に、翻訳元言語で書かれた文の形態素解析結果を利用して、翻訳元言語の単語を翻訳先言語の単語へと単純に置き換えるものである。形態素解析では、文を意味的最小単位である形態素（ｍｏｒｐｈｅｍｅ）に分節して品詞の認定処理が行なわれる。しかしながら、ダイレクト方式は、日韓翻訳やノルウェー語−スウェーデン語翻訳の場合のように、翻訳元言語と翻訳先言語間で文法が似通っている場合にのみ有効な方式である。
【０００９】
一方、トランスファー方式は、解析過程、変換過程、生成過程という３つの過程から成る。ここで言う解析過程では、翻訳元言語で書かれた文を構文解析して、構文構造を生成する。構文解析では、自然言語文を受け取り、文法規則に基づいて単語（文節）間の係り受け関係を決定する処理が行なわれる。翻訳元言語で書かれた文を形態素解析し、さらに構文解析を行ない、木構造を得る。そして、翻訳元言語と翻訳先言語間の木構造変換規則を用いて、翻訳先言語における構文解析木を得る。
【００１０】
ここで、「少女が望遠鏡で男を見た。」という日本語文を翻訳元言語の文として、英語に機械翻訳する場合を例にとって、トランスフォー方式について考察してみる。
【００１１】
図２８には、「少女が望遠鏡で男を見た。」という日本語文の解析過程を経た後の句構造（構文構造）表現を示している。図示の構文解析木は、文のまとめあげ関係を記述した木構造の末端に単語が付されている。続く変換過程は「翻訳元言語の構文構造から翻訳先言語の構文構造への変換」及び「翻訳先言語の訳語の選択」という２種の処理で構成される。図２９には、図２８に示した日本語構文構造を英語の構文構造に変換し、さらに、適切な訳語を付与した例を示している。構文構造の変換は、基本的には木構造間の対応付けであり、言語間の木構造の対応関係を記述した変換規則を各ノードや部分構造に適用することによって実行される。
【００１２】
翻訳先言語の訳語の選択には、翻訳元言語と翻訳先言語の単語の対応関係を記述した対訳辞書を用いる。例えば、対訳辞書中には、上記の日本語文中の「見る」という単語に対応する英語単語として、「ｓｅｅ」、「ｌｏｏｋ」、「ｇｌａｎｃｅ」、「ｗａｔｃｈ」、「ｇａｚｅ」などの訳語候補が記述されている。対訳辞書中の単語候補の中から、文中の他の単語との同時出現確率や木構造中の特定位置での出現確率といった情報を用いて訳語を１つに絞る処理を実行する。
【００１３】
続く生成過程は、変換過程で得られた翻訳先言語の構文構造から、翻訳先言語文（翻訳結果）を生成する過程である。生成過程では、翻訳先言語の文としてより自然な表現にするための処理が行なわれる。例えば、上記の日本語文中の「少女」を「ｔｈｅｇｉｒｌ」とするか「ａｇｉｒｌ」とするかを文脈情報などを参照することによって決定する。
【００１４】
トランスファー方式を構成する上述した３つの過程の中で、変換過程は大きな誤訳を回避するという点において最も重要なものである。しかしながら、実際には翻訳元言語の構文構造を翻訳先言語の構文構造に変換する変換規則を、すべての構文構造に対して網羅的に記述しておくことは現実的ではない。
【００１５】
そこで、既存の機械翻訳システムでは、用例に基づく翻訳（Ｅｘａｍｐｌｅ−ＢａｓｅｄＭａｃｈｉｎｅＴｒａｎｓｌａｔｉｏｎ：ＥＢＭＴ）と呼ばれる手法を用いている。ＥＢＭＴに基づく機械翻訳システムでは、人手で書かれた翻訳元言語の文（翻訳元用例文）と翻訳先言語の文（翻訳先用例文）の対訳対をあらかじめ多数用意しておく。そして、ＥＢＭＴに基づく機械翻訳システムに翻訳元言語の入力文が与えられると、既に存在する翻訳元用例文の中から入力文に最も類似するものを選択し、その翻訳元用例文と対を成す翻訳先用例文を模倣することによって翻訳を行なう。入力文と同一の文が翻訳元用例文集合中に見つかれば、対応する翻訳先用例文をそのまま出力し、入力文とは異なっていても極めて類似度の高い翻訳元用例文が見つかれば、対応する翻訳先用例文の単語あるいはフレーズを一部変更するだけで高い品質の翻訳結果を得ることができる。
【００１６】
ＥＢＭＴに基づく機械翻訳システムの長所は、対訳対を用意するだけで、変換過程で必要な変換規則を詳細に記述することなしに、それと同等の効果を得ることができる点にある。
【００１７】
一方で、ＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒ（ＬＦＧ）やＨｅａｄ−ｄｒｉｖｅｎＰｈｒａｓｅＳｔｒｕｃｔｕｒｅＧｒａｍｍａｒ（ＨＰＳＧ）といった文法理論に基づいた、より深い解析（意味解析）手法を用いて精度の高い機械翻訳を実現しようとする研究が行なわれている。すなわち、翻訳元言語を特定の言語に依存しない中間言語に変換し、その後、中間言語をターゲット言語に変換するという処理が行なわれ、インターリンガ方式とも呼ばれる。
【００１８】
前者のＬＦＧでは、ネイティブ・スピーカの言語知識すなわち文法を、コンピュータ処理や、コンピュータの処理動作に影響を及ぼすその他の非文法的な処理パラメータとは切り離したコンポーネントとして構成している（例えば、非特許文献１を参照のこと）。意味解析では、単語（文節）間の係り受け関係に基づいて、文中の格関係を決定する処理が行なわれる。とりわけ、ＬＦＧに基づく意味解析では、入力文に対して、その構文構造だけではなく、格構造（主格、目的格など）や、時制、様相、態（受動態、能動態）、話法など、さまざまな情報をｆｕｎｃｔｉｏｎａｌｓｔｒｕｃｔｕｒｅ（ｆ−ｓｔｒｕｃｔｕｒｅ）と呼ばれる属性と属性値からなるマトリックス構造で出力する。さらにｆ−ｓｔｒｕｃｔｕｒｅは、同じ意味を表現する文に対しては、言語が異なっていても基本的に等価な構造として出力されるという特徴を持っている。ｆ−ｓｔｒｕｃｔｕｒｅ中で、言語に固有の単語レベルの情報は異なるが、その他の構造は基本的に等価になる。すなわち、ｆ−ｓｔｒｕｃｔｕｒｅには言語普遍性があり、インターリンガ方式における中間言語として利用することができる。
【００１９】
なお、ＬＦＧ以外でも、例えばＣ．Ｊ．Ｆｉｌｌｍｏｒｅによって提唱された格文法（ｃａｓｅｇｒａｍｍａｒ）を、言語普遍性を持つ解析結果を得ることができる文法理論の例として挙げることができる。
【００２０】
ＬＦＧの出力するｆ−ｓｔｒｕｃｔｕｒｅでは、文の単語情報、構文構造を示す格情報、時制、様相などの属性情報のすべてを、属性と属性値のペアの入れ子構造で表現する。すなわち、文を「属性と属性値のペア」の集合で表現し、また、属性値はさらにその入れ子として「属性と属性値のペア」の集合となり得る。この中で、文を構成するそれぞれの単語は、ＰＲＥＤ（ｐｒｅｄｉｃａｔｅ：述語）と呼ばれる属性に対応する属性値としてｆ−ｓｔｒｕｃｔｕｒｅ中に記述されることになる。
【００２１】
ｆ−ｓｔｒｕｃｔｕｒｅ中で言語に依存して変化する部分はこのＰＲＥＤに対応する属性値（単語）のみであり、その他の属性及び属性値は、全言語を通して共通化（標準化）されている。すなわち、ＬＦＧの出力するｆ−ｓｔｒｕｃｔｕｒｅは言語普遍性を持つ。
【００２２】
図３０には、日本語文「太郎は花子にプレゼントを渡した。」をＬＦＧにより解析した結果得られるｆ−ｓｔｒｕｃｔｕｒｅの例を示している。同図に示すように、属性とそれに対応する属性値は水平の位置に並べることによって表現される。また、属性値はさらにその入れ子として「属性と属性値のペア」の集合として表現される。同図中で下線を引いて示した部分が単語情報（ＰＲＥＤ属性に対応する属性値）であり、その他の部分は（表記上は英語で表現されているが）すべての言語に共通の概念である。
【００２３】
したがって、翻訳元言語文に対してＬＦＧに基づく意味解析処理を施すことによって翻訳元言語のｆ−ｓｔｒｕｃｔｕｒｅを取得し、それを翻訳先言語のｆ−ｓｔｒｕｃｔｕｒｅに変換し、得られたｆ−ｓｔｒｕｃｔｕｒｅから翻訳先言語の文を生成するという手順でより品質のよい機械翻訳を実現することができる（例えば、非特許文献２を参照のこと）。
【００２４】
このようなｆ−ｓｔｒｕｃｔｕｒｅを中間言語とする機械翻訳システムの問題点は、翻訳先言語のｆ−ｓｔｒｕｃｔｕｒｅから翻訳先言語の文を生成する過程にある。すなわち、ｆ−ｓｔｒｕｃｔｕｒｅは、文の情報を抽象化して（表層的な情報の一部を捨象して）得られる構造であるため、１つのｆ−ｓｔｒｕｃｔｕｒｅから生成可能な文が多数存在する可能性がある。このため、複数の翻訳結果候補の中から翻訳先言語の文として自然な表現を選択するためには、ｆ−ｓｔｒｕｃｔｕｒｅ以外の情報が必要となる。例えば、トランスファー方式（前述）と同様、膨大な量の翻訳先用例文をあらかじめ用意しておき、それらのいずれかと類似する翻訳結果候補を選択するという手法が考えられる。
【００２５】
上述したように、ＥＢＭＴに基づく機械翻訳システムでは、トランスファー方式の変換過程において詳細な変換規則を記述する代わりに、多数の対訳対（用例対）を用意することによって翻訳を実現することができる。ところが、変換規則は言語の文法現象を一般化したものであり、１つの規則で多数の文をカバーできる広い適用範囲を持つという性格を有するのに対して、用例は、そもそもが個々の文に固有の特徴を表現するものに過ぎない。このため、言語現象全体をカバーするためには膨大な数の用例対を用意しておく必要がある。
【００２６】
用例対は人手で作成する必要があるため、実際には言語現象全体をカバーするに足る量の用例対を用意することは不可能である。このため、用例対によってカバーできる言語現象の範囲は個々の機械翻訳システムで偏りが生じることになる。ある機械翻訳システムでは、特定の分野あるいは特定の言語現象に対応する用例対が数多く用意され、当該分野あるいは言語現象に関する文の翻訳は高い精度で実現できる反面、そこから外れる文に対する翻訳結果の品質は極めて低いものとなってしまう。別の機械翻訳システムでも同様の状況が起こり、さらに、どの分野あるいは言語現象がその機械翻訳システムにとって得意な範囲であるかは、用例対がたまたま多く用意されていることにのみ依存するため、ユーザが予想することはできない。
【００２７】
このように用例の数が増えるほど翻訳精度が向上するというＥＢＭＴに基づく現状の機械翻訳システムの性格を勘案すれば、多くの異なる機械翻訳システムを入手し、それらに同一の文を翻訳させることにより、それらの中から品質の高い翻訳結果が得られる可能性は格段に高まることになる。しかしながら、どの翻訳結果の品質が最も高いものであるかは、翻訳結果を人手で読み比べて判断するしかない。このため、多くの機械翻訳システムを用意すればするほど、その比較判断に要するコストが問題となってしまう。
【００２８】
【非特許文献１】
R. M. Kaplan及びJ. Bresnan共著“Lexical-Functional Grammar: A Formal System for Grammatical Representation”（The MIT Press, Cambridge (1982). Reprinted in Formal Issues in Lexical-Functional Grammar, pp. 29-130. CSLI publications, Stanford University(1995).）
【非特許文献２】
Frank, A.著“From Parallel Grammar Development towards Machine Translation."（In Proceedings of MT Summit VII, "MT in the Great Translation Era", Singapore, pp. 134-142. (1999)）
【００２９】
【発明が解決しようとする課題】
本発明の目的は、翻訳元言語の入力文に対する意味解析結果を利用して翻訳結果文を好適に得ることができる、優れた機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムを提供することにある。
【００３０】
本発明のさらなる目的は、ＬＦＧに基づく意味解析結果を利用して翻訳元言語の入力文を翻訳先言語に好適に変換することができる、優れた機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムを提供することにある。
【００３１】
本発明のさらなる目的は、ＬＦＧの出力するｆ−ｓｔｒｕｃｔｕｒｅの持つ言語普遍性を利用してより最適な翻訳結果文を出力することができる、優れた機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムを提供することにある。
【００３２】
【課題を解決するための手段及び作用】
本発明は、上記課題を参酌してなされたものであり、翻訳元言語文を翻訳先言語に変換する機械翻訳システムであって、
翻訳元言語文を翻訳先言語に翻訳する翻訳手段と、
翻訳元言語文を意味解析する第１の意味解析手段と、
前記翻訳手段による翻訳結果文を意味解析する第２の意味解析手段と、
前記第１の意味解析手段による意味解析結果と前記第２の意味解析手段による意味解析結果を比較する翻訳結果文比較手段と、
を具備することを特徴とする機械翻訳システムである。
【００３３】
ここで、前記翻訳手段は、翻訳元言語文を翻訳先言語文へ変換する複数の翻訳副手段を備えていてもよい。翻訳副手段は、例えば市販の機械翻訳システムやＷｅｂ上で有償又は無償で公開されている翻訳サービスなどである。このような場合、前記第２の意味解析手段は、前記の各翻訳副手段による翻訳結果文をそれぞれ意味解析する。そして、前記翻訳結果文比較手段は、前記の各翻訳副手段による翻訳結果文の意味解析結果を前記第１の意味解析手段による意味解析結果と比較し、例えば翻訳元言語文と類似度の高い意味解析結果を持つ１又はそれ以上の翻訳結果文を最適な翻訳文として出力する。
【００３４】
図１には、本発明に係る機械翻訳システムの基本的な機能構成を模式的に示している。前記第１及び第２の意味解析手段は、ＬＦＧに基づいて記述された該当する言語に関する文法規則を備え、前記文法規則を参照することにより入力された言語文に対してＬＦＧに基づく解析を施し、ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅという言語普遍性のある形式で意味解析結果を出力する。そして、前記翻訳結果文比較手段は、言語普遍性のある意味解析結果を中間言語方式の機械翻訳システムに直接利用するのではなく、翻訳元言語で書かれた入力文と複数の機械翻訳システムから出力される翻訳先言語で書かれた翻訳結果文との比較判断に利用することにより、最も品質の高い翻訳結果を取得することができる。
【００３５】
本発明に係る機械翻訳システムは、前記第１及び第２の意味解析手段から得られるｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを格関係に基づく木構造に変換する木構造変換手段をさらに備えていてもよい。このような場合、前記翻訳結果文比較手段は、前記木構造変換手段から得られる翻訳元言語文と翻訳結果文についての木構造を用いてより効率的に意味解析結果同士の比較を行なうことができる。
【００３６】
前記翻訳結果文比較手段は、前記第１の意味解析手段による翻訳元言語文に対する意味解析結果と、前記第２の意味解析手段による前記の各翻訳副手段からの翻訳結果文に対する意味解析結果を比較し、その類似度に応じて前記の各翻訳副結果手段からの翻訳結果文のそれぞれについて翻訳結果の信頼度を付与するようにしてもよい。
【００３７】
現状では、ＬＦＧやＨＰＳＧに基づく意味解析に基づく機械翻訳システムは実用化のレベルに達しているとは言い難い。これは、主に意味解析結果から翻訳先言語文を生成する過程に問題があり、ＥＢＭＴの手法と同様に、用意することができる用例の数に翻訳品質が依存するという点に由来する。
【００３８】
一方、現在実用化されている機械翻訳システムのほとんどは、ＥＢＭＴに基づくものである。既に述べたようにＥＢＭＴに基づく機械翻訳システムでは、変換規則および用例対が大きな役割を果たす。入力文の構文に偶然合致する変換規則が存在する場合、あるいは入力文と類似度の高い用例がたまたま存在する場合には高品質の翻訳結果が得られる反面、変換規則が十分に記述されておらず、入力文と類似度の高い用例が存在しない場合には翻訳結果の品質は極めて低いものになってしまう。
【００３９】
このような問題を解決するためには、多数のＥＢＭＴに基づく機械翻訳システムを用意して翻訳を実行し、翻訳結果を比較する手法が有効である。ある翻訳元言語と翻訳先言語のペアを対象とする既存のすべての機械翻訳システムを用意して、その中から適切な翻訳結果が選択することができれば、それが現状の技術における最高品質の機械翻訳結果であると推定することができる。
【００４０】
本発明によれば、翻訳元言語文に対して多数の既存の機械翻訳システムを用意する。そして、すべての機械翻訳システムを用いて翻訳を実行し、これらの翻訳結果を比較する。比較の際に、翻訳元言語文と翻訳結果の類似性（翻訳結果の正当性）を翻訳品質を計測する尺度として、両者の意味解析結果を利用する。両者の意味解析結果が類似していればしているほど、同じ意味内容を表現している（翻訳結果としての品質が高い）ことになるので、最適な翻訳結果を自動的に選択することが可能となる。
【００４１】
意味解析結果から翻訳先言語文を生成することは難しいが（前述）、翻訳元言語文及び翻訳先言語文からそれぞれＬＦＧなどの文法理論に基づいて意味解析結果を生成することは現状の技術においても十分可能である。
【００４２】
ここで、入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られないという事態も想定される。このような場合、前記第１及び第２の意味解析手段は、解析可能な部分解析結果又は部分ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの集合を出力し、前記翻訳結果文比較手段は、前記第１及び第２の意味解析手段から出力される解析可能な部分解析結果又は部分ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの集合を比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文を出力するようにすればよい。
【００４３】
また、前記第１の意味解析手段から得られる翻訳元言語文についての意味解析結果に基づいて該翻訳元言語文を部分構造に分割する入力文分割手段をさらに備えていてもよい。このような場合、前記翻訳結果文比較手段は、前記入力文分割手段から得られる部分構造に対応する各部分意味解析結果と類似する部分意味解析結果を前記の各翻訳副手段から得られた翻訳結果文についての意味解析結果から抽出し、得られた部分意味解析結果に対応する翻訳先言語で書かれたテキスト部分を出力するようにすればよい。また、前記翻訳結果文比較手段から得られるテキストを組み合わせることにより、翻訳結果文を生成することができる。
【００４４】
例えば、入力日本語文のｆ−ｓｔｒｕｃｔｕｒｅが最も外側にＰＡＲＡ（後述）の構造を持つ場合（２つ以上の単文が接続詞で単純に結合されている場合）には、入力日本語文を複数の部分構造（単文）に分割し、各単文毎に最適の英語訳を選択する、あるいは、それらの英語訳を結合してユーザに提示する、といった手法を実現することが可能である。
【００４５】
また、本発明に係る機械翻訳システムは、翻訳先言語で書かれた複数の用例文を格納する用例文格納手段と、前記用例文格納手段に格納されている用例文を意味解析する第３の意味解析手段をさらに備えていてもよい。このような場合、前記翻訳結果文比較手段は、前記第１の意味解析手段による意味解析結果と、前記第２の意味解析手段による翻訳結果文の意味解析結果あるいは前記第３の意味解析結果による用例文の意味解析結果を比較し、翻訳結果よりも用例文の評価が高い場合には用例文を翻訳結果として採用する。
【００４６】
他方、ことわざやその他の慣用句においては、いずれの翻訳副手段による翻訳結果文も翻訳言語文との間で意味解析結果が低いことがある。このような場合には、各翻訳副手段からの翻訳結果文に対する意味解析結果を比較し、翻訳結果文同士で意味解析結果の類似度が高い翻訳結果文を出力するようにしてもよい。
【００４７】
また、前記の各翻訳副手段にあらかじめ優先順位を設定しておいてもよい。そして、記翻訳結果文比較手段は、優先順位を参照して、優先順位が上位となる翻訳副手段の翻訳結果を優先的に使用するようにしてもよい。
【００４８】
また、前記第１の意味解析手段から得られる翻訳元言語文についてのｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを翻訳先言語文の構文構造に従うｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅに変換するｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ変換手段をさらに備え、前記木構造変換手段は、前記ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ変換手段によって変換されたｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを木構造に変換するようにしてもよい。
【００４９】
また、本発明の第２の側面は、翻訳元言語文を翻訳先言語に変換する処理をコンピュータ・システム上で執行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
翻訳元言語文を翻訳先言語に翻訳する翻訳ステップと、
翻訳元言語文を意味解析する第１の意味解析ステップと、
前記翻訳手段による翻訳結果文を意味解析する第２の意味解析ステップと、
前記第１の意味解析手段による意味解析結果と前記第２の意味解析ステップによる意味解析結果を比較する翻訳結果文比較ステップと、
を具備することを特徴とするコンピュータ・プログラムである。
【００５０】
本発明の第２の側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第２の側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第１の側面に係る機械翻訳システムと同様の作用効果を得ることができる。
【００５１】
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
【００５２】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施形態について詳解する。
【００５３】
第１の実施形態：
図２には、本発明の一実施形態に係る機械翻訳システムの機能構成を模式的に示している。機械翻訳システムは、例えばパーソナル・コンピュータ（ＰＣ）などの一般的な計算機システム上で機械翻訳アプリケーションを導入するという形態で実現可能である。
【００５４】
入力文格納部１は、翻訳の対象となる日本語文を計算機内部に保持する。
【００５５】
翻訳機能部２は、複数の翻訳サブブロック２１−２ｎを内部に持つ。翻訳サブブロック２１−２ｎは、独立したｎ個のプログラム・モジュールであり、それぞれがトランスファー方式によって日本語文を英語文へと翻訳することができる機械翻訳ツールである。翻訳サブブロックが単独の計算機上で動作するプログラムで構成される場合は、入力文格納部１に格納された日本語文を直接受け取り、翻訳結果の英語文を翻訳結果文格納部３に格納する。また、翻訳サブブロックがインターネットを介してアクセスされるＷｅｂ上の翻訳システムで構成される場合、入力文格納部１に格納された日本語文を（ＰＵＴあるいはＰＯＳＴなどのＨＴＭＬリクエストの形式で）Ｗｅｂ翻訳システムに送信し、翻訳結果として得られた英語文を翻訳結果文格納部３に格納する。
【００５６】
翻訳結果文格納部３は、翻訳サブブロック２１−２ｎから得られるｎ個の翻訳結果としての英語文を計算機内部に保持する手段である。
【００５７】
日本語文法規則格納部４は、日本語文に対してＬＦＧに基づく意味解析を施すために必要となる日本語ＬＦＧ文法規則及び語彙規則を計算機内部に保持する手段である。また、英語文法規則格納部５は、英語に対してＬＦＧに基づく意味解析処理を施すために必要となる英語ＬＦＧ文法規則及び語彙規則を計算機内部に保持する手段である。なお、ＬＦＧによる文法記述の詳細については、例えばDalrymple, M.著の論文“Syntax and Semantics -Lexical Functional Grammar”（Academic Press (2001)）を参照されたい。
【００５８】
ＬＦＧ解析部６は、日本語文法規則格納部４に保持されている日本語ＬＦＧ文法規則及び語彙規則と、英語文法規則格納部５に保持されている英語ＬＦＧ文法規則及び語彙規則とを用いることにより、入力文格納部１に保持されている日本語文、及び翻訳結果文格納部３に保持されているｎ個の英語文に対してそれぞれＬＦＧに基づく意味解析処理を施し、対応するｆ−ｓｔｒｕｃｔｕｒｅを得る。
【００５９】
意味解析では、単語（文節）間の係り受け関係に基づいて、文中の格関係を決定する処理が行なわれる。ＬＦＧに基づく意味解析結果であるｆ−ｓｔｒｕｃｔｕｒｅでは、入力文の構文構造だけではなく、格構造（主格、目的格、保護、修飾語といった意味理解）や、時制、様相、態（受動態、能動態）、話法などさまざまな情報を、属性と属性値からなるマトリックス構造で出力する。図３には、日本語文「画家が赤い帽子と女性の絵を描いていた。」に対応するｆ−ｓｔｒｕｃｔｕｒｅの一例を示している。
【００６０】
ｆ−ｓｔｒｕｃｔｕｒｅは、同じ意味を表現する文に対しては、言語が異なっていても基本的に等価な構造として出力されるという特徴を持っている。なお、ＬＦＧによる意味解析結果の詳細については、Dalrymple, M.著の論文"Syntax and Semantics -Lexical Functional Grammar"（Academic Press (2001)）を参照されたい。
【００６１】
入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られないという事態も想定される。このような場合、ＬＦＧ解析部６は、解析可能な部分解析結果又は部分ｆ−ｓｔｒｕｃｔｕｒｅの集合を出力するようにしてもよい。
【００６２】
木構造変換部７は、ＬＦＧ解析部６から得られる日本語文に対応するｆ−ｓｔｕｒｕｃｔｕｒｅ、並びに英語文に対応するｎ個のｆ−ｓｔｒｕｃｔｕｒｅをそれぞれ木構造に変換する。基本的には、ｆ−ｓｔｒｕｃｔｕｒｅ中のＰＲＥＤ属性に対応する属性値をすべて抽出し、ｆ−ｓｔｒｕｃｔｕｒｅ上で外側のＰＲＥＤが内側のＰＲＥＤの親となるように属性値（各単語）を表すノード間を連結することにより、ｆ−ｓｔｒｕｃｔｕｒｅを木構造に変換することができる。ここで生成される木構造は、文のまとめあげ関係を記述した木構造の末端に単語が付される構文解析木（図２９を参照のこと）とは相違する。木構造変換部７における変換のための詳細な手順は以下の通りである。
【００６３】
［ステップ１］
ｆ−ｓｔｒｕｃｔｕｒｅ中のＰＲＥＤ属性に対応する属性値をすべて抽出し、それぞれの属性値を木構造を構成するノードとする。但し、ＰＲＥＤ属性が「ｐｒｏ」（代名詞）の場合には、同じ属性値内で代名詞の実体を表すＰＲＯＮ−ＦＯＲＭ属性に対応する属性値を抽出してノードとし、ＰＲＯＮ−ＦＯＲＭ属性が存在しない場合はノードとしない。
【００６４】
［ステップ２］
ｆ−ｓｔｒｕｃｔｕｒｅ中に存在する属性−属性値ペアの入れ子構造の包含関係を、木構造のノード間の親子関係とみなし、ノードを接続して木構造を作成する。すなわち、あるノードｎ１に対応するＰＲＥＤの属性値をｖ１とし、ｖ１を包含する最も内側の属性値をｖ２とする。さらに、ｖ２を包含する最も内側の属性値をｖ３とし、ｖ３が持つＰＲＥＤ属性に対応する属性値をｖ４とすれば、ｖ４に対応するノードをｎ１の親ノードｎ２とする（図４を参照のこと）。
【００６５】
このようなノードｎ１に関する処理を上記の［ステップ１］で得られたすべてのノードに対して再帰的に行なう。但し、ｆ−ｓｔｒｕｃｔｕｒｅ全体も１つの属性値であるとみなして処理を行なう。また、ｆ−ｓｔｒｕｃｔｕｒｅ全体に対応する属性値が持つＰＲＥＤ属性の属性値に対応するノードに関しては、親ノードが存在しないため、木構造の根に対応するノードとみなす。ｆ−ｓｔｒｕｃｔｕｒｅ全体に対応する属性値がＰＲＥＤ属性を持たない場合には、根に対応するノードはＮＵＬＬの記号を持つものとする。
【００６６】
上述した処理によって木構造が得られる（図５を参照のこと）。なお、図５中の「ＰＡＲＡ」は並置構造を表現する記号であり、例外的にＰＲＥＤの属性値が単語とならない。
【００６７】
［ステップ３］
ｎ１とｎ２を結ぶリンクに対して、ｖ２とペアを成す属性を付与する。但し、ペアを成す属性が存在しない場合は何も付与しない。このようなノードｎ１に関する処理を、上記の［ステップ１］で得られたすべてのノードに対して行なう。但し、木構造の根に対応するノードに対しては処理を行なわない（図６を参照のこと）。
【００６８】
［ステップ４］
ｎ１に対して、ｖ２内に存在する属性のうち、その属性とペアを成す属性値内にＰＲＥＤを持たないものがあれば、その属性及びその属性とペアを成す属性値をｎ１の属性情報として付与する。このようなノードｎ１に関する処理を、上記の［ステップ１］で得られたすべてのノードに対して行なう（図７を参照のこと）。但し、あらかじめ設定された「木構造に含める属性のリスト」に従い、翻訳結果の比較に必要な属性のみをノードｎ１に付与する。
【００６９】
日英単語辞書格納部８は、日本語の単語とその英訳単語の対応関係を記述した対訳辞書を計算機内部に保持する。
【００７０】
対応ノード決定部９は、木構造変換部７から得られる木構造のうち、入力文格納部１に保持されている日本語文に対応する木構造（以下、「日本語木構造」とする）と、翻訳結果文格納部３に保持されている英語文に対応するｎ個の木構造（以下、「英語木構造」とする）の各々を比較し、日本語木構造中の各ノード（単語）と英語木構造中の各ノードの対応関係を決定する。ノード間の対応関係を決定する際には、日英単語辞書格納部８に保持されている対訳辞書を用いる。対応関係があると決定された（すなわち、日本語単語とその英訳単語であることが対訳辞書中に記載されていた）日本語木構造中のノードと英語木構造中のノードには、等しい識別子（ノード識別子）を付与する。また、対応関係が決定されなかったノードにはそれぞれ異なる識別子を付与する。
【００７１】
翻訳結果文比較選択部１０は、元の日本語入力文についての日本語木構造と、各翻訳サブブロックの翻訳結果についてのｎ個の英語木構造の各々を比較することにより、日本語木構造と最も類似する英語木構造を選択し、その英語木構造に対応する英語文をユーザに提示する。
【００７２】
なお、ＬＦＧ解析部６では、入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られないことがある。このような場合には、解析可能な部分解析結果又は部分ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの集合を出力する（前述）。そして、翻訳結果比較選択部１０は、翻訳元言語文や各翻訳サブブロックにおける翻訳結果文についての解析可能な部分解析結果あるいは部分ｆ−ｓｔｒｕｃｔｕｒｅの集合を比較することによって、最も類似する英語木構造を選択することができる。
【００７３】
翻訳結果文比較選択部１０において、最も類似する英語木構造を選択するための詳細な手順は以下の通りである。
【００７４】
［ステップ１］
日本語木構造Ｔ_ｊ中に存在するノード（ノード識別子）ペア、及びノード又はノード間リンクに付与された属性情報の組（ノード・ペア情報）をすべて抽出する。同様に、ある１つの英語木構造Ｔ_ｅ中に存在するノード・ペア情報をすべて抽出する。
【００７５】
［ステップ２］
日本語木構造Ｔ_ｊと英語木構造Ｔ_ｅの類似度を初期値０に設定する。日本語木構造Ｔ_ｊから得られたすべてのノードペア情報と英語木構造Ｔ_ｅから得られたすべてのノード・ペア情報を互いに比較する。そして、ノード・ペア情報が一致するものが見つかる毎に、日本語木構造Ｔ_ｊと英語木構造Ｔ_ｅの類似度に対して１を加算する。得られた類似度を英語木構造Ｔ_ｅ中に存在するノード・ペア情報の数で除したものを新たに類似度とする。
【００７６】
ここで、「ノード・ペア情報が一致する」とは、「ノードペア情報に含まれる全ての情報が完全に一致する」ことと定義する。但し、ノード及びノード間リンクに付与された属性に関しては、それらが完全に一致していない場合であっても「ノード・ペア情報が一致する」ものとし、一致しない情報の数をｍとすれば、１を加算する代わりに、α^ｍを加算する。αは、あらかじめ設定された定数（０＜α＜１）である。
【００７７】
［ステップ３］
以上の、英語木構造Ｔ_ｅに対する処理をすべての翻訳サブブロックによる翻訳結果についての英語木構造に対して行ない、各翻訳結果についての日本語木構造Ｔ_ｊとの類似度を決定する。日本語木構造Ｔ_ｊとの間で最も大きい類似度値を持つ英語木構造Ｔ_ｅを選択する。
【００７８】
図３１には、元の日本語文についての木構造と各翻訳結果の木構造との比較に基づいて最適な翻訳結果を選択するための処理手順をフローチャートの形式で示している。
【００７９】
まず、日本語木構造をＴＪとし、各翻訳サブブロックから得られたｎ個の翻訳結果についての英語木構造をそれぞれＴＥｘ（ｘ＝１，２，…，ｎ）とする（ステップＳ１）。
【００８０】
また、日本語木構造ＴＪ中に存在するノード識別子ペア及び属性情報の組（以下では、「ノード・ペア情報」とも呼ぶ）をすべて抽出し、ＰＪｙ（ｙ＝１，２，…，ｐ）とする（ステップＳ２）。
【００８１】
そして、英語木構造のインデックスであるｘに初期値１を代入する（ステップＳ３）。
【００８２】
ここで、ｘ番目の英語木構造ＴＥｘ中に存在するノード識別子ペア及び属性情報についてのノード・ペア情報をすべて抽出し、これをＰＥｘｚ（ｚ＝１，２，…，ｑ）とする（ステップＳ４）。
【００８３】
また、日本語木構造ＴＪと英語木構造ＴＥｘの類似度Ｓ（ＴＪ，ＴＥｘ）を初期値０とし（ステップＳ５）、さらに変数ｙ及びｚに初期値１を代入する（ステップＳ６）。
【００８４】
そして、日本語木構造ＴＪのｙ番目のノード・ペア情報ＰＪｙとｘ番目の英語木構造ＴＥｘのｚ番目のノード・ペア情報ＰＥｘｚに含まれるすべての情報が完全に一致していれば、類似度Ｓ（ＴＪ，ＴＥｘ）に１を加算する。また、ノード識別子ペアが一致しているが属性情報が一致していない場合には、位置していない属性情報の数をｍとし、類似度Ｓ（ＴＪ，ＴＥｘ）に１を加算する代わりにα^ｍを加算する（ステップＳ７）。但し、αは、あらかじめ設定された定数（０＜α＜１）である。
【００８５】
次いで、ｚがｘ番目の英語木構造ＴＥｘのノード識別子ペアの総数ｑに到達したかどうかを判別し（ステップＳ８）、到達していなければ、ｚに１だけ加算し（ステップＳ１３）、ステップＳ７に戻り、次の英語木構造ＴＥｘのノード識別子ペアについて日本語木構造ＴＪのｙ番目のノード・ペア情報ＰＪｙとの比較を継続して行なう。
【００８６】
次いで、ｙが日本語木構造ＴＪのノード識別子ペアの総数ｐに到達したかどうかを判別し（ステップＳ９）、到達していなければ、ｙに１だけ加算し（ステップＳ１４）、ステップＳ７に戻り、日本語木構造ＴＪの次のノード識別子ペアＰＪｙについてｘ番目の英語木構造ＴＥｘのｚ番目のノード・ペア情報ＰＥｘｚとの比較を継続して行なう。
【００８７】
次いで、ｘ番目の英語木構造ＴＥｘ中に存在するノード・ペア情報の数で類似度Ｓ（ＴＪ，ＴＥｘ）を除した値を、新たに日本語木構造ＴＪとｘ番目の英語木構造ＴＥｘとの類似度Ｓ（ＴＪ，ＴＥｘ）とする（ステップＳ１０）。
【００８８】
そして、ｘが英語木構造の総数ｎに到達したかどうかを判別し（ステップＳ１１）、到達していなければｘに１だけ加算し（ステップＳ１５）、ステップＳ４に戻り、日本語木構造ＴＪのノード識別子ペアＰＪｙと次の英語木構造ＴＥｘのｚ番目のノード・ペア情報ＰＥｘｚとの比較を継続して行なう。
【００８９】
一方、ｘが英語木構造の総数ｎに到達したならば、日本語木構造ＴＪと最も大きい値を持つ類似度Ｓ（ＴＪ，ＴＥｘ）に対応する英語木構造ＴＥｘを選択して（ステップＳ１２）、本処理ルーチン全体を終了する。
【００９０】
ここで、日本語文「誰が彼が学校へ来ることを知っていますか。」が入力文格納部１に入力された場合を例にとって、本実施形態に係る最適な翻訳文の選択処理について具体的に説明する。
【００９１】
各翻訳サブブロック２１−２４（ｎ＝４の場合）によって上記の日本語文が以下の４通りの英語文（１）〜（４）に訳されたとする。
【００９２】
（１）Ｗｈｏｋｎｏｗｓｔｈａｔｉｔｃｏｍｅｓｔｏｓｃｈｏｏｌ
ｈｅ？
（２）Ｓｏｍｅｏｎｅｙｏｕｋｎｏｗｔｈａｔｈｅｃｏｍｅｓｔｏ
ｓｃｈｏｏｌ？
（３）Ｗｈｏｋｎｏｗｓｈｅｃｏｍｅｓｔｏｓｃｈｏｏｌ？
（４）Ｗｈｏｋｎｏｗｓｃｏｍｉｎｇｔｏｓｃｈｏｏｌｆｏｒｈｉｍ？
【００９３】
ＬＦＧ解析部６は、日本語文法規則格納部４に保持されている日本語ＬＦＧ文法規則及び語彙規則を用い入力文格納部１に保持されている日本語文を意味解析するとともに、英語文法規則格納部５に保持されている英語ＬＦＧ文法規則及び語彙規則を用い翻訳結果文格納部３に保持されている各英語文に対してそれぞれＬＦＧに基づく意味解析処理を施し、対応するｆ−ｓｔｒｕｃｔｕｒｅを得る。図８には、ＬＦＧ解析部６によって元の日本語文から得られるｆ−ｓｔｒｕｃｔｕｒｅを示している。また、図９〜図１２には、元の日本文を各翻訳サブブロックにより翻訳した英語文（１）〜（４）からＬＦＧ解析部６によって得られるｆ−ｓｔｒｕｃｔｕｒｅを示している。
【００９４】
図９及び図１０に示すｆ−ｓｔｒｕｃｔｕｒｅは、部分解析結果となっている。すなわち、英語文（１）と（２）は英語文法に従った文とはみなされず、部分的な解析結果のリスト構造となっている。図示の通り、図９及び図１０中のＦＩＲＳＴ属性及びＲＥＳＴ属性は、このようなリスト構造を構成するための特殊な属性である。
【００９５】
さらに、木構造変換部７によって、図８及び図９〜図１２の各ｆ−ｓｔｒｕｃｔｕｒｅに対して得られる木構造を、ＬＦＧ解析部６から得られる日本語文に対応するｆ−ｓｔｕｒｕｃｔｕｒｅ、並びに英語文に対応するｆ−ｓｔｒｕｃｔｕｒｅをそれぞれ木構造に変換する。図１３には、元の日本語文から得られるｆ−ｓｔｒｕｃｔｕｒｅを木構造変換部７によって木構造に変換した結果を示している。また、図１４〜１７には、元の日本文を各翻訳サブブロックにより翻訳した英語文（１）〜（４）からＬＦＧ解析部６によって得られるｆ−ｓｔｒｕｃｔｕｒｅをさらに木構造変換部７によって木構造に変換した結果を示している。なお、本実施形態では、ノードに付与する属性情報として、ＴＥＮＳＥ属性（現在（ｐｒｅｓ）などの時制を示す属性）とＳＴＭＴ−ＴＹＰＥ属性（平常文（ｄｅｃｌ）、疑問文（ｉｎｔ）などの文のタイプを示す属性）のみを選択している。
【００９６】
次いで、対応ノード決定部９は、木構造変換部７から得られる日本語木構造と、各翻訳結果についての英語木構造をそれぞれ比較し、日本語木構造中の各ノード（単語）と英語木構造中の各ノードの対応関係を決定する。
【００９７】
図１８〜図２２には、元の日本語文についての日本語木構造と、各翻訳サブブロックにより翻訳した英語文（１）〜（４）についての英語木構造の各ノードに対してノード識別子を付与した例を示している。これは、日英単語辞書格納部８中の対訳辞書により、「知る−ｋｎｏｗ」、「誰−ｗｈｏ」、「来る−ｃｏｍｅ」、「彼−ｈｅ」、「へ−ｔｏ」、「学校−ｓｃｈｏｏｌ」の対応関係が得られた場合の結果であり、対応するノードには等しい識別子が付与され、対応関係が得られなかったノードには互いに異なる識別子が付与されている。
【００９８】
次いで、翻訳結果分比較選択部１０は、それぞれの英語木構造について日本語木構造との類似度を計算する。ここでは、日本語木構造から得られたすべてのノードペア情報と英語木構造Ｔ_ｅから得られたすべてのノード・ペア情報を互いに比較し、ノード・ペア情報が一致するものが見つかる毎に日本語木構造と英語木構造の類似度に対して１を加算する。そして、得られた類似度を英語木構造Ｔ_ｅ中に存在するノード・ペア情報の数で除したものを新たに類似度とする。
【００９９】
図１８に示した元の日本語文の木構造と、図１９〜２２に示した各翻訳結果についての英語木構造の間の類似度を計算した結果をそれぞれ図２３〜図２６に示している。但し、ここでの計算ではα＝０．９とした。
【０１００】
図１８に示した日本語木構造と図１９に示した英語木構造を比較した場合、完全一致ノード・ペア情報数が３、非完全一致ノード・ペア情報数が１、全ノード・ペア情報数（リンク数）が７であることから、類似度は（３＋０．９）／７＝０．５６である。また、図１８に示した日本語木構造と図２０に示した英語木構造を比較した場合、完全一致ノード・ペア情報数が１、非完全一致ノード・ペア情報数が１、全ノード・ペア情報数（リンク数）が６であることから、類似度は（１＋０．９）／７＝０．３０である。また、図１８に示した日本語木構造と図２１に示した英語木構造を比較した場合、完全一致ノード・ペア情報数が４、非完全一致ノード・ペア情報数が１、全ノード・ペア情報数（リンク数）が５であることから、類似度は（４＋０．９）／５＝０．９８である。また、図１８に示した日本語木構造と図２２に示した英語木構造を比較した場合、完全一致ノード・ペア情報数が３、非完全一致ノード・ペア情報数が１、全ノード・ペア情報数（リンク数）が６であることから、類似度は（３＋０．９）／６＝０．６２である。
【０１０１】
これらの結果から、類似度が０．９８となる図２１に示した木構造が選択される。したがって、対応する英語文“Ｗｈｏｋｎｏｗｓｈｅｃｏｍｅｓｔｏｓｃｈｏｏｌ？”が、日本語文「誰が彼が学校へ来ることを知っていますか。」の英語訳として選択されることになる。
【０１０２】
本実施形態では最も類似度の高い英語文を選択するものとしたが、それぞれ算出された類似度を信頼度とみなし、その値の高いものから順にユーザに示すようにしても構わない。
【０１０３】
また、本実施形態では、翻訳結果文比較選択部１０による比較をノード・ペアの一致数に基づく手法としたが、高橋哲郎、乾健太郎、松本裕治共著「テキストの構文的類似度の評価方法について」（情報処理学会研究報告，2002-NL-150，pp. 163-170（2002））で提案されているような、他の比較手法を用いても同様の効果が得られることを理解されたい。
【０１０４】
第２の実施形態：
ことわざやその他の慣用句においては、いずれの機械翻訳システムによる翻訳結果文も元の日本語文との間で意味解析結果が低いことがある。本発明の第２の実施形態では、各翻訳サブブロックからの翻訳結果文に対する意味解析結果を比較し、英語文同士で意味解析結果の類似度が高いものを翻訳結果として出力する。
【０１０５】
本実施形態に係る機械翻訳システムの機能構成は、図２に示したものと略同一である。但し、翻訳結果文比較選択部１０における英語木構造の選択手順のみが異なる。すなわち、［ステップ３］において、すべての英語木構造に対して日本語木構造Ｔ_ｊとの類似度を決定した後に、以下の処理を継続する。
【０１０６】
［ステップ４］
［ステップ２］で行った日本語木構造Ｔ_ｊと英語木構造Ｔ_ｅの間の類似度計算と同様の計算を、英語木構造のすべてのペアに対して行なう。ここで、英語木構造Ｔ_ｅａと英語木構造Ｔ_ｅｂの間の類似度をＳ（Ｔ_ｅａ，Ｔ_ｅｂ）とし、また、日本語木構造Ｔ_ｊとの類似度をそれぞれＳ（Ｔ_ｊ，Ｔ_ｅａ）、Ｓ（Ｔ_ｊ，Ｔ_ｅｂ）とする。
【０１０７】
［ステップ５］
Ｓ（Ｔ_ｊ，Ｔ_ｅａ）＜Ｔ_１
Ｓ（Ｔ_ｊ，Ｔ_ｅｂ）＜Ｔ_１
Ｓ（Ｔ_ｅａ，Ｔ_ｅｂ）＞Ｔ_２
を満たす英語木構造Ｔ_ｅａと英語木構造Ｔ_ｅｂの組み合わせがＮ個以上存在する場合、この条件を満たすすべての英語木構造Ｔ_ｅａ及び英語木構造Ｔ_ｅｂを最適な翻訳文についての木構造として選択する。但し、Ｔ_１、Ｔ_２はあらかじめ値の設定された実数の定数（０＜Ｔ_１＜Ｔ_２＜１）であり、Ｎはあらかじめ設定された整数の定数である。
【０１０８】
図３２には、元の日本語文についての木構造と各翻訳結果の木構造との比較、並びに翻訳結果の木構造同士の比較に基づいて最適な翻訳結果を選択するための処理手順をフローチャートの形式で示している。
【０１０９】
ここでは、まず図３１に示した処理手順に従って、日本語木構造ＴＪと各翻訳サブブロックからの翻訳結果についての英語木構造ＴＥｘとの類似度Ｓ（ＴＪ，ＴＥｘ）を求めるとともに、英語木構造ＴＥｘ及びＴＥｘ’同士の類似度Ｓ（ＴＥｘ，ＴＥｘ’）を求める（ステップＳ２１）。
【０１１０】
次いで、日本語木構造ＴＪとの類似度が所定の閾値Ｔ_１を下回るとともに、互いの類似度が所定の閾値Ｔ_２を上回るような英語木構造の組み合わせＴＥｘ及びＴＥｘ’を求め、その組の数をｔとする（ステップＳ２２）。但し、Ｔ_１、Ｔ_２はあらかじめ値の設定された実数の定数（０＜Ｔ_１＜Ｔ_２＜１）であり、Ｎはあらかじめ設定された整数の定数である。
【０１１１】
次いで、ｔが所定の整数Ｎ以上かどうかを判別する（ステップＳ２３）。ｔがＮ以上のときには、日本語木構造ＴＪとの類似度が所定の閾値Ｔ_１を下回るとともに、互いの類似度が所定の閾値Ｔ_２を上回るという２つの条件を同時に満たす英語木構造の組み合わせＴＥｘ及びＴＥｘ’を選択して（ステップＳ２４）、本処理ルーチン全体を終了する。
【０１１２】
一方、ｔがＮを越えない場合には、最も大きな値を持つ類似度Ｓ（ＴＪ，ＴＥｘ）に対応する英語木構造ＴＥｘを選択して（ステップＳ２５）、本処理ルーチン全体を終了する。
【０１１３】
特にことわざや格言の場合では、構文的には全く異なる英文が正しい英訳となることが多い。例えば、日本語文「朱に交われば赤くなる。」の英語訳として英語文“Ｔｈｅｒｏｔｔｅｎａｐｐｌｅｉｎｊｕｒｅｓｉｔｓｎｅｉｇｈｂｏｒｓ．”は正しいものであるが、直接表現する意味内容は大きく異なる。
【０１１４】
ＥＢＭＴに基づく翻訳システムでは、このような慣用的な表現が用例として収集されていれば、正しく翻訳することが可能である。本実施形態に係る機械翻訳システムは、このような状況に対処するものである。
【０１１５】
このような慣用的、すなわち、繰り返し使われる表現はＥＢＭＴに基づく翻訳システムにおいて、用例対集合の中に既に収集されている可能性が極めて高い。したがって、多くの翻訳サブブロックから類似度の高い英訳文が出力され、且つ、それらが日本語文と類似度が低い場合は、慣用的表現とみなして正しい英語訳であると認定する。
【０１１６】
第３の実施形態：
図２７には、本発明の第３の実施形態に係る機械翻訳システムの機能構成を模式的に示している。同図に示す機械翻訳システムは、翻訳先言語（英語）で書かれた複数の用例文を格納する用例文格納部１１をさらに備えている。
【０１１７】
この場合、ＬＦＧ解析部６は、日本語文法規則格納部４に保持されている日本語ＬＦＧ文法規則及び語彙規則を用い入力文格納部１に保持されている日本語文を意味解析し、英語文法規則格納部５に保持されている英語ＬＦＧ文法規則及び語彙規則を用い翻訳結果文格納部３に保持されている各英語文に対してそれぞれＬＦＧに基づく意味解析するとともに、英語文法規則格納部５に保持されている英語ＬＦＧ文法規則及び語彙規則を用い用例文格納部１１から翻訳先言語（英語）で書かれた複数の用例文を取り出してこれらに意味解析処理を施す。
【０１１８】
そして、木構造変換部７は、元の日本語文、翻訳結果文、並びに用例分についてのｆ−ｓｔｒｕｃｔｕｒｅを木構造に変換するあるいは、各用例文について意味解析処理をあらかじめ施し、これらのｆ−ｓｔｒｕｃｔｕｒｅ又はその木構造を蓄積し、適宜取り出すようにしてもよい。
【０１１９】
対応ノード決定部９は、木構造変換部７から得られる日本語木構造と、各翻訳結果についての英語木構造、さらには用例分についての英語木構造をそれぞれ比較し、日本語木構造中の各ノード（単語）と英語木構造中の各ノードの対応関係を決定する。
【０１２０】
そして、翻訳結果分比較選択部１０は、それぞれの英語木構造について日本語木構造との類似度を計算する。
【０１２１】
このような場合、翻訳結果よりも用例文の評価が高い場合には用例文を翻訳結果として採用することができる。
【０１２２】
第４の実施形態：
入力された日本語文が複数の部分構造に分割可能な場合には、上述した翻訳、日本語文及び英語文の意味解析、木構造変換、対応ノード決定並びに翻訳結果文の比較処理を部分構造毎に実行する。そして、最も類似度の高い部分英語訳の並びを出力する、あるいは、類似度の高い部分訳を組み合わせることによって翻訳英語文を生成した上でユーザに提示することも可能である。
【０１２３】
例えば、入力日本語文のｆ−ｓｔｒｕｃｔｕｒｅが最も外側にＰＡＲＡの構造を持つ場合（２つ以上の単文が接続詞で単純に結合されている場合）には、入力日本語文を複数の部分構造（単文）に分割し、各単文毎に最適の英語訳を選択する、あるいは、それらの英語訳を結合してユーザに提示する、といった手法を実現することが可能である。
【０１２４】
第５の実施形態：
翻訳機能部２内の翻訳サブブロックは、例えば市販の機械翻訳システムやＷｅｂ上で有償又は無償で公開されている翻訳サービスなどで構成される。
【０１２５】
翻訳サブブロックがインターネットを介してアクセスされるＷｅｂ上の翻訳システムの場合、入力文格納部１に格納されている文を含むＷｅｂページとしてインターネット上に公開する。
【０１２６】
第６の実施形態：
翻訳元言語文を翻訳先言語文に直接翻訳する翻訳システムが存在しない場合、翻訳元言語から翻訳することが可能な翻訳システムが存在し、且つ、翻訳先言語へと翻訳することが可能な翻訳システムも存在する第３の言語を設定する。
【０１２７】
この場合、まず第３の言語を本発明に係る機械翻訳システムの翻訳先言語文に設定して、翻訳元言語文を第３の言語へと翻訳した翻訳結果文を得る。そして、さらに第３の言語を本発明に係る機械翻訳システムの翻訳元言語文に設定して、目的とする翻訳先言語文への翻訳結果文を得ることができる。
【０１２８】
［追補］
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
【０１２９】
【発明の効果】
以上詳記したように、本発明によれば、ＬＦＧに基づく意味解析結果を利用して翻訳元言語の入力文を翻訳先言語に好適に変換することができる、優れた機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムを提供することができる。
【０１３０】
また、本発明によれば、ＬＦＧの出力するｆ−ｓｔｒｕｃｔｕｒｅの持つ言語普遍性を利用してより最適な翻訳結果文を出力することができる、優れた機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラムを提供することができる。
【０１３１】
本発明によれば、意味解析技術を中間言語方式の機械翻訳システムに直接利用するのではなく、翻訳元言語で書かれた入力文と複数の機械翻訳システムから出力される翻訳先言語で書かれた翻訳結果文との比較判断に利用することにより、最も品質の高い翻訳結果を取得することができる。
【０１３２】
本明細書では、日本語から英語への翻訳を行なう実施形態を例として挙げているが、言語の如何に関わらず同等の効果が得られることは明らかである。また、意味解析処理としてＬＦＧに基づく解析を行う実施形態としたが、複数の言語間で比較可能な解析結果を出力するものであればいかなる意味解析の手段を利用しても同等の効果が得られるということを充分理解されたい。
【０１３３】
要するに、本発明によれば、複数の翻訳システムの翻訳結果から最適な訳を自動選択することが可能となる。既存のすべての機械翻訳システムを用意し、その中から適切な翻訳結果を選択することにより、結果として現状の技術における最高品質の機械翻訳結果を適宜得ることができる。
【図面の簡単な説明】
【図１】本発明に係る機械翻訳システムの基本的な機能構成を模式的に示した図である。
【図２】本発明の一実施形態に係る機械翻訳システムの機能構成を模式的に示した図である。
【図３】日本語文「画家が赤い帽子と女性の絵を描いていた。」に対応するｆ−ｓｔｒｕｃｔｕｒｅの一例を示した図である。
【図４】図３に示したｆ−ｓｔｒｕｃｔｕｒｅを木構造に変換する処理を説明するための図である。
【図５】図３に示したｆ−ｓｔｒｕｃｔｕｒｅを木構造に変換する処理を説明するための図である。
【図６】図３に示したｆ−ｓｔｒｕｃｔｕｒｅを木構造に変換する処理を説明するための図である。
【図７】図３に示したｆ−ｓｔｒｕｃｔｕｒｅを木構造に変換する処理を説明するための図である。
【図８】ＬＦＧ解析部６によって元の日本語文「誰が彼が学校へ来ることを知っていますか。」から得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。
【図９】英語文（１）からＬＦＧ解析部６によって得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。
【図１０】英語文（２）からＬＦＧ解析部６によって得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。
【図１１】英語文（３）からＬＦＧ解析部６によって得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。
【図１２】英語文（４）からＬＦＧ解析部６によって得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。
【図１３】元の日本語文「誰が彼が学校へ来ることを知っていますか。」から得られるｆ−ｓｔｒｕｃｔｕｒｅを木構造変換部７によって木構造に変換した結果を示した図である。
【図１４】英語文（１）からＬＦＧ解析部６によって得られるｆ−ｓｔｒｕｃｔｕｒｅを木構造変換部７によって木構造に変換した結果さらに示した図である。
【図１５】英語文（２）からＬＦＧ解析部６によって得られるｆ−ｓｔｒｕｃｔｕｒｅを木構造変換部７によって木構造に変換した結果さらに示した図である。
【図１６】英語文（３）からＬＦＧ解析部６によって得られるｆ−ｓｔｒｕｃｔｕｒｅを木構造変換部７によって木構造に変換した結果さらに示した図である。
【図１７】英語文（４）からＬＦＧ解析部６によって得られるｆ−ｓｔｒｕｃｔｕｒｅを木構造変換部７によって木構造に変換した結果さらに示した図である。
【図１８】元の日本語文「誰が彼が学校へ来ることを知っていますか。」についての日本語木構造の各ノードに対してノード識別子を付与した例を示した図である。
【図１９】１９英語文（１）についての英語木構造の各ノードに対してノード識別子を付与した例を示した図である。
【図２０】英語文（２）についての英語木構造の各ノードに対してノード識別子を付与した例を示した図である。
【図２１】英語文（３）についての英語木構造の各ノードに対してノード識別子を付与した例を示した図である。
【図２２】英語文（４）についての英語木構造の各ノードに対してノード識別子を付与した例を示した図である。
【図２３】図１８に示した日本語木構造と図１９に示した英語木構造の間に類似度を計算した結果を示した図である。
【図２４】図１８に示した日本語木構造と図２０に示した英語木構造の間に類似度を計算した結果を示した図である。
【図２５】図１８に示した日本語木構造と図２１に示した英語木構造の間に類似度を計算した結果を示した図である。
【図２６】図１８に示した日本語木構造と図２２に示した英語木構造の間に類似度を計算した結果を示した図である。
【図２７】本発明の第３の実施形態に係る機械翻訳システムの機能構成を模式的に示した図である。
【図２８】「少女が望遠鏡で男を見た。」という日本語文の句構造（構文構造）表現を示した図である。
【図２９】図２８に示した日本語構文構造を英語の構文構造に変換し、さらに、適切な訳語を付与した例を示した図である。
【図３０】日本語文「太郎は花子にプレゼントを渡した。」をＬＦＧにより解析した結果得られるｆ−ｓｔｒｕｃｔｕｒｅの例を示した図である。
【図３１】元の日本語文についての木構造と各翻訳結果の木構造との比較に基づいて最適な翻訳結果を選択するための処理手順を示したフローチャートである。
【図３２】元の日本語文についての木構造と各翻訳結果の木構造との比較、並びに翻訳結果の木構造同士の比較に基づいて最適な翻訳結果を選択するための処理手順を示したフローチャートである。
【符号の説明】
１…入力文格納部
２…翻訳機能部
２１−２ｎ…翻訳サブブロック
３…翻訳結果文格納部
４…日本語文法規則格納部
５…英語文法規則格納部
６…ＬＦＧ解析部
７…木構造変換部
８…日英単語辞書格納部
９…対応ノード決定部
１０…翻訳結果文比較選択部
１１…用例文格納部

Claims

翻訳元言語文を翻訳先言語に変換する機械翻訳システムであって、
翻訳元言語文を翻訳先言語文へ変換する複数の翻訳副手段を備え、翻訳元言語文を翻訳先言語に翻訳する翻訳手段と、
翻訳元言語文を意味解析する第１の意味解析手段と、
前記の各翻訳副手段による翻訳結果文を意味解析する第２の意味解析手段と、
前記第１及び第２の意味解析手段による意味解析結果を格関係に基づく木構造に変換する木構造変換手段と、
前記の各翻訳副手段による翻訳結果文の意味解析結果を前記第１の意味解析手段による意味解析結果と比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文を出力する翻訳結果文比較手段と、
を備え、
前記第１及び第２の意味解析手段は、意味解析結果として、解析対象の文を、文の単語情報、構文構造を示す格情報、時制、様相を含む属性情報を、属性（ＰＲＥＤ）と対応する属性値（単語）のペアの入れ子構造で表現し、
前記木構造変換手段は、意味解析結果中の属性に対応する属性値をすべて抽出し、入れ子の外側の属性が内側の属性の親になるように属性値（各単語）を表すノード間をリンクで連結するとともに、外側の属性値とペアをなす属性を該リンクに付与して、意味解析結果の木構造を生成し、
前記翻訳結果文比較手段は、翻訳元言語文及び翻訳結果文それぞれについての意味解析結果の木構造から、ノード・ペア、及びノード又はノード間リンクに付与された属性情報の組からなるノード・ペア情報を抽出し、翻訳元言語文及び翻訳結果文の間で一致するノード・ペア情報の個数に基づいて類似度を算出する、
ことを特徴とする機械翻訳システム。
前記第１及び第２の意味解析手段は、ＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒに基づいて記述された該当する言語に関する文法規則を備え、前記文法規則を参照することにより入力された言語文に対してＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒに基づく解析を施し、ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを出力し、
前記翻訳結果文比較手段は、前記第１及び第２の意味解析手段から出力される翻訳元言語文と翻訳結果文のｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの木構造を比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文を出力する、
ことを特徴とする請求項１に記載の機械翻訳システム。
前記第１及び第２の意味解析手段は、入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られない場合には、解析可能な部分解析結果又は部分ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの集合を出力し、
前記翻訳結果文比較手段は、前記第１及び第２の意味解析手段から出力される文全体に対応する意味解析結果又はｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ、あるいは解析可能な部分解析結果又は部分ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの集合を比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文を出力する、
ことを特徴とする請求項１又は２のいずれかに記載の機械翻訳システム。
前記第１の意味解析手段から得られる翻訳元言語文についての意味解析結果に基づいて該翻訳元言語文を部分構造に分割する入力文分割手段をさらに備え、
前記翻訳結果文比較手段は、前記入力文分割手段から得られる部分構造に対応する各部分意味解析結果と類似する部分意味解析結果を前記の各翻訳副手段から得られた翻訳結果文についての意味解析結果から抽出し、得られた部分意味解析結果に対応する翻訳先言語で書かれたテキスト部分を出力する、
ことを特徴とする請求項３に記載の機械翻訳システム。
翻訳先言語で書かれた複数の用例文を格納する用例文格納手段と、
前記用例文格納手段に格納されている用例文を意味解析する第３の意味解析手段をさらに備え、
前記翻訳結果文比較手段は、前記第１の意味解析手段による意味解析結果と、前記第２の意味解析手段による翻訳結果文の意味解析結果あるいは前記第３の意味解析結果による用例文の意味解析結果を比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文あるいは用例文を出力する、
ことを特徴とする請求項１に記載の機械翻訳システム。
前記翻訳結果文比較手段は、前記第１の意味解析手段による翻訳元言語文に対する意味解析結果と、前記第２の意味解析手段による前記の各翻訳副手段からの翻訳結果文に対する意味解析結果を比較し、前記第１の意味解析手段による翻訳元言語文に対する意味解析結果と各翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度よりも、いずれか２以上の翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度の方が高い場合には、当該２以上の翻訳副手段からの翻訳結果文を最適な翻訳結果として選択する、
ことを特徴とする請求項１に記載の機械翻訳システム。
前記第１の意味解析手段から得られる翻訳元言語文についてのｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを翻訳先言語文の構文構造に従うｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅに変換するｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ変換手段をさらに備え、
前記木構造変換手段は、前記ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ変換手段によって変換されたｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを木構造に変換する、
ことを特徴とする請求項２に記載の機械翻訳システム。
コンピュータを用いて構築される機械翻訳システム上で、翻訳元言語文を翻訳先言語に変換する機械翻訳方法であって、
前記コンピュータが備える翻訳手段が、翻訳元言語文を翻訳先言語文へ変換する複数の翻訳サブステップにより翻訳元言語文を翻訳先言語にそれぞれ翻訳する翻訳ステップと、
前記コンピュータが備える第１の意味解析手段が、翻訳元言語文を意味解析する第１の意味解析ステップと、
前記コンピュータが備える第２の意味解析手段が、前記の各翻訳サブステップによる翻訳結果文をそれぞれ意味解析する第２の意味解析ステップと、
前記コンピュータが供える木構造変換手段が、前記第１及び第２の意味解析手段による意味解析結果を格関係に基づく木構造に変換する木構造変換ステップと、
前記コンピュータが備える翻訳結果比較手段が、前記の各翻訳サブステップによる翻訳結果文の意味解析結果を前記第１の意味解析ステップによる意味解析結果と比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文を出力する翻訳結果文比較ステップと、
を備え、
前記第１及び第２の意味解析ステップでは、意味解析結果として、解析対象の文を、文の単語情報、構文構造を示す格情報、時制、様相を含む属性情報を、属性（ＰＲＥＤ）と対応する属性値（単語）のペアの入れ子構造で表現し、
前記木構造変換ステップでは、意味解析結果中の属性に対応する属性値をすべて抽出し、入れ子の外側の属性が内側の属性の親になるように属性値（各単語）を表すノード間をリンクで連結するとともに、外側の属性値とペアをなす属性を該リンクに付与して、意味解析結果の木構造を生成し、
前記翻訳結果文比較ステップでは、翻訳元言語文及び翻訳結果文それぞれについての意味解析結果の木構造から、ノード・ペア、及びノード又はノード間リンクに付与された属性情報の組からなるノード・ペア情報を抽出し、翻訳元言語文及び翻訳結果文の間で一致するノード・ペア情報の個数に基づいて類似度を算出する、
を具備することを特徴とする機械翻訳方法。
前記第１及び第２の意味解析ステップでは、ＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒに基づいて記述された該当する言語に関する文法規則を参照することにより入力された言語文に対してＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒに基づく解析を施し、ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを出力し、
前記翻訳結果文比較ステップでは、前記第１及び第２の意味解析ステップにより得られる翻訳元言語文と翻訳結果文のｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文を出力する、
ことを特徴とする請求項８に記載の機械翻訳方法。
前記第１及び第２の意味解析ステップでは、入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られない場合には、解析可能な部分解析結果又は部分ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの集合を出力し、
前記翻訳結果文比較ステップでは、前記第１及び第２の意味解析ステップにより得られる文全体に対応する意味解析結果又はｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ、あるいは解析可能な部分解析結果又は部分ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの集合を比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文を出力する、
ことを特徴とする請求項８又は９のいずれかに記載の機械翻訳方法。
前記第１の意味解析ステップにより得られる翻訳元言語文についての意味解析結果に基づいて該翻訳元言語文を部分構造に分割する入力文分割ステップをさらに備え、
前記翻訳結果文比較ステップでは、前記入力文分割ステップにより得られる部分構造に対応する各部分意味解析結果と類似する部分意味解析結果を前記の各翻訳サブステップから得られた翻訳結果文についての意味解析結果から抽出し、得られた部分意味解析結果に対応する翻訳先言語で書かれたテキスト部分を出力する、
ことを特徴とする請求項８に記載の機械翻訳方法。
翻訳先言語で書かれた複数の用例文を意味解析する第３の意味解析ステップをさらに備え、
前記翻訳結果文比較ステップでは、前記第１の意味解析ステップによる意味解析結果と、前記第２の意味解析ステップによる翻訳結果文の意味解析結果あるいは前記第３の意味解析ステップによる用例文の意味解析結果を比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文あるいは用例文を出力する、
ことを特徴とする請求項８に記載の機械翻訳方法。
前記翻訳結果文比較ステップでは、前記第１の意味解析ステップによる翻訳元言語文に対する意味解析結果と、前記第２の意味解析ステップによる前記の各翻訳副手段からの翻訳結果文に対する意味解析結果を比較し、前記第１の意味解析手段による翻訳元言語文に対する意味解析結果と各翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度よりも、いずれか２以上の翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度の方が高い場合には、当該２以上の翻訳副手段からの翻訳結果文を最適な翻訳結果として選択する、
ことを特徴とする請求項８に記載の機械翻訳方法。
前記第１の意味解析ステップにより得られる翻訳元言語文についてのｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを翻訳先言語文の構文構造に従うｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅに変換するｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ変換ステップをさらに備え、
前記木構造変換ステップでは、前記ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ変換ステップによって変換されたｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを木構造に変換する、
ことを特徴とする請求項９に記載の機械翻訳方法。
翻訳元言語文を翻訳先言語に変換する処理をコンピュータ・システム上で執行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータを、
翻訳元言語文を翻訳先言語文へ変換する複数の翻訳副手段を備え、翻訳元言語文を翻訳先言語に翻訳する翻訳手段と、
翻訳元言語文を意味解析する第１の意味解析手段と、
前記の各翻訳副手段による翻訳結果文を意味解析する第２の意味解析手段と、
前記第１及び第２の意味解析手段による意味解析結果を格関係に基づく木構造に変換する木構造変換手段と、
前記の各翻訳副手段による翻訳結果文の意味解析結果を前記第１の意味解析手段による意味解析結果と比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文を出力する翻訳結果文比較手段と、
として機能させるためのコンピュータ・プログラムであって、
前記第１及び第２の意味解析手段は、意味解析結果として、解析対象の文を、文の単語情報、構文構造を示す格情報、時制、様相を含む属性情報を、属性（ＰＲＥＤ）と対応する属性値（単語）のペアの入れ子構造で表現し、
前記木構造変換手段は、意味解析結果中の属性に対応する属性値をすべて抽出し、入れ子の外側の属性が内側の属性の親になるように属性値（各単語）を表すノード間をリンクで連結するとともに、外側の属性値とペアをなす属性を該リンクに付与して、意味解析結果の木構造を生成し、
前記翻訳結果文比較手段は、翻訳元言語文及び翻訳結果文それぞれについての意味解析結果の木構造から、ノード・ペア、及びノード又はノード間リンクに付与された属性情報の組からなるノード・ペア情報を抽出し、翻訳元言語文及び翻訳結果文の間で一致するノード・ペア情報の個数に基づいて類似度を算出する、
ことを特徴とするコンピュータ・プログラム。
前記第１及び第２の意味解析手段は、ＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒに基づいて記述された該当する言語に関する文法規則を備え、前記文法規則を参照することにより入力された言語文に対してＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒに基づく解析を施し、ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを出力し、
前記翻訳結果文比較手段は、前記第１及び第２の意味解析手段から出力される翻訳元言語文と翻訳結果文のｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの木構造を比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文を出力する、
ことを特徴とする請求項１５に記載のコンピュータ・プログラム。
前記第１及び第２の意味解析手段は、入力された言語文に対して意味解析を施す際に、文全体の解析結果が得られない場合には、解析可能な部分解析結果又は部分ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの集合を出力し、
前記翻訳結果文比較手段は、前記第１及び第２の意味解析手段から出力される文全体に対応する意味解析結果又はｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ、あるいは解析可能な部分解析結果又は部分ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅの集合を比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文を出力する、
ことを特徴とする請求項１５又は１６のいずれかに記載のコンピュータ・プログラム。
前記第１の意味解析手段から得られる翻訳元言語文についての意味解析結果に基づいて該翻訳元言語文を部分構造に分割する入力文分割手段をさらに備え、
前記翻訳結果文比較手段は、前記入力文分割手段から得られる部分構造に対応する各部分意味解析結果と類似する部分意味解析結果を前記の各翻訳副手段から得られた翻訳結果文についての意味解析結果から抽出し、得られた部分意味解析結果に対応する翻訳先言語で書かれたテキスト部分を出力する、
ことを特徴とする請求項１７に記載のコンピュータ・プログラム。
翻訳先言語で書かれた複数の用例文を格納する用例文格納手段と、
前記用例文格納手段に格納されている用例文を意味解析する第３の意味解析手段をさらに備え、
前記翻訳結果文比較手段は、前記第１の意味解析手段による意味解析結果と、前記第２の意味解析手段による翻訳結果文の意味解析結果あるいは前記第３の意味解析結果による用例文の意味解析結果を比較し、該比較結果に基づいて１又はそれ以上の翻訳結果文あるいは用例文を出力する、
ことを特徴とする請求項１５に記載のコンピュータ・プログラム。
前記翻訳結果文比較手段は、前記第１の意味解析手段による翻訳元言語文に対する意味解析結果と、前記第２の意味解析手段による前記の各翻訳副手段からの翻訳結果文に対する意味解析結果を比較し、前記第１の意味解析手段による翻訳元言語文に対する意味解析結果と各翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度よりも、いずれか２以上の翻訳副手段からの翻訳結果文に対する意味解析結果との間の類似度の方が高い場合には、当該２以上の翻訳副手段からの翻訳結果文を最適な翻訳結果として選択する、
ことを特徴とする請求項１５に記載のコンピュータ・プログラム。
前記第１の意味解析手段から得られる翻訳元言語文についてのｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを翻訳先言語文の構文構造に従うｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅに変換するｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ変換手段をさらに備え、
前記木構造変換手段は、前記ｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅ変換手段によって変換されたｆｕｎｃｔｉｏｎａｌ−ｓｔｒｕｃｔｕｒｅを木構造に変換する、
ことを特徴とする請求項１６に記載のコンピュータ・プログラム。