JP4023384B2

JP4023384B2 - 自然言語翻訳方法及び装置及び自然言語翻訳プログラム

Info

Publication number: JP4023384B2
Application number: JP2003146323A
Authority: JP
Inventors: 昭男横尾; 健太郎小倉
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2003-05-23
Filing date: 2003-05-23
Publication date: 2007-12-19
Anticipated expiration: 2023-05-23
Also published as: JP2004348556A

Description

【０００１】
【発明の属する技術分野】
本発明は、自然言語翻訳方法及び装置及び自然言語翻訳プログラムに係り、特に、原言語で記述されたテキスト文を目的言語に翻訳する際に、原言語文を書き替えて翻訳を行う自然言語翻訳方法及び装置及び自然言語翻訳プログラムに関する。
【０００２】
【従来の技術】
一般的な自然言語翻訳装置は、その入力として主語や目的語といった必須となる格要素及び用言があるテキスト文を対象としている。一方、新聞記事の見出しなどは、動詞などの用言が文末になく、文の形をしていない。これらの翻訳装置を使って、新聞記事の見出し文を翻訳すると、箇条書きの名詞句のように翻訳することはできるが、記事見出しの意味をより正確に伝えるためには、文の形の方が翻訳できる。
【０００３】
従来の自然言語翻訳システムで、用言が省略されているときに用言を補完する手段として、単語を分割し、文節ごとにまとめ上げる形態素解析処理、文節間の係り受け関係を決定する係り受け解析処理の結果を使って、用言を補完する技術がある（例えば、特許文献１参照）。
【０００４】
また、１つの用言に係る格要素の候補の繰り返される助詞に着目して文中に用言を補完するという技術もある。例えば、「Ｘ社は、新社屋の２階に応接室を、３階に会議室を設置する。」という文において、「〜に」と「〜を」の繰り返される助詞に着目して「設置し、」という用言を補完するものである。
【０００５】
【特許文献１】
特許第２７７０５５５号「自然言語解析システム」
【０００６】
【発明が解決しようとする課題】
しかしながら、上記従来の技術は、形態素解析処理、係り受け解析処理の後で用言を補完する処理を実行している。そのため、係り受け解析による多義が生成されているため、その各々に対して用言の補完処理を行うため、処理が重くなるという問題がある。
【０００７】
また、助詞の繰り返しと用言の関係に着目して用言の補完を行う技術においては、補完されるべき用言が文中に存在していることが条件となっている。
【０００８】
本発明は、上記の点に鑑みなされたもので、新聞記事の見出し文のように文末に用言が省略されている日本語テキスト文を正しく翻訳するための自然言語翻訳方法及び装置及び自然言語翻訳プログラムを提供することを目的とする。
【０００９】
【課題を解決するための手段】
図１は、本発明の原理を説明するための図である。
【００１０】
本発明（請求項１）は、形態素解析手段、助詞用言補完手段、係り受け解析手段、意味解析手段、日本語目的言語変換手段、目的言語生成手段を有し、原言語文を書き換えて翻訳を行う装置における自然言語翻訳方法において、
形態素解析手段が、単語と該単語の品詞や意味属性を含む情報を記憶した日本語解析辞書を参照して、入力された日本語で記述されたテキスト文を単語分割し、文節を生成し、単語構造バッファに格納する形態素解析過程（ステップ１）と、
助詞用言補完手段が、単語構造バッファに格納された最終文節を利用して、単語及び文節の情報に対して、入力されたテキスト文の文末の名詞に対する条件と該条件により補完する助詞と用言の補完ルールを記憶した助詞・用言補完テーブルの該補完ルールに従って助詞及び用言を補完し、結果を単語構造バッファに格納する助詞用言補完過程（ステップ２）と、
係り受け解析手段が、単語分割された日本語文の文節間の係り受け関係に必要な情報を記憶した係り受け解析辞書を参照して、助詞及び用言が補完された単語構造バッファの文節構造に対して係り受け関係を決定する係り受け解析過程（ステップ３）と、
意味解析手段が、日本文における用言と格要素の関係を制約する情報と対応する目的言語文の用言と格要素の関係の情報を記憶した意味解析辞書を参照して、係り受け解析過程の解析結果における格要素と用言との間の関係を決定する意味解析過程（ステップ４）と、
日本語目的言語変換手段が、日本語と目的言語の単語の対訳や訳語選択に必要となる情報が記憶された日本語目的言語対照辞書を参照して、意味解析過程の解析結果における日本語単語に対する目的言語の単語を決定する日本語目的言語変換過程（ステップ５）と、
目的言語生成手段が、目的言語文の生成に必要となる単語の形態素情報を記憶した目的言語生成辞書を参照して、日本語目的言語変換過程によって決定された目的言語の単語から目的言語文を生成する目的言語生成過程（ステップ６）と、を行う。
【００１１】
図２は、本発明の原理構成図である。
【００１２】
本発明（請求項２）は、原言語文を書き換えて翻訳を行う自然言語翻訳装置であって、
入力されたテキスト文の文末の名詞に対する条件と該条件により補完する助詞と用言の補完ルールを記憶した助詞・用言補完テーブル１２と、
単語と該単語の品詞や意味属性を含む情報を記憶する日本語解析辞書１１と、
単語分割された日本語文の文節間の係り受け関係に必要な情報を記憶する係り受け解析辞書１３と、
日本文における用言と格要素の関係を制約する情報と対応する目的言語文の用言と格要素の関係の情報を記憶する意味解析辞書１４と、
日本語と目的言語の単語の対訳や訳語選択に必要となる情報を記憶する日本語目的言語対照辞書１５と、
目的言語文の生成に必要となる単語の形態素情報を記憶する目的言語生成辞書１６と、
日本語文の形態素解析、係り受け解析、意味解析、助詞・用言の補完、日本語と目的言語の単語対訳、目的言語文の生成に必要となる意味属性情報を記憶する意味属性体系辞書１７と、
日本語解析辞書１１を参照して、入力された日本語で記述されたテキスト文を単語分割し、文節を生成し、単語構造バッファ４に格納する形態素解析手段３と、
単語構造バッファ４に格納された最終文節を利用して単語及び文節の情報に対して、助詞・用言補完テーブルに記憶された補完ルールに従って助詞及び用言を補完し、結果を該単語構造バッファ４に格納する助詞用言補完手段５と、
係り受け辞書１３を参照して、助詞及び用言が補完された単語構造バッファ４の文節構造に対して係り受け関係を決定する係り受け解析手段１３と、
意味解析辞書１４を参照して、係り受け解析手段１３の解析結果における格要素と用言との間の関係を決定する意味解析手段７と、
日本語目的言語対照辞書１５を参照して、意味解析手段７の解析結果における日本語単語に対する目的言語の単語を決定する日本語言語変換手段８と、
目的言語生成辞書１６を参照して、日本語目的言語変換手段８によって決定された目的言語の単語から目的言語文を生成する目的言語生成手段９と、を有する。
【００１３】
本発明（請求項３）は、請求項２に記載の自然言語翻訳装置を構成する各手段としてコンピュータを機能させる自然言語翻訳プログラムである。
【００１４】
上記のように、本発明によれば、係り受け解析処理の前の早い段階で助詞や用言を補完するので、少ない解析多義に対して適用できる利点があることに加え、用言を補完することにより文の意味が明確になるので、解析により生成される多義を減らすことも可能となる。
【００１５】
【発明の実施の形態】
以下、図面と共に本発明の実施の形態を説明する。
【００１６】
図３は、本発明の一実施の形態における自然言語翻訳装置の構成図である。
【００１７】
同図に示す自然言語翻訳装置は、入力部１、プロセッサ２、記憶部１０、出力部１８から構成される。
【００１８】
入力部１は、例えば、キーボードやファイル読み取り装置等により構成され、翻訳の対象となるテキスト文を入力するために使用する。
【００１９】
記憶部１０は、日本語解析辞書１１、助詞・用言補完テーブル１２、係り受け解析辞書１３、意味解析辞書１４、日本語目的言語対照辞書１５、目的言語生成辞書１６、及び、意味属性体系辞書１７と、を有する。
【００２０】
日本語解析辞書１１は、日本語の形態素解析に使用する辞書であり、単語と当該単語の品詞や意味属性などの情報を記憶する。
【００２１】
助詞・用言補完テーブル１２は、日本語文において、助詞と用言を補完するための条件と補完される単語の情報である補完ルールを記憶する。
【００２２】
係り受け解析辞書１３は、単語分割された日本語文の文節間の係り受け関係の解析に必要な情報を記憶する。
【００２３】
意味解析辞書１４は、日本語文における用言と格要素の間の関係を制約する情報と対応する目的言語文の用言と格要素の関係の情報を記憶する。
【００２４】
日本語目的言語対照辞書１５は、日本語と目的言語の単語の対訳や訳語選択に必要となる情報を記憶する。
【００２５】
目的言語生成辞書１６は、目的言語文の生成に必要となる単語の形態素情報を記憶する。
【００２６】
意味属性体系辞書１７は、日本語文の形態素解析、係り受け解析、意味解析、助詞・用言の補完、日本語と目的言語の単語対訳の選択、目的言語文の生成に必要となる意味属性情報を記憶する。
【００２７】
プロセッサ２は、ＣＰＵやＲＯＭ，ＲＡＭ等のコンピュータとしての一般的な構成を備えており、上記ＲＯＭに記憶された自然言語翻訳プログラムにより指定される処理手順に従って翻訳処理を実行する。この翻訳処理のためのプロセッサ２は、形態素解析部３、単語構造バッファ４、助詞・用言補完部５、係り受け解析部６、意味解析部７、日本語目的言語変換部８、及び、目的言語生成部９と、を備えている。
【００２８】
形態素解析部３は、日本語で記述されたテキスト文を、上記の日本語解析辞書１１に格納された情報に基づいて単語分割を行い、各単語に品詞や意味属性に関する情報や後述する処理で必要となる情報を付与すると共に、文節構造にまとめ上げ、単語構造バッファ４に記録する。
【００２９】
単語構造バッファ４は、形態素解析された結果である単語と文節の情報を保持している。
【００３０】
助詞・用言補完部５は、単語構造バッファ４に記憶された単語及び文節の情報に対して、助詞・用言補完テーブル１２に記憶された情報を使って書き替えを行い、その結果を再度単語構造バッファ４に記憶する。
【００３１】
係り受け解析部６は、単語構造バッファ４に記録された単語及び文節の情報を使い、係り受け解析辞書１３に格納された情報に基づいて文節間の係り受けに関する情報を付与する。
【００３２】
意味解析部７は、上述した係り受け解析の結果に対して、意味解析辞書１４に格納された情報に基づいて用言と格要素の間の関係を決定すると共に、対応する目的言語文における用言と格要素の間の関係を付与する。
【００３３】
日本語目的言語変換部８は、上述した意味解析の結果に対して、日本語目的言語対照辞書１５に格納された情報に基づいて日本語文の単語に対応する目的言語文の単語を決定する。
【００３４】
目的言語生成部９は、上述した日本語目的言語変換の結果に対して、目的言語生成辞書１６に格納された情報に基づいて目的言語文を生成する。
【００３５】
出力部１８は、例えば、ディスプレイやプリンタ、または、ファイル書き込み装置により構成され、上記プロセッサ２の制御の下に、上記目的言語文生成部９により生成された目的言語文等の表示または、印刷または、書き込みを行う。
【００３６】
以下に、プロセッサ２の動作を処理の流れに従って説明する。
【００３７】
形態素解析部３は、日本語で記述されたテキスト文を、上記日本語解析辞書１１に格納された情報に基づいて単語分割を行い、各単語に品詞や意味属性に関する情報や後述する処理で必要となる情報を付与すると共に、文節構造にまとめ上げ、単語構造バッファ４に記録する。
【００３８】
ここで解析された結果は、文節＜１＞から文節＜ｎ＞で構成される。また、各文節＜ｉ＞は、単語＜ｉ_１＞から単語＜ｉ_ｍ＞で構成される。ここで、ｉ＝１，…，ｎである。単語＜ｉ_ｊ＞は、“一般名詞”、“固有名詞”、“接尾辞”、“動詞”、“格助詞”、“文末記号”などである。ここで、ｊ＝１，…，ｍである。
【００３９】
単語の品詞については、例えば、「横尾他、“日英機械翻訳のための単語辞書”、電子情報通信学会、言語理解とコミュニケーション研究会，ＮＬＣ−９７，ｐｐ．３７−４４（１９９７．７）」を参照することができる。
【００４０】
図４は、本発明の一実施の形態における単語構造バッファの一例を示す。
【００４１】
助詞・用言補完部５は、単語構造バッファ４に記憶された単語及び文節の情報に対して、助詞・用言補完テーブル１２に記憶された情報を使って書き替えを行い、その結果を再度単語構造バッファ４に記録する。
【００４２】
図５は、本発明の一実施の形態における助詞・用言補完部の全体処理のフローチャートである。
【００４３】
助詞・用言補完部５では、図５に示すように、まず、単語構造バッファ４に格納された文節のうち、最終文節が単一名詞か名詞複合語であるかを判定する（ステップ３０１）。最終文節が単一名詞でも名詞複合語でもない場合は、本処理の対象外であり、単語構造バッファ４の内容を何も書き替えることなく本処理を終了する。
【００４４】
ここで、最終文節が単一名詞か名詞複合語であるかの判定は、以下により行う。但し、最終単語として文末記号「。」がある場合は、それを除いて判定する。まず、最終文節が１つの単語で構成されていて、かつ、その単語が“名詞”である場合は、「単一名詞」であるという条件を満たす。
【００４５】
次に、最終文節が複数の単語で構成されている場合、複数の単語の品詞がすべて“接頭語”、“名詞”、“接尾辞”である場合は、「名詞複合語」であるという条件を満たす。これら以外の場合は、「単一名詞」か「名詞複合語」であるという条件を満たさない。
【００４６】
次に、最終文節の主名詞を決定する（ステップ３０２）。主名詞とは、名詞複合語の意味を代表する単語である。単一名詞である場合は、それが主名詞となる。名詞複合語の場合は、以下により主名詞を決定する。名詞複合語の後方から単語を１つずつ取り出していく。その単語が名詞である場合は、それが主名詞となる。その単語が接尾辞である場合、「人」、「年」などの“助数詞型接尾辞”、「山」「駅」などの“固有名詞承接型接尾辞”、「性」「式」などの“連体詞型接尾辞”のように名詞的な意味を持つ接尾辞である場合に、それが主名詞となる。なお、名詞複合語には最低１つの名詞が含まれているので、主名詞がないということはありえない。
【００４７】
次に、助詞・用言補完テーブル１２に主名詞の条件がマッチする補完ルールがあるかどうかを判定する（ステップ３０３）。助詞・用言補完テーブル１２の条件部４０１に記述された条件と主名詞とのマッチングは、助詞・用言補完テーブル１２に対して、補完ルールの先頭から順番に行ってもよいし、インデックスを使うなどして別の方法によっても構わない。上記マッチングにより条件がマッチする補完ルールがなかった場合は、単語構造バッファ４の内容を何も書き替えることなく本処理を終了する。
【００４８】
図６は、本発明の一実施の形態における助詞・用言補完テーブルの構成例を示す。助詞・用言補完テーブル１２の条件部４０１と主名詞のマッチングは以下のようにして行う。条件部４０１は、表記と品詞と意味属性の条件が記述してあり、その各々が主名詞の表記と品詞と意味属性とすべて合致したときにマッチングが成功する。但し、条件部４０１に「＊」が記述されているときは、その条件については考慮しなくて良いということを示す。
【００４９】
表記が合致するとは、完全に一致することである。但し、条件部４０１の表記の条件として複数の表記が記述されているときは、そのいずれかと主名詞の表記が一致すればよい。
【００５０】
品詞が合致するとは、品詞名が一致することである。但し、条件部４０１の品詞の条件として複数の品詞が記述されているときは、そのいずれかと主名詞の品詞が一致すればよい。
【００５１】
意味属性が合致するとは、条件部４０１の意味属性条件に記述された意味属性が主名詞の意味属性と一致するか、主名詞の意味属性を包含していればよい。但し、条件部４０１の意味属性の条件として、複数の意味属性が記述されているときは、そのいずれかと主名詞の意味属性が一致するか、そのいずれかに包含されていればよい。また、主名詞の意味属性が複数ある場合は、そのいずれかについて上記の一致か包含関係が成立すればよい。
【００５２】
更に、条件部４０１の意味属性条件として、複数の意味属性が記述され、かつ、主名詞の意味属性が複数のある場合は、いずれかの組み合わせについて上記の一致か包含関係が成立すればよい。
【００５３】
なお、上記において、ある意味属性αが別の意味属性βを包含しているとは、名詞の意味属性体系辞書１７を示す図７において、意味属性αを頂点とする部分木の中に意味属性βが含まれていることをいう。また、図７では、一部の意味属性の関係のみを例として記述しており、破線で示された部分は途中を省略してある。
【００５４】
意味属性については、例えば、「宮崎他、“日英機械翻訳のための意味属性体系”、電子情報通信学会、言語理解とコミュニケーション研究会、ＮＬＣ−９７，ｐｐ．２９−３６（１９９７，７）」を参照することができる。
【００５５】
以上の判定により、条件がマッチする補完ルールがあった場合は、書き替え部４０２の内容に従って、助詞と用言を補完し、単語構造バッファ４の内容を書き替える（ステップ３０４）。
【００５６】
まず、単語構造バッファ４の最終文節の最終単語の後方に、書き替え部４０２の助詞部に記述された助詞の表記と品詞とその他の情報を持つ単語を追加する。その他の情報とは、後述する処理で必要とされる情報であって、ここでは、特に規定しない。
【００５７】
次に、単語構造バッファ４の最終文節の後方に、文節構造を追加し、書き替え部４０２の用言部に記述された用言及び助動詞の表記と品詞とその他の情報を持つ単語を追加する。なお、助動詞がない場合もある。
【００５８】
なお、書き替える前の単語構造バッファ４の最終単語として文末記号「。」があった場合は、まず、その文末記号を取り除き、書き替え処理を実行した後、単語構造バッファ４の最後の文節の最終単語として文末記号「。」を戻す。
【００５９】
次に、プロセッサ２の以降の処理について述べる。
【００６０】
係り受け解析部６は、単語構造バッファ４に記録された文節について、係り先の文節と、文節間の関係として“格関係”、“並列関係”、“連体修飾関係”などの係り受け属性を決定する。
【００６１】
意味解析部７は、上記係り受け解析部６の結果に対して、意味解析辞書１４に格納された情報に基づいて用言と格要素の間の関係を決定すると共に、対応する目的言語文における用言と格要素の間の関係を付与する。
【００６２】
日本語目的言語変換部８は、上記意味解析部７の結果に対して、日本語目的言語対照辞書１５に格納された情報に基づいて日本語文の単語に対応する目的言語文の単語を決定する。
【００６３】
目的言語生成部９は、上記日本語目的言語変換部８の結果に対して、目的言語生成辞書１６に格納された情報に基づいて目的言語文を生成する。
【００６４】
以下に、目的言語として英語を採った場合の動作例について例文を用いて示す。なお、以下の説明において、“｜”は、単語境界を、“‖”は文節境界を表す。
【００６５】
第１の例として、「杉山愛、平木理化とペア」が入力されたとして説明する。
【００６６】
この文に対して形態素解析部３を実行すると、
「杉山｜愛、‖平木｜理化｜と‖ペア」
となり、その結果を単語構造バッファ４に記録する。その例を図８に示す。
【００６７】
続いて、助詞・用言補完部５が図５の処理フローに従って動作する。
【００６８】
まず、ステップ３０１において、最終文節が単一名詞か名詞複合語であるかの判定を行う。この例では、図８から最終文節は「ペア」の１単語であり、それが名詞であることが判定されるので、次に進む。
【００６９】
次に、ステップ３０２において、主名詞を決定する。この例では、最終文節は「ペア」の１単語であるので、「ペア」が主名詞となる。
【００７０】
次に、ステップ３０３において、助詞・用言補完テーブル１２に主名詞の条件がマッチする補完ルールがあるかどうかを判定する。この例では、図６に示す助詞・用言補完テーブル１２の例において、１番目の補完ルールと条件がマッチする。これは、条件部４０１の表記「ペア」と主名詞の表記「ペア」が一致し、かつ、条件部４０１の品詞“一般名詞”と主名詞の品詞“一般名詞”が一致し、かつ、条件部４０１の意味属性『対』が主名詞の意味属性の１つである『対』と一致するからである。
【００７１】
マッチする補完ルールが見つかったので、ステップ３０４において、書き替え部４０２の情報に従って書き替え処理を行う。
【００７２】
まず、単語構造バッファ４の最終文節の最終単語の後方に、書き替え部４０２の助詞部に記述された助詞の表記「を」と品詞“格助詞”とその他の情報を持つ単語を追加する。
【００７３】
次に、単語構造バッファ４の最終文節の後方に、文節構造を追加し、書き替え部４０２の用言部に記述された用言の表記「組む」と品詞の“他動詞”とその他の情報を持つ単語を追加する。
【００７４】
助詞・用言補完部５の処理が終了した段階での単語構造バッファの情報を図９に示す。
【００７５】
以下、係り受け解析部６、意味解析部７、日本語目的言語変換部８、目的言語生成部９の処理を行い、最終的な目的言語文として、
“ＡｉＳｕｇｉｙａｍａｐａｉｒｓｗｉｔｈＲｉｋａＨｉｒａｋｉ．”を得て、それを出力部１８から出力する。
【００７６】
第２の例として、「候補者は５人」が入力されたとして説明する。
【００７７】
この文に対して形態素解析部３を実行すると、「候補者｜は‖５｜人」となり、その結果を単語構造バッファ４に記録する。図１０にその情報を示す。
【００７８】
続いて、助詞・用言補完部５が図５の処理フローに従って動作する。
【００７９】
まず、ステップ３０１において、最終文節が単一名詞か名詞複合語であるかの判定を行う。この例では、図８から最終文節は、「５｜人」の２単語であり、「５」は数量を表す“数詞”という“名詞”であり、「人」は、“助数詞型接尾辞”であり、名詞複合語の条件を満たすので、次に進む。
【００８０】
次に、ステップ３０２において、主名詞を決定する。この例では、最終文節は「５｜人」の２単語で構成される名詞複合語である。後方の単語から主名詞の条件を満たすか順次判定を行い、「人」が“助数詞型接尾辞”であるので、この単語「人」が主名詞であると決定される。
【００８１】
次に、ステップ３０３において、助詞・用言補完テーブル１２に主名詞の条件がマッチする補完ルールがあるかどうかを判定する。この例では、図６に示す助詞・用言補完テーブル１２の例において、２番目の補完ルールと条件がマッチする。これは、条件部４０１の表記「＊」となっていて主名詞の表記について何も規定しておらず、かつ、条件部４０１の品詞“助数詞型接尾辞”と主名詞の品詞“助数詞型接尾辞”が一致し、かつ、条件部４０１の意味属性『数量』が主名詞の意味属性の１つである『単位』を包含しているからである。
【００８２】
助詞・用言補完テーブル１２からマッチする補完ルールが見つかったので、ステップ３０４において書き替え部４０２の情報に従って書き替え処理を行う。
【００８３】
まず、単語構造バッファ４の最終文節の最終単語の後方に、書き替え部４０２の助詞部に記述された助詞の表記「に」と品詞“格助詞”とその他の情報を持つ単語を追加する。
【００８４】
次に、単語構造バッファ４の最終文節の後方に、文節構造を追加し、書き替え部４０２の用言部に記述された用言の表記「なる」と品詞“自動詞”とその他の情報を持つ単語を追加する。さらに、助動詞の表記「た」と品詞“助動詞”とその他の情報を持つ単語を追加する。
【００８５】
助詞・用言補完部５の処理が終了した段階での単語構造バッファ４の情報を図１１に示す。
【００８６】
以下、係り受け解析部６、意味解析部７、日本語目的言語変換部８、目的言語生成部９の処理を行い、最終的な目的言語文として
“Ｃａｎｄｉｄａｔｅｓｒｅａｃｈｅｄｆｉｖｅｐｅｏｐｌｅ．”
を得て、それを出力部１８から出力する。
【００８７】
上記の実施の形態では、ＲＯＭに組み込まれた自然言語翻訳プログラムをＣＰＵが実行することで翻訳処理を行うように説明したが、上記自然言語翻訳プログラムをＣＤ−ＲＯＭ等の外部記憶媒体から読み込んだり、ネットワーク上のサイトから通信回線を介してダウンロードしてインストールするようにしてもよい。
【００８８】
また、上記の実施の形態では、翻訳の対象となるテキスト文をキーボードまたは、ファイルから入力するように説明したが、テキスト文を引数とし、本実施の形態をサブルーチンまたは、関数のように呼び出したり、ネットワークを経由してテキスト文を受け渡すようにしてもよい。
【００８９】
また、同様に、上記の実施例では、翻訳の結果をディスプレイに表示したり、プリンタで印刷したり、ファイルに書き込んだりするように説明したが、サブルーチンまたは、関数の実行結果として翻訳結果を受け取ったり、ネットワークを経由して翻訳結果を引き渡すようにしてもよい。
【００９０】
その他、自然言語翻訳装置の種類とその構成、辞書の種類とその構成、形態素解析処理、係り受け解析処理、意味解析処理、日本語目的言語変換処理、目的言語文生成処理の方法や制御手順とその内容についても、本発明の要旨を逸脱しない範囲で種々変形して実施できる。
【００９１】
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
【００９２】
【発明の効果】
上述のように、本発明によれば、自然言語翻訳装置において、新聞記事の見出し文のように、文末に用言が省略されたテキスト文に対し、翻訳処理の早い段階で解析の多義を増やすことなく、テキスト文の文末の単語にマッチする条件を有した助詞・用言補完ルールにより、適切な助詞及び用言を補完して翻訳することが可能になる。
【図面の簡単な説明】
【図１】本発明の原理を説明するための図である。
【図２】本発明の原理構成図である。
【図３】本発明の一実施の形態における自然言語翻訳装置の構成図である。
【図４】本発明の一実施の形態における単語構造バッファの一例である。
【図５】本発明の一実施の形態における助詞・用言補完部の全体処理のフローチャートである。
【図６】本発明の一実施の形態における助詞・用言補完テーブルの構成例である。
【図７】本発明の一実施の形態における名詞の意味属性体系辞書の例である。
【図８】本発明の一実施の形態における第１の例の形態素解析結果を単語構造バッファに記録した例である。
【図９】本発明の一実施の形態における第１の例の助詞・用言補完部の処理が終了した段階での単語構造バッファの例である。
【図１０】本発明の一実施の形態における第２の例の形態素解析結果を単語構造バッファに記録した例である。
【図１１】本発明の一実施の形態における第２の例の助詞・用言補完部の処理が終了した段階での単語構造バッファの例である。
【符号の説明】
１入力部
２プロセッサ
３形態素解析手段、形態素解析部
４単語構造バッファ
５助詞用言補完手段、助詞用言補完部
６係り受け解析手段、係り受け解析部
７意味解析手段、意味解析部
８日本語目的言語変換手段、日本語目的言語変換部
９目的言語生成手段、目的言語生成部
１０記憶部
１１日本語解析辞書
１２助詞・用言補完テーブル
１３係り受け解析辞書
１４意味解析辞書
１５日本語目的言語対照辞書
１６目的言語生成辞書
１７意味属性体系辞書
１８出力部
４０１助詞・用言補完テーブルの条件部
４０２助詞・用言補完テーブルの書き替え部

Claims

形態素解析手段、助詞用言補完手段、係り受け解析手段、意味解析手段、日本語目的言語変換手段、目的言語生成手段を有し、原言語文を書き換えて翻訳を行う装置における自然言語翻訳方法において、
前記形態素解析手段が、単語と該単語の品詞や意味属性を含む情報を記憶した日本語解析辞書を参照して、入力された日本語で記述されたテキスト文を単語分割し、文節を生成し、単語構造バッファに格納する形態素解析過程と、
前記助詞用言補完手段が、前記単語構造バッファに格納された最終文節を利用して、単語及び文節の情報に対して、入力されたテキスト文の文末の名詞に対する条件と該条件により補完する助詞と用言の補完ルールを記憶した助詞・用言補完テーブルの該補完ルールに従って助詞及び用言を補完し、結果を前記単語構造バッファに格納する助詞用言補完過程と、
前記係り受け解析手段が、単語分割された日本語文の文節間の係り受け関係に必要な情報を記憶した係り受け解析辞書を参照して、助詞及び用言が補完された前記単語構造バッファの文節構造に対して係り受け関係を決定する係り受け解析過程と、
前記意味解析手段が、日本文における用言と格要素の関係を制約する情報と対応する目的言語文の用言と格要素の関係の情報を記憶した意味解析辞書を参照して、前記係り受け解析過程の解析結果における格要素と用言との間の関係を決定する意味解析過程と、
前記日本語目的言語変換手段が、日本語と目的言語の単語の対訳や訳語選択に必要となる情報が記憶された日本語目的言語対照辞書を参照して、前記意味解析過程の解析結果における日本語単語に対する目的言語の単語を決定する日本語目的言語変換過程と、
前記目的言語生成手段が、目的言語文の生成に必要となる単語の形態素情報を記憶した目的言語生成辞書を参照して、前記日本語目的言語変換過程によって決定された前記目的言語の単語から目的言語文を生成する目的言語生成過程と、
を行うことを特徴とする自然言語翻訳方法。
原言語文を書き換えて翻訳を行う自然言語翻訳装置であって、
入力されたテキスト文の文末の名詞に対する条件と該条件により補完する助詞と用言の補完ルールを記憶した助詞・用言補完テーブルと、
単語と該単語の品詞や意味属性を含む情報を記憶する日本語解析辞書と、
単語分割された日本語文の文節間の係り受け関係に必要な情報を記憶する係り受け解析辞書と、
日本文における用言と格要素の関係を制約する情報と対応する目的言語文の用言と格要素の関係の情報を記憶する意味解析辞書と、
日本語と目的言語の単語の対訳や訳語選択に必要となる情報を記憶する日本語目的言語対照辞書と、
目的言語文の生成に必要となる単語の形態素情報を記憶する目的言語生成辞書と、
日本語文の形態素解析、係り受け解析、意味解析、助詞・用言の補完、日本語と目的言語の単語対訳、目的言語文の生成に必要となる意味属性情報を記憶する意味属性体系辞書と、
前記日本語解析辞書を参照して、入力された日本語で記述されたテキスト文を単語分割し、文節を生成し、単語構造バッファに格納する形態素解析手段と、
前記単語構造バッファに格納された最終文節を利用して単語及び文節の情報に対して、前記助詞・用言補完テーブルに記憶された前記補完ルールに従って助詞及び用言を補完し、結果を該単語構造バッファに格納する助詞用言補完手段と、
前記係り受け辞書を参照して、助詞及び用言が補完された前記単語構造バッファの文節構造に対して係り受け関係を決定する係り受け解析手段と、
前記意味解析辞書を参照して、前記係り受け解析手段の解析結果における格要素と用言との間の関係を決定する意味解析手段と、
前記日本語目的言語対照辞書を参照して、前記意味解析手段の解析結果における日本語単語に対する目的言語の単語を決定する日本語言語変換手段と、
前記目的言語生成辞書を参照して、前記日本語目的言語変換手段によって決定された前記目的言語の単語から目的言語文を生成する目的言語生成手段と、
を有することを特徴とする自然言語翻訳装置。
請求項２に記載の自然言語翻訳装置を構成する各手段としてコンピュータを機能させる自然言語翻訳プログラム。