WO2007097208A1

WO2007097208A1 - 言語処理装置、言語処理方法および言語処理用プログラム

Info

Publication number: WO2007097208A1
Application number: PCT/JP2007/052319
Authority: WO
Inventors: Kunihiko Sadamasa; Shinichi Ando; Shinichi Doi
Original assignee: Nec Corporation
Priority date: 2006-02-27
Filing date: 2007-02-09
Publication date: 2007-08-30
Also published as: US20090018821A1; CN101390091A; CN101390091B; JP5071373B2; JPWO2007097208A1; US8301435B2

Abstract

　言語処理装置は、多義語と他の語とを含む自然言語文に対して所定の解析を行い、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第１の解析部２１と、第１の解析部２１が出力した複数の解析結果に対して特定の解析を行って該複数の解析結果から１つの解析結果を採用する第２の解析部２３と、第１の解析部２１が出力した複数の解析結果から削除されても、第２の解析部２３が採用する解析結果が維持される、第１の解析部２１の不要な解析結果を削除するための削除規則を、第１の解析部２１が出力した複数の解析結果と第２の解析部２３の採用結果とに基づいて生成する生成部２４４と、を含む。

Description

明細書

言語処理装置、言語処理方法および言語処理用プログラム

技術分野

[0001] 本発明は、自然言語処理における形態素解析または構文解析などを行う言語処理装置、言語処理方法および言語処理用プログラムに関し、特に、元となる言語解析処理の解析結果を変えることなく解析途中の曖昧性を削減し、高速に解析処理を行うことが可能な言語処理装置、言語処理方法および言語処理用プログラムに関する背景技術

[0002] 機械翻訳またはテキストマイニング等に代表される自然言語処理では、入力された文を解析する構文解析処理が重要である。

[0003] 構文解析処理では、入力された文に対して、（1)文を単語に区切る、（2)各単語に品詞を付与する、（3)単語間の係り受けを決定する、（4)単語に意味情報を付与する、と

V、つた一連の処理が行われる。

[0004] しかし、自然言語の単語および句などの文法要素は、複数の意味や複数の品詞などの複数の文法上の働きを持ちうるため、単独では、一つの意味に特定されず複数の意味を有する曖昧性を持ちうる。

[0005] このため、構文解析処理では、文法要素の曖昧性を考慮しながら、解析が行われる。

[0006] 具体的には、言語処理装置は、複数の意味または複数の品詞などの文法上の働きを持つ単語または句などの文法要素 (以下「多義語」と称する。 )を含む文を解析する際、以下のように解析を行う。

[0007] まず、言語処理装置は、多義語が有する複数の文法上の働き (以下「複数の意味」と称する。 )に応じて、複数の候補を作成する。その後、言語処理装置は、それら複数の候補を解析して 1つの解析結果を出力する。

[0008] よって、言語処理装置は、多義語を含む文を解析する際、構文解析処理に多大な時間がかかる。 [0009] 構文解析処理を高速化する方法は、従来力多く提案されている。例えば、削除しても構文解析結果が変わらない不必要な候補を、早期に削減することにより、処理を高速化するとヽぅ方法がある。

[0010] この不必要な候補を特定するための規則を作成する方法としては、その規則を事前に人手で列挙する t 、う方法が従来提案されて、るが、人手でのデータ作成は、コストがかかるため現実的ではな!/、。

[0011] 一方、特許文献 1 (特開平 2— 114377号公報）には、構文解析処理の解析結果の実例から、曖昧性解消のモデル (規則）を学習する自然言語処理装置が記載されている。

[0012] 具体的には、特許文献 1には、構文解析処理の解析結果から品詞の曖昧性を解消するモデルを学習する自然言語処理装置が記載されて!ヽる。

[0013] この従来の自然言語処理装置は、形態素解析部と、構文解析部と、学習装置と、学習結果保持部と、から構成されている。このような構成を有する従来の自然言語処理装置は、次のように動作する。

[0014] 形態素解析部は、入力された文を形態素解析する。構文解析部は、形態素解析結果を基に構文解析を行う。学習装置は、形態素解析部が出力した曖昧性のある品詞列と、構文解析部での解析の結果に基づいて決定された品詞列と、を入力として、品詞推定を行う統計モデルを学習する。学習結果保持部は、学習装置で学習された結果を保持する。次回以降の解析処理では、構文解析部が、学習結果保持部の学習結果を利用して品詞推定を行い、早期に品詞列の曖昧性を解消する。

特許文献 1 :特開平 2— 114377号公報

発明の開示

発明が解決しょうとする課題

[0015] 特許文献 1に記載の従来の自然言語処理装置は、曖昧性を解消するために、品詞推定を行うが、その際、誤った品詞推定を行う可能性を有している。よって、従来の自然言語処理装置は、誤った品詞推定を行った場合、曖昧性を解消しない場合の構文解析結果と異なる構文解析結果を出力する可能性がある。

[0016] そのため、従来の自然言語処理装置では、構文解析結果を変えな!/、不必要な候補だけを削減するという目的を達成することはできない。

[0017] なお、従来の自然言語処理装置で誤った品詞推定が起こる理由は、本質的に削減できない候補が有るにもかかわらず、統計モデルでは、その候補の存在を考慮せずに、最も尤もらし、解 (候補)を推定する最尤推定が行われて、るためである。

[0018] 例えば、「走る/と/彼/は/言う」（表現 1)と、「走る/と/彼/は/疲れる」（表現 2)という 2つの表現について考えてみる。なお、表現中のスラッシュ記号は、単語区切りを表す。

[0019] ここで、単語「と」には、直前の句が引用表現であることを表す「引用助詞」、および

、時間の推移を表す「接続助詞」、という 2つの文法上の働き (意味)すなわち 2つの候補がある。よって、単語「と」は、曖昧性を有する。

[0020] いずれの候補が正解となるかは、多くの場合、「と」の後ろに、引用表現を受けることが出来る動詞が存在するか否かによって決定される。

[0021] 上記の例では、表現 1では、「言う」という引用表現を受ける動詞があるため、「引用助詞」が正解となり、表現 2では、該当する動詞がないため、「接続助詞」が正解となる。

[0022] し力しながら、従来の自然言語処理装置のように、品詞だけに着目した学習が行われる場合、表現 2とも、学習時に参照できる情報としては、「動詞/と/名詞/助詞/ 動詞」と同一になる。このため、表現 2における品詞推定を異なる結果にすることは、本質的に不可能である。

[0023] このような矛盾したデータが学習データとして使用された場合、最尤推定の統計学習においては、一般には、学習データ中でより頻度の高い品詞を単語の品詞として推定するモデルが学習される。

[0024] 例えば「接続助詞」の頻度の方が「引用助詞」の頻度より高い場合、表現 1が解析対象の際の曖昧性削減処理では、頻度が低いが本来の正解である「引用助詞」が削除され、結果として、元の構文解析結果とは異なる構文解析結果が出力される。

[0025] このような学習データ中の矛盾は、学習時に品詞だけを参照した場合だけでなぐ統計モデル学習全般につ!/、て起こる。

[0026] 統計モデル学習にお!/、ては、データスパースネスを防ぐために、参照する情報を有限の空間に制限するため、当該空間外の情報を用いないと曖昧性が解消できない例に関しては、同様に学習データ中の矛盾が生じる。

[0027] 本発明の目的は、最終的な解析結果を変化させない不要な候補のみを除去することを可能にする言語処理装置、言語修理方法および言語処理用プログラム、および、その不要な候補のみを除去することで、解析結果を変えることなぐより高速に解析処理を行うことができる言語処理装置、言語修理方法および言語処理用プログラムを提供することにある。

課題を解決するための手段

[0028] 上記目的を達成するために、本発明の言語処理装置は、多義語と他の語とを含む自然言語文に対して所定の解析を行い、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析部と、前記第 1の解析部が出力した複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析部と、前記第 1の解析部が出力した複数の解析結果力削除されても、前記第 2の解析部が採用する解析結果が維持される、該第 1の解析部の不要な解析結果を削除するための削除規則を、該第 1の解析部が出力した複数の解析結果と該第 2の解析部の採用結果とに基づいて生成する生成部と、を含む。

[0029] また、本発明の言語処理方法は、多義語と他の語とを含む自然言語文に対して所定の解析を行い、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析ステップと、前記複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析ステップと、前記複数の解析結果から削除されても、前記第 2の解析ステップで採用される解析結果が維持される、該第 1の解析ステップでの不要な解析結果を削除するための削除規則を、該第 1の解析ステップにて出力された複数の解析結果と該第 2の解析ステップでの採用結果とに基づ、て生成する生成ステップと、を含む。

[0030] 上記発明によれば、第 1の解析部の複数の解析結果力削除されても、第 2の解析部で採用される解析結果が維持される、第 1の解析部での不要な解析結果を削除するための削除規則が、第 1の解析部にて出力された複数の解析結果と第 2の解析部での採用結果とに基づ、て生成される。

[0031] このため、第 2の解析部にて採用されなかった第 1の解析部の解析結果から、第 2 の解析部が正確な解析結果を採用するために必要な解析結果が削除されることを防止できる。よって、最終的な解析結果を変化させない不要な候補 (解析結果)のみを除去することが可能になる。

[0032] また、本発明の言語処理装置は、多義語と他の語とを含む自然言語文に対して所定の解析を行い、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析部と、前記第 1の解析部が出力した複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析部と、前記多義語の 1つの意味と他の語に関する情報との組合せごとに、該組合せを採用するカゝ否カゝを表す判断情報が記憶されている記憶部と、前記第 1の解析部が出力した各解析結果中の前記多義語の意味および他の語に関する情報との組合せごとに、該組合せが該第 2の解析部で採用された力否力を表す採否情報を、該第 1の解析部が出力した複数の解析結果と前記第 2の解析部の採用結果とに基づ!/、て生成する採否情報生成部と、前記採否情報生成部が生成した採否情報で不採用とされた前記組合せが、前記記憶部で採用を表す判断情報と対応している場合、該採否情報を採用に変更し、その後、前記複数の解析結果から不要な解析結果を削除するための削除規則を、変更された該採否情報と変更されな力た該採否情報とに基づいて生成する規則生成部と、を含む。

[0033] また、本発明の言語処置方法は、多義語の 1つの意味と他の語に関する情報との組合せごとに、該組合せを採用するカゝ否かを表す判断情報が記憶されてヽる記憶部を含む言語処理装置が行う言語処理方法であって、多義語と他の語とを含む自然言語文に対して所定の解析を行い、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析ステップと、前記複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析ステップと、前記第 1の解析ステップで出力された各解析結果中の前記多義語の意味および他の語に関する情報との組合せごとに、該組合せが該第 2の解析ステップで採用されたカゝ否カゝを表す採否情報を、該第 1の解析ステップで出力された複数の解析結果と前記第 2の解析ステップの採用結果とに基づいて生成する採否情報生成ステップと、前記採否情報で不採用とされた前記組合せが、前記記憶部で採用を表す判断情報と対応している場合、該採否情報を採用に変更し、その後、前記複数の解析結果力不要な解析結果を削除するための削除規則を、変更された該採否情報と変更されな力つた該採否情報とに基づいて生成する規則生成ステップと、を含む。

[0034] 上記発明によれば、第 2の解析部にて採用されな力つた解析結果内の組合せが、記憶部で採用を表す判断情報と対応していると、その組合せの採否情報が採用に変更され、その後、第 1の解析部の複数の解析結果から不要な解析結果を削除するための削除規則が、変更された採否情報と変更されなカゝつた採否情報とに基づいて生成される。

[0035] このため、第 2の解析部にて採用されなかった第 1の解析部の解析結果から、第 2 の解析部が正確な解析結果を採用するために必要な解析結果が削除されることを防止できる。よって、最終的な解析結果を変化させない不要な候補 (解析結果)のみを除去することが可能になる。

[0036] なお、前記多義語の意味と前記他の語に関する情報との組合せは、該多義語とその周辺の単語との表層、原型、品詞、活用形の 1つないしその組み合わせであることが望ましい。

[0037] また、前記第 1の解析部は、予め定められた所定の規則に基づいて解析を行うルールベース方式により、前記自然言語文を解析することが望まし、。

[0038] 上記発明によれば、第 1の解析部での解析方式がルールベース方式となり、削除規則の作成に用いられる統計モデルに基づいた統計ベース解析と、解析方式が異なる。よって、削除規則に基づく削除処理が有効に機能する可能性が高くなる。

[0039] また、本発明の言語処理装置は、上記言語処理装置にて生成された削除規則を記憶する知識ベース記憶部と、多義語と他の語とを含む自然言語文に対して所定の解析を行い、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析部と、前記知識ベース記憶部に記憶されている削除規則に基づいて、前記第 1の解析部が出力した複数の解析結果力も不要な解析結果を削除する曖昧性削減部と、前記曖昧性削減部にて前記不要な解析結果が削除された複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析部と、を含む。

[0040] また、本発明の言語処理方法は、言語処理装置にて生成された削除規則を記憶する知識ベース記憶部を含む言語処理装置が行う言語処理方法であって、多義語と他の語とを含む自然言語文に対して所定の解析を行ヽ、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析ステツプと、前記知識ベース記憶部に記憶されている削除規則に基づいて、前記複数の解析結果力不要な解析結果を削除する曖昧性削減ステップと、前記不要な解析結果が削除された複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析ステップと、を含む。

[0041] 上記発明によれば、第 2の解析部にて採用されな力つた第 1の解析部の解析結果から、第 2の解析部が正確な解析結果を採用するために必要な解析結果が削除されなくなり、不要な解析結果のみを削除可能となる。このため、第 2の解析部の解析結果の精度を保ちながら、第 2の解析部の処理を少なくすることが可能となる。

[0042] また、本発明の言語処理用プログラムは、コンピュータに言語処理を実行させる言語処理用プログラムであって、多義語と他の語とを含む自然言語文に対して所定の解析を行い、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析処理と、前記複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析処理と、前記複数の解析結果から削除されても、前記第 2の解析処理で採用される解析結果が維持される、該第 1の解析処理での不要な解析結果を削除するための削除規則を、該第 1の解析処理にて出力された複数の解析結果と該第 2の解析処理での採用結果とに基づいて生成する生成処理と、を含む言語処理をコンピュータに実行させる。

[0043] また、本発明の言語処理用プログラムは、多義語の 1つの意味と他の語に関する情報との組合せごとに、該組合せを採用するカゝ否カゝを表す判断情報が記憶されている記憶部と接続されたコンピュータに、言語処理を実行させる言語処理用プログラムであって、多義語と他の語とを含む自然言語文に対して所定の解析を行い、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析処理と、前記複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析処理と、前記第 1の解析処理で出力された各解析結果中の前記多義語の意味および他の語に関する情報との組合せごとに、該組合せが該第 2の解析処理で採用されたか否かを表す採否情報を、該第 1の解析処理で出力された複数の解析結果と前記第 2の解析処理の採用結果と〖こ基づ、て生成する採否情報生成処理と、前記採否情報で不採用とされた前記組合せが、前記記憶部で採用を表す判断情報と対応している場合、該採否情報を採用に変更し、その後、前記複数の解析結果から不要な解析結果を削除するための削除規則を、変更された該採否情報と変更されなカゝつた該採否情報とに基づヽて生成する規則生成処理と、を含む言語処理を、前記コンピュータに実行させる。

[0044] また、本発明の言語処理用プログラムは、言語処理装置にて生成された削除規則を記憶する知識ベース記憶部と接続されたコンピュータに、言語処理を実行させる言語処理用プログラムであって、多義語と他の語とを含む自然言語文に対して所定の解析を行い、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析処理と、前記知識ベース記憶部に記憶されている削除規則に基づいて、前記複数の解析結果から不要な解析結果を削除する曖昧性削減処理と、前記不要な解析結果が削除された複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析処理と、を含む言語処理を、前記コンピュータに実行させる。

[0045] 上記発明によれば、上記言語処理方法をコンピュータに実行させることが可能となる。

発明の効果

[0046] 本発明によれば、最終的な解析結果を変化させな!/、不要な候補のみを除去することが可能になり、また、その不要な候補のみを除去することで、解析結果を変えることなぐより高速に解析処理を行うことが可能になる。

図面の簡単な説明

[0047] [図 1]図 1は、本発明の第 1の実施の形態の構成を示すブロック図である。 [図 2]図 2は、図 1に示した言語処理装置の動作を示す流れ図である。

[図 3A]図 3Aは、出現事例記憶部 31に記憶されている矛盾検出用事例の具体例を示した説明図である。

圆 3B]図 3Bは、曖昧性を持つ形態素解析結果の具体例を示した説明図である。

[図 3C]図 3Cは、図 3Bの解析結果力得られる事例の具体例を示した説明図である符号の説明

1 入力装置

2 データ処理装置

21 第 1の解析部

22 曖昧性削減部

23 第 2の解析部

24 不要曖昧性学習部

241 事例抽出部

242 矛盾調整部

243 知識ベース構築部

244 規則生成部

3 記憶装置

31 出現事例記憶部

32 知識ベース記憶部

4 出力装置

5 プログラム記憶部

発明を実施するための最良の形態

[0049] 次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。

[0050] 図 1は、本発明を実施するための第 1の実施の形態の構成を示すブロック図である [0051] 図 1において、第 1の実施の形態の言語処理装置は、キーボード等の入力装置 1と、プログラム制御により動作するデータ処理装置 (コンピュータ） 2と、情報を記憶する記憶装置 3と、ディスプレイ装置または印刷装置等の出力装置 4と、データ処理装置 2の動作を規定するプログラムを記憶するプログラム記憶部（コンピュータにて読み取り可能な記録媒体) 5とを含む。

[0052] 記憶装置 3は、出現事例記憶部 31と知識ベース記憶部 32を備えている。

[0053] 出現事例記憶部 31には、予め、矛盾検出用の事例が記憶されている。

[0054] 矛盾検出用の事例は、好適には第 1の解析部 21と第 2の解析部 23によって大量の文が構文解析され、その各々の結果力知識ベース構築部 243に与える事例と同形式のデータを抽出することで作成される。矛盾検出の性能は、ここで作成される事例の数が多いほど高くなる。

[0055] 各事例では、多義語の 1つの意味と他の語に関する情報との組合せが、その組合せを採用する力否力を表す判断情報と関連づけられている。

[0056] なお、多義語は、複数の意味または複数の品詞などの文法上の働きを持つ単語または句などの文法要素として、定義される。また、他の語に関する情報は、多義語と異なる語に関する情報 (例えば、多義語の直前の語の品詞)である。

[0057] 知識ベース記憶部 32には、知識ベース構築部 243で作成された知識ベース (例えば、削除規則）が記憶される。

[0058] データ処理装置 2は、第 1の解析部 21と、曖昧性削減部 22と、第 2の解析部 23と、事例抽出部 241と、矛盾調整部 242と、知識ベース構築部 243とを備えている。なお、矛盾調整部 242と、知識ベース構築部 243とで、規則生成部 244を構成する。また、事例抽出部 241と、矛盾調整部 242と、知識ベース構築部 243と、出現事例記憶部 31とで、生成部を構成する。

[0059] データ処理装置 2は、例えば、プログラム記憶部 5に記録されているプログラムを読み取り、そのプログラムを実行することによって、第 1の解析部 21と、曖昧性削減部 2 2と、第 2の解析部 23と、事例抽出部 241と、矛盾調整部 242と、知識ベース構築部 243とを実現する。

[0060] なお、第 1の解析部 21と、曖昧性削減部 22と、第 2の解析部 23と、事例抽出部 24 1と、矛盾調整部 242と、知識ベース構築部 243とは、ハードウェアにて構成されてもよい。

[0061] これらの構成部は、概略次のように動作する。

[0062] 第 1の解析部 21は、構文解析処理を途中のフェーズまで行う。構文解析処理が XI 〜Xnの nフェーズからなる場合、第 1の解析部 21は、 Xl〜Xm (m≠n)までの解析を行う。

[0063] また、第 1の解析部 21は、多義語と他の語とを含む自然言語文に対して所定の解析 (Xl〜Xm (m≠n)までの解析)を行、、その多義語の有する複数の意味に応じて

、その自然言語文に対する複数の解析結果を出力する。

[0064] 曖昧性削減部 22は、第 1の解析部 21が出力した複数の解析結果から、知識べ一ス記憶部 32に記憶されて、る知識ベースに基づ、て「不採用」と判定される解釈結果を除去する。なお、曖昧性削減部 22は、動作が禁止されると、第 1の解析部 21が出力した複数の解析結果を、第 2の解析部 23に提供する。

[0065] 第 2の解析部 23は、曖昧性削減部 22の出力を元に、第 1の解析部 21が行った解析処理以降のフェーズの解析処理を行う。

[0066] 具体的には、第 2の解析部 23は、曖昧性削減部 22の出力（例えば、第 1の解析部

21が出力した複数の解析結果）に対して特定の解析 (Xm+ l〜Xnまでの解析)を行って複数の解析結果から 1つの解析結果を採用する。

[0067] 事例抽出部 241は、第 1の解析部 21の解析結果ごとに、第 2の解析部 23の出力における採否を表す採否情報と、知識ベース構築部 243で知識ベースを構築するのに用いる各解析結果での曖昧性に関する情報、すなわち、素性集合と、に基づいて、事例を作成する。

[0068] 具体的には、事例抽出部 241は、採用情報生成部の一例であり、第 1の解析部 21 が出力した複数の解析結果と第 2の解析部 23の採用結果とに基づいて、各解析結果中から、多義語の意味と他の語に関する情報との組合せ (素性集合を含む)すなわち事例を抽出する。

[0069] さらに、事例抽出部 241は、第 1の解析部 21が出力した複数の解析結果と第 2の解析部 23の採用結果とに基づいて、事例ごとに、その事例が第 2の解析部 23で採用されたか否かを表す採否情報を生成し、その採否情報を、その事例に付与する。 [0070] 矛盾調整部 242は、出現事例記憶部 31に記憶された大量の事例と、事例抽出部 2 41で得られた事例をつきあわせ、矛盾した事例が存在しないか確認する。矛盾調整部 242は、矛盾した事例が存在する場合は、事例抽出部 241で得られた事例の採否情報を「不採用」から「採用」の方向にのみ修正する。

[0071] 知識ベース構築部 243は、矛盾調整部 242が出力する事例に基づいて、曖昧性削減のための知識ベース (例えば、第 1の解析部 21の複数の解析結果から不要な解析結果を削除するための削除規則)を作成し、その知識ベースを知識ベース記憶部 32に格納する。

図 2は、図 1に示した言語処理装置の動作を説明するためのフローチャートである。以下、図 1および図 2を参照して、図 1に示した言語処理装置の全体の動作について詳細に説明する。

[0072] まず、知識ベースを学習する際の動作 (例えば、第 1の解析部 21の複数の解析結果カも不要な解析結果を削除するための削除規則を作成する際の動作)について説明する。

[0073] 入力装置 1から与えられた入力文字列は、第 1の解析部 21と第 2の解析部 23により構文解析される (ステップ Al)。なお、入力文字列は、多義語と他の語とを含む。

[0074] 本実施形態では、第 1の解析部 21は、入力文を単語に区切って品詞を付与する形態素解析処理を行い、第 2の解析部 23は、単語間の係り受けを決定する係り受け決定処理を行う。この際、曖昧性削減部 22は、曖昧性削減を行わなくてもよい。

[0075] 次に、事例抽出部 241は、第 1の解析部 21が出力した複数の解析結果と、第 2の解析部 23の採用結果と、を受け付け、それらをまとめた情報力事例を抽出する。なお、事例は、各解析結果内の多義語の意味および他の語に関する情報との組合せ（素性集合を含む）と、その組合せが第 2の解析部 23で採用された力否力を表す採否情報とを含む (ステップ A2)。

[0076] 本実施形態では、第 1の解析部 21が出力する解析結果は、単語区切りおよび品詞の曖昧性を有する。また、本実施形態では、素性集合は、曖昧性を有する多義語（単語)とその直前と直後の単語と、の表層、品詞および活用形とを含む。

[0077] 次に、矛盾調整部 242は、出現事例記憶部 31に記憶された事例と、事例抽出部 2 41で得られた事例をつきあわせ、矛盾した事例が存在しないか確認する (ステップ A 3)。

[0078] 矛盾は、事例抽出部 241で得られた事例と素性集合が同一で採否情報が異なる事例が、出現事例記憶部 31に存在することを表す。

[0079] 矛盾調整部 242は、矛盾した事例が存在する場合は、事例抽出部 241で得られた事例の採否情報を「不採用」から「採用」の方向にのみ修正する (ステップ A4)。

[0080] 矛盾調整部 242が、この修正を行うことで、削除された場合に学習データに矛盾した事例が存在してしまうという、本質的に曖昧性削減が不可能な解析結果を、誤って削減するモデル力作成されにくくなる。

[0081] 矛盾調整部 242の出力である事例は、一時的に知識ベース構築部 243内のメモリに格納される (ステップ A5)。

[0082] ここで、第 1の解析部 21は、入力可能な文字列が残っているか確認する (ステップ

A6)。

[0083] 入力可能な文字列が残っている場合は、残りの入力について、ステップ A1からステツプ A5の処理が繰り返えされる。

[0084] 入力可能な文字列が残って!/、な、場合は、知識ベース構築部 243は、矛盾調整部 242の出力として得られた事例を元に、曖昧性削減のための知識ベースを作成し

、その知識ベースを知識ベース記憶部 32に格納する。

[0085] 本実施形態では、知識ベースの作成方法として、決定木、最大エントロピ一法、サポートベクターマシン法などの学習器を用いた統計モデル作成方法が用いられる。

[0086] 以下では、本実施形態の他のバリエーションについて述べる。

[0087] 第 1の解析部 21と第 2の解析部 23は、第 1の解析部 21の解析結果の曖昧性が第 2 の解析部 23により削減されるという組み合わせであれば、適宜変更可能である。

[0088] 例えば、第 1の解析部 21が、形態素解析と文節纏め上げ処理を行い、第 2の解析部 23が、文節間の係り受け解析を行ってもよい。

[0089] また、本実施形態では、第 1の解析部 21と第 2の解析部 23を合わせた全体の言語解析処理として、構文解析処理が用いられた。しカゝしながら、第 1の解析部 21と第 2 の解析部 23を合わせた全体の言語解析処理は、それ以外にも、形態素解析処理、意味解析処理、機械翻訳処理、音声合成処理および音声認識処理などの、複数フエーズからなり、かつ、途中のフェーズでの曖昧性が後段のフェーズによって解消される言語解析処理であれば、適宜変更可能である。

[0090] 出現事例記憶部 31に格納される矛盾検出用の事例は、人手で作成されてもよい。

また、この事例が予め作成されず、言語処理の過程での矛盾調整部 242の出力力事例として、出現事例記憶部 31に格納されていってもよい。更には、予め矛盾検出用の事例が蓄えられた上で、矛盾調整部 242の出力力その事例に追加されていつてもよい。

[0091] 知識ベースを構築するのに用いる素性集合として参照される単語や文節と!/、つた文法要素 (他の語)の数と方向は、適宜変更可能である。例えば、多義語の直前の 1 要素のみが参照されたり、直前の 2要素と直後の 1要素が参照されたりしてもよい。

[0092] また、文法要素中の参照される情報 (他の語に関する情報)は、文法要素に関係のある情報であれば、表層、品詞、活用形のいずれ力 1つないしその組合せ、または、それら以外でもよい。

[0093] また、各文法要素で参照される情報は、全て統一されなくてもよい。例えば、機能語は表層を参照し、自立語では表層を参照しないといった変化を付けてもよい。

[0094] また、ステップ A6が行われずに、 1入力ごとに、ステップ A7において、知識ベースの更新が行われてもよい。

[0095] 知識ベースの作成方法としては、矛盾調整部 242の出力力そのまま知識ベースに格納されてもよい。

[0096] 続いて、知識ベース記憶部 32内の知識ベースを用いて構文解析を行う場合の動作について説明する。

[0097] 第 1の解析部 21は、入力装置 1から入力された文字列を、構文解析処理の途中のフェーズまで解析する (ステップ Bl)。なお、その文字列に多義語が含まれていると、第 1の解析部 21は、その多義語の有する複数の意味に応じて、文字列に対する複数の解析結果を出力する。

[0098] 次に、曖昧性削減部 22は、第 1の解析部 21の各解析結果中の多義語の意味と他の語に関する情報と、知識ベース記憶部 32内の知識ベースと、を参照して、各解析結果の採否を判定し、「不採用」と判定された解析結果を、それらの解析結果力ゝら削除する (ステップ B2)。

[0099] 第 2の解析部 23は、曖昧性削減部 22で残された解析結果を用いて、残りのフエ一ズの解析を行う（ステップ B3)。

[0100] 第 2の解析部 23は、解析の結果、最後に得られた解析結果を出力装置 4に出力する（ステップ B4)。

[0101] 次に、本実施形態の効果について説明する。

[0102] 本実施形態では、事例抽出部 241と、矛盾調整部 242と、知識ベース構築部 243 と、出現事例記憶部 31とで構成される生成部は、第 1の解析部 21が出力した複数の解析結果カゝら削除されても、第 2の解析部 23が採用する解析結果が維持される、第 1の解析部 21の不要な解析結果を削除するための削除規則を、第 1の解析部 21が出力した複数の解析結果と第 2の解析部 24の採用結果とに基づいて生成する。

[0103] このため、第 2の解析部 24にて採用されなかった第 1の解析部 21の解析結果から、第 2の解析部 24が正確な解析結果を採用するために必要な解析結果が削除されることを防止できる。よって、最終的な解析結果を変化させない不要な候補 (解析結果)のみを除去することが可能になる。

[0104] また、本実施形態では、矛盾調整部 242は、事例抽出部 241が抽出した事例に反する事例 (矛盾事例）が、出現事例記憶部 21に記憶されていると、事例抽出部 241 が抽出した事例の採否情報を「不採用」から「採用」に修正する。このため、矛盾調整部 242の出力を元に作成される知識ベースを用いた曖昧性削減部 22が、誤った検索結果削減を行ってしまう可能性が減る。

[0105] よって、曖昧性を削減して解析処理を高速ィ匕して、るにもかかわらず、解析結果は、曖昧性を削減しな、場合と変化しな、と、う効果を奏する。

[0106] また、第 1の解析部 21の実現方法としては、大きく分けて、統計モデルに基づいた統計ベース解析と、人手で作成した規則に基づ!/、て解析を行うルールベース解析 ( ルールベース方式)の 2種類が考えられる力本実施形態は、ルールベース解析に基づいた解析部に対して、より大きな効果が得られる。

[0107] その理由は、以下の通りである。 [0108] 第 1の解析部 21は、多くの場合、独自に曖昧性削減を行っており、曖昧性削減部 2 2では、第 1の解析部 21で削減できなかった曖昧性 (解析結果)を削減する。

[0109] 同様の情報力は同様の曖昧性 (解析結果)しか削減できないと考えると、第 1の解析部 21と曖昧性削減部 22が参照する情報の重なりが少ないほど、削減効果が大きくなると言える。

[0110] 第 1の解析部 21が統計ベースの解析を行っている場合、この解析のベースとなつている統計モデルと曖昧性削減部 22が参照する統計モデルが類似したモデルであると、参照情報の重なりが大きくなるので、曖昧性削減効果は小さくなる。逆に、ルールベースの解析での解析規則は、統計モデルとは異なる性質を持つことが多ぐ参照情報の重なりが小さくなるため、曖昧性削減効果は大きくなる。

[0111] (実施例）

次に、具体的な実施例を用いて、本実施形態の動作を説明する。

[0112] 第 1の実施例では、第 1の解析部 21は、入力文を単語に区切って品詞を付与する形態素解析処理を行い、第 2の解析部 23は、単語間の係り受けを決定する係り受け決定処理を行う。

[0113] また、事例抽出部 241で参照される情報は、曖昧性を持つ語 (多義語)とその直前と直後の単語との、表層 (但し、曖昧性を持つ語 (多義語)と機能語のみ)と、品詞である。

[0114] また、知識ベース構築部 243における知識ベースの作成方法は、サポートベクターマシン法（以下、 SVM法と呼ぶ）である。

[0115] また、出現事例記憶部 31には、大量の文を第 1の解析部 21および第 2の解析部 2

3で解析した結果を、事例抽出部 241に供給することにより得られる事例が、格納されている。

[0116] 図 3Aは、出現事例記憶部 31に格納されている事例の具体例を示した説明図である。例えば、図 3Aの上力も 4番目の事例は、「問題がとけると幸せになれる」という入力文から得ることができる。

[0117] まず、知識ベース学習時の動作を説明する。

[0118] 入力文中に、「問題をとけると娘が言う」（表現 1)、「雪がとけると春が来る」（表現 2) 、および、「この難問がとけると話が進む」（表現 3)、という 3つの表現が存在していたとする。

[0119] 単語「とける」には、「(ものが)溶ける」の意味を持つ動詞と、「（問題を)解く」の可能形である可能動詞という 2つの意味があり、単語「とける」は、曖昧性を有する。

[0120] また、単語「と」には、「引用助詞」と「接続助詞」の 2つの意味があり、単語「と」は、曖昧性を有する。

[0121] このため、第 1の解析部 21による表現 1〜3の形態素解析結果は、図 3Bに示すような、複数の形態素解析結果を有する曖昧性を持った構造となる。

[0122] この曖昧性を持った構造が、第 2の解析部 23に供給されると、第 2の解析部 23の解析の過程で、第 1の解析部 21の形態素解析結果の曖昧性は解消される。図 3B中の※印は、解析の結果、第 2の解析部 23にて採用された形態素解析結果を示す。

[0123] 次に、不要曖昧性学習部 24は、第 1の解析部 21の出力と、第 2の解析部 23の採用結果から、知識ベースを学習するための事例を作成する。

[0124] 本実施例における事例の作成とは、第 1の解析部の各形態素解析結果について、曖昧性を持つ語 (多義語)とその直前と直後の単語との、表層（但し、曖昧性を持つ語と機能語のみ)、品詞の情報と、各解析結果の第 2の解析部 23での採否情報と、をペアにすることを指す。

[0125] 採否情報は、「採用」と「不採用」のいずれかとなり、 2値を取る。

[0126] 以下に、不要曖昧性学習部 24が表現 1の「とける（溶ける）」の曖昧性力事例を作成する例を示す。

[0127] 図 3Bの（表現 1)参照すると、曖昧性を持つ語 (多義語)の表層は「とける」で、その品詞は「動詞」であり、直前の単語の表層は「を」で、その品詞は「助詞」であり、直後の単語の表層は「と」で、その品詞は「引用助詞」または「接続助詞」であり、それらの採否情報は「不採用」であるため、以下の 2つの事例が得られる。

[0128] 事例 1 : [直前の単語 (表層：を/品詞:助詞)、曖昧性を持つ語 (表層：とける/品詞：動詞)、直後の単語 (表層：と/品詞:引用助詞） ]→不採用

事例 2： [直前の単語 (表層：を/品詞:助詞)、曖昧性を持つ語 (表層：とける/品詞：動詞)、直後の単語 (表層：と/品詞：接続助詞） ]→不採用学習時の計算量を削減するには、事例数をできるだけ減らす方が望ましい。

[0129] そこで、曖昧性を持つ語とは異なる語 (他の語）については、できるだけ第 2の解析部 23で採用された単語を用いるようにしてもよ!、。

[0130] すなわち、表現 1において採用された「と」の候補 (解釈事例）は、「引用助詞」であるため、採用されなかった候補 (解釈事例）の「接続助詞」の事例 2は、学習に用いられなくてもよい。

[0131] 図 3Cは、このようにして表現 1〜3の全ての形態素解析結果について事例を作成した結果を示す説明図である。

[0132] 続、て、不要曖昧性学習部 24 (矛盾調整部 242)は、得られた事例を出現事例記憶部 31に記憶された矛盾検証用事例と比較し、矛盾がな、か確認する。

[0133] 例えば、図 3Cの上力 4番目の事例は、図 3Aの上力 4番目の矛盾検証用事例と比較すると、素性集合が同一で、採否情報が異なるため、矛盾がある事例だといえる

[0134] この場合、矛盾調整部 242は、得られた事例の採否情報を「不採用」から「採用」に修正する。

[0135] なお、「採用」から「不採用」への修正が行われると、後の知識ベース構築において

、本質的に曖昧性削減が不可能な曖昧性を一律削除するモデルが作成されてしまうため、本実施例では、その修正は行われない。

[0136] なお、「不採用」から「採用」への修正が必要な表現 1の他の事例については、図 3

Cの採用情報の項目に「 (矛盾）」と、うマークが付与されて、る。

[0137] 矛盾調整部 242は、その修正を終了すると、修正された事例および修正されなかつた事例を、知識ベース構築部 243に提供する。

[0138] 最後に、知識ベース構築部 243は、矛盾調整部 242から受け付けた事例から、 SV

Mを用いて曖昧性解消モデルを学習する。

[0139] この際、知識ベース構築部 243は、各事例の素性集合を入力とし、採否情報を分類先のクラスとする 2値分類学習を行う。

[0140] SVMのカーネル関数に 3次の多項式関数が用いられると、高い精度が得られる。

[0141] SVMや最大エントロピ一法、決定木といった分類器は、入力された事例が事例中で示されたクラス通りに分類されるような境界線を学習しょうとする。

[0142] 知識ベース構築部 243は、本実施例の事例からは、おおまかには、直前に助詞「を」がある動詞「とける (溶ける)」という形態素解析結果を「不採用」と判定し、単語「と」に関する複数の形態素解析結果 (曖昧性)は、 V、かなる文脈でも「採用」と判定するモデル (知識ベース）を得て、これを知識ベース記憶部 32に格納する。

[0143] 次に、得られた知識ベースを用いて構文解析を行う場合の動作を説明する。

[0144] 表現 1〜3が入力されたとすると、第 1の解析部 21は、学習時と同様に、図 3Bに示される曖昧性を持った形態素解析結果、すなわち、複数の形態素解析結果を出力する。

[0145] 続、て、曖昧性削減部 22は、各形態素解析結果につ!、て素性集合を作成し、素性集合が知識ベースに格納された分類器によって「不採用」と判定された場合には、その組成集合に対応する形態素解析結果を除去する。

[0146] 例えば、表現 1の動詞「とける（溶ける）」の解析結果からは、学習時の実施例と同様の手順で、以下の素性集合が得られる。ただし、第 1の解析部 21の解析時には、単語「と」の曖昧性が決定されていないため、数は 2つとなる。

[0147] 素性集合 1： [直前の単語 (表層：を/品詞:助詞)、曖昧性を持つ語 (表層：とける/品詞:動詞)、直後の単語 (表層：と/品詞:引用助詞)]

素性集合 2： [直前の単語 (表層：を/品詞：助詞)、曖昧性を持つ語 (表層：とける/品詞：動詞)、直後の単語 (表層：と/品詞：接続助詞) ]

曖昧性削除部 22は、各素性集合について、知識ベース記憶部 32内のモデルにより採否を判定する。この場合、曖昧性削除部 22は、素性集合 1、 2共に曖昧性を持つ語が動詞「とける (溶ける）」であり、その直前に助詞「を」が存在するため、「不採用」と判定する。

[0148] 結果として、動詞「とける (溶ける）」の候補は、不必要と判定され、除去される。

[0149] 一方で、今回学習されたモデルは、直前に助詞「を」がない場合には可能動詞「とける (解ける）」の候補を「不採用」と判定せず、また単語「と」の複数の解析結果 (曖昧性）についても「不採用」と判定しないため、表現 1〜3のその他の形態素解析結果については除去されない。 [0150] 最後に、第 2の解析部 23は、残された形態素解析結果を用いて解析処理を行う。

[0151] 曖昧性削減部 22で削除された形態素解析結果は、曖昧性削減部 22が除去しない場合でも、第 2の解析部 23で採用されなカゝつた形態素解析結果であるため、今回の曖昧性削減によって、第 2の解析部 23の解析結果は変化しな、。

[0152] 以下、第 1の実施例の効果について説明する。

[0153] 本実施例においては、第 2の解析部 23の解析結果を変化させない形態素解析結果のみが除去されるため、曖昧性削減を行わない場合の第 2の解析部 23の解析結果と比較して、第 2の解析部 23の解析結果が変化することがなヽ。

[0154] 一方で「とける」に対する第 1の解析部 21の不必要な形態素解析結果を削除できているため、第 2の解析部 23の解析速度が向上し、その結果、全体の解析速度も向上する。

[0155] また、実施例においては、日本語を例に説明しているが、解析対象の言語は日本語に限定されない。

[0156] 次に、第 2の実施例を説明する。

[0157] 第 2の実施例は、知識ベース構築部 243が、矛盾調整部 242から受け付けた事例を、直接、知識ベース記憶部 32に格納する点を除けば、第 1の実施例とほぼ同じ構成である。

[0158] まず、学習時の動作を説明する。

[0159] 上述した表現 1〜3が入力されると、第 1の実施例と同様に、矛盾調整部 242は、図 3Cに示される事例を得る（なお、矛盾マークが付与された事例は、採否情報が「採用」に修正されている）。

[0160] 本実施例では、知識ベース構築部 243は、矛盾調整部 242から得られた事例を、そのまま知識ベース記憶部 32に格納する。

[0161] 次に、得られた知識ベースを用いて構文解析を行う場合の動作を説明する。

[0162] 第 1の実施例と同様に、表現 1〜3が入力されると、第 1の解析部 21は、図 3Bに示される曖昧性を持った複数の形態素解析結果を出力し、曖昧性削除部 22は、各形態素解析結果力第 1の実施例と同様の素性集合を得られる。表現 1の動詞「とける

(溶ける）」の曖昧性についても第 1の実施例と同様である。 [0163] 続いて、曖昧性削除部 22は、各素性集合に対して以下のように採否判定を行う。

[0164] 曖昧性削除部 22は、得られた各素性集合について、素性集合が一致する事例が知識ベース記憶部 32に存在すれば、知識ベース記憶部 32に存在する事例の採否情報を、判定結果とする。

[0165] 具体的には、曖昧性削除部 22は、該当する事例が知識ベース記憶部 32に存在し

、その採否情報が「採用」の場合は、判定結果も「採用」とし、該当事例の採否情報が

「不採用」の場合は、判定結果も「不採用」とし、該当事例が存在しない場合は、判定結果を「保留」とする。

[0166] そして、曖昧性削除部 22は、各形態素解析結果について以下のように判定を行う

[0167] 曖昧性削除部 22は、判定結果が「採用」となる素性集合が 1つでも存在すれば、その形態素解析結果を「採用」と判定し、「採用」となる素性集合が一つも存在しない場合に「不採用」となる素性集合が 1つでも存在すれば、その形態素解析結果を「不採用」と判定し、それ以外の場合は「採用」とする。

[0168] 例えば、動詞「とける (溶ける）」の各形態素解析結果の素性集合 (素性集合 1、 2) を例に説明すると、素性集合 1は、図 3Cの上から 1番目の事例の素性集合と同一であり、その採否情報は「不採用」であるため、素性集合 1は「不採用」と判定され、一方、素性集合 2は同一の素性集合を持つ事例が知識ベースに存在しないため「保留」となる。

[0169] よって、動詞「とける (溶ける）」を表す形態素解析結果は、「不採用」と判定される。

表現 1〜3の他の形態素解析結果について同様の方法により判定が行われると、全て「採用」と判定される。

[0170] 以下、第 2の実施例の効果について説明する。

[0171] 第 2の実施例では、各形態素解析結果力 ^不採用」と判定されるためには、形態素解析結果力得られた素性集合と知識ベース内の素性集合が完全一致しなければならないため、第 1の実施例よりも曖昧性削減性能が劣るが、第 1の実施例と同様、不必要な曖昧性のみ除去することで解析結果を変えずに高速ィヒを行うことが可能である。 [0172] なお、本発明は、第 1の自然言語から第 2の自然言語に翻訳する機械翻訳プロダラムゃ、文章力も特徴的な単語の連なりを抽出するテキストマイニングプログラムといつた構文解析処理を必要とする自然言語処理用途に適用できる。

[0173] 以上説明した実施形態および各実施例において、図示した構成は単なる一例であつて、本発明はその構成に限定されるものではない。

Claims

請求の範囲

[1] 多義語と他の語とを含む自然言語文に対して所定の解析を行い、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析部と、

前記第 1の解析部が出力した複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析部と、

前記第 1の解析部が出力した複数の解析結果力削除されても、前記第 2の解析部が採用する解析結果が維持される、該第 1の解析部の不要な解析結果を削除するための削除規則を、該第 1の解析部が出力した複数の解析結果と該第 2の解析部の採用結果とに基づいて生成する生成部と、を含む言語処理装置。

[2] 多義語と他の語とを含む自然言語文に対して所定の解析を行、、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析部と、

前記多義語の 1つの意味と他の語に関する情報との組合せごとに、該組合せを採用するか否かを表す判断情報が記憶されている記憶部と、

前記第 1の解析部が出力した各解析結果中の前記多義語の意味および他の語に関する情報との組合せごとに、該組合せが該第 2の解析部で採用されたカゝ否かを表す採否情報を、該第 1の解析部が出力した複数の解析結果と前記第 2の解析部の採用結果とに基づいて生成する採否情報生成部と、

前記採否情報生成部が生成した採否情報で不採用とされた前記組合せが、前記記憶部で採用を表す判断情報と対応している場合、該採否情報を採用に変更し、その後、前記複数の解析結果力も不要な解析結果を削除するための削除規則を、変更された該採否情報と変更されなカゝつた該採否情報とに基づいて生成する規則生成部と、を含む言語処理装置。

[3] 前記多義語の意味と前記他の語に関する情報との組合せは、該多義語とその周辺の単語との表層、品詞、活用形の 1つないしその組み合わせである、請求の範囲 2に記載の言語処理装置。

[4] 前記第 1の解析部は、予め定められた所定の規則に基づいて解析を行うルールべース方式により、前記自然言語文を解析する、請求の範囲 1ないし 3のいずれ力 1項に記載の言語処理装置。

[5] 請求の範囲 1ないし 4のいずれか 1項に記載の言語処理装置にて生成された削除規則を記憶する知識ベース記憶部と、

多義語と他の語とを含む自然言語文に対して所定の解析を行! \該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析部と、

前記知識ベース記憶部に記憶されて！ヽる削除規則に基づ!/、て、前記第 1の解析部が出力した複数の解析結果力不要な解析結果を削除する曖昧性削減部と、前記曖昧性削減部にて前記不要な解析結果が削除された複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析部と、を含む言語処理装置。

[6] 多義語と他の語とを含む自然言語文に対して所定の解析を行、、該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析ステップと、

前記複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析ステップと、

前記複数の解析結果カゝら削除されても、前記第 2の解析ステップで採用される解析結果が維持される、該第 1の解析ステップでの不要な解析結果を削除するための削除規則を、該第 1の解析ステップにて出力された複数の解析結果と該第 2の解析ステップでの採用結果とに基づ、て生成する生成ステップと、を含む言語処理方法。

[7] 多義語の 1つの意味と他の語に関する情報との組合せごとに、該組合せを採用するカゝ否かを表す判断情報が記憶されている記憶部を含む言語処理装置が行う言語処理方法であって、

多義語と他の語とを含む自然言語文に対して所定の解析を行! \該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析ステップと、

前記第 1の解析ステップで出力された各解析結果中の前記多義語の意味および他の語に関する情報との組合せごとに、該組合せが該第 2の解析ステップで採用されたか否かを表す採否情報を、該第 1の解析ステップで出力された複数の解析結果と前記第 2の解析ステップの採用結果とに基づいて生成する採否情報生成ステップと前記採否情報で不採用とされた前記組合せが、前記記憶部で採用を表す判断情報と対応している場合、該採否情報を採用に変更し、その後、前記複数の解析結果力も不要な解析結果を削除するための削除規則を、変更された該採否情報と変更されなカゝつた該採否情報とに基づヽて生成する規則生成ステップと、を含む言語処理方法。

[8] 請求の範囲 1ないし 4のいずれか 1項に記載の言語処理装置にて生成された削除規則を記憶する知識ベース記憶部を含む言語処理装置が行う言語処理方法であつて、

前記知識ベース記憶部に記憶されて、る削除規則に基づ、て、前記複数の解析結果力不要な解析結果を削除する曖昧性削減ステップと、

前記不要な解析結果が削除された複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析ステップと、を含む言語処理方法。

[9] コンピュータに言語処理を実行させる言語処理用プログラムであって、

多義語と他の語とを含む自然言語文に対して所定の解析を行! \該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析処理と、前記複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析処理と、

前記複数の解析結果から削除されても、前記第 2の解析処理で採用される解析結果が維持される、該第 1の解析処理での不要な解析結果を削除するための削除規則を、該第 1の解析処理にて出力された複数の解析結果と該第 2の解析処理での採用結果とに基づいて生成する生成処理と、を含む言語処理をコンピュータに実行させる言語処理用プログラム。

[10] 多義語の 1つの意味と他の語に関する情報との組合せごとに、該組合せを採用する力否かを表す判断情報が記憶されている記憶部と接続されたコンピュータに、言語処理を実行させる言語処理用プログラムであって、

多義語と他の語とを含む自然言語文に対して所定の解析を行! \該多義語の有する複数の意味に応じて、該自然言語文に対する複数の解析結果を出力する第 1の解析処理と、

前記複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析処理と、

前記第 1の解析処理で出力された各解析結果中の前記多義語の意味および他の語に関する情報との組合せごとに、該組合せが該第 2の解析処理で採用されたカゝ否かを表す採否情報を、該第 1の解析処理で出力された複数の解析結果と前記第 2の解析処理の採用結果とに基づいて生成する採否情報生成処理と、

前記採否情報で不採用とされた前記組合せが、前記記憶部で採用を表す判断情報と対応している場合、該採否情報を採用に変更し、その後、前記複数の解析結果力も不要な解析結果を削除するための削除規則を、変更された該採否情報と変更されなカゝつた該採否情報とに基づヽて生成する規則生成処理と、を含む言語処理を、前記コンピュータに実行させる言語処理用プログラム。

[11] 請求の範囲 1ないし 4のいずれか 1項に記載の言語処理装置にて生成された削除規則を記憶する知識ベース記憶部と接続されたコンピュータに、言語処理を実行させる言語処理用プログラムであって、

前記知識ベース記憶部に記憶されて、る削除規則に基づ、て、前記複数の解析結果力不要な解析結果を削除する曖昧性削減処理と、

前記不要な解析結果が削除された複数の解析結果に対して特定の解析を行って該複数の解析結果から 1つの解析結果を採用する第 2の解析処理と、を含む言語処理を、前記コンピュータに実行させる言語処理用プログラム。