JP2004280509A - 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム - Google Patents

自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP2004280509A
JP2004280509A JP2003071544A JP2003071544A JP2004280509A JP 2004280509 A JP2004280509 A JP 2004280509A JP 2003071544 A JP2003071544 A JP 2003071544A JP 2003071544 A JP2003071544 A JP 2003071544A JP 2004280509 A JP2004280509 A JP 2004280509A
Authority
JP
Japan
Prior art keywords
quantifier
semantic
classifier
natural language
semantic role
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003071544A
Other languages
English (en)
Other versions
JP4039282B2 (ja
Inventor
Tomoko Okuma
智子 大熊
Hiroshi Masuichi
博 増市
Hiroki Yoshimura
宏樹 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2003071544A priority Critical patent/JP4039282B2/ja
Publication of JP2004280509A publication Critical patent/JP2004280509A/ja
Application granted granted Critical
Publication of JP4039282B2 publication Critical patent/JP4039282B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】格助詞を伴って現れる数量詞の係り受け関係を正確に把握する。
【解決手段】数量詞を構成する助数詞の属性すなわち意味役割をあらかじめ対応表の形式で記述し、文中における数量詞の接続関係に応じて助数詞の意味役割を判定するためのルールを記述した助数詞の接続ルールを規定しておき、数量詞が格助詞を伴って現れる場合であって、同じ文中にさらに別の数量詞が存在するときには、それぞれの数量詞に含まれる助数詞の属性に従って、格助詞を伴って出現した数量詞についての係り受け関係を判定し意味解析出力する。互いの助数詞の意味役割が一致する場合は、文の後方に出現した数量詞に掛ける。
【選択図】 図4

Description

【0001】
【発明の属する技術分野】
本発明は、人間が日常的なコミュニケーションに使用する自然言語を数学的に取り扱うための自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに係り、特に、自然言語文の構文・意味解析を行なう自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに関する。
【0002】
さらに詳しくは、本発明は、単語の係り受け関係を正確に把握してより高精度な構文・意味解析処理を行なう自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに係り、特に、数量詞との組み合わせで格助詞が用いられる場合の係り受け関係を正確に把握してより高精度の構文・意味解析処理を行なう自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに関する。
【0003】
【従来の技術】
日本語や英語など、人間が日常的なコミュニケーションに使用する言葉のことを「自然言語」と呼ぶ。多くの自然言語は、自然発生的な起源を持ち、人類、民族、社会の歴史とともに進化してきた。勿論、人は身振りや手振りなどによっても意思疎通を行なうことが可能であるが、自然言語により最も自然で且つ高度なコミュニケーションを実現することができる。
【0004】
他方、情報技術の発展に伴い、コンピュータが人間社会に定着し、各種産業や日常生活の中に深く浸透している。いまやコンピュータ・データだけでなく、画像や音響などほとんどすべての情報コンテンツがコンピュータ上で取り扱われ、情報の編集・加工、蓄積、管理、伝達、共有など高度な処理を行なうことが可能となっている。
【0005】
例えば、日本語や英語を始めと刷る各種の言語で記述される自然言語は、本来抽象的であいまい性が高い性質を持つが、文章を数学的に取り扱うことにより、コンピュータ処理を行なうことができる。この結果、機械翻訳や対話システム、検索システム、質問応答システムなど、自動化処理により自然言語に関するさまざまなアプリケーション/サービスが実現される。
【0006】
かかる自然言語処理は一般に、形態素解析、構文解析、意味解析、文脈解析という各処理フェーズに区分される。
【0007】
形態素解析では、文を意味的最小単位である形態素(morpheme)に分節して品詞の認定処理を行なう。構文解析では、文法規則などを基に句構造などの文の構造を解析する。文法規則が木構造であることから、構文解析結果は一般に個々の形態素が係り受け関係などを基にして接合された木構造となる。意味解析では、文中の語の語義(概念)や、語と語の間の意味関係などに基づいて、文が伝える意味を表現する意味構造を求めて、意味構造を合成する。また、文脈解析では、文の系列である文章(談話)を解析の基本単位とみなして、文間の意味的なまとまりを得て談話構造を構成する。
【0008】
構文解析では、自然言語文を受け取り、文法規則に基づいて単語(文節)間の係り受け関係を決定する処理を行なう。構文解析結果は、依存構造と呼ばれる木構造(依存木)の形態で表現することができる。また、意味解析では、単語(文節)間の係り受け関係に基づいて、文中の格関係を決定する処理を行なうことができる。
【0009】
したがって、構文解析において単語間の係り受け関係を正確に決定することは、力文の意味内容を正確に解釈する上で不可欠である。例えば、入力文に応答して動作する検索システムや質問応答システムにおいては、係り受け関係の決定は信頼性に大いに関わる。
【0010】
ここで、名詞が格助詞を伴って文中に現れる場合、一般に、名詞は述語に係るとされている。これに対し、数量詞が格助詞を伴って現れる場合、その係り受け関係は明瞭であるとは限らない。
【0011】
例えば、助数詞の意味を格納した単位意味辞書と名詞に対応する名詞単位所を設け、数詞表現に対してこれらの辞書を用いて数詞表現部分の修飾先と修飾関係を決定することができる(例えば、特許文献1を参照のこと)。
【0012】
また、「一日に一個のりんご」など、数量詞は一般にニ格を受けることができるという性質がある(例えば、非特許文献1を参照のこと)。
【0013】
また、結合価辞書と数量や程度を示す副詞についての再分類を付与した辞書を用いて、福祉の出現位置に応じて副詞の修飾先を決定することができる(例えば、特許文献2を参照のこと)。
【0014】
数量詞が格助詞を伴って現れる場合、名詞と同様に述語に係ることが多い。ところが同じ文中にさらに別の数量詞が存在するときには、述語以外に係る可能性があり、解析エラーを発生し易い。数量詞が格助詞を伴って現れる場合であって、同じ文中にさらに別の数量詞が存在するときには、格助詞を伴った数量詞は、用言を修飾する場合、別の数量詞を修飾する場合、さらには曖昧性が生じる場合が考えられる。検索システムや質問応答システムに適用した場合、係り受け関係が誤った解析エラーにより、正確な回答を行なうことができなくなる。
【0015】
【特許文献1】
特開平2−118879号公報
【特許文献2】
特開平9−6778号公報
【非特許文献1】
星野外著「日本語の表現」(圭文社 1993,P94)
【0016】
【発明が解決しようとする課題】
本発明の目的は、単語の係り受け関係を正確に把握してより高精度な構文・意味解析処理を行なうことができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
【0017】
本発明のさらなる目的は、数量詞との組み合わせで格助詞が用いられる場合の係り受け関係を正確に把握してより高精度の構文・意味解析処理を行なうことができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
【0018】
【課題を解決するための手段及び作用】
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、数量詞が格助詞を伴って現れる文についての意味解析を行なう自然言語処理システムであって、
同じ句の後方に別の数量詞が存在するかどうかを判断する数量詞判定手段と、
同じ句の後方に別の数量詞が存在すると判定された場合に、それぞれの数量詞に含まれる助数詞が持つ意味役割を判定する意味役割判定手段と、
文中の各助数詞が持つ意味役割に応じて、格助詞を伴って現れる数量詞の係り受け関係を判定する意味解析手段と、
を具備することを特徴とする自然言語処理システムである。
【0019】
ここで、前記意味役割判定手段は、数量詞を構成する助数詞とその意味役割の対応関係を記述した助数詞の対応表と、文中における数量詞の接続関係に応じて助数詞の意味役割を判定するためのルールを記述した助数詞の接続ルールとを備えることによって、それぞれの数量詞に含まれる助数詞が持つ意味役割を前記助数詞の対応表で引き、前記助数詞の接続ルールに従って各助数詞の意味役割を判定することができる。
【0020】
前記の助数詞の対応表は、1つの助数詞につき複数の意味役割を規定することができる。助数詞の対応表では、助数詞としての「年」、「月」、「日」は、いずれも、「日時」及び「期間」などを意味役割として有していると規定されている。また、助数詞「時」は意味役割として「日時」のみを有していると規定されている。また、助数詞「度」は意味役割として「回数」及び「度数」を有していると規定されている。また、助数詞「回」は意味役割として「回数」のみを有していると規定されている。
【0021】
また、前記の助数詞の接続ルールでは、助数詞の意味役割を判定するためのルールとして、例えば以下の事柄を規定している。
(1)2以上の意味役割「日時」を持つ数量詞が連続したら、数量詞の意味役割を「日時」に限定する。
(2)意味役割「日時」を持つ数量詞に接尾辞「間」が接続したら、その意味役割を「期間」に限定する。
(3)意味役割「度数」を持つ数量詞の数詞が「−」で始まっていたら、その意味役割を「度数」に限定する。
【0022】
前記意味解析手段は、文中の各助数詞が持つ意味役割に応じて、格助詞を伴って現れる数量詞の係り受け関係を判定することができる。
【0023】
例えば、格助詞を伴って現れる数量詞と、同じ句の後方に出現する数量詞の意味役割が一致しない場合には、格助詞を伴って現れる数量詞を文中の述語に掛けるものと判断することができる。
【0024】
また、格助詞を伴って現れる数量詞と、同じ句の後方に出現する数量詞の意味役割が一致する場合には、格助詞を伴って現れる数量詞を後方に出現する数量詞に掛けるものと判断することができる。
【0025】
また、少なくとも一方の数量詞が複数の意味役割を持つ場合には、格助詞を伴って現れる数量詞をさらに文中の述語に掛けるものと判断して、数量詞自体が持つあいまい性に対応することができる。
【0026】
したがって、本発明に係る自然言語処理システムによれば、数量詞の後に格助詞が用いられている場合であっても、文中に数量詞が格助詞を伴って現れた場合、文中に別の数量詞が存在するときにはそれぞれの数量詞を構成する助数詞の属性に基づいて係り受け関係を判断して、構文意味・解析の処理精度を向上することができる。この結果、解析結果を例えば検索システムや質問応答システムに利用する際に、有用な結果を得ることができる。
【0027】
また、本発明の第2の側面は、数量詞が格助詞を伴って現れる文についての意味解析を行なうための自然言語処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
同じ句の後方に別の数量詞が存在するかどうかを判断する数量詞判定ステップと、
同じ句の後方に別の数量詞が存在すると判定された場合に、それぞれの数量詞に含まれる助数詞が持つ意味役割を判定する意味役割判定ステップと、
文中の各助数詞が持つ意味役割に応じて、格助詞を伴って現れる数量詞の係り受け関係を判定する意味解析ステップと、
を具備することを特徴とするコンピュータ・プログラムである。
【0028】
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第1の側面に係る自然言語処理システムと同様の作用効果を得ることができる。
【0029】
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
【0030】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施形態について詳解する。
【0031】
本発明に係る自然言語処理システムは、数量詞との組み合わせで用いられる格助詞の係り受け関係を正確に把握してより高精度の構文・意味解析処理を行なうものである。
【0032】
意味解析を行うための文法理論の代表的な例として、Lexical Functional Grammar (LFG)を挙げることができる本発明は、例えばLFG文法理論に基づく構文・意味解析処理に組み込んで実装することができる。
【0033】
LFGでは、ネイティブ・スピーカの言語知識すなわち文法を、コンピュータ処理や、コンピュータの処理動作に影響を及ぼすその他の非文法的な処理パラメータとは切り離したコンポーネントとして構成している。まず、自然言語処理システムの全体像について簡単に説明する。
【0034】
図1には、LFGに基づく自然言語処理システム1の構成を模式的に示している。
【0035】
形態素解析部2は、日本語など特定の言語に関する形態素ルール2Aと形態素辞書2Bを持ち、入力文を意味的最小単位である形態素に分節して品詞の認定処理を行なう。例えば、「私の娘は英語を話します。」という文が入力された場合、形態素解析結果として、「私{Noun} の{up} 娘{Noun} は{up} 英語{Noun} を{up} 話す{Verb1}{tr} ます{jp} 。{pt}」が出力される。
【0036】
このような形態素解析結果は、次いで、統語・意味解析部3に入力される。統語・意味解析部は、文法ルール3Aや結合価辞書3Bなどの辞書を持ち、文法ルールなどに基づく句構造の解析や、文中の語の語義や語と語の間の意味関係などに基づいて文が伝える意味を表現する意味構造の解析を行なう(結合価辞書は動詞と主語などの文中の他の構成要素との関係を記述したものであり、述部とそれに係る語の意味関係を抽出することができる)。そして、構文解析した結果として、単語や形態素などからなる文章の句構造を木構造として表した”c−structure(constituent structure)”と、主語、目的語などの格構造に基づいて入力文を疑問文、過去形、丁寧文など意味的・機能的に解析した結果として”f−structure(functional structure)”を出力する。
【0037】
図2及び図3には、入力文「私の娘は英語を話します。」を統語・意味解析部1により処理した結果として得られるc−structure及びf−structureをそれぞれ示している。
【0038】
c−structureは、文中の単語や句の構造を木構造形式で表したものであり、構文カテゴリーによって定義される。例えば音素列を生成するための音韻学的な解釈を、c−structureを基に行なうことができる。一方、f−structureは、文法的な機能を明確に表現したものであり、文法的な機能名、意味的形式、並びに特徴シンボルにより構成される。f−structureを参照することにより、主語(subject)、目的語(object)、補語(complement)、修飾語(adjunct)といった意味理解を得ることができる。f−structureは、c−structureの各節点に付随する素性の集合であり、図3に示すように属性−属性値のマトリックスの形で表現される。すなわち、[]で囲まれた中の左側は素性(属性)の名前であり、右側は素性の値(属性値)である。
【0039】
なお、LFGの詳細に関しては、例えばR. M. Kaplan及びJ. Bresnan共著の論文”Lexical−Functional Grammar: A Formal System for Grammatical Representation”(The MIT Press, Cambridge (1982). Reprinted in Formal Issues in Lexical−Functional Grammar, pp. 29−130. CSLI publications, Stanford University(1995).)に記述されている。
【0040】
次いで、本発明に係る自然言語処理による数量詞との組み合わせで用いられる格助詞の係り受け関係の判定処理について詳解する。
【0041】
既に述べたように、数量詞が格助詞を伴って現れる場合であって、同じ文中にさらに別の数量詞が存在するときには、格助詞を伴った数量詞は、用言を修飾する場合、別の数量詞を修飾する場合、さらには曖昧性が生じる場合があり、係り受け関係の判定エラーを発生し易い。
【0042】
そこで、本発明では、数量詞を構成する助数詞の属性すなわち意味役割をあらかじめ記述し、属性に応じた助数詞の接続ルールを規定しておき、数量詞が格助詞を伴って現れる場合であって、同じ文中にさらに別の数量詞が存在するときには、それぞれの数量詞に含まれる助数詞の属性に従って、格助詞を伴って現れる数量詞についての係り受け関係を判定し意味解析出力するようにした。なお、数量詞は、(数量接頭語)、(符号)、(数)、(助数詞)、(数量限定語)の組み合わせで構成されると定義することができる。
【0043】
数量詞を構成する助数詞の属性すなわち意味役割を記述した助数詞の対応表の構成例を以下の表1に示している。
【0044】
【表1】
Figure 2004280509
【0045】
上表に示す例では、助数詞としての「年」、「月」、「日」は、いずれも、「日時」及び「期間」などを意味役割として有していると規定されている。また、助数詞「時」は意味役割として「日時」のみを有していると規定されている。また、助数詞「度」は意味役割として「回数」及び「度数」を有していると規定されている。また、助数詞「回」は意味役割として「回数」のみを有していると規定されている。
【0046】
また、助数詞の接続ルールは、文中における数量詞の接続関係に応じて助数詞の意味役割を判定するためのルールを記述している。本実施形態に係る自然言語処理システムでは、以下に示す3種類の助数詞の接続ルールを規定している。
【0047】
(1)2以上の意味役割「日時」を持つ数量詞が連続したら、数量詞の意味役割を「日時」に限定する。
(2)意味役割「日時」を持つ数量詞に接尾辞「間」が接続したら、その意味役割を「期間」に限定する。
(3)意味役割「度数」を持つ数量詞の数詞が「−」で始まっていたら、その意味役割を「度数」に限定する。
【0048】
図4には、本発明に係る自然言語処理の一実施形態である、数量詞との組み合わせで用いられる格助詞の係り受け関係を判定するための処理手順をフローチャートの形式で示している。
【0049】
格助詞を接続した数量詞aを含む文が当該システムに投入されると、まず、同じ句の右側に別の数量詞bが存在するかどうかを判定する(ステップS1)。
【0050】
ここで、同じ句の右側に別の数量詞bが存在しない場合には、数量詞aは、通常の名詞と同様に取り扱われ、述語に掛けて(ステップS7)、これを構文又は意味解析結果の出力として(ステップS6)、本処理ルーチン全体を終了する。
【0051】
一方、同じ句の右側に別の数量詞bが存在すると判定された場合には、それぞれの数量詞に含まれる助数詞が持つ意味役割を決定する(ステップS2)。
【0052】
上述したように、本実施形態では、数量詞を構成する助数詞の属性すなわち意味役割を記述した助数詞の対応表と、文中における数量詞の接続関係に応じて助数詞の意味役割を判定するためのルールを記述した助数詞の接続ルールが用意されているので、当該システムは、これら助数詞の対応表と助数詞の接続ルールを参照することによって、それぞれの数量詞に含まれる助数詞が持つ意味役割を容易に取得することができる。
【0053】
そして、数量詞aと数量詞bの意味役割が一致しているかどうかを判断する(ステップS3)。
【0054】
ここで、数量詞aと数量詞bの意味役割が一致しない場合には、数量詞aは、通常の名詞と同様に取り扱われ、述語に掛けて(ステップS7)、これを意味解析結果の出力として(ステップS6)、本処理ルーチン全体を終了する。
【0055】
一方、数量詞aと数量詞bの意味役割が一致する場合には、数量詞aを数量詞bに掛ける(ステップS4)。
【0056】
そして、数量詞a又は数量詞bのうち少なくとも一方が複数の意味役割を持つかどうかをさらに判定する(ステップS5)。
【0057】
ここで、数量詞a又は数量詞bのうち少なくとも一方が複数の意味役割を持つ場合には、格助詞を伴って出現する数量詞aの意味役割が曖昧であるとして、数量詞aを句の述語に掛けるという係り受け関係をさらに追加して(ステップS7)、2通りの構文又は意味解析結果を出力して(ステップS6)、本処理ルーチン全体を終了する。
【0058】
以下では、図4に示した数量詞との組み合わせで用いられる格助詞の係り受け関係の判定処理手順に従った数量詞の処理結果の具体例について説明する。
【0059】
例えば、「彼は5月3日に1回失恋している。」という例文の場合、格助詞を伴う数量詞として「5月3日」が抽出される。この数量詞は、2以上の意味役割「日時」を持つ数量詞が連続していることから、助数詞の接続ルールに従い、その意味役割を「日時」に限定することができる。また、同じ文中に別の数量詞「1回」が抽出されるが、この数量詞は、助数詞の対応表から意味役割として「回数」を持つことが分る。そして、これら同じ文中に出現する2つの数量詞の意味内容が相違することから、格助詞を伴う数量詞「5月3日」は、通常の名詞と同様に取り扱われ、用言「失恋している」を修飾していると判断される。
【0060】
したがって、「彼はどのくらい失恋しているのですか」という質問文があった場合、この例文に基づく回答は「1回」となるべきである。図5には、この例文の構文解析木を示している。また、図6には、図5に示した構文解析木に基づいた意味解析結果(f−structure)を示している。
【0061】
また、「彼は3回に1回失恋している。」という例文の場合、格助詞を伴う数量詞として「3回」が抽出される。この数量詞は、助数詞の対応表から意味役割として「回数」を持つことが分る。また、同じ文中に別の数量詞「1回」が抽出されるが、この数量詞は、助数詞の対応表から意味役割として「回数」を持つことが分る。そして、これら同じ文中に出現する2つの数量詞の意味内容が同じであることから、格助詞を伴う数量詞「3回」を同じ文中で後続する数量詞文中の別の数量詞「1回」を修飾していると判断される。
【0062】
したがって、「彼はどのくらい失恋しているのですか」という同様の質問文があった場合、この例文に基づく回答は「3回に1回」となるべきである。図7には、この例文の構文解析木を示している。また、図8には、図7に示した構文解析木に基づいた意味解析結果(f−structure)を示している。
【0063】
また、「彼は3日に1回失恋している。」という例文の場合、格助詞を伴う数量詞として「3日」が抽出される。この数量詞は、助数詞の対応表から、意味役割として「日時」以外に、「期間」や「頻度」を持つことが分る。また、同じ文中に別の数量詞「1回」が抽出されるが、この数量詞は、助数詞の対応表から意味役割として「回数」を持つことが分る。この場合、格助詞を伴う数量詞「3日」は複数の意味役割を持つが、助数詞の接続ルールを参照しても該当するルールが発見されないことから、1つの意味役割に特定することができない。
【0064】
まず、格助詞を伴う数量詞「3日」と、同じ句の中で後続する別の数量詞「1回」がともに、意味役割として頻度を持つことから、格助詞を伴う数量詞「3日」を同じ文中で後続する数量詞文中の別の数量詞「1回」を修飾していると判断される。
【0065】
また、格助詞を伴う数量詞「3日」が複数の意味役割を持つことから、用言「失恋している」を修飾しているとさらに判断される。
【0066】
すなわち、この例文の場合、格助詞を伴う数量詞自体にあいまい性があるため、同じ質問文「彼はどれくらい失恋しているのですか」に対する回答は、「1回」となる場合と、「3日に1回」となる場合の両方が考えられる。図9には、この例文についての1つの構文解析結果を示している。また、図10には、図9に示した構文解析木に基づいた意味解析結果(f−structure)を示している。また、図11には、この例文についての他の構文解析結果を示している。また、図12には、図11に示した構文解析木に基づいた意味解析結果(f−structure)を示している。
【0067】
[追補]
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。
【0068】
本実施形態ではLFG文法理論に基づいて説明するが、勿論、他の文法ルールを備えた解析システムにおいても本発明を同様に適用することができる。
【0069】
要するに、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
【0070】
【発明の効果】
以上詳記したように、本発明によれば、単語の係り受け関係を正確に把握してより高精度な構文・意味解析処理を行なうことができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
【0071】
また、本発明によれば、数量詞との組み合わせで格助詞が用いられる場合の係り受け関係を正確に把握してより高精度の構文・意味解析処理を行なうことができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
【0072】
本発明によれば、数量詞の後に格助詞が用いられている場合、文中に数量詞が格助詞を伴って現れた場合、文中に別の数量詞が存在するときにはそれぞれの数量詞を構成する助数詞の属性に基づいて係り受け関係を判断して、構文意味・解析の処理精度を向上することができる。この結果、解析結果を例えば検索システムや質問応答システムに利用する際に、有用な結果を得ることができる。
【図面の簡単な説明】
【図1】LFGに基づく自然言語処理システム1の構成を模式的に示した図である。
【図2】入力文「私の娘は英語を話します。」を統語・意味解析部1により処理した結果として得られるc−structureを示した図である。
【図3】入力文「私の娘は英語を話します。」を統語・意味解析部1により処理した結果として得られるf−structureを示した図である。
【図4】数量詞との組み合わせで用いられる格助詞の係り受け関係を判定するための処理手順を示したフローチャートである。
【図5】例文「彼は5月3日に1回失恋している。」についての構文解析木を示した図である。
【図6】図5に示した構文解析木に基づいた意味解析結果(f−structure)を示した図である。
【図7】例文「彼は3回に1回失恋している。」についての構文解析木を示した図である。
【図8】図7に示した構文解析木に基づいた意味解析結果(f−structure)を示した図である。
【図9】例文「彼は3日に1回失恋している。」についての構文解析木を示した図である。
【図10】図9に示した構文解析木に基づいた意味解析結果(f−structure)を示した図である。
【図11】例文「彼は3日に1回失恋している。」についての他の構文解析木を示した図である。
【図12】図11に示した構文解析木に基づいた意味解析結果(f−structure)を示した図である。
【符号の説明】
1…自然言語処理システム
2…形態素解析部
2A…形態素ルール,2B…形態素辞書
3…統語・意味解析部
3A…文法ルール,3B…結合価辞書

Claims (15)

  1. 数量詞が格助詞を伴って現れる文についての意味解析を行なう自然言語処理システムであって、
    同じ句の後方に別の数量詞が存在するかどうかを判断する数量詞判定手段と、
    同じ句の後方に別の数量詞が存在すると判定された場合に、それぞれの数量詞に含まれる助数詞が持つ意味役割を判定する意味役割判定手段と、
    文中の各助数詞が持つ意味役割に応じて、格助詞を伴って現れる数量詞の係り受け関係を判定する意味解析手段と、
    を具備することを特徴とする自然言語処理システム。
  2. 前記意味役割判定手段は、
    数量詞を構成する助数詞とその意味役割の対応関係を記述した助数詞の対応表と、文中における数量詞の接続関係に応じて助数詞の意味役割を判定するためのルールを記述した助数詞の接続ルールとを備え、
    それぞれの数量詞に含まれる助数詞が持つ意味役割を前記助数詞の対応表で引き、前記助数詞の接続ルールに従って各助数詞の意味役割を判定する、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  3. 前記の助数詞の対応表は、1つの助数詞につき複数の意味役割を規定することができる、
    ことを特徴とする請求項2に記載の自然言語処理システム。
  4. 前記の助数詞の接続ルールでは、助数詞の意味役割を判定するためのルールとして、
    (1)2以上の意味役割「日時」を持つ数量詞が連続したら、数量詞の意味役割を「日時」に限定する
    (2)意味役割「日時」を持つ数量詞に接尾辞「間」が接続したら、その意味役割を「期間」に限定する
    (3)意味役割「度数」を持つ数量詞の数詞が「−」で始まっていたら、その意味役割を「度数」に限定する
    を規定する、
    を含むことを特徴とする請求項2に記載の自然言語処理システム。
  5. 前記意味解析手段は、格助詞を伴って現れる数量詞と、同じ句の後方に出現する数量詞の意味役割が一致しない場合には、格助詞を伴って現れる数量詞を文中の述語に掛ける、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  6. 前記意味解析手段は、格助詞を伴って現れる数量詞と、同じ句の後方に出現する数量詞の意味役割が一致する場合には、格助詞を伴って現れる数量詞を後方に出現する数量詞に掛ける、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  7. 少なくとも一方の数量詞が複数の意味役割を持つ場合には、格助詞を伴って現れる数量詞をさらに文中の述語に掛ける、
    ことを特徴とする請求項6に記載の自然言語処理システム。
  8. 同じ句の後方に別の数量詞が存在しないと判定された場合には、格助詞を伴って現れる数量詞を文中の述語に掛ける、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  9. 2以上の数量詞が出現する入力文についての意味解析を行なう自然言語処理システムであって、
    数量詞を構成する助数詞とその意味役割の対応関係を記述した助数詞の対応表と、
    文中における数量詞の接続関係に応じて助数詞の意味役割を判定するためのルールを記述した助数詞の接続ルールと、
    同じ句の後方に別の数量詞が存在すると判断された場合に、それぞれの数量詞に含まれる助数詞が持つ意味役割を前記助数詞の対応表で引き、前記助数詞の接続ルールに従って各助数詞の意味役割を判定する手段と、
    各助数詞の意味役割に応じて入力文を意味解析する手段と、
    を具備することを特徴とする自然言語処理システム。
  10. 前記の助数詞の対応表は、1つの助数詞につき複数の意味役割を規定することができる、
    ことを特徴とする請求項9に記載の自然言語処理システム。
  11. 前記の助数詞の接続ルールでは、助数詞の意味役割を判定するためのルールとして、
    (1)2以上の意味役割「日時」を持つ数量詞が連続したら、数量詞の意味役割を「日時」に限定する
    (2)意味役割「日時」を持つ数量詞に接尾辞「間」が接続したら、その意味役割を「期間」に限定する
    (3)意味役割「度数」を持つ数量詞の数詞が「−」で始まっていたら、その意味役割を「度数」に限定する
    を規定する、
    を含むことを特徴とする請求項9に記載の自然言語処理システム。
  12. 数量詞が格助詞を伴って現れる文についての意味解析を行なう自然言語処理方法であって、
    同じ句の後方に別の数量詞が存在するかどうかを判断する数量詞判定ステップと、
    同じ句の後方に別の数量詞が存在すると判定された場合に、それぞれの数量詞に含まれる助数詞が持つ意味役割を判定する意味役割判定ステップと、
    文中の各助数詞が持つ意味役割に応じて、格助詞を伴って現れる数量詞の係り受け関係を判定する意味解析ステップと、
    を具備することを特徴とする自然言語処理方法。
  13. 2以上の数量詞が出現する入力文についての意味解析を行なう自然言語処理方法であって、
    同じ句の後方に別の数量詞が存在すると判断された場合に、それぞれの数量詞に含まれる助数詞が持つ意味役割を、数量詞を構成する助数詞とその意味役割の対応関係を記述した助数詞の対応表で引くとともに、文中における数量詞の接続関係に応じて助数詞の意味役割を判定するためのルールを記述した助数詞の接続ルールに従って各助数詞の意味役割を判定するステップと、
    各助数詞の意味役割に応じて入力文を意味解析するステップと、
    を具備することを特徴とする自然言語処理方法。
  14. 数量詞が格助詞を伴って現れる文についての意味解析を行なうための自然言語処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
    同じ句の後方に別の数量詞が存在するかどうかを判断する数量詞判定ステップと、
    同じ句の後方に別の数量詞が存在すると判定された場合に、それぞれの数量詞に含まれる助数詞が持つ意味役割を判定する意味役割判定ステップと、
    文中の各助数詞が持つ意味役割に応じて、格助詞を伴って現れる数量詞の係り受け関係を判定する意味解析ステップと、
    を具備することを特徴とするコンピュータ・プログラム。
  15. 2以上の数量詞が出現する入力文についての意味解析を行なうための自然言語処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
    同じ句の後方に別の数量詞が存在すると判断された場合に、それぞれの数量詞に含まれる助数詞が持つ意味役割を、数量詞を構成する助数詞とその意味役割の対応関係を記述した助数詞の対応表で引くとともに、文中における数量詞の接続関係に応じて助数詞の意味役割を判定するためのルールを記述した助数詞の接続ルールに従って各助数詞の意味役割を判定するステップと、
    各助数詞の意味役割に応じて入力文を意味解析するステップと、
    を具備することを特徴とするコンピュータ・プログラム。
JP2003071544A 2003-03-17 2003-03-17 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム Expired - Fee Related JP4039282B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003071544A JP4039282B2 (ja) 2003-03-17 2003-03-17 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003071544A JP4039282B2 (ja) 2003-03-17 2003-03-17 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2004280509A true JP2004280509A (ja) 2004-10-07
JP4039282B2 JP4039282B2 (ja) 2008-01-30

Family

ID=33287963

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003071544A Expired - Fee Related JP4039282B2 (ja) 2003-03-17 2003-03-17 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP4039282B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100886688B1 (ko) 2007-12-11 2009-03-04 한국전자통신연구원 한국어 수량사 생성 방법 및 장치
JP2010134730A (ja) * 2008-12-05 2010-06-17 Fuji Xerox Co Ltd 言語処理装置、言語処理システム及びプログラム
CN105760359A (zh) * 2014-11-21 2016-07-13 财团法人工业技术研究院 问句处理系统及其方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100886688B1 (ko) 2007-12-11 2009-03-04 한국전자통신연구원 한국어 수량사 생성 방법 및 장치
JP2010134730A (ja) * 2008-12-05 2010-06-17 Fuji Xerox Co Ltd 言語処理装置、言語処理システム及びプログラム
CN105760359A (zh) * 2014-11-21 2016-07-13 财团法人工业技术研究院 问句处理系统及其方法

Also Published As

Publication number Publication date
JP4039282B2 (ja) 2008-01-30

Similar Documents

Publication Publication Date Title
JPH0383167A (ja) 自然言語処理方法
Hammouda et al. Parsing Arabic nominal sentences with transducers to annotate corpora
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Bourahma et al. Syntactic parsing of simple Arabic nominal sentence using the NooJ linguistic platform
JP2005284723A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4039282B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Gupta et al. Study of divergence for example based English-Hindi machine translation
JP4033011B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2008077512A (ja) 文書解析装置、および文書解析方法、並びにコンピュータ・プログラム
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Nenadić Local grammars and parsing coordination of nouns in Serbo-Croatian
Murthy et al. A New Approach to Tagging in Indian Languages.
JP3903820B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Rodrigues et al. Bootstrapping a hybrid MT system to a new language pair
Hammouda et al. Arabic NooJ parser: nominal sentence case
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033088B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972699B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4114580B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
KR20110092691A (ko) 코더 친화적 기계이해형 자연어 텍스트 표현 방법
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP6694987B2 (ja) 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005092616A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972698B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070724

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071016

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071029

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131116

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees