JP3903820B2 - 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム - Google Patents

自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP3903820B2
JP3903820B2 JP2002079632A JP2002079632A JP3903820B2 JP 3903820 B2 JP3903820 B2 JP 3903820B2 JP 2002079632 A JP2002079632 A JP 2002079632A JP 2002079632 A JP2002079632 A JP 2002079632A JP 3903820 B2 JP3903820 B2 JP 3903820B2
Authority
JP
Japan
Prior art keywords
sentence
word
question
input
input sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002079632A
Other languages
English (en)
Other versions
JP2003281137A (ja
Inventor
博 増市
智子 大熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2002079632A priority Critical patent/JP3903820B2/ja
Publication of JP2003281137A publication Critical patent/JP2003281137A/ja
Application granted granted Critical
Publication of JP3903820B2 publication Critical patent/JP3903820B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、人間が日常的なコミュニケーションに使用する自然言語を数学的に取り扱うための自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに係り、特に、日本語構文の統語・意味解析を行なう自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに関する。
【0002】
さらに詳しくは、本発明は、文法ルールに従って日本語構文の統語・意味解析を行なう自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに係り、特に、入力された文が疑問文であるか否かを判定する自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに関する。
【0003】
【従来の技術】
日本語や英語など、人間が日常的なコミュニケーションに使用する言葉のことを「自然言語」と呼ぶ。多くの自然言語は、自然発生的な起源を持ち、人類、民族、社会の歴史とともに進化してきた。勿論、人は身振りや手振りなどによっても意思疎通を行なうことが可能であるが、自然言語により最も自然で且つ高度なコミュニケーションを実現することができる。
【0004】
他方、情報技術の発展に伴い、コンピュータが人間社会に定着し、各種産業や日常生活の中に深く浸透している。いまやコンピュータ・データだけでなく、画像や音響などほとんどすべての情報コンテンツがコンピュータ上で取り扱われ、情報の編集・加工、蓄積、管理、伝達、共有など高度な処理を行なうことが可能となっている。
【0005】
自然言語は、本来抽象的であいまい性が高い性質を持つが、文章を数学的に取り扱うことにより、コンピュータ処理を行なうことができる。この結果、機械翻訳や対話システム、検索システムなど、自動化処理により自然言語に関するさまざまなアプリケーション/サービスが実現される。
【0006】
自然言語処理は一般に、形態素解析、構文解析、意味解析、文脈解析という各処理フェーズに区分される。
【0007】
形態素解析では、文を意味的最小単位である形態素(morpheme)に分節して品詞の認定処理を行なう。構文解析では、文法規則などを基に句構造などの文の構造を解析する。文法規則が木構造であることから、構文解析結果は一般に個々の形態素が接合された木構造である。意味解析では、文中の語の語義(概念)や、語と語の間の意味関係などに基づいて、文が伝える意味を表現する意味構造を求めて、意味構造を合成する。文脈解析では、文の系列である文章(談話)を解析の基本単位とみなして、文間の意味的なまとまりを得て談話構造を構成する。
【0008】
ところで、自然言語処理を用いて対話システムや質問応答システムを構築する場合、ユーザからの入力が文法に従った正規の疑問文であるのかそれとも非文であるのか、Yes−Noタイプの疑問文であるのかそれとも5W1Hタイプの疑問文であるのかを決定する処理は、ユーザの入力に対する応答を生成する際に極めて重要である。
【0009】
現状の構文・意味解析システムにおいては、疑問文中の疑問詞を同定してそれに対応する回答を生成する手法が用いられているに過ぎない。この場合、例えば「誰もがデジタルデバイドという言葉を知っていますか。」というユーザ入力に対してシステムは、「誰」という疑問詞を同定して、デジタルデバイドという言葉を知っている人を知識ベースから検索しようとする。
【0010】
しかしながら、この場合のユーザ入力は実際には誰がデジタルデバイドという言葉を知っているのかを聞いているのではなく、例えば日本人のうち何パーセントの人間がその言葉を知っているのかを聞いていると考えられる。
【0011】
これは、疑問文中の疑問詞に対し意味用法を1つに限定して処理を行うために起こる現象であり、この結果文の意図が正しく理解されないという事態を招来する。
【0012】
【発明が解決しようとする課題】
本発明の目的は、文法ルールに従って日本語構文の意味解析を好適に行なうことができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
【0013】
本発明のさらなる目的は、入力された文が疑問文であるか否かを正確に判定することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
【0014】
本発明のさらなる目的は、単に疑問詞の抽出に頼ることなく、入力された文が疑問文であるか否かを正確に判定することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
【0015】
本発明のさらなる目的は、入力文が文法に従った正規の疑問文又は非文のいずれであるのか、Yes−Noタイプ又は5W1Hタイプいずれの疑問文であるのかを判定することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
【0016】
【課題を解決するための手段及び作用】
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、 入力文が疑問文であるかどうかを判定するための自然言語処理システム又は自然言語処理方法であって、
入力文に疑問詞に対応する品詞カテゴリWに属する単語が含まれているかどうかを判断する第1の手段又はステップと、
前記第1の手段により発見された単語wの直後に単語wが文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPが存在するかどうかを判定する第2の手段又はステップと、
を具備することを特徴とする自然言語処理システム又は自然言語処理方法である。
【0017】
また、本発明の第2の側面は、入力文が疑問文であるかどうかを判定するための自然言語処理システム又は自然言語処理方法であって、
入力文に疑問詞に対応する品詞カテゴリWに属する単語が含まれているかどうかを判断する第1の手段又はステップと、
前記第1の手段により発見された単語wの直後に単語wが文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPが存在するかどうかを判定する第2の手段又はステップと、
入力文中で単語wが疑問文であることを要請する機能が及ぶ最大範囲となる可能な最大句を抽出する第3の手段又はステップと、
前記第3の手段により抽出された最大句が文全体に及ぶか否かで入力文が疑問文か否かを判定する第4の手段又はステップと、
を具備することを特徴とする自然言語処理システム又は自然言語処理方法である。
【0018】
本発明に係る自然言語処理では、関係詞句が分かる構造で記述された文を入力として扱うことが好ましい。このような入力文は、より具体的には、LFG(Lexical-Functional Grammar)文法理論に基づいて構文解析及び意味解析が行なわれた結果であるf−structure形式で記述された文である。
【0019】
また、前記第3の手段又はステップは、単語wが係る動詞句、及び、単語wが関係詞節に含まれる場合はその関係詞が係る名詞句が係る動詞句を可能な最大句として抽出する。入力文がf−structure形式で記述された文であれば、各形態素毎の品詞が認定済みであり、且つ、係り受け関係が明瞭であるから、f−structureに所定のINTマークを埋め込むという文法ルールを記述すれば、最大句の抽出を容易に実現することができ。すなわち、まず疑問詞にINTマークを付加するとともに、係り受け関係に従ってINTマークが文中の上位に向かって最大範囲まで伝播していく。
【0020】
また、前記第4の手段又はステップにより最大句が文全体に及ぶと判定された場合には、入力文全体が疑問文であるかどうかをさらに判定する。そして、判定結果が肯定的であれば入力文が5W1Hタイプの疑問文であると判定し、判定結果が否定的であれば入力文が非文法的文であると判定する。
【0021】
また、前記第1の手段又はステップにより入力文中で品詞カテゴリWに属する単語が発見されなかった場合、前記第2の手段はステップにより入力文中で単語wの直後に品詞カテゴリPに属する単語が発見された場合、並びに、前記第4の手段はステップにより最大句が文全体に及ばないと判定された場合には、当該入力文が疑問文であるか否かをさらに判定する。そして、判定結果が肯定的であれば入力文がYes−Noタイプの疑問文であると判定し、判定結果が否定的であれば入力文が肯定文であると判定する。
【0022】
なお、末尾が疑問を表す終助詞又は疑問を表す記号で終わっているかによって、文全体が疑問文であるか否かを判定することができる。
【0023】
また、本発明の第3の側面は、入力文が疑問文であるかどうかを判定するための自然言語処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
入力文に疑問詞に対応する品詞カテゴリWに属する単語が含まれているかどうかを判断する第1のステップと、
前記第1のステップにより発見された単語wの直後に単語wが文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPが存在するかどうかを判定する第2のステップと、
を具備することを特徴とするコンピュータ・プログラムである。
【0024】
また、本発明の第4の側面は、入力文が疑問文であるかどうかを判定するための自然言語処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
入力文に疑問詞に対応する品詞カテゴリWに属する単語が含まれているかどうかを判断する第1のステップと、
前記第1のステップにより発見された単語wの直後に単語wが文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPが存在するかどうかを判定する第2のステップと、
入力文中で単語wが疑問文であることを要請する機能が及ぶ最大範囲となる可能な最大句を抽出する第3のステップと、
前記第3のステップにより抽出された最大句が文全体に及ぶか否かで入力文が疑問文か否かを判定する第4のステップと、
を具備することを特徴とするコンピュータ・プログラムである。
【0025】
本発明の第3及び第4の各側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第3及び第4の各側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第1及び第2の各側面に係る自然言語処理システム及び自然言語処理方法と同様の作用効果を得ることができる。
【0026】
本発明に係る自然言語処理システム又は自然言語方法によれば、入力文が疑問文であるか否かを高精度に判定することができる。したがって、この疑問文の判定結果を対話システムに利用することによって質問応答を行なうことができる。すなわち、対話システムにおいては、入力文の構文・意味解析を行ない、疑問文であると判定されたことに応答して、入力文に対する相槌文として、疑問文に対する回答を生成すればよい。例えばYes−Noタイプの疑問文であると判定された場合には、Yes−No形式を基調とする回答文を生成すればよいし、5W1Hタイプの疑問文であると判定された場合には、問い合わされた事柄に対応した回答文を生成すればよい。
【0027】
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
【0028】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施形態について詳解する。
【0029】
本発明に係る自然言語処理システムは、入力文が疑問文であるか否かを判断するものであるが、例えば、LFG(Lexical-Functional Grammar)文法理論に基づく統語・意味解析処理に組み込んで実装することができる。LFGでは、ネイティブ・スピーカの言語知識すなわち文法を、コンピュータ処理や、コンピュータの処理動作に影響を及ぼすその他の非文法的な処理パラメータとは切り離したコンポーネントとして構成している。まず、自然言語処理システムの全体像について簡単に説明する。なお、本実施形態ではLFG文法理論に基づいて説明するが,勿論、他の文法ルールを備えた解析システムにおいても本発明を同様に適用することができる。
【0030】
図4には、LFGに基づく自然言語処理システム1の構成を模式的に示している。
【0031】
形態素解析部2は、日本語など特定の言語に関する形態素ルール2Aと形態素辞書2Bを持ち、入力文を意味的最小単位である形態素に分節して品詞の認定処理を行なう。例えば、「私の娘は英語を話します。」という文が入力された場合、形態素解析結果として、「私{Noun} の{up} 娘{Noun} は{up} 英語{Noun} を{up} 話す{Verb1}{tr} ます{jp} 。{pt}」が出力される。
【0032】
このような形態素解析結果は、次いで、統語・意味解析部3に入力される。統語・意味解析部は、文法ルール3Aや結合価辞書3Bなどの辞書を持ち、文法ルールなどに基づく句構造の解析や、文中の語の語義や語と語の間の意味関係などに基づいて文が伝える意味を表現する意味構造の解析を行なう(結合価辞書は動詞と主語などの文中の他の構成要素との関係を記述したものであり、述部とそれに係る語の意味関係を抽出することができる)。そして、構文解析した結果として、単語や形態素などからなる文章の句構造を木構造として表した"c−structure(constituent structure)"と、主語、目的語などの格構造に基づいて入力文を疑問文、過去形、丁寧文など意味的・機能的に解析した結果として"f−structure(functional structure)"を出力する。
【0033】
図5及び図6には、入力文「私の娘は英語を話します。」を統語・意味解析部1により処理した結果として得られるc−structure及びf−structureをそれぞれ示している。
【0034】
c−structureは、文中の単語や句の構造を木構造形式で表したものであり、構文カテゴリーによって定義される。例えば音素列を生成するための音韻学的な解釈を、c−structureを基に行なうことができる。一方、f−structureは、文法的な機能を明確に表現したものであり、文法的な機能名、意味的形式、並びに特徴シンボルにより構成される。f−structureを参照することにより、主語(subject)、目的語(object)、補語(complement)、修飾語(adjunct)といった意味理解を得ることができる。f−structureは、c−structureの各節点に付随する素性の集合であり、図6に示すように属性−属性値のマトリックスの形で表現される。すなわち、[]で囲まれた中の左側は素性(属性)の名前であり、右側は素性の値(属性値)である。
【0035】
なお、LFGの詳細に関しては、例えばR. M. Kaplan及びJ. Bresnan共著の論文"Lexical-Functional Grammar: A Formal System for Grammatical Representation"(The MIT Press, Cambridge (1982). Reprinted in Formal Issues in Lexical-Functional Grammar, pp. 29-130. CSLI publications, Stanford University(1995).)に記述されている。
【0036】
次いで、本発明に係る自然言語処理による疑問文の判定について詳解する。
【0037】
本発明では、まず、疑問詞に対応する品詞カテゴリWと、疑問詞が文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPを定義する。
【0038】
ここで、品詞カテゴリWに分類される疑問詞は、「誰」や「何」などである。また、品詞カテゴリPに分類される助詞は、「か」や「も」などである。例えば、「か」は副助詞であるが、「も」は係助詞であることからも分かるように、品詞カテゴリPの分類は一般的な品詞分類とは一致しない。
【0039】
図1には、入力文が疑問文であるかどうかを判定するための処理手順をフローチャートの形式で示している。
【0040】
この処理手順によれば、あらかじめ定義された品詞カテゴリW及びPを用いて、ユーザからの入力が文法に従った正規の疑問文であるのかそれとも非文であるのか、さらには、Yes−Noタイプの疑問文であるのかそれとも5W1Hタイプの疑問文であるのかを決定することができる。
【0041】
但し、この処理フローに投入される文は、例えば構文解析処理を終えて、関係詞句が分かる構造で記述された文であることが好ましい。
【0042】
まず、ユーザからの入力文が品詞カテゴリWに属する単語を含む文であるか否かを判定する(ステップS1)。
【0043】
入力文に品詞カテゴリWに属する単語(以下、単語wとする)が含まれている場合、さらに単語wの直後に品詞カテゴリPに属する単語が存在するか否かを判定する(ステップS2)。
【0044】
ステップS2において判別結果が否定的、すなわち単語wの直後に品詞カテゴリPに属する単語が存在しない場合には、入力文中で可能な最大句にINT(Interrogative:疑問文)というマークを付加する処理を行なう(ステップS3)。
【0045】
ここで、「可能な最大句」とは、ステップS1において発見された単語wが疑問文であることを要請する機能が及ぶ最大範囲の句のことである。具体的には、単語wが係る動詞句、及び、単語wが関係詞節に含まれる場合はその関係詞が係る名詞句が係る動詞句のことを指す。
【0046】
例えば、「誰がその猫を飼っていますか。」という入力文の場合、疑問詞「誰」は「飼う」に係るので、「飼う」すなわち文全体にINTマークが付されることになる。この場合、「誰がその猫を飼っています。」は正規の日本語文とは認められない。また、「誰が飼っている猫が逃げましたか。」の場合は、まず、「飼う」にINTのマークが付され、さらに「誰が飼っている」という関係詞節が係る名詞句「猫」が係る動詞句「逃げる」(すなわち文全体)にもINTが付されることになる。また、関係詞節が多重の入れ子構造をとる場合は、INTが再帰的に文全体の上位方向に伝搬されるものとする。
【0047】
ステップS4では、文全体にINTが付加されているかどうかを判定する。文全体にINTが付加されていると判定された場合には、さらにステップS5において、文全体が疑問文であるかどうかを判別する。これは、入力文の末尾が疑問を表す終助詞「か」、あるいは疑問を表す記号で終わっているか否かによって判定することができる。
【0048】
ステップS5における結果が肯定的であれば、5W1Hタイプの疑問文であると判定する。また、判定結果が否定的であれば入力文が非文法的文であると判定する。ユーザによる入力が非文法的文と判定された場合は、正確な意味をユーザに聞き返すようにしてもよい。
【0049】
他方、ステップS1において入力文中で品詞カテゴリWに属する単語が発見されなかった場合、ステップS2において入力文中で単語wの直後に品詞カテゴリPに属する単語が発見された場合、又は、ステップS4において文全体にINTが付加されていないと判定された場合には、さらにステップS6において、文全体が疑問文であるかどうかを判別する。これは、ステップS5と同様に、入力文の末尾が疑問を表す終助詞「か」、あるいは疑問を表す記号で終わっているか否かによって判定することができる。
【0050】
ステップS5における結果が肯定的であれば、Yes−Noタイプの疑問文であると判定する。また、判定結果が否定的であれば入力文が肯定文であると判定する。
【0051】
図1に示したような処理手順は、例えば、INTマークをf−structureに埋め込むような文法ルールを記述することによって容易に実現することができるが、統語・意味解析部3自身が備える処理機能として実装することもできる。
【0052】
ここで、以下の6文を例にとって、図1に示した疑問文の判定処理について具体的に説明する。
【0053】
(1)誰が「種の起源」を書きました。
(2)誰が「種の起源」を書きましたか。
(3)あなたは誰が書いた本を読みました。
(4)あなたは誰が書いた本を読みましたか。
(5)誰もが「聖書」を読んでいます。
(6)誰もが「聖書」を読んでいますか。
【0054】
文例(1)は、ステップS1において"Yes"、ステップS2において"No"、ステップS4において"Yes"、ステップS5において"No"と判断され、最終的には非文法的文であると判断される。
【0055】
文例(2)は、文例(1)と同様に、ステップS1において"Yes"、ステップS2において"No"、ステップS4において"Yes"と判断されるが、ステップS5において"Yes"と判断されて、最終的には5W1Hタイプの疑問文であると判断される。
【0056】
文例(3)及び(4)は、それぞれ文例(1)及び(2)と同様に判断される。
【0057】
文例(5)は、ステップS1において"Yes"、ステップS2において"Yes"、ステップS6において"No"と判断され、最終的には肯定文であると判断される。
【0058】
文例(6)は、文例(1)と同様に、ステップS1において"Yes"、ステップS2において"Yes"と判断されるが、ステップS6において"Yes"と判断され、最終的にはYes−Noタイプの疑問文であると判断される。
【0059】
図2には、LFG(lexical-Functional Grammar)と呼ばれる文法理論に基づいて、上記の文例(4)に構文解析を施した場合の解析結果例を示している。LFGに基づく構文解析結果は、c−structure(constituent-structure)と呼ばれる(前述)。同図からも判るように、「誰が書いた」の部分が関係詞節として「本」に係っていることが示されている。
【0060】
また、図3には、同じくLFGに基づいて上記の文例(4)の構文解析結果に対してさらに意味解析を施した場合の解析結果例を示している。LFGに基づく意味解析結果は、f−structure(functional -structure)と呼ばれる(前述)。
【0061】
図3に示す例では、f−structure中の"INT+"という記述によってINTマークを表現している。INTマークは、疑問詞「誰」が疑問文であることを要請する機能が及んでいることを示している。「誰」が係る動詞句、並びに、「誰」が関係詞節に含まれる場合はその関係詞が係る名詞句が係る動詞句にもINTマークが付加される。f−structureは、構造解析及び意味解析が施された後の、関係詞句が判る構造で記述された文であることから、このようなINTマークの伝播処理が可能である。
【0062】
図示の例では、「誰」によって付加されたINTマークが文中の上位に伝播して、文全体に対してもINTマークが付加されていることが判る。
【0063】
上述したように、LFGの文法理論を利用する場合、INTマークをf−structureに埋め込むという文法ルールを記述することによって、本発明をより好適に実装することができる。
【0064】
本発明によれば、疑問文に対して精度の高い解析が可能となる。例えば、後続する処理として対話システムや質問応答システムを考えた場合、ユーザによる入力が非文法的文と判定された場合は、正確な意味をユーザに聞き返す、あるいは5W1Hタイプ又はYes−Noタイプの疑問文であると判定された場合は、タイプに応じた回答を生成するといった利用法が考えられる。
【0065】
本発明に係る自然言語処理システム又は自然言語方法によれば、入力文が疑問文であるか否かを高精度に判定することができるので、この疑問文の判定結果を対話システムに利用することによって質問応答を行なうことができる。
【0066】
図7には、本発明に係る自然言語処理を利用した対話システム10の機能構成を模式的に示している。この対話システム10は、音声入力部11と、音声認識部12と、形態素解析部13と、構文・意味解析部14と、文脈解析部15と、相槌処理部16とで構成される。
【0067】
音声入力部11は特定又は不特定の話者が話す音声を入力し、音声認識部12はこの入力音声を認識してテキスト形式のデータに変換する。勿論、入力文の入力方法は、音声に限定されるものではなく、手書き文字やテキスト・データがシステム10に入力されてもよい。
【0068】
形態素解析部13は、日本語など特定の言語に関する形態素ルールと形態素辞書を持ち、入力文を意味的最小単位である形態素に分節して品詞の認定処理を行なう。
【0069】
構文・意味解析部14は、文法ルールや結合価辞書などの辞書を持ち、文法ルールなどに基づく句構造の解析や、文中の語の語義や語と語の間の意味関係などに基づいて文が伝える意味を表現する意味構造の解析を行なう。そして、構文解析した結果として、単語や形態素などからなる文章の句構造を木構造として表したc−structureと、主語、目的語などの格構造に基づいて入力文を疑問文、過去形、丁寧文など意味的・機能的に解析した結果としてf−structureを出力する。
【0070】
本実施形態では、構文・意味解析部14内には、入力文が疑問文であるか否かを高精度に判定する疑問文判定部14Aを含んでいる。この疑問文判定部14Aは、入力文中で発見された疑問詞に対応する品詞カテゴリWに属する単語wの直後に単語wが文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPが存在するかどうかを判定して、該入力文中で単語wが疑問文であることを要請する機能が及ぶ最大範囲となる可能な最大句が文全体に及ぶか否かで入力文が疑問文か否かを判定するようになっている。すなわち、最大句が文全体に及ぶと判定された場合に入力文が疑問文であれば入力文が5W1Hタイプの疑問文であると判定し、判定結果が否定的であれば入力文が非文法的文であると判定する。
【0071】
また、疑問文判定部14Aは、入力文中で品詞カテゴリWに属する単語が発見されなかった場合、入力文中で単語wの直後に品詞カテゴリPに属する単語が発見された場合、並びに、最大句が文全体に及ばないと判定された場合には、さらに当該入力文全体が疑問文であるか否かを判定して、該判定結果が肯定的であれば入力文がYes−Noタイプの疑問文であると判定し、判定結果が否定的であれば入力文が肯定文であると判定する。また、入力文の末尾が疑問を表す終助詞又は疑問を表す記号で終わっているかによって疑問文であるか否かを判定する。
【0072】
文脈解析部15は、文の系列である文章(談話)を解析の基本単位とみなして、文間の意味的なまとまりを得て談話構造を構成する。
【0073】
相槌処理部16は、文脈解析結果を利用して入力文に対する相槌文を作成して、例えば音声形式で出力する。本実施形態では、相槌処理部16内には、疑問文に対する回答を生成する回答文作成部16Aを含んでいる。この回答文作成部16Aは、疑問文判定部14Aによって入力文がYes−Noタイプの疑問文であると判定された場合には、Yes−No形式を基調とする回答文を生成する。また、回答文作成部16Aは、入力文が5W1Hタイプの疑問文であると判定された場合には、問い合わされた事柄に対応した回答文を生成する。
【0074】
[追補]
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
【0075】
【発明の効果】
以上詳記したように、本発明によれば、文法ルールに従って日本語構文の意味解析を好適に行なうことができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
【0076】
また、本発明によれば、単に疑問詞の抽出に頼ることなく、入力された文が疑問文であるか否かを正確に判定することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
【0077】
また、本発明によれば、入力文が文法に従った正規の疑問文又は非文のいずれであるのか、Yes−Noタイプ又は5W1Hタイプいずれの疑問文であるのかを判定することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
【0078】
本発明によれば、疑問文に対して精度の高い解析が可能となる。例えば、後続する処理として対話システムや質問応答システムを考えた場合、ユーザによる入力が非文法的文と判定された場合は、正確な意味をユーザに聞き返す、あるいは5W1Hタイプ又はYes−Noタイプの疑問文であると判定された場合は、タイプに応じた回答を生成するといった利用法が考えられる。
【図面の簡単な説明】
【図1】入力文が疑問文であるかどうかを判定するための処理手順を示したフローチャートである。
【図2】LFGに基づいて構文解析を施した場合の解析結果例を示した図である。
【図3】LFGに基づいて意味解析を施した場合の解析結果例を示した図である。
【図4】LFGに基づく自然言語処理システム1の構成を模式的に示した図である。
【図5】入力文「私の娘は英語を話します。」を統語・意味解析部1により処理した結果として得られるf−structureを示した図である。
【図6】入力文「私の娘は英語を話します。」を統語・意味解析部1により処理した結果として得られるf−structureを示した図である。
【図7】本発明に係る自然言語処理を利用した対話システム10の機能構成を模式的に示した図である。
【符号の説明】
1…自然言語処理システム
2…形態素解析部
2A…形態素ルール,2B…形態素辞書
3…統語・意味解析部
3A…文法ルール,3B…結合価辞書
10…対話システム
11…音声入力部,12…音声認識部
13…形態素解析部
14…構文・意味解析部,14A…疑問文判定部
15…文脈解析部
16…相槌処理部,16A…回答文作成部

Claims (15)

  1. 入力文が疑問文であるかどうかを判定するための自然言語処理システムであって、
    入力文に疑問詞に対応する品詞カテゴリWに属する単語が含まれているかどうかを判断する第1の手段と、
    前記第1の手段により発見された単語wの直後に単語wが文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPが存在するかどうかを判定する第2の手段と、
    前記第2の手段の判定結果が肯定的であるときに、入力文中で単語wが疑問文であることを要請する機能が及ぶ最大範囲となる可能な最大句を抽出する第3の手段と、
    前記第3の手段により抽出された最大句が文全体に及ぶか否かで入力文が疑問文か否かを判定する第4の手段と、
    前記第4の手段により最大句が文全体に及ぶと判定された場合に入力文が疑問文であるかどうかを判定する第5の手段と、
    前記第1の手段により入力文中で品詞カテゴリWに属する単語が発見されなかった場合、前記第2の手段により入力文中で単語wの直後に品詞カテゴリPに属する単語が発見された場合、又は、前記第4の手段により最大句が文全体に及ばないと判定された場合に、当該入力文全体が疑問文であるか否かを判定する第6の手段と、
    を具備することを特徴とする自然言語処理システム。
  2. 入力文は関係詞句が分かる構造で記述された文である、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  3. 前記第3の手段は、単語wが係る動詞句、及び、単語wが関係詞節に含まれる場合はその関係詞が係る名詞句が係る動詞句を可能な最大句として抽出する、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  4. 前記第5の手段における判定結果が肯定的であれば入力文が5W1Hタイプの疑問文であると判定し、該判定結果が否定的であれば入力文が非文法的文であると判定する、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  5. 前記第6の手段における判定結果が肯定的であれば入力文がYes−Noタイプの疑問文であると判定し、該判定結果が否定的であれば入力文が肯定文であると判定する、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  6. 前記第5の手段又は前記第6の手段は、入力文の末尾が疑問を表す終助詞又は疑問を表す記号で終わっているかによって疑問文であるか否かを判定する、
    ことを特徴とする請求項1のいずれかに記載の自然言語処理システム。
  7. コンピュータを用いて構築される自然言語処理システムにおいて、入力文が疑問文であるかどうかを判定するための自然言語処理方法であって、
    前記コンピュータが備える第1の手段が、入力文に疑問詞に対応する品詞カテゴリWに属する単語が含まれているかどうかを判断する第1のステップと、
    前記コンピュータが備える第2の手段が、前記第1のステップにおいて発見された単語wの直後に単語wが文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPが存在するかどうかを判定する第2のステップと、
    前記コンピュータが備える第3の手段が、前記第2のステップにおける判定結果が肯定的であるときに、入力文中で単語wが疑問文であることを要請する機能が及ぶ最大範囲となる可能な最大句を抽出する第3のステップと、
    前記コンピュータが備える第4の手段が、前記第3のステップにおいて抽出された最大 句が文全体に及ぶか否かで入力文が疑問文か否かを判定する第4のステップと、
    前記コンピュータが備える第5の手段が、前記第4のステップにおいて最大句が文全体に及ぶと判定された場合に入力文が疑問文であるかどうかを判定する第5のステップと、
    前記コンピュータが備える第6の手段が、前記第1のステップにおいて入力文中で品詞カテゴリWに属する単語が発見されなかった場合、前記第2のステップにおいて入力文中で単語wの直後に品詞カテゴリPに属する単語が発見された場合、又は、前記第4のステップにおいて最大句が文全体に及ばないと判定された場合に、当該入力文全体が疑問文であるか否かを判定する第6のステップと、
    を具備することを特徴とする自然言語処理方法。
  8. 入力文は関係詞句が分かる構造で記述された文である、
    ことを特徴とする請求項7に記載の自然言語処理方法。
  9. 前記第3のステップでは、単語wが係る動詞句、及び、単語wが関係詞節に含まれる場合はその関係詞が係る名詞句が係る動詞句を可能な最大句として抽出する、
    ことを特徴とする請求項7に記載の自然言語処理方法。
  10. 前記第5のステップでは、判定結果が肯定的であれば入力文が5W1Hタイプの疑問文であると判定し、判定結果が否定的であれば入力文が非文法的文であると判定する、
    ことを特徴とする請求項7に記載の自然言語処理方法。
  11. 前記第6のステップでは、判定結果が肯定的であれば入力文がYes−Noタイプの疑問文であると判定し、判定結果が否定的であれば入力文が肯定文であると判定する、
    ことを特徴とする請求項7に記載の自然言語処理方法。
  12. 前記第5のステップ又は前記第6のステップでは、入力文の末尾が疑問を表す終助詞又は疑問を表す記号で終わっているかによって疑問文であるか否かを判定する、
    ことを特徴とする請求項1に記載の自然言語処理方法。
  13. 入力文が疑問文であるかどうかを判定するための自然言語処理をコンピュータ上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータに対し、
    入力文に疑問詞に対応する品詞カテゴリWに属する単語が含まれているかどうかを判断する第1の手順と、
    前記第1の手順を実行することにより発見された単語wの直後に単語wが文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPが存在するかどうかを判定する第2の手順と、
    前記第2の手順を実行して得られた判定結果が肯定的であるときに、入力文中で単語wが疑問文であることを要請する機能が及ぶ最大範囲となる可能な最大句を抽出する第3の手順と、
    前記第3の手順を実行することにより抽出された最大句が文全体に及ぶか否かで入力文が疑問文か否かを判定する第4の手順と、
    前記第4の手順を実行して最大句が文全体に及ぶと判定された場合に入力文が疑問文であるかどうかを判定する第5の手順と、
    前記第1の手順を実行して入力文中で品詞カテゴリWに属する単語が発見されなかった場合、前記第2の手順を実行して入力文中で単語wの直後に品詞カテゴリPに属する単語が発見された場合、又は、前記第4の手順を実行して最大句が文全体に及ばないと判定された場合に、当該入力文全体が疑問文であるか否かを判定する第6の手順と、
    を実行させることを特徴とするコンピュータ・プログラム。
  14. 問い合わせに対する回答を返す質問応答システムであって、
    ユーザから分を入力する入力手段と、
    入力文に疑問詞に対応する品詞カテゴリWに属する単語が含まれているかどうかを判断する第1の手段と、
    前記第1の手段により発見された単語wの直後に単語wが文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPが存在するかどうかを判定する第2の手段と、
    前記第2の手段の判定結果が肯定的であるときに、入力文中で単語wが疑問文であることを要請する機能が及ぶ最大範囲となる可能な最大句を抽出する第3の手段と、
    前記第3の手段により抽出された最大句が文全体に及ぶか否かで入力文が疑問文か否かを判定する第4の手段と、
    前記第4の手段により最大句が文全体に及ぶと判定された場合に入力文が疑問文であるかどうかを判定する第5の手段と、
    前記第1の手段により入力文中で品詞カテゴリWに属する単語が発見されなかった場合、前記第2の手段により入力文中で単語wの直後に品詞カテゴリPに属する単語が発見された場合、又は、前記第4の手段により最大句が文全体に及ばないと判定された場合に、当該入力文全体が疑問文であるか否かを判定する第6の手段と、
    前記第4乃至前記第6の手段のいずれかによって当該入力文が疑問文であると判定されたことに応答して、その回答文を作成して出力する第7の手段と、
    を具備することを特徴とする質問応答システム。
  15. コンピュータを用いて構築される質問応答システムにおいて、問い合わせに対する回答を返す質問応答方法であって、
    前記コンピュータが備える入力手段が、ユーザから文を入力する入力ステップと、
    前記コンピュータが備える第1の手段が、入力文に疑問詞に対応する品詞カテゴリWに属する単語が含まれているかどうかを判断する第1のステップと、
    前記コンピュータが備える第2の手段が、前記第1のステップにおいて発見された単語wの直後に単語wが文全体を疑問文とする効果を打ち消す働きを持つ助詞に対応する品詞カテゴリPが存在するかどうかを判定する第2のステップと、
    前記コンピュータが備える第3の手段が、前記第2のステップにおける判定結果が肯定的であるときに、入力文中で単語wが疑問文であることを要請する機能が及ぶ最大範囲となる可能な最大句を抽出する第3のステップと、
    前記コンピュータが備える第4の手段が、前記第3のステップにおいて抽出された最大句が文全体に及ぶか否かで入力文が疑問文か否かを判定する第4のステップと、
    前記コンピュータが備える第5の手段が、前記第4のステップにおいて最大句が文全体に及ぶと判定された場合に入力文が疑問文であるかどうかを判定する第5のステップと、
    前記コンピュータが備える第6の手段が、前記第1のステップにおいて入力文中で品詞カテゴリWに属する単語が発見されなかった場合、前記第2のステップにおいて入力文中で単語wの直後に品詞カテゴリPに属する単語が発見された場合、又は、前記第4のステップにおいて最大句が文全体に及ばないと判定された場合に、当該入力文全体が疑問文であるか否かを判定する第6のステップと、
    前記コンピュータが備える第7の手段が、前記第4乃至前記第6のステップのいずれかにおいて当該入力文が疑問文であると判定されたことに応答して、その回答文を作成して出力する第7のステップと、
    を具備することを特徴とする質問応答方法。
JP2002079632A 2002-03-20 2002-03-20 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム Expired - Fee Related JP3903820B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002079632A JP3903820B2 (ja) 2002-03-20 2002-03-20 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002079632A JP3903820B2 (ja) 2002-03-20 2002-03-20 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2003281137A JP2003281137A (ja) 2003-10-03
JP3903820B2 true JP3903820B2 (ja) 2007-04-11

Family

ID=29229023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002079632A Expired - Fee Related JP3903820B2 (ja) 2002-03-20 2002-03-20 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP3903820B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252382A (ja) * 2005-03-14 2006-09-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP5857648B2 (ja) * 2011-11-11 2016-02-10 富士通株式会社 受信メール分類装置、受信メール分類プログラム及び受信メール分類方法
CN106407198A (zh) * 2015-07-28 2017-02-15 百度在线网络技术(北京)有限公司 问答信息的处理方法及装置

Also Published As

Publication number Publication date
JP2003281137A (ja) 2003-10-03

Similar Documents

Publication Publication Date Title
US20050086047A1 (en) Syntax analysis method and apparatus
WO1999063456A1 (fr) Dispositif de preparation de regles de conversion du langage, dispositif de conversion du langage et support d'enregistrement de programme
WO2010046782A2 (en) Hybrid machine translation
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
JPH05189481A (ja) 翻訳用コンピュータ操作方法、字句モデル生成方法、モデル生成方法、翻訳用コンピュータシステム、字句モデル生成コンピュータシステム及びモデル生成コンピュータシステム
KR101409413B1 (ko) 단일화 문법을 이용한 자연어 처리 방법
JP4033011B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3903820B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005284723A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4039282B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2018010481A (ja) 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972699B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005092616A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033088B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4114580B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4289822B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972698B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Kim A dialogue-based NLIDB system in a schedule management domain
Bosch et al. Software Tools for Morphological Tagging of Zulu Corpora and Lexicon Development.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061024

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070101

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120119

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120119

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130119

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130119

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140119

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees