JP2003263428A - 文型との照合による意味解釈方法、装置、当該方法の実行コンピュータプログラム、及び当該方法の実行コンピュータプログラムを記録した記憶媒体 - Google Patents

文型との照合による意味解釈方法、装置、当該方法の実行コンピュータプログラム、及び当該方法の実行コンピュータプログラムを記録した記憶媒体

Info

Publication number
JP2003263428A
JP2003263428A JP2002062791A JP2002062791A JP2003263428A JP 2003263428 A JP2003263428 A JP 2003263428A JP 2002062791 A JP2002062791 A JP 2002062791A JP 2002062791 A JP2002062791 A JP 2002062791A JP 2003263428 A JP2003263428 A JP 2003263428A
Authority
JP
Japan
Prior art keywords
sentence
sentence pattern
case
semantic
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002062791A
Other languages
English (en)
Inventor
Hisaaki Tajima
久彰 田島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002062791A priority Critical patent/JP2003263428A/ja
Publication of JP2003263428A publication Critical patent/JP2003263428A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 自然言語を用いた計算機とのインターフェー
スを目的として自然言語文を解釈するため、名詞の意味
属性分類を用いて文型及び意味を規定する辞書を検索し
て文型を識別し、自然言語文を計算機で解釈可能な形式
表現とする。 【解決手段】 インターフェース部5から入力された自
然言語文を文解析部1で用語辞書41を用いて形態素解
析し、述語部と格要素を抽出し、単文(原文)に分解す
る。文型識別部2では、述語の用言をキーワードにして
構文辞書42の文型辞書を検索し、原文の格要素と規定
条件が一致する文型を選び出す。ここで複数の文型が選
ばれた場合には、文型の絞り込みを行う。ついで文型識
別部2は、各格要素の格種別を判定する。最後に、変換
部3で、確定した文型に基づいて、入力された自然言語
文を文型の意味を機械的に解釈可能に形式化したLP形
式の表現に変換する。このLP形式の表現により、計算
機での解釈が可能となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自然言語を用いた
計算機(コンピュータ)とのインターフェースを目的と
して自然言語文の解釈を行うため、名詞の意味属性分類
を用いて文型及び意味を規定する辞書類を構成し、それ
を用いて文型を識別し、自然言語文を解釈する方法及び
装置に関する。
【0002】
【従来の技術】自然言語文の意味解釈では、通常、用語
を意味属性により分類した用語辞書、文型を規定した構
文辞書などの辞書類を利用した形態素解析、構文解析、
文型照合などの技術を用いる。特に、文型規定と文型照
合は意味解釈に特有の技術であるが、多くの課題が残っ
ている。
【0003】用語辞書として古くは、分類語彙表(国立
国語研究所)があり、大規模な辞書として、EDR電子
化辞書(日本電子化辞書研究所)、日本語語彙体系(N
TTコミュニケーション科学研究所)などがあるが、用
語を分類する統一的な観点が無いことや用語が意味的に
連続していて一意的な区別が出来ないなどの技術的な問
題があるため、辞書として決定的なものがない。
【0004】構文辞書としては、用言の文型を表層構造
に基づく結合価文法を用いて規定した日本語計算機用辞
書IPAL、日本語語彙体系などがある。また、これら
を利用して、機械翻訳などの自然言語処理が行われてい
る。結合価文法による文型規定では格要素の規定に名詞
の意味を使用するが、名詞の意味分類は比較的簡単なも
の(数十種類程度)が用いられていた。簡単な意味属性
分類では正確な翻訳は難しく、詳細な意味属性分類を用
いる方法(日本語語彙体系)が提案されている。何れに
しても、翻訳を目的とした規定では元となる言語の表現
と翻訳先の言語の表現の対応付けに主眼があり、必ずし
も意味的な区分を必要としないので、表層構造に着目し
た文型規定が用いられている。しかし、文の意味は、文
中での格要素の文法的な役割ではなく意味的な役割に依
存することから、深層構造に基づく情報を必要とし、結
合価文法による文型規定では不十分である。
【0005】深層格の情報を含む辞書としてはEDRの
概念記述辞書がある。しかし、概念記述辞書では用言に
かかる体言と用言の意味的関係(概念関係子)を規定
し、文型を直接的には規定していない。さらに、文型と
文の意味を対応付けた辞書がない。
【0006】自然言語文の文型識別のための文型照合に
おいては、用語の多義性、表現の多様性、文型規定の曖
昧性などのため対応する文型を一意に識別することが非
常に難しい。電子化辞書やコーパスを利用した文型の判
定、事例を用いた文型の判定など多くの方法が提案され
ているが、自然言語文の意味解釈を統一的に行う方法は
確立されていない。
【0007】
【発明が解決しようとする課題】自然言語文の解釈に
は、用語の多義性や統語的(構文的)な曖昧さに対応で
きる用語辞書、構文辞書などの辞書類の作成とそれらを
用いた解釈方法の確立が必要である。
【0008】本発明の課題は、用語の多義性、分類の曖
昧さに対処するために、用語を意味属性により分類する
だけ(既存の用語辞書)ではなく、分類の意味や相互関
係についての情報を付加した辞書を作成すること、文型
に基づく意味解釈を可能とするために、深層格を主体と
し、用語辞書の分類に基づいた文型の規定とその文型の
意味を機械的に解釈可能なように形式化した文表現を対
応付けた構文辞書を作成すること、用語の多義性あるい
は分類の曖昧さ、構文的な曖昧さなどに起因する文型照
合上の問題((1)与えられた自然言語文に対応する文
型が複数となることがある。つぎに、(2)文型内での
格要素の識別が一意に定まらないことがある)に、上記
の用語辞書、構文辞書を用いて対処した方法及び装置で
あって、自然言語を用いた計算機とのインターフェース
を目的とした、自然言語文を解釈する方法及び装置を提
供することである。
【0009】
【課題を解決するための手段】上記の課題を解決するた
め、本発明は、入力された自然言語文を用語辞書を用い
て形態素解析して、述語部と格要素を抽出し単文に分解
する第一手順と、該述語部の用言に基づいて構文辞書を
検索し該格要素と規定条件が一致する文型を選び出して
文型を確定する第二手順と、該格要素それぞれの格種別
を判定する第三手順と、該確定した文型と該格種別に基
づいて、入力された自然言語文を文型の意味の形式化表
現に変換する第四手順と、を有することを特徴とする文
型との照合による意味解釈方法を手段とする。
【0010】あるいは、前記第二手順では、述語の格要
素を深層格と名詞の意味属性分類で規定した文型及びこ
の文型に対応する意味を規定した構文辞書(A)を用い
ることを特徴とする文型との照合による意味解釈方法を
手段とする。
【0011】あるいは、前記第一手順では、述語の格要
素を深層格と対応する名詞の意味属性分類の複数の分類
項目への帰属関係で規定した用語辞書(B)を用いるこ
とを特徴とする文型との照合による意味解釈方法を手段
とする。
【0012】あるいは、前記第一手順では、名詞の意味
属性分類において分類相互の意味的な関係を規定した用
語辞書(C)を用いることを特徴とする文型との照合に
よる意味解釈方法を手段とする。
【0013】あるいは、前記第二手順では、自然言語文
の格要素を構成する名詞の意味属性分類への帰属関係を
基に、構文辞書(A)の文型を検索し、前記第四手順で
は、該当する意味規定により当該自然言語文を規定され
た形式に変換することを特徴とする文型との照合による
意味解釈方法を手段とする。
【0014】あるいは、前記第二手順では、自然言語文
の格要素を構成する名詞の意味属性分類判定において、
当該名詞が複数の意味分類に対応する場合、(B)また
は(C)の用語辞書による規定を用いて、対応する文型
を判定して選び出すことを特徴とする文型との照合によ
る意味解釈方法を手段とする。
【0015】あるいは、前記第二手順では、自然言語文
の格要素を構成する名詞の意味属性分類を基に、構文辞
書(A)の文型規定の検索において複数の文型が対応す
る場合、(B)または(C)の用語辞書による規定を用
いて、対応する文型を絞り込むことを特徴とする文型と
の照合による意味解釈方法を手段とする。
【0016】また、本発明は、入力された自然言語文を
用語辞書を用いて形態素解析して、述語部と格要素を抽
出し単文に分解する文分解部と、該述語部の用言に基づ
いて構文辞書を検索し該格要素と規定条件が一致する文
型を選び出して文型を確定し、該格要素それぞれの格種
別を判定する文型識別部と、該確定した文型と該格種別
に基づいて、入力された自然言語文を文型の意味の形式
化表現に変換する変換部と、を有することを特徴とする
文型との照合による意味解釈装置を手段とする。
【0017】あるいは、前記構文辞書として、述語の格
要素を深層格と名詞の意味属性分類で規定した文型及び
この文型に対応する意味を規定した構文辞書(A)を用
いることを特徴とする文型との照合による意味解釈装置
を手段とする。
【0018】あるいは、前記用語辞書として、述語の格
要素を深層格と対応する名詞の意味属性分類の複数の分
類項目への帰属関係で規定した用語辞書(B)を用いる
ことを特徴とする文型との照合による意味解釈装置を手
段とする。
【0019】あるいは、前記用語辞書として、名詞の意
味属性分類において分類相互の意味的な関係を規定した
用語辞書(C)を用いることを特徴とする文型との照合
による意味解釈装置を手段とする。
【0020】あるいは、前記文型識別部は、自然言語文
の格要素を構成する名詞の意味属性分類への帰属関係を
基に、構文辞書(A)の文型を検索するものであり、前
記変換部は、該当する意味規定により当該自然言語文を
規定された形式に変換するものであることを特徴とする
文型との照合による意味解釈装置を手段とする。
【0021】あるいは、前記文型識別部は、自然言語文
の格要素を構成する名詞の意味属性分類判定において、
当該名詞が複数の意味分類に対応する場合、(B)また
は(C)の用語辞書による規定を用いて、対応する文型
を判定して選び出すものであることを特徴とする文型と
の照合による意味解釈装置を手段とする。
【0022】あるいは、前記文型識別部は、自然言語文
の格要素を構成する名詞の意味属性分類を基に、構文辞
書(A)の文型規定の検索において複数の文型が対応す
る場合、(B)または(C)の用語辞書による規定を用
いて、対応する文型を絞り込むものであることを特徴と
する文型との照合による意味解釈装置を手段とする。
【0023】あるいは、上記の文型との照合による意味
解釈方法における手順を、コンピュータに実行させるた
めのプログラムとしたことを特徴とする文型との照合に
よる意味解釈方法の実行コンピュータプログラムを手段
とする。
【0024】あるいは、上記の文型との照合による意味
解釈方法における手順を、コンピュータに実行させるた
めのプログラムとし、該プログラムを、該コンピュータ
が読み取りできる記憶媒体に記録したことを特徴とする
文型との照合による意味解釈方法の実行コンピュータプ
ログラムを記録した記憶媒体を手段とする。
【0025】本発明では、入力された自然言語文の格要
素の名詞を意味属性により分類し、この分類に基づいて
文の格要素を規定した文型と解釈対象の文を照合し、文
型で規定された意味をもとに、文の意味を機械的に解釈
できる形式化した表現に自然言語文を変換することによ
り、計算機とのインターフェースに自然言語を用いるこ
とを可能とし、計算機の操作に慣れない人などに対して
計算機利用の利便性を向上させる。
【0026】
【発明の実施の形態】以下、本発明の実施の形態につい
て図を用いて詳細に説明する。
【0027】始めに、本発明の原理を説明する。
【0028】自然言語文の解釈は、対象となる自然言語
文の形態素解析、構文解析、意味解釈の順に行う。
【0029】自然言語で表現される対象は極めて広範で
あり、表現方法も多様であるため、汎用的な意味解釈の
方法を確立することは難しい。本発明で対象とする自然
言語文は計算機とのインターフェースを行う文に限定す
る。すなわち、計算機とのインターフェースを行う文
は、極端に複雑な文はなく比較的簡単な文であると考え
て良いので、信念文や引用文を除外でき、複文中の単文
は入れ子構造で、交叉はないなどを前提とできる。この
前提の下に、自然言語文を形態素解析(既存の技術を用
いる)し、述語と格要素を識別して単文の論理的結合に
分解する(特願2000−353108参照)。元の自
然言語文の意味は、得られた単文(以下、原文)の意味
を解釈することに帰着できる。原文の意味を解釈するこ
とに関しては、先に述べたような問題があるので、これ
らの問題に対処できる辞書類の作成及び文型の識別方法
を以下に示す。
【0030】まず、名詞の意味分類の方法を示す。
【0031】名詞を意味属性により分類した辞書は既に
各種存在し、それぞれに特徴はあるが基本的には類似し
た内容を持つ。基本的な部分に関しては既存の辞書を利
用できる。ここでは一例として、詳細な名詞の意味属性
分類である日本語語彙体系(以下、語彙辞書)をベース
とし、これに意味情報を付加した用語辞書を作成する方
法を示す。
【0032】語彙辞書の名詞意味属性体系は木構造をな
す。以下の説明のために、名詞種別のノード名を表1に
示すように表現する。
【0033】
【表1】
【0034】名詞の意味属性分類の観点が多様であるこ
とや名詞に多義性があることから、一つの用語が複数の
ノードに帰属することがある。用語の意味属性は所属す
るノードから判定できるが、複数のノードに所属する用
語(多重帰属語)の意味と所属するノードとの関係は多
様である。この関係は語彙辞書には規定されていない
が、本発明の用語辞書にはこれを含める。多重帰属語の
意味は、ノードヘの帰属状態に応じてほぼ決まってい
る。これを、A:一つの対象に対応、B:異なる具体物
に対応、C:異なる抽象物に対応、D:具体物と抽出物
に対応の4つに分類して規定する。例を表2に示す。
【0035】
【表2】
【0036】Aの場合は、一つの対象に対し、複数の意
味分類上の観点(前提的な意味と本来的な意味など)が
あり複数のノードに対応するものである。Aの場合、文
型規定において用語の多重帰属を規定(これは用語を意
義素により定義することに該当)することで用語の意味
の曖昧さを軽減する。B,Cの場合は、一つの用語が二
つの対象に対応する。すなわち多義語である。Dの場合
は、一つの用語が具体物と抽出物に対応する。具体物と
抽象物が、具体物とその性質、行為とその対象、行為と
その結果など意味的に関連する場合Daと、全く無関係
な場合Db(多義語)がある。多重帰属語の意味分類情
報を用いて文型を規定する。また、文型照合における判
定情報とする。3つ以上のノードに帰属する用語も多数
有るが、2つの場合の組み合わせとして解釈する。
【0037】名詞の用法として、(1)具体的な対象の
表現(指示機能)、(2)一般的な対象の表現(概念
非)の2つがある。一般的にはこの区別は文あるいは文
脈に依存し、名詞単体では区別できない。しかし、抽象
的な用語ではこの区別が可能なものがある。この区別を
(1)はva、(2)はgcとして用語分類に追加す
る。例を表3に示す。
【0038】
【表3】
【0039】つぎに文型の規定方法を示す。図4に文型
規定の形式を示す。文型は、(1)用言名を見出しと
し、(2)その用言がとる格要素の集合、(3)補足的
情報、(4)その文型の意味の形式化表現で表す。
【0040】
【表4】
【0041】(1)見出し語は用言の終止形とする。
【0042】(2)格要素は格種別を深層格で、その名
詞種別を用語辞書のノード名で表す。深層格により規定
するので格助詞の役割は少ないが、代表的な格助詞をこ
れに追加する。すなわち、格要素は(格種別、名詞種
別、格助詞)の組の集合で規定する。従来の文型規定
(例を表5に示す)では、上位ノードあるいはデフォル
トによる規定が多数用いられている。格要素をデフォル
トあるいは上位ノードにより規定することで文型照合時
の適合率は向上するが意味的な曖昧さは増大する。本発
明では、文型と意味の形式化表現を対応させるため、意
味の相違があるものを区別するので、デフォルトによる
指定は行わない。原則的には可能な限り下位ノードによ
り指定する。下位ノードによる規定が広範に及ぶ場合は
上位ノードにより規定する。また、表2の意味分類Aに
該当する多重帰属語の場合、複数のノードヘの帰属を規
定する。
【0043】
【表5】
【0044】(3)補足的な情報として、用言の品詞、
文型の属性、文型の意味種別を加える。品詞は形容詞、
動詞である。文型の属性は特別の解釈方法が必要な場合
(比喩、慣用句など)を示す。比喩、慣用句などは語彙
辞書では個別の用語で規定されている。慣用表現や比喩
と一般的な表現の区別は微妙である。本方法では、個別
表現は、格要素となる名詞の意味が、意味分類の中に含
まれない場合のみとする。これにより文型規定と名詞分
類の不整合を防ぐと同時に文型規定の幅を広げることが
できる。文型の意味種別は文の意味の大分類(状態、属
性、関係など)を示す。
【0045】(4)文型の意味の形式化表現を述語論理
の論理式形式(Logical Presentati
on:LP形式)で示す。用言は単独では意味を確定で
きないので、文型として意味分類を行う。厳密に言えば
用言毎に意味が異なる訳であるが、意味的な類型により
範疇化する。この範疇化に応じて述語分類を行う。例え
ば、上位語・下位語関係ISA、全体・部分関係PT
O、大小関係BIG、物理的移動MOVEpなど。LP
形式及び文型の意味分類の例を表6に示す。表4の形式
に基づく文型の例を表7に示す。
【0046】
【表6】
【0047】
【表7】
【0048】次に、以上の情報を含む用語辞書と文型規
定を用いて文型を識別する方法を示す。
【0049】文型の識別は原文の格要素の名詞種別と文
型の名詞種別の照合により行う(付属する助詞の情報は
この段階では用いない)。複数の文型と一致するのは、
(1)上位ノードにより格要素が規定されている、
(2)使われている用語が多重帰属語である、(3)同
じ文型がある(同一の格要素の組み合わせで意味が異な
る)の3つの場合であり、その他に(4)原文で格要素
が省略されているなど原文と文型で規定されている格要
素の種別が異なる場合に文型照合での不一致が起こる。
【0050】文型の識別ではまず、用語辞書を検索して
原文の格要素の名詞種別を得る。この際、格要素を構成
する名詞が多重帰属語であるか否かも判定する。ついで
原文の述語をキーワードとして文型辞書を検索し、原文
と文型条件が一致した文型を取り出す。複数の文型が得
られた場合、それらの文型の相互関係は、格要素の規定
を比較し上位ノードによる規定か同じ文型なのか判定す
る。すなわち文型照合の過程で複数の文型と一致する要
因が、(1),(2),(3)あるいはこれらの複合の
何れであるかを判定する。文型照合において複数の文型
が得られた場合、その要因に応じた絞り込み方法をつぎ
に示す。
【0051】(1)の場合の文型の格要素と原文の格要
素の関係を表8に例示する。デフォルトによる格要素の
指定が無いことより(1)となるのは文型が包含関係に
ある場合のみである。従って、下位ノードによる規定を
優先させることにより絞り込みを行う。
【0052】
【表8】
【0053】(2)多重帰属語の場合に複数文型と一致
する例をつぎに示す。原文の格要素x1が、ノードm
x,myに帰属するとすると、表8の(2)でmx∈A
かつmy∈Bならば文型A,Bともに一致する。要する
に、多重帰属語を含む場合は、複数文型との一致はどの
文型でも起こり得るので、文型の特徴からの絞り込みは
難しい。そこで、多重帰属語であることとその意味種別
により文型照合結果を判定する。多重帰属語はその帰属
状態に応じて表2に示す意味を持つ。多重帰属語が表2
の分類Aの場合、文型規定の多重帰属の指定により複数
文型との一致を回避できる。また、1つの対象であるこ
とから文型の意味規定(表4(4))が同じである可能
性が高いので、これをチェックし、同じならば一つの意
味に帰着する。表2の分類B,CまたはDbの場合、用
語の多義が原因で、更なる絞り込みには文脈情報などが
必要である。分類Daの場合、原文の意味も曖昧で、得
られた文型が同じような意味を持つので、一致した文型
による意味を共に採用する(絞り込みはしない)。以上
より、多重帰属語の意味分類情報を用いることで少なく
とも文型照合での曖昧さの要因は判定できる。なお、3
つのノードに帰属する多重帰属語は、一つの対象を表す
ものから三つの対象を表すものまである。二つのノード
の組み合わせ(3通り)について表2をチェックする。
4つ以上のノードに帰属する多重帰属語は個別に二重帰
属以下の組み合わせに展開する。多数のノードに帰属す
る用語は数は少ないが、日常的に多様な表現で用いられ
るので個別に対処する方が効率的である。
【0054】(3)同一文型の場合は絞り込みの方法が
ない。文脈などから判定することになる。ただし、本発
明の文型規定では、デフォルトによる指定を行わないの
で規定が詳細化され、同一文型になる場合は少ない。
【0055】(4)原文の格要素が省略されると、文型
で規定された格要素数より原文の格要素数が少なくなる
ため、本来、一致する筈の文型を得ることが難しくな
る。また、文型規定で規定する格要素は述語に対する補
充成分を対象とし、修飾成分は含まないことより、原文
の格要素に修飾成分が含まれると、原文での格要素の省
略とは逆に、原文の格要素数が文型で規定された格要素
より多くなる。述語によって補充成分となる格種別と修
飾成分となる格種別は異なる。要するに、文型で規定さ
れた格要素と原文の格要素との対応関係は常に一対一で
あるとは限らない。さらに、原文に省略があるか否かを
判定する一般的な方法が無いことなどから、文型照合に
は、大きな不確定性があり、従来の方法では殆ど対処が
出来ない。本発明では文型を深層格と名詞の意味属性分
類で規定したことを利用して、この問題に以下の方法で
対処する。
【0056】原文の格要素数と等しい格要素を持つ文型
との照合に失敗したら、原文より格要素数の多い文型に
ついて、文型側のagent,a−objectが未対
応でも一致文型とする(一般的に、原文で省略可能な格
要素は主にagent,a−objectである)。さ
らに、a−objectが対象の属性(表3のmk3の
gc)で、そのcomplementが属性値(表3の
mk3のva)の場合、対象あるいは属性(gc)の一
方が省略されることが多いが、gcとvaの組み合わせ
情報からgcを推定する。また、文型と不一致の格要素
の名詞種別が時間(mk39)や場所(mk38,mm
2)で、文型規定にtimeやplaceを含まなけれ
ば、時間や場所に関わる名詞(mk39、,mk38,
mm2に属す)を含む格要素を除外して文型照合を行
う。要するに、原文と格要素数が一致する文型から照合
を始め、不一致の格要素の格種別あるいは名詞種別によ
り文型あるいは原文の格要素を増減して、原文の格要素
と条件が合う文型を見つけ出す。
【0057】従来の文型規定ではデフォルトによる規定
(表5)が多く、格要素の対応付けは格助詞により識別
することになる。しかし、格助詞と格種別の関係は一意
ではなく、また格助詞ではなく係助詞が使われることも
あり、意味的に曖昧さが残る。デフォルトによる指定を
行わず、格要素の名詞の意味属性分類への帰属状態まで
用いた文型照合により、この曖昧さを解消できる。ただ
し、同じ名詞種別が異なる格要素に対応する場合は、付
属する格助詞により格種別と対応する名詞をを識別する
(修飾成分の格要素以外では、同じ格助詞または係助詞
が付くことはない。修飾成分の場合、名詞種別で格種別
を判定する。)。
【0058】以上により文型とその格要素の名詞が確定
する。文型の意味情報の格種別に対応する名詞を当ては
めることで原文をLP形式へ変換できる。LP形式の表
現は一階述語論理の論理式と同じ表現なのでProlo
gによる処理が可能である。また、格種別が確定してい
るのでその解釈方法を予め規定することが出来、原文の
真偽の判定や簡単な推論への道が開ける。
【0059】続いて、本発明の実施形態例を示す。
【0060】本発明による用語規定及び文型規定と、そ
れを用いた文型の照合による自然言語文の意味解釈シス
テムの構成例と、そこにおける処理の例を以下に示す。
【0061】図1に本発明によるシステム構成例を示
す。本システムは、文解析部1、文型識別部2、変換部
3とこれらの各部で使用する用語情報を記載した辞書部
4(用語辞書41、構文辞書42)、及び自然言語文を
入力するインターフェース部5で構成する。
【0062】用語辞書41の構成例を図2に示す。単語
辞書は形態素解析ツールで使用するもので、形態素解析
ツールとセットで既存のものを使う。名詞の意味属性体
系は、表1に示す語彙辞書に準じた木構造で、mk3配
下のノードなどには表3に示す細分類を加える。なお、
木構造を上下何れの方向にも辿れるように図2中の2の
表現形式に示すようにノード名の他にノードの位置情報
を含める。多重帰属語意味分類表は2つのノードに帰属
する場合の代表的な意味を示すもので、表2はその例で
ある。
【0063】構文辞書42の構成例を図3に示す。文型
辞書は用言とその格要素(深層格)、意味(LP形式)
などを表4の形式で規定した辞書で、表7は文型辞書に
おける文型規定の一例である。述語分類辞書はLP形式
による文表現とその解釈方法を規定した辞書で、表6は
その一例である。従来の方法による文型規定と本発明に
よる文型規定との対応例を表5と表7で示す。表5の
(2−1)は表7の(1−1)に、表5の(2−2)は
表7の(1−2)、(1−3)に対応する。表5の(2
−3)はデフォルトによる指定で、表7(1−4)以降
の文型に対応する。デフォルトによる指定では、文の意
味を確定できない。デフォルトによる指定を止め、意味
属性分類により指定することで文の意味を確定出来る。
【0064】図4は、本発明のシステムにおける処理の
一例を示す。インターフェース部5から入力された自然
言語文を文解析部1で用語辞書41を用いて形態素解析
し、述語部と格要素を抽出し、単文(原文)に分解す
る。文型識別部2では、述語の用言をキーワードにして
構文辞書42の文型辞書を検索し、原文の格要素と規定
条件が一致する文型を選び出す。複数の文型が選ばれた
場合には、文型の絞り込みを行う。ついで各格要素の格
種別を判定する。最後に、変換部3で、確定した文型に
基づいて、入力された自然言語文をLP形式の表現に変
換する。LP形式の表現により、計算機での解釈が可能
となる。以下に処理例の詳細を説明する。
【0065】文解析部1の処理は既存の自然言語処理技
術を用いて実現する。
【0066】文型識別部2では、本発明の辞書部4を用
いて原文と文型の照合を行う。その実施形態例を説明す
る。以下の説明で用いる原文X及び文型Biの格要素の
表記方法を表9に示す。図5に文型照合及び絞り込み処
理の流れを示す。
【0067】
【表9】
【0068】文解析部1で得られた原文からその格要素
の名詞xkを取り出す。xkで用語辞書(意味属性分類
体系)41を検索し、xkが帰属するノード名を得る。
xkが多重帰属語の場合は複数(kw個)のノード名が
得られる。原文の全ての格要素(s個)の名詞について
帰属するノード名を取得する。Xの格要素の名詞が帰属
するノード名の組み合わせXKを作成する。XKの要素
XK−iは各格要素に一つのノード名を対応させたもの
である。XKの要素数wsは各格要素のxkが帰属する
ノード数の積になる。
【0069】つぎに{XK−i}と文型の比較を行う。
この処理の流れを図6に示す。Xの述語Pxで構文辞書
(文型辞書)42を検索し、文型{Bi|1≦i≦w}
を得る。ただし、見出しPxを持つ文型数をvxとす
る。{Bi}の中から格要素数がs個の文型を選び出
し、その文型についてそこに規定されているそれぞれの
格要素をXK−iと比較し、格要素の条件を満たす組み
合わせを見つけ出す(格要素照合)。格要素を照合する
方法の例を図7に示す。格要素の照合は文型に規定され
るノード名(またはノード名の条件)と原文のノード名
が完全に一致するものをまず識別し、ついで文型に規定
されるノード名(またはノード名の条件)に原文のノー
ド名が包含されるものを識別する。xkが文型の条件に
包含されなければ、その文型Biは原文Xとは不一致と
して、文型Biについての照合を終了する。図7の操作
をXKの全ての項について行う。この結果より一致する
文型数MBと一致したXKの数MXKを得、表10によ
り判定する。
【0070】
【表10】
【0071】表10の判定で(5)(格要素が一致する
文型が見つからない)の場合は、表11(1)の判定を
行う。表11(1)は原文が修飾成分の格要素を含むか
否かのチェックで、表11(1)ア)なら修飾成分があ
るので、その格要素を除外し、図8のAに従って文型照
合を行う。表11(1)イ)なら修飾成分は無く、原文
に格要素の省略が有る場合で、図8のBに従って文型照
合を行う。図18による照合結果は、表11(2)また
は(3)により判定する。
【0072】
【表11】
【0073】表10の判定で(3),(4)(XK−i
が複数の文型と一致する)の場合は、文型規定に包含関
係があるか同一の文型があるかであり、表12の方法で
格要素のチェック及び絞り込みを行う。
【0074】
【表12】
【0075】表10の判定が(1),(2)ならば文型
が確定する。
【0076】文型を確定するまでには図6あるいは図8
の照合処理と表10、表11による結果判定を繰り返
す。この過程を図9にまとめて示す。
【0077】例文(表13)を用いて文型識別の過程を
説明する。
【0078】
【表13】
【0079】文解析部1(図4)の処理結果より例文1
の格要素をなす名詞xkは「xk−1=夕食」、「xk
−2=魚」(表14)である。
【0080】
【表14】
【0081】例文で用いられている名詞は意味属性分類
体系(表1)の下位ノードに属し、表1上では省略され
ているので、関連する部分を表15に示す。
【0082】
【表15】
【0083】「夕食」、「魚」で意味属性分類体系を検
索(図5)すると、表15より「夕食」、「魚」の帰属
先のノード(表16)が分かる。
【0084】
【表16】
【0085】何れも多重帰属語である。表2より「魚」
は多重帰属の意味分類A、「夕食」はDaである。照合
すべき格要素の組は表16より[mk21d2,mm3
22e2]と[mm311,mm322e1]の組み合
わせ(図5)で、表17(1)となる。例文1の格要素
数は2で、述語pxは「出る」である。この条件で文型
辞書(表7)を検索する(図6)と、表7の(2−5)
と格要素の組(mm322e1,mk21d2)の条件
が一致する。条件を満たすのはこれだけなので図表10
の(1)が該当し、文型が確定する。例文1の場合と同
様にして、例文2では述語pxは[出る」、格要素数は
2、格要素の組み合わせは表17(2)である。
【0086】
【表17】
【0087】例文2の格要素は表7の格要素数2のどの
文型の条件とも合わず、表10(5)が該当する。そこ
で表12(1)の判定を行うと、表12(1)ア)と合
致する。図8のAに進む。格要素数が1の文型の条件も
満たさないので表12(3)イ)となり、γ=2として
図8のAのパスから表12(3)ウ)となる。条件を満
たす格要素の組はXK1[mk3913,mk21d
2],XK3[mk3921、mk21d2]で、表1
0の(2)となる。mk3913とmk3921は表2
よりA分類なのでXK1とXK3の区別はしなくてよ
い。
【0088】変換部3(図4)では確定した文型につい
て、格種別と名詞の対応付けを行い、原文に対応するL
P形式表現を作成する。格種別と名詞の対応付けの処理
の流れを図10に示す。各格要素の名詞種別が異なれ
ば、名詞種別に応じて格と名詞の対応付けは一意に定ま
る。格要素に同じ名詞種別がある場合、格の補助情報に
ある格助詞で対応付けを判定する。原文の格要素が係助
詞を伴う場合、格助詞を伴う格要素の格を先に定め、残
りの格を係助詞を伴う格要素とする。格助詞による判定
ができない場合、名詞の意味属性から判定する。その判
定規則の例を表18に示す。
【0089】
【表18】
【0090】以上により文型とその格要素の名詞が決ま
るのでLP形式にこれを当てはめることで原文をLP形
式に変換できる。
【0091】表13(1)の例文は、表7の(2−5)
と一致するので、object=「魚」、comple
ment=「夕食」である。文の意味はLP形式よりS
ERVED(魚、夕食)が得られる。表13(2)の例
文と条件が合う文型も、表7の(2−5)であるが、o
bject=「−」、comp1ement=「食事」
で、mk39の下位ノードに属する格要素があることか
ら修飾成分timeを伴う文と判定できる。文の意味と
してはSERVED(−、食事、time<昼>)が得
られる。以上より表13の例文は表19に変換できる。
【0092】なお、図1で示した装置における各部の一
部もしくは全部の機能をコンピュータ(計算機)のプロ
グラムで構成し、そのプログラムをコンピュータを用い
て実行して本発明を実現することができること、あるい
は、図4〜図10で示した処理の手順をコンピュータの
プログラムで構成し、そのプログラムをコンピュータに
実行させることができることは言うまでもなく、コンピ
ュータでその機能を実現するためのプログラム、あるい
は、コンピュータにその処理の手順を実行させるための
プログラムを、そのコンピュータが読み取り可能な記憶
媒体、例えば、FD(フロッピーディスク(登録商
標))や、MO、ROM、メモリカード、CD、DV
D、リムーバブルディスクなどに記録して、保存した
り、配布したりすることが可能である。また、上記のプ
ログラムをインターネットや電子メールなど、ネットワ
ークを通して提供することも可能である。
【0093】
【発明の効果】本発明によれば、計算機とのインターフ
ェースに自然言語を用いることが可能となり、計算機の
操作に慣れない人などにとって計算機利用の利便性を向
上させることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態例を示す構成図
【図2】本実施形態例における用語辞書の構成図
【図3】本実施形態例における構文辞書の構成図
【図4】本実施形態例における処理の概要を示す図
【図5】本実施形態例における文型照合、絞り込み処理
の流れを示す図
【図6】本実施形態例における格要素チェック(1)の
処理の流れを示す図
【図7】本実施形態例における格要素照合処理の流れを
示す図
【図8】本実施形態例における格要素チェック(2)の
処理の流れを示す図
【図9】本実施形態例における文型照合過程の処理の流
れを示す図
【図10】本実施形態例における格要素の確定処理の流
れを示す図
【符号の説明】
1…文解析部 2…文型識別部 3…変換部 4…辞書部 41…用語辞書 42…構文辞書 5…インターフェース部

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 入力された自然言語文を用語辞書を用い
    て形態素解析して、述語部と格要素を抽出し単文に分解
    する第一手順と、 該述語部の用言に基づいて構文辞書を検索し該格要素と
    規定条件が一致する文型を選び出して文型を確定する第
    二手順と、 該格要素それぞれの格種別を判定する第三手順と、 該確定した文型と該格種別に基づいて、入力された自然
    言語文を文型の意味の形式化表現に変換する第四手順
    と、を有することを特徴とする文型との照合による意味
    解釈方法。
  2. 【請求項2】 前記第二手順では、 述語の格要素を深層格と名詞の意味属性分類で規定した
    文型及びこの文型に対応する意味を規定した構文辞書を
    用いることを特徴とする請求項1記載の文型との照合に
    よる意味解釈方法。
  3. 【請求項3】 前記第一手順では、 述語の格要素を深層格と対応する名詞の意味属性分類の
    複数の分類項目への帰属関係で規定した用語辞書を用い
    ることを特徴とする請求項1または2記載の文型との照
    合による意味解釈方法。
  4. 【請求項4】 前記第一手順では、 名詞の意味属性分類において分類相互の意味的な関係を
    規定した用語辞書を用いることを特徴とする請求項1か
    ら3のいずれか1項記載の文型との照合による意味解釈
    方法。
  5. 【請求項5】 前記第二手順では、 自然言語文の格要素を構成する名詞の意味属性分類への
    帰属関係を基に、請求項2記載の構文辞書の文型を検索
    し、 前記第四手順では、 該当する意味規定により当該自然言語文を規定された形
    式に変換することを特徴とする請求項2記載の文型との
    照合による意味解釈方法。
  6. 【請求項6】 前記第二手順では、 自然言語文の格要素を構成する名詞の意味属性分類判定
    において、当該名詞が複数の意味分類に対応する場合、
    請求項3または請求項4記載の用語辞書による規定を用
    いて、対応する文型を判定して選び出すことを特徴とす
    る請求項3または4記載の文型との照合による意味解釈
    方法。
  7. 【請求項7】 前記第二手順では、 自然言語文の格要素を構成する名詞の意味属性分類を基
    に、請求項2記載の構文辞書の文型規定の検索において
    複数の文型が対応する場合、請求項3または請求項4記
    載の用語辞書による規定を用いて、対応する文型を絞り
    込むことを特徴とする請求項3または4記載の文型との
    照合による意味解釈方法。
  8. 【請求項8】 入力された自然言語文を用語辞書を用い
    て形態素解析して、述語部と格要素を抽出し単文に分解
    する文分解部と、 該述語部の用言に基づいて構文辞書を検索し該格要素と
    規定条件が一致する文型を選び出して文型を確定し、該
    格要素それぞれの格種別を判定する文型識別部と、 該確定した文型と該格種別に基づいて、入力された自然
    言語文を文型の意味の形式化表現に変換する変換部と、
    を有することを特徴とする文型との照合による意味解釈
    装置。
  9. 【請求項9】 前記構文辞書として、 述語の格要素を深層格と名詞の意味属性分類で規定した
    文型及びこの文型に対応する意味を規定した構文辞書を
    用いることを特徴とする請求項8記載の文型との照合に
    よる意味解釈装置。
  10. 【請求項10】 前記用語辞書として、 述語の格要素を深層格と対応する名詞の意味属性分類の
    複数の分類項目への帰属関係で規定した用語辞書を用い
    ることを特徴とする請求項8または9記載の文型との照
    合による意味解釈装置。
  11. 【請求項11】 前記用語辞書として、 名詞の意味属性分類において分類相互の意味的な関係を
    規定した用語辞書を用いることを特徴とする請求項8か
    ら10のいずれか1項記載の文型との照合による意味解
    釈装置。
  12. 【請求項12】 前記文型識別部は、 自然言語文の格要素を構成する名詞の意味属性分類への
    帰属関係を基に、請求項9記載の構文辞書の文型を検索
    するものであり、 前記変換部は、 該当する意味規定により当該自然言語文を規定された形
    式に変換するものであることを特徴とする請求項9記載
    の文型との照合による意味解釈装置。
  13. 【請求項13】 前記文型識別部は、 自然言語文の格要素を構成する名詞の意味属性分類判定
    において、当該名詞が複数の意味分類に対応する場合、
    請求項10または請求項11記載の用語辞書による規定
    を用いて、対応する文型を判定して選び出すものである
    ことを特徴とする請求項10または11記載の文型との
    照合による意味解釈装置。
  14. 【請求項14】 前記文型識別部は、 自然言語文の格要素を構成する名詞の意味属性分類を基
    に、請求項9記載の構文辞書の文型規定の検索において
    複数の文型が対応する場合、請求項10または請求項1
    1記載の用語辞書による規定を用いて、対応する文型を
    絞り込むものであることを特徴とする請求項10または
    11記載の文型との照合による意味解釈装置。
  15. 【請求項15】 請求項1から7のいずれか1項記載の
    文型との照合による意味解釈方法における手順を、コン
    ピュータに実行させるためのプログラムとしたことを特
    徴とする文型との照合による意味解釈方法の実行コンピ
    ュータプログラム。
  16. 【請求項16】 請求項1から7のいずれか1項記載の
    文型との照合による意味解釈方法における手順を、コン
    ピュータに実行させるためのプログラムとし、 該プログラムを、該コンピュータが読み取りできる記憶
    媒体に記録したことを特徴とする文型との照合による意
    味解釈方法の実行コンピュータプログラムを記録した記
    憶媒体。
JP2002062791A 2002-03-08 2002-03-08 文型との照合による意味解釈方法、装置、当該方法の実行コンピュータプログラム、及び当該方法の実行コンピュータプログラムを記録した記憶媒体 Pending JP2003263428A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002062791A JP2003263428A (ja) 2002-03-08 2002-03-08 文型との照合による意味解釈方法、装置、当該方法の実行コンピュータプログラム、及び当該方法の実行コンピュータプログラムを記録した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002062791A JP2003263428A (ja) 2002-03-08 2002-03-08 文型との照合による意味解釈方法、装置、当該方法の実行コンピュータプログラム、及び当該方法の実行コンピュータプログラムを記録した記憶媒体

Publications (1)

Publication Number Publication Date
JP2003263428A true JP2003263428A (ja) 2003-09-19

Family

ID=29196380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002062791A Pending JP2003263428A (ja) 2002-03-08 2002-03-08 文型との照合による意味解釈方法、装置、当該方法の実行コンピュータプログラム、及び当該方法の実行コンピュータプログラムを記録した記憶媒体

Country Status (1)

Country Link
JP (1) JP2003263428A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007018342A (ja) * 2005-07-08 2007-01-25 Nec Corp 情報提供装置および情報提供方法
JP2010170260A (ja) * 2009-01-21 2010-08-05 Fuji Xerox Co Ltd 情報処理装置及びプログラム
JP2018516420A (ja) * 2015-04-28 2018-06-21 ナディア アナリア ウェブラ, 自然言語により機能アーキテクチャ文書及びソフトウェア設計・解析仕様書を自動的に生成するプロセス及びシステム
JP7103763B2 (ja) 2017-07-20 2022-07-20 株式会社日立製作所 情報処理システムおよび情報処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007018342A (ja) * 2005-07-08 2007-01-25 Nec Corp 情報提供装置および情報提供方法
JP2010170260A (ja) * 2009-01-21 2010-08-05 Fuji Xerox Co Ltd 情報処理装置及びプログラム
JP2018516420A (ja) * 2015-04-28 2018-06-21 ナディア アナリア ウェブラ, 自然言語により機能アーキテクチャ文書及びソフトウェア設計・解析仕様書を自動的に生成するプロセス及びシステム
JP7103763B2 (ja) 2017-07-20 2022-07-20 株式会社日立製作所 情報処理システムおよび情報処理方法

Similar Documents

Publication Publication Date Title
Bergsma et al. Bootstrapping path-based pronoun resolution
Tiun et al. Automatic topic identification using ontology hierarchy
Anita et al. An approach to cluster Tamil literatures using discourse connectives
Btoush et al. Generating ER diagrams from requirement specifications based on natural language processing
Suleiman et al. The use of hidden Markov model in natural ARABIC language processing: a survey
Zouaq An overview of shallow and deep natural language processing for ontology learning
Neumann et al. A shallow text processing core engine
Al-Zoghby et al. Semantic relations extraction and ontology learning from Arabic texts—a survey
Yeasmin et al. Study of abstractive text summarization techniques
Cuteri et al. A logic-based question answering system for cultural heritage
Fahrni et al. HITS'Monolingual and Cross-lingual Entity Linking System at TAC 2013.
Batura et al. A method for automatic text summarization based on rhetorical analysis and topic modeling
Reinberger et al. Mining for lexons: Applying unsupervised learning methods to create ontology bases
Das Dawn et al. A comprehensive review of Bengali word sense disambiguation
WO2016067396A1 (ja) 文の並び替え方法および計算機
JPH1196177A (ja) 用語辞書生成方法および用語辞書生成プログラムを記録した記録媒体
Al_Janabi et al. Pragmatic text mining method to find the topics of citation network
Szwed Concepts extraction from unstructured Polish texts: A rule based approach
Albukhitan et al. Arabic ontology learning from un-structured text
JP2003263428A (ja) 文型との照合による意味解釈方法、装置、当該方法の実行コンピュータプログラム、及び当該方法の実行コンピュータプログラムを記録した記憶媒体
Tohalino et al. Using virtual edges to extract keywords from texts modeled as complex networks
Kuo et al. A BiLSTM-CRF entity type tagger for question answering system
Nevzorova et al. The Semantic Context Models of Mathematical Formulas in Scientific Papers.
Grandi ProbQL: A Probabilistic Query Language for Information Extraction from PDF Reports and Natural Language Written Texts
Kim et al. Question answering towards automatic augmentations of ontology instances