JPH0519187B2 - - Google Patents

Info

Publication number
JPH0519187B2
JPH0519187B2 JP63220328A JP22032888A JPH0519187B2 JP H0519187 B2 JPH0519187 B2 JP H0519187B2 JP 63220328 A JP63220328 A JP 63220328A JP 22032888 A JP22032888 A JP 22032888A JP H0519187 B2 JPH0519187 B2 JP H0519187B2
Authority
JP
Japan
Prior art keywords
interpretation
sentence
context
information
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63220328A
Other languages
English (en)
Other versions
JPH0268661A (ja
Inventor
Kazuo Sumita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP63220328A priority Critical patent/JPH0268661A/ja
Publication of JPH0268661A publication Critical patent/JPH0268661A/ja
Publication of JPH0519187B2 publication Critical patent/JPH0519187B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
[発明の目的] (産業上の利用分野) 本発明は、自然言語の解釈を求めるための文脈
理解装置に係わり、特に暖昧性のある文の解釈を
行なう分脈理解装置に関する。 (従来の技術) 近年、自然言語を入力する各種の情報処理シス
テムの開発が進められている。自然言語の対象
は、情報処理システムが取扱う仕事の種類によつ
て、既に文章として書き言葉で表現されたものも
あれば、対話的に音声やキーボードなどを入力の
手段として入力されるものである。このような自
然言語を入力文とする場合、情報処理システムが
所与の仕事をなし得るように上記入力文を計算機
内部の表現に変換し、それに基づいて処理がなさ
れなければならない。これは自然言語の表現が多
様、かつ暖昧であることから、そのままの表現で
は計算機が仕事の内容を理解できないからであ
る。即ち、自然言語は1つの文の解釈がそれ単独
では一意に決定できず、強い文脈依存性を有して
おり、多くの場合、前後の文脈との関わり合いを
考慮した上で決定されなければならない。一般
に、このように文の解釈を文脈に依存して求め、
情報処理システムが所与の仕事を行なえるような
表現に変換する技術は、文脈理解あるいは談話理
解と呼ばれている。 文脈理解を行なう上での問題としては、文内に
出現する代名詞や語句の省略によつて、前後の事
物を指示する照応参照が必要となることや、その
文が表層的に表現している意味が実際の意味とは
異なつている間接的発話行為の解釈等がある。中
でも、人間が自然言語を理解する場合、解釈がい
くつか可能である時、その文が現われる前の文に
対して矛盾するような解釈は採用しない。また、
矛盾しない解釈が複数ある場合には、その中で最
も文脈に照らし合せて適合する解釈を選んでい
る。 即ち、人間の理解は“無矛盾性”と“最適性”の
原則に基づいている。従つて自然言語の文脈を理
解するシステムにおいても、このような原則に基
づいた処理が行なわれなければ、人間と同じよう
に柔軟な文脈の理解を行なうことは不可能であ
る。 しかしながら、従来、最適性に関する定量的な
評価尺度が明確でなかつたため、文脈理解におい
て自然な会話を支障なくこなせるシステムは存在
しなかつた。 (発明が解決しようとする課題) このように、従来の文脈理解装置では、日本語
の暖昧性に起因して複数の解釈候補が得られたと
きに、明確な基準に基づいて最適な解釈を得るこ
とができないという問題があつた。 本発明は、上記の点を考慮し、日本語の暖昧性
に基づき、複数の解釈候補が得られた場合に、定
量的な評価基準に基づいて最も自然な解釈を得る
ことができる文脈理解装置を提供することを目的
とする。 [発明の構成] (課題を解決するための手段) 本発明は、文脈理解に必要な知識として推論規
則の集合と一階述語の集合と対象の集合とを格納
した知識ベースと、自然言語による入力文を入力
する手段と、この手段を介して入力された入力文
を形態素解析及び構文解析することにより上記入
力文の文解析結果を得る手段と、この手段で得ら
れた文解析結果から解釈候補を得る手段と、この
手段で得られた解釈候補が構文的又は意味的に矛
盾する場合にその解釈を棄却する手段と、この手
段で棄却されなかつた複数の解釈のそれぞれにつ
いて、前記一階述語の集合と対象の集合から構成
される命題と推論規則とを用いて情報量を計算す
る手段と、この手段で計算された情報量の大きな
解釈を解釈結果として選択し出力する手段とを具
備したことを特徴としている。 (作用) 本発明によれば、入力文の解釈結果から構文的
或は意味的に矛盾のある解釈が棄却され、更に複
数の解釈候補が残つた場合、即ち構文的にも意味
的にもいずれが正しいか決めがたい複数の解釈候
補が残つた場合、これら各解釈に対してそれぞれ
の情報量を計算し、その値の大きい解釈が解釈結
果として採用される。各解釈に対する情報量は、
後に詳細に説明するが、知識ベースに格納された
一階述語の集合と対象の集合から構成される命題
と推論規則とに基づいて、その解釈が与えられた
場合のエントロピーの減少分として定量的に求め
られる。本発明ではこの評価基準に基づいて解釈
結果が選択されるので、より可能性の高い解釈結
果が求められ、最も自然な解釈を得ることが可能
となる。 (実施例) 以下、図面に基づいて本発明の一実施例に係る
文脈理解方式について説明する。 第1図は本発明の一実施例に係る文脈理解装置
の構成を示す図である。この文脈理解装置は、自
然言語文を入力するキーボード、音声知識装置等
の入力部1と、この入力部1を介して入力された
入力文を形態素解析する形態素解析部2と、形態
素解析結果に対し構文解析を行なう構文解析部3
と、構文解析結果に対し照応先の抽出を行なう照
応先抽出部4と、照応先の抽出によつて得られた
解釈のうち矛盾する解釈を棄却する無矛盾性検定
部5と、矛盾する解釈が棄却された後に更に複数
の解釈候補が残つたとき、それらの解釈について
情報量を計算する情報量計算部6と、その計算結
果から最も情報量の大きな解釈を解釈結果として
出力する解釈結果出力部7と、文脈理解に必要な
知識を格納した知識ベース8とにより構成されて
いる。なお、知識ベース8には、文脈理解に必要
な知識として推論規則の集合と一階述語(例えば
“行く”、“動く”等)の集合と対象(例えば“ビ
デオ”、“スイツチ”等)の集合とが格納される。 次に第2図に示す流れ図に沿つて本発明の動作
について説明する。 入力部1を介して自然言語の形態の文が入力さ
れると(S1)、まず、形態素解析部2は入力文を
語幹、語尾等の形態素に分割する形態素解析
(S2)を実行する。続いて構文解析部3は単語の
係り受け関係等、入力文の構造を解析する構文解
析(S3)を実行する。これらの処理が行われる
と、第3図に例示するような文解析結果が得られ
る。ここでは、“そのスイツチを押すと、どうな
りますか”という入力文に対する文解析結果を示
している。尚、これらの処理方法は、例えば長尾
真、“言語工学”(1983、昭晃堂)等に示されてい
るように周知の技術である。 次に求められた文解析結果から照応先抽出部4
は照応先の抽出処理(S4)を実行する。この処
理は、文解析結果において照応する可能性のある
名詞や指示名詞が出現したら、これらが過去の文
脈に出現した名詞と照応するかどうかを調べる処
理である。ここで、照応する可能性のある名詞と
は、例えば“この赤いスイツチ”や“その製造
元”のように“この”、“その”、“あの”という指
示連体詞のついた名詞である。また、指示名詞と
は、例えば“それ”、“これ”、“あれ”等の名詞で
ある。これらの名詞や指示名詞が、過去の文脈に
出現した名詞と照応するかどうかは、過去に出現
した名詞を例えばスタツクに積んでおき、このス
タツク内の名詞と入力文の指示名詞等との間の関
係を知識ベース8上で調べることにより判定する
ことが可能である。どのような関係がある場合に
照応可能性があるかという点については、内田ユ
リ子、“照応現象における表層構造と意味の関係”
(電子総合研究所彙報、第49巻、第8号)や、田
中穂積“談話理解システムへのアプローチ(その
1)”(計算機による日本語談話行動の総合モデル
化、昭和53年文部省科学研究費、特定研究(1)、課
題番号310702)などに示されている。また、知識
ベース8の実現方法については、D.G.Bobrow、
T.Winograd“An Overview of KRL、a
Knowledge Representation Language”
(Xerox Palo Alto Research Center、CSL76−
4、1976)等に示されている。例えば、第4図a
に示すような状態で過去の文脈において出現した
名詞“ビデオ”、“電源スイツチ”、“カセツト”が
スタツクに積まれている場合、同図bに示すよう
に名詞句“そのスイツチ”に対しては“ビデオ”
と“電源スイツチ”とが照応可能性のある名詞と
して抽出される。これは、“スイツチ”と“ビデ
オ”とが部分−全体の関係にあり、“スイツチ”
と“電源スイツチ”とが上位−下位関係にあると
いうことが知識ベース8上で判定されるからであ
る。また、例えば“それ”という指示名詞に対し
ては、“ビデオ”、“電源スイツチ”及び“カセツ
ト”が抽出される。 照応先を全て抽出すると、その組合わせによ
り、いくつかの解釈の候補が導出される場合があ
る。これらの解釈のうち、その文を文として成立
たせない(構文的な矛盾)解釈や過去の文脈を照
らし合せて矛盾(意味的な矛盾)する解釈は、無
矛盾性検定部5で棄却される(S5)。ここで、前
者のその文を成立たせない解釈とは、次のような
解釈をいう。例えば“行く”という述語に対応す
る知識ベース8内の表現が仮に第5図に示すよう
な表現であるとすると、“行く”という述語の動
作主と行先とには、それぞれ“人”、“場所”とい
う範疇に属する名詞しか当てはまらない。このよ
うな知識ベース8上に記述された述語に係わる制
限に違反する解釈のことをいう。一方、後者の文
脈と照らし合せて矛盾するということは、過去の
文脈で明示された事実と矛盾する場合、及び過去
の文脈から導き出される事実と矛盾する場合の2
つの場合がある。ここでの矛盾とは、矛盾である
と予め宣言された宣言、或は直接的な矛盾であ
る。これらの判定を行なうことによつて過去の文
脈との矛盾する解釈を棄却する。 以上の処理が終了した段階で、構文的にも意味
的にも正しい解釈が複数残つているときには、い
ずれを解釈結果として採用すべきかが問題とな
る。即ち、例えばビデオの操作法に関する質問応
答において、“それが動かない”という文に対す
る解釈結果として第6図のような3つの解釈候補
が残つた場合、いずれの解釈候補を解釈結果とし
て選択するかを判定する必要がある。そこでこの
装置では情報量計算部6が各解釈候補について情
報量を計算し(S6)、この情報量の大きい解釈候
補を解釈結果として採用するようにしている。こ
の情報量は次のように求められる。 即ち、いま知識ベース8に格納されている知識
として、取扱う対象(例えば“ビデオ”、“電源ス
イツチ”、“カセツト”等)の集合をC、一階の述
語(例えば“動く”、“押す”等)の集合をΔ、推
論規則の集合をKJ、命題をDPとし、これらを、 C={cn|1≦n≦N} ……(1) Δ={δh|1≦h≦H} ……(2) DP={πp|1≦p≦P} ……(3) KJ={κj|1≦j≦J} ……(4) で表されるものとする。命題DPは文の解釈に相
当する。本装置では新たな文が入力される毎にそ
の文の解釈に対応する命題が集合DPに追加され
ていくことになる。ここでは、簡単のために一変
数の命題のみを考え、更にH=1であるとして説
明する。 全ての対象に対して述語δが成立するかどうか
が決定されていれば、あいまいさのない記述とな
るが、DPには全ての命題が設定されている訳で
はなく、設定されていない命題に関しては真偽値
は未知である。もし、推論規則の集合Kと、命題
の集合Dとが空集合であると、DPは命題δ(ci)
の否定と肯定の組合わせによつて、δ(c1)Λδ
(c2)Λ…Λδ(cN)から(c1)Λ(c2)Λ…
Λ(cN)までのあらゆる可能性を含むことに
なる((x)はδ(x)の否定を表す)。この可能な状
態の集合をSとすると、 S={δ(c1)Λδ(c2)Λ…Λδ(cN)、 δ(c1)Λδ(c2)Λ…Λ(cN)、 …、(c1)Λ(c2)Λ…Λ(cN)}
……(5) となる。Sの各要素は相互に背反であり、会話が
行われていない状態では、いずれの要素が真であ
るかは不明である。そこでSの全ての要素の事前
確率が等しいとすると、Sのエントロピーは次式
のようになる。 E=−2N 〓 2-Nlog22-N=N ……(6) ここで、仮にδ(c1)という解釈が入力された
とすると、可能な状態の集合S(δ(c1))は次の
ようになる。 S(δ(c1)) ={δ(c1)Λδ(c2)Λ…Λδ(cN)、 δ(c1)Λδ(c2)Λ…Λ(cN)、 …、δ(c1)Λ(c2)Λ…(cN)} ……(7) ここで、S(δ(c1))をδ(c1)の領域と呼ぶ。
この状態の集合SのエントロピーSは、 E(δ(c1))=−2N-1 〓 21-Nlog221-N=N−1 ……(8) で示される。情報量は、エントロピーの差として
定義されるので、δ(c1)の解釈を採用した場合
の情報量δ(c1)は、 δ(c1)=E−E(δ(c1))=1 ……(9) となる。 次に、知識ベース8内の推論規則KJが空集合
でなく、 KJ={δ(c1)Λδ(c2)Λ…Λδ(cm−1) →δ(cm)} ……(10) という推論規則が存在する場合について考える。 簡単のためm=3とすると、 KJ={δ(c1)Λδ(c2)→δ(c3)} ……(11) この推論規則が成立する状態の集合は、
(c1)v(c2)vδ(c3)の領域であり、共通要
素を持たない集合の和として次のように展開でき
る。 S((c1)v(c2)vδ(c3)) =S((c1)Λ(c2)Λδ(c3)) +S((c1)Λ(c2)Λ(c3)) +S((c1)Λδ(c2)Λδ(c3)) +S((c1)Λδ(c2)Λ(c3)) +S(δ(c1)Λ(c2)Λδ(c3)) +S(δ(c1)Λ(c2)Λ(c3)) +S(δ(c1)Λδ(c2)Λδ(c3)) ……(12) 但し、ここでS(δ(c1)Λδ(c2)Λδ(c3))は

Sのうちδ(c1)、δ(c2)、δ(c3)の全てが成立
している状態を集めた集合である。S((c1)
v(c2)vδ(c3))は、会話が全く行われてい
ない状況での状態の集合であるが、会話の諸相
(δ(c1)、δ(c2)、δ(c3)がそれぞれ真であるが
偽であるか未知であるか)、つまり文脈によつて
27通りの場合が想定できる。例えばδ(c1)が真、
δ(c2)が偽、δ(c3)が未知(以下、このような
状態を(t、f、u)と表す)である場合、状態
の集合Sは(12)式より対応する領域を取出すことに
より、次のように表わせる。 S{((c1)v(c2)vδ(c3)) Λδ(c1)Λ(c2)} =S(δ(c1)Λ(c2)Λδ(c3)) +S(δ(c1)Λ(c2)Λ(c3)) ……(13) このような種々の状況に対して、ある解釈を与
えることにより求められるエントロピーの差を情
報量として求めることができる。表1はδ(c1)、
δ(c2)、δ(c3)が全て未知である(u、u、u)
の場合に各解釈を与えた場合の情報量を、また表
2はδ(c1)が真、δ(c2)及びδ(c3)が未知で
ある(t、u、u)の場合に各解釈を与えた場合
の情報量をそれぞれ示している。
【表】
【表】 なお、δ(c1)とδ(c2)が真で、δ(c3)が偽
であるような状態(t、t、u)は第(12)式に含ま
れていない。このような状態を矛盾状態と呼ぶ。
また、例えばδ(c1)が真で、δ(c2)及びδ(c3)
が未知であるような(t、u、u)の場合には、
未知であるδ(c2)、δ(c3)にそれぞれ真、偽が
得られると矛盾状態となるので、矛盾状態を含ん
でいるということができる。従つて、矛盾状態を
含んでいる場合には、それを除いた状態でエント
ロピーを計算する必要がある。 以上のことは述語及び推論規則が複数存在する
場合についても同様に成立つ。即ち、ある述語
δhに入り得る対象の総数をNh、推論規則κjに係
わるmj個の命題のうち、真偽が未知である命題
の総数をLPとすると、エントロピーは次式で求
められる。 E(DP、KJ、Δ、C)=Hh=1 Nh−LPJj=1 log22mj-kj−σj(DP)/2mj ……(14) 但し、ここでσj(DP)は、DPについて、推論
規則κjに関しての矛盾状態を内在する場合につい
ては1、それ以外は0を与える関数である。 ある解釈(命題)πP+1を与えることで変化
するエントロピーの差がその命題の持つ情報量に
相当するので、諸相においての命題の情報量は次
式のように求められる。 このような情報量を算出し、その値の大きな解
釈候補を解釈結果として採用することにより、最
適な解釈が得られる(S7) このように、本実施例によれば、形態素解析、
構文解析、照応先の抽出及び矛盾のある解釈の棄
却の各処理を経て得られた解釈の候補に対し、情
報量を算出し、その比較を行なうことにより、文
脈に基づく量も自然な解釈を求めることができ
る。 なお、この実施例では、照応先を抽出した後、
無矛盾性の検査を行なつているが、この無矛盾性
の検査は、照応先を抽出する毎に行なうようにし
てもよい。 また、上記実施例では、照応参照の解析により
解析が複数である場合について、最も自然な解釈
を得るための方式について示した。しかし、照応
の現象が無くても、文脈により文の解釈が暖昧に
なり、複数の解釈が得られる場合もある。この時
も情報量の比較により解釈候補を評価することに
より、最も自然な解釈を求めることができる。即
ち、本発明は、照応参照の解析だけの文脈処理に
適用を限定されるものではない。 [発明の効果] 以上述べたように、本発明によれば、日本語の
暖昧性に基づき複数の解釈候補が得られた場合で
も、それらの情報量を計算しその比較結果によつ
て自然な解釈結果を得ることができる。
【図面の簡単な説明】
第1図〜第6図は本発明の一実施例に係る文脈
理解装置を説明するための図で、第1図は装置の
構成を示すブロツク図、第2図は同装置の動作を
示す流れ図、第3図は構文解析を行なつた後の文
解析結果の例を示す図、第4図aは照応可能性の
ある名詞候補がスタツクに格納されている様子を
示す図、同図bは同名詞候補から照応先の名詞候
補が抽出された様子を示す図、第5図は矛盾する
解釈の棄却処理に使用される知識ベースの表現例
を示す図、第6図は抽出された解釈候補の一例を
示す図である。 1……入力部、2……形態素解析部、3……構
文解析部、4……照応先抽出部、5……無矛盾性
検定部、6……情報量計算部、7……解釈結果出
力部、8……知識ベース。

Claims (1)

  1. 【特許請求の範囲】 1 文脈理解に必要な知識として推論規則の集合
    と一階述語の集合と対象の集合とを格納した知識
    ベースと、 自然言語による入力文を入力する手段と、 この手段を介して入力された入力文を形態素解
    析及び構文解析することにより上記入力文の文解
    析結果を得る手段と、 この手段で得られた文解析結果から解釈候補を
    得る手段と、 この手段で得られた解釈候補が構文的又は意味
    的に矛盾する場合にその解釈を棄却する手段と、 この手段で棄却されなかつた複数の解釈のそれ
    ぞれについて、前記一階述語の集合と対象の集合
    から構成される命題と推論規則とに基づいて、そ
    の解釈が与えられた場合のエントロピーの減少分
    を情報量として計算する手段と、 この手段で計算された情報量の大きな解釈を解
    釈結果として選択し出力する手段とを具備したこ
    とを特徴とする文脈理解装置
JP63220328A 1988-09-05 1988-09-05 文脈理解装置 Granted JPH0268661A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63220328A JPH0268661A (ja) 1988-09-05 1988-09-05 文脈理解装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63220328A JPH0268661A (ja) 1988-09-05 1988-09-05 文脈理解装置

Publications (2)

Publication Number Publication Date
JPH0268661A JPH0268661A (ja) 1990-03-08
JPH0519187B2 true JPH0519187B2 (ja) 1993-03-16

Family

ID=16749422

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63220328A Granted JPH0268661A (ja) 1988-09-05 1988-09-05 文脈理解装置

Country Status (1)

Country Link
JP (1) JPH0268661A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712758B2 (en) 2007-08-31 2014-04-29 Microsoft Corporation Coreference resolution in an ambiguity-sensitive natural language processing system
MX2010002349A (es) * 2007-08-31 2010-07-30 Microsoft Corp Resolucion de correferencia en un sistema de procesamiento de lenguaje natural sensible a la ambiguedad.
JP5575449B2 (ja) * 2009-10-06 2014-08-20 新日鉄住金ソリューションズ株式会社 情報処理装置、情報処理方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6182274A (ja) * 1984-08-28 1986-04-25 Fujitsu Ltd 日本語文処理装置
JPS63123163A (ja) * 1986-11-12 1988-05-26 Matsushita Electric Ind Co Ltd 自然言語処理システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6182274A (ja) * 1984-08-28 1986-04-25 Fujitsu Ltd 日本語文処理装置
JPS63123163A (ja) * 1986-11-12 1988-05-26 Matsushita Electric Ind Co Ltd 自然言語処理システム

Also Published As

Publication number Publication date
JPH0268661A (ja) 1990-03-08

Similar Documents

Publication Publication Date Title
JP3266246B2 (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
Kanakaraddi et al. Survey on parts of speech tagger techniques
US20080154578A1 (en) Method and system for learning ontological relations from documents
Lee et al. Deep learning-based context-sensitive spelling typing error correction
Krizhanovsky et al. An approach to automated construction of a general-purpose lexical ontology based on Wiktionary
Pogorilyy et al. Coreference resolution method using a convolutional neural network
Gaizauskas et al. Using a semantic network for information extraction
Roman et al. Exploiting contextual word embedding of authorship and title of articles for discovering citation intent classification
Antony et al. A survey of advanced methods for efficient text summarization
JPH03116374A (ja) 専門用語抽出システム
Jang et al. Beyond distributional hypothesis: Let language models learn meaning-text correspondence
Monroe et al. Generating bilingual pragmatic color references
JPH0519187B2 (ja)
Annam et al. Anaphora resolution in dialogue systems for south asian languages
Daelemans et al. Part-of-speech tagging for Dutch with MBT, a memory-based tagger generator
Nishy Reshmi et al. Textual entailment classification using syntactic structures and semantic relations
Jolly et al. Anatomizing lexicon with natural language Tokenizer Toolkit 3
Nevzorova et al. Corpus management system: Semantic aspects of representation and processing of search queries
Siegel et al. Gathering statistics to aspectually classify sentences with a genetic algorithm
CN111191465A (zh) 一种问答匹配方法、装置、设备及存储介质
Wang et al. Probing Representations for Document-level Event Extraction
Di Sciullo A reason to optimize information processing with a core property of natural language
JP2765618B2 (ja) 言語解析装置
LEMU Named Entity Detection and Classification for Afaan Oromoo Text based on Bidirectional Encoder Representations from Transformers
Yu et al. Extracting and Clustering of Story Events from a Story Corpus.

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term