JPH11250085A - 事象推移予測方法および事象推移予測プログラムを記録した記録媒体 - Google Patents

事象推移予測方法および事象推移予測プログラムを記録した記録媒体

Info

Publication number
JPH11250085A
JPH11250085A JP10049851A JP4985198A JPH11250085A JP H11250085 A JPH11250085 A JP H11250085A JP 10049851 A JP10049851 A JP 10049851A JP 4985198 A JP4985198 A JP 4985198A JP H11250085 A JPH11250085 A JP H11250085A
Authority
JP
Japan
Prior art keywords
causal
node
case frame
arc
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10049851A
Other languages
English (en)
Inventor
Hiroshi Sato
浩史 佐藤
Kaname Kasahara
要 笠原
Kazumitsu Matsuzawa
和光 松澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10049851A priority Critical patent/JPH11250085A/ja
Publication of JPH11250085A publication Critical patent/JPH11250085A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 自然言語テキストに内在する事象間の因果知
識を自動的に獲得して事象間の推移予測を適確に行い得
る事象推移予測方法および事象推移予測プログラムを記
録した記録媒体を提供する。 【解決手段】 格フレーム1,2…からなるノード、因
果関係を有するノード同士を繋ぐアーク1-2,1−3
…、該アークで繋がれたノード間の因果関係の形態と度
合を表すラベル1-2,1-3…から因果知識グラフを構築
し、指定された格フレームに対するノードを因果知識グ
ラフから検索し、この検索したノードとアークを介して
接続される各ノードを列挙し、この列挙したノードの各
々と前記検索したノードとをそれぞれ接続する各アーク
のラベルに基づいて前記指定されたノードに対して常識
的に次に起こり得るノードを出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された事象に
対して次に起こる可能性のある事象を予測する事象推移
予測方法に関し、更に詳しくは、用言を中心に他の単語
との対応関係を整理した格フレームを事象の集合と見な
し、該格フレーム集合中の任意の指定された格フレーム
に対して常識的に次に起こり得る格フレームを予測する
事象推移予測方法および事象推移予測プログラムを記録
した記録媒体に関する。なお、本事象推移予測方法は事
象推移予測に使用する知識データベースの構築法、表現
法に有効である。
【0002】
【従来の技術】自然界および人間社会において何らかの
手段によって観測される事柄や現象(これらを「事象」
と呼ぶ)には、他の事象が観測された時に引き続いて発
生するものがある。このような事象の推移は、時間的・
空間的に偶然起こる場合があるが、自然法則に基づいて
常に起こる推移や、自然現象では説明できないが高い頻
度で起こる推移が見られる。後者のような事象の推移に
対して人間は、元となる事象を原因、引き続いて起こる
事象を結果とした因果関係と捉えて知識とし、新しく発
生した事象に対し次に起こるであろう事象の予測に利用
していると考えられる。例えば、「冬になって温度が下
がる」という事象が起こった場合に、たびたび「風邪を
ひく人が多い」という事象が起こることを知っている人
は、冬になった時には、普通よりも風邪をひきやすくな
ると予測し風邪をひかないような対策を取ることができ
る。
【0003】人間が行うような上記の事象の予測の一部
については、計算機を用いて人間が保有する因果知識を
知識ベースとして蓄積し、それを用いて予測することが
行われている。例えば、エキスパートシステムでは、事
象の領域を限定し、その領域についての専門家からの聞
き取りによって因果知識をデータベース化する。そし
て、患者の症状と病名の知識ベースを用いて、新たな患
者の病状から病名を判断したり、発電所における故障の
状態とその場合の関係する部品の状態に関する知識ベー
スから、発電所の故障診断を行ったりする。これらの知
識ベースの構築は各専門分野ごとに構築され、その知識
源は主にその分野の専門家の経験であり、直接手入力ま
たは日々の経験の半自動的記録により蓄えられている。
【0004】また、エキスパートシステムのような専門
的で限られた領域の事象を対象とするのでなく、CYC
(D.B.Renato,R.V.Guha and so ou,Cyc:Toward Program
s with Common Sence,Communication of the ACM,vol.3
3,No.8(1990)参照)のような人が共通して保有する大
規模な常識知識データベースを構築し、常識的な事象の
推移予測を行おうとする試みが見られる。しかし、これ
らの構築手段は、常識知識が膨大でかつ広範囲に及ぶた
め、多数の人手・経費と長い歳月が必要になるという問
題点がある。
【0005】近年、電子的な記憶媒体の規模が大きくな
り低価格となったため、新聞記事や辞書などの膨大な自
然言語テキストが電子化され蓄積されるようになってい
る。また、インターネットにおけるWWWでは、膨大な
テキストが蓄積されている。これらのテキストを利用
し、文法的な知識を自動獲得することが行われている。
自然言語テキスト中には事象およびその因果知識も含ま
れているが、常識的な因果の推移予測を行うために文書
が表す事象を判定し、それらの事象間の因果を自動的に
獲得するような方法は、事象および因果が定式化されて
いないために確立されていない。また、自然言語テキス
トのすべての文に事象および因果が含まれているわけで
ないので、常識のような多数の因果知識を獲得するため
には、非常に膨大な自然言語テキストを収集する必要が
ある。
【0006】
【発明が解決しようとする課題】上述したように、事象
間の因果を知識ベースとし、この知識ベースを用いて行
う従来の事象の推移予測では、知識ベースの作成が主と
して人手によって行われているため、膨大な時間と労力
がかかり、非効率的であるという問題がある。
【0007】また、膨大な自然言語テキストは常識的な
因果知識源と考えられるが、常識的な事象および因果が
定式化されていないため、常識的事象に対する予測、判
断を行うシステムも確立していないという問題がある。
【0008】本発明は、上記に鑑みてなされたもので、
その目的とするところは、自然言語テキストに内在する
事象間の因果知識を自動的に獲得して事象間の推移予測
を適確に行い得る事象推移予測方法および事象推移予測
プログラムを記録した記録媒体を提供することにある。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の本発明は、用言を中心に他の単語と
の対応関係を整理した格フレームを事象の集合と見な
し、該格フレーム集合中の任意の指定された格フレーム
に対して常識的に次に起こり得る格フレームを予測する
事象推移予測方法であって、前記格フレームからなるノ
ードと、因果関係を有するノード同士を繋ぐアークと、
該アークで繋がれたノード間の因果関係の形態と度合を
表すラベルとからなる因果知識グラフを構築し、指定さ
れた格フレームに対するノードを前記因果知識グラフか
ら検索し、この検索したノードとアークを介して接続さ
れる各ノードを列挙し、この列挙したノードの各々と前
記検索したノードとをそれぞれ接続する各アークのラベ
ルに基づいて前記指定されたノードに対して常識的に次
に起こり得るノードを出力することを要旨とする。
【0010】請求項1記載の本発明にあっては、格フレ
ームからなるノードと、因果関係を有するノード同士を
繋ぐアークと、該アークで繋がれたノード間の因果関係
の形態と度合を表すラベルとから因果知識グラフを構築
し、指定された格フレームに対するノードを因果知識グ
ラフから検索し、この検索したノードとアークを介して
接続される各ノードを列挙し、この列挙したノードの各
々と前記検索したノードとをそれぞれ接続する各アーク
のラベルに基づいて前記指定されたノードに対して常識
的に次に起こり得るノードを出力するため、事象および
因果が定式化した因果知識グラフを構築でき、人が行う
ような常識的な事象の推移予測を適確に行うことができ
る。
【0011】また、請求項2記載の本発明は、請求項1
記載の発明において、前記因果知識グラフを自然言語テ
キストから構築するために、該自然言語テキストを文に
分割し、この分割された文の各々を構成する複数の格フ
レームを判定し、この判定された複数の格フレーム間の
構文的な接続関係を判定し、この接続関係に基づいて該
複数の格フレームに対応する因果知識グラフ中のノード
間のアークと因果関係の形態を獲得し、同一因果関係が
複数得られた場合の出現頻度および該文中の用言を修飾
する修飾辞から該ノード間の因果関係の度合を獲得する
ことを要旨とする。
【0012】請求項2記載の本発明にあっては、自然言
語テキストを文に分割し、この文の各々を構成する複数
の格フレームを判定し、この複数の格フレーム間の構文
的な接続関係を判定し、この接続関係に基づいて複数の
格フレームに対応する因果知識グラフ中のノード間のア
ークと因果関係の形態を獲得し、同一因果関係が複数得
られた場合の出現頻度および該文中の用言を修飾する修
飾辞から該ノード間の因果関係の度合を獲得することに
より自然言語テキストから因果知識グラフを構築するこ
とができるため、様々な分野に存在する自然言語テキス
トから因果知識グラフを容易に構築することができる。
【0013】更に、請求項3記載の本発明は、請求項1
記載の発明において、任意の自然言語文を事象とし、該
自然言語文を適合する格フレームに変換し、この格フレ
ームに対するノードを前記因果知識グラフから検索し、
この検索したノードとアークを介して接続されるノード
の各々と前記検索したノードとをそれぞれ接続する各ア
ークのラベルに基づいて前記格フレームに対して常識的
に次に起こり得る格フレームを検出することを要旨とす
る。
【0014】請求項3記載の本発明にあっては、任意の
自然言語文を事象とし、該自然言語文を適合する格フレ
ームに変換し、この格フレームに対するノードを因果知
識グラフから検索し、該因果知識グラフから前記格フレ
ームに対して常識的に次に起こり得る格フレームを検出
するため、推移の原因となる事象を自然言語文で容易に
入力できる。
【0015】請求項4記載の本発明は、用言を中心に他
の単語との対応関係を整理した格フレームを事象の集合
と見なし、該格フレーム集合中の任意の指定された格フ
レームに対して常識的に次に起こり得る格フレームを予
測する事象推移予測プログラムを記録した記録媒体であ
って、前記格フレームからなるノードと、因果関係を有
するノード同士を繋ぐアークと、該アークで繋がれたノ
ード間の因果関係の形態と度合を表すラベルとからなる
因果知識グラフを構築し、指定された格フレームに対す
るノードを前記因果知識グラフから検索し、この検索し
たノードとアークを介して接続される各ノードを列挙
し、この列挙したノードの各々と前記検索したノードと
をそれぞれ接続する各アークのラベルに基づいて前記指
定されたノードに対して常識的に次に起こり得るノード
を出力する事象推移予測プログラムを記録媒体に記録す
ることを要旨とする。
【0016】請求項4記載の本発明にあっては、格フレ
ームからなるノードと、因果関係を有するノード同士を
繋ぐアークと、該アークで繋がれたノード間の因果関係
の形態と度合を表すラベルとから因果知識グラフを構築
し、指定された格フレームに対するノードを因果知識グ
ラフから検索し、この検索したノードとアークを介して
接続される各ノードを列挙し、この列挙したノードの各
々と前記検索したノードとをそれぞれ接続する各アーク
のラベルに基づいて前記指定されたノードに対して常識
的に次に起こり得るノードを出力する事象推移予測プロ
グラムを記録媒体に記録するため、該記録媒体を用い
て、その流通性を高めることができる。
【0017】また、請求項5記載の本発明は、請求項4
記載の発明において、前記因果知識グラフを自然言語テ
キストから構築するために、該自然言語テキストを文に
分割し、この分割された文の各々を構成する複数の格フ
レームを判定し、この判定された複数の格フレーム間の
構文的な接続関係を判定し、この接続関係に基づいて該
複数の格フレームに対応する因果知識グラフ中のノード
間のアークと因果関係の形態を獲得し、同一因果関係が
複数得られた場合の出現頻度および該文中の用言を修飾
する修飾辞から該ノード間の因果関係の度合を獲得する
事象推移予測プログラムを記録媒体に記録することを要
旨とする。
【0018】請求項5記載の本発明にあっては、自然言
語テキストを文に分割し、この文の各々を構成する複数
の格フレームを判定し、この複数の格フレーム間の構文
的な接続関係を判定し、この接続関係に基づいて複数の
格フレームに対応する因果知識グラフ中のノード間のア
ークと因果関係の形態を獲得し、同一因果関係が複数得
られた場合の出現頻度および該文中の用言を修飾する修
飾辞から該ノード間の因果関係の度合を獲得することに
より自然言語テキストから因果知識グラフを構築する事
象推移予測プログラムを記録媒体に記録しているため、
該記録媒体を用いて、その流通性を高めることができ
る。
【0019】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態について説明する。
【0020】図1は、本発明の第1の実施形態に係る事
象推移予測方法に使用される因果知識グラフを部分的に
示す説明図である。同図に示す因果知識グラフの形式
は、自然言語テキストから自動テキストに獲得可能にす
ることを考慮し、論理的に詳細な因果知識の認識を求め
ていない。すなわち、「夏は暑い」という知識を「夏は
地球の自転軸の傾きの影響で太陽高度が高く、日差しが
強くなるので暑い」のように詳細に認識する必要なく機
能するように事象を単純な形式である自然言語処理で用
いる格フレーム、すなわち用言を中心に他の単語との対
応関係を整理した格フレームを用いて記述している。
【0021】すなわち、図1に示す因果知識グラフで
は、上述した格フレームを事象の単位であるノードと
し、常識的に推移すると考えられる因果のノード同士を
アークで結び付け、この結び付きの度合と形態をラベル
として記述して、因果知識グラフを構築している。具体
的には、図1において、格フレーム1はラベル1-2の付
与されたアーク1-2を介して格フレーム2に接続され、
この格フレーム2はラベル2-3の付与されたアーク2-3
を介して格フレーム3に接続され、この格フレーム3は
ラベル1-3の付与されたアーク1-3を介して格フレーム
1に接続されている。また、この格フレーム1はラベル
1-nに付与されたアーク1-nを介して格フレームnに接
続されている。
【0022】そして、このように構築された因果知識グ
ラフにおいて、ユーザによって任意の1つの格フレーム
が指定された場合、この格フレームに対応するノードを
因果知識グラフから検索し、このノードに対してアーク
で接続されているノードを複数列挙する。この列挙され
た複数のノードに対して付与されているラベルに記述さ
れている度合と接続関係に基づいてユーザが指定した格
フレームの事象に対して常識的に推移する事象の格フレ
ームを因果知識グラフの中のノードから選択する。
【0023】図2は、図1に示す因果知識グラフを更に
具体的に示しているものである。図2において、例えば
「(主体)は(体の一部)が痛む」という格フレーム1
は、ラベル1-3の付与されたアーク1-3を介して「(主
体)は(病院)に行く」という格フレーム3に接続さ
れ、この格フレーム3はラベル3-4の付与されたアーク
3-4を介して「(主体)は(検査)を受ける」という格
フレーム4に接続されているというように因果知識グラ
フが構築されている。
【0024】上述したように、本実施形態において、因
果知識グラフを構成するノードは格フレームである。こ
れは自然言語において動詞や形容詞などの用言に着目
し、単文に含まれる用言が文を構成する用言以外の単語
とどのように関係しているかを整理したものである。
【0025】例えば、「私は大学病院に行く」といった
文の用言は「行く」であるが、その使われ方は「彼は学
校に行く」と同じである。すなわち「(主体)が(場
所)に行く」と他の用言以外の単語を意味において整理
した場合、2つの文の用言は同一の使われ方と見なすこ
とができる。このように用言を中心に他の単語との対応
関係を整理したものが格フレームである。格フレーム
は、機械翻訳や構文解析を行うために必要であり、例え
ば日英翻訳システムであるALT−J/Eでは、日本語
について約一万五千の格フレームが体系的に整理されて
いる(池原、宮崎他、日本語語彙大系、岩波書店(199
7)参照)。
【0026】格フレームにおける用言以外の単語の整理
の仕方は色々考えられ、例えば単語の整理を抽象的に粗
く行ったり、具体的に細かく行ったりする。例えば、前
述の例を「(主体)が(病院)に行く」「(主体)が
(教育機関)に行く」と区別することもできる。また、
整理の仕方には様々な方法があるので、複数の異なる格
フレームの体系が存在する。本実施形態において事象を
表す格フレームとしては、体系的に記述されてあればど
のような格フレームの集合であっても構わない。このよ
うな格フレーム個々を事象とする。
【0027】複数種の格フレームの集合が存在するとき
に、因果知識グラフにおいて、格フレームに対応する事
象の推移が存在すると判定される時、それらの格フレー
ムのノード同士はアークで結ばれる。例えば、格フレー
ム1に対応する事象が起こったときに、格フレーム2に
対応する事象が起こり得ると判断される場合、この2つ
のフレームの間をアーク1-2で結ぶ。アークは、すべて
の格フレームの組み合わせの間について張られるのでは
なく、推移が考えられる格フレーム間にのみ張られる。
そして、すべてのアークには、推移の情報を収納するラ
ベルが付与される。例えば、アーク1-2にはラベル1-2
が付与される 推移の情報は、因果の形態と度合からなる。因果の形態
は、格フレームの表す事象の間の推移を説明・整理する
情報であり、その種類は色々考えられる。その1つは
「因果の向き」で3種類からなる。例えば、ラベル1-2
においては、「1→2」、「2→1」、「1⇔2」が考
えられる。「1→2」はフレーム1の事象が起こったと
きにフレーム2の事象が起こり得ることを表し、反対は
起こり得ないことを示す。また、「1⇔2」では、2つ
のフレームのどちらのフレームの事象からももう一方の
フレームの事象に起こり得ることを表す。また、他の因
果の形態としては「因果の種類」があり、例えば、 のような推移の関係を表す。この因果の種類として、構
文解析における複文や重文における文節間の関係を充て
ることもできる。推移の情報のもう1つは因果の度合で
あり、これは値が大きいほどアークで結びつけられたフ
レームの因果同士の推移の起こりやすさが強いことを表
す。
【0028】次に、図3に示すフローチャートを参照し
て、本実施形態の作用について説明する。図3におい
て、ユーザは、推移の予測を行いたい事象として、因果
知識グラフを構成する格フレームの集合Xの中より最も
適切な格フレームxを選択する(ステップS11)。次
に、その選択された格フレームxのノードを因果知識グ
ラフより検索し、そのノードにアークが結合しているか
を判定する(ステップS13)。アークが結合していな
い場合、推移する事象は存在しないので、「推移はな
い」という予測結果をユーザに出力する(ステップS1
5)。
【0029】格フレームxのノードにアークが接続して
いる場合、それらの{アークxy}(y∈Y⊂X)に付
与されている{ラベルxy}(y∈Y)を検索し、その
情報を取り出す(ステップS17)。次に各ラベルの情
報に基づいて、格フレームxから{格フレームy}(y
∈Y)の推移の度合を計算する(ステップS19)。計
算方法としてはラベルの情報を用いたものであればどの
ようなものであっても構わない。例えば、因果の度合を
そのまま推移の度合とする方法や、因果の向きが格フレ
ームxからの一方方向のみのラベルが付与されたアーク
への推移を1、双方向のラベルでは0.5、格フレーム
への一方方向のみのラベルでは0とする方法、因果の種
類が原因結果の場合には1、それ以外は0.5とする方
法など様々存在し、また、これらを組み合わせて決定す
ることもできる。
【0030】最後に、計算された推移の度合に基づい
て、格フレームxとアークで接続された{格フレーム
y}(y∈Y)の中から格フレームxから推移し得る
{格フレームz}(z∈Z⊂Y)を選択し(ステップS
21)、予測結果としてユーザに出力する(ステップS
23)。選択方法としては、推移の度合を用いたもので
あればどのようなものであっても構わない。例えば、推
移の度合の最も高い格フレームを選択する方法、推移の
度合の基準値を予め定めておき、基準値以上の推移の度
合の格フレームを選択する方法、推移の度合の高い順に
固定数個分の格フレームを選択する方法など様々考えら
れる。
【0031】次に、図2に示した因果知識グラフを用い
て、ユーザが事象を表す格フレームとして例えば図2の
格フレーム1「(主体)は(体の一部)が痛む」を入力
した場合に、次に起こる事象を予測する処理について説
明する。
【0032】まず、格フレーム1を図2に示す因果知識
グラフ上で検索する。この因果知識グラフにおいて、ア
ークに付与されたラベルには、因果の形態として推移の
方向と因果の関係および因果の度合が付与されている。
例えば、ラベル1-3には因果の形態として推移の方向
「1-3」、関係「原因理由」、因果の度合「0.5」が
付与されている。
【0033】ここで、格フレーム1と接続されたアーク
を選択すると、アーク1-2、アーク1-3、アーク1-5、
アーク1-6が獲得される。これらのアークに付与された
ラベル1-2、ラベル1-3、ラベル1-5、ラベル1-6の情
報に基づいて、格フレーム1から格フレーム2、格フレ
ーム3、格フレーム5、格フレーム6への推移の度合を
計算する。ここで、一例として格フレーム1から格フレ
ームiへの推移の度合「推移1i 」の計算式を下記に示
す。
【0034】
【数1】 推移1i =f1 (ラベル1i の推移の方向) ×f2 (ラベル1i の因果の関係) ×(ラベル1i の因果の度合) (i=2,3,5,6) f1 は、推移の方向が「1→i」と「1⇔i」の時に
1、「1←i」の時に0となる関数である。また、f2
は、因果の関係が「原因理由」の時に1、それ以外のと
きには0.5の値を与える関数である。この式に基づい
て図4のように計算を行い、推移1-2=0、推移1-3=
0.5、推移1-5=0.45、推移1-6=0.1が得ら
れる。なお、この図では向きの種類(→,←,⇔)をそ
れぞれ(順、逆、両)と表記している。
【0035】このようにして決定された推移の度合に基
づいて、格フレーム1から推移し得る格フレームを事象
として選択する。ここでは、最も推移の度合の高くなる
アークで結ばれた格フレームを選択する。推移の度合は
アーク1-3が最も高く、最も起こりやすい事象として格
フレーム3が選択される。最終的に、この格フレーム3
「(主体)は(病院)へ行く」を推移する事象の予測と
して出力する。
【0036】ここでは、直接格フレーム1にアークで接
続された格フレームのみから推移の予測を行う例を説明
したが、格フレーム1と2段のアークで接続している格
フレーム4との推移は、推移3-4と推移1-3の積などに
よって表すことができることは明らかである。
【0037】次に、図5、図6に示すフローチャートを
参照して、本発明の第2の実施形態に係る事象推移予測
方法について説明する。この実施形態は、第1の実施形
態における因果知識グラフを自然言語テキストから自動
的に作成するものである。すなわち、自然言語テキスト
に対して既存の構文解析処理を用いて得られる構文同士
の接続関係や係り受け関係から事象間の因果関係を獲得
することにより因果知識グラフを構築するものである。
【0038】図5、図6においては、ある自然言語テキ
ストにおいて句点を検出して、複数の文1,文2,…文
kに分割する(ステップS31)。そして、すべての文
のそれぞれについて以下の処理を順次行い、因果知識グ
ラフにアークと付与されるラベルの追加等を行うために
各文を特定するパラメータlを1に設定し(ステップS
33)、各文l(l=1,2,…,k)について以下の
処理を行う。まず、すべての文lについて以下の処理を
終了したか否かをチェックするために、文に付与された
パラメータlがすべての文の数kよりも大きいか否かを
チェックする(ステップS35)。最初は、パラメータ
lはkよりも小さいが、すべての文lについて処理を完
了して、lがkよりも大きくなった場合には、処理を終
了する(ステップS37)。
【0039】文に付与されたパラメータlがk以下の場
合には、まず構文解析により文lに格フレームが含まれ
るかを判定する(ステップS39)。この構文解析は、
日英翻訳システムALT−J/Eの日本語処理部分のよ
うに、格フレームの集合を保有し、文のどの部分が格フ
レームに対応するかを判断するシステムであれば、どの
ようなものであっても構わない。含まれる格フレームを
「格フレームl1 ,…,格フレームlq 」とする。因果
知識グラフにおいて、事象間の推移を表す情報は、格フ
レーム間のアークとラベルであるために、文lが単文で
1つの格フレームのみを含む場合には、事象の推移に関
する情報が含まれない。
【0040】従って、文lが2つ以上の格フレームを含
むか否かをチェック(ステップS41)、1つの格フレ
ームのみの単文である場合には、その文の処理を終了
し、次の文の処理を行う(ステップS43)。文lが複
文や重文であり格フレームが2つ以上含まれる場合に
は、格フレームl1,…,格フレームlq 中のすべての2
つの格フレームの組み合わせ、格フレームls と格フレ
ームlt (t<s)について、以下の処理を行うために
パラメータsとtを設定する(ステップS45〜S5
3)。
【0041】文lにおける格フレームls と格フレーム
lt の構文的接続関係を判別し(ステップS55)、関
係がない場合には、tをインクリメントするが(ステッ
プS57)、関係がある場合には、アークと因果の形態
(「因果の形態ls lt 」と呼ぶ)を抽出する(ステッ
プS59)。これは文lの構文解析を行い、2つの格フ
レームを繋ぐ接続詞などの情報より、因果の形態を獲得
する。例えば、図7のような因果の形態データベースを
予め構築しておき、解析する文で格フレームls と格フ
レームlt が「だから」という接続詞で結びつけられて
いることを判定した場合、因果の形態データベースを参
照し、因果の向き「ls →lt 」、因果の種類「原因理
由」を2つの格フレーム間の因果の形態として取得す
る。
【0042】次に、文l中での格フレームls と格フレ
ームlt の中の用言を修飾する副詞等を判定し、その副
詞に基づいて、2つの格フレーム間の因果の度合を決定
する(ステップS61)。2つの格フレーム間の因果の
度合とは、値が大きいほどアークで結びつけられた格フ
レームの因果同士の推移の起こりやすさが強いことを表
す数値である。この度合を決定するためには、程度や量
と関わり得ると判断されるような副詞に関して、副詞が
原因となる格フレームもしくは結果となる格フレームの
用言を修飾する場合それぞれに応じた因果の度合の対応
データベースを予め作成しておく。その一例を図8に挙
げる。原因が強調されている場合は因果は弱いと考えら
れ、逆に結果が強調されていれば、因果は強いと考える
ことができる。例えば、結果となる事象の格フレーム中
の用言が「とても」で修飾されている場合、因果の度合
として7を付与する。このような副詞が存在しない場合
には、度合は初期値(例えば1)を与える。また、副詞
が複数存在する場合には、対応する度合を加算したも
の、または積算したもの等、統合した値を因果の度合と
することは明らかである。
【0043】次に、因果知識グラフ中で、格フレームl
s と格フレームlt の間にアークが張られているかを判
定する(ステップS63)。もし張られていない場合に
は、アークls lt を因果グラフに新設し(ステップS
65)、上記手続きによって獲得された因果の形態と因
果の度合を含むラベルls lt をアークls lt に付与
する(ステップS67)。また、既にアークls lt が
存在する時には、ラベルls lt も既に存在するので、
そこに因果の形態と因果の度合を追加する(ステップS
69)。因果の形態は、既に存在する因果の形態と同じ
であればそのまま、別であれば追記する。また、因果の
度合は、加算もしくは積算等の統合を行う。
【0044】文lについて、そこに含まれるすべての2
つの格フレームの組み合わせにおいて、上記のような因
果知識グラフへのアークとラベルの新設・追加を行う。
そして、この処理を自然言語テキスト中のすべての文に
ついて行い、処理が終った段階で終了となる。
【0045】第2の実施形態について、具体例で説明す
る。自然言語テキスト「私はお腹が痛いので、すぐに大
学病院に行った」を入力とする。この場合、文は1つな
ので、この文についてのみ処理を行う。まず、構文解析
によって、文には2つの格フレーム「(主体)は(体の
一部)が痛む」(格フレームi)と「(主体)は(病
院)に行く」(格フレームj)が存在すると判定され
る。次に、図7の因果の形態データベースを参照し、2
つの格フレームが「ので」で接続されていることを判断
し、因果の向きは、「i→j」であり、その関係は「原
因理由」であることを判定する。
【0046】次に、格フレームj「(主体)は(病院)
に行く」の用言「行く」が副詞「すぐに」で修飾されて
いることを判断し、図8の因果の度合データベースを参
照し、「すぐに」に対応する因果の度合5を取り出す。
それから、因果知識グラフ中に格フレームiと格フレー
ムjの間にアークが張られているかを調べる。アークが
張られていない場合には、アークijを新設し、そのア
ークに、因果の形態として因果の向き「i→j」、因果
の関係「原因理由」、因果の度合5を情報とするラベル
ijを付与する。
【0047】第3の実施形態は、第1の実施形態の入力
としての格フレームを自然言語テキスト文とし、それを
格フレームに変換すること以外は、第1の実施形態と同
一である。自然言語テキスト文を格フレームに変換する
ことは、格フレームの集合を保有する構文解析であれば
どのようなものであっても構わない。
【0048】第3の実施形態を具体的に説明する。ユー
ザが「私は、頭が痛む」という文を事象として入力し、
推移する事象の予測を行う場合を述べる。まず、上記文
を構文解析し、図3における格フレーム1「(主体)は
(体の一部)が痛む」が選択される。その後の処理は、
具体例と同一に行われ、図3における格フレーム3
「(主体)は(病院)へ行く」が予測され得る事象とし
て出力される。
【0049】このように第3の実施形態では、ユーザが
より自然な形、すなわち自然文による事象の入力を可能
にしている。ユーザが推移の原因となり得る事象を自然
言語文で入力すると、この文を構成する格フレームが判
定され、入力された事象と適合する格フレームに変換さ
れる。この格フレームの集合から格フレームに対して常
識的に起こり得る格フレームが選択される。
【0050】
【発明の効果】以上説明したように、本発明によれば、
格フレームからなるノードと、因果関係を有するノード
同士を繋ぐアークと、該アークで繋がれたノード間の因
果関係の形態と度合を表すラベルとから因果知識グラフ
を構築し、指定された格フレームに対するノードを因果
知識グラフから検索し、この検索したノードとアークを
介して接続される各ノードを列挙し、この列挙したノー
ドの各々と前記検索したノードとをそれぞれ接続する各
アークのラベルに基づいて前記指定されたノードに対し
て常識的に次に起こり得るノードを出力するので、事象
および因果が定式化した因果知識グラフおよび因果知識
ベースを構築でき、人が行うような常識的な事象の推移
予測を適確に行うことができる。
【0051】また、本発明によれば、自然言語テキスト
を文に分割し、この文の各々を構成する複数の格フレー
ムを判定し、この複数の格フレーム間の構文的な接続関
係に基づいて複数の格フレームに対応する因果知識グラ
フ中のノード間のアークと因果関係の形態を獲得し、同
一因果関係が複数得られた場合の出現頻度および該文中
の用言を修飾する修飾辞から該ノード間の因果関係の度
合を獲得することにより自然言語テキストから因果知識
グラフを構築することができるので、従来のように人手
による入力を必要とすることなく、自然言語テキストか
ら事象および因果を抽出して、因果知識ベースを自動的
に獲得でき、様々な分野に存在する自然言語テキストか
らそれぞれの分野に応じた常識的な因果知識を獲得でき
る。例えば、学校教育で使用される教科書を知識源とす
れば、その学年に応じた因果知識ベースの構築および事
象の推移予測を行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る事象推移予測方
法に使用される因果知識グラフを部分的に示す図であ
る。
【図2】図1に示す因果知識グラフを更に具体的に示す
図である。
【図3】図1、図2に示す実施形態の作用を示すフロー
チャートである。
【図4】格フレーム間の推移の度合の計算例を示す図で
ある。
【図5】本発明の第2の実施形態に係る事象推移予測方
法の作用の一部を示すフローチャートである。
【図6】本発明の第2の実施形態に係る事象推移予測方
法の作用の残りの部分を示すフローチャートである。
【図7】図5、図6の実施形態に使用される因果の形態
データベース例を示す図である。
【図8】図5、図6の実施形態に使用される因果の度合
データベース例を示す図である。
【符号の説明】
1,2,3,n 格フレーム 1-2,1-3,1-n,2-3 アーク、ラベル

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 用言を中心に他の単語との対応関係を整
    理した格フレームを事象の集合と見なし、該格フレーム
    集合中の任意の指定された格フレームに対して常識的に
    次に起こり得る格フレームを予測する事象推移予測方法
    であって、前記格フレームからなるノードと、因果関係
    を有するノード同士を繋ぐアークと、該アークで繋がれ
    たノード間の因果関係の形態と度合を表すラベルとから
    因果知識グラフを構築し、指定された格フレームに対す
    るノードを前記因果知識グラフから検索し、この検索し
    たノードとアークを介して接続される各ノードを列挙
    し、この列挙したノードの各々と前記検索したノードと
    をそれぞれ接続する各アークのラベルに基づいて前記指
    定されたノードに対して常識的に次に起こり得るノード
    を出力することを特徴とする事象推移予測方法。
  2. 【請求項2】 前記因果知識グラフを自然言語テキスト
    から構築するために、該自然言語テキストを文に分割
    し、この分割された文の各々を構成する複数の格フレー
    ムを判定し、この判定された複数の格フレーム間の構文
    的な接続関係を判定し、この接続関係に基づいて該複数
    の格フレームに対応する因果知識グラフ中のノード間の
    アークと因果関係の形態を獲得し、同一因果関係が複数
    得られた場合の出現頻度および該文中の用言を修飾する
    修飾辞から該ノード間の因果関係の度合を獲得すること
    を特徴とする請求項1記載の事象推移予測方法。
  3. 【請求項3】 任意の自然言語文を事象とし、該自然言
    語文を適合する格フレームに変換し、この格フレームに
    対するノードを前記因果知識グラフから検索し、この検
    索したノードとアークを介して接続されるノードの各々
    と前記検索したノードとをそれぞれ接続する各アークの
    ラベルに基づいて前記格フレームに対して常識的に次に
    起こり得る格フレームを検出することを特徴とする請求
    項1記載の事象推移予測方法。
  4. 【請求項4】 用言を中心に他の単語との対応関係を整
    理した格フレームを事象の集合と見なし、該格フレーム
    集合中の任意の指定された格フレームに対して常識的に
    次に起こり得る格フレームを予測する事象推移予測プロ
    グラムを記録した記録媒体であって、前記格フレームか
    らなるノードと、因果関係を有するノード同士を繋ぐア
    ークと、該アークで繋がれたノード間の因果関係の形態
    と度合を表すラベルとからなる因果知識グラフを構築
    し、指定された格フレームに対するノードを前記因果知
    識グラフから検索し、この検索したノードとアークを介
    して接続される各ノードを列挙し、この列挙したノード
    の各々と前記検索したノードとをそれぞれ接続する各ア
    ークのラベルに基づいて前記指定されたノードに対して
    常識的に次に起こり得るノードを出力することを特徴と
    する事象推移予測プログラムを記録した記録媒体。
  5. 【請求項5】 前記因果知識グラフを自然言語テキスト
    から構築するために、該自然言語テキストを文に分割
    し、この分割された文の各々を構成する複数の格フレー
    ムを判定し、この判定された複数の格フレーム間の構文
    的な接続関係を判定し、この接続関係に基づいて該複数
    の格フレームに対応する因果知識グラフ中のノード間の
    アークと因果関係の形態を獲得し、同一因果関係が複数
    得られた場合の出現頻度および該文中の用言を修飾する
    修飾辞から該ノード間の因果関係の度合を獲得すること
    を特徴とする請求項4記載の事象推移予測プログラムを
    記録した記録媒体。
JP10049851A 1998-03-02 1998-03-02 事象推移予測方法および事象推移予測プログラムを記録した記録媒体 Pending JPH11250085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10049851A JPH11250085A (ja) 1998-03-02 1998-03-02 事象推移予測方法および事象推移予測プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10049851A JPH11250085A (ja) 1998-03-02 1998-03-02 事象推移予測方法および事象推移予測プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPH11250085A true JPH11250085A (ja) 1999-09-17

Family

ID=12842575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10049851A Pending JPH11250085A (ja) 1998-03-02 1998-03-02 事象推移予測方法および事象推移予測プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JPH11250085A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008102562A (ja) * 2006-10-17 2008-05-01 Fujitsu Ltd シナリオ作成支援プロブラム及び装置及び方法
JP2008203964A (ja) * 2007-02-16 2008-09-04 Nec Corp 因果関係分析装置、因果関係分析方法及びプログラム
JP2008226168A (ja) * 2007-03-15 2008-09-25 Omron Corp 因果推論装置、その制御プログラムおよび制御方法
JP2010271819A (ja) * 2009-05-20 2010-12-02 Nec Corp 語句関係抽出装置、語句関係抽出方法及びプログラム
WO2014132402A1 (ja) * 2013-02-28 2014-09-04 株式会社東芝 データ処理装置および物語モデル構築方法
JP2017072875A (ja) * 2015-10-05 2017-04-13 哲明 仲村 情報処理装置、情報処理方法、データ構造およびプログラム
JPWO2016063341A1 (ja) * 2014-10-21 2017-05-18 株式会社日立製作所 時系列予測装置、及び時系列予測方法
JP6159002B1 (ja) * 2016-09-20 2017-07-05 ヤフー株式会社 推定装置、推定方法及び推定プログラム
WO2018056423A1 (ja) * 2016-09-26 2018-03-29 国立研究開発法人情報通信研究機構 シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム
JP2018049587A (ja) * 2017-06-08 2018-03-29 ヤフー株式会社 推定装置、推定方法及び推定プログラム
JP2021068109A (ja) * 2019-10-21 2021-04-30 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008102562A (ja) * 2006-10-17 2008-05-01 Fujitsu Ltd シナリオ作成支援プロブラム及び装置及び方法
JP2008203964A (ja) * 2007-02-16 2008-09-04 Nec Corp 因果関係分析装置、因果関係分析方法及びプログラム
JP2008226168A (ja) * 2007-03-15 2008-09-25 Omron Corp 因果推論装置、その制御プログラムおよび制御方法
JP2010271819A (ja) * 2009-05-20 2010-12-02 Nec Corp 語句関係抽出装置、語句関係抽出方法及びプログラム
US9904677B2 (en) 2013-02-28 2018-02-27 Kabushiki Kaisha Toshiba Data processing device for contextual analysis and method for constructing script model
WO2014132402A1 (ja) * 2013-02-28 2014-09-04 株式会社東芝 データ処理装置および物語モデル構築方法
JP5945062B2 (ja) * 2013-02-28 2016-07-05 株式会社東芝 データ処理装置および物語モデル構築方法
JPWO2016063341A1 (ja) * 2014-10-21 2017-05-18 株式会社日立製作所 時系列予測装置、及び時系列予測方法
JP2017072875A (ja) * 2015-10-05 2017-04-13 哲明 仲村 情報処理装置、情報処理方法、データ構造およびプログラム
JP6159002B1 (ja) * 2016-09-20 2017-07-05 ヤフー株式会社 推定装置、推定方法及び推定プログラム
JP2018049340A (ja) * 2016-09-20 2018-03-29 ヤフー株式会社 推定装置、推定方法及び推定プログラム
US11068793B2 (en) 2016-09-20 2021-07-20 Yahoo Japan Corporation Causality analysis device, method, and non-transitory computer readable storage medium with determination of causal advantages and disadvantages to a user
WO2018056423A1 (ja) * 2016-09-26 2018-03-29 国立研究開発法人情報通信研究機構 シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム
US10963646B2 (en) 2016-09-26 2021-03-30 National Institute Of Information And Communications Technology Scenario passage pair recognizer, scenario classifier, and computer program therefor
JP2018049587A (ja) * 2017-06-08 2018-03-29 ヤフー株式会社 推定装置、推定方法及び推定プログラム
JP2021068109A (ja) * 2019-10-21 2021-04-30 富士ゼロックス株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US7689411B2 (en) Concept matching
JP4658420B2 (ja) 文字列の正規化表示を生成するシステム
Hacherouf et al. Transforming XML documents to OWL ontologies: A survey
US20100145902A1 (en) Methods and systems to train models to extract and integrate information from data sources
US20100030552A1 (en) Deriving ontology based on linguistics and community tag clouds
US20090112903A1 (en) Ontology data import/export method and apparatus
JPH07319917A (ja) 文書データべース管理装置および文書データべースシステム
JPH11250085A (ja) 事象推移予測方法および事象推移予測プログラムを記録した記録媒体
AU2013270517B2 (en) Patent mapping
Galitsky Artificial intelligence for customer relationship management
KR100575581B1 (ko) 우선순위 그래프를 이용한 제품 계열의 기능 분석 및테스팅 경로 분석 장치 및 그 방법
WO2006015110A2 (en) Patent mapping
JP2009128949A (ja) グラフ表示装置およびプログラム
Ren et al. Resource recommendation algorithm based on text semantics and sentiment analysis
Kettler et al. A template-based markup tool for semantic web content
US20040093333A1 (en) Structured data retrieval apparatus, method, and program
Tiwari et al. Mold-a framework for entity extraction and summarization
Gilardoni et al. LKMS–A legal knowledge management system exploiting semantic Web technologies
Fuchs et al. Supporting model-based construction of semantic-enabled web applications
Konstantopoulos et al. Authoring semantic and linguistic knowledge for the dynamic generation of personalized descriptions
Vidra et al. Next Step in Online Querying and Visualization of Word-Formation Networks
Konstantopoulos et al. An intelligent authoring environment for abstract semantic representations of cultural object descriptions
Cohen-Boulakia et al. Selecting biological data sources and tools with xpr, a path language for rdf
Gärtner et al. Making Corpus Querying Ready for the Future: Challenges and Concepts.
JP4938298B2 (ja) テキストの要約に含める文の候補を出力する方法およびプログラム