JP2009059323A

JP2009059323A - 知識生成システム

Info

Publication number: JP2009059323A
Application number: JP2007228570A
Authority: JP
Inventors: Masaki Ida; 政樹伊田; Hoshiko Ito; 星子伊藤
Original assignee: Omron Corp; Omron Tateisi Electronics Co
Current assignee: Omron Corp
Priority date: 2007-09-04
Filing date: 2007-09-04
Publication date: 2009-03-19

Abstract

【課題】未経験の問題を解決するための新たな知識を既存の知識から自動生成するための技術を提供する。
【解決手段】システムは、複数の事象を事象間の因果関係と共に予め記憶している因果関係ＤＢと、入力された入力事象と因果関係ＤＢに記憶されている事象との間の因果関係を類推する類推部２と、を備える。類推部２は、因果関係ＤＢに記憶された複数の事象の中から、入力事象に類似する第１の事象、第１の事象と因果関係を有する第２の事象、及び、第２の事象に類似する第３の事象を順次検索する抽象化・検索部２１と、第３の事象の中から、入力事象にドメインが類似する事象を選択し、選択された事象と入力事象との間に因果関係があるものとみなす写像・具体化部２２と、を備える。
【選択図】図１

Description

本発明は、事象間の因果関係に関する知識を自動生成する技術に関する。

人間であれば、過去の経験や知識を応用して、未経験の問題に対する有効な解決策を見出したり、予測・診断により問題の発生や拡大を未然に防いだりすることができる。しかしながら、コンピュータによる問題解決手法で同様のことを実現するのは極めて難しい。たとえば、類似事例検索に基づいた問題解決システムでは、未経験の問題はデータベースに事例が存在しないため、適切な検索結果を得ることができない。また、エキスパートシステムの応用例である原因分析システムにおいても、問題を解決するための知識が存在しなければ原因を分析することができない。

とはいえ、未経験の問題が無くなるほどの十分な知識をシステムに揃えるのは非現実的である。もし人手で作成するとしたら、専門的知識をもつ熟練者が多大な時間と労力をかける必要があり高コストであるし、事例を蓄積するにしても、未経験の問題に遭遇しなくなるまで網羅的に収集するのはほとんど不可能だからである。また、事故とか故障といった重大な問題ほど発生頻度は低いため、事例の収集が難しいという事情もある。

なお、関連する先行技術としては、特許文献１〜３がある。特許文献１では、階層的な概念知識をもとに推論することで未知の現象に対応する手法が提案されている。しかしこの手法は、階層的な知識の作成自体が難しく、その実現方法やコストが課題となる。また特許文献２では、未知の入力があったときに、それまでとの差分を考慮して知識を適応学習する装置が開示されている。しかしこの装置は、逐次的に賢くはなるものの、未知の現象に対応できるわけではなく、初めての事例は解決できない。また特許文献３では、因果構造を適応化する機構を備えたシステムが提案されているが、このシステムは優先度の値を更新するだけなので、未知の現象に対応できるわけではない。
特開２００５−１５７９０７号公報特開平６−１８７３１８号公報特開２００１−１１７７７４号公報

本発明は上記実情に鑑みてなされたものであって、その目的とするところは、未経験の問題を解決するための新たな知識を既存の知識から自動生成するための技術を提供することにある。

上記目的を達成するために本発明は、以下の構成を採用する。

本発明に係る知識生成システムは、複数の事象を事象間の因果関係と共に予め記憶している記憶手段と、入力された入力事象と前記記憶手段に記憶されている事象との間の因果関係を類推する類推手段と、を備える。具体的には、前記類推手段は、前記記憶手段に記憶された複数の事象の中から、前記入力事象に類似する第１の事象、前記第１の事象と因果関係を有する第２の事象、及び、前記第２の事象に類似する第３の事象を順次検索し、前記第３の事象の中から、前記入力事象にドメインが類似する事象を選択し、前記選択された事象と前記入力事象との間に因果関係があるものとみなす。

ここで「事象」とは、因果関係の「因（原因）」または「果（結果）」となり得る現象の単位であり、それ単体で意味を成すひとまとまりの文もしくは語句の組み合わせである。２つの事象が類似するとは、２つの事象の意味が類似（同一を含む）することをいう。２つの事象のドメインが類似するとは、２つの事象の属する分野（問題領域）が類似（同一を含む）することをいう。

この構成によれば、既存の因果知識（事象の組み合わせとそれらの間の因果関係）を類推適用することで、入力事象に対する新たな因果知識を獲得することができる。よって、未経験の問題に対する原因分析や結果予測が可能となる。

ここで、前記類推手段は、各事象に含まれる語句と係受け関係を有する語句の傾向を表す情報に基づいて、２つの事象の類似度を評価するとよい。意味の類似する語句は、互いに置換可能であったり、同じような文脈で使われることが多いため、「係受け関係を有する語句の傾向」が類似する蓋然性が高い。よって、「係受け関係を有する語句の傾向」に着目することで、２つの事象の意味内容が類似するかどうかを精度よく判定可能である。

「係受け関係を有する語句の傾向を表す情報」として、「係受け関係を有する語句の種類及びその出現頻度」を用いることができる。このとき、システムが、所定の文書群から予め求められた、対象語句と係受け関係を有する語句の種類及びその出現頻度を、当該対象語句の意味情報として記憶している意味情報記憶手段を備えていることが好ましい。ある事象が与えられた場合に、その事象に含まれる語句を意味情報記憶手段に登録されている対象語句の中から検索するだけで、当該事象に関する意味情報を高速かつ簡単に取得することができる。そして、前記類推手段は、各事象に含まれる語句の意味情報を比較することによって、２つの事象の類似度を評価するとよい。

前記類推手段は、各事象に含まれる語句と共起する語句の傾向を表す情報に基づいて、２つの事象のドメインの類似度を評価するとよい。同一文書中に現れる（共起する）語句は同一又は非常に近いドメインに属する語句である可能性があり、共起頻度が高いほどその可能性は高くなる。よって、「共起する語句の傾向」に着目することで、２つの事象のドメインが類似するかどうかを精度よく判定可能である。

「共起する語句の傾向を表す情報」として、「同一文書内に共起する語句の種類及びその出現頻度」を用いることができる。このとき、システムが、所定の文書群から予め求められた、対象語句と同一文書内に共起する語句の種類及びその出現頻度を、当該対象語句のドメイン情報として記憶しているドメイン情報記憶手段を備えていることが好ましい。ある事象が与えられた場合に、その事象に含まれる語句をドメイン情報記憶手段に登録されている対象語句の中から検索するだけで、当該事象に関するドメイン情報を簡単かつ高速に取得することができる。前記類推手段は、各事象に含まれる語句のドメイン情報を比較することによって、２つの事象のドメインの類似度を評価するとよい。

ところで、上述した「類推」は、記憶手段に登録されている既存の因果知識が基礎となる。記憶手段に登録する因果知識は、コーパス（文書群）から自動で獲得されたものでもよいし、人手で作成されたものでもよいが、労力やコストを考慮すると前者のほうが好ましい。そこで、本発明は、コーパスから因果知識を獲得（学習）するための機能も提供する。

具体的には、本発明は、２つの事象の間の因果関係の強度を推定する推定手段を備える。推定手段は、前記２つの事象から語句を抽出し、前記抽出された語句の集合と、予め定められたＮ個の語句集合のそれぞれとの類似度を算出し、前記Ｎ個の語句集合との類似度に対する因果関係の強度分布を規定するモデルを用いて、前記算出された類似度に対応す
る因果関係の強度を算出し、前記算出された因果関係の強度に基づき、前記２つの事象の間の因果関係の有無を推定する。

この手法では、離散値である事象が類似度という連続量のパラメータに変換されるため、任意の事象間の因果関係の強度を算出可能となる。よって、文書中に因果が明示されていない事象の組み合わせや、モデル生成時に現れなかった事象の組み合わせであっても、因果関係の強度を推定でき、因果知識の獲得が可能となる。

システムが、教師データから前記モデルを生成するモデル生成手段をさらに備えることが好ましい。教師データは、因果関係を有する事象のペアを複数含むものである。前記モデル生成手段は、前記事象のペアから抽出された語句の集合と前記Ｎ個の語句集合のそれぞれとの類似度を算出して、その算出された類似度をＮ次元空間へマッピングし、前記複数の事象のペアに対応する複数の点がマッピングされたＮ次元空間において、前記点の密度分布を算出し、前記算出された密度分布を前記因果関係の強度分布とするとよい。密度分布（強度分布）には適当な確率分布をあてはめればよい。このような統計的学習によって、Ｎ個の語句集合との類似度に対する因果関係の強度を表すモデルを自動で生成することができる。

本発明は、上記手段の少なくとも一部を有する知識生成システムとして捉えてもよいし、上記処理の少なくとも一部を含む知識生成方法、または、かかる方法を実現するためのプログラムやそのプログラムを記録した記録媒体として捉えることもできる。なお、上記手段および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。

本発明によれば、未経験の問題を解決するための新たな因果知識を既存の因果知識から自動生成することができる。これにより、未経験の事象に対する原因推定や結果予測などの問題解決が可能になる。

本発明の実施形態に係る知識生成システムは、類推に基づいて類似事例から新たな因果知識を生成することで、未経験の問題の解決を可能とするシステムである。類推（Analogy）とは、「類似した状況においては類似した事実が成り立つ」という前提の下、いくつ
かの与えられた対象間の類似性を検出し、その類否を用いて、一方の対象で成立した事実や知識を、もう一方の対象に変換することにより、問題解決の手がかりを得たり、未知の事実などを予測したりすることである。

たとえば、「（原因）ＱＦＰ部品でリード曲がり発生」→「（結果）ハンダのブリッジ不良発生」、という因果知識を有していたとする。ＱＦＰ部品とＳＯＰ部品の足の形の類似性に着目し、ＱＦＰ部品の知識をＳＯＰ部品に類推適用すれば、ＳＯＰ部品でリード曲がりが発生したときにも（未知の事象）、ブリッジ不良が発生するおそれがある、という結果予測が可能になる。また、「雨の日に家庭用プリンタの調子が悪くなるのは紙やインクの湿気が原因である」という因果知識を、印刷プロセスの類似性に着目して、基板のハンダ印刷工程に類推適用することで、印刷不良の増加（未知の事象）は基板の湿気が原因の可能性がある、といった原因推定が可能となる。

＜システム構成＞
図１は、本発明の実施形態に係る知識生成システムの全体構成を示している。

知識生成システムは、その構成要素として、学習部１、類推部２、問題解決部３を備える。また、構成要素間のインタフェースとして、汎用知識ＤＢ（データベース）４、類推
知識ＤＢ５を備える。また、ユーザインタフェースとして、コーパス６、入力部７、表示部８を備えている。なお、知識生成システムは、ハードウエア的には、ＣＰＵ、記憶装置（メモリ、ハードディスクなど）、入力装置、表示装置などを具備する汎用的なコンピュータにより構成可能である。図１に示される各々の機能は、ＣＰＵが記憶装置に格納されたプログラムを実行し、必要に応じて記憶装置、入力装置、表示装置などのハードウエア資源を利用することで、実現されるものである。

＜学習部＞
学習部１は、所定の文書群であるコーパス６から汎用知識を学習（獲得）する機能である。学習部１は、（１）因果学習部１０、（２）事象類似モデル学習部１１、（３）ドメイン類似モデル学習部１２、（４）データ整備部１３から構成される。学習部１による学習結果は汎用知識ＤＢ４に格納される。なお、汎用知識ＤＢ４には、因果関係ＤＢ４０、事象類似モデル４１、ドメイン類似モデル４２、テキスト解析辞書４３などが格納される。

（１）因果学習部
因果学習部１０は、コーパス６から事象を抽出し、事象間の因果関係の有無を推定する機能である。コーパス６とは事例が記述された文書の集合体であり、たとえば、過去の不具合報告、顧客問い合わせ履歴、新聞記事データ、論文集などをコーパス６として利用可能である。

図２に示すように、因果学習部１０は、コーパス６から処理対象とする文書を読み込み、テキスト解析辞書４３を利用してテキスト解析（形態素解析および係受け解析）を実行する（Ｓ２０）。テキスト解析辞書４３には、コーパス６内に出現する専門用語や固有名詞などが予め登録されているものとする。

次に、因果学習部１０は、テキスト解析の結果から「事象」を抽出する（Ｓ２１）。ここでは、因果関係の「因（原因）」または「果（結果）」となり得る現象の単位を「事象」と定義する。因果学習部１０は、格フレーム解析を行い、述語（動詞、形容詞、形容動詞、サ変名詞）と述語に係る語句の組を事象として抽出する。文書から複数の事象が抽出されると、それらの事象のリストが次の処理にわたされる。

因果学習部１０は、抽出された複数の事象の間の因果強度を推定する（Ｓ２２）。事象の全ての組み合わせについて因果強度が推定され、その結果が因果関係ＤＢ４０に格納される（Ｓ２３）。記憶容量の削減のため、因果強度が所定値よりも大きな組み合わせのみ（つまり、因果関係がありそうな事象の組み合わせのみ）を因果関係ＤＢ４０に登録するとよい。

因果関係ＤＢ４０は、たとえば、因の事象、果の事象、因果強度、因果属性の４つの情報で１つの因果知識を表す。因果強度とは事象間の因果関係の強さを０．０（因果関係なし）〜１．０（因果関係あり）のスカラー値で表現したものである。因果属性とは因果関係の分類（原因・前提条件）を指す。本実施形態では、因果関係ＤＢ４０が、複数の事象を事象間の因果関係と共に予め記憶している記憶手段を構成している。

（因果強度推定処理）
図３は、因果学習部１０による因果強度推定処理を示すブロック図である。文書中の因果関係は、接続詞等の識別語によって明示されている場合と明示されていない場合とがある。その両者に対応するため、因果学習部１０は、推定対象となる事象のペアに対して、（Ａ）識別語による因果関係抽出（１０１）と、（Ｂ）統計モデルによる因果強度推定（１０３）の両方を行い、それらの出力スコアから事象間の因果強度を決定する（１０４）
。たとえば、出力スコアの大きな方が事象間の因果強度の値として採用される。本実施形態では、因果学習部１０のこの機能が、２つの事象の間の因果関係の強度を推定する推定手段を構成する。

（Ａ）識別語による因果関係抽出
接続詞等の識別語により明示的に因果関係が示されている場合は、その前後の事象間に因果関係が存在することが分かる。たとえば、「雨が降ったので服が濡れた」という事例においては、識別語「ので」を鍵に事象「雨が降る」と事象「服が濡れる」の間に因果関係が存在することを推測できる。

識別語リスト１００には、このような識別語が予め複数登録されている。因果学習部１０はテキスト解析（Ｓ２０）の結果と識別語リスト１００とを参照して、２つの事象の間に因果関係があるか否か判定し、その結果を０（因果関係なし）／１（因果関係あり）で出力する。

（Ｂ）統計モデルによる因果強度推定
「雨が降り、服が濡れた」のように文書中に因果関係が明示されていない場合は、識別語を手がかりとする手法は利用できない。このような非明示の因果関係に対応する手法としては、隠れ変数モデルを用いた手法がある。学習により事象間の因果関係を隠れ変数を用いてモデル化するというものである。しかしこの手法は、各々の事象を離散値として扱っているために、モデル学習の際に出現しなかった事象の組み合わせに関しては因果知識を獲得できないという問題がある。たとえば、「雨が降ると服が濡れる」「雪が降ると服が濡れる」という２つの因果関係がわかっていても、未知事象「みぞれが降る」については因果を導出できないのである。このような問題を解決するために、未知事象を考慮する必要がなくなるまで教師データを収集するとか、「雨＜みぞれ＜雪」のように用語の大小・順序を考慮した階層辞書を作成して用語を網羅するといったアプローチも提案されてはいるものの、いずれのアプローチも非現実的である。

そこで本実施形態では、離散値である事象を連続量に変換したものをパラメータとする統計モデルを学習により作成し（１０６）、その統計モデル（１０２）を用いて事象間の因果関係の強度を推定する（１０３）。

（Ｂ１）統計モデルの作成
まず、因果の教師データ１０５と、Ｎ個の語句集合を用意する（Ｎは１以上の整数）。教師データ１０５は、モデル学習用のデータであり、因果関係を有していることが分かっている、多数の事象ペアから構成されている。Ｎ個の語句集合のそれぞれは、意味が類似するか、分野が類似する語句の集合体である。たとえば、辞書分類に基づいて、動物、植物、非生物、人名、行動、・・・のように意味分類されている。

因果学習部１０は、教師データ１０５から因果関係を有する事象のペアを読み込み、その事象のペアから語句を抽出する。たとえば、「みぞれが降る」「服が濡れる」という事象のペアから、それぞれの述語である「降る」「濡れる」という語句が抽出される。

次に、因果学習部１０は、抽出された「降る；濡れる」という語句集合と、Ｎ個の語句集合のそれぞれとの類似度を算出する。語句集合間の類似度は、ワードベクトル間のコサイン距離で求められる。

ワードベクトルとは、対象語句の文脈語の集合を頻度情報として数値化し、対象語句の意味を文脈語の種類とその出現頻度とで表現したベクトルである。概念ファジィ集合（Conceptual Fuzzy-Sets）のひとつの具体例である。図４は、「バス」という対象語句のワ
ードベクトルの一例を示している。「交通」、「時刻」、「駅」などの文脈語により「バス」という語句の概念が形成されていることが分かる。なお、語句集合のワードベクトルは、語句集合を構成する各語句のワードベクトルの成分を包含するベクトルとして定義できる。つまり、「降る；濡れる」という語句集合のワードベクトルは、語句「降る」の文脈語の情報と「濡れる」の文脈語の情報の両方を含むものである。同様に、事象（事象のペア）のワードベクトルは、事象（事象のペア）に含まれる１又は複数の語句のワードベクトルの成分を包含するベクトルと定義できる。

ワードベクトル間のコサイン距離は、下記式により計算できる。下記式において、ａ、ｂはそれぞれワードベクトルであり、ａｉ、ｂｉはワードベクトルの成分である。コサイン距離ｃｏｓ（ａ，ｂ）が小さいほど２つのワードベクトルの類似度は高い、といえる。なお、対象語句ごとに成分（文脈語）の種類や個数が異なり得るため、コサイン距離の算出にあたっては、２つのワードベクトルの成分の種類と個数を揃えておく。

ところで、ワードベクトルを生成する際に、どのような文脈を考慮するかで、コサイン距離で表現される類似度の視点が変わる。文脈語として、対象語句と係受け関係を有する語句を選んだ場合は、対象語句（対象語句を含む語句集合、事象）間の意味内容の類似度を評価することができる。意味の類似する語句は、互いに置換可能であったり、同じような文脈で使われることが多いため、係受け関係を有する語句の傾向が類似する蓋然性が高いからである。一方、文脈語として、対象語句と共起する語句を選んだ場合は、対象語句（対象語句を含む語句集合、事象）間のドメインの類似度を評価できる。同一文書中に共起する語句は同一又は非常に近い問題領域に属している可能性が高いからである。前者を「係受けワードベクトル」、後者を「共起ワードベクトル」とよぶ。

統計モデルの作成には、係受けワードベクトルを用いることとする。これにより、意味分類されているＮ個の語句集合のそれぞれと事例（「降る；濡れる」）との意味内容の類似性を把握することが可能となる。

因果学習部１０は、このようにして求めた類似度をＮ次元空間にマッピングする。図５に示すように、Ｎ次元空間の各軸は各語句集合との類似度を表している。なお、図５は、説明を簡単にするため、２つの語句集合（Ｎ＝２）の場合を示しているが、実際の統計モデルではより多くの語句集合が用いられる。

教師データとして与えられた多数の事象ペアについて、類似度の算出及びＮ次元空間へのマッピングを繰り返す（図５参照）。意味の類似する事象ペアはＮ次元空間内の同じような位置にマッピングされるため、点の密度には偏りが現れてくる。それぞれの点は因果関係を有する事象ペアに対応するものであるから、点の密度分布は因果関係の存在の尤度（もしくは因果関係の強度）を表しているものとみなすことができる。因果学習部１０は、Ｎ次元空間内の点の密度分布を混合ガウス分布でモデル化し、それを因果関係の強度分布とする。このとき、因果強度を０．０〜１．０で規格化しておくとよい。

このようにして作成された統計モデル１０２は、Ｎ個の語句集合との類似度に対する因果関係の強度分布を規定するものである。統計モデル１０２は汎用知識ＤＢに登録され、次に述べる因果強度の算出処理に利用される。

（Ｂ２）因果強度の算出
因果強度の推定対象となる事象のペアが与えられると、因果学習部１０は、モデル作成時の処理と同様、事象のペアから語句を抽出し、その抽出された語句の集合と上記Ｎ個の語句集合のそれぞれとの類似度を算出する。そして、図５の点Ｐに示すように、算出された類似度を統計モデル１０２にあてはめることで、因果関係の強度Ｑを算出する。これは、推定対象の事象ペアの間に因果関係があるならば、教師データのいずれかの事象ペアに意味が類似しており、強度分布（密度分布）の大きな位置にマッピングされるはずである、との予想に基づくものである。

（２）事象類似モデル学習部
事象類似モデル学習部１１は、事象間の類似度を評価するために利用される係受けワードベクトルを作成し、事象類似モデル４１として出力する機能である。

図６に示すように、事象類似モデル学習部１１は、コーパス６から文書を読み込み、テキスト解析（Ｓ６０）及び事象抽出（Ｓ６１）を行う。これらの処理は図２のＳ２０、Ｓ２１と同様である。事象類似モデル学習部１１は、各事象に含まれる述語を対象語句として選び、各対象語句に係る語句（自立語）の出現回数をカウントする（Ｓ６２）。これらの処理をコーパス６内の全ての文書について繰り返すことにより（Ｓ６３）、事象の述語になり得る対象語句の抽出と、各対象語句と係受け関係を有する文脈語の種類及びその出現頻度の学習とが行われる。そして、事象類似モデル学習部１１は、Ｓ６２で得られた対象語句と文脈語の出現頻度とから、各対象語句の係受けワードベクトルを作成する（Ｓ６４）。

このようにして得られた係受けワードベクトルは、対象語句と係受け関係を有する語句の傾向を表す情報、あるいは、対象語句の意味内容を表す意味情報とよぶことができる。

なお、ここで得られた係受けワードベクトルを、上述した因果学習部１０による統計モデルの作成や因果強度の算出に利用してもよい。その場合、因果学習部１０は、語句集合を構成する各語句の係受けワードベクトルを事象類似モデル４１から取得し、それらを合成することで、語句集合に対応する係受けワードベクトルを生成することになる。

（３）ドメイン類似モデル学習部
ドメイン類似モデル学習部１２は、事象間のドメインの類似度を利用される共起ワードベクトルを作成し、ドメイン類似モデル４２として出力する機能である。

図７に示すように、ドメイン類似モデル学習部１２は、コーパス６から文書を読み込み、テキスト解析（Ｓ７０）及び事象抽出（Ｓ７１）を行う。これらの処理は図２のＳ２０、Ｓ２１と同様である。ドメイン類似モデル学習部１２は、各事象に含まれる述語を対象語句として選び、同一文書内に共起する語句（述語を除く。）の出現回数をカウントする（Ｓ７２）。これらの処理をコーパス６内の全ての文書について繰り返すことにより（Ｓ
７３）、事象の述語になり得る対象語句の抽出と、各対象語句と共起する文脈語の種類及びその出現頻度の学習とが行われる。そして、ドメイン類似モデル学習部１２は、Ｓ７２で得られた対象語句と文脈語の出現頻度とから、各対象語句の共起ワードベクトルを作成する（Ｓ７４）。

このようにして得られた共起ワードベクトルは、対象語句と共起する語句の傾向を表す情報、あるいは、対象語句のドメイン（分野、問題領域）を表すドメイン情報とよぶことができる。

（４）データ整備部
データ整備部１３は、学習部１および類推部２におけるテキスト解析処理で利用されるテキスト解析辞書４３を更新・整備する機能である。

図８に示すように、データ整備部１３は、コーパス６に含まれるテキストから自動的に重要語を抽出し（Ｓ８１）、所定フォーマットの追加辞書ファイル４３Ｃを生成する。また、データ整備部１３は、人手による辞書追加機能も有している（Ｓ８０）。追加辞書ファイル４３Ｂ、４３Ｃは、元のテキスト解析辞書４３Ａと統合され（Ｓ８２）、更新されたテキスト解析辞書４３が汎用知識ＤＢ４に格納される。

前処理として、専門用語や固有名詞などをテキスト解析辞書４３に登録し、コーパス６中からテキスト解析における未知語をなくしておくとよい。

＜類推部、入力部＞
入力部７は、解決すべき問題に関する情報をテキスト形式で入力するための現状入力ＵＩを備えている。

類推部２は、解決すべき問題に含まれる事象（入力事象）と因果関係ＤＢ４０に登録されている事象（既知事象）との間の因果関係を類推する機能である。類推部２は、（１）現状理解部２０、（２）抽象化・検索部２１、（３）写像・具体化部２２から構成される。

（１）現状理解部
現状理解部２０は、解決すべき問題として入力されたテキストから、事象と因果関係を抽出する機能である。抽出アルゴリズムは、因果学習部１０のものと同様である。なお、因果関係が抽出できない場合は事象を抽出するだけでも構わない。

（２）抽象化・検索部
抽象化・検索部２１は、因果関係ＤＢ４０から、入力事象に類似した事象を因または果とする因果関係を検索し、入力事象を起点とする抽象化された因果構造（ネットワーク）を生成する機能である。

図９に示すように、まず抽象化・検索部２１は、入力事象および果の事象を着目事象に設定する（Ｓ９０）。現状理解部において果の事象が抽出できなかった場合には入力事象のみを着目事象に設定すればよい。

次に、抽象化・検索部２１は、因果関係ＤＢ４０に登録されている事象の中から、着目事象に類似する事象を検索する（Ｓ９１）。類似度の評価には、事象類似モデル４１が利用される。つまり、抽象化・検索部２１は、着目事象と比較対象の事象のそれぞれから述語を抽出し、各述語を対象語句とする係受けワードベクトルを事象類似モデル４１から取得し、それらのコサイン距離を算出することで類似度を得る。抽象化・検索部２１は、類
似度の値が所定のしきい値より小さい場合に、２つの事象が類似していると判定する。Ｓ９１で索出された事象は着目事象に追加される。なお、索出数が多すぎる場合は、しきい値を変更することで類似判定を厳しくしたり、類似度の小さなものから一定数だけ採用するようにすればよい。

次に、抽象化・検索部２１は、着目事象を因とする果の事象を因果関係ＤＢ４０の中から検索する（Ｓ９２）。索出数が多すぎる場合は、因果強度の大きなものから一定数だけ採用するようにしてもよい。果の事象が索出された場合は（Ｓ９３；ＹＥＳ）、その果の事象を着目事象に追加した後（Ｓ９４）、Ｓ９１に戻る。果の事象が索出されなかった場合は（Ｓ９３；ＮＯ）、Ｓ１００に進む。

また、抽象化・検索部２１は、入力事象および因の事象を着目事象に設定し（Ｓ９５）、Ｓ９１〜Ｓ９４と同様にして、因の方向にも因果構造を展開していく（Ｓ９６〜Ｓ９９）。

そして、両方向の因果構造を結合することで、入力事象を起点に展開された因果構造を得ることができる（Ｓ１００）。

図１０は、抽象化・検索部２１で形成された因果構造の一例を示している。それぞれの円が事象を、矢印が因果を表している。破線は類似する事象のグループを表している。

入力テキストから入力事象Ａ０と果の事象Ｂ０が得られたとする。事象Ａ０の類似事象としてＡ１〜Ａ３が追加され、事象Ｂ０の類似事象としてＢ１、Ｂ２が追加される。事象Ａ０→Ｂ１、Ａ１→Ｂ１、Ａ３→Ｂ２のように、因果関係があることが因果関係ＤＢ４０に既知ならば因果を接続する。続いて、事象Ａ１〜Ａ３の因の事象としてＣ０、Ｄ０、Ｅ０、Ｆ０が追加され、さらにそれらの類似事象としてＣ１、Ｄ１、Ｆ１が追加される。一方、事象Ｂ１、Ｂ２の果の事象としてＧ０、Ｈ０が追加され、それらの類似事象としてＧ１が追加される。さらにＧ１、Ｈ０の因の事象としてＩ０、Ｉ３が追加され、それらの類似事象としてＩ１、Ｉ２が追加される。

（３）写像・具体化部
展開された因果構造には、解決すべき問題とはまったく異なる問題領域の事象も多く含まれている。そこで、写像・具体化部２２が入力事象にドメインが類似する事象のみを選択し、因果関係を再構築する。

図１１に示すように、写像・具体化部２２は、展開された因果構造において、類似事象のグループに順に着目する（Ｓ１１０）。グループ内の複数の事象の中で、入力事象にドメインが類似する事象を選択し、他の事象は削除する（Ｓ１１１）。ドメインの類似度の評価には、ドメイン類似モデル４２が利用される。つまり、写像・具体化部２２は、入力事象と比較対象の事象のそれぞれから述語を抽出し、各述語を対象語句とする共起ワードベクトルをドメイン類似モデル４２から取得し、それらのコサイン距離を算出することで類似度を得る。図１２は、図１０の因果構造において各グループで最もドメインの近い事象のみを選択した例である。事象Ｃ１、Ｄ１、Ｅ０、Ｆ０、Ｇ１、Ｈ０、Ｉ２が選択されている。

ドメインによる絞り込みを全てのグループについて行った後（Ｓ１１２）、写像・具体化部２２は、残された事象の間に因果関係があるものとみなし、因果の連鎖を再構築する（Ｓ１１３）。このとき、図１２に示すように、グループ間の因果の方向や階層を変えないように、事象間を連結していく。

以上の処理により、解決すべき問題（事象Ａ０、Ｂ０）に関わる新たな因果知識が自動生成される。ここで得られた因果知識は、類推知識ＤＢ５に格納される。

＜問題解決部、表示部＞
問題解決部３は、類推知識ＤＢ５の因果知識を用いて問題解決を行う機能である。たとえばベイジアン・ネットワークを利用した因果推論などを利用すればよい。因果推論の結果は、表示部８に出力される。

＜具体例＞
図１３は、類推型問題解決の具体例を示している。

基板の表面実装プロセスにおいて、「ハンダがだれる」という不具合が発生したとする。本システムに「ハンダがだれる」という入力事象を与えると、それに類似する事象として「ペンキがだれる」「接着剤がはみ出す」「ケチャップがはみ出す」という３つの事象が検索される。そして、各類似事象と因果関係を有する事象（図１３の例では原因事象）、さらに各原因事象に類似する事象、と順次検索される。

このようにして展開された因果構造の中には、「塗装面が傾いている」とか「ケチャップが多すぎる」のように、入力事象「ハンダがだれる」とはまったく無関係な事象も多く含まれている。これを入力事象のドメインに類似するものだけに絞り込むと、「粘度が低い」「下型が傾いている」「はんだ過多」「部品を持つ力が強すぎる」が選ばれ、入力事象「ハンダがだれる」の原因推定に有益な情報が得られる。

以上述べたように本実施形態のシステムによれば、既存の因果知識を類推適用することで、入力事象に対する新たな因果知識を獲得することができ、未経験の問題に対する原因分析や結果予測が可能となる。

本発明の実施形態に係る知識生成システムの全体構成を示す図である。因果学習部の処理を示す図である。因果学習部による因果強度推定処理を示す図である。ワードベクトルの一例を示す図である。因果強度推定処理に用いる統計モデルを示す図である。事象類似モデル学習部の処理を示す図である。ドメイン類似モデル学習部の処理を示す図である。データ整備部の処理を示す図である。抽象化・検索部の処理を示す図である。展開された因果構造の一例を示す図である。写像・具体化部の処理を示す図である。写像・具体化された因果構造の一例を示す図である。類推型問題解決の具体例を示す図である。

符号の説明

１学習部
２類推部
３問題解決部
４汎用知識ＤＢ
５類推知識ＤＢ
６コーパス
７入力部
８表示部
１０因果学習部
１１事象類似モデル学習部
１２ドメイン類似モデル学習部
１３データ整備部
２０現状理解部
２１抽象化・検索部
２２写像・具体化部
４０因果関係ＤＢ
４１事象類似モデル
４２ドメイン類似モデル
４３テキスト解析辞書
４３Ａテキスト解析辞書
４３Ｂ追加辞書ファイル
４３Ｃ追加辞書ファイル

Claims

複数の事象を事象間の因果関係と共に予め記憶している記憶手段と、
入力された入力事象と前記記憶手段に記憶されている事象との間の因果関係を類推する類推手段と、を備え、
前記類推手段は、
前記記憶手段に記憶された複数の事象の中から、前記入力事象に類似する第１の事象、前記第１の事象と因果関係を有する第２の事象、及び、前記第２の事象に類似する第３の事象を順次検索し、
前記第３の事象の中から、前記入力事象にドメインが類似する事象を選択し、
前記選択された事象と前記入力事象との間に因果関係があるものとみなす
ことを特徴とする知識生成システム。
前記類推手段は、各事象に含まれる語句と係受け関係を有する語句の傾向を表す情報に基づいて、２つの事象の類似度を評価する
ことを特徴とする請求項１に記載の知識生成システム。
所定の文書群から予め求められた、対象語句と係受け関係を有する語句の種類及びその出現頻度を、当該対象語句の意味情報として記憶している意味情報記憶手段をさらに備え、
前記類推手段は、各事象に含まれる語句の意味情報を比較することによって、２つの事象の類似度を評価する
ことを特徴とする請求項１に記載の知識生成システム。
前記類推手段は、各事象に含まれる語句と共起する語句の傾向を表す情報に基づいて、２つの事象のドメインの類似度を評価する
ことを特徴とする請求項１〜３のいずれかに記載の知識生成システム。
所定の文書群から予め求められた、対象語句と同一文書内に共起する語句の種類及びその出現頻度を、当該対象語句のドメイン情報として記憶しているドメイン情報記憶手段をさらに備え、
前記類推手段は、各事象に含まれる語句のドメイン情報を比較することによって、２つの事象のドメインの類似度を評価する
ことを特徴とする請求項１〜３のいずれかに記載の知識生成システム。
２つの事象の間の因果関係の強度を推定する推定手段をさらに備え、
前記推定手段は、
前記２つの事象から語句を抽出し、
前記抽出された語句の集合と、予め定められたＮ個の語句集合のそれぞれとの類似度を算出し、
前記Ｎ個の語句集合との類似度に対する因果関係の強度分布を規定するモデルを用いて、前記算出された類似度に対応する因果関係の強度を算出する
ことを特徴とする請求項１〜５のいずれかに記載の知識生成システム。
教師データから前記モデルを生成するモデル生成手段をさらに備え、
前記教師データは、因果関係を有する事象のペアを複数含んでおり、
前記モデル生成手段は、
前記事象のペアから抽出された語句の集合と前記Ｎ個の語句集合のそれぞれとの類似度を算出して、その算出された類似度をＮ次元空間へマッピングし、
前記複数の事象のペアに対応する複数の点がマッピングされたＮ次元空間において、前
記点の密度分布を算出し、
前記算出された密度分布を前記因果関係の強度分布とする
ことを特徴とする請求項６に記載の知識生成システム。
２つの事象の間の因果関係の強度を推定する推定手段を備え、
前記推定手段は、
前記２つの事象から語句を抽出し、
前記抽出された語句の集合と、予め定められたＮ個の語句集合のそれぞれとの類似度を算出し、
前記Ｎ個の語句集合との類似度に対する因果関係の強度分布を規定するモデルを用いて、前記算出された類似度に対応する因果関係の強度を算出する
ことを特徴とする知識生成システム。
教師データから前記モデルを生成するモデル生成手段をさらに備え、
前記教師データは、因果関係を有する事象のペアを複数含んでおり、
前記モデル生成手段は、
前記事象のペアから抽出された語句の集合と前記Ｎ個の語句集合のそれぞれとの類似度を算出して、その算出された類似度をＮ次元空間へマッピングし、
前記複数の事象のペアに対応する複数の点がマッピングされたＮ次元空間において、前記点の密度分布を算出し、
前記算出された密度分布を前記因果関係の強度分布とする
ことを特徴とする請求項８に記載の知識生成システム。
複数の事象を事象間の因果関係と共に予め記憶している記憶手段を有するコンピュータが実行する知識生成方法であって、
入力事象の入力を受け付ける工程と、
前記入力事象と前記記憶手段に記憶されている事象との間の因果関係を類推する類推工程と、を備え、
前記類推工程は、
前記記憶手段に記憶された複数の事象の中から、前記入力事象に類似する第１の事象、前記第１の事象と因果関係を有する第２の事象、及び、前記第２の事象に類似する第３の事象を順次検索する工程と、
前記第３の事象の中から、前記入力事象にドメインが類似する事象を選択する工程と、
前記選択された事象と前記入力事象との間に因果関係があるものとみなす工程と
を含むことを特徴とする知識生成方法。
コンピュータが実行する知識生成方法であって、
２つの事象の間の因果関係の強度を推定する推定工程を備え、
前記推定工程は、
前記２つの事象から語句を抽出する工程と、
前記抽出された語句の集合と、予め定められたＮ個の語句集合のそれぞれとの類似度を算出する工程と、
前記Ｎ個の語句集合との類似度に対する因果関係の強度分布を規定するモデルを用いて、前記算出された類似度に対応する因果関係の強度を算出する工程と、
を含むことを特徴とする知識生成方法。
請求項１０または１１に記載された知識生成方法をコンピュータに実行させるためのプログラム。