JP6828823B2

JP6828823B2 - 知識生成装置、知識生成方法、及びプログラム

Info

Publication number: JP6828823B2
Application number: JP2019541596A
Authority: JP
Inventors: 大地木村; 正明土田
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2017-09-15
Filing date: 2017-09-15
Publication date: 2021-02-10
Anticipated expiration: 2037-09-15
Also published as: WO2019053878A1; JPWO2019053878A1

Description

本発明は、推論に用いるための知識を生成するための、知識生成装置、及び知識生成方法に関し、更には、これらを実現するためのプログラムに関する。

仮説推論は、既存の知識に基づいて、観測した事実（入力データ）を説明付ける、仮説を導く推理方法であり、近年においては、処理速度の飛躍的向上により、計算機を用いて行なわれるようになっている。仮説推論によれば、例えば、物体、製造システム、実行中のソフトウェアプログラムなどに生じた異常状態に対して、その状態に至る幾つかの可能性に基づく仮説のうち、得られている関連事実を最もよく説明できる仮説を得ることができる。

ところで、仮説推論にて用いられる知識を全て静的なデータベースによって用意しようとすると、データベースには大量の知識を格納しておく必要がある。これは、仮説を導くためには、入力データに対して、コンテキストに依存して解釈する必要があること、及び厳密には同一の入力データが入力されることが殆どないこと、による。

従って、大量の知識を予め用意することには限界があるため、既存の知識と入力データとに対して含意判定を行ない、含意判定の結果を用いることで、新たな知識を生成する試みがなされている。例えば、入力データが「運賃を統一する」であり、知識が「価格を調整する→カルテル発生」であるとする。この場合において、含意判定によって、前者が後者を含意すると判定されると、「運賃を統一する→価格を調整する」という新たな知識が生成される。

また、このような含意判定を行なうための技術は、例えば、特許文献１に開示されている。特許文献１に開示された技術においては、まず、判定対象となる第１のテキストと第２のテキストとについて、共通部分構造が抽出される。続いて、共通部分構造間の依存関係に基づく特徴量、共通部分構造とそれ以外の構造との間の依存関係に基づく特徴量のうちいずれかが抽出される。その後、抽出された特徴量に基づいて、第１のテキストと第２のテキストとの間の含意関係が判定される。特許文献１に開示された技術では、文章の構造を表す情報を用いることで、複数の文章間の含意関係が判定される。

国際公開第２０１５／００４１５５号公報

上述のように、特許文献１に開示された技術を用いれば、含意と判断されたデータを用いて、自動的に多数の知識を新たに作成することが可能となる。しかしながら、このようにして生成された知識には、全て正しいとは限らないという問題が存在する。そして、正しくない知識を用いて仮説推論が行なわれた場合は、間違った推論結果が得られることになる。

本発明の目的の一例は、上記問題を解消し、間違った知識の生成を抑制し得る、知識生成装置、知識生成方法、及びプログラムを提供することにある。

上記目的を達成するため、本発明の一側面における知識生成装置は、
推論で用いる知識の生成のための、入力データ及び予め用意された知識データを取得し、取得した前記入力データ及び前記知識データを用いて生成される知識が、適正かどうかを、統計的な予測モデルを用いて判定する、知識判定部と、
前記知識判定部が適正と判断した前記入力データ及び前記知識データを用いて、前記推論で用いる知識を生成する、知識生成部と、を備え、
前記予測モデルは、入力データ及び知識データの組み合わせに応じて、両者から得られる知識の適正度合を出力するモデルである、
ことを特徴とする。

また、上記目的を達成するため、本発明の一側面における知識生成方法は、
（ａ）推論で用いる知識の生成のための、入力データ及び予め用意された知識データを取得し、取得した前記入力データ及び前記知識データを用いて生成される知識が、適正かどうかを、統計的な予測モデルを用いて判定する、ステップと、
（ｂ）前記（ａ）のステップで適正と判断した前記入力データ及び前記知識データを用いて、前記推論で用いる知識を生成する、ステップと、を有し、
前記予測モデルは、入力データ及び知識データの組み合わせに応じて、両者から得られる知識の適正度合を出力するモデルである、
ことを特徴とする。

更に、上記目的を達成するため、本発明の一側面におけるプログラムは、
コンピュータに、
（ａ）推論で用いる知識の生成のための、入力データ及び予め用意された知識データを取得し、取得した前記入力データ及び前記知識データを用いて生成される知識が、適正かどうかを、統計的な予測モデルを用いて判定する、ステップと、
（ｂ）前記（ａ）のステップで適正と判断した前記入力データ及び前記知識データを用いて、前記推論で用いる知識を生成する、ステップと、
を実行させる、
前記予測モデルは、入力データ及び知識データの組み合わせに応じて、両者から得られる知識の適正度合を出力するモデルである、
ことを特徴とする。

以上のように本発明によれば、仮説推論に用いる知識の生成において、間違った知識の生成を抑制することができる。

図１は、本発明の実施の形態における知識生成装置の概略構成を示すブロック図である。図２は、本発明の実施の形態における知識生成装置の構成を具体的に示すブロック図である。図３（ａ）及び（ｂ）は、本発明の実施の形態における知識生成装置で行われる学習処理を示す説明図であり、図３（ａ）は知識生成部での学習処理を示し、図３（ｂ）はモデル生成部での学習処理を示している。図４は、本発明の実施の形態における知識生成装置の予測モデルの作成時の動作を示すフロー図である。図５は、本発明の実施の形態における知識生成装置の知識生成時の動作を示すフロー図である。図６は、本発明の実施の形態における知識生成装置を実現するコンピュータの一例を示すブロック図である。

（実施の形態）
以下、本発明の実施の形態における、知識生成装置、知識生成方法、及びコンピュータ読み取り可能な記録媒体について、図１〜図６を参照しながら説明する。

［装置構成］
最初に、本実施の形態における知識生成装置の概略構成について図１を用いて説明する。図１は、本発明の実施の形態における知識生成装置の概略構成を示すブロック図である。

図１に示す、本実施の形態における知識生成装置１００は、推論で用いる知識を生成するための装置である。図１に示すように、知識生成装置１００は、知識判定部１０と、知識生成部２０とを備えている。

知識判定部１０は、まず、推論で用いる知識の生成のための、入力データ及び予め用意された知識データ４０を取得する。また、知識データ４０は、推論に用いることができる推論の集合で構成されている。次いで、知識判定部１０は、取得した入力データ及び知識データ４０を用いて生成される知識が、適正かどうかを、統計的な予測モデル３０を用いて判定する。

予測モデル３０は、入力データ及び知識データの組み合わせに応じて、両者から得られる知識の適正度合を出力するモデルである。また、知識生成部２０は、知識判定部１０が適正と判断した入力データ及び知識データ４０を用いて、推論で用いる知識を生成する。

このように、本実施の形態においては、作成される知識について、予め適正かどうかが判定され、適正と判定される場合にのみ、この知識が生成され、仮説推論が行われる。このため、本実施の形態によれば、仮説推論に用いる知識の生成において、間違った知識の生成を抑制することができる。

続いて、図２を用いて、本実施の形態における知識生成装置１００の構成についてより具体的に説明する。図２は、本発明の実施の形態における知識生成装置の構成を具体的に示すブロック図である。

図２に示すように、本実施の形態においては、知識生成装置１００は、上述した、知識判定部１０及び知識生成部２０に加えて、予測モデル３０を生成するモデル生成部５０と、入力データから知識の生成に用いるデータを抽出するデータ抽出部６０とを更に備えている。入力データとしては、例えば、電子メール、ブログ、電子掲示板の書き込み、ニュース等を構成しているテキストデータが挙げられる。

モデル生成部５０は、学習用の入力データ及び学習用の知識データの組み合せを用いた場合に、知識生成部１０によって生成された知識と、学習用の入力データ及び学習用の知識の組み合せに対して与えられている正解の知識とを、学習データとして取得する。そして、モデル生成部５０は、取得した学習データを用いて、学習処理を行なって、予測モデル３０を生成する。

知識判定部１０は、本実施の形態では、入力データ及び知識データ４０を予測モデル３０に適用して、データ抽出部６０によって抽出されたデータ（以下「抽出データ」と表記する）及び知識データ４０を用いて知識生成部２０で生成される知識が、適正かどうかを判定する。

知識生成部２０は、本実施の形態では、予め、知識生成のための学習モデル（図２において図示せず）を生成し、知識判定部１０が適正と判断した抽出データ及び知識データを、生成した学習モデルに適用して、推論で用いる知識を生成する。

ここで、図３を用いて、モデル生成部５０による学習処理と、知識生成部２０による学習処理とについて具体的に説明する。図３（ａ）及び（ｂ）は、本発明の実施の形態における知識生成装置で行われる学習処理を示す説明図であり、図３（ａ）は知識生成部での学習処理を示し、図３（ｂ）はモデル生成部での学習処理を示している。

また、本実施の形態では、知識生成部２０は、学習モデルを用いた含意判定によって、知識を生成するとする。このため、含意判定が可能となるように、データ抽出部６０は、入力データに含まれる文章に対して述語項構造解析を行い、例えば、入力データ中の主語、述語、目的語を抽出する。

図３（ａ）に示すように、知識生成部２０の学習処理においては、まず、データ抽出部６０が、学習データとなる入力データから、主語、述語、目的語のテキストデータ（抽出データ）を抽出し、これを知識生成部２０に入力する。

また、知識生成部２０は、抽出データを取得すると、知識データ４０を構成している知識毎に、当該知識が、抽出データを含意しているかどうかを判定し、含意していると判定した場合は、抽出データと該当する知識とで、新たな知識を生成する。そして、知識生成部２０は、生成した知識と、予め用意されている正解知識（教師データ）とを対比し、対比結果（正解又は不正解）を学習して、学習モデルを作成する。

また、図３（ｂ）に示すように、モデル生成部５０の学習処理においては、モデル生成部５０は、知識生成部２０と異なり、学習データとなる入力データの全体を取得する。つまり、モデル生成部５０は、入力データ中の主語、述語、目的語だけでなく、修飾語等も取得する。

また、このとき、同じ入力データがデータ抽出部６０にも入力され、データ抽出部６０は、入力データから、主語、述語、目的語を抽出し、これらを抽出データとして、知識生成部２０に渡す。そして、知識生成部２０は、抽出データと知識データ４０とを、学習モデルに適用して、知識を生成する。その後、生成された知識には、外部のシステム等によって、予め用意された正解知識に基づいて、正解であるか否かを示すラベルが付与される。

続いて、モデル生成部５０は、入力データ及び知識データ４０を用いて、同じ入力データから知識生成部２０によって生成される知識のラベルが、正解であるかどうかを予測する。そして、モデル生成部５０は、予測結果と、生成された知識のラベルとを対比し、対比結果（予測が正解又は不正解）を学習して、予測モデル３０を作成する。その後、作成された予測モデル３０は、知識判定部１０による判定に用いられる。

［装置動作］
次に、本発明の実施の形態における知識生成装置の動作について図４及び図５を用いて説明する。以下の説明においては、適宜図１〜図３を参酌する。また、本実施の形態では、知識生成装置１００を動作させることによって、知識生成方法が実施される。よって、本実施の形態における知識生成方法の説明は、以下の知識生成装置１００の動作説明に代える。

まず、図４を用いて、予測モデルの作成処理、即ち、モデル作成部５０による学習処理について説明する。図４は、本発明の実施の形態における知識生成装置の予測モデルの作成時の動作を示すフロー図である。前提として、知識生成部２０においては学習処理が実行され（図３（ａ）参照）、既に学習モデルが作成されているとする。

図４に示すように、まず、モデル生成部５０は、学習データとなる入力データの全体を取得する（ステップＡ１）。次に、モデル生成部５０は、入力データ及び知識データ４０を用いて、同じ入力データから知識生成部２０によって生成される知識のラベルが、正解であるかどうかを予測する（ステップＡ２）。

また、ステップＡ１及びＡ２に同期して、同じ入力データがデータ抽出部６０にも入力され、データ抽出部６０は、入力データから、主語、述語、目的語を抽出し、これらを抽出データとして、知識生成部２０に渡す。そして、知識生成部２０は、抽出データと知識データ４０とを、学習モデルに適用して、知識を生成する。その後、生成された知識には、外部のシステム等によって、予め用意された正解知識に基づいて、正解であるか否かを示すラベルが付与される（図３（ｂ）参照）。

ステップＡ２の実行後、モデル生成部５０は、ステップＡ２の予測結果（正解又は不正解）と、知識生成部２０が生成した知識に付与されたラベル（正解又は不正解）とを対比し、対比結果を学習して、予測モデル３０を作成する（ステップＡ３）。ステップＡ３で作成された予測モデル３０は、知識判定部１０による判定に用いられる。

続いて、図５を用いて、知識の作成処理について説明する。図５は、本発明の実施の形態における知識生成装置の知識生成時の動作を示すフロー図である。

図５に示すように、最初に、データ抽出部６０は、入力データを取得し、取得した入力データを知識判定部１０に入力する（ステップＢ１）。

続いて、データ抽出部６０は、取得した入力データから、知識の生成に用いるデータを抽出し、抽出したデータ（抽出データ）を知識生成部２０に入力する（ステップＢ２）。具体的には、例えば、入力データが電子メールであった場合は、データ抽出部６０は、電子メールを構成している文毎に、述語項構造解析を実行し、各文を構成する主語、述語、目的語を抽出し、これらを知識生成部２０に入力する。

次に、知識判定部１０は、ステップＢ１で取得された入力データと知識データ４０とを予測モデル３０に適用して、ステップＢ２で抽出された抽出データ及び知識データ４０を用いて知識生成部２０で生成される知識が、適正かどうかを判定する（ステップＢ３）。

ステップＢ３の判定の結果、適正でないと判定された場合は、ステップＢ５が実行される。一方、ステップＢ３の判定の結果、適正であると判定された場合は、知識生成部２０は、ステップＢ２で抽出された抽出データと知識データ４０とを学習モデル（図３（ａ）及び（ｂ）参照）に適用して、推論で用いる知識を生成する（ステップＢ４）。生成された知識は、例えば、別のシステムで行われる推論に用いられる。

次に、ステップＢ５では、知識判定部１０は、ステップＢ１で取得された入力データに含まれる全てのテキストに対して、ステップＢ３が実行されているかどうかを判定する。ステップＢ５の判定の結果、全てのテキストに対してステップＢ３が実行されていない場合は、再度ステップＢ３を実行する。一方、ステップＢ５の判定の結果、全てのテキストに対してステップＢ３が実行されている場合は、知識生成装置１００における処理は終了する。

ここで、具体例を用いて、図５に示したステップＢ１〜Ｂ５について説明する。まず、ステップＢ１で取得された入力データが電子メールであり、その中に「仮定の話として、我々が運賃を統一したとしましょう。」という文が含まれていたとする。

この場合、データ抽出部６０は、「仮定の話として、我々が運賃を統一したとしましょう。」に対して述語項構造解析を行い、下記の結果を得る。
述語項構造：我々（が格）が運賃（を格）を（に格）に統一（述語）
（なお、この文には「に格」は存在していない。）

また、知識データ４０に知識として、「価格を調整する→カルテル発生」が含まれているとすると、知識生成部２０は、通常、この知識と抽出データとから、「運賃を統一する」は「価格を調整する」に対して含意であると判断し、下記の知識を新たに生成する。
知識：運賃を統一する→価格を調整する

しかしながら、本実施の形態では、知識判定部１０は、入力データ全体、即ち、抽出データとして抽出されていない部分も用いて、生成される知識が適正かどうかを判定する。上述の例であれば、データ抽出部６０は、抽出データだけでなく、「仮定」という文言も予測モデルに適用する。

このとき、予測モデルが、仮定という文言が含まれた場合に、適正度合として低い値（例えば、１０％以下）を出力するとする。知識判定部１０は、上述の入力データから知識生成部２０によって生成される知識は適正でないと判定する。

以上のように、本実施の形態では、入力データから作成されると予測される知識が、予め適正かどうかが判定される。そして、適正と判定される場合にのみ、知識生成部は、入力データから知識を生成する。

このため、本実施の形態によれば、仮説推論に用いる知識の生成において、間違った知識の生成を抑制でき、仮説推論の精度の向上を図ることができる。また、知識判定部１０は、入力データ全体を用いて判定を行うため、知識生成部２０による知識生成においてコンテキストが反映され、知識の妥当性が高まることになる。また、知識生成部２０における精度がそれほど高くない場合、即ち、学習モデルが単純な場合であっても、適正な知識の生成が可能となる。

［プログラム］
本実施の形態におけるプログラムは、コンピュータに、図４に示すステップＡ１〜Ａ３を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態における知識生成装置と知識生成方法とを実現することができる。この場合、コンピュータのプロセッサは、知識判定部１０、知識生成部２０、モデル生成部５０及びデータ抽出部６０として機能し、処理を行なう。

また、本実施の形態では、予測モデル３０及び知識データ４０は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現される。

また、本実施の形態におけるプログラムは、複数のコンピュータによって構築されたコンピュータシステムによって実行されても良い。この場合は、例えば、各コンピュータが、それぞれ、知識判定部１０、知識生成部２０、モデル生成部５０及びデータ抽出部６０のいずれかとして機能しても良い。また、予測モデル３０及び知識データ４０は、は、本実施の形態におけるプログラムを実行するコンピュータとは別のコンピュータの記憶装置に格納されていても良い。

ここで、本実施の形態におけるプログラムを実行することによって、知識生成装置１００を実現するコンピュータについて図６を用いて説明する。図６は、本発明の実施の形態における知識生成装置を実現するコンピュータの一例を示すブロック図である。

図６に示すように、コンピュータ１１０は、ＣＰＵ１１１と、メインメモリ１１２と、記憶装置１１３と、入力インターフェイス１１４と、表示コントローラ１１５と、データリーダ／ライタ１１６と、通信インターフェイス１１７とを備える。これらの各部は、バス１２１を介して、互いにデータ通信可能に接続される。

ＣＰＵ１１１は、記憶装置１１３に格納された、本実施の形態におけるプログラム（コード）をメインメモリ１１２に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ１１２は、典型的には、ＤＲＡＭ（Dynamic Random Access Memory）等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体１２０に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス１１７を介して接続されたインターネット上で流通するものであっても良い。

また、記憶装置１１３の具体例としては、ハードディスクドライブの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス１１４は、ＣＰＵ１１１と、キーボード及びマウスといった入力機器１１８との間のデータ伝送を仲介する。表示コントローラ１１５は、ディスプレイ装置１１９と接続され、ディスプレイ装置１１９での表示を制御する。

データリーダ／ライタ１１６は、ＣＰＵ１１１と記録媒体１２０との間のデータ伝送を仲介し、記録媒体１２０からのプログラムの読み出し、及びコンピュータ１１０における処理結果の記録媒体１２０への書き込みを実行する。通信インターフェイス１１７は、ＣＰＵ１１１と、他のコンピュータとの間のデータ伝送を仲介する。

また、記録媒体１２０の具体例としては、ＣＦ（Compact Flash（登録商標））及びＳＤ（Secure Digital）等の汎用的な半導体記憶デバイス、フレキシブルディスク（Flexible Disk）等の磁気記録媒体、又はＣＤ−ＲＯＭ（Compact DiskRead Only Memory）などの光学記録媒体が挙げられる。

なお、本実施の形態における知識生成装置１００は、プログラムがインストールされたコンピュータではなく、各部に対応したハードウェアを用いることによっても実現可能である。更に、知識生成装置１００は、一部がプログラムで実現され、残りの部分がハードウェアで実現されていてもよい。

上述した実施の形態の一部又は全部は、以下に記載する（付記１）〜（付記９）によって表現することができるが、以下の記載に限定されるものではない。

（付記１）
推論で用いる知識の生成のための、入力データ及び予め用意された知識データを取得し、取得した前記入力データ及び前記知識データを用いて生成される知識が、適正かどうかを、統計的な予測モデルを用いて判定する、知識判定部と、
前記知識判定部が適正と判断した前記入力データ及び前記知識データを用いて、前記推論で用いる知識を生成する、知識生成部と、を備え、
前記予測モデルは、入力データ及び知識データの組み合わせに応じて、両者から得られる知識の適正度合を出力するモデルである、
ことを特徴とする知識生成装置。

（付記２）
前記予測モデルを生成する、モデル生成部を更に備え、
前記モデル生成部は、学習用の入力データ及び学習用の知識データの組み合せを用いた場合に、前記知識生成部によって生成された知識と、前記学習用の入力データ及び前記学習用の知識の組み合せに対して与えられている正解の知識とを、学習データとして用いて、学習処理を行なって、前記予測モデルを生成する、
付記１に記載の知識生成装置。

（付記３）
前記入力データから、知識の生成に用いるデータを抽出する、データ抽出部を更に備え、
前記知識判定部は、前記データ抽出部によって抽出されたデータ及び前記知識データを用いて生成される知識が、適正かどうかを、前記予測モデルを用いて判定し、
前記知識生成部は、前記知識判定部が適正と判断した、前記データ抽出部によって抽出されたデータ及び前記知識データを用いて、前記推論で用いる知識を生成する、
付記１または２に記載の知識生成装置。

（付記４）
（ａ）推論で用いる知識の生成のための、入力データ及び予め用意された知識データを取得し、取得した前記入力データ及び前記知識データを用いて生成される知識が、適正かどうかを、統計的な予測モデルを用いて判定する、ステップと、
（ｂ）前記（ａ）のステップで適正と判断した前記入力データ及び前記知識データを用いて、前記推論で用いる知識を生成する、ステップと、を有し、
前記予測モデルは、入力データ及び知識データの組み合わせに応じて、両者から得られる知識の適正度合を出力するモデルである、
ことを特徴とする知識生成方法。

（付記５）
（ｃ）前記予測モデルを生成する、ステップを更に有し、
前記（ｃ）のステップにおいて、学習用の入力データ及び学習用の知識データの組み合せを用いた場合に、前記（ｂ）のステップの実行によって生成される知識と、前記学習用の入力データ及び前記学習用の知識の組み合せに対して与えられている正解の知識とを、学習データとして用いて、学習処理を行なって、前記予測モデルを生成する、
付記４に記載の知識生成方法。

（付記６）
（ｄ）前記入力データから、知識の生成に用いるデータを抽出する、ステップを更に有し、
前記（ａ）のステップにおいて、前記（ｄ）のステップによって抽出されたデータ及び前記知識データを用いて生成される知識が、適正かどうかを、前記予測モデルを用いて判定し、
前記（ｂ）のステップにおいて、前記（ａ）のステップで適正と判断した、前記（ｄ）のステップで抽出されたデータ及び前記知識データを用いて、前記推論で用いる知識を生成する、
付記４または５に記載の知識生成方法。

（付記７）
コンピュータに、
（ａ）推論で用いる知識の生成のための、入力データ及び予め用意された知識データを取得し、取得した前記入力データ及び前記知識データを用いて生成される知識が、適正かどうかを、統計的な予測モデルを用いて判定する、ステップと、
（ｂ）前記（ａ）のステップで適正と判断した前記入力データ及び前記知識データを用いて、前記推論で用いる知識を生成する、ステップと、
を実行させ、
前記予測モデルは、入力データ及び知識データの組み合わせに応じて、両者から得られる知識の適正度合を出力するモデルである、
ことを特徴とするプログラム。

（付記８）
前記コンピュータに、
（ｃ）前記予測モデルを生成する、ステップを更に実行させ、
前記（ｃ）のステップにおいて、学習用の入力データ及び学習用の知識データの組み合せを用いた場合に、前記（ｂ）のステップの実行によって生成される知識と、前記学習用の入力データ及び前記学習用の知識の組み合せに対して与えられている正解の知識とを、学習データとして用いて、学習処理を行なって、前記予測モデルを生成する、
付記７に記載のプログラム。

（付記９）
前記コンピュータに、
（ｄ）前記入力データから、知識の生成に用いるデータを抽出する、ステップを更に実行させ、
前記（ａ）のステップにおいて、前記（ｄ）のステップによって抽出されたデータ及び前記知識データを用いて生成される知識が、適正かどうかを、前記予測モデルを用いて判定し、
前記（ｂ）のステップにおいて、前記（ａ）のステップで適正と判断した、前記（ｄ）のステップで抽出されたデータ及び前記知識データを用いて、前記推論で用いる知識を生成する、
付記７または８に記載のプログラム。

以上のように本発明によれば、仮説推論に用いる知識の生成において、間違った知識の生成を抑制することができる。本発明は、事故、犯罪、サイバー攻撃などの状況または原因を明らかにする作業の効率化に有用である。同様に、本発明は、災害及びシステム障害の原因分析と対策検討にも有用である。

１０知識判定部
２０知識生成部
３０予測モデル
４０知識データ
５０モデル生成部
６０データ抽出部
１００知識生成装置
１１０コンピュータ
１１１ＣＰＵ
１１２メインメモリ
１１３記憶装置
１１４入力インターフェイス
１１５表示コントローラ
１１６データリーダ／ライタ
１１７通信インターフェイス
１１８入力機器
１１９ディスプレイ装置
１２０記録媒体
１２１バス

Claims

推論で用いる知識の生成のための、入力データ及び予め用意された知識データを取得し、取得した前記入力データ及び前記知識データを用いて生成される知識が、適正かどうかを、統計的な予測モデルを用いて判定する、知識判定部と、
前記知識判定部が適正と判断した前記入力データ及び前記知識データを用いて、前記推論で用いる知識を生成する、知識生成部と、を備え、
前記予測モデルは、入力データ及び知識データの組み合わせに応じて、両者から得られる知識の適正度合を出力するモデルである、
ことを特徴とする知識生成装置。
前記予測モデルを生成する、モデル生成部を更に備え、
前記モデル生成部は、学習用の入力データ及び学習用の知識データの組み合せを用いた場合に、前記知識生成部によって生成された知識と、前記学習用の入力データ及び前記学習用の知識の組み合せに対して与えられている正解の知識とを、学習データとして用いて、学習処理を行なって、前記予測モデルを生成する、
請求項１に記載の知識生成装置。
前記入力データから、知識の生成に用いるデータを抽出する、データ抽出部を更に備え、
前記知識判定部は、前記データ抽出部によって抽出されたデータ及び前記知識データを用いて生成される知識が、適正かどうかを、前記予測モデルを用いて判定し、
前記知識生成部は、前記知識判定部が適正と判断した、前記データ抽出部によって抽出されたデータ及び前記知識データを用いて、前記推論で用いる知識を生成する、
請求項１または２に記載の知識生成装置。
（ａ）推論で用いる知識の生成のための、入力データ及び予め用意された知識データを取得し、取得した前記入力データ及び前記知識データを用いて生成される知識が、適正かどうかを、統計的な予測モデルを用いて判定する、ステップと、
（ｂ）前記（ａ）のステップで適正と判断した前記入力データ及び前記知識データを用いて、前記推論で用いる知識を生成する、ステップと、を有し、
前記予測モデルは、入力データ及び知識データの組み合わせに応じて、両者から得られる知識の適正度合を出力するモデルである、
ことを特徴とする知識生成方法。
（ｃ）前記予測モデルを生成する、ステップを更に有し、
前記（ｃ）のステップにおいて、学習用の入力データ及び学習用の知識データの組み合せを用いた場合に、前記（ｂ）のステップの実行によって生成される知識と、前記学習用の入力データ及び前記学習用の知識の組み合せに対して与えられている正解の知識とを、学習データとして用いて、学習処理を行なって、前記予測モデルを生成する、
請求項４に記載の知識生成方法。
（ｄ）前記入力データから、知識の生成に用いるデータを抽出する、ステップを更に有し、
前記（ａ）のステップにおいて、前記（ｄ）のステップによって抽出されたデータ及び前記知識データを用いて生成される知識が、適正かどうかを、前記予測モデルを用いて判定し、
前記（ｂ）のステップにおいて、前記（ａ）のステップで適正と判断した、前記（ｄ）のステップで抽出されたデータ及び前記知識データを用いて、前記推論で用いる知識を生成する、
請求項４または５に記載の知識生成方法。
コンピュータに、
（ａ）推論で用いる知識の生成のための、入力データ及び予め用意された知識データを取得し、取得した前記入力データ及び前記知識データを用いて生成される知識が、適正かどうかを、統計的な予測モデルを用いて判定する、ステップと、
（ｂ）前記（ａ）のステップで適正と判断した前記入力データ及び前記知識データを用いて、前記推論で用いる知識を生成する、ステップと、
を実行させ、
前記予測モデルは、入力データ及び知識データの組み合わせに応じて、両者から得られる知識の適正度合を出力するモデルである、
ことを特徴とするプログラム。
前記コンピュータに、
（ｃ）前記予測モデルを生成する、ステップを更に実行させ、
前記（ｃ）のステップにおいて、学習用の入力データ及び学習用の知識データの組み合せを用いた場合に、前記（ｂ）のステップの実行によって生成される知識と、前記学習用の入力データ及び前記学習用の知識の組み合せに対して与えられている正解の知識とを、学習データとして用いて、学習処理を行なって、前記予測モデルを生成する、
請求項７に記載のプログラム。
前記コンピュータに、
（ｄ）前記入力データから、知識の生成に用いるデータを抽出する、ステップを更に実行させ、
前記（ａ）のステップにおいて、前記（ｄ）のステップによって抽出されたデータ及び前記知識データを用いて生成される知識が、適正かどうかを、前記予測モデルを用いて判定し、
前記（ｂ）のステップにおいて、前記（ａ）のステップで適正と判断した、前記（ｄ）のステップで抽出されたデータ及び前記知識データを用いて、前記推論で用いる知識を生成する、
請求項７または８に記載のプログラム。