JP6702499B2 - 情報処理システム、情報処理方法、及び、プログラム - Google Patents

情報処理システム、情報処理方法、及び、プログラム Download PDF

Info

Publication number
JP6702499B2
JP6702499B2 JP2019503488A JP2019503488A JP6702499B2 JP 6702499 B2 JP6702499 B2 JP 6702499B2 JP 2019503488 A JP2019503488 A JP 2019503488A JP 2019503488 A JP2019503488 A JP 2019503488A JP 6702499 B2 JP6702499 B2 JP 6702499B2
Authority
JP
Japan
Prior art keywords
events
event
rules
pair
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019503488A
Other languages
English (en)
Other versions
JP2019525336A (ja
Inventor
シルバ ダニエル ゲオルグ アンドラーデ
シルバ ダニエル ゲオルグ アンドラーデ
陽太郎 渡邉
陽太郎 渡邉
森永 聡
聡 森永
定政 邦彦
邦彦 定政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2019525336A publication Critical patent/JP2019525336A/ja
Application granted granted Critical
Publication of JP6702499B2 publication Critical patent/JP6702499B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理システム、情報処理方法、及び、コンピュータにより読み取り可能な記録媒体に関する。
推論方法として、知識ベース(knowledge base)(KBとも表記される)を利用した確率的推論が知られている。確率的推論では、観測値、及び、クエリ(ターゲットイベント)が入力されると、観測値が与えられたときのクエリの確率が、KB内のルール集合に基づいて計算される。非特許文献4に開示されているマルコフロジックネットワーク(Markov Logic Network)(MLNとも表記される)は確率的推論の一例である。確率的推論では、非特許文献4に示されているように、確率、又は、重みが、KB内の各ルールに割り当てられる。
確率的推論では、決定論的推論と同様に、KB内の不完全なルールの影響を受ける。しかしながら、KBのルール集合を手動で定義するのには多大な労力を要する。そのため、様々な確率的推論フレームワークについて、データに基づいて新たなルールを自動的に学習する幾つかの方法が提案されている。例えば、非特許文献1では、論理的学習法、及び、関係性学習処理に関するホーン節(Horn clause)を、カーネルを利用して学習する方法が開示されている。非特許文献2では、事前確率付きのベイジアンネットワークを構造学習する方法が開示されている。非特許文献3では、MLNを構造学習する方法が開示されている。これらの方法は、サンプル数n>>1の大量のトレーニングデータを必要とする。ここで、各トレーニングデータのサンプルは、過去からの観測値を結合した集合である。
関連技術として、特許文献1には、テキストが別のテキストを含意しているかどうかを、テキストの組み合わせに対する特徴量に基づいて評価する、テキスト含意評価装置が開示されている。特許文献2には、各エッジがコスト値を有するエッジ群からなるハイパーグラフを含む知識ベースが開示されている。
国際公開第2013/058118号 特開平07−334368号公報
Paolo Frasconi, et al., "kLog: A Language for Logical and Relations Learning with Kernels", Artificial Intelligence, Volume 217, p.p. 117-143, December 2014 Vikash Mansinghka, et al., "Structured Priors for Structure Learning",. Proceedings of the Twenty-Second Conference on Uncertainty in Artificial Intelligence (UAI 2006), July 2006 Jan Van Haaren, et al., "Lifted generative learning of Markov logic networks", Machine Learning, Volume 103, Issue 1, p.p. 27-55, April 2016 Matthew Richardson, et al., "Markov logic networks", Machine Learning, Volume 62, Issue 1, p.p. 107-136, February 2006
上述の非特許文献では、汎用ルールを過剰適合が発生することなく学習するために、n個(n>>1)のトレーニングサンプルが必要となる。しかしながら、このような大量のトレーニングデータの取得が常に可能であるとは限らない。極端な場合、トレーニングサンプルは1つしか存在しない。
本発明の目的は、上述の課題を解決し、トレーニングサンプルが1つしか与えられない場合でも新たな確率的ルールを学習できる、情報処理システム、情報処理方法、及び、コンピュータにより読み取り可能な記録媒体を提供することにある。
本発明の一態様における情報処理システムは、複数のイベントのイベント間のルール群を記憶する知識記憶手段と、1以上の新たなルールを、前記ルール群、及び、前記イベント間の含意スコアに基づいて生成する、ルール生成手段と、確率的推論に適用される前記1以上の新たなルールの重みを、前記含意スコアに基づいて算出する、重み算出手段と、を備える。
本発明の一態様における情報処理方法は、1以上の新たなルールを、複数のイベントのイベント間のルール群、及び、前記イベント間の含意スコアに基づいて生成し、確率的推論に適用される前記1以上の新たなルールの重みを、前記含意スコアに基づいて算出する。
本発明の一態様におけるコンピュータにより読み取り可能な記録媒体は、コンピュータに、1以上の新たなルールを、複数のイベントのイベント間のルール群、及び、前記イベント間の含意スコアに基づいて生成し、確率的推論に適用される前記1以上の新たなルールの重みを、前記含意スコアに基づいて算出する、処理を実行させるプログラムを記憶する。
本発明の効果は、トレーニングサンプルが1つしか与えられない場合でも、新たな確率的ルールを学習できることである。
実施形態の特徴的な構成を示すブロック図である。 実施形態における学習システム100の構成を示すブロック図である。 実施形態において学習システム100をコンピュータ上で実現する場合の構成を示すブロック図である。 実施形態における学習システム100の処理を示すフローチャートである。 実施形態におけるKB内のルールの例を示す図である。 実施形態におけるKB内のルールに基づくグラウンデッドネットワークの例を示す図である。 実施形態における新たなエッジの候補、及び、スコアの例を示す図である。 実施形態における新たなエッジの選択例を示す図である。 実施形態における新たなエッジの候補、及び、スコアの他の例を示す図である。 実施形態における新たなエッジの候補、及び、スコアのさらに他の例を示す図である。 実施形態における新たなルールに関するグラフの一部の例を示す図である。
本発明の実施形態について以下に説明する。
はじめに、本発明の実施形態の構成について説明する。図2は、実施形態における学習システム100の構成を示すブロック図である。学習システム100は、本発明の情報処理システムの一実施形態である。図2を参照すると、実施形態の学習システム100は、KB(knowledge base)記憶部(知識記憶モジュールとも記載する)110と、入力部120と、ルール生成部(ルール生成モジュールとも記載する)130と、重み算出部(重み算出モジュールとも記載する)140と、を含む。ルール生成部130は、エッジ候補生成部131と、スコア算出部132と、エッジ選択部133と、ルール決定部134と、を含む。
KB記憶部110は、イベント間の1以上のルールを含むKBを記憶する。
図5は、実施形態におけるKB内のルールの例を示す図である。
図5のKBでは、以下の3種類のルール:(X, sell, Y)=>(X, earn, Z)、(X, sell, Y)=>(X, drop, Y)、及び、(X, drop, Y)=>(X, go bankrupt)が存在する。ここで、「(X, sell, Y)」は、動詞「sell(売る)」、意味的主語「X」、及び、意味的目的語「Y」を含むイベント「X sells Y」を、述語項構造で表したものである。記号「=>」は、記号の左側のイベントが前提、記号の右側のイベントが結論である、含意関係(implication relation)を示す。ここで、用語「含意(implication)」は、「Peter buys book」=>「Peter sells book」のような未来予測だけでなく、「Peter buys book」=>「Peter owns book」のようなテキストの伴意(textual entailment)を含む広い意味に用いられる。簡単のため、各ルールは、1つの前提イベント、及び、1つの結論イベントを含むと仮定する(ホーン節(Horn clause))。確率的推論では、非特許文献4に示されるように、確率、又は、重みが各ルールに割り当てられる。
KB内のルールは、複数のトレーニングサンプルに基づいて生成され、KBに前もって記憶されていると仮定する。
ここで、(X, sell, Y)のようなイベントは、非グラウンデッドイベント(ungrounded event)と呼ばれ、プレースホルダーX、及び、Yが、主語、及び、目的語にそれぞれ対応する。一方、(ABC, sell, computer)のようなイベントは、グラウンデッドイベント(grounded event)と呼ばれ、各プレースホルダーはエンティティで置き換えられている。
図6は、実施形態おけるKB内のルールに基づくグラウンデッドネットワーク(grounded network)の例を示す図である。
図6では、グラウンデッドネットワークは、無向エッジにより連結されたグラフとして表わされる。グラフでは、各ノードがグラウンデッドイベントに対応し、2つのノードの間の各エッジは、2つのイベントの間のルールに対応する。エッジは、対応する2つのイベントが同じルールで発生する場合、かつその場合にのみ記載される。なお、一般的に、イベントの共起を含むルールのような更に複雑なルールを設けることもできる。
KBを用いて、確率的クエリを実行できる。例えば、観測値(観測イベント)の集合Oが与えられた場合の、ターゲットイベントTの確率を導出することができる。観測値、及び、ターゲットイベントがe:=(ABC, sell, computer)、及び、e:=(ABC, go bankrupt)のように定義される場合、確率P(T=e|O={e})は、例えば非特許文献4に従って算出することができる。
しかしながら、観測値及びターゲットイベントがe:=(ABC, produce, computer)、及び、e:=(ABC, go bankrupt)のように定義される場合、観測値、及び、当該観測値に関連するルールは、図5に示すKB内に定義されない、すなわち観測値eは未知の観測値であるため、観測値{e}は、P(T=e|O={e})を導出する際には無関係となる。別の表現をすると、確率は、P(T=e|O={e})=P(T=e)と表現される。
上記に基づくと、KB内の「ルールの欠落(rule is missing)」は「∃e∈Oについて:グラウンデッドネットワークに、観測イベントeとターゲットイベントeを接続する経路が存在しない」場合、かつその場合のみと定義される。eとターゲットイベントeとの間の経路が無いことが、P(T=e|O={e})=P(T=e)が成立するための十分条件である。
欠落ルールの定義により、全ての観測値がターゲットイベントの結果に直接影響する、又は、間接的に影響するという暗黙的な仮定がなされる。しかしながら、この仮定は必ずしも真である訳ではない。例えば、(Peter, buy, ice cream)のようなイベントは、e=(ABC, go bankrupt)という結果に関連付けられない可能性が非常に高い。一般的に、このような非関連イベントは、フィルタリングにより容易に除去できる。
上記仮定によれば、観測値e=(ABC, produce, computer)をターゲットイベントe=(ABC, go bankrupt)に(直接、又は、間接的に)接続する1以上のルールが欠落している。
実施形態では、新たなルール(欠落ルール)は、グラフ上の新たなエッジの候補から選択される新たなエッジに基づいて生成される。新たなエッジの候補は、グラフ上で、観測値、又は、ターゲットイベントを含むサブグラフ群を接続するエッジとして定義される。ここで、サブグラフはグラフの一部であり、グラフにおいてエッジで接続されたノードを探索することにより得られる、ノード群、及び、エッジ群からなる。他のいずれのノードにも接続されないノード(独立ノード)も、サブグラフと考える。
図7は、実施形態における、新たなエッジの候補、及び、スコアの例を示す図である。
入力部120は、観測値の集合、及び、ターゲットイベントを、新たなトレーニングサンプルとして、ユーザなどから受信する。
ルール生成部130のエッジ候補生成部131は、観測値の集合、及び、ターゲットイベントが入力されると、入力された観測値の集合、及び、ターゲットイベントについて、新たなエッジの候補を生成する。
図7では、グラフは、観測値(ABC, produce, computer)を含むサブグラフ1、及びターゲットイベント(ABC, go bankrupt)を含むサブグラフ2からなる。例えば、エッジ候補生成部131は、図7の破線で示すように、サブグラフ1、及び、サブグラフ2を接続する新たなエッジの候補を生成する。
新たなエッジを新たなエッジの候補の中から選択するために、スコア算出部132は、新たなエッジの候補の各々のエッジスコアSを算出する。エッジスコアSは、S(a,b)=max{s(a,b),s(b,a)}として定義される。ここで、s(a,b)はイベントaとイベントbとの間の含意スコアであり、イベントaがイベントbを含意する程度を表わす。スコア算出部132は、含意スコアsを、例えば以下に説明する一段予測推定(One-Step-Predictor)(OSP)方法を用いて算出する。
OSP方法では、はじめに、イベントa、及び、bの各単語を、次元dを有するWord Embeddingにマッピングする。次に、Word Embeddingを用いて、イベントa、及び、bについて、次元hを有するEvent Embedding e、及び、eを生成する。最後に、含意スコアs(a,b)、s(b,a)を、Event Embedding e、及び、e、並びに、所定の重み行列を用いて算出する。
例えば、スコア算出部132は、図7に示すように、新たなエッジの候補の各々のエッジスコアSを算出する。OSP方法の利点は、任意の2つのイベント間のエッジスコアを算出できることである。しかしながら、OSPは単なるヒューリスティックな方法に過ぎず、一般に、信頼できるスコアを算出できない。したがって、OSPによりエッジスコアSを算出した新たなルールの候補の内、必要最小限のルールをKBに含める必要がある。
正式には、その目標は次のように記述できる:観測値の集合、及び、1以上の欠落ルールを含むKBが与えられた場合に、KBを増強して、最も妥当であり、かつ、最もシンプルな推論経路を見つける。
この目標は、例えば、新たなエッジとして、観測値、又は、ターゲットイベントを含む全てのサブグラフを接続し、かつ、選択した新たなエッジの候補のエッジスコアの合計値が最大となるような、最小数の新たなエッジの候補を選択することにより達成できる。
エッジ選択部133は、生成した新たなエッジの候補から、エッジスコアに基づいて、新たなエッジを選択する。
図8は、実施形態における、新たなエッジの選択例を示す図である。図7において、サブグラフ1のイベント(ABC, produce, computer)とサブグラフ2のイベント(ABC, sell, computer)との間の新たなエッジの候補のエッジスコアは最大値「9」である。この場合、エッジ選択部133は、図8に示すように、イベント(ABC, produce, computer)とイベント(ABC, sell, computer)との間の新たなエッジの候補を、新たなエッジとして選択する。
図9、及び、図10は、実施形態における、新たなエッジの候補、及び、スコアの他の例を示す図である。
図9では、観測値、及び、ターゲットイベントは以下のように定義される:e:=(ABC, produce, computer)、e:=(ABC, go bankrupt)。観測値eは、KB内で定義される。すなわち観測値eは、既知の観測値である。グラフは、観測値(ABC, produce, computer)を含むサブグラフ1、及び、ターゲットイベント(ABC, go bankrupt)を含むサブグラフ2からなる。この場合、サブグラフ1のイベント(ABC, sell, computer)とサブグラフ2のイベント(ABC, drop, computer)との間の新たなエッジの候補のエッジスコアは最大値「25」である。エッジ選択部133は、イベント(ABC, sell, computer)とイベント(ABC, drop, computer)との間の新たなエッジの候補を、新たなエッジとして選択する。
図10では、観測値、及び、ターゲットイベントは以下のように定義される:{e}:={(ABC, produce, computer),(ABC, drop, computer)}、e:=(ABC, go bankrupt)。観測値{e}は、KB内で定義される。すなわち観測値eは、既知の観測値である。グラフは、観測値(ABC, produce, computer)を含むサブグラフ1、観測値(ABC, drop, computer)を含むサブグラフ2、及び、ターゲットイベント(ABC, go bankrupt)を含むサブグラフ3からなる。この場合、サブグラフ1のイベント(ABC, sell, computer)とサブグラフ2のイベント(ABC, drop, computer)との間の新たなエッジの候補のエッジスコア、及び、サブグラフ2のイベント(ABC, drop, computer)とサブグラフ3のイベント(ABC, go bankrupt)との間の新たなエッジの候補のエッジスコアの合計値は最大値「50」である。エッジ選択部133は、これらの新たなエッジ候補を、新たなエッジとして選択する。
次に、ルール決定部134は、選択した新たなエッジについて、追加すべき新たなルールを含意スコアに基づいて決定する。ここで、ルール決定部134は、例えば、イベントaとイベントbとの間で選択した新たなエッジについて、s(a,b)>s(b,a)の関係が成り立つ場合にはルールa=>bを新たなルールとして決定し、s(a,b)>s(b,a)の関係が成り立たない場合にはルールb=>aを新たなルールとして決定する。
図8の場合、2つの選択肢:(ABC, produce, computer)=>(ABC, sell, computer)、(ABC, sell, computer)=>(ABC, produce, computer)がある。s((ABC, sell, computer),(ABC, produce, computer))=6、及び、s((ABC, produce, computer),(ABC, sell, computer))=9の関係が成り立つ場合、ルール決定部134は、ルール(ABC, produce, computer)=>(ABC, sell, computer)を新たなルールとして決定する。
この時点で、決定論的推論の推論経路、すなわち観測値e=(ABC, produce, computer)からターゲットイベントe=(ABC, go bankrupt)に至る推論経路が得られている。確率的推論を行なう場合、確率P((ABC, go bankrupt)|(ABC, produce, computer))を算出することが更に必要である。以下の説明では、確率的推論が、非特許文献4に開示されているMLNを用いて行なわれると仮定する。この場合、新たなルールの重みを決定する必要がある。
重み算出部140は、新たなルールの重みを、以下の2つのステップに従って算出する。ここでは、イベントaとイベントbとの間の新たなルールr:(a=>b)が決定され、新たなルールrの重みwが算出されると仮定する。
第1ステップでは、重み算出部140が条件的確率を、含意スコアを用いて、数式1で定義されるOSPに基づいて取得する。
[数1]
Figure 0006702499
ここで、全ての含意スコアが正であり、イベントb’(b’≠b)は互いに排他的であると仮定する。含意スコアs(a,b)が、所定の確率(0〜1)を示すように定義されている場合、重み算出部140は、数式2で定義される条件的確率を取得してもよい。
[数2]
Figure 0006702499
第2ステップでは、重み算出部140が重みwを、当該重みが以下の2つの条件に従うと仮定して算出する:1.KB内の全ての他のルールの重みは不変である、2.MLNに基づく確率P(b|a)はPOSP(b|a)に等しい。以下に示すように、これらの2つの条件が重みwを一意に定義する。
図11は、実施形態における、新たなルールr:(a=>b)に関するグラフの一部の例を示す図である。
MLNは、KB内の全ルール∪{a=>b}、の重みで定義される確率分布を指すものとする。また、ベクトルxが、図11に示すように、イベントaに直接接続されるイベントx、x、…を指すものとする。同様に、ベクトルyが、図11に示すように、イベントbに直接接続されるイベントy、y、…を指すものとする。元のグラフでは、イベントaとイベントbとの間には経路が無かったので、イベントa、及び、イベントbの両方に接続されるイベントは存在しない。この場合、MLNに基づく条件的確率PMLN(b|a)は、数式3で表わすことができる。
[数3]
Figure 0006702499
ここで、1(a,b)はルールrの指示関数である。すなわちルールr:(a=>b)が満たされる場合に1であり、ルールrが満たされない場合に0である。1(x,a)、及び、1(b,y)もルールf:(x=>a)、及び、ルールr:(b=>y)の指示関数である。すなわち、ルールfが満たされる場合に1であり、ルールfが満たされない場合に0である。F、及び、Fは、それぞれ、イベントa、及び、イベントbを含む全てのルールの集合である。
以下、イベントa、又は、イベントbが真もしくは偽であるかどうかが、イベントが真である場合にa=T、又は、b=T、イベントが偽である場合にa=F、又は、b=Fにより明示的に示される。
条件的確率PMLN(b=T|a=T)は、数式3に定義されるt(a,b)、g(a)、及び、h(b)を用いて、数式4で表される。
[数4]
Figure 0006702499
数式4から、正しい重みwを数式5で算出できる。
[数5]
Figure 0006702499
ここで、pはp:=POSP(b=T|a=T)のように定義される。
重み算出部140は、重みwを、数式5を用いて算出する。新たなルールの重みは、図7、図9、及び、図10に示す例の全てについて、数式5により算出できることは明らかである。
重み算出部140は、生成した新たなルール、及び、算出した重みをユーザなどに出力する。更に、重み算出部140は、生成した新たなルール、及び、算出した重みをKBに追加してもよい。この場合、重み算出部140は、生成した新たなルールから変換される、非グラウンデッドイベント間の新たなルールを追加してもよい。
また、学習システム100の推論モジュール(図示せず)は、確率的クエリを実行し、生成した新たなルール、及び、算出した重みを用いて、確率P(T=e|O={e})を算出してもよい。
学習システム100は、CPU(central processing unit)とプログラムを格納する記録媒体とを含み、プログラム制御に従って動作するコンピュータでもよい。図3は、実施形態において、学習システム100がコンピュータ上で実現する場合の構成を示すブロック図である。
図3を参照すると、学習システム100は、CPU101と、記憶デバイス102(記録媒体)と、通信デバイス103と、キーボードのような入力デバイス104と、ディスプレイのような出力デバイス105と、を含む。CPU101は、コンピュータプログラムを実行して、入力部120、ルール生成部130、及び、重み算出部140の機能を実現する。記憶デバイス102は、KB記憶部110の情報を記憶する。入力デバイス104は、トレーニングサンプルをユーザなどから受信してもよい。出力デバイス105は、新たなルール、及び、新たなルールの重みをユーザなどに出力(表示)してもよい。通信デバイス103は、トレーニングサンプルを他のシステムから受信し、新たなルール、及び、重みを他のシステムに送信してもよい。
図3の学習システム100のモジュールが、有線、又は、無線で相互に接続される複数のデバイスにそれぞれ配置されてもよい。学習システム100において新たなルールを生成するサービスは、SaaS(Software as a Service)としてユーザなどに提供されてもよい。
図3の学習システム100のモジュールは回路(circuitry)上で実現されてもよい。ここで、用語「circuitry」は、シングルチップ、マルチデバイス、チップセット、又は、クラウドを概念的に含む用語として定義される。
次に、本発明の第1の実施形態における、学習システム100の動作について説明する。
図4は、実施形態における学習システム100の処理を示すフローチャートである。ここで、図5に示すKBがKB記憶部110に格納されており、図6に示すグラウンデッドネットワークが学習システム100において生成されていると仮定する。
入力部120は、観測値の集合、及び、ターゲットイベントを、新たなトレーニングサンプルとしてユーザなどから受信する(ステップS101)。例えば、入力部120は、観測値e=(ABC, produce, computer)、及び、ターゲットイベントe=(ABC, go bankrupt)を受信する。
エッジ候補生成部131は、新たなエッジの候補を、観測値の集合、及び、ターゲットイベントについて生成する(ステップS102)。例えば、エッジ候補生成部131は、新たなエッジの候補を図7の破線のように生成する。
スコア算出部132は、新たなエッジの候補の各々のエッジスコアSを算出する(ステップS103)。例えば、スコア算出部132は、図7に示すように、生成した新たなエッジの候補について、エッジスコアを算出する。
エッジ選択部133は、エッジスコアに基づいて、生成した新たなエッジの候補から、新たなエッジを選択する(ステップS104)。例えば、エッジ選択部133は、図8に示すように、新たなエッジとして、イベント(ABC, produce, computer)とイベント(ABC, sell, computer)との間の新たなエッジの候補を選択する。
ルール決定部134は、選択した新たなエッジについて、追加すべき新たなルールを含意スコアに基づいて決定する(ステップS105)。例えば、ルール決定部134は、ルール(ABC, produce, computer)=>(ABC, sell, computer)を新たなルールとして決定する。
重み算出部140は、新たなルールの重みを、含意スコア、及び、数式5に基づいて算出する(ステップS106)。例えば、重み算出部140は、新たなルール(ABC, produce, computer)=>(ABC, sell, computer)の重みを算出する。
重み算出部140は、生成した新たなルール、及び、算出した重みを出力する(ステップS107)。例えば、重み算出部140は、新たなルール(ABC, produce, computer)=>(ABC, sell, computer)、及び、当該新たなルールの重みを出力する。
以上により、学習システム100の動作が完了する。
上述の実施形態では、ルール生成部130が、新たなエッジの候補から、観測値、又は、ターゲットイベントを含む全てのサブグラフを接続し、選択した新たなエッジの候補の含意スコアの合計値が最大になるような、最小数の候補を選択することにより、新たなルールを生成した。そして、重み算出部140が、新たなルールについて、確率的推論のための重みを、含意スコアに基づいて算出した。しかしながら、新たなルールをKB内のルール、及び、含意スコアに基づいて生成し、重みを含意スコアに基づいて算出できれば、他の方法を用いてもよい。
例えば、ルール生成部130は、含意スコアの合計値を用いる代わりに、観測値、及び、ターゲットイベントの結合確率を用いてもよい。この場合、ルール生成部130は、新たなエッジ候補から、観測値、又は、ターゲットイベントを含む全てのサブグラフを接続し、観測値、及び、ターゲットイベントの結合確率が最大になるような、最小数の候補を選択することにより、新たなルールを生成する。観測値、及び、ターゲットイベントの結合確率は、選択した新たなエッジの候補に関するルールが存在すると仮定し、かつ、選択した新たなエッジの候補の重みを用いて、MLNに従って得られる。選択した新たなエッジの候補の重みは、重み算出部140により、数式5を用いて算出される。
次に、実施形態の特徴的な構成について説明する。
図1は、実施形態の特徴的な構成を示すブロック図である。
図1を参照すると、学習システム100は、KB(knowledge base)記憶部110と、ルール生成部130と、重み算出部140と、を含む。KB記憶部110は、複数のイベントのイベント間のルール群を記憶する。ルール生成部130は、1以上の新たなルールを、ルール群、及び、イベント間の含意スコアに基づいて生成する。重み算出部140は、確率的推論に適用される1以上の新たなルールの重みを含意スコアに基づいて算出する。
本発明の第1の実施形態によれば、新たな確率的ルールを、トレーニングサンプルが1つしか与えられない場合でも学習できる。その理由は、ルール生成部130が、1以上の新たなルールを、複数のイベントのイベント間のルール群、及び、イベント間の含意スコアに基づいて生成し、重み算出部140が、確率的推論に適用される1以上の新たなルールの重みを、含意スコアに基づいて算出するからである。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
本発明は、確率的論理型推論システムなどに適用可能である。ルールを自動的に完成させることができることは、ルールの全ての候補を前もって生成しておくことができない(又は、そのために非常にコストがかかる)状況において極めて重要である。
100 学習システム
101 CPU
102 記憶デバイス
103 通信デバイス
104 入力デバイス
105 出力デバイス
110 KB記憶部
120 入力部
130 ルール生成部
131 エッジ候補生成部
132 スコア算出部
133 エッジ選択部
134 ルール決定部
140 重み算出部

Claims (9)

  1. 複数のイベントのイベント間のルール群を含む知識ベースを記憶する知識記憶手段と、
    1以上の新たなルールを、前記知識ベースに含まれるルールの重み、及び、前記知識ベースにルールが含まれないイベントの各ペアの含意スコアに基づいて生成する、ルール生成手段と、
    を備える、情報処理システム。
  2. さらに、前記知識ベースにルールが含まれないイベントの各ペアについて、当該イベントのペアの一方のイベントと前記知識ベースにおける当該イベントのペア以外のイベント間のルールの重み、及び、当該イベントのペアの含意スコアに基づき、重みを算出する、重み算出手段を備え、
    前記ルール生成手段は、前記知識ベースにルールが含まれないイベントの各ペアについて算出された重みに基づき、前記1以上の新たなルールを生成する、
    請求項1に記載の情報処理システム。
  3. 前記ルール生成手段は、前記知識ベースにルールが含まれないイベントのペアから、選択したイベントのペアについて算出された重みを用いることにより得られる、観測イベントとターゲットイベントとの結合確率が最大となるような、最小数のイベントのペアを選択することにより、前記1以上の新たなルールを生成する、
    請求項1または2に記載の情報処理システム。
  4. 前記ルール群は、イベントに対応するノードと、ノード間のルールに対応するエッジと、を含むグラフにより表され、
    前記ルール生成手段は、前記知識ベースにルールが含まれないイベントのペアから、観測イベントまたは目的イベントを含む全てのサブグラフが接続され、前記結合確率が最大となるような、最小数のイベントのペアを選択することにより、前記1以上の新たなルールを生成する、
    請求項3に記載の情報処理システム。
  5. 複数のイベントのイベント間のルール群を含む知識ベースを記憶し、
    1以上の新たなルールを、前記知識ベースに含まれるルールの重み、及び、前記知識ベースにルールが含まれないイベントの各ペアの含意スコアに基づいて生成する、
    情報処理方法。
  6. さらに、前記知識ベースにルールが含まれないイベントの各ペアについて、当該イベントのペアの一方のイベントと前記知識ベースにおける当該イベントのペア以外のイベント間のルールの重み、及び、当該イベントのペアの含意スコアに基づき、重みを算出し、
    前記知識ベースにルールが含まれないイベントの各ペアについて算出された重みに基づき、前記1以上の新たなルールを生成する、
    請求項5に記載の情報処理方法。
  7. 前記知識ベースにルールが含まれないイベントのペアから、選択したイベントのペアについて算出された重みを用いることにより得られる、観測イベントとターゲットイベントとの結合確率が最大となるような、最小数のイベントのペアを選択することにより、前記1以上の新たなルールを生成する、
    請求項5または6に記載の情報処理方法。
  8. 前記ルール群は、イベントに対応するノードと、ノード間のルールに対応するエッジと、を含むグラフにより表され、
    前記知識ベースにルールが含まれないイベントのペアから、観測イベントまたは目的イベントを含む全てのサブグラフが接続され、前記結合確率が最大となるような、最小数のイベントのペアを選択することにより、前記1以上の新たなルールを生成する、
    請求項7に記載の情報処理方法。
  9. コンピュータに、
    複数のイベントのイベント間のルール群を含む知識ベースを記憶し、
    1以上の新たなルールを、前記知識ベースに含まれるルールの重み、及び、前記知識ベースにルールが含まれないイベントの各ペアの含意スコアに基づいて生成する、
    処理を実行させるプログラム
JP2019503488A 2016-08-18 2016-08-18 情報処理システム、情報処理方法、及び、プログラム Active JP6702499B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/003774 WO2018033946A1 (en) 2016-08-18 2016-08-18 An information processing system, an information processing method and a computer readable storage medium

Publications (2)

Publication Number Publication Date
JP2019525336A JP2019525336A (ja) 2019-09-05
JP6702499B2 true JP6702499B2 (ja) 2020-06-03

Family

ID=61196817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019503488A Active JP6702499B2 (ja) 2016-08-18 2016-08-18 情報処理システム、情報処理方法、及び、プログラム

Country Status (3)

Country Link
US (1) US20190180192A1 (ja)
JP (1) JP6702499B2 (ja)
WO (1) WO2018033946A1 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09297686A (ja) * 1996-05-07 1997-11-18 Mitsubishi Electric Corp データマイニング装置

Also Published As

Publication number Publication date
JP2019525336A (ja) 2019-09-05
WO2018033946A1 (en) 2018-02-22
US20190180192A1 (en) 2019-06-13

Similar Documents

Publication Publication Date Title
CN110929047B (zh) 关注邻居实体的知识图谱推理方法和装置
CN110334742B (zh) 一种用于文档分类的基于强化学习的通过添加虚假节点的图对抗样本生成方法
JP2021518024A (ja) 機械学習アルゴリズムのためのデータを生成する方法、システム
US11030265B2 (en) Cross-platform data matching method and apparatus, computer device and storage medium
CN111523831B (zh) 风险团伙的识别方法、装置、存储介质和计算机设备
CN111460234B (zh) 图查询方法、装置、电子设备及计算机可读存储介质
CN111143539B (zh) 基于知识图谱的教学领域问答方法
US11593665B2 (en) Systems and methods driven by link-specific numeric information for predicting associations based on predicate types
CN112417169A (zh) 知识图谱的实体对齐方法、装置、计算机设备和存储介质
CN115170449A (zh) 一种多模态融合场景图生成方法、系统、设备和介质
Xu et al. Robust network enhancement from flawed networks
Chen et al. Understanding and accelerating neural architecture search with training-free and theory-grounded metrics
CN114399025A (zh) 一种图神经网络解释方法、系统、终端以及存储介质
CN114254615A (zh) 组卷方法、装置、电子设备和存储介质
JP6702499B2 (ja) 情報処理システム、情報処理方法、及び、プログラム
Chebotarev et al. How to choose the most appropriate centrality measure? A decision tree approach
CN115599990A (zh) 一种知识感知结合深度强化学习的跨域推荐方法及系统
CN109582802B (zh) 一种实体嵌入方法、装置、介质及设备
CN110210691B (zh) 资源推荐方法、装置、存储介质及设备
JP6690713B2 (ja) 推論システム、情報処理システム、推論方法、及び、プログラム
US11972335B2 (en) System and method for improving classification in adversarial machine learning
Bui et al. Toward Multiple Specialty Learners for Explaining GNNs via Online Knowledge Distillation
CN116089722B (zh) 基于图产出标签的实现方法、装置、计算设备和存储介质
Alzubaidi et al. LPCNN: convolutional neural network for link prediction based on network structured features
CN115658926B (zh) 知识图谱的要素推测方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190122

A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20190122

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200420

R150 Certificate of patent or registration of utility model

Ref document number: 6702499

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150