JP7172497B2

JP7172497B2 - 情報処理装置及びプログラム

Info

Publication number: JP7172497B2
Application number: JP2018219690A
Authority: JP
Inventors: 基行鷹合; 一成橋本
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2018-11-22
Filing date: 2018-11-22
Publication date: 2022-11-16
Anticipated expiration: 2038-11-22
Also published as: JP2020086874A

Description

本発明は、情報処理装置及びプログラムに関する。

近年、意味ネットワークをインターネットで共有するためのメカニズムの研究分野として、セマンティック・ウエブ（Semantic Web）が提唱され注目されている。この意味ネットワークとは、意味をコンピュータ処理できる形で表現（一般に「知識表現」と呼ばれる。）する手段の一つである。

例えば、特許文献１には、管理されるネットワークノード内に備えられ、管理されるネットワークノードと関係づけられ、又は管理されるネットワークノードと通信するように構成されたネットワーク管理のための装置が記載されている。この装置は、推論エンジンによる推論能力を備える形式オントロジーを用い、非形式的記述を用いてネットワーク領域及び振る舞いをモデリングするように構成され、領域及び振る舞いを記述する形式オントロジーモデルを与えるモデリング手段を備える。また、この装置は、領域及び振る舞いの形式オントロジーモデルに対して意味情報を加えるように構成された注釈手段を備える。また、この装置は、形式オントロジーモデル及び推論エンジンを用いて、領域及びその振る舞いを示す確率因果ネットワークグラフ構造を生成し更新するように構成されたアルゴリズムを作り出すように構成された生成手段を備える。

また、特許文献２には、知識データベースを解析する方法が記載されている。この方法は、分散取得技術によって収集されたデータの入力を受けるステップと、データからベイズネットワークを導き出すステップと、を含んでいる。

また、特許文献３には、自然言語文から意味ネットワークを生成する情報処理装置が記載されている。この情報処理装置は、入力テキスト内の各要素に対応するオントロジー内の概念を特定する特定手段と、入力テキスト内の要素同士の関係として、それら要素に対応する概念同士の間にオントロジーで規定されている関係を出力する関係出力手段と、を含んでいる。

特表２０１０－５１２０７９号公報特表２００８－５２９１６３号公報特開２０１８－００５６９０号公報

ところで、意味ネットワークは、有向グラフ構造を持ち、各ノードに、物理的あるいは仮想的な存在を表す個体を割り当て、個体間の関係を関係の種類ごとに異なるラベルを持つエッジで結びつけることによって、物や事柄の存在を表現する。個体を示すノードは、「インスタンス」と呼ばれ、２つの個体（ノード）とそれら両者間の関係（エッジ）からなる三者は、「トリプル」と呼ばれる。

上記の意味ネットワークに対して、まだ記述されていないがあり得る事実を導き出し、インスタンスとして意味ネットワークに追加することを推論と呼ぶが、この推論の確からしさを定量的に評価することは行われていない。このため、確からしさが比較的低い推論がなされる場合がある。

本発明は、入力された情報から得られる、インスタンス及びインスタンス間のエッジにより定義される意味ネットワークから、別のインスタンスを推論する場合に、推論の確からしさを定量的に評価することができる情報処理装置及びプログラムを提供することを目的とする。

上記目的を達成するために、第１態様に係る情報処理装置は、予め定義され、かつ、概念と概念とを階層構造で表現したオントロジー情報から得られる第１意味ネットワークに対して、前記第１意味ネットワークのスコアを導出し、かつ、前記第１意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加して得られる第２意味ネットワークに対して、前記第２意味ネットワークのスコアを導出する導出部と、前記導出部により導出された、前記第１意味ネットワークのスコア及び前記第２意味ネットワークのスコアに基づいて、前記第２意味ネットワークの確からしさを判定する判定部と、を備えている。

また、第２態様に係る情報処理装置は、第１態様に係る情報処理装置において、前記第１意味ネットワーク及び前記第２意味ネットワークの各々のスコアが、連結されたグラフの個数、インスタンスの数、インスタンス間のエッジの数、及び各インスタンスのスコアの和又は積の少なくとも一つを用いて導出される。

また、第３態様に係る情報処理装置は、第２態様に係る情報処理装置において、前記連結されたグラフの個数が、インスタンスが全て連結されている場合に１であり、インスタンスの少なくとも一部が連結されていない場合に０であるとされている。

また、第４態様に係る情報処理装置は、第２態様又は第３態様に係る情報処理装置において、前記各インスタンスのスコアが、予め定められたオントロジーの各クラスのスコアに基づく値、オントロジーで定義されたプロパティのうち実際に意味ネットワークでエッジとして関連付けられたプロパティのスコアに基づく値、及び、推論のために新規に追加されたインスタンスであるか否かを示す値の少なくとも一つを用いて導出される。

また、第５態様に係る情報処理装置は、第４態様に係る情報処理装置において、前記プロパティのスコアに基づく値が、予めプロパティに付与されたスコアに、インスタンスから出るエッジの数を乗じて得られる値であるとされている。

また、第６態様に係る情報処理装置は、第１態様～第５態様のいずれか１の態様に係る情報処理装置において、前記判定部が、前記第２意味ネットワークのスコアが、前記第１意味ネットワークのスコアよりも高い場合に、前記第２意味ネットワークが確からしいと判定する。

また、第７態様に係る情報処理装置は、第１態様～第５態様のいずれか１の態様に係る情報処理装置において、前記判定部が、前記第２意味ネットワークのスコアが、前記第１意味ネットワークのスコア以上の閾値よりも高い場合に、前記第２意味ネットワークが確からしいと判定する。

また、第８態様に係る情報処理装置は、第１態様～第７態様のいずれか１の態様に係る情報処理装置において、前記オントロジー情報に基づいて、前記第１意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加する追加部を更に備えている。

また、第９態様に係る情報処理装置は、第８態様に係る情報処理装置において、前記インスタンス間のエッジが、前記インスタンスが属するクラスのプロパティに関連付けられている。

更に、上記目的を達成するために、第１０態様に係るプログラムは、コンピュータを、第１態様～第９態様のいずれか１の態様に係る情報処理装置が備える各部として機能させる。

第１態様及び第１０態様によれば、入力された情報から得られる、インスタンス及びインスタンス間のエッジにより定義される意味ネットワークから、別のインスタンスを推論する場合に、推論の確からしさを定量的に評価することができる、という効果を有する。

第２態様によれば、第１意味ネットワーク及び第２意味ネットワークの各々のスコアを適切に導出することができる、という効果を有する。

第３態様によれば、連結されたグラフの個数を、第１意味ネットワーク及び第２意味ネットワークの各々のスコアに適切に反映させることができる、という効果を有する。

第４態様によれば、各インスタンスのスコアを、第１意味ネットワーク及び第２意味ネットワークの各々のスコアに適切に反映させることができる、という効果を有する。

第５態様によれば、プロパティのスコアに基づく値を、第１意味ネットワーク及び第２意味ネットワークの各々のスコアに適切に反映させることができる、という効果を有する。

第６態様によれば、第１意味ネットワークのスコアと第２意味ネットワークのスコアとを比較しない場合と比較して、第２意味ネットワークの確からしさを精度良く判定することができる、という効果を有する。

第７態様によれば、第２意味ネットワークのスコアと第１意味ネットワークのスコア以上の閾値とを比較しない場合と比較して、第２意味ネットワークの確からしさを精度良く判定することができる。という効果を有する。

第８態様によれば、第１意味ネットワークにインスタンス及びエッジの少なくとも一方を追加することにより、第１意味ネットワークから別の推論を行うことができる、という効果を有する。

第９態様によれば、インスタンス間のエッジを、別の推論に適切に反映させることができる、という効果を有する。

実施形態に係るオントロジー情報の説明に供する図である。実施形態に係る第１意味ネットワークの説明に供する図である。実施形態に係る情報処理装置の電気的な構成の一例を示すブロック図である。実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。実施形態に係る第２意味ネットワークの説明に供する図である。実施形態に係る第２意味ネットワークの説明に供する図である。実施形態に係る第１意味ネットワークの説明に供する図である。実施形態に係る判定処理プログラムによる処理の流れの一例を示すフローチャートである。

以下、図面を参照して、本発明を実施するための形態の一例について詳細に説明する。

本実施形態では、入力された情報（以下、「入力情報」という。）に含まれる要素（単語等の形態素）同士の関係（トリプル）を求めるにあたり、オントロジー情報を利用する。利用するオントロジー情報は、概念同士の上位・下位関係の他に、概念同士の「プロパティ」関係の情報も含む。上位・下位関係は、上位の概念が下位の概念に該当するエンティティをすべて包含するという特定の関係を表すものである。これに対して、プロパティ関係は、上位・下位関係以外で自由に定義可能な関係を表すものである。例えば、概念「人間」と概念「人工物」との間に「所有」というプロパティ関係を定義したり、概念「機械」と概念「動作中」との間に「主体」というプロパティ関係を定義したりすることが可能である。

本実施形態では、入力情報内の各要素に対応するそのオントロジー上の概念を、例えば、辞書等を参照して特定する。そして、それら要素同士の関係を求めるために、それら要素に対応する概念同士の関係をそのオントロジー情報から求める。ここで求めるのは概念間のプロパティ関係である。そして、それら要素と、求めたプロパティ関係とからなる組を、それら要素間の関係（トリプル）の候補として出力する。

入力情報には、例えば、単語等の要素がいくつか含まれており、それら要素同士の組合せがいくつか存在する。このため、それら要素同士の組合せについて上述のようにして求めた関係（トリプル）の候補を組み合わせることで、その入力情報の意味内容を表す意味ネットワークを生成する。この意味ネットワークの生成には、一例として、上述の特許文献３（特開２０１８－００５６９０号公報）に記載の技術等が用いられる。

図１を参照して、本実施形態に係るオントロジー情報について説明する。ここでいうオントロジー情報とは、個体（インスタンス）の特徴の種類（以下、「クラス」という。）や関係の種類（以下、「プロパティ」という。）などの概念を体系的に記述したものである。

図１は、本実施形態に係るオントロジー情報の説明に供する図である。
図１に示すように、本実施形態に係るオントロジー情報は、予め定義され、かつ、概念と概念とが階層構造で表現されている。

図１のグラフに示すオントロジー情報は、一例として、セマンティック・ウェブにおけるＯＷＬ（Web Ontology Language）等を用いて定義される。このオントロジー情報は、意味ネットワークの背景にある前提知識を与えることで、知識表現の標準化と含意推論や意味制約検証などの機能を実現する。また、ユーザにとって有用なドメイン固有の知識体系を記述することも可能である。

図１のグラフでは、楕円形状のノードはクラスを示し、クラス間に定義された「所有」、「主体」、及び「原因」はプロパティを示す。また、クラス間における矢印の先のクラスは、矢印の根元のクラスの上位概念となる。これらクラスの上位・下位関係は、集合的包含関係を表している。一例として、図１に示すように、電灯クラスに属するインスタンスはすべて、機械クラス、人工物クラス、及びＴｈｉｎｇ（ものごと一般）クラスにも属すると定義されている。

また、プロパティには、ドメイン（domain：定義域）及びレンジ（range：値域）が定義される。プロパティのドメイン及びレンジは、そのプロパティとトリプルを構成し得る２つのインスタンス同士の関係において、その関係の始点と終点として取り得る値の範囲を制約する。一例として、図１に示すように、原因プロパティのドメインは「動作中」クラスであり、原因プロパティのレンジは「動作させる」クラスである。これらのプロパティ、ドメイン、レンジ等の概念は、一例として、ＯＷＬがベースとするＲＤＦ（Resource Description Framework）で規定されている。

次に、図２を参照して、オントロジー情報から得られる第１意味ネットワークについて説明する。

図２は、本実施形態に係る第１意味ネットワークＧ１の説明に供する図である。
図２に示す第１意味ネットワークＧ１は、オントロジークラスのインスタンス及びインスタンス間に定義されたプロパティを含んでいる。

図２に示す第１意味ネットワークＧ１は、入力情報の一例として、「太郎の電灯が点灯中。」という事実が入力された場合に、一例として、図１に示すオントロジー情報から生成される意味ネットワークである。なお、矩形状のノードは、点線矢印で示されたオントロジークラスのインスタンスであり、それが事実として存在していることを示している。

次に、図３を参照して、本実施形態に係る情報処理装置１０の構成について説明する。

図３は、本実施形態に係る情報処理装置１０の電気的な構成の一例を示すブロック図である。
図３に示すように、本実施形態に係る情報処理装置１０は、制御部１２と、記憶部１４と、表示部１６と、操作部１８と、通信部２０と、を備えている。

本実施形態に係る情報処理装置１０には、一例として、サーバコンピュータや、パーソナルコンピュータ（ＰＣ：Personal Computer）等の汎用的なコンピュータ装置や、スマートフォン、タブレット端末等の携帯可能なコンピュータ装置等が適用される。

制御部１２は、ＣＰＵ（Central Processing Unit）１２Ａ、ＲＯＭ（Read Only Memory）１２Ｂ、ＲＡＭ（Random Access Memory）１２Ｃ、及び入出力インターフェース（Ｉ／Ｏ）１２Ｄを備えており、これら各部がバスを介して各々接続されている。

Ｉ／Ｏ１２Ｄには、記憶部１４と、表示部１６と、操作部１８と、通信部２０と、を含む各機能部が接続されている。これらの各機能部は、Ｉ／Ｏ１２Ｄを介して、ＣＰＵ１２Ａと相互に通信可能とされる。

制御部１２は、情報処理装置１０の一部の動作を制御するサブ制御部として構成されてもよいし、情報処理装置１０の全体の動作を制御するメイン制御部の一部として構成されてもよい。制御部１２の各ブロックの一部又は全部には、例えば、ＬＳＩ（Large Scale Integration）等の集積回路又はＩＣ（Integrated Circuit）チップセットが用いられる。上記各ブロックに個別の回路を用いてもよいし、一部又は全部を集積した回路を用いてもよい。上記各ブロック同士が一体として設けられてもよいし、一部のブロックが別に設けられてもよい。また、上記各ブロックのそれぞれにおいて、その一部が別に設けられてもよい。制御部１２の集積化には、ＬＳＩに限らず、専用回路又は汎用プロセッサを用いてもよい。

記憶部１４としては、例えば、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、フラッシュメモリ等が用いられる。記憶部１４には、本実施形態に係る推論の確からしさ判定処理を実現するための判定処理プログラム１４Ａが記憶される。なお、この判定処理プログラム１４Ａは、ＲＯＭ１２Ｂに記憶されていてもよい。

判定処理プログラム１４Ａは、例えば、情報処理装置１０に予めインストールされていてもよい。判定処理プログラム１４Ａは、不揮発性の記憶媒体に記憶して、又はネットワークを介して配布して、情報処理装置１０に適宜インストールすることで実現してもよい。なお、不揮発性の記憶媒体の例としては、ＣＤ-ＲＯＭ（Compact Disc Read Only Memory）、光磁気ディスク、ＨＤＤ、ＤＶＤ-ＲＯＭ（Digital Versatile Disc Read Only Memory）、フラッシュメモリ、メモリカード等が想定される。

表示部１６には、例えば、液晶ディスプレイ（ＬＣＤ:Liquid Crystal Display）や有機ＥＬ（Electro Luminescence）ディスプレイ等が用いられる。表示部１６は、タッチパネルを一体的に有していてもよい。操作部１８には、例えば、キーボードやマウス等の操作入力用のデバイスが設けられている。表示部１６及び操作部１８は、情報処理装置１０のユーザから各種の指示を受け付ける。表示部１６は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。

通信部２０は、インターネットや、ＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）等のネットワークに接続されており、外部機器との間でネットワークを介して通信が可能とされる。

ところで、上述したように、推論の確からしさを定量的に評価することは行われていないため、確からしさが比較的低い推論がなされる場合がある。

このため、本実施形態に係る情報処理装置１０のＣＰＵ１２Ａは、記憶部１４に記憶されている判定処理プログラム１４ＡをＲＡＭ１２Ｃに書き込んで実行することにより、図４に示す各部として機能する。

図４は、本実施形態に係る情報処理装置１０の機能的な構成の一例を示すブロック図である。
図４に示すように、本実施形態に係る情報処理装置１０のＣＰＵ１２Ａは、追加部３０、導出部３２、及び判定部３４として機能する。

本実施形態に係る追加部３０は、一例として、上述の図１に示すオントロジー情報に基づいて、一例として、上述の図２に示す第１意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加して第２意味ネットワークを生成する。なお、インスタンス間のエッジは、インスタンスが属するクラスのプロパティに関連付けられている。

本実施形態に係る導出部３２は、第１意味ネットワークに対して、第１意味ネットワークのスコアを導出し、かつ、第２意味ネットワークに対して、第２意味ネットワークのスコアを導出する。

ここで、意味ネットワークを表すグラフ全体のスコアを導出する方法について説明する。

意味ネットワークのスコアは、連結されたグラフの個数、インスタンスの数、インスタンス間のエッジの数、及び各インスタンスのスコアの和又は積の少なくとも一つを用いて導出される。ここでは、意味ネットワークＧのスコア、すなわち、グラフ全体のスコアをＳｃｏｒｅ（Ｇ）で表す。また、連結されたグラフの個数をＡ（Ｇ）で表し、インスタンスの数をＢ（Ｇ）で表す。また、インスタンス間のエッジの数をＣ（Ｇ）で表し、各インスタンスのスコアの和又は積をＤ（Ｇ）で表す。また、各インスタンスのスコアをＳｃｏｒｅ_Ｇ（Ｉｎ）で表す。

なお、連結されたグラフの個数（＝Ａ（Ｇ））は、一例として、インスタンスが全て連結されている場合に１とし、インスタンスの少なくとも一部が連結されていない場合に０とする。

また、各インスタンスのスコア（＝Ｓｃｏｒｅ_Ｇ（Ｉｎ））は、予め定められたオントロジーの各クラスのスコアに基づく値、オントロジーで定義されたプロパティのうち実際に意味ネットワークでエッジとして関連付けられたプロパティのスコアに基づく値、及び、推論のために新規に追加されたインスタンスであるか否かを示す値の少なくとも一つを用いて導出される。ここでは、予め定められたオントロジーの各クラスのスコアに基づく値を、Ｅ_Ｇ（Ｉｎ）で表す。また、オントロジーで定義されたプロパティのうち実際に意味ネットワークでエッジとして関連付けられたプロパティのスコアに基づく値を、Ｆ_Ｇ（Ｉｎ）で表す。また、推論のために新規に追加されたインスタンスであるか否かを示す値を、Ｈ_Ｇ（Ｉｎ）で表す。

なお、プロパティのスコアに基づく値（＝Ｆ_Ｇ（Ｉｎ））は、一例として、予めプロパティに付与されたスコアに、インスタンスから出るエッジの数を乗じて得られる値とする。

以上を踏まえ、一例として、上述の図２に示す第１意味ネットワークＧ１について、以下に示すように、グラフ全体のスコア（＝Ｓｃｏｒｅ（Ｇ１））を導出する。なお、クラスは「」で表し、インスタンス（＝Ｉｎ）は” ”で表し、プロパティ及びインスタンス間のエッジは[ ]で表す。

Ｅ_Ｇ１（Ｉｎ）に関して、一例として、図２に示すように、オントロジーにおける「人間」、「動作させる」、「点灯中」、及び「電灯」の各クラスのスコアを１．０とし、これら以外のクラスのスコアを０．０とする。
また、Ｆ_Ｇ１（Ｉｎ）に関して、プロパティのスコアを全て０．５とする。
また、Ｈ_Ｇ１（Ｉｎ）に関して、推論のために新規に追加されたインスタンスの場合は－０．７５とし、そうでない場合は１．０とする。

例えば、”点灯中”インスタンスの場合、Ｅ_Ｇ１（”点灯中”）、Ｆ_Ｇ１（”点灯中”）、及びＨ_Ｇ１（”点灯中”）は、以下のように導出される。

E_G1("点灯中")=1.0 これは、”点灯中”インスタンスが属する「点灯中」クラスのスコアが１．０であるためである。
F_G1("点灯中")=0.5 これは、”点灯中”インスタンスから出るエッジの数が１つであり、そのプロパティのスコアが０．５であるためである。
H_G1("点灯中")=1.0 これは、”点灯中”インスタンスが推論のために新規に追加されたインスタンスではないためである。

これより、”点灯中”インスタンスのスコアの値を、一例として、以下に示す式（１）を用いて導出する。

(数１)
Score_G1("点灯中")=E_G1("点灯中")×{F_G1("点灯中")＋H_G1("点灯中")} （１）

すなわち、
Score_G1("点灯中")=1.0×(0.5+1.0)=1.5
と導出される。

同様にして、”電灯”インスタンスのスコアの値、”太郎”インスタンスのスコアの値についても以下のように導出される。

Score_G1("電灯")=1.0×(0+1.0)=1.0
Score_G1("太郎")=1.0×(0.5+1.0)=1.5

また、第１意味ネットワークＧ１におけるＡ（Ｇ１）、Ｂ（Ｇ１）、Ｃ（Ｇ１）、及びＤ（Ｇ１）は、以下に示すとおりである。

A(G1)=1 これは、第１意味ネットワークＧ１が全て連結しているためである。
B(G1)=3 これは、第１意味ネットワークＧ１のインスタンスの数が３であるためである。
C(G1)=2 これは、第１意味ネットワークＧ１のインスタンス間のエッジの数が２であるためである。
D(G1)=4.0 これは、Score_G1("点灯中")、Score_G1("電灯")、及びScore_G1("太郎")の和が４．０（＝１．５＋１．０＋１．５）であるためである。なお、Score_G1("点灯中")、Score_G1("電灯")、及びScore_G1("太郎")の積を用いてもよい。

そして、第１意味ネットワークＧ１のグラフ全体のスコアの値を、一例として、以下に示す式（２）を用いて導出する。

(数２)
Score(G1)=A(G1)×D(G1) （２）

すなわち、
Score(G1)=1×4.0=4.0
と導出される。

本実施形態においては、一例として、第１意味ネットワークＧ１において、電灯を点灯しているのは、その電灯を動作させたからであり、その動作を行ったのは、太郎であることを推論する。このため、当該推論を、インスタンス及びインスタンス間のエッジの少なくとも一方を追加することで実行する。

まず、図２に示す第１意味ネットワークＧ１に対して、インスタンス間のエッジを追加することを考える。第１意味ネットワークＧ１において、オントロジー上で定義されたプロパティのうち、意味ネットワーク上で当該プロパティに関連するエッジが存在していない部分は、”点灯中”インスタンスにおける[原因]エッジである。オントロジーにおける[原因]プロパティのレンジは「動作させる」クラスであるので、「動作させる」クラスのインスタンスを意味ネットワークから探し、存在すれば、インスタンス間のエッジの追加を行う。但し、図２に示す例では、「動作させる」クラスのインスタンスが第１意味ネットワークＧ１には存在しないため、インスタンス間のエッジの追加は行われない。

次に、図２に示す第１意味ネットワークＧ１に対して、１つのインスタンスを追加することを考える。ここで、第１意味ネットワークＧ１に追加するインスタンスは、第１意味ネットワークＧ１に出現していないクラスのインスタンスとする。図２に示す例の場合、「動作させる」クラスあるいは「行為」クラスのインスタンスとなる。ここでは、”動作させる”インスタンスを追加して新しく生成された意味ネットワークを第２意味ネットワークＧ２（図示省略）とする。

この場合、”動作させる”インスタンスのスコアの値は、上述の式（１）を用いて、以下のように導出される。

Score_G2("動作させる")=1.0×(0-0.75)=-0.75

これより、D(G2)=1.5+1.0+1.5-0.75=3.25

また、A(G2)=0 これは、第２意味ネットワークＧ２の一部（ここでは、”動作させる”インスタンス）が連結されていないためである。

従って、第２意味ネットワークＧ２のグラフ全体のスコアの値は、上述の式（２）を用いて、以下のように導出される。

Score(G2)=0×3.25=0

次に、図５を参照して、１つのインスタンス及び１つのエッジを追加する場合における第２意味ネットワークについて説明する。

図５は、本実施形態に係る第２意味ネットワークＧ３の説明に供する図である。
図５に示す第２意味ネットワークＧ３は、図２に示す第１意味ネットワークＧ１に対して、１つのインスタンス及び１つのエッジを追加したものである。

ここで、”点灯中”インスタンスは、オントロジーの「動作中」クラスに属し、「動作中」クラスと「動作させる」クラスとの間には、[原因]プロパティが存在する。従って、[原因]プロパティに関連する[原因]エッジは、”動作させる”インスタンスにリンク可能である。ここでは、”動作させる”インスタンス及び[原因]エッジを追加して新しく生成された意味ネットワークを第２意味ネットワークＧ３とする。

Score_G3("動作させる")=1.0×(0-0.75)=-0.75

また、”点灯中”インスタンスについて、Ｅ_Ｇ３（”点灯中”）、Ｆ_Ｇ３（”点灯中”）、及びＨ_Ｇ３（”点灯中”）は、以下のように導出される。

E_G3("点灯中")=1.0 これは、第２意味ネットワークＧ３が全て連結しているためである。
F_G3("点灯中")=1.0 これは、”点灯中”インスタンスから出るエッジの数が２つであり、各プロパティのスコアが０．５であるためである。
H_G3("点灯中")=1.0 これは、”点灯中”インスタンスが推論のために新規に追加されたインスタンスではないためである。

これより、”点灯中”インスタンスのスコアの値は、上述の式（１）を用いて、以下のように導出される。

Score_G3("点灯中")=1.0×(1.0+1.0)=2.0

Score_G3("電灯")=1.0×(0+1.0)=1.0
Score_G3("太郎")=1.0×(0.5+1.0)=1.5

これより、D(G3)=3.75 これは、Score_G3("点灯中")、Score_G3("電灯")、Score_G3("太郎")、及びScore_G3("動作させる")の和が３．７５（＝２．０＋１．０＋１．５－０．７５）であるためである。なお、Score_G3("点灯中")、Score_G3("電灯")、Score_G3("太郎")、及びScore_G3("動作させる")の積を用いてもよい。

そして、第２意味ネットワークＧ３のグラフ全体のスコアの値は、上述の式（２）を用いて、以下のように導出される。

Score(G3)=1×3.75=3.75

次に、図６を参照して、１つのインスタンス及び２つのエッジを追加する場合における第２意味ネットワークについて説明する。

図６は、本実施形態に係る第２意味ネットワークＧ４の説明に供する図である。
図６に示す第２意味ネットワークＧ４は、図２に示す第１意味ネットワークＧ１に対して、１つのインスタンス及び２つのエッジを追加したものである。

ここで、”動作させる”インスタンスは、オントロジーの「動作させる」クラスに属し、「動作させる」クラスと「人間」クラスとの間には、[主体]プロパティが存在する。従って、[主体]プロパティに関連する[主体]エッジは、”太郎”インスタンスにリンク可能である。ここでは、”動作させる”インスタンス、[原因]エッジ、及び[主体]エッジを追加して新しく生成された意味ネットワークを第２意味ネットワークＧ４とする。

この場合、”動作させる”インスタンスについて、Ｅ_Ｇ４（”動作させる”）、Ｆ_Ｇ４（”動作させる”）、及びＨ_Ｇ４（”動作させる”）は、以下のように導出される。

E_G4("動作させる")=1.0 これは、第２意味ネットワークＧ４が全て連結しているためである。
F_G4("動作させる")=0.5 これは、”動作させる”インスタンスから出るエッジの数が１つであり、そのプロパティのスコアが０．５であるためである。
H_G4("動作させる")=-0.75 これは、”動作させる”インスタンスが推論のために新規に追加されたインスタンスであるためである。

これより、”動作させる”インスタンスのスコアの値は、上述の式（１）を用いて、以下のように導出される。

Score_G4("動作させる")=1.0×(0.5-0.75)=-0.25

同様にして、”点灯中”インスタンスのスコアの値、”電灯”インスタンスのスコアの値、及び”太郎”インスタンスのスコアの値についても以下のように導出される。

Score_G4("点灯中")=1.0×(1.0+1.0)=2.0
Score_G4("電灯")=1.0×(0+1.0)=1.0
Score_G4("太郎")=1.0×(0.5+1.0)=1.5

これより、D(G4)=4.25 これは、Score_G4("点灯中")、Score_G4("電灯")、Score_G4("太郎")、及びScore_G4("動作させる")の和が４．２５（＝２．０＋１．０＋１．５－０．２５）であるためである。なお、Score_G4("点灯中")、Score_G4("電灯")、Score_G4("太郎")、及びScore_G4("動作させる")の積を用いてもよい。

そして、第２意味ネットワークＧ４のグラフ全体のスコアの値は、上述の式（２）を用いて、以下のように導出される。

Score(G4)=1×4.25=4.25

図４に戻り、本実施形態に係る判定部３４は、導出部３２により導出された、第１意味ネットワークＧ１のスコア及び第２意味ネットワークＧ４のスコアに基づいて、第２意味ネットワークＧ４の確からしさを判定する。具体的には、第２意味ネットワークＧ４のスコアが、第１意味ネットワークＧ１のスコアよりも高い場合に、第２意味ネットワークＧ４が確からしいと判定する。あるいは、判定部３４は、第２意味ネットワークＧ４のスコアが、第１意味ネットワークＧ１のスコア以上の閾値よりも高い場合に、第２意味ネットワークＧ４が確からしいと判定してもよい。この場合、第１意味ネットワークＧ１のグラフ全体のスコアが例えば４．０であれば、４．０以上の閾値を用いて、第２意味ネットワークＧ４の確からしさが判定される。

上記導出例の場合、Ｓｃｏｒｅ（Ｇ４）＞Ｓｃｏｒｅ（Ｇ１）であるため、第２意味ネットワークＧ４は確からしい、つまり、この推論はもっともらしいと判定される。すなわち、新しく生成された第２意味ネットワークＧ４は、入力された事実「太郎の電灯が点灯中。」に対して、電灯が点灯中であるのであれば、誰かがその電灯を動作させたに違いなく、それはおそらく太郎であるという推論を行った結果を表している。

これに対して、入力情報として入力された事実が、例えば、「太郎の電灯。」である場合について説明する。この場合、太郎が電灯を所有していることだけが判明しており、電灯が点灯していると推論するのは行き過ぎであると考えられる。

図７は、本実施形態に係る第１意味ネットワークＧ５の説明に供する図である。
図７に示す第１意味ネットワークＧ５は、入力情報として、「太郎の電灯。」という事実が入力された場合に、一例として、図１に示すオントロジー情報から生成される意味ネットワークである。

この場合、”太郎”インスタンスについて、Ｅ_Ｇ５（”太郎”）、Ｆ_Ｇ５（”太郎”）、及びＨ_Ｇ５（”太郎”）は、以下のように導出される。

E_G5("太郎")=1.0 これは、第１意味ネットワークＧ５が全て連結しているためである。
F_G5("太郎")=0.5 これは、”太郎”インスタンスから出るエッジの数が１つであり、そのプロパティのスコアが０．５であるためである。
H_G5("太郎")=1.0 これは、”太郎”インスタンスが推論のために新規に追加されたインスタンスではないためである。

これより、”太郎”インスタンスのスコアの値は、上述の式（１）を用いて、以下のように導出される。

Score_G5("太郎")=1.0×(0.5+1.0)=1.5

同様にして、”電灯”インスタンスのスコアの値についても以下のように導出される。

Score_G5("電灯")=1.0×(0+1.0)=1.0

これより、D(G5)=2.5 これは、Score_G5("太郎")及びScore_G5("電灯")の和が２．５（＝１．０＋１．５）であるためである。なお、Score_G5("太郎")及びScore_G5("電灯")の積を用いてもよい。

そして、第１意味ネットワークＧ５のグラフ全体のスコアの値は、上述の式（２）を用いて、以下のように導出される。

Score(G5)=1×2.5=2.5

この第１意味ネットワークＧ５に対して、”点灯中”インスタンス及び[主体]エッジを追加して新しく生成された意味ネットワークを第２意味ネットワークＧ６（図示省略）とする。この第２意味ネットワークＧ６は、上述の図２に示した第１意味ネットワークＧ１とグラフ構造は同一となるが、グラフ全体のスコアが異なる。

この場合、”点灯中”インスタンスについて、Ｅ_Ｇ６（”点灯中”）、Ｆ_Ｇ６（”点灯中”）、及びＨ_Ｇ６（”点灯中”）は、以下のように導出される。

E_G6("点灯中")=1.0 これは、第２意味ネットワークＧ６が全て連結しているためである。
F_G6("点灯中")=0.5 これは、”点灯中”インスタンスから出るエッジの数が１つであり、そのプロパティのスコアが０．５であるためである。
H_G6("点灯中")=-0.75 これは、”点灯中”インスタンスが推論のために新規に追加されたインスタンスであるためである。

Score_G6("点灯中")=1.0×(0.5-0.75)=-0.25

同様にして、”太郎”インスタンスのスコアの値、”電灯”インスタンスのスコアの値についても以下のように導出される。

Score_G6("太郎")=1.0×(0.5+1.0)=1.5
Score_G6("電灯")=1.0×(0+1.0)=1.0

これより、D(G6)=2.25 これは、Score_G6("太郎")、Score_G6("電灯")、及びScore_G6("点灯中")の和が２．２５（＝１．５＋１．０－０．２５）であるためである。なお、Score_G6("太郎")、Score_G6("電灯")、及びScore_G6("点灯中")の積を用いてもよい。

そして、第２意味ネットワークＧ６のグラフ全体のスコアの値は、上述の式（２）を用いて、以下のように導出される。

Score(G6)=1×2.25=2.25

上記導出例の場合、Ｓｃｏｒｅ（Ｇ６）＜Ｓｃｏｒｅ（Ｇ５）であるため、第２意味ネットワークＧ６は確からしくない、つまり、この推論はもっともらしくないと判定される。

次に、図８を参照して、本実施形態に係る情報処理装置１０の作用を説明する。

図８は、本実施形態に係る判定処理プログラム１４Ａによる処理の流れの一例を示すフローチャートである。

まず、情報処理装置１０に対して、ユーザにより判定処理プログラム１４Ａの起動が指示されると、以下の各ステップを実行する。

図８のステップ１００では、追加部３０が、一例として、上述の図１に示すオントロジー情報から、一例として、上述の図２に示す第１意味ネットワークＧ１を生成する。

ステップ１０２では、追加部３０が、第１意味ネットワークＧ１に対して、インスタンス及びインスタンス間のエッジの少なくとも一方を追加し、一例として、図６に示す第２意味ネットワークＧ４を生成する。

ステップ１０４では、導出部３２が、ステップ１００で生成された第１意味ネットワークＧ１及びステップ１０２で生成された第２意味ネットワークＧ４の各々のスコアを、一例として、上述の式（１）及び式（２）を用いて導出する。

ステップ１０６では、判定部３４が、ステップ１０４で導出された、第２意味ネットワークＧ４のスコアが第１意味ネットワークＧ１のスコアよりも高いか否かを判定する。第２意味ネットワークＧ４のスコアが第１意味ネットワークＧ１のスコアよりも高いと判定した場合（肯定判定の場合）、ステップ１０８に移行する。一方、第２意味ネットワークＧ４のスコアが第１意味ネットワークＧ１のスコア以下であると判定した場合（否定判定の場合）、ステップ１１０に移行する。

ステップ１０８では、判定部３４が、第２意味ネットワークＧ４による推論は確からしいと判定し、本判定処理プログラム１４Ａによる一連の処理を終了する。なお、推論の判定結果は、表示部１６に表示させるようにしてもよい。

一方、ステップ１１０では、判定部３４が、第２意味ネットワークＧ４による推論は確からしくないと判定し、本判定処理プログラム１４Ａによる一連の処理を終了する。なお、推論の判定結果は、上記と同様に、表示部１６に表示させるようにしてもよい。

このように本実施形態によれば、入力情報から得られる、インスタンス及びインスタンス間のエッジにより定義される意味ネットワークから、別のインスタンスを推論する場合に、推論の確からしさが定量的に評価される。このため、確からしさが比較的低い推論がなされることが抑制される。

なお、意味ネットワークを探索する場合に、一般的な探索の基本アルゴリズムとして深さ優先、幅優先アルゴリズム等があるが、これらは全探索アルゴリズムであるため、時間あるいは空間(メモリ)の消費が大きい。そこで、意味ネットワークのスコアを評価関数としたヒューリスティックな探索アルゴリズムを適用してもよい。

また、上記では、オントロジーにおけるクラスのスコアを既知として与えていた。このスコアは、そのクラスが出現した場合の意味的な重要度を表している。このため、このスコアを、文書中に出現する単語のｔｆ（Term Frequency、単語の出現頻度）-ｉｄｆ（Inverse Document Frequency、逆文書頻度）スコア等に基づいて算出してもよい。

以上、実施形態に係る情報処理装置を例示して説明した。実施形態は、情報処理装置が備える各部の機能をコンピュータに実行させるためのプログラムの形態としてもよい。実施形態は、このプログラムを記憶したコンピュータが読み取り可能な記憶媒体の形態としてもよい。

その他、上記実施形態で説明した情報処理装置の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。

また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。

また、上記実施形態では、プログラムを実行することにより、実施形態に係る処理がコンピュータを利用してソフトウェア構成により実現される場合について説明したが、これに限らない。実施形態は、例えば、ハードウェア構成や、ハードウェア構成とソフトウェア構成との組み合わせによって実現してもよい。

１０情報処理装置
１２制御部
１２ＡＣＰＵ
１２ＢＲＯＭ
１２ＣＲＡＭ
１２ＤＩ／Ｏ
１４記憶部
１４Ａ判定処理プログラム
１６表示部
１８操作部
２０通信部
３０追加部
３２導出部
３４判定部

Claims

予め定義され、かつ、概念と概念とを階層構造で表現したオントロジー情報から得られる第１意味ネットワークに対して、前記第１意味ネットワークのスコアを導出し、かつ、前記第１意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加して得られる第２意味ネットワークに対して、前記第２意味ネットワークのスコアを導出する導出部と、
前記導出部により導出された、前記第１意味ネットワークのスコア及び前記第２意味ネットワークのスコアに基づいて、前記第２意味ネットワークの確からしさを判定する判定部と、
を備えた情報処理装置。
前記第１意味ネットワーク及び前記第２意味ネットワークの各々のスコアは、連結されたグラフの個数、インスタンスの数、インスタンス間のエッジの数、及び各インスタンスのスコアの和又は積の少なくとも一つを用いて導出される請求項１に記載の情報処理装置。
前記連結されたグラフの個数は、インスタンスが全て連結されている場合に１であり、インスタンスの少なくとも一部が連結されていない場合に０である請求項２に記載の情報処理装置。
前記各インスタンスのスコアは、予め定められたオントロジーの各クラスのスコアに基づく値、オントロジーで定義されたプロパティのうち実際に意味ネットワークでエッジとして関連付けられたプロパティのスコアに基づく値、及び、推論のために新規に追加されたインスタンスであるか否かを示す値の少なくとも一つを用いて導出される請求項２又は３に記載の情報処理装置。
前記プロパティのスコアに基づく値は、予めプロパティに付与されたスコアに、インスタンスから出るエッジの数を乗じて得られる値である請求項４に記載の情報処理装置。
前記判定部は、前記第２意味ネットワークのスコアが、前記第１意味ネットワークのスコアよりも高い場合に、前記第２意味ネットワークが確からしいと判定する請求項１～５のいずれか１項に記載の情報処理装置。
前記判定部は、前記第２意味ネットワークのスコアが、前記第１意味ネットワークのスコア以上の閾値よりも高い場合に、前記第２意味ネットワークが確からしいと判定する請求項１～５のいずれか１項に記載の情報処理装置。
前記オントロジー情報に基づいて、前記第１意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加する追加部を更に備えた請求項１～７のいずれか１項に情報処理装置。
前記インスタンス間のエッジは、前記インスタンスが属するクラスのプロパティに関連付けられている請求項８に記載の情報処理装置。
コンピュータを、請求項１～９のいずれか１項に記載の情報処理装置が備える各部として機能させるためのプログラム。