JP2020086874A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2020086874A
JP2020086874A JP2018219690A JP2018219690A JP2020086874A JP 2020086874 A JP2020086874 A JP 2020086874A JP 2018219690 A JP2018219690 A JP 2018219690A JP 2018219690 A JP2018219690 A JP 2018219690A JP 2020086874 A JP2020086874 A JP 2020086874A
Authority
JP
Japan
Prior art keywords
score
semantic network
instance
information processing
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018219690A
Other languages
English (en)
Other versions
JP7172497B2 (ja
Inventor
基行 鷹合
Motoyuki Takaai
基行 鷹合
橋本 一成
Kazunari Hashimoto
一成 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2018219690A priority Critical patent/JP7172497B2/ja
Publication of JP2020086874A publication Critical patent/JP2020086874A/ja
Application granted granted Critical
Publication of JP7172497B2 publication Critical patent/JP7172497B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】入力された情報から得られる、インスタンス及びインスタンス間のエッジにより定義される意味ネットワークから、別のインスタンスを推論する場合に、推論の確からしさを定量的に評価することができる情報処理装置及びプログラムを提供する。【解決手段】情報処理装置10は、予め定義され、かつ、概念と概念とを階層構造で表現したオントロジー情報から得られる第1意味ネットワークに対して、第1意味ネットワークのスコアを導出し、かつ、第1意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加して得られる第2意味ネットワークに対して、第2意味ネットワークのスコアを導出する導出部32と、導出部32により導出された、第1意味ネットワークのスコア及び第2意味ネットワークのスコアに基づいて、第2意味ネットワークの確からしさを判定する判定部34と、を備える。【選択図】図4

Description

本発明は、情報処理装置及びプログラムに関する。
近年、意味ネットワークをインターネットで共有するためのメカニズムの研究分野として、セマンティック・ウエブ(Semantic Web)が提唱され注目されている。この意味ネットワークとは、意味をコンピュータ処理できる形で表現(一般に「知識表現」と呼ばれる。)する手段の一つである。
例えば、特許文献1には、管理されるネットワークノード内に備えられ、管理されるネットワークノードと関係づけられ、又は管理されるネットワークノードと通信するように構成されたネットワーク管理のための装置が記載されている。この装置は、推論エンジンによる推論能力を備える形式オントロジーを用い、非形式的記述を用いてネットワーク領域及び振る舞いをモデリングするように構成され、領域及び振る舞いを記述する形式オントロジーモデルを与えるモデリング手段を備える。また、この装置は、領域及び振る舞いの形式オントロジーモデルに対して意味情報を加えるように構成された注釈手段を備える。また、この装置は、形式オントロジーモデル及び推論エンジンを用いて、領域及びその振る舞いを示す確率因果ネットワークグラフ構造を生成し更新するように構成されたアルゴリズムを作り出すように構成された生成手段を備える。
また、特許文献2には、知識データベースを解析する方法が記載されている。この方法は、分散取得技術によって収集されたデータの入力を受けるステップと、データからベイズネットワークを導き出すステップと、を含んでいる。
また、特許文献3には、自然言語文から意味ネットワークを生成する情報処理装置が記載されている。この情報処理装置は、入力テキスト内の各要素に対応するオントロジー内の概念を特定する特定手段と、入力テキスト内の要素同士の関係として、それら要素に対応する概念同士の間にオントロジーで規定されている関係を出力する関係出力手段と、を含んでいる。
特表2010−512079号公報 特表2008−529163号公報 特開2018−005690号公報
ところで、意味ネットワークは、有向グラフ構造を持ち、各ノードに、物理的あるいは仮想的な存在を表す個体を割り当て、個体間の関係を関係の種類ごとに異なるラベルを持つエッジで結びつけることによって、物や事柄の存在を表現する。個体を示すノードは、「インスタンス」と呼ばれ、2つの個体(ノード)とそれら両者間の関係(エッジ)からなる三者は、「トリプル」と呼ばれる。
上記の意味ネットワークに対して、まだ記述されていないがあり得る事実を導き出し、インスタンスとして意味ネットワークに追加することを推論と呼ぶが、この推論の確からしさを定量的に評価することは行われていない。このため、確からしさが比較的低い推論がなされる場合がある。
本発明は、入力された情報から得られる、インスタンス及びインスタンス間のエッジにより定義される意味ネットワークから、別のインスタンスを推論する場合に、推論の確からしさを定量的に評価することができる情報処理装置及びプログラムを提供することを目的とする。
上記目的を達成するために、第1態様に係る情報処理装置は、予め定義され、かつ、概念と概念とを階層構造で表現したオントロジー情報から得られる第1意味ネットワークに対して、前記第1意味ネットワークのスコアを導出し、かつ、前記第1意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加して得られる第2意味ネットワークに対して、前記第2意味ネットワークのスコアを導出する導出部と、前記導出部により導出された、前記第1意味ネットワークのスコア及び前記第2意味ネットワークのスコアに基づいて、前記第2意味ネットワークの確からしさを判定する判定部と、を備えている。
また、第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記第1意味ネットワーク及び前記第2意味ネットワークの各々のスコアが、連結されたグラフの個数、インスタンスの数、インスタンス間のエッジの数、及び各インスタンスのスコアの和又は積の少なくとも一つを用いて導出される。
また、第3態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記連結されたグラフの個数が、インスタンスが全て連結されている場合に1であり、インスタンスの少なくとも一部が連結されていない場合に0であるとされている。
また、第4態様に係る情報処理装置は、第2態様又は第3態様に係る情報処理装置において、前記各インスタンスのスコアが、予め定められたオントロジーの各クラスのスコアに基づく値、オントロジーで定義されたプロパティのうち実際に意味ネットワークでエッジとして関連付けられたプロパティのスコアに基づく値、及び、推論のために新規に追加されたインスタンスであるか否かを示す値の少なくとも一つを用いて導出される。
また、第5態様に係る情報処理装置は、第4態様に係る情報処理装置において、前記プロパティのスコアに基づく値が、予めプロパティに付与されたスコアに、インスタンスから出るエッジの数を乗じて得られる値であるとされている。
また、第6態様に係る情報処理装置は、第1態様〜第5態様のいずれか1の態様に係る情報処理装置において、前記判定部が、前記第2意味ネットワークのスコアが、前記第1意味ネットワークのスコアよりも高い場合に、前記第2意味ネットワークが確からしいと判定する。
また、第7態様に係る情報処理装置は、第1態様〜第5態様のいずれか1の態様に係る情報処理装置において、前記判定部が、前記第2意味ネットワークのスコアが、前記第1意味ネットワークのスコア以上の閾値よりも高い場合に、前記第2意味ネットワークが確からしいと判定する。
また、第8態様に係る情報処理装置は、第1態様〜第7態様のいずれか1の態様に係る情報処理装置において、前記オントロジー情報に基づいて、前記第1意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加する追加部を更に備えている。
また、第9態様に係る情報処理装置は、第8態様に係る情報処理装置において、前記インスタンス間のエッジが、前記インスタンスが属するクラスのプロパティに関連付けられている。
更に、上記目的を達成するために、第10態様に係るプログラムは、コンピュータを、第1態様〜第9態様のいずれか1の態様に係る情報処理装置が備える各部として機能させる。
第1態様及び第10態様によれば、入力された情報から得られる、インスタンス及びインスタンス間のエッジにより定義される意味ネットワークから、別のインスタンスを推論する場合に、推論の確からしさを定量的に評価することができる、という効果を有する。
第2態様によれば、第1意味ネットワーク及び第2意味ネットワークの各々のスコアを適切に導出することができる、という効果を有する。
第3態様によれば、連結されたグラフの個数を、第1意味ネットワーク及び第2意味ネットワークの各々のスコアに適切に反映させることができる、という効果を有する。
第4態様によれば、各インスタンスのスコアを、第1意味ネットワーク及び第2意味ネットワークの各々のスコアに適切に反映させることができる、という効果を有する。
第5態様によれば、プロパティのスコアに基づく値を、第1意味ネットワーク及び第2意味ネットワークの各々のスコアに適切に反映させることができる、という効果を有する。
第6態様によれば、第1意味ネットワークのスコアと第2意味ネットワークのスコアとを比較しない場合と比較して、第2意味ネットワークの確からしさを精度良く判定することができる、という効果を有する。
第7態様によれば、第2意味ネットワークのスコアと第1意味ネットワークのスコア以上の閾値とを比較しない場合と比較して、第2意味ネットワークの確からしさを精度良く判定することができる。という効果を有する。
第8態様によれば、第1意味ネットワークにインスタンス及びエッジの少なくとも一方を追加することにより、第1意味ネットワークから別の推論を行うことができる、という効果を有する。
第9態様によれば、インスタンス間のエッジを、別の推論に適切に反映させることができる、という効果を有する。
実施形態に係るオントロジー情報の説明に供する図である。 実施形態に係る第1意味ネットワークの説明に供する図である。 実施形態に係る情報処理装置の電気的な構成の一例を示すブロック図である。 実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。 実施形態に係る第2意味ネットワークの説明に供する図である。 実施形態に係る第2意味ネットワークの説明に供する図である。 実施形態に係る第1意味ネットワークの説明に供する図である。 実施形態に係る判定処理プログラムによる処理の流れの一例を示すフローチャートである。
以下、図面を参照して、本発明を実施するための形態の一例について詳細に説明する。
本実施形態では、入力された情報(以下、「入力情報」という。)に含まれる要素(単語等の形態素)同士の関係(トリプル)を求めるにあたり、オントロジー情報を利用する。利用するオントロジー情報は、概念同士の上位・下位関係の他に、概念同士の「プロパティ」関係の情報も含む。上位・下位関係は、上位の概念が下位の概念に該当するエンティティをすべて包含するという特定の関係を表すものである。これに対して、プロパティ関係は、上位・下位関係以外で自由に定義可能な関係を表すものである。例えば、概念「人間」と概念「人工物」との間に「所有」というプロパティ関係を定義したり、概念「機械」と概念「動作中」との間に「主体」というプロパティ関係を定義したりすることが可能である。
本実施形態では、入力情報内の各要素に対応するそのオントロジー上の概念を、例えば、辞書等を参照して特定する。そして、それら要素同士の関係を求めるために、それら要素に対応する概念同士の関係をそのオントロジー情報から求める。ここで求めるのは概念間のプロパティ関係である。そして、それら要素と、求めたプロパティ関係とからなる組を、それら要素間の関係(トリプル)の候補として出力する。
入力情報には、例えば、単語等の要素がいくつか含まれており、それら要素同士の組合せがいくつか存在する。このため、それら要素同士の組合せについて上述のようにして求めた関係(トリプル)の候補を組み合わせることで、その入力情報の意味内容を表す意味ネットワークを生成する。この意味ネットワークの生成には、一例として、上述の特許文献3(特開2018−005690号公報)に記載の技術等が用いられる。
図1を参照して、本実施形態に係るオントロジー情報について説明する。ここでいうオントロジー情報とは、個体(インスタンス)の特徴の種類(以下、「クラス」という。)や関係の種類(以下、「プロパティ」という。)などの概念を体系的に記述したものである。
図1は、本実施形態に係るオントロジー情報の説明に供する図である。
図1に示すように、本実施形態に係るオントロジー情報は、予め定義され、かつ、概念と概念とが階層構造で表現されている。
図1のグラフに示すオントロジー情報は、一例として、セマンティック・ウェブにおけるOWL(Web Ontology Language)等を用いて定義される。このオントロジー情報は、意味ネットワークの背景にある前提知識を与えることで、知識表現の標準化と含意推論や意味制約検証などの機能を実現する。また、ユーザにとって有用なドメイン固有の知識体系を記述することも可能である。
図1のグラフでは、楕円形状のノードはクラスを示し、クラス間に定義された「所有」、「主体」、及び「原因」はプロパティを示す。また、クラス間における矢印の先のクラスは、矢印の根元のクラスの上位概念となる。これらクラスの上位・下位関係は、集合的包含関係を表している。一例として、図1に示すように、電灯クラスに属するインスタンスはすべて、機械クラス、人工物クラス、及びThing(ものごと一般)クラスにも属すると定義されている。
また、プロパティには、ドメイン(domain:定義域)及びレンジ(range:値域)が定義される。プロパティのドメイン及びレンジは、そのプロパティとトリプルを構成し得る2つのインスタンス同士の関係において、その関係の始点と終点として取り得る値の範囲を制約する。一例として、図1に示すように、原因プロパティのドメインは「動作中」クラスであり、原因プロパティのレンジは「動作させる」クラスである。これらのプロパティ、ドメイン、レンジ等の概念は、一例として、OWLがベースとするRDF(Resource Description Framework)で規定されている。
次に、図2を参照して、オントロジー情報から得られる第1意味ネットワークについて説明する。
図2は、本実施形態に係る第1意味ネットワークG1の説明に供する図である。
図2に示す第1意味ネットワークG1は、オントロジークラスのインスタンス及びインスタンス間に定義されたプロパティを含んでいる。
図2に示す第1意味ネットワークG1は、入力情報の一例として、「太郎の電灯が点灯中。」という事実が入力された場合に、一例として、図1に示すオントロジー情報から生成される意味ネットワークである。なお、矩形状のノードは、点線矢印で示されたオントロジークラスのインスタンスであり、それが事実として存在していることを示している。
次に、図3を参照して、本実施形態に係る情報処理装置10の構成について説明する。
図3は、本実施形態に係る情報処理装置10の電気的な構成の一例を示すブロック図である。
図3に示すように、本実施形態に係る情報処理装置10は、制御部12と、記憶部14と、表示部16と、操作部18と、通信部20と、を備えている。
本実施形態に係る情報処理装置10には、一例として、サーバコンピュータや、パーソナルコンピュータ(PC:Personal Computer)等の汎用的なコンピュータ装置や、スマートフォン、タブレット端末等の携帯可能なコンピュータ装置等が適用される。
制御部12は、CPU(Central Processing Unit)12A、ROM(Read Only Memory)12B、RAM(Random Access Memory)12C、及び入出力インターフェース(I/O)12Dを備えており、これら各部がバスを介して各々接続されている。
I/O12Dには、記憶部14と、表示部16と、操作部18と、通信部20と、を含む各機能部が接続されている。これらの各機能部は、I/O12Dを介して、CPU12Aと相互に通信可能とされる。
制御部12は、情報処理装置10の一部の動作を制御するサブ制御部として構成されてもよいし、情報処理装置10の全体の動作を制御するメイン制御部の一部として構成されてもよい。制御部12の各ブロックの一部又は全部には、例えば、LSI(Large Scale Integration)等の集積回路又はIC(Integrated Circuit)チップセットが用いられる。上記各ブロックに個別の回路を用いてもよいし、一部又は全部を集積した回路を用いてもよい。上記各ブロック同士が一体として設けられてもよいし、一部のブロックが別に設けられてもよい。また、上記各ブロックのそれぞれにおいて、その一部が別に設けられてもよい。制御部12の集積化には、LSIに限らず、専用回路又は汎用プロセッサを用いてもよい。
記憶部14としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等が用いられる。記憶部14には、本実施形態に係る推論の確からしさ判定処理を実現するための判定処理プログラム14Aが記憶される。なお、この判定処理プログラム14Aは、ROM12Bに記憶されていてもよい。
判定処理プログラム14Aは、例えば、情報処理装置10に予めインストールされていてもよい。判定処理プログラム14Aは、不揮発性の記憶媒体に記憶して、又はネットワークを介して配布して、情報処理装置10に適宜インストールすることで実現してもよい。なお、不揮発性の記憶媒体の例としては、CD-ROM(Compact Disc Read Only Memory)、光磁気ディスク、HDD、DVD-ROM(Digital Versatile Disc Read Only Memory)、フラッシュメモリ、メモリカード等が想定される。
表示部16には、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(Electro Luminescence)ディスプレイ等が用いられる。表示部16は、タッチパネルを一体的に有していてもよい。操作部18には、例えば、キーボードやマウス等の操作入力用のデバイスが設けられている。表示部16及び操作部18は、情報処理装置10のユーザから各種の指示を受け付ける。表示部16は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。
通信部20は、インターネットや、LAN(Local Area Network)、WAN(Wide Area Network)等のネットワークに接続されており、外部機器との間でネットワークを介して通信が可能とされる。
ところで、上述したように、推論の確からしさを定量的に評価することは行われていないため、確からしさが比較的低い推論がなされる場合がある。
このため、本実施形態に係る情報処理装置10のCPU12Aは、記憶部14に記憶されている判定処理プログラム14AをRAM12Cに書き込んで実行することにより、図4に示す各部として機能する。
図4は、本実施形態に係る情報処理装置10の機能的な構成の一例を示すブロック図である。
図4に示すように、本実施形態に係る情報処理装置10のCPU12Aは、追加部30、導出部32、及び判定部34として機能する。
本実施形態に係る追加部30は、一例として、上述の図1に示すオントロジー情報に基づいて、一例として、上述の図2に示す第1意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加して第2意味ネットワークを生成する。なお、インスタンス間のエッジは、インスタンスが属するクラスのプロパティに関連付けられている。
本実施形態に係る導出部32は、第1意味ネットワークに対して、第1意味ネットワークのスコアを導出し、かつ、第2意味ネットワークに対して、第2意味ネットワークのスコアを導出する。
ここで、意味ネットワークを表すグラフ全体のスコアを導出する方法について説明する。
意味ネットワークのスコアは、連結されたグラフの個数、インスタンスの数、インスタンス間のエッジの数、及び各インスタンスのスコアの和又は積の少なくとも一つを用いて導出される。ここでは、意味ネットワークGのスコア、すなわち、グラフ全体のスコアをScore(G)で表す。また、連結されたグラフの個数をA(G)で表し、インスタンスの数をB(G)で表す。また、インスタンス間のエッジの数をC(G)で表し、各インスタンスのスコアの和又は積をD(G)で表す。また、各インスタンスのスコアをScore_G(In)で表す。
なお、連結されたグラフの個数(=A(G))は、一例として、インスタンスが全て連結されている場合に1とし、インスタンスの少なくとも一部が連結されていない場合に0とする。
また、各インスタンスのスコア(=Score_G(In))は、予め定められたオントロジーの各クラスのスコアに基づく値、オントロジーで定義されたプロパティのうち実際に意味ネットワークでエッジとして関連付けられたプロパティのスコアに基づく値、及び、推論のために新規に追加されたインスタンスであるか否かを示す値の少なくとも一つを用いて導出される。ここでは、予め定められたオントロジーの各クラスのスコアに基づく値を、E_G(In)で表す。また、オントロジーで定義されたプロパティのうち実際に意味ネットワークでエッジとして関連付けられたプロパティのスコアに基づく値を、F_G(In)で表す。また、推論のために新規に追加されたインスタンスであるか否かを示す値を、H_G(In)で表す。
なお、プロパティのスコアに基づく値(=F_G(In))は、一例として、予めプロパティに付与されたスコアに、インスタンスから出るエッジの数を乗じて得られる値とする。
以上を踏まえ、一例として、上述の図2に示す第1意味ネットワークG1について、以下に示すように、グラフ全体のスコア(=Score(G1))を導出する。なお、クラスは「 」で表し、インスタンス(=In)は” ”で表し、プロパティ及びインスタンス間のエッジは[ ]で表す。
E_G1(In)に関して、一例として、図2に示すように、オントロジーにおける「人間」、「動作させる」、「点灯中」、及び「電灯」の各クラスのスコアを1.0とし、これら以外のクラスのスコアを0.0とする。
また、F_G1(In)に関して、プロパティのスコアを全て0.5とする。
また、H_G1(In)に関して、推論のために新規に追加されたインスタンスの場合は−0.75とし、そうでない場合は1.0とする。
例えば、”点灯中”インスタンスの場合、E_G1(”点灯中”)、F_G1(”点灯中”)、及びH_G1(”点灯中”)は、以下のように導出される。
E_G1("点灯中")=1.0 これは、”点灯中”インスタンスが属する「点灯中」クラスのスコアが1.0であるためである。
F_G1("点灯中")=0.5 これは、”点灯中”インスタンスから出るエッジの数が1つであり、そのプロパティのスコアが0.5であるためである。
H_G1("点灯中")=1.0 これは、”点灯中”インスタンスが推論のために新規に追加されたインスタンスではないためである。
これより、”点灯中”インスタンスのスコアの値を、一例として、以下に示す式(1)を用いて導出する。
(数1)
Score_G1("点灯中")=E_G1("点灯中")×{F_G1("点灯中")+H_G1("点灯中")} (1)
すなわち、
Score_G1("点灯中")=1.0×(0.5+1.0)=1.5
と導出される。
同様にして、”電灯”インスタンスのスコアの値、”太郎”インスタンスのスコアの値についても以下のように導出される。
Score_G1("電灯")=1.0×(0+1.0)=1.0
Score_G1("太郎")=1.0×(0.5+1.0)=1.5
また、第1意味ネットワークG1におけるA(G1)、B(G1)、C(G1)、及びD(G1)は、以下に示すとおりである。
A(G1)=1 これは、第1意味ネットワークG1が全て連結しているためである。
B(G1)=3 これは、第1意味ネットワークG1のインスタンスの数が3であるためである。
C(G1)=2 これは、第1意味ネットワークG1のインスタンス間のエッジの数が2であるためである。
D(G1)=4.0 これは、Score_G1("点灯中")、Score_G1("電灯")、及びScore_G1("太郎")の和が4.0(=1.5+1.0+1.5)であるためである。なお、Score_G1("点灯中")、Score_G1("電灯")、及びScore_G1("太郎")の積を用いてもよい。
そして、第1意味ネットワークG1のグラフ全体のスコアの値を、一例として、以下に示す式(2)を用いて導出する。
(数2)
Score(G1)=A(G1)×D(G1) (2)
すなわち、
Score(G1)=1×4.0=4.0
と導出される。
本実施形態においては、一例として、第1意味ネットワークG1において、電灯を点灯しているのは、その電灯を動作させたからであり、その動作を行ったのは、太郎であることを推論する。このため、当該推論を、インスタンス及びインスタンス間のエッジの少なくとも一方を追加することで実行する。
まず、図2に示す第1意味ネットワークG1に対して、インスタンス間のエッジを追加することを考える。第1意味ネットワークG1において、オントロジー上で定義されたプロパティのうち、意味ネットワーク上で当該プロパティに関連するエッジが存在していない部分は、”点灯中”インスタンスにおける[原因]エッジである。オントロジーにおける[原因]プロパティのレンジは「動作させる」クラスであるので、「動作させる」クラスのインスタンスを意味ネットワークから探し、存在すれば、インスタンス間のエッジの追加を行う。但し、図2に示す例では、「動作させる」クラスのインスタンスが第1意味ネットワークG1には存在しないため、インスタンス間のエッジの追加は行われない。
次に、図2に示す第1意味ネットワークG1に対して、1つのインスタンスを追加することを考える。ここで、第1意味ネットワークG1に追加するインスタンスは、第1意味ネットワークG1に出現していないクラスのインスタンスとする。図2に示す例の場合、「動作させる」クラスあるいは「行為」クラスのインスタンスとなる。ここでは、”動作させる”インスタンスを追加して新しく生成された意味ネットワークを第2意味ネットワークG2(図示省略)とする。
この場合、”動作させる”インスタンスのスコアの値は、上述の式(1)を用いて、以下のように導出される。
Score_G2("動作させる")=1.0×(0-0.75)=-0.75
これより、D(G2)=1.5+1.0+1.5-0.75=3.25
また、A(G2)=0 これは、第2意味ネットワークG2の一部(ここでは、”動作させる”インスタンス)が連結されていないためである。
従って、第2意味ネットワークG2のグラフ全体のスコアの値は、上述の式(2)を用いて、以下のように導出される。
Score(G2)=0×3.25=0
次に、図5を参照して、1つのインスタンス及び1つのエッジを追加する場合における第2意味ネットワークについて説明する。
図5は、本実施形態に係る第2意味ネットワークG3の説明に供する図である。
図5に示す第2意味ネットワークG3は、図2に示す第1意味ネットワークG1に対して、1つのインスタンス及び1つのエッジを追加したものである。
ここで、”点灯中”インスタンスは、オントロジーの「動作中」クラスに属し、「動作中」クラスと「動作させる」クラスとの間には、[原因]プロパティが存在する。従って、[原因]プロパティに関連する[原因]エッジは、”動作させる”インスタンスにリンク可能である。ここでは、”動作させる”インスタンス及び[原因]エッジを追加して新しく生成された意味ネットワークを第2意味ネットワークG3とする。
この場合、”動作させる”インスタンスのスコアの値は、上述の式(1)を用いて、以下のように導出される。
Score_G3("動作させる")=1.0×(0-0.75)=-0.75
また、”点灯中”インスタンスについて、E_G3(”点灯中”)、F_G3(”点灯中”)、及びH_G3(”点灯中”)は、以下のように導出される。
E_G3("点灯中")=1.0 これは、第2意味ネットワークG3が全て連結しているためである。
F_G3("点灯中")=1.0 これは、”点灯中”インスタンスから出るエッジの数が2つであり、各プロパティのスコアが0.5であるためである。
H_G3("点灯中")=1.0 これは、”点灯中”インスタンスが推論のために新規に追加されたインスタンスではないためである。
これより、”点灯中”インスタンスのスコアの値は、上述の式(1)を用いて、以下のように導出される。
Score_G3("点灯中")=1.0×(1.0+1.0)=2.0
同様にして、”電灯”インスタンスのスコアの値、”太郎”インスタンスのスコアの値についても以下のように導出される。
Score_G3("電灯")=1.0×(0+1.0)=1.0
Score_G3("太郎")=1.0×(0.5+1.0)=1.5
これより、D(G3)=3.75 これは、Score_G3("点灯中")、Score_G3("電灯")、Score_G3("太郎")、及びScore_G3("動作させる")の和が3.75(=2.0+1.0+1.5−0.75)であるためである。なお、Score_G3("点灯中")、Score_G3("電灯")、Score_G3("太郎")、及びScore_G3("動作させる")の積を用いてもよい。
そして、第2意味ネットワークG3のグラフ全体のスコアの値は、上述の式(2)を用いて、以下のように導出される。
Score(G3)=1×3.75=3.75
次に、図6を参照して、1つのインスタンス及び2つのエッジを追加する場合における第2意味ネットワークについて説明する。
図6は、本実施形態に係る第2意味ネットワークG4の説明に供する図である。
図6に示す第2意味ネットワークG4は、図2に示す第1意味ネットワークG1に対して、1つのインスタンス及び2つのエッジを追加したものである。
ここで、”動作させる”インスタンスは、オントロジーの「動作させる」クラスに属し、「動作させる」クラスと「人間」クラスとの間には、[主体]プロパティが存在する。従って、[主体]プロパティに関連する[主体]エッジは、”太郎”インスタンスにリンク可能である。ここでは、”動作させる”インスタンス、[原因]エッジ、及び[主体]エッジを追加して新しく生成された意味ネットワークを第2意味ネットワークG4とする。
この場合、”動作させる”インスタンスについて、E_G4(”動作させる”)、F_G4(”動作させる”)、及びH_G4(”動作させる”)は、以下のように導出される。
E_G4("動作させる")=1.0 これは、第2意味ネットワークG4が全て連結しているためである。
F_G4("動作させる")=0.5 これは、”動作させる”インスタンスから出るエッジの数が1つであり、そのプロパティのスコアが0.5であるためである。
H_G4("動作させる")=-0.75 これは、”動作させる”インスタンスが推論のために新規に追加されたインスタンスであるためである。
これより、”動作させる”インスタンスのスコアの値は、上述の式(1)を用いて、以下のように導出される。
Score_G4("動作させる")=1.0×(0.5-0.75)=-0.25
同様にして、”点灯中”インスタンスのスコアの値、”電灯”インスタンスのスコアの値、及び”太郎”インスタンスのスコアの値についても以下のように導出される。
Score_G4("点灯中")=1.0×(1.0+1.0)=2.0
Score_G4("電灯")=1.0×(0+1.0)=1.0
Score_G4("太郎")=1.0×(0.5+1.0)=1.5
これより、D(G4)=4.25 これは、Score_G4("点灯中")、Score_G4("電灯")、Score_G4("太郎")、及びScore_G4("動作させる")の和が4.25(=2.0+1.0+1.5−0.25)であるためである。なお、Score_G4("点灯中")、Score_G4("電灯")、Score_G4("太郎")、及びScore_G4("動作させる")の積を用いてもよい。
そして、第2意味ネットワークG4のグラフ全体のスコアの値は、上述の式(2)を用いて、以下のように導出される。
Score(G4)=1×4.25=4.25
図4に戻り、本実施形態に係る判定部34は、導出部32により導出された、第1意味ネットワークG1のスコア及び第2意味ネットワークG4のスコアに基づいて、第2意味ネットワークG4の確からしさを判定する。具体的には、第2意味ネットワークG4のスコアが、第1意味ネットワークG1のスコアよりも高い場合に、第2意味ネットワークG4が確からしいと判定する。あるいは、判定部34は、第2意味ネットワークG4のスコアが、第1意味ネットワークG1のスコア以上の閾値よりも高い場合に、第2意味ネットワークG4が確からしいと判定してもよい。この場合、第1意味ネットワークG1のグラフ全体のスコアが例えば4.0であれば、4.0以上の閾値を用いて、第2意味ネットワークG4の確からしさが判定される。
上記導出例の場合、Score(G4)>Score(G1)であるため、第2意味ネットワークG4は確からしい、つまり、この推論はもっともらしいと判定される。すなわち、新しく生成された第2意味ネットワークG4は、入力された事実「太郎の電灯が点灯中。」に対して、電灯が点灯中であるのであれば、誰かがその電灯を動作させたに違いなく、それはおそらく太郎であるという推論を行った結果を表している。
これに対して、入力情報として入力された事実が、例えば、「太郎の電灯。」である場合について説明する。この場合、太郎が電灯を所有していることだけが判明しており、電灯が点灯していると推論するのは行き過ぎであると考えられる。
図7は、本実施形態に係る第1意味ネットワークG5の説明に供する図である。
図7に示す第1意味ネットワークG5は、入力情報として、「太郎の電灯。」という事実が入力された場合に、一例として、図1に示すオントロジー情報から生成される意味ネットワークである。
この場合、”太郎”インスタンスについて、E_G5(”太郎”)、F_G5(”太郎”)、及びH_G5(”太郎”)は、以下のように導出される。
E_G5("太郎")=1.0 これは、第1意味ネットワークG5が全て連結しているためである。
F_G5("太郎")=0.5 これは、”太郎”インスタンスから出るエッジの数が1つであり、そのプロパティのスコアが0.5であるためである。
H_G5("太郎")=1.0 これは、”太郎”インスタンスが推論のために新規に追加されたインスタンスではないためである。
これより、”太郎”インスタンスのスコアの値は、上述の式(1)を用いて、以下のように導出される。
Score_G5("太郎")=1.0×(0.5+1.0)=1.5
同様にして、”電灯”インスタンスのスコアの値についても以下のように導出される。
Score_G5("電灯")=1.0×(0+1.0)=1.0
これより、D(G5)=2.5 これは、Score_G5("太郎")及びScore_G5("電灯")の和が2.5(=1.0+1.5)であるためである。なお、Score_G5("太郎")及びScore_G5("電灯")の積を用いてもよい。
そして、第1意味ネットワークG5のグラフ全体のスコアの値は、上述の式(2)を用いて、以下のように導出される。
Score(G5)=1×2.5=2.5
この第1意味ネットワークG5に対して、”点灯中”インスタンス及び[主体]エッジを追加して新しく生成された意味ネットワークを第2意味ネットワークG6(図示省略)とする。この第2意味ネットワークG6は、上述の図2に示した第1意味ネットワークG1とグラフ構造は同一となるが、グラフ全体のスコアが異なる。
この場合、”点灯中”インスタンスについて、E_G6(”点灯中”)、F_G6(”点灯中”)、及びH_G6(”点灯中”)は、以下のように導出される。
E_G6("点灯中")=1.0 これは、第2意味ネットワークG6が全て連結しているためである。
F_G6("点灯中")=0.5 これは、”点灯中”インスタンスから出るエッジの数が1つであり、そのプロパティのスコアが0.5であるためである。
H_G6("点灯中")=-0.75 これは、”点灯中”インスタンスが推論のために新規に追加されたインスタンスであるためである。
これより、”点灯中”インスタンスのスコアの値は、上述の式(1)を用いて、以下のように導出される。
Score_G6("点灯中")=1.0×(0.5-0.75)=-0.25
同様にして、”太郎”インスタンスのスコアの値、”電灯”インスタンスのスコアの値についても以下のように導出される。
Score_G6("太郎")=1.0×(0.5+1.0)=1.5
Score_G6("電灯")=1.0×(0+1.0)=1.0
これより、D(G6)=2.25 これは、Score_G6("太郎")、Score_G6("電灯")、及びScore_G6("点灯中")の和が2.25(=1.5+1.0−0.25)であるためである。なお、Score_G6("太郎")、Score_G6("電灯")、及びScore_G6("点灯中")の積を用いてもよい。
そして、第2意味ネットワークG6のグラフ全体のスコアの値は、上述の式(2)を用いて、以下のように導出される。
Score(G6)=1×2.25=2.25
上記導出例の場合、Score(G6)<Score(G5)であるため、第2意味ネットワークG6は確からしくない、つまり、この推論はもっともらしくないと判定される。
次に、図8を参照して、本実施形態に係る情報処理装置10の作用を説明する。
図8は、本実施形態に係る判定処理プログラム14Aによる処理の流れの一例を示すフローチャートである。
まず、情報処理装置10に対して、ユーザにより判定処理プログラム14Aの起動が指示されると、以下の各ステップを実行する。
図8のステップ100では、追加部30が、一例として、上述の図1に示すオントロジー情報から、一例として、上述の図2に示す第1意味ネットワークG1を生成する。
ステップ102では、追加部30が、第1意味ネットワークG1に対して、インスタンス及びインスタンス間のエッジの少なくとも一方を追加し、一例として、図6に示す第2意味ネットワークG4を生成する。
ステップ104では、導出部32が、ステップ100で生成された第1意味ネットワークG1及びステップ102で生成された第2意味ネットワークG4の各々のスコアを、一例として、上述の式(1)及び式(2)を用いて導出する。
ステップ106では、判定部34が、ステップ104で導出された、第2意味ネットワークG4のスコアが第1意味ネットワークG1のスコアよりも高いか否かを判定する。第2意味ネットワークG4のスコアが第1意味ネットワークG1のスコアよりも高いと判定した場合(肯定判定の場合)、ステップ108に移行する。一方、第2意味ネットワークG4のスコアが第1意味ネットワークG1のスコア以下であると判定した場合(否定判定の場合)、ステップ110に移行する。
ステップ108では、判定部34が、第2意味ネットワークG4による推論は確からしいと判定し、本判定処理プログラム14Aによる一連の処理を終了する。なお、推論の判定結果は、表示部16に表示させるようにしてもよい。
一方、ステップ110では、判定部34が、第2意味ネットワークG4による推論は確からしくないと判定し、本判定処理プログラム14Aによる一連の処理を終了する。なお、推論の判定結果は、上記と同様に、表示部16に表示させるようにしてもよい。
このように本実施形態によれば、入力情報から得られる、インスタンス及びインスタンス間のエッジにより定義される意味ネットワークから、別のインスタンスを推論する場合に、推論の確からしさが定量的に評価される。このため、確からしさが比較的低い推論がなされることが抑制される。
なお、意味ネットワークを探索する場合に、一般的な探索の基本アルゴリズムとして深さ優先、幅優先アルゴリズム等があるが、これらは全探索アルゴリズムであるため、時間あるいは空間(メモリ)の消費が大きい。そこで、意味ネットワークのスコアを評価関数としたヒューリスティックな探索アルゴリズムを適用してもよい。
また、上記では、オントロジーにおけるクラスのスコアを既知として与えていた。このスコアは、そのクラスが出現した場合の意味的な重要度を表している。このため、このスコアを、文書中に出現する単語のtf(Term Frequency、単語の出現頻度)-idf(Inverse Document Frequency、逆文書頻度)スコア等に基づいて算出してもよい。
以上、実施形態に係る情報処理装置を例示して説明した。実施形態は、情報処理装置が備える各部の機能をコンピュータに実行させるためのプログラムの形態としてもよい。実施形態は、このプログラムを記憶したコンピュータが読み取り可能な記憶媒体の形態としてもよい。
その他、上記実施形態で説明した情報処理装置の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。
また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
また、上記実施形態では、プログラムを実行することにより、実施形態に係る処理がコンピュータを利用してソフトウェア構成により実現される場合について説明したが、これに限らない。実施形態は、例えば、ハードウェア構成や、ハードウェア構成とソフトウェア構成との組み合わせによって実現してもよい。
10 情報処理装置
12 制御部
12A CPU
12B ROM
12C RAM
12D I/O
14 記憶部
14A 判定処理プログラム
16 表示部
18 操作部
20 通信部
30 追加部
32 導出部
34 判定部

Claims (10)

  1. 予め定義され、かつ、概念と概念とを階層構造で表現したオントロジー情報から得られる第1意味ネットワークに対して、前記第1意味ネットワークのスコアを導出し、かつ、前記第1意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加して得られる第2意味ネットワークに対して、前記第2意味ネットワークのスコアを導出する導出部と、
    前記導出部により導出された、前記第1意味ネットワークのスコア及び前記第2意味ネットワークのスコアに基づいて、前記第2意味ネットワークの確からしさを判定する判定部と、
    を備えた情報処理装置。
  2. 前記第1意味ネットワーク及び前記第2意味ネットワークの各々のスコアは、連結されたグラフの個数、インスタンスの数、インスタンス間のエッジの数、及び各インスタンスのスコアの和又は積の少なくとも一つを用いて導出される請求項1に記載の情報処理装置。
  3. 前記連結されたグラフの個数は、インスタンスが全て連結されている場合に1であり、インスタンスの少なくとも一部が連結されていない場合に0である請求項2に記載の情報処理装置。
  4. 前記各インスタンスのスコアは、予め定められたオントロジーの各クラスのスコアに基づく値、オントロジーで定義されたプロパティのうち実際に意味ネットワークでエッジとして関連付けられたプロパティのスコアに基づく値、及び、推論のために新規に追加されたインスタンスであるか否かを示す値の少なくとも一つを用いて導出される請求項2又は3に記載の情報処理装置。
  5. 前記プロパティのスコアに基づく値は、予めプロパティに付与されたスコアに、インスタンスから出るエッジの数を乗じて得られる値である請求項4に記載の情報処理装置。
  6. 前記判定部は、前記第2意味ネットワークのスコアが、前記第1意味ネットワークのスコアよりも高い場合に、前記第2意味ネットワークが確からしいと判定する請求項1〜5のいずれか1項に記載の情報処理装置。
  7. 前記判定部は、前記第2意味ネットワークのスコアが、前記第1意味ネットワークのスコア以上の閾値よりも高い場合に、前記第2意味ネットワークが確からしいと判定する請求項1〜5のいずれか1項に記載の情報処理装置。
  8. 前記オントロジー情報に基づいて、前記第1意味ネットワークにインスタンス及びインスタンス間のエッジの少なくとも一方を追加する追加部を更に備えた請求項1〜7のいずれか1項に情報処理装置。
  9. 前記インスタンス間のエッジは、前記インスタンスが属するクラスのプロパティに関連付けられている請求項8に記載の情報処理装置。
  10. コンピュータを、請求項1〜9のいずれか1項に記載の情報処理装置が備える各部として機能させるためのプログラム。
JP2018219690A 2018-11-22 2018-11-22 情報処理装置及びプログラム Active JP7172497B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018219690A JP7172497B2 (ja) 2018-11-22 2018-11-22 情報処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018219690A JP7172497B2 (ja) 2018-11-22 2018-11-22 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020086874A true JP2020086874A (ja) 2020-06-04
JP7172497B2 JP7172497B2 (ja) 2022-11-16

Family

ID=70909991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018219690A Active JP7172497B2 (ja) 2018-11-22 2018-11-22 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP7172497B2 (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190453A (ja) * 1996-12-06 1997-07-22 Hitachi Ltd データベース装置
WO2004036497A1 (ja) * 2002-10-18 2004-04-29 Japan Science And Technology Agency 構造化知識に基づく学習・思考機械及び学習・思考方法並びにコンピュータシステム及び情報生成方法
US20110191273A1 (en) * 2010-02-02 2011-08-04 International Business Machines Corporation Evaluating ontologies
WO2011151500A1 (en) * 2010-05-31 2011-12-08 Helsingin Yliopisto Arrangement and method for finding relationships among data
JP2013522733A (ja) * 2010-03-12 2013-06-13 マイクロソフト コーポレーション サービスとしての情報に関連するセマンティックスの更新および適応性のあるインタフェース
JP2014506357A (ja) * 2011-01-05 2014-03-13 プライマル フュージョン インコーポレイテッド 1人以上のユーザに関心ある情報を提供する方法及び装置
US20150019462A1 (en) * 2013-07-15 2015-01-15 Senscio Systems Systems and methods for semantic reasoning
JP2018005690A (ja) * 2016-07-05 2018-01-11 富士ゼロックス株式会社 情報処理装置及びプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190453A (ja) * 1996-12-06 1997-07-22 Hitachi Ltd データベース装置
WO2004036497A1 (ja) * 2002-10-18 2004-04-29 Japan Science And Technology Agency 構造化知識に基づく学習・思考機械及び学習・思考方法並びにコンピュータシステム及び情報生成方法
US20110191273A1 (en) * 2010-02-02 2011-08-04 International Business Machines Corporation Evaluating ontologies
JP2013522733A (ja) * 2010-03-12 2013-06-13 マイクロソフト コーポレーション サービスとしての情報に関連するセマンティックスの更新および適応性のあるインタフェース
WO2011151500A1 (en) * 2010-05-31 2011-12-08 Helsingin Yliopisto Arrangement and method for finding relationships among data
JP2014506357A (ja) * 2011-01-05 2014-03-13 プライマル フュージョン インコーポレイテッド 1人以上のユーザに関心ある情報を提供する方法及び装置
US20150019462A1 (en) * 2013-07-15 2015-01-15 Senscio Systems Systems and methods for semantic reasoning
JP2018005690A (ja) * 2016-07-05 2018-01-11 富士ゼロックス株式会社 情報処理装置及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
廣田 啓一、他2名: "オントロジー主導による情報抽出", 人工知能学会誌, vol. 第14巻,第6号, JPN6008001362, 1 November 1999 (1999-11-01), JP, pages 1010 - 1018, ISSN: 0004886810 *
筒井 佑一郎、外1名: "RBMを用いた意味ネットワークの構築", 電子情報通信学会技術研究報告, vol. 第115巻,第514号, JPN6022041920, 15 March 2016 (2016-03-15), JP, pages 13 - 18, ISSN: 0004886809 *

Also Published As

Publication number Publication date
JP7172497B2 (ja) 2022-11-16

Similar Documents

Publication Publication Date Title
CN110692050B (zh) 语义图中元关系的自适应评估
Nigam et al. Towards a robust metric of opinion
US10430469B2 (en) Enhanced document input parsing
US20190179878A1 (en) Generating organization-specific tags for communications from various sources of an organization using an expanded knowledge graph for organization-specific content
TW201519075A (zh) 文字範圍的智慧選擇
US9524526B2 (en) Disambiguating authors in social media communications
JP2013178754A (ja) ソーシャルメディアデータ分析システム及び方法
JP6729095B2 (ja) 情報処理装置及びプログラム
US20160217200A1 (en) Dynamic creation of domain specific corpora
Kauer et al. Using information retrieval for sentiment polarity prediction
Mazharov et al. Some problems of dynamic contactless charging of electric vehicles
CN111625630A (zh) 信息处理装置、信息处理方法和计算机可读记录介质
Manrique et al. Investigating learning resources precedence relations via concept prerequisite learning
Tang et al. Propagation-based sentiment analysis for microblogging data
US20200279000A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
Khan et al. Possible effects of emoticon and emoji on sentiment analysis web services of work organisations
Nigam et al. Towards a robust metric of polarity
JP6563350B2 (ja) データ分類装置、データ分類方法、及びプログラム
Liu et al. Dynamic updating of the knowledge base for a large-scale question answering system
Song et al. Detecting positive opinion leader group from forum
JP2020086874A (ja) 情報処理装置及びプログラム
Bontcheva et al. Extracting information from social media with gate
Singh et al. Towards a knowledge centric semantic approach for text summarization
US10824659B2 (en) Predicting the temporal stability of answers in a deep question answering system
Lincy et al. A survey on challenges in sentiment analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221017

R150 Certificate of patent or registration of utility model

Ref document number: 7172497

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150