JP2018005690A - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP2018005690A JP2018005690A JP2016133656A JP2016133656A JP2018005690A JP 2018005690 A JP2018005690 A JP 2018005690A JP 2016133656 A JP2016133656 A JP 2016133656A JP 2016133656 A JP2016133656 A JP 2016133656A JP 2018005690 A JP2018005690 A JP 2018005690A
- Authority
- JP
- Japan
- Prior art keywords
- relationship
- evaluation value
- semantic network
- elements
- triple
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
この実施の形態では、入力されたテキスト(入力テキストと呼ぶ)に含まれる要素(単語等の形態素)同士の関係(すなわちトリプル)を、構文解析を用いずに求める。要素同士の関係を求めるにあたり、本実施形態ではオントロジーを利用する。利用するオントロジーは、概念同士の上位・下位関係の他に、概念同士の「プロパティ」関係の情報も含む。上・下位関係は、上位の概念は下位の概念に該当するエンティティをすべて包含するという特定の関係を表すものであるのに対し、プロパティ関係は、上位・下位関係以外の自由に定義可能な関係である。例えば概念「人間」と概念「人工物」との間に「製造者」又は「被製造物」、「所有者」又は「被所有物」といったプロパティ関係を定義可能である。
また、生成した意味ネットワークが含む要素同士の関係群の評価値からその意味ネットワークの評価値を求め、その意味ネットワーク評価値が高い意味ネットワークを、入力テキストに対応する意味ネットワークとして優先的に選ぶようにしてもよい。
以上、この実施の形態の概要について説明した。次に、この実施の形態に沿った意味ネットワーク構築装置の例を説明する。図1に、意味ネットワーク構築装置の構成の一例を示す。
あるインスタンスが属するクラスがあるプロパティのドメインであり、別のインスタンスが属するクラスがそのプロパティのレンジであるという関係がある場合、それら2つのインスタンスとそのプロパティがなすその関係のことがトリプルである。これらドメイン、レンジ、トリプルは、RDFスキーマに規定されている。
次に、本実施形態の意味ネットワーク構築装置が実行する構築処理を、具体例を用いて説明する。
例文1: 「カメラで撮影した」
例文2: 「あなたのAで太郎を撮影した」(Aはカメラの製品名)
形態素解析部10が入力テキスト(例文1,2)を形態素解析して単語ごとに分解し、各単語に品詞を対応付ける。また、入力テキストに固有名詞が含まれる場合はその固有名詞の品詞の細分類を行う。
この形態素解析処理により、例文1「カメラで撮影した」については、例えば以下の解析結果が得られる。
「カメラ」 名詞-一般名詞-カメラ
「で」 助詞-で
「撮影した」 動詞-過去
また例文2「あなたのAで太郎を撮影した」については、形態素解析により、例えば以下の解析結果が得られる。
「あなた」 名詞-代名詞-人間
「の」 助詞-の
「A」 名詞-固有名詞-カメラ
「で」 助詞-で
「太郎」 名詞-固有名詞-人間
「を」 助詞-を
「撮影した」 動詞-過去
係り受け解析部12が、ステップ1により得られた単語(形態素)の列に対して係り受け解析を行う。
例文1についての係り受け解析結果として例えば図4に示すツリー(1)が得られ、例文2についての係り受け解析結果として例えツリー(2)が得られたとする。これらツリーは、矢印(方向付きのエッジ)の根元の単語(矩形のノード)が先端(鏃)の単語に係っていることを示している。係り受け解析結果のツリーのことを、以下では単語依存木と呼ぶ。
初期グラフ生成部14が、初期グラフとしてオントロジーDB16が表すオントロジー(図2参照)の構造をそのまま持つグラフGを生成する。
インスタンス生成部18が、形態素解析結果の単語のうち、名詞や動詞などのように意味を構成するインスタンスとしてふさわしい単語に対して、グラフGにその単語に対応するインスタンスノードを付加する。インスタンスとしてふさわしいと考えられる単語は、例えば日本語の場合、自立語である。またインスタンス生成部18は、付加したインスタンスノードからその単語が属する概念(クラス)のノードに対して、instanceOf関係(インスタンスノードがクラスノードのインスタンスであることを示す関係)を表すエッジを追加する。単語が属する概念は、形態素解析の辞書から求められたその単語の品詞、単語ラベル、クラスラベル等から特定される。なお、単語が属する概念が特定できなかった場合は、その単語に対応するインスタンスノードから、オントロジーの最上位のクラス(Thing)のノードに対してinstanceOf関係のエッジを設ける。
トリプル生成部20は、ステップ4でグラフGに追加されたインスタンスの任意の2つに対して、それらのうち一方が属するクラスがプロパティのドメインであり他方がそのプロパティのレンジであるという関係を満たすプロパティをそのグラフGから探す。そのようなプロパティが見つかった場合、グラフGにおいて、それら2つのインスタンスのノードの間にそのプロパティの名を持つエッジを張る。このとき、エッジの方向はプロパティのドメインからレンジの方向である。それら2つのインスタンスノードとその間のプロパティを示すエッジが、1つのトリプルを示す。
subj(t)=トリプルtの始点(ドメイン)のインスタンス
obj(t)=トリプルtの終点(レンジ)のインスタンス
prop(t)=トリプルtのプロパティ
cls(i)=インスタンスiの属するクラス
domain(p)=プロパティpのドメインクラス
range(p)=プロパティpのレンジクラス
sup(c)=クラスcの上位クラスの集合
sup(p)=プロパティpの上位プロパティの集合
word(i)=インスタンスiの生成元となった単語
subj(撮影した-被写体->カメラ)=インスタンス「撮影した」
cls(subj(撮影した-被写体->カメラ))=クラス「撮影する」
sup(obj(撮影した-被写体->カメラ))={カメラ,人工物,オブジェクト,Thing}
prop(撮影した-被写体->カメラ)=プロパティ「被写体」
range(撮影した-被写体->カメラ)=クラス「オブジェクト」
word(撮影した-被写体->カメラ)=単語「撮影した」
トリプル評価部22は、ステップ5で求められたすべてのトリプルに対して、そのトリプルが示す関係の出現可能性の程度を示す評価値(「重み値Wt」)を算出する。
トリプル評価部22は、以下に例示する4つの重みのうちの1つ以上から、最終的な評価値Wtを計算する。
(1)プロパティ重み(Wtp)
(2)インスタンスの重み(Wti)
(3)形態素の重み(Wtwp)
(4)係り受けの重み(Wtwd)
(1)プロパティ重み(Wtp)
プロパティ重み(Wtp)は、トリプルtに含まれるプロパティprop(t)についての評価値であり、意味解析で想定している世界におけるそのプロパティの出現可能性の高さを示す。
Wtp(撮影した-被写体->カメラ)=0.02
Wtp(撮影した-撮影機材->カメラ)=0.01
Wtp(撮影した-被写体->太郎)=0.02
Wtp(撮影した-行為の主体->太郎)=0.3
Wtp(撮影した-被写体->あなた)=0.02
Wtp(撮影した-行為の主体->あなた)=0.3
Wtp(太郎-所有者->あなた)=0.2
Wtp(あなた-所有者->太郎)=0.2
Wtp(撮影した-被写体->A)=0.02
Wtp(撮影した-撮影機材->A)=0.01
Wtp(A-所有者->太郎)=0.2
Wtp(A-製造者->太郎)=0.1
Wtp(A-所有者->あなた)=0.2
Wtp(A-製造者->あなた)=0.1
インスタンスの重み(Wti)は、トリプルtにおける2つのインスタンスの属するクラスcls(subj(t)),cls(obj(t))とプロパティprop(t)の三つ組みに対する評価値である。この評価値は、想定している世界におけるそのトリプルの出現可能性の高さを示す。
これらの値は、事前に出現数などから計算してもよいし、cls(subj())やcls(obj())のオントロジー上のクラスの上位-下位関係の位置づけやprop()に対する同様な上下関係の位置づけを利用して設定してもよい。
Wti(撮影した-被写体->カメラ)=0.5
Wti(撮影した-撮影機材->カメラ)=1
Wti(撮影した-被写体->太郎)=0.8
Wti(撮影した-行為の主体->太郎)=1
Wti(撮影した-被写体->あなた)=0.8
Wti(撮影した-行為の主体->あなた)=1
Wti(太郎-所有者->あなた)=0.01
Wti(あなた-所有者->太郎)=0.01
Wti(撮影した-被写体->A)=0.5
Wti(撮影した-撮影機材->A)=1
Wti(A-所有者->太郎)=0.9
Wti(A-製造者->太郎)=0.1
Wti(A-所有者->あなた)=0.9
Wti(A-製造者->あなた)=0.1
形態素の重みは、トリプルtに含まれるプロパティprop(t)と、2つのインスタンスの元になった単語word(subj(t)),word(obj(t))のうちの少なくとも1つと、の組み合わせについての評価値である。この評価値は、単語word(subj(t))又はword(obj(t))についての品詞などの形態素情報、あるいは、その単語word(subj(t))又はword(obj(t))の前後の1以上の単語の情報等のうちの少なくとも1つを考慮して求めてもよい。
Wtwp(撮影した-被写体->カメラ)=0.05
Wtwp(撮影した-撮影機材->カメラ)=0.3
Wtwp(撮影した-被写体->太郎)=0.3
Wtwp(撮影した-行為の主体->太郎)=0.01
Wtwp(撮影した-被写体->あなた)=0.01
Wtwp(撮影した-行為の主体->あなた)=0.01
Wtwp(太郎-所有者->あなた)=0.3
Wtwp(あなた-所有者->太郎)=0.01
Wtwp(撮影した-被写体->A)=0.05
Wtwp(撮影した-撮影機材->A)=0.3
Wtwp(A-所有者->太郎)=0.01
Wtwp(A-製造者->太郎)=0.01
Wtwp(A-所有者->あなた)=0.3
Wtwp(A-製造者->あなた)=0.3
係り受けの重み(Wtwd)は、トリプルtの2つのインスタンスの生成元となる単語word(subj(t)),word(obj(t))の組に対する評価値であり、係り受け解析部12の解析結果である単語依存木から求められる。例えば、単語依存木をグラフと見た場合のそれら2単語間の距離(グラフ上のそれら2単語の間の経路上に存在するエッジの数)からこの重み(Wtwd)を求めてもよい。例えば、それら2単語間の距離が小さいほど、この重みを大きい値とする。
(1) コーパスに含まれる多数のサンプル文から、各サンプル文に対応する意味ネットワーク(サンプル意味ネットワークと呼ぶ)をそれぞれ作成する
(2) 係り受け解析により各サンプル文の単語依存木を作成する
(3) 同じサンプル文から生成したサンプル意味ネットワークと単語依存木を対応付ける
(4) サンプル意味ネットワークに現れるトリプルtについて、(a)そのトリプルtのプロパティprop(t)を抽出する。(b)また、そのサンプル意味ネットワーク対応する単語依存木において、2単語word(subj(t)),word(obj(t))間の経路を求める。求めた経路のうち名詞や動詞等は具体的な単語の代わりにワイルドカード(「*-*」)に置き換える(ただし品詞は維持)。抽出したプロパティprop(t)と置換え済みの経路情報とのペアを作成し、記憶する。
(5) 上記(4)の処理を全サンプル意味ネットワークに含まれる全トリプルtについて繰り返す。
(6) 上記(5)の完了後に蓄積されているペア群を集計し、プロパティと経路情報とが一致するペアの合計数を求める。この合計数が、全サンプル文及び全サンプル意味ネットワーク内でのそのペアの出現頻度である。この出現頻度が高いほど重み(Wtwd)が大きくなるよう、各ペアの係り受けの重み(Wtwd)を計算する。
Wtwd(撮影した-被写体->カメラ)=0.01
同様に例文1について得られたもう一つのトリプルについての係り受け重み(Wtwd)は、次の通りとなる。
Wtwd(撮影した-撮影機材->カメラ)=0.3
Wtwd(撮影した-被写体->太郎)=0.4
Wtwd(撮影した-行為の主体->太郎)=0
Wtwd(撮影した-被写体->あなた)=0
Wtwd(撮影した-行為の主体->あなた)=0
Wtwd(太郎-所有者->あなた)=0
Wtwd(あなた-所有者->太郎)=0
Wtwp(撮影した-被写体->A)=0.01
Wtwp(撮影した-撮影機材->A)=0.3
Wtwp(A-所有者->太郎)=0
Wtwp(A-製造者->太郎)=0
Wtwp(A-所有者->あなた)=0.3
Wtwp(A-製造者->あなた)=0.3
Wt(t)=0.2*Wtp(t)+0.2*Wti(t)+0.1*Wtwp(t)+0.5*Wtwd(t) ...(式1)
のように、それら4つの要素の調和平均(加重平均)を最終的な重みWtとしてもよい。なお、調和平均はそれら4つの要素の組み合わせ方の一例に過ぎず、それら4つの要素を用いる別の関数を用いて最終的な重みWtを求めてもよい。
Wt(撮影した-被写体->カメラ)=0.2*0.02+0.2*0.5+0.1*0.05+0.5*0.01 = 0.114
Wt(撮影した-撮影機材->カメラ)=0.2*0.01+0.2*1+0.1*0.3+0.5*0.3 = 0.382
Wt(撮影した-被写体->太郎)= 0.2*0.02+ 0.2* 0.8+ 0.1*0.3+ 0.5*0.4 = 0.394
Wt(撮影した-行為の主体->太郎)= 0.2*0.3+ 0.2*1+ 0.1*0.01+ 0.5*0 = 0.261
Wt(撮影した-被写体->あなた)= 0.2*0.02+ 0.2*0.8+ 0.1*0.01+ 0.5*0 = 0.165
Wt(撮影した-行為の主体->あなた)= 0.2*0.3+ 0.2*1+ 0.1*0.01+ 0.5*0 = 0.261
Wt(太郎-所有者->あなた)= 0.2*0.2+ 0.2*0.01+ 0.1*0.3+ 0.5*0 = 0.072
Wt(あなた-所有者->太郎)= 0.2*0.2+ 0.2*0.01+ 0.1*0.01+ 0.5*0 = 0.043
Wt(撮影した-被写体->A)= 0.2*0.02+ 0.2*0.5+ 0.1*0.05+ 0.5*0.01 = 0.114
Wt(撮影した-撮影機材->A)= 0.2*0.01+ 0.2*1+ 0.1*0.3+ 0.5*0.3 = 0.382
Wt(A-所有者->太郎)= 0.2*0.2+ 0.2*0.9+ 0.1*0.01+ 0.5*0 = 0.221
Wt(A-製造者->太郎)= 0.2*0.1+ 0.2*0.1+ 0.1*0.01+ 0.5*0 = 0.041
Wt(A-所有者->あなた)= 0.2*0.2+ 0.2*0.9+ 0.1*0.3+ 0.5*0.3 = 0.4
Wt(A-製造者->あなた)= 0.2*0.1+ 0.2*0.1+ 0.1*0.3+ 0.5*0.3 = 0.22
候補生成部24は、ステップ6で得られた重み付きのトリプルを意味ネットワークの構成要素の候補として考え、それらを任意に組み合わせて意味ネットワークの候補を0個以上生成する。すなわち、候補生成部24は、それらトリプルの中からn個(nは0からそれらトリプルの総数Nまでの整数)を選んだ組み合わせを、1つの意味ネットワーク(候補)として生成する。
(要素条件1)すべてのインスタンスは、トリプルの始点、または終点、またはその両方になっている。
(要素条件2)任意のインスタンスの組i1,i2について、i1からi2へのトリプルは高々1個である。
(要素条件3)生成された意味ネットワークは、高々2つ連結グラフから構成される。
(要素条件4)生成された意味ネットワークを構成するトリプルのWtスコアがすべて0.25以上である
意味ネットワーク1-1:
撮影した-撮影機材->カメラ
意味ネットワーク2-1:
撮影した-被写体->太郎
撮影した-行為の主体->あなた
撮影した-撮影機材->A
意味ネットワーク2-2:
撮影した-行為の主体->太郎
撮影した-行為の主体->あなた
撮影した-撮影機材->A
意味ネットワーク2-3:
撮影した-被写体->太郎
A-所有者->あなた
意味ネットワーク2-4:
撮影した-行為の主体->太郎
A-所有者->あなた
意味ネットワーク2-5:
撮影した-被写体->太郎
撮影した-行為の主体->あなた
A-所有者->あなた
意味ネットワーク2-6:
撮影した-行為の主体->太郎
撮影した-行為の主体->あなた
A-所有者->あなた
意味ネットワーク2-7:
撮影した-被写体->太郎
撮影した-撮影機材->A
A-所有者->あなた
意味ネットワーク2-8:
撮影した-行為の主体->太郎
撮影した-撮影機材->A
A-所有者->あなた
意味ネットワーク2-9:
撮影した-被写体->太郎
撮影した-行為の主体->あなた
撮影した-撮影機材->A
A-所有者->あなた
意味ネットワーク2-10:
撮影した-行為の主体->太郎
撮影した-行為の主体->あなた
撮影した-撮影機材->A
A-所有者->あなた
候補評価部26は、ステップ7で得られた意味ネットワーク候補のそれぞれに対して評価値を算出する。
(要素評価値1)候補nが含むすべてのトリプルt_iの重みWt(t_i)の平均値Wna
(要素評価値2)候補nの大きさ(例えばトリプルの数が多い)に基づく重みWnn
(要素評価値3)候補nが持つ閉路の数に基づく重み(Wno)
(要素評価値4)候補nが含む連結グラフの数に基づく重み(Wnc)
重みWnaは意味ネットワークnがトリプルt_1,…t_i,…t_mから構成される場合、ΣWt(t_i) / mとなる。
例文1の場合、各候補についての重みWnaは以下のようになる。
Wna(意味ネットワーク1-1)=0.382/1=0.382
例文2の場合、各候補についての重みWnaは以下のようになる。
Wna(意味ネットワーク2-1) =(0.394+0.261+0.382)/3=0.34567
Wna(意味ネットワーク2-2) =(0.261+0.261+0.382/3=0.30133
Wna(意味ネットワーク2-3) =(0.394+0.4)/2=0.397
Wna(意味ネットワーク2-4) =(0.261+0.4)/2=0.3305
Wna(意味ネットワーク2-5) =(0.394+0.261+0.4)/3=0.35167
Wna(意味ネットワーク2-6) =(0.261+0.261+0.4)/3=0.30733
Wna(意味ネットワーク2-7) =(0.394+0.382+0.4)/3=0.392
Wna(意味ネットワーク2-8) =(0.261+0.382+0.4)/3=0.34767
Wna(意味ネットワーク2-9) =(0.394+0.261+0.382+0.4)/4=0.35925
Wna(意味ネットワーク2-10)=(0.261+0.261+0.382+0.4)/4=0.326
重みWnnは、意味ネットワークが大きいほどそれが表現する意味内容が豊富であることに基づく評価値である。意味内容が豊富であるほど意味ネットワークの利用価値が高いので、重みWnnを大きい値とする。意味ネットワークの大きさを示す指標としては、例えば、その意味ネットワークが含んでいるトリプルの数を用いる(もちろん大きさを示す他の指標を用いてもよい)。意味ネットワークの大きさの指標値そのものをその意味ネットワークの重みWnnとして用いてもよい。以下の例は、この方針に沿ったものである。
Wnn(意味ネットワーク1-1)=1 (意味ネットワーク1-1が含むトリプルの数は1)
例文2の場合、各候補の重みWnnは以下のようになる。
Wnn(意味ネットワーク2-1) =3
Wnn(意味ネットワーク2-2) =3
Wnn(意味ネットワーク2-3) =2
Wnn(意味ネットワーク2-4) =2
Wnn(意味ネットワーク2-5) =3
Wnn(意味ネットワーク2-6) =3
Wnn(意味ネットワーク2-7) =3
Wnn(意味ネットワーク2-8) =3
Wnn(意味ネットワーク2-9) =4
Wnn(意味ネットワーク2-10)=4
重みWnoは、意味ネットワークが閉路を持つ場合、内容が冗長であるため意図しない関連付けが付いている、という可能性を考慮した評価値である。すなわち、意味ネットワーク内に閉路がある場合、その閉路内の2つのノード(インスタンス)の間には複数の経路が存在する。これは、それら2つのインスタンスの組がなす意味に多義性(曖昧性)があるということである。閉路が多い意味ネットワークほど曖昧さを多く含むことになる。曖昧度合いが高い意味ネットワークは利用価値が少ないと考えられる。したがって、閉路数に基づく重みWnoは、候補nに含まれる閉路の数が少ないほど大きい値とする。
Wno= -1*(候補が含む閉路の数)
という計算式で重みWnoを計算する。なお、ここでいう「閉路」とは、候補(意味ネットワーク)を無向グラフと見たときの閉路である。
Wno(意味ネットワーク1-1)=0
Wno(意味ネットワーク2-1) =0
Wno(意味ネットワーク2-2) =0
Wno(意味ネットワーク2-3) =0
Wno(意味ネットワーク2-4) =0
Wno(意味ネットワーク2-5) =0
Wno(意味ネットワーク2-6) =0
Wno(意味ネットワーク2-7) =0
Wno(意味ネットワーク2-8) =0
Wno(意味ネットワーク2-9) =-1
Wno(意味ネットワーク2-10)=-1
重みWncは、1つの文に出現する単語はすべて意味的に関連づいているはずであるという考えに基づく評価値である。よって意味ネットワークの構造上大きく連結している(すなわちその意味ネットワークを構成する連結グラフの数が少ない)ほうが評価値が高くなるべきである。
Wnc=1-1*構成される連結グラフの数
Wnc(意味ネットワーク1-1)=0
Wnc(意味ネットワーク2-1) =0
Wnc(意味ネットワーク2-2) =0
Wnc(意味ネットワーク2-3) =-1
Wnc(意味ネットワーク2-4) =-1
Wnc(意味ネットワーク2-5) =0
Wnc(意味ネットワーク2-6) =0
Wnc(意味ネットワーク2-7) =0
Wnc(意味ネットワーク2-8) =0
Wnc(意味ネットワーク2-9) =0
Wnc(意味ネットワーク2-10)=0
Wn = Wna*(Wnn+Wno+Wnc) ...(式2)
Wn(意味ネットワーク1-1)=0.382*(1+0+0) = 0.382
Wn(意味ネットワーク2-1) =0.34567*(3+0+0)=1.037
Wn(意味ネットワーク2-2) =0.30133*(3+0+0)=0.904
Wn(意味ネットワーク2-3) =0.397*(2-1+0)=0.397
Wn(意味ネットワーク2-4) =0.3305*(2-1+0)=0.3305
Wn(意味ネットワーク2-5) =0.35167*(3+0+0)=1.055
Wn(意味ネットワーク2-6) =0.30733*(3+0+0)=0.922
Wn(意味ネットワーク2-7) =0.392*(3+0+0)=1.176
Wn(意味ネットワーク2-8) =0.34767*(3+0+0)1.043
Wn(意味ネットワーク2-9) =0.35925*(4+0-1)=1.07778
Wn(意味ネットワーク2-10)= 0.326*(4+0-1)=0.978
候補選択部28は、ステップ8で得られた各候補の最終的な評価値Wnに基づき、それら各候補の中から、入力テキストの意味を表現するのに最もふさわしいものを選択し、選択したものを解析結果として出力する。具体的には、最終的な評価値Wnが最も高い候補を、入力テキストの最終的な解析結果である意味ネットワークとして選択する。
例文1の場合、候補は「意味ネットワーク1-1」(図3の(A)に該当)のみなので、候補選択部28はこれを選択する。例文2の場合、候補選択部28は、重み値Wnが最大である「意味ネットワーク2-7」(図3の(B)に該当)を選択する。例文の意味を的確に表現した意味ネットワークが選択されていることが分かる。
例文2の形態素解析において以下のような結果が得られたとする。
あなた 名詞-代名詞-人間
の 助詞-の
A 未知語
で 助詞-で
太郎 名詞-固有名詞-人間
を 助詞-を
撮影した 動詞-過去
上述した実施の形態及び変形例1では、入力テキストに対する意味ネットワークを作成した。しかし、意味ネットワーク生成の前の段階、例えばトリプル生成の段階まででも有益性がある。この変形例2は、トリプル生成を利用した装置構成について説明する。
2)「あなた」は「撮影した」に対する「被写体」である
3)「あなた」は「撮影した」に対する「行為の主体」である
これらの選択肢の文は、質問部40が、各トリプルのデータから自動的に生成する。
そして、ユーザーから選択されたトリプルを、それら2つのインスタンス間の関係を表すものとして確定する。
Claims (10)
- 入力テキスト内の各要素に対応するオントロジー内の概念を特定する特定手段と、
前記入力テキスト内の要素同士の関係として、それら要素に対応する前記概念同士の間に前記オントロジーで規定されている関係を出力する関係出力手段と、
を含む情報処理装置。 - 前記特定手段は、前記要素に対応するものとして規定されている概念、及び、前記オントロジーでその概念に対する直接又は間接の上位と規定されている各概念、をそれぞれ前記要素に対応する概念として特定し、
前記関係出力手段は、前記入力テキスト内の第1の要素について前記特定手段が特定した概念群に含まれる第1の概念と、前記入力テキスト内の第2の要素について前記特定手段が特定した概念群に含まれる第2の概念と、の間に、前記オントロジーに規定された関係が存在する場合に、その関係を前記第1の要素と前記第2の要素との間の関係として出力する、ことを特徴とする請求項1に記載の情報処理装置。 - 前記関係出力手段が出力した前記要素同士の関係のうちの1以上から構成されるネットワークを、前記入力テキストに対応する意味ネットワークとして生成する生成手段、
を更に含む請求項1又は2に記載の情報処理装置。 - 前記関係出力手段が出力した前記要素同士の関係についての評価値である関係評価値を算出する関係評価値算出手段、を更に含み、
前記生成手段は、前記関係評価値に基づいて選抜された前記要素同士の関係から前記意味ネットワークを生成する、ことを特徴とする請求項3に記載の情報処理装置。 - 前記入力テキストに含まれる要素間の係り受けを解析する係り受け解析手段、を更に含み、
前記関係評価値算出手段は、前記要素同士の関係と、当該関係をなす前記要素同士について前記係り受け解析手段で求められた係り受けと、の組み合わせについての評価値に基づき前記関係評価値を算出する、ことを特徴とする請求項4に記載の情報処理装置。 - 前記関係評価値算出手段は、前記要素同士の関係と、当該関係をなす前記各要素に対応する前記各概念と、の組み合わせについての評価値に基づき前記関係評価値を算出する、ことを特徴とする請求項4又は5に記載の情報処理装置。
- 前記生成手段が生成した各意味ネットワークについての評価値であるネットワーク評価値を、その意味ネットワークが含む前記要素同士の関係についての前記関係評価値に基づいて求め、求めたネットワーク評価値に基づいて選んだ意味ネットワークを前記入力テキストに対応する意味ネットワークとして出力する意味ネットワーク出力手段、を更に含むことを特徴とする請求項4〜6のいずれか1項に記載の情報処理装置。
- 前記特定手段が特定した前記入力テキスト内の要素に対応する概念に対して前記オントロジー内に下位の概念が存在する場合、その要素をその下位の概念に対応付けた場合について、前記関係出力手段、前記生成手段、前記関係評価値算出手段、及び前記意味ネットワーク出力手段に処理を実行させる制御を行う実行制御手段、更に含むことを特徴とする請求項7に記載の情報処理装置。
- 前記生成手段が生成した各意味ネットワークについて求めた前記ネットワーク評価値がすべて予め定めた閾値以下であり、かつ前記特定手段が特定した前記入力テキスト内の要素に対応する概念に対して前記オントロジー内に下位の概念が存在する場合に、その要素をその下位の概念に対応付けることを提案する手段、を更に備える請求項7又は8に記載の情報処理装置。
- コンピュータを、
入力テキスト内の各要素に対応するオントロジー内の概念を特定する特定手段、
前記入力テキスト内の要素同士の関係として、それら要素に対応する前記概念同士の間に前記オントロジーで規定されている関係を出力する関係出力手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016133656A JP6729095B2 (ja) | 2016-07-05 | 2016-07-05 | 情報処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016133656A JP6729095B2 (ja) | 2016-07-05 | 2016-07-05 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018005690A true JP2018005690A (ja) | 2018-01-11 |
JP6729095B2 JP6729095B2 (ja) | 2020-07-22 |
Family
ID=60946385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016133656A Active JP6729095B2 (ja) | 2016-07-05 | 2016-07-05 | 情報処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6729095B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190104659A (ko) * | 2018-03-02 | 2019-09-11 | 신성대학교 산학협력단 | 물리치료 환자 기록 관리 서비스 제공 방법 |
JP2020086874A (ja) * | 2018-11-22 | 2020-06-04 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP2021152905A (ja) * | 2019-05-23 | 2021-09-30 | ヤフー株式会社 | 決定装置、決定方法、および決定プログラム |
JPWO2021205639A1 (ja) * | 2020-04-10 | 2021-10-14 | ||
KR20220068462A (ko) * | 2020-11-19 | 2022-05-26 | 주식회사 티맥스에이아이 | 지식 그래프 생성 방법 및 장치 |
WO2022195848A1 (ja) * | 2021-03-19 | 2022-09-22 | 日本電気株式会社 | 分析条件生成装置、分析システム、分析条件生成プログラム、分析プログラム、分析条件生成方法、及び分析方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09190453A (ja) * | 1996-12-06 | 1997-07-22 | Hitachi Ltd | データベース装置 |
JP2005157823A (ja) * | 2003-11-27 | 2005-06-16 | Nippon Telegr & Teleph Corp <Ntt> | 知識ベースシステム、および同システムにおける単語間の意味関係判別方法、ならびにそのコンピュータプログラム |
JP2009080624A (ja) * | 2007-09-26 | 2009-04-16 | Toshiba Corp | 情報表示装置、方法及びプログラム |
JP2012252694A (ja) * | 2011-06-03 | 2012-12-20 | Korea Institute Of Science & Technology Infomation | オントロジースキーマーに基づくインスタンス経路の探索方法及び装置 |
-
2016
- 2016-07-05 JP JP2016133656A patent/JP6729095B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09190453A (ja) * | 1996-12-06 | 1997-07-22 | Hitachi Ltd | データベース装置 |
JP2005157823A (ja) * | 2003-11-27 | 2005-06-16 | Nippon Telegr & Teleph Corp <Ntt> | 知識ベースシステム、および同システムにおける単語間の意味関係判別方法、ならびにそのコンピュータプログラム |
JP2009080624A (ja) * | 2007-09-26 | 2009-04-16 | Toshiba Corp | 情報表示装置、方法及びプログラム |
JP2012252694A (ja) * | 2011-06-03 | 2012-12-20 | Korea Institute Of Science & Technology Infomation | オントロジースキーマーに基づくインスタンス経路の探索方法及び装置 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102041783B1 (ko) * | 2018-03-02 | 2019-11-07 | 신성대학교 산학협력단 | 물리치료 환자 기록 관리 서비스 제공 방법 |
KR20190104659A (ko) * | 2018-03-02 | 2019-09-11 | 신성대학교 산학협력단 | 물리치료 환자 기록 관리 서비스 제공 방법 |
JP7172497B2 (ja) | 2018-11-22 | 2022-11-16 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP2020086874A (ja) * | 2018-11-22 | 2020-06-04 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7273888B2 (ja) | 2019-05-23 | 2023-05-15 | ヤフー株式会社 | 決定装置、決定方法、および決定プログラム |
JP2021152905A (ja) * | 2019-05-23 | 2021-09-30 | ヤフー株式会社 | 決定装置、決定方法、および決定プログラム |
WO2021205639A1 (ja) * | 2020-04-10 | 2021-10-14 | 日本電信電話株式会社 | オントロジを用いた文章データ解析情報生成装置、文章データ解析情報生成方法、および文章データ解析情報生成プログラム |
JPWO2021205639A1 (ja) * | 2020-04-10 | 2021-10-14 | ||
JP7343820B2 (ja) | 2020-04-10 | 2023-09-13 | 日本電信電話株式会社 | オントロジを用いた文章データ解析情報生成装置、文章データ解析情報生成方法、および文章データ解析情報生成プログラム |
KR20220068462A (ko) * | 2020-11-19 | 2022-05-26 | 주식회사 티맥스에이아이 | 지식 그래프 생성 방법 및 장치 |
KR102560521B1 (ko) * | 2020-11-19 | 2023-07-27 | 주식회사 티맥스알지 | 지식 그래프 생성 방법 및 장치 |
WO2022195848A1 (ja) * | 2021-03-19 | 2022-09-22 | 日本電気株式会社 | 分析条件生成装置、分析システム、分析条件生成プログラム、分析プログラム、分析条件生成方法、及び分析方法 |
JP7552864B2 (ja) | 2021-03-19 | 2024-09-18 | 日本電気株式会社 | 分析条件生成装置、分析システム、分析条件生成プログラム、分析プログラム、分析条件生成方法、及び分析方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6729095B2 (ja) | 2020-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11397762B2 (en) | Automatically generating natural language responses to users' questions | |
US10699080B2 (en) | Capturing rich response relationships with small-data neural networks | |
Grishman | Information extraction | |
Andhale et al. | An overview of text summarization techniques | |
US10496749B2 (en) | Unified semantics-focused language processing and zero base knowledge building system | |
RU2686000C1 (ru) | Извлечение информационных объектов с использованием комбинации классификаторов, анализирующих локальные и нелокальные признаки | |
CN104991891B (zh) | 一种短文本特征提取方法 | |
JP6729095B2 (ja) | 情報処理装置及びプログラム | |
US9633005B2 (en) | Exhaustive automatic processing of textual information | |
KR101136007B1 (ko) | 문서 감성 분석 시스템 및 그 방법 | |
Banik et al. | Evaluation of naïve bayes and support vector machines on bangla textual movie reviews | |
KR20190015797A (ko) | 인공지능(ai)을 통한 딥러닝훈련모듈과, 순위화프레임워크모듈을 활용하여, 법률전문가에게 최적화된 모범답안을 제시하는 한편, 법률정보를 의미 벡터로 변환하여, 데이터베이스에 저장하고, 이에 대한 문자열 사전모듈을 활용한 온라인 법률정보사전을 제공하는 시스템 및 그 방법 | |
US9734238B2 (en) | Context based passage retreival and scoring in a question answering system | |
WO2013088287A1 (en) | Generation of natural language processing model for information domain | |
Sabeti et al. | LexiPers: An ontology based sentiment lexicon for Persian | |
Reganti et al. | Modeling satire in English text for automatic detection | |
US10621499B1 (en) | Systems and methods for semantic understanding of digital information | |
Thakur et al. | A review on text based emotion recognition system | |
Akram et al. | Lexicon and heuristics based approach for identification of emotion in text | |
Garrido et al. | The GENIE project-a semantic pipeline for automatic document categorisation | |
Rahul et al. | Social media sentiment analysis for Malayalam | |
Melnikov et al. | On usage of machine learning for natural language processing tasks as illustrated by educational content mining | |
Zouaoui et al. | Ontological Approach Based on Multi-Agent System for Indexing and Filtering Arabic Docu-ments | |
US11093706B2 (en) | Protagonist narrative balance computer implemented analysis of narrative data | |
CN113505889B (zh) | 图谱化知识库的处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200615 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6729095 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |