JP6212470B2 - 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム - Google Patents

行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム Download PDF

Info

Publication number
JP6212470B2
JP6212470B2 JP2014235167A JP2014235167A JP6212470B2 JP 6212470 B2 JP6212470 B2 JP 6212470B2 JP 2014235167 A JP2014235167 A JP 2014235167A JP 2014235167 A JP2014235167 A JP 2014235167A JP 6212470 B2 JP6212470 B2 JP 6212470B2
Authority
JP
Japan
Prior art keywords
action
situation
network information
behavior
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014235167A
Other languages
English (en)
Other versions
JP2016099752A (ja
Inventor
片岡 泰之
泰之 片岡
真 中辻
真 中辻
浩之 戸田
浩之 戸田
義昌 小池
義昌 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014235167A priority Critical patent/JP6212470B2/ja
Publication of JP2016099752A publication Critical patent/JP2016099752A/ja
Application granted granted Critical
Publication of JP6212470B2 publication Critical patent/JP6212470B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、テキストマイニングに関する技術分野、特に、行動予測のための行動ネットワーク情報を大規模テキストから抽出する技術に関する。
ウェアラブル端末や環境センサの普及に伴い、実世界における人間の状況を推定することが現実的になった。実世界行動を支援する情報ナビゲーションの為には、ユーザの状況の推定結果を発展させて「次の行動を予測する技術」が必要となる。
しかしながら、上記のセンサによる人間の行動の理解は、特定の状況を判定する分類問題に帰着させる事が多く、その分類数には限界がある。人間のあらゆる行動を予測するには、それらセンサで判定された人間の行動を基点として、次の行動を推論するアプローチが有効であると考えられる。
近年多様化するソーシャルメディアからのテキストマイニングによる情報抽出方法が提案されている(非特許文献1)。多様なソーシャルメディアの発達と共に、ユーザの実世界行動がテキスト情報で詳細に記録され、Web上に公開されるようになった。
そして、これらの大規模テキストから人間が行う行動を適切に抽出することにより、人間の行動を体系化することが可能となる。例えば、自動車に乗っている時にする行動や、それら行動の連鎖性を体系化しておくことで、自動車に乗った次の行動の予測に基づく情報提示が可能となる。
倉島健、藤村考、奥田英範,「大規模テキストからの経験マイニング」,電子情報通信学会論文誌,vol.92, No.3, pp.301 - pp.310, 2009
従来のテキストマイニング方法は、ある場所と時間で特徴的な行動をリフト値として表してランキング化する。しかしながら、この従来の方法は行動と行動間の関連性には注目していない。関連性には、例えば遷移関係や因果関係が考えられ、こうした関係性を考慮することにより、ある行動の次の行動の予測精度の向上ができると考えられる。
本発明は、上記の事情に鑑み、人間の行動理解のための行動ネットワーク情報を高精度及び広範囲に抽出することを課題とする。
そこで、本発明は、ある状況を表現する単語に加えてその前後の時間で変化しうる状況を考慮した複数の単語からそれぞれ生成される行動ネットワーク情報を重み付き和によって融合することにより、広範な行動ネットワーク情報の抽出を行う。
すなわち、本発明の行動ネットワーク情報抽出装置は、大規模テキストから特定状況における行動予測のための行動ネットワーク情報を抽出する行動ネットワーク情報抽出装置であって、大規模テキストから抽出された特定状況を示す状況語を含んだ文書情報から得られた行動表現の出現頻度と当該行動表現と共起する他の行動表現の共起頻度とを成分とする特定状況を示す状況語の行動共起行列に基づき当該状況語を示す行動ノードの集合と当該状況語と他の行動表現との関連性を示す行動間エッジの集合とから成る特定状況を示す状況語の行動ネットワーク情報を作成すると共に、前記大規模テキストから前記特定状況を示す状況語と時間的に前後関係にある状況語を含んだ文書情報から得られた行動表現の出現頻度とこの行動表現と共起する他の行動表現の共起頻度とを成分とする当該前後関係にある状況語の行動共起行列に基づき当該前後関係にある状況語を示す行動ノードの集合と当該状況語と他の行動表現との関連性を示す行動間エッジの集合とをから成る当該前後関係にある状況語の行動ネットワーク情報を作成する前処理手段と、前記特定状況を示す状況語の行動ノードの集合と前記前後関係にある状況語の行動ノードの集合とに基づき当該特定状況を示す状況語の行動ネットワーク情報と当該前後関係にある状況語の行動ネットワーク情報との類似性を算出する類似性評価手段と、前記特定状況を示す状況語の行動共起行列と前記類似性により重み付けされた前記前後関係にある状況語の行動共起行列との和に基づき当該特定状況を示す状況語の行動ノード並びに行動間エッジを更新することにより当該特定状況を示す状況語の行動ネットワーク情報を拡張する行動ネットワーク拡張手段と、前記拡張された特定状況を示す状況語の行動ネットワーク情報における行動ノードの集合から行動ノードの重要度に基づき選択された行動ノードの集合と当該行動ノードに対応した行動間エッジの集合とから行動ネットワーク情報を新たに作成する行動ネットワーク作成手段とを備える。
また、本発明の行動ネットワーク情報抽出方法は、大規模テキストから特定状況における行動予測のための行動ネットワーク情報を抽出する行動ネットワーク情報抽出装置が実行する行動ネットワーク情報抽出方法であって、大規模テキストから抽出された特定状況を示す状況語を含んだ文書情報から得られた行動表現の出現頻度と当該行動表現と共起する他の行動表現の共起頻度とを成分とする特定状況を示す状況語の行動共起行列に基づき当該状況語を示す行動ノードの集合と当該状況語と他の行動表現との関連性を示す行動間エッジの集合とから成る特定状況を示す状況語の行動ネットワーク情報を作成すると共に、前記大規模テキストから前記特定状況を示す状況語と時間的に前後関係にある状況語を含んだ文書情報から得られた行動表現の出現頻度とこの行動表現と共起する他の行動表現の共起頻度とを成分とする当該前後関係にある状況語の行動共起行列に基づき当該前後関係にある状況語を示す行動ノードの集合と当該状況語と他の行動表現との関連性を示す行動間エッジの集合とをから成る当該前後関係にある状況語の行動ネットワーク情報を作成する前処理ステップと、前記特定状況を示す状況語の行動ノードの集合と前記前後関係にある状況語の行動ノードの集合とに基づき当該特定状況を示す状況語の行動ネットワーク情報と当該前後関係にある状況語の行動ネットワーク情報との類似性を算出する類似性評価ステップと、前記特定状況を示す状況語の行動共起行列と前記類似性により重み付けされた前記前後関係にある状況語の行動共起行列との和に基づき当該特定状況を示す状況語の行動ノード並びに行動間エッジを更新することにより当該特定状況を示す状況語の行動ネットワーク情報を拡張する行動ネットワーク拡張ステップと、前記拡張された特定状況を示す状況語の行動ネットワーク情報における行動ノードの集合から行動ノードの重要度に基づき選択された行動ノードの集合とその行動間エッジの集合とから行動ネットワーク情報を新たに作成する行動ネットワーク作成ステップとを有する。
尚、本発明は上記装置の各手段としてコンピュータを機能させるプログラムまたは上記方法のステップをコンピュータに実行させるプログラムの態様とすることもできる。
本発明によれば、人間の行動理解のための行動ネットワーク情報を高精度及び広範囲に抽出できる。
本発明の実施形態における行動ネットワーク情報抽出装置のブロック構成図。 同装置における行動ネットワーク拡張処理部のブロック構成図。 同装置が適用されたシステムのブロック構成図。 行動ネットワーク情報の融合のイメージ図。 広範囲な行動ネットワーク情報の作成のフロー図。 行動ネットワーク拡張処理のフロー図。
以下、図面を参照しながら本発明の実施の形態について説明するが本発明はこの実施形態に限定されるものではない。
[概要]
図1に示された本実施形態の行動ネットワーク情報抽出装置10は、行動の体系化において、行動ネットワーク情報を採用する。行動ネットワーク情報は、ある行動を表現する行動ノードと、行動と行動の間に関連性を表現する行動間エッジとで構成される。
特に本態様の行動ネットワーク情報抽出装置10は、注目するユーザの行動(状態)を起点として、その状態に関連する行動を高精度及び広範囲に抽出する。すなわち、時間経過と共に変化する各状況を複数の単語で表現した情報に基づき、ある状況とその前後の状況を表す単語を取得する。次いで、ある状況における行動ネットワーク情報と、ある状況の前後の状況における行動ネットワーク情報を入力として、ある状況とその前の状況若しくは状況とその後の状況の類似性をネットワーク情報のノード集合の類似性から算出する。そして、その類似性を重みとしてその重み和によってネットワーク情報を融合することにより、ネットワーク情報全体を拡張させる。
[装置の構成]
行動ネットワーク情報抽出装置10は、図1に示されたように、行動抽出エンジン1、行動ネット抽出処理部2、クエリ解析部3、行動ネットワーク拡張処理部4を備える。
クエリ解析部3は、ユーザの端末等のユーザの実世界環境30から注目する特定状況を表現する単語がクエリとして入力された状況語q1と時間的に前後関係にある状況語を状況の時間変化情報DB(データベース)28から抽出する。この抽出された状況語は行動抽出エンジン1に供される。尚、状況の時間変化情報DBは事前に与えられているものとし、例えば人手で構築することで得られる。
行動抽出エンジン1は、状況語q1と時間的に前後関係にある状況語に基づき大規模テキストデータ23から状況依存の行動の自然言語表現を抽出する。状況依存の行動の自然言語表現は、行動‐doc情報DB11に保存される。
行動ネット抽出処理部2は、行動‐doc情報DB11に保存されている状況依存の行動の自然言語表現X{c}に基づき状況依存の行動共起行列Aを算出する。
行動抽出エンジン1と行動ネット抽出処理部2の組合せ処理は、注目する状況に対して一つのキーワード(状況語)を用いて行動のネットワークを生成する。状況語とは、センサによって観測できる状況とし、例えば、「睡眠」や「自転車」等である。しかしながらこの手法で大きなネットワークを得ようとすると状況に関連しない行動表現も抽出されてしまうので、抽出精度を高く保ちながら広範囲なネットワークを得ることが困難となる。
そこで、行動ネットワーク拡張処理部4は、注目する状況の前後の状況に対する行動ネットワーク情報を重み付き和で融合する。その重みは、状況の類似性によって決定する。状況の類似性は、2つの状況で同じ行動を誘発すればするほど高い値を持つように設定する。
例えば、睡眠という状況の前後を想定すると、状況は、(風呂)→(睡眠)→(起床)のように遷移する。この情報に基づき3つの行動ネットワーク情報を、(睡眠)と(風呂)の状況の類似性、(睡眠)と(起床)の状況の類似性を元に融合する。各ネットワークの中心部は精度の高いネットワークが得られるという特徴があるため、これら複数のネットワークを組み合わせることで睡眠を中心としてより広範囲に精度が高いネットワークが得られる。尚、行動ネットワーク情報抽出装置10では「注目する状況の前後の状況に関する情報」は構造化データとして与えられていることを前提とする。
以上の機能部1〜4はコンピュータのハードウェアリソースによって実現される。すなわち、行動ネットワーク情報抽出装置10は、少なくとも演算装置(CPU)、記憶装置(メモリ、ハードディスク装置等)、通信インタフェース等のコンピュータに係るハードウェアリソースを備える。そして、これらのハードウェアリソースがソフトウェアリソース(OS、アプリケーション等)と協働することにより各機能部1〜4が実装される。また、各々のコンピュータに機能部1〜4を各々実装させるようにしてもよい。
[行動ネットワーク情報の拡張処理過程の説明]
以下、図1〜6を参照しながら行動ネットワーク情報の拡張処理過程について説明する。
S1:行動抽出エンジン1は、大規模テキストデータ23から行動の自然言語表現を抽出する。ここで行動の候補は、形態素解析と係り受け解析に基づいて、[動詞と名詞のペア]或いは動詞のみで構成し、例えば(写真,共有)や(‐,睡眠する)等を抽出する。ここで行動の厳密な定義は、本発明の論点とは独立であることを強調しておく。自然言語表現抽出の処理は以下のステップS101〜S103となる。
S101:先ず、例えばユーザの端末等のユーザの実世界環境30から注目する特定状況を表現する単語である状況語q1をクエリとして入力を受けて、大規模テキストDB23から状況語q1を含む文書を取得する。
S102:前記取得した文書の形態素解析と係り受け解析によって、動詞或いは動詞と名詞のペアで構成される行動表現を抽出する。その際、名詞に日本語の意味解釈上不適切な表現を削除するために、Wikipediaデータ蓄積部22に保存されている名詞に含まれない表現は削除する。
S103:上記各文書から得られた行動の情報(行動表現とこれを含む文書)を行動‐doc情報DB11に保存する。得られた行動表現をai {c}(i=1,…,nc),文書をdj {c}(j=1,…,mc)とし、行動表現を行成分に、文書を列成分にした行列X{c}∈Rnc×mcを構成する。但し、X{c}の各要素は0か1で構成され、また、一般にmg>mc,mg>ncである。
S2:行動ネット抽出処理部2は、行動‐doc情報DB11に保存されている状況依存の行動の自然言語表現X{c}に基づき状況依存の行動共起行列Aを算出する。行動共起行列Aは、対角成分A(i,i)に行動表現aiの出現頻度を非対角成分A(i,j)に行動表現aiと行動表現ajの共起頻度を示す情報となる。行動共起行列A{c}は以下の式(1)により算出される。行動共起行列A{c}はそれぞれ行動共起情報累積部12に保存される。
Figure 0006212470
S3:行動ネットワーク拡張処理部4は、状況語q1に対して広範な行動ネットワーク情報を得る。
先ず、S3の処理について説明する前に、クエリ解析部3によって実行される前処理について説明する。クエリ解析部3は、状況語q1と時間的に前後関係にある状況語を、状況の時間変化情報DBから抽出する。例えば、状況語q1=「睡眠」であれば、「風呂」や「起床」等が状況モード変化である。この状況語の数は、任意であり1つ以上であればよい。以降では状況語の数をnc、それぞれの状況語をα1,…,αncと表現する。これらの状況語αiもステップS1,S2に供して、それぞれ得られた共起行列をA{αi}とする。この共起行列A{αi}は、行動共起行列A{c}と共に、以下のS3のS301〜S305に供される。図6に示されたS301〜S305は図2に示した行動ネットワーク拡張処理部4の各機能部41〜45によってそれぞれ実行される。
S301:入力部41は、行動-doc情報DB11から引き出された行動共起行列A{c},A{αi}(i=1,…,nc)の入力を受ける。
S302:前処理部42は、行動共起行列A{c},A{αi}(i=1,…,nc)の対角成分A(i,i) {c}に対して、閾値γ1未満であるものは削除する。γ1の選択方法は、例えば出現頻度順のランキングで下位10%を削除する。これにより、出現頻度が低いものが不適切に処理されることを回避される。また、行動表現aiと行動表現ajの共起頻度についても同様に処理を行う。各行動共起行列の対角成分A(i,j) {c}に対して、閾値γ2未満であるものは削除する。γ2の選択方法は、例えば共起頻度順のランキングで下位10%を削除する。これにより、共起頻度が低いものが不適切に処理されることを回避される。こうして更新された共起行列から得られた行動ネットワーク情報をGq1,Gα1,…,Gαncと表現する。尚、行動ネットワーク情報は、G*=(V*,E*)と定義され、V*はネットワークの行動ノードの集合を、E*はネットワークの行動間エッジの集合を表す。
S303:類似性評価部43は、状況語q1と状況語αi(i=1,…,nc)(クエリ解析部3によって得られたもの)とに基づき生成された行動ネットワーク情報の類似性を評価する。以下の式(2)で示した類似性であるdi(i=1,…,nc)は、出現する行動ノード集合V*のJaccard係数で評価する。
Figure 0006212470
これは、仮に状況語q1とこれと時間的に前後関係にある状況語αiが全く違う状況であれば、それらから抽出される行動ノードの集合に類似性はあまりない。逆に、状況語q1とこれの時間的に前後関係にある状況語αiが遷移性を伴う状況であれば、同じ行動を誘発しdiの値は高くなる。
S304:行動ネットワーク拡張部44は、上記算出した類似性に基づいて行動ネットワーク情報を拡張する。
本ステップでは、各共起行列を重み付き和で更新する。基本的には、行動ネットワーク情報A{c}にdi{αi}を加える処理をi=1,…,ncまで繰り返すことで行動ネットワーク情報を融合する。これにより、最終的な行動ネットワーク情報A{final}を得る。しかしながら、それぞれの行動共起行列のi成分は、参照している行動表現aiの行動ノードの実体は異なること、また行列の大きさが異なることから、単純な行列の加算では行動ネットワーク情報は融合できない。そこで、以下のステップ(1)(2)で重み付き和を算出する。
(1)行動ノードの情報を更新する。
(a)行動ノードai {αi}が行動ネットワーク情報A{final}に存在するか否かを確認し、当該ノードが存在する場合はノードの値を更新する。
(b)行動ノードai {αi}が行動ネットワーク情報A{final}に存在しない場合は、行動ネットワーク情報A{final}に新たな行動表現ai {αi}を追加する。
(2)行動間エッジの情報を更新する。
(a)対象の行動間エッジA(i,j) {αi}の行動表現ai {αi}と行動表現aj {αi}の値を更新する。
(b)定義されない値は0を代入する(大規模テキストデータ23において特定状況を示す状況語と時間的に前後関係にある状況語が存在しない場合には行動共起行列A{αi}の成分の値に0を代入する)。
以下に具体的な処理のアルゴリズムを表1に示す。但し、A(i,j) {αi}∈Nnαi×nαiであり、ai {αi}は行動共起行列A{αi}のi成分の行動ノードを示す。
Figure 0006212470
以上のステップS3,S4の類似性の評価に基づく行動ネットワーク情報の融合のイメージを図4に示す。
S305:行動ネットワーク生成部45は、最終的に得られた行動ネットワーク情報A{final}の行動表現aiの行動ノードの重要度を、当該行動ノードの行動間エッジの対角要素A(i,j) {final}に基づき算出する。この算出された値に基づき行動ノードをランキング化し、上位M個を行動ノードの候補として選出し、それ以外を削除する処理を行う。Mは任意に設定できるパラメータである。そして、この選択された行動ノードの集合とその行動間エッジの集合とから新たな行動ネットワーク情報が得られる。こうして得られた行動ネットワーク情報は行動ネット蓄積部27に保存される。
[実施例]
図3を参照しながら本発明の実施例について説明する。本実装の全体像について、ユーザの実世界環境30、サーバ側の環境20に分けて説明する。
(ユーザの実世界環境30)
ユーザの実世界環境30では、環境センサ301,ウェアラブル端末302,携帯電話303やスマートフォン等に搭載されているセンサで観測されたデータをサーバ側の環境20内のユーザ状況推定装置24に送信する。
(サーバ側の環境20)
大規模テキスト取得サーバ21は、Web11上のブログ等のテキストデータを取得し、大規模テキストデータ23に保存する。
Wikipediaデータ蓄積部22も同様にWikipediaのデータを取得する。
一方、ユーザ状況推定装置24は、ユーザの実世界環境のセンサデータに基づいてユーザの現在の状況を推定する。例えば、ウェアラブル端末302の生体センサから「睡眠」という状況の推定、或いは、ウェアラブル端末302若しくは携帯電話303のGPSログからユーザの移動モード(電車,自転車,バス,飛行機等)を推定する。
クエリ変換処理装置25は、ユーザ状況推定装置24で推定された結果を一語に変換する処理を行う。例えば「睡眠」等のキーワードを選択する。
時間変化情報DB28は、ある状況の時間的に前後の状況をテキストデータで保存したデータベースである。例えば「睡眠」の前は「風呂」という状況や、「睡眠」の後は「起床」という状況というような情報を蓄積している。
行動ネットワーク抽出サーバ26は、上述の行動ネットワーク情報抽出装置10の機能部1〜4を実装している。同サーバ26は前述のS1〜S3を実行することにより行動ネットワーク情報を作成する。本態様では、Wikipediaデータ蓄積部22、大規模テキストデータ23、クエリ変換処理装置25、時間変化情報DB28から状況語の入力を受ける。行動ネットワーク抽出サーバ26によって生成された行動ネットワーク情報は行動ネット累積部27に累積される。
[本実施形態の効果]
以上説明したように本実施形態の行動ネットワーク情報抽出装置10によれば、ある状況と、その状況の前後少なくとも一方の状況とで、同じ行動を誘発する状況であるほど類似性が高くなるように類似性が得られる。そして、この得られた類似性に基づき状況間の重みを設定し、各状況のネットワーク情報を重み付き和で融合させることにより、ネットワーク全体が拡張する。したがって、広範な行動ノードの取得と精度が向上する。よって、人間の行動理解のための行動ネットワーク情報を高精度及び広範囲に抽出できる。
特に、S302の前処理ステップにおいては、前記特定状況を示す状況語の行動共起行列の作成する過程において、前記大規模テキストから抽出された特定状況を示す状況語を含んだ文書情報から得られた行動表現の出現頻度と当該行動表現と共起する他の行動表現の共起頻度の値が閾値未満である場合に当該出現頻度並びに共起頻度の値が、前記特定状況を示す状況語の行動共起行列の成分から除外される。また、前記特定状況を示す状況語と時間的に前後関係にある状況語の行動共起行列を作成する過程において、前記大規模テキストから前記前後関係にある状況語を含んだ文書情報から得られた行動表現の出現頻度と当該行動表現と共起する他の行動表現の共起頻度の値が閾値未満である場合に当該出現頻度並びに共起頻度の値が、前記前後関係にある状況語の行動共起行列の成分から除外される。以上のように、前記出現頻度及び共起頻度が低いものが不適的に処理されることが回避されるので、後に続くS303の類似性評価ステップにおける行動ネットワーク情報の類似性評価の精度が高まる。
また、S305の行動ネットワーク作成ステップにおいては、行動ネットワーク情報を新たに作成する過程で、拡張された特定状況を示す状況語の行動ネットワーク情報における行動ノードの集合から行動ノードの重要度の値が上位所定数の行動ノードが選択される。したがって、最終的に生成される行動ネットワーク情報の精度レベルが一定以上に高まる。
以上説明した本態様の発明は産業上利用可能性の観点から以下の効果(1)(2)が得られる。
(1)ユーザの実世界環境をセンシングし、その状況の前後におけるユーザの行動を予測するので、実世界行動依存型サービスまたはコンテンツ推薦の質が向上する。
(2)ノウハウカタログの自動生成が可能となる。具体的には、あるユーザが特定の環境で取る行動のプロセスを集合知として抽出できる。例えば、災害発生前後で人間の行動変化を知ることにより、物資やボランティアの需要予測が可能となる。
[本発明の他の態様]
本発明は、行動ネットワーク情報抽出装置10を構成する上記の機能部1〜4の一部若しくは全てとしてコンピュータを機能させるプログラムで構成しこれを当該コンピュータに実行させることにより実現できる。または、同装置10が実行する上記のステップS1〜S3の一部若しくは全てをコンピュータに実行させるプログラムで構成しこれを当該コンピュータに実行させることにより実現できる。そして、このプログラムをそのコンピュータが読み取り可能な周知の記録媒体(例えば、ハードディスク、フレキシブルディスク、CD−ROM等)に格納して提供できる。または、前記プログラムをインターネットや電子メール等でネットワークを介して提供できる。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更、応用が可能である。
1…行動抽出エンジン
2…行動ネット抽出処理部
3…クエリ解析部
4…行動ネットワーク拡張処理部
41…入力部
42…前処理部(前処理手段)
43…類似性評価部(類似性評価手段)
44…行動ネットワーク拡張部(行動ネットワーク拡張手段)
45…行動ネットワーク生成部(行動ネットワーク作成手段)
10…行動ネットワーク情報抽出装置

Claims (8)

  1. 大規模テキストから特定状況における行動予測のための行動ネットワーク情報を抽出する行動ネットワーク情報抽出装置であって、
    大規模テキストから抽出された特定状況を示す状況語を含んだ文書情報から得られた行動表現の出現頻度と当該行動表現と共起する他の行動表現の共起頻度とを成分とする特定状況を示す状況語の行動共起行列に基づき当該状況語を示す行動ノードの集合と当該状況語と他の行動表現との関連性を示す行動間エッジの集合とから成る特定状況を示す状況語の行動ネットワーク情報を作成すると共に、前記大規模テキストから前記特定状況を示す状況語と時間的に前後関係にある状況語を含んだ文書情報から得られた行動表現の出現頻度とこの行動表現と共起する他の行動表現の共起頻度とを成分とする当該前後関係にある状況語の行動共起行列に基づき当該前後関係にある状況語を示す行動ノードの集合と当該状況語と他の行動表現との関連性を示す行動間エッジの集合とをから成る当該前後関係にある状況語の行動ネットワーク情報を作成する前処理手段と、
    前記特定状況を示す状況語の行動ノードの集合と前記前後関係にある状況語の行動ノードの集合とに基づき当該特定状況を示す状況語の行動ネットワーク情報と当該前後関係にある状況語の行動ネットワーク情報との類似性を算出する類似性評価手段と、
    前記特定状況を示す状況語の行動共起行列と前記類似性により重み付けされた前記前後関係にある状況語の行動共起行列との和に基づき当該特定状況を示す状況語の行動ノード並びに行動間エッジを更新することにより当該特定状況を示す状況語の行動ネットワーク情報を拡張する行動ネットワーク拡張手段と、
    前記拡張された特定状況を示す状況語の行動ネットワーク情報における行動ノードの集合から行動ノードの重要度に基づき選択された行動ノードの集合とその行動間エッジの集合とから行動ネットワーク情報を新たに作成する行動ネットワーク作成手段と
    を備えたこと
    を特徴とする行動ネットワーク情報抽出装置。
  2. 前記行動ネットワーク拡張手段は、
    前記行動ノードを更新する際に、前記更新された行動ネットワーク情報において当該行動ノードを有する場合には当該ノードを更新する一方で、前記行動ノードを有しない場合には当該行動ネットワーク情報に当該行動ノードを追加し、
    前記行動間エッジを更新する際に、前記大規模テキストにおいて前記特定状況を示す状況語と時間的に前後関係にある状況語が存在する場合に前記前後関係にある状況語の行動共起行列における成分の値を更新する一方で、前記大規模テキストにおいて前記前後関係にある状況語が存在しない場合には前記成分の値に0を代入すること
    を特徴とする請求項1に記載の行動ネットワーク情報抽出装置。
  3. 前記前処理手段は、前記特定状況を示す状況語の行動共起行列の作成する過程において、前記大規模テキストから抽出された特定状況を示す状況語を含んだ文書情報から得られた行動表現の出現頻度と当該行動表現と共起する他の行動表現の共起頻度の値が閾値未満である場合に当該出現頻度並びに共起頻度の値を、前記特定状況を示す状況語の行動共起行列の成分から除外すること
    を特徴とする請求項1または2に記載の行動ネットワーク情報抽出装置。
  4. 前記前処理手段は、前記特定状況を示す状況語と時間的に前後関係にある状況語の行動共起行列を作成する過程において、前記大規模テキストから前記前後関係にある状況語を含んだ文書情報から得られた行動表現の出現頻度と当該行動表現と共起する他の行動表現の共起頻度の値が閾値未満である場合に当該出現頻度並びに共起頻度の値を、前記前後関係にある状況語の行動共起行列の成分から除外すること
    を特徴とする請求項3に記載の行動ネットワーク情報抽出装置。
  5. 前記行動ネットワーク作成手段は、行動ネットワーク情報を新たに作成する過程で、前記拡張された特定状況を示す状況語の行動ネットワーク情報における行動ノードの集合から行動ノードの重要度の値が上位所定数の行動ノードを選択すること
    を特徴とする請求項1から4のいずれか1項に記載の行動ネットワーク情報抽出装置。
  6. 大規模テキストから特定状況における行動予測のための行動ネットワーク情報を抽出する行動ネットワーク情報抽出装置が実行する行動ネットワーク情報抽出方法であって、
    大規模テキストから抽出された特定状況を示す状況語を含んだ文書情報から得られた行動表現の出現頻度と当該行動表現と共起する他の行動表現の共起頻度とを成分とする特定状況を示す状況語の行動共起行列に基づき当該状況語を示す行動ノードの集合と当該状況語と他の行動表現との関連性を示す行動間エッジの集合とから成る特定状況を示す状況語の行動ネットワーク情報を作成すると共に、前記大規模テキストから前記特定状況を示す状況語と時間的に前後関係にある状況語を含んだ文書情報から得られた行動表現の出現頻度とこの行動表現と共起する他の行動表現の共起頻度とを成分とする当該前後関係にある状況語の行動共起行列に基づき当該前後関係にある状況語を示す行動ノードの集合と当該状況語と他の行動表現との関連性を示す行動間エッジの集合とをから成る当該前後関係にある状況語の行動ネットワーク情報を作成する前処理ステップと、
    前記特定状況を示す状況語の行動ノードの集合と前記前後関係にある状況語の行動ノードの集合とに基づき当該特定状況を示す状況語の行動ネットワーク情報と当該前後関係にある状況語の行動ネットワーク情報との類似性を算出する類似性評価ステップと、
    前記特定状況を示す状況語の行動共起行列と前記類似性により重み付けされた前記前後関係にある状況語の行動共起行列との和に基づき当該特定状況を示す状況語の行動ノード並びに行動間エッジを更新することにより当該特定状況を示す状況語の行動ネットワーク情報を拡張する行動ネットワーク拡張ステップと、
    前記拡張された特定状況を示す状況語の行動ネットワーク情報における行動ノードの集合から行動ノードの重要度に基づき選択された行動ノードの集合とその行動間エッジの集合とから行動ネットワーク情報を新たに作成する行動ネットワーク作成ステップと
    を有すること
    を特徴とする行動ネットワーク情報抽出方法。
  7. 前記行動ネットワーク拡張ステップでは、
    前記行動ノードを更新する際に、前記更新された行動ネットワーク情報において当該行動ノードを有する場合には当該ノードを更新する一方で、前記行動ノードを有しない場合には当該行動ネットワーク情報に当該行動ノードを追加し、
    前記行動間エッジを更新する際に、前記大規模テキストにおいて前記特定状況を示す状況語と時間的に前後関係にある状況語が存在する場合に前記前後関係にある状況語の行動共起行列における成分の値を更新する一方で、前記大規模テキストにおいて前記前後関係にある状況語が存在しない場合には前記成分の値に0を代入すること
    を特徴とする請求項6に記載の行動ネットワーク情報抽出方法。
  8. コンピュータを請求項1から5のいずれか1項に記載の行動ネットワーク情報抽出装置を構成する各手段として機能させることを特徴とする行動ネットワーク情報抽出プログラム。
JP2014235167A 2014-11-20 2014-11-20 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム Active JP6212470B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014235167A JP6212470B2 (ja) 2014-11-20 2014-11-20 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014235167A JP6212470B2 (ja) 2014-11-20 2014-11-20 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム

Publications (2)

Publication Number Publication Date
JP2016099752A JP2016099752A (ja) 2016-05-30
JP6212470B2 true JP6212470B2 (ja) 2017-10-11

Family

ID=56077147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014235167A Active JP6212470B2 (ja) 2014-11-20 2014-11-20 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム

Country Status (1)

Country Link
JP (1) JP6212470B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4284026B2 (ja) * 2002-01-30 2009-06-24 株式会社東芝 データ分析方法およびデータ分析装置およびプログラム
JP2010152679A (ja) * 2008-12-25 2010-07-08 Toshiba Corp 情報提示装置および情報提示方法
EP2817737A4 (en) * 2012-02-22 2015-10-07 Nokia Technologies Oy ADAPTIVE SYSTEM
JP2015531909A (ja) * 2012-07-20 2015-11-05 インタートラスト テクノロジーズ コーポレイション 情報ターゲティングシステムおよび方法

Also Published As

Publication number Publication date
JP2016099752A (ja) 2016-05-30

Similar Documents

Publication Publication Date Title
US11868375B2 (en) Method, medium, and system for personalized content delivery
AU2016225947B2 (en) System and method for multimedia document summarization
US8386457B2 (en) Using a dynamically-generated content-level newsworthiness rating to provide content recommendations
JP2014501988A5 (ja)
WO2019114423A1 (zh) 对模型预测值进行融合的方法、装置和设备
JP5454357B2 (ja) 情報処理装置および方法、並びに、プログラム
US10936950B1 (en) Processing sequential interaction data
JP6662119B2 (ja) ソーシャルメディア投稿のキャプションを生成する方法、プログラム及びサーバ装置
US11613008B2 (en) Automating a process using robotic process automation code
KR20190013426A (ko) 인공지능 학습모델을 이용하여 요약 정보를 제공하기 위한 전자 장치 및 이의 제어 방법
AU2019203747B2 (en) Scoring mechanism for discovery of extremist content
US10977031B2 (en) Method for a software development system
JP5961320B2 (ja) ソーシャル・メデイアにおけるユーザの分類方法、コンピュータ・プログラム及びコンピュータ
JP2014106661A (ja) ユーザ状態予測装置及び方法及びプログラム
CN111443964A (zh) 更新用户界面的方法、设备和计算机程序产品
JP5973935B2 (ja) 閲覧行動予測装置、閲覧行動予測方法及びプログラム
KR101494795B1 (ko) 문서를 매트릭스로 표현하는 방법
JP6228909B2 (ja) 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム
JP2021092925A (ja) データ生成装置およびデータ生成方法
JP6971181B2 (ja) 予測装置、予測方法、およびプログラム
JP6212470B2 (ja) 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム
US20200357030A1 (en) Facilitating responding to multiple product or service reviews associated with multiple sources
JP6280859B2 (ja) 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム
JP5555238B2 (ja) ベイジアンネットワーク構造学習のための情報処理装置及びプログラム
US11068793B2 (en) Causality analysis device, method, and non-transitory computer readable storage medium with determination of causal advantages and disadvantages to a user

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170915

R150 Certificate of patent or registration of utility model

Ref document number: 6212470

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150