JP5521319B2 - 情報分析装置及びプログラム - Google Patents

情報分析装置及びプログラム Download PDF

Info

Publication number
JP5521319B2
JP5521319B2 JP2008313497A JP2008313497A JP5521319B2 JP 5521319 B2 JP5521319 B2 JP 5521319B2 JP 2008313497 A JP2008313497 A JP 2008313497A JP 2008313497 A JP2008313497 A JP 2008313497A JP 5521319 B2 JP5521319 B2 JP 5521319B2
Authority
JP
Japan
Prior art keywords
elements
information
node
attention
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008313497A
Other languages
English (en)
Other versions
JP2010140096A (ja
Inventor
洋 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2008313497A priority Critical patent/JP5521319B2/ja
Publication of JP2010140096A publication Critical patent/JP2010140096A/ja
Application granted granted Critical
Publication of JP5521319B2 publication Critical patent/JP5521319B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報分析装置及びプログラムに関する。
例えば文書等をノード(要素)、文書間の引用関係等をリンク(接続関係)としてネットワークを構成し、構成したネットワークを分析することで有用な情報を得る技術がある。例えば、下記の特許文献1には、ノードに付与されるデータ値をノードのリンクに従って伝播させて得た各ノードのデータ値をノードの重要度として利用することが開示されている。
こうしたネットワーク分析において、各ノードについて利用者が感じる注目度を定量的に評価しているものはなかった。
特開2007−241459号公報
本発明の目的の一つは、複数のノードを有向リンクにより接続して構成されたネットワークに含まれる各ノードの注目度を定量的に評価することができる情報分析装置及びプログラムを提供することにある。
上記目的を達成するために、請求項1に記載の情報分析装置の発明は、複数の要素と、当該複数の要素間に定められた有向の接続関係との情報を含む分析対象情報を取得する取得手段と、前記取得手段により取得された分析対象情報に含まれる各要素に値を付与すると共に、当該付与した値を当該各要素間に定められた有向の接続関係に従って更新する処理を予め定められた条件を満足するまで繰り返し実行する処理実行手段と、前記分析対象情報に含まれる要素毎の注目度を、当該要素を始点とする有向の接続関係にある他の要素について前記処理実行手段による処理の結果得られた値に基づいて算出する算出手段と、を含むことを特徴とする。
また、請求項2に記載の発明は、請求項1に記載の情報分析装置において、前記処理実行手段は、前記取得手段により取得された分析対象情報に含まれる要素の中から予め指定された条件に従って選択された要素群に基づいて初期状態を設定することを特徴とする。
また、請求項3に記載の発明は、請求項1又は2に記載の情報分析装置において、前記算出手段は、前記分析対象情報に含まれる要素毎の注目度を、当該要素を始点とする有向の接続関係にある他の要素の中から重要度の大きさに基づいて選択された要素について前記処理実行手段による処理の結果得られた値に基づいて算出することを特徴とする。
また、請求項4に記載の発明は、請求項1乃至3のいずれかに記載の情報分析装置において、前記分析対象情報に含まれる各要素を前記算出手段により算出された注目度に基づいて順位付けすると共に、当該順位付けに基づく結果を表示する結果表示手段をさらに含むことを特徴とする。
また、請求項5に記載の発明は、請求項4に記載の情報分析装置において、前記結果表示手段は、前記分析対象情報に含まれる要素毎に、前記処理実行手段により得られた値と、前記算出手段により算出された注目度とに基づいて順位付けすることを特徴とする。
また、請求項6に記載の発明は、請求項4に記載の情報分析装置において、前記結果表示手段は、前記分析対象情報に含まれる要素毎に、前記処理実行手段により得られた値に基づいて順位付けした結果と、前記算出手段により算出された注目度に基づいて順位付けした結果とを切り替えて表示することを特徴とする。
また、請求項7に記載のプログラムの発明は、複数の要素と、当該複数の要素間に定められた有向の接続関係との情報を含む分析対象情報を取得する取得手段と、前記取得手段により取得された分析対象情報に含まれる各要素に値を付与すると共に、当該付与した値を当該各要素間に定められた有向の接続関係に従って更新する処理を予め定められた条件を満足するまで繰り返し実行する処理実行手段と、前記分析対象情報に含まれる要素毎の注目度を、当該要素を始点とする有向の接続関係にある他の要素について前記処理実行手段による処理の結果得られた値に基づいて算出する算出手段としてコンピュータを機能させることを特徴とする。
請求項1及び7に記載の発明によれば、各要素の注目度を定量的に評価することができる。
請求項2に記載の発明によれば、指定された条件に基づく各要素の注目度を定量的に評価できる。
請求項3に記載の発明によれば、他の要素へのリンク数が要素毎にばらつく場合にも各要素の注目度を適切に評価できる。
請求項4に記載の発明によれば、利用者はどの要素が注目されているのかを知ることができる。
請求項5に記載の発明によれば、利用者に重要度と注目度との双方を考慮して順位付けした結果を提供することができる。
請求項6に記載の発明によれば、重要度と注目度の基準に応じて表示する結果を切り替えることができる。
以下、本発明を実施するための好適な実施の形態(以下、実施形態という)を、図面に従って説明する。
図1には、本実施形態に係る情報分析システム1の構成図を示す。図1に示されるように、情報分析システム1は、データベース5と、データベース5にアクセスして得た情報を分析する情報分析装置10とを含む。
データベース5は、メモリや磁気ディスク等の記憶装置を含み構成され、複数のノード、及び複数のノード間に設定された有向リンクの関係の情報を含むネットワークデータを格納するものである。本実施形態においては、ノードを文書に、有向リンクの関係を文書間の引用関係に対応させた文書ネットワークを分析対象とする。例えば、文書Aが文書Bを引用する関係は、文書Aを始点とし文書Bを終点とする方向の有向リンクにより表すこととする。なお、データベース5には、ネットワークデータの全データが格納されていることとする。
また、図1に示されるように、情報分析装置10は、分析対象データ取得部12、データ記憶部14、種ノード設定部16、引用分析部18、注目度算出部20、及び結果表示部22を含む。上記の各部の機能は、CPU等の制御手段、メモリ等の記憶手段、外部デバイスとデータを送受信する入出力手段等を備えたコンピュータが、コンピュータ読み取り可能な情報記憶媒体に格納されたプログラムを読み込み実行することで実現されるものとしてよい。なお、プログラムは情報記憶媒体によってコンピュータたる情報分析装置10に供給されることとしてもよいし、インターネット等のデータ通信ネットワークを介して供給されることとしてもよい。
分析対象データ取得部12は、データベース5にアクセスして分析の対象とするデータ(以下、分析対象データ)を取得するものである。本実施形態では、分析対象データ取得部12は、データベース5に格納されたネットワークデータの中から指定した条件に基づいて一部のデータを分析対象として抽出して取得する。このデータの抽出の際には、例えば、ノードたる文書に付与された分野情報、日時情報、人物情報等の属性情報や、文書内容等が利用者により指定された条件と合致するものを抽出することとしてよい。
データ記憶部14は、半導体メモリ等の記憶素子を含み構成され、分析対象データを記憶する他、後述する分析処理の作業用メモリとしても用いられるものである。
種ノード設定部16は、分析対象データ取得部12により取得した分析対象データの中から種ノードを設定するものである。種ノードとは、利用者の指定に基づいて選択されるノードであり、例えば利用者が直接種ノードを指定してもよいし、利用者により指定された検索条件に合致するノードのうち予め定められた検索順位までのノードを種ノードとして設定することとしてもよい。例えば、特許文献をノードとすれば、利用者が調査を望む分野の特許文献のうち予め既知のものを種文書(種ノード)として設定することとしてよい。
引用分析部18は、データ記憶部14に記憶された分析対象のネットワークデータにおいて、種ノード設定部16により設定された種ノードとそれ以外のノードとに異なる初期データ値を付与してノード間に定められた有向のリンクに従ったデータ値の伝播処理を行い、各ノードのデータ値が収束するまで上記伝播処理を繰り返し行うものである。引用分析部18は、例えば種ノードのみに正の初期データ値を付与し、それ以外のノードの初期データ値は0とすることとしてもよい。
具体的には、ノードiを被引用文献、ノードjを引用文献とした場合に、被引用文献たるノードiのデータ値pは、以下の式(1)により求められる。
Figure 0005521319
ここで、Tijは、ノードiとノードjとの被引用関係を表す行列であり、例えばTijをノードiがノードjから引用される関係があれば「1」、なければ「0」として生成してもよいし、Tijを遷移確率行列として生成してもよい。なお、Tijを遷移確率行列として生成する場合には、ノードjが引用するノードの数をnとした場合にTijを、Tij=1/nとして求めることとしてよい。
引用分析部18では、初期状態では種ノードに正のデータ値を付与して、そのデータ値を(1)式に従って伝播させる計算を繰り返し実行した後の収束値を、各ノードのデータ値として得る。この収束値は各ノードの被引用のリンクに基づいて増加する値であり、データ値の高いノードから引用されるノードはデータ値が高くなる特性を有することから各ノードの重要度を示しているとされる。以下、収束した結果得られた各ノードのデータ値を重要度とする。
注目度算出部20は、引用分析部18による分析結果に基づいて得られた各ノードのデータ値に基づいて、各ノードの注目度を算出するものである。本実施形態では、ノードiの注目度qを以下の式(2)に基づいて算出する。
Figure 0005521319
なお、βはノードiが引用するノードの集合を表し、Sijはノードiとノードjとの引用関係を表す行列である。例えば、Sijをノードiがノードjを引用する関係があれば「1」、なければ「0」として生成することとしてもよいし、Sijを遷移確率行列として生成することとしてもよい。Sijを遷移確率行列として生成する場合には、ノードiが引用するノードの数をnとした場合に、Sij=1/nとなる。このようにSijを遷移確率行列として生成することで、ノードが引用するノードの数が多いだけで注目度が上がってしまうのを防いでいる。なお、注目度算出部20による各ノードの注目度の算出方法は、上記のものに限られない。以下に、ノードの注目度の算出方法の他の例を2つ例示する。
まず第1の例について説明する。注目度算出部20は、各ノードの注目度を、ノードが引用するノードのうち重要度が上位のM件(Mは予め定められた自然数)を用いて算出することとしてよい。この場合には、上記の式(2)において、βはノードiが引用するノードのうち重要度が上位のM件と置き換えることで、後は上述したものと同様に各ノードの注目度が算出される。
次に第2の例について説明する。引用分析部18において、計算の収束性のために各ノードの有向リンクを仮想的に双方向化してデータ値の更新を行うことがあるが、この場合には引用分析部18及び注目度算出部20はそれぞれノードiの重要度pと注目度qとを以下の式(3)及び式(4)により算出することとしてよい。
Figure 0005521319
Figure 0005521319
なお、rjは上記手法によりノードjが獲得した活性又は確率の値であり、Tij及びSijは上述したものと同様に生成することとしてよい。
結果表示部22は、注目度算出部20により算出された各ノードの注目度に基づいて各ノードを順位付けすると共に、当該順位づけに従って結果を表示するものである。例えば、結果表示部22は、算出された各ノードの注目度を順位付けに従って上位から順に並べたリストを表示することにより、種ノードにより表現された「話題」に対して注目されているノードを利用者に提示する。結果表示部22により生成される結果の例は上述したものに限られるものではない。以下に、結果表示部22により生成される結果の他の例を2つ例示する。
まず第1の例について説明する。結果表示部22は、ノード毎に算出された重要度と注目度との双方を組み合わせた評価値を算出し、算出された評価値に基づいて順位付けした結果を表示することとしてよい。例えば、結果表示部22は、ノードiの重要度p、注目度qとした場合に、評価値VをV=γp+(1−γ)qとして算出することとしてよい。ここで、γ(0≦γ≦1)は重みづけを表すパラメータであり、γの値を調整することにより評価値の算出において重要度と注目度の寄与する割合を調整することとしてよい。そして、結果表示部22は、上記算出された評価値に基づいて各ノードを順位付けした結果を表示することとしてよい。
次に第2の例について説明する。結果表示部22は、ノード毎に算出された重要度に基づいた第1の順位付け結果と、ノード毎に算出された注目度に基づいた第2の順位付け結果とを生成し、利用者の指定に基づいて第1の順位付け結果と第2の順位付け結果とを相互に切り替えて表示することとしてよい。
次に、図2に示された注目度算出処理のフローチャートを参照しながら、情報分析装置10により行われる注目度算出処理の詳細について説明する。
図2に示されるように、情報分析装置10は、ネットワークデータを格納したデータベース5にアクセスして(S101)、利用者が要望する分野の文書を取得し(S102)、取得した文書について文書間に定められた引用関係に基づいて生成した分析対象のネットワークデータを記憶する(S103)。
次に、情報分析装置10は、例えば利用者により入力された検索文字列を含む文書を検索してこれを種文書に設定し(S104)、分析対象のネットワークデータにおいて上記設定した種文書に正の初期データ値を付与して引用分析処理を行う(S105)。
情報分析装置10は、引用分析処理が行われた後に、分析対象のノード毎に当該ノードが引用するノードについて上記引用分析処理により算出された重要度を加算して注目度を算出する(S106)。そして、情報分析装置10は、算出された各ノードの注目度に応じて各ノードを順位付けすると共に(S107)、当該順位づけの結果に従ってノードを順に並べたリストを表示して(S108)、処理を終了する。
本発明は、上記の実施形態に限定されるものではない。例えば、引用分析部18においては、線形活性伝播法、連続アトラクター力学に基づく方法、パーソナライズされたPageRankアルゴリズム等の手法を用いることとしてよい。
また、上記の実施形態では、文書をノード、文書間の引用関係を有向リンクとしたネットワークデータの分析に本発明を適用した例を示したが、本発明はノードが有向リンクにより接続されるその他多様なネットワークデータの分析にも適用してよいのはもちろんである。
本実施形態に係る情報分析システムの機能ブロック図である。 注目度算出処理のフローチャートである。
符号の説明
1 情報分析システム、5 データベース、10 情報分析装置、12 分析対象データ取得部、14 データ記憶部、16 種ノード設定部、18 引用分析部、20 注目度算出部、22 結果表示部。

Claims (7)

  1. 複数の要素と、当該複数の要素間に定められた有向の接続関係との情報を含む分析対象情報を取得する取得手段と、
    前記取得手段により取得された分析対象情報に含まれる各要素に値を付与すると共に、当該付与した値を当該要を終点とする有向の接続関係にある他の要素に付与された前記値に基づいて更新する処理を予め定められた条件を満足するまで繰り返し実行する処理実行手段と、
    前記処理実行手段により前記各要素に付与された値を確定した後に、前記分析対象情報に含まれる要素毎の注目度を、当該要素を始点とする有向の接続関係にある他の要素に付与された確定した値に基づいて算出する算出手段と、を含む
    ことを特徴とする情報分析装置。
  2. 前記処理実行手段は、前記取得手段により取得された分析対象情報に含まれる要素の中から予め指定された条件に従って選択された要素群に基づいて初期状態を設定する
    ことを特徴とする請求項1に記載の情報分析装置。
  3. 前記算出手段は、前記分析対象情報に含まれる要素毎の注目度を、当該要素を始点とする有向の接続関係にある他の要素の中から重要度の大きさに基づいて選択された要素について当該要素に付与された確定した値に基づいて算出する
    ことを特徴とする請求項1又は2に記載の情報分析装置。
  4. 前記分析対象情報に含まれる各要素を前記算出手段により算出された注目度に基づいて順位付けすると共に、当該順位付けに基づく結果を表示する結果表示手段をさらに含む
    ことを特徴とする請求項1乃至3のいずれかに記載の情報分析装置。
  5. 前記結果表示手段は、前記分析対象情報に含まれる要素毎に、前記処理実行手段により付与された確定した値と、前記算出手段により算出された注目度とに基づいて順位付けする
    ことを特徴とする請求項4に記載の情報分析装置。
  6. 前記結果表示手段は、前記分析対象情報に含まれる要素毎に、前記処理実行手段により付与された確定した値に基づいて順位付けした結果と、前記算出手段により算出された注目度に基づいて順位付けした結果とを切り替えて表示する
    ことを特徴とする請求項4に記載の情報分析装置。
  7. 複数の要素と、当該複数の要素間に定められた有向の接続関係との情報を含む分析対象情報を取得する取得手段と、
    前記取得手段により取得された分析対象情報に含まれる各要素に値を付与すると共に、当該付与した値を当該要を終点とする有向の接続関係にある他の要素に付与された前記値に基づいて更新する処理を予め定められた条件を満足するまで繰り返し実行する処理実行手段と、
    前記処理実行手段により前記各要素に付与された値を確定した後に、前記分析対象情報に含まれる要素毎の注目度を、当該要素を始点とする有向の接続関係にある他の要素に付与された確定した値に基づいて算出する算出手段としてコンピュータを機能させることを特徴とするプログラム。
JP2008313497A 2008-12-09 2008-12-09 情報分析装置及びプログラム Expired - Fee Related JP5521319B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008313497A JP5521319B2 (ja) 2008-12-09 2008-12-09 情報分析装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008313497A JP5521319B2 (ja) 2008-12-09 2008-12-09 情報分析装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2010140096A JP2010140096A (ja) 2010-06-24
JP5521319B2 true JP5521319B2 (ja) 2014-06-11

Family

ID=42350215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008313497A Expired - Fee Related JP5521319B2 (ja) 2008-12-09 2008-12-09 情報分析装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5521319B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167920A (ja) * 2001-11-30 2003-06-13 Fujitsu Ltd ニーズ情報構築方法、ニーズ情報構築装置、ニーズ情報構築プログラム及びこれを記録した記録媒体
JP3864235B2 (ja) * 2002-05-24 2006-12-27 株式会社 日立東日本ソリューションズ 情報検索システムおよび情報検索プログラム
JP2007241459A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd ドキュメントデータ分析装置
JP2008217637A (ja) * 2007-03-07 2008-09-18 Fuji Xerox Co Ltd 情報分析装置及びプログラム

Also Published As

Publication number Publication date
JP2010140096A (ja) 2010-06-24

Similar Documents

Publication Publication Date Title
US8813102B2 (en) Method and apparatus for generating mashup graph, and method and apparatus for recommending mashup service
US8166047B1 (en) Systems, devices, and/or methods for managing data
Kim et al. Latent multi-group membership graph model
US20040236709A1 (en) System and method for representing and incorporating available information into uncertainty-based forecasts
JP2005317018A (ja) 表示ページ内のブロックの重要度を計算するための方法およびシステム
JP6400178B2 (ja) 検索推薦方法及び装置
JP2013149140A (ja) 情報処理装置、及び、情報処理方法
JP2016177359A (ja) 検索装置及びプログラム
JP6685985B2 (ja) 分類支援装置、分類支援方法、および分類支援プログラム
US20190362240A1 (en) Information processing device, neural network design method, and recording medium
JP2007102647A (ja) アンケート作成方法及びシステム
JP5521319B2 (ja) 情報分析装置及びプログラム
CN111552549A (zh) 一种智能设备的多任务请求动态配置方法及系统
JP5375065B2 (ja) 情報分析装置及びプログラム
JP6831719B2 (ja) 情報処理システム、情報処理方法、およびプログラム
CN109684466B (zh) 一种智能教育顾问系统
JP6305473B2 (ja) 分類支援装置、分類支援方法、および分類支援プログラム
JP5545063B2 (ja) プログラム及び情報分析装置
JP4543687B2 (ja) データ分析装置
JP7062327B1 (ja) 行動支援システム、行動支援方法及び行動支援プログラム
CN109102415A (zh) 数据处理方法及系统
WO2024095397A1 (ja) 目標最適化装置、方法およびプログラム
CN111797197B (zh) 舆情分析的方法及装置
JP6253041B1 (ja) ウェブページ解析装置、ウェブページ解析方法、及びプログラム
WO2023171656A1 (ja) 行動支援システム、行動支援方法及び行動支援プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140324

R150 Certificate of patent or registration of utility model

Ref document number: 5521319

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees