JP6111938B2 - 情報処理プログラム及び情報処理装置 - Google Patents

情報処理プログラム及び情報処理装置 Download PDF

Info

Publication number
JP6111938B2
JP6111938B2 JP2013177964A JP2013177964A JP6111938B2 JP 6111938 B2 JP6111938 B2 JP 6111938B2 JP 2013177964 A JP2013177964 A JP 2013177964A JP 2013177964 A JP2013177964 A JP 2013177964A JP 6111938 B2 JP6111938 B2 JP 6111938B2
Authority
JP
Japan
Prior art keywords
community
information
user
users
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013177964A
Other languages
English (en)
Other versions
JP2015046102A (ja
Inventor
シャオジュン 馬
シャオジュン 馬
幸寛 坪下
幸寛 坪下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2013177964A priority Critical patent/JP6111938B2/ja
Publication of JP2015046102A publication Critical patent/JP2015046102A/ja
Application granted granted Critical
Publication of JP6111938B2 publication Critical patent/JP6111938B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理プログラム及び情報処理装置に関する。
従来の技術として、組織における電子メール通信記録から特定の事項について重要な役割を果たす人材を特定する情報処理装置が提案されている(例えば、特許文献1参照)。
特許文献1に開示された情報処理装置は、電子メールのシステムに蓄積された送受信履歴、メール本文の内容、添付文書の内容等の通信記録(以下、「ログ」という。)から情報流通の構造や効率を分析し、個人間の関係データを抽出し、情報流通経路の境界を超える情報展開の回数又は頻度が所定値を超える送受信の組を特定の事項について重要な役割を果たす人材(以下、「キーパーソン」という。)の候補として特定する。情報流通経路の境界の設定は、予め設定されるものであって、部門や拠点などの組織情報が用いられる。
特開2006−259914号公報
本発明の目的は、文書情報の操作履歴から、文書情報を操作した利用者間の関連性と、共通の関連性を有する利用者の集合とを抽出する情報処理プログラム及び情報処理装置を提供することにある。
本発明の一態様は、上記目的を達成するため、以下の情報処理プログラム及び情報処理装置を提供する。
[1]コンピュータを、
文書情報に対する利用者の操作履歴情報を取得する取得手段と、
前記利用者をノードとし、同一の文書情報を操作した利用者間に関連性があるとしてリンクを張って、当該ノード及び当該リンクから構成されるネットワーク構造を生成する生成手段と、
前記ネットワーク構造から前記リンクの生成確率に基づく確率モデルを用いて共通の関連性の境界を判別し、当該境界内の利用者の集合を共通の関連性を有するコミュニティとして抽出する抽出手段と
前記確率モデルを用いて、前記コミュニティにおける前記利用者の確率分布に基づき、前記コミュニティにおける前記利用者のネットワーク指標の期待値を算出する算出手段と、
前記コミュニティに所属する利用者が操作した文書情報の集合から単語を抽出して、抽出した単語からタグ情報を生成するタグ生成手段と、
人材を検索するためのキーワードを受け付ける受付手段と、
前記キーワードを前記タグ情報の単語に持つコミュニティを特定するコミュニティ特定手段と、
前記特定されたコミュニティにおいて前記ネットワーク指標の期待値が高い利用者を特定する人材特定手段と、
前記特定された人材を前記キーワードの送信元に表示処理する表示処理手段として機能させるための情報処理プログラム。
]表示要求を受け付けたとき、前記ネットワーク構造及び前記利用者のネットワーク指標の期待値の少なくとも1つを前記表示要求元に表示処理する表示処理手段としてさらに機能させる[]に記載の情報処理プログラム。
]文書情報に対する利用者の操作履歴情報を取得する取得手段と、
前記利用者をノードとし、同一の文書情報を操作した利用者間に関連性があるとしてリンクを張って、当該ノード及び当該リンクから構成されるネットワーク構造を生成する生成手段と、
前記ネットワーク構造から前記リンクの生成確率に基づく確率モデルを用いて共通の関連性の境界を判別し、当該境界内の利用者の集合を共通の関連性を有するコミュニティとして抽出する抽出手段と
前記確率モデルを用いて、前記コミュニティにおける前記利用者の確率分布に基づき、前記コミュニティにおける前記利用者のネットワーク指標の期待値を算出する算出手段と、
前記コミュニティに所属する利用者が操作した文書情報の集合から単語を抽出して、抽出した単語からタグ情報を生成するタグ生成手段と、
人材を検索するためのキーワードを受け付ける受付手段と、
前記キーワードを前記タグ情報の単語に持つコミュニティを特定するコミュニティ特定手段と、
前記特定されたコミュニティにおいて前記ネットワーク指標の期待値が高い利用者を特定する人材特定手段と、
前記特定された人材を前記キーワードの送信元に表示処理する表示処理手段とを有する情報処理装置。
請求項1又はに係る発明によれば、文書情報の操作履歴から、文書情報を操作した利用者間の関連性と、共通の関連性を有する利用者の集合とを抽出する情報処理プログラム及び情報処理装置を提供することができるとともに、コミュニティにおける利用者に関する指標を算出し、受け付けたキーワードに関連するコミュニティの人材であって、キーパーソンとなりうる人材をキーワード送信元に表示することができる。
請求項に係る発明によれば、ネットワーク構造、利用者の確率分布及び利用者のリンク数の期待値の少なくとも1つを表示要求元に表示処理することができる。
図1は、実施の形態に係る情報処理システムの構成の一例を示す概略図である。 図2は、実施の形態に係る情報処理装置の構成例を示すブロック図である。 図3は、文書DBのログ情報の内容の一例を示す概略図である。 図4は、情報処理装置のネットワーク情報の内容の一例を示す概略図である。 図5は、情報処理装置のコミュニティ情報の内容の一例を示す概略図である。 図6は、情報処理装置の利用者指標情報の内容の一例を示す概略図である。 図7は、情報処理装置のコミュニティタグ情報の内容の一例を示す概略図である。 図8(a)−(f)は、情報処理装置の動作を説明するための概略図である。 図9は、LDAモデルの概念を説明するための概略図である。 図10は、情報処理装置の表示処理手段の表示内容の一例を示す概略図である。 図11は、情報処理装置の表示処理手段の表示内容の他の例を示す概略図である。 図12は、情報処理装置の解析動作の一例を示すフローチャートである。 図13は、情報処理装置の検索動作の一例を示すフローチャートである。
[実施の形態]
(情報処理システムの構成)
図1は、実施の形態に係る情報処理システムの構成の一例を示す概略図である。
この情報処理システム5は、情報処理装置1と、文書データベース(DB)2と、端末3、3、3、3…とをネットワーク4によって互いに通信可能に接続することで構成される。端末3、3、3、3…は、それぞれ管理者U000、利用者U001、U002、U003…によって操作される。
情報処理装置1は、サーバ型の情報処理装置であり、端末3、3、3、3…の要求に応じて動作するものであって、本体内に情報を処理するための機能を有するCPU(Central Processing Unit)やフラッシュメモリ等の電子部品を備える。
文書DB2は、文書情報200を格納するデータベースであり、当該文書情報200に対する操作履歴を示すログ情報201(操作履歴情報)を格納する。ここで、文書情報200は、例えば、企画書、技術文書等の文書である。
端末3、3、3、3…は、PC(Personal Computer)等の情報処理装置であって、本体内に情報を処理するための機能を有するCPUやフラッシュメモリ等の電子部品を備える。
ネットワーク4は、高速通信が可能な通信ネットワークであり、例えば、イントラネットやLAN(Local Area Network)等の私設の有線又は無線の通信網である。
情報処理装置1は、一例として、端末3、3、3…の要求に応じて後述する文書DB2の文書情報200の書き込み(アップロード)、読み出し(ダウンロード又はオープン)、コピー、削除等の操作を行うとともに、当該操作履歴をログ情報201として文書DB2に保存する。なお、当該操作は、他のサーバに実行させるものであってもよい。
また、情報処理装置1は、他の例として、ログ情報201に基づいて端末3の要求に応じて利用者U001、U002、U003…の関係図(後述する「ネットワーク構造」)を作成して、端末3の表示部に表示したり、利用者U001、U002、U003…の中から端末3において入力されたキーワードに対応する人材を特定して、端末3の表示部に表示したりする。詳しくは後述する。
なお、利用者U001、U002、U003…は、会社等の組織に所属する会社員等であり、職務の実行のために端末3、3、3…を利用して文書DB2の文書情報200にアクセスするものである。
(情報処理装置の構成)
図2は、実施の形態に係る情報処理装置1の構成例を示すブロック図である。
情報処理装置1は、CPU等から構成され、各部を制御するとともに、各種のプログラムを実行する制御部10と、フラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11と、ネットワークを介して外部と通信する通信部12とを備える。
制御部10は、後述する情報処理プログラム110を実行することで、ログ取得手段100、ネットワーク生成手段101、コミュニティ抽出手段102、利用者指標算出手段103、コミュニティタグ生成手段104、キーワード受付手段105、コミュニティ特定手段106、人材特定手段107及び表示処理手段108等として機能する。
ログ取得手段100は、文書DB2からログ情報201を取得する。ただし、ほぼすべての利用者がアクセスする文書情報200からは、利用者同士の関連性が抽出しづらいため、ログ取得手段100は、アクセスした利用者数が予め定めた閾値(例えば、80%)以下の文書情報200のログ情報201のみを取得することでログ情報201のフィルタリングを行う。
ネットワーク生成手段101は、ログ取得手段100が取得したログ情報201に基づいて、利用者を節点(以下、「ノード」という。)とし、利用者間に関連性があるかを判断して、関連性がある場合はノード間に繋がり(以下、「リンク」という。)を生成して、利用者間のリンクの構造(以下、「ネットワーク構造」という。)を生成する。ネットワーク生成手段101は、具体的に、同一文書情報に対して予め定めた回数以上の操作履歴を有する利用者同士に関連性があると判断してリンクを張って、ネットワーク構造を生成する。生成されたネットワーク構造は、ネットワーク情報111として記憶部11に記憶される。
コミュニティ抽出手段102は、ネットワーク情報111のネットワーク構造から、共通する関連性の境界を自動的に判別し、共通の関連性を有する複数の利用者の集合(以下、「コミュニティ」という。)を抽出する。コミュニティ抽出手段102は、ネットワーク構造のリンクの生成確率に基づく確率モデルを導入して、境界の判別及びコミュニティの抽出を行う。確率モデルとしては、LDA(Latent Dirichlet Allocation)、GMM(Gaussian Mixture Model)等のモデルを用いる。抽出されたコミュニティに関する情報はコミュニティ情報112として記憶部11に記憶される。
コミュニティ抽出の具体的な例として、リンクのbetweennessを用いるものがある。リンクの「betweenness」とは、あるリンクについて、すべてのノードのペアについての最短経路がそのリンクを通る回数により定義される(最短路数)。密接に結びついているノード同士は、直接リンクで結ばれているためbetweennessは小さくなり、逆に結びつきが弱いリンクでは、そこを通ることが複数のノード間の経路の近道になっていることが多いため、betweennessは大きくなる。そこで、betweennessが大きな辺から除いていくことで、ノードとリンクの組み合わせがいくつかの成分に分かれ、これらをコミュニティとみなすことでコミュニティが抽出できる。
利用者指標算出手段103は、コミュニティにおける利用者の指標としてコミュニティに対する所属度と、コミュニティへの影響度を算出する。所属度は、コミュニティにおける利用者の確率分布であり、曖昧な境界を有するコミュニティにおいて利用者が複数のコミュニティに所属することを反映するものである。また、影響度は、コミュニティにおける利用者の確率分布に基づき算出される、ネットワーク指標の期待値である。
ここで、ネットワーク指標としては、次の(1)、(2)、(3)等が挙げられる。
(1)あるコミュニティにおける利用者のリンク(degree)の数の期待値
(2)あるコミュニティにおける最短路数(betweenness)の期待値
(3)あるコミュニティにおける最短距離(closeness)の期待値
なお、ここで「closeness」とは、任意のノードからノードへの最短経路の長さの平均値である。
利用者指標算出手段103により算出された所属度、影響度等の指標は、利用者指標情報113として記憶部11に記憶される。
コミュニティタグ生成手段104は、コミュニティ抽出手段102によって抽出されたコミュニティに、コミュニティを特定する情報(以下、「タグ」という。)を生成する。コミュニティタグ生成手段104は、一例として、コミュニティに所属する利用者がアクセスしたすべての文書情報200を集合文書情報とし、集合文書情報から構成されるコーパスにおいて単語抽出処理を行い、tf−idf(term frequency−inverse document frequency)の高い単語をタグとする。生成されたタグは、コミュニティタグ情報114として記憶部11に記憶される。
キーワード受付手段105は、端末3から送信されるキーワードを受け付ける。キーワードは、適切な人材を検索するためのキーワードである。
コミュニティ特定手段106は、キーワード受付手段105が受け付けたキーワードをタグに持つコミュニティをコミュニティタグ情報114から特定する。
人材特定手段107は、利用者指標情報113を参照し、コミュニティ特定手段106が特定したコミュニティにおいて影響度の高い利用者をキーパーソンとして特定する。
表示処理手段108は、人材特定手段107が特定したキーパーソンや、当該キーパーソンが所属するコミュニティや、当該コミュニティに所属する利用者等に関する情報を、キーワードの送信元である端末3の表示部に表示する。また、表示処理手段108は、ネットワーク生成手段101が生成したネットワーク構造を可視化して表示してもよいし、利用者指標算出手段103が算出した指標を表形式等により表示してもよい。
記憶部11は、制御部10を上述した各手段101−108として動作させる情報処理プログラム110、ネットワーク情報111、コミュニティ情報112、利用者指標情報113及びコミュニティタグ情報114等を記憶する。
図3は、文書DB2のログ情報201の内容の一例を示す概略図である。
ログ情報201aは、文書情報200に対するアクセスの内容を示す情報であり、アクセスされた時刻と、アクセスした利用者と、アクセスされた文書情報と、アクセス時の操作内容とを有する。
(情報処理装置の動作)
次に、本実施の形態の作用を、(1)基本動作、(2)解析動作、(3)検索動作、(4)表示動作に分けて説明する。
(1)基本動作
利用者U001、U002、U003…は、端末3、3、3…を用いて文書DB2の文書情報200にアクセスする。
情報処理装置1は、端末3、3、3…の要求に応じて後述する文書DB2の文書情報200の書き込み(アップロード)、読み出し(ダウンロード又はオープン)、コピー、削除等の操作を行うとともに、当該操作履歴をログ情報201として文書DB2に保存する。
管理者U000は、端末3を用いて情報処理装置1にアクセスし、文書DB2のログ情報201の解析を要求する。
情報処理装置1は、端末3から要求を受け付けて以下に説明する「(2)解析動作」を実行する。
(2)解析動作
図12は、情報処理装置1の解析動作の一例を示すフローチャートである。
まず、情報処理装置1のログ取得手段100は、文書DB2から図3に示すログ情報201を取得する(S1)。
次に、ログ取得手段100は、文書DB2から取得したログ情報201のうち、アクセスした利用者数が予め定めた閾値(例えば、80%)以下の文書情報200のログ情報201のみを取得することでログ情報201のフィルタリングを行う(S2)。
次に、ネットワーク生成手段101は、フィルタリングされたログ情報201に基づいて、利用者をノードとし、利用者間にリンクが張れるかを判断して、ネットワーク構造を生成する(S3)。ネットワーク生成手段101は、具体的に、同一文書情報に対して予め定めた回数以上の操作履歴を有する利用者同士に関連性があると判断してリンクを張って、以下に示すネットワーク構造111aを生成する。
図4は、情報処理装置1のネットワーク情報111の内容の一例を示す概略図である。
図4に示すように、ネットワーク構造111aは、ネットワーク情報111に含まれるネットワーク構造の一例であって、各利用者U001−U009を示すノードn、n、n、n…と、関連性のある各ノード間に実線で示されるリンクL12、L13、L14…とを有する。図3のログ情報201aに示すように、例えば、利用者U001、U002、U004は同一の文書情報docxxx001に操作履歴を有するため、図4に示すように、リンクL12、L14、L24が張られ、利用者U008、U009は同一の文書情報docxxx011に操作履歴を有するため、リンクL89が貼られる。他のリンクについても同様に他の同一の文書情報に操作履歴を有するために貼られているものである。
次に、コミュニティ抽出手段102は、ネットワーク構造111aのリンクの生成確率に基づく確率モデルを導入して解析し(S4)、ネットワーク構造111aから、共通の関連性の境界を自動的に判別し、共通の関連性を有する複数の利用者が含まれるコミュニティを抽出する(S5)。なお、確率モデルによる解析(ステップS4−S6の動作)については、「(2−1)解析動作の詳細」において詳細に説明する。
図5は、情報処理装置1のコミュニティ情報112の内容の一例を示す概略図である。
コミュニティ情報112は、ネットワーク構造111a上に設けられた境界112a−112aを有し、それぞれコミュニティ1−3を表すものである。図5に示すように、例えば、ノードn(利用者U004)は、「コミュニティ1」及び「コミュニティ2」の両方に属する。
次に、利用者指標算出手段103は、コミュニティ1−3における利用者U001−U009の指標として各コミュニティに対する所属度と、各コミュニティへの影響度を算出する(S8)。ここで、「所属度」とは、各コミュニティに利用者が所属している度合を示す指標である。また、「影響度」とは、利用者が各コミュニティに対して有する影響力を示す指標である。
図6は、情報処理装置1の利用者指標情報113の内容の一例を示す概略図である。
利用者指標情報113aは、利用者指標情報113の一例として各コミュニティ1−3に対する各利用者U001−U009の影響度を示している。なお、所属していないコミュニティに対する影響度は「0.00」となっている。また、所属度については後述する。
次に、コミュニティタグ生成手段104は、コミュニティ1−3のぞれぞれに所属する利用者がアクセスしたすべての文書情報200を集合文書情報とし、集合文書情報から構成されるコーパスにおいて単語抽出処理を行い、tf−idfの高い単語をタグとして、コミュニティタグ情報114を生成する(S7)。
図7は、情報処理装置1のコミュニティタグ情報114の内容の一例を示す概略図である。
コミュニティタグ情報114aは、コミュニティタグ情報114の一例であり、各コミュニティ1−3の集合文書情報から抽出された単語がタグとして記載される。
(2−1)解析動作の詳細
コミュニティ抽出手段102は、ステップS4−S6において、ネットワーク構造111aのリンクの生成確率に基づく確率モデルを導入して解析するが、説明のため一例として確率モデルにLDAを用いた場合について説明する。LDAは一例として以下に説明するような場合に用いられる。
図8(a)−(f)は、情報処理装置1の動作を説明するための概略図である。
図8(a)に示すように、文書情報Aが単語a、単語b、単語c、単語dを用いた文章で構成されるものである場合、図8(b)に示すように、あるトピックIに用いられる頻度の高い単語が単語a、単語b、単語cであれば、図8(c)に示すように文書情報AはトピックIに属すると推定される。つまり、「秋場所全勝なら、稀勢の里の綱取り継続する」という文書情報Aがあった場合に、「相撲」というトピックIに用いられる頻度の高い単語が「秋場所」、「稀勢の里」、「綱取り」であれば、文書情報Aは相撲に関するものであると推定される。
上記の「文書情報A」を「利用者A」に置き換え、「単語a」−「単語d」を「利用者a」−「利用者d」に置き換え、「トピックI」を「コミュニティI」と置き換えると以下のようになる。つまり、図8(d)に示すように、利用者Aが利用者a、利用者b、利用者c、利用者dとリンクが張られているものである場合、図8(e)に示すように、あるコミュニティIに所属する頻度の高い利用者が利用者a、利用者b、利用者cであれば、図8(f)に示すように利用者AはコミュニティIに属すると推定される。
以下に、具体的なLDAモデルの概念、確率モデルの生成過程及び利用者指標の算出方法を説明する。
図9は、LDAモデルの概念を説明するための概略図である。
図9においてωは、観察データであってネットワーク構造111aにおける利用者のそれぞれの間のリンクの有無を表す行列である。また、α及びβはハイパーパラメータであり、例えば、管理者U000が設定する。
N人の利用者の間にM本のリンクを生成する確率モデルの生成過程は、コミュニティをKとした場合に以下のようになる。
(A)Chooseφk〜Dirchlet(β)
(B)Chooseθi〜Dirchlet(α)
(C)Choose Mi〜Poisson(ε)
(D)For each of the Mi social interactions ωi,j
(a)Choose a community Zi,j〜Multinominal(θi)
(b)Choose a social interaction ωi,j from p(ωi,j/Zi,j,φ)〜Multinominal(φZi,j)
上記したLDAのモデルにEMアルゴリズムやGibbs Sampling等の手法を用いてコミュニティ推定を行い、コミュニティを抽出する。
つまり、ネットワーク構造111aから、境界を自動的に判別し、共通の関連性を有する複数の利用者が含まれるコミュニティΖを抽出する。なお、φは影響度を示し、θは所属度を示す。
ここで、影響度は、コミュニティにおける利用者の確率分布に基づき算出されるが、例えば、影響度として、あるコミュニティKにおける、ある利用者と他のN−1人の利用者の間のリンク総数(degree)の期待値を用いた場合、当該影響度は、コミュニティK内における、ある利用者と他の利用者N−1人の間におけるリンクの生成率を全て足し合わせることにより算出する。すなわち、影響度とは、各利用者のそれぞれのコミュニティKに対する関係性を反映する指標となる。
(3)検索動作
管理者U000は、例えば、「LCD」等のキーワードを端末3に入力し、「LCD」に詳しい人材(キーパーソン)を検索するよう要求する。
端末3は、当該キーワード「LCD」と検索要求とを情報処理装置1に送信する。情報処理装置1は、検索要求に基づいて当該キーワードに詳しい人材を検索する。
図13は、情報処理装置1の検索動作の一例を示すフローチャートである。
まず、キーワード受付手段105は、端末3から送信されるキーワード「LCD」を受け付ける(S10)。
次に、コミュニティ特定手段106は、キーワード受付手段105が受け付けたキーワード「LCD」をタグに持つコミュニティをコミュニティタグ情報114から特定する(S11)。
次に、人材特定手段107は、利用者指標情報113を参照し、コミュニティ特定手段106が特定したコミュニティにおいて影響度の高い利用者をキーワード「LCD」に詳しい人材(キーパーソン)として特定する(S12)。
表示処理手段108は、人材特定手段107が特定した人材の利用者名、当該人材が所属するコミュニティ名、当該コミュニティに所属する利用者等に関する情報を、キーワード「LCD」の送信元である端末3の表示部に表示する。
(4)表示動作
また、管理者U000は、例えば、利用者U001、U002、U003…の組織が予め定められた組織図どおりに機能しているかを確認するため、利用者の指標やネットワーク構造を表示するよう端末3に要求する。つまり、管理者U000は、組織図と利用者の指標とを比較して、実際のリーダーの影響度が小さい場合はリーダーを他の利用者に変更したり、組織図とネットワーク構造とを比較して、異なる部分について組織を再編する等の管理を行ったりする。
端末3は、利用者の指標やネットワーク構造を表示するよう情報処理装置1に要求する。
情報処理装置1の表示処理手段108は、端末3から要求を受け付けると以下に示す利用者指標情報113やネットワーク情報111を端末3の表示部に表示処理する。
図10は、情報処理装置1の表示処理手段108によって表示部に表示される表示内容の一例を示す概略図である。
表示内容108aは、利用者指標情報113に基づいて表示されるものであり、「コミュニティ1」に所属する利用者U001−U004の所属度及び影響度を表形式で表示したものである。
図11は、情報処理装置1の表示処理手段108によって表示部に表示される表示内容の他の例を示す概略図である。
表示内容108bは、ネットワーク情報111及び利用者指標情報113に基づいて表示されるものであり、各利用者のネットワーク構造を表示するとともに、所属度をノードの色の濃淡で表し、影響度をノードの大きさで表したものである。つまり、影響度が他の利用者に比べて高い利用者U004はノードが大きく表され、同時に所属度が他の利用者に比べて低いため色の濃度が淡く表されている。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。
上記実施の形態では制御部10の各手段100〜108の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD−ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
1 情報処理装置
2 文書DB
‐3 端末
4 ネットワーク
5 情報処理システム
10 制御部
11 記憶部
12 通信部
100 ログ取得手段
101 ネットワーク生成手段
102 コミュニティ抽出手段
103 利用者指標算出手段
104 コミュニティタグ生成手段
105 キーワード受付手段
106 コミュニティ特定手段
107 人材特定手段
108 表示処理手段
110 情報処理プログラム
111 ネットワーク情報
111a ネットワーク構造
112 コミュニティ情報
112a‐112a境界
113 利用者指標情報
113a 利用者指標情報
114 コミュニティタグ情報
114a コミュニティタグ情報
200 文書情報
201 ログ情報

Claims (3)

  1. コンピュータを、
    文書情報に対する利用者の操作履歴情報を取得する取得手段と、
    前記利用者をノードとし、同一の文書情報を操作した利用者間に関連性があるとしてリンクを張って、当該ノード及び当該リンクから構成されるネットワーク構造を生成する生成手段と、
    前記ネットワーク構造から前記リンクの生成確率に基づく確率モデルを用いて共通の関連性の境界を判別し、当該境界内の利用者の集合を共通の関連性を有するコミュニティとして抽出する抽出手段と
    前記確率モデルを用いて、前記コミュニティにおける前記利用者の確率分布に基づき、前記コミュニティにおける前記利用者のネットワーク指標の期待値を算出する算出手段と、
    前記コミュニティに所属する利用者が操作した文書情報の集合から単語を抽出して、抽出した単語からタグ情報を生成するタグ生成手段と、
    人材を検索するためのキーワードを受け付ける受付手段と、
    前記キーワードを前記タグ情報の単語に持つコミュニティを特定するコミュニティ特定手段と、
    前記特定されたコミュニティにおいて前記ネットワーク指標の期待値が高い利用者を特定する人材特定手段と、
    前記特定された人材を前記キーワードの送信元に表示処理する表示処理手段として機能させるための情報処理プログラム。
  2. 表示要求を受け付けたとき、前記ネットワーク構造及び前記利用者のネットワーク指標の期待値の少なくとも1つを前記表示要求元に表示処理する表示処理手段としてさらに機能させる請求項に記載の情報処理プログラム。
  3. 文書情報に対する利用者の操作履歴情報を取得する取得手段と、
    前記利用者をノードとし、同一の文書情報を操作した利用者間に関連性があるとしてリンクを張って、当該ノード及び当該リンクから構成されるネットワーク構造を生成する生成手段と、
    前記ネットワーク構造から前記リンクの生成確率に基づく確率モデルを用いて共通の関連性の境界を判別し、当該境界内の利用者の集合を共通の関連性を有するコミュニティとして抽出する抽出手段と
    前記確率モデルを用いて、前記コミュニティにおける前記利用者の確率分布に基づき、前記コミュニティにおける前記利用者のネットワーク指標の期待値を算出する算出手段と、
    前記コミュニティに所属する利用者が操作した文書情報の集合から単語を抽出して、抽出した単語からタグ情報を生成するタグ生成手段と、
    人材を検索するためのキーワードを受け付ける受付手段と、
    前記キーワードを前記タグ情報の単語に持つコミュニティを特定するコミュニティ特定手段と、
    前記特定されたコミュニティにおいて前記ネットワーク指標の期待値が高い利用者を特定する人材特定手段と、
    前記特定された人材を前記キーワードの送信元に表示処理する表示処理手段とを有する情報処理装置。
JP2013177964A 2013-08-29 2013-08-29 情報処理プログラム及び情報処理装置 Expired - Fee Related JP6111938B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013177964A JP6111938B2 (ja) 2013-08-29 2013-08-29 情報処理プログラム及び情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013177964A JP6111938B2 (ja) 2013-08-29 2013-08-29 情報処理プログラム及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2015046102A JP2015046102A (ja) 2015-03-12
JP6111938B2 true JP6111938B2 (ja) 2017-04-12

Family

ID=52671527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013177964A Expired - Fee Related JP6111938B2 (ja) 2013-08-29 2013-08-29 情報処理プログラム及び情報処理装置

Country Status (1)

Country Link
JP (1) JP6111938B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ548804A (en) * 2003-12-31 2008-11-28 Thomson Global Resources Systems, methods, interfaces and software for automated collection and integration of entity data into online databases and professional directories
JP4953428B2 (ja) * 2006-09-05 2012-06-13 ヤフー株式会社 コミュニティへの関連情報提供システム
JP2009146253A (ja) * 2007-12-17 2009-07-02 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP2010039605A (ja) * 2008-08-01 2010-02-18 Ricoh Co Ltd 個人検索システム、個人検索方法、プログラムおよび記録媒体
JP5499333B2 (ja) * 2011-06-15 2014-05-21 日本電信電話株式会社 情報推薦装置、情報推薦方法及び情報推薦プログラム
JP5734118B2 (ja) * 2011-07-01 2015-06-10 Kddi株式会社 ソーシャルネットワークから小集団を抽出し、名前付け、並びに可視化する方法およびプログラム

Also Published As

Publication number Publication date
JP2015046102A (ja) 2015-03-12

Similar Documents

Publication Publication Date Title
JP7411651B2 (ja) コンテンツアイテム推奨をランク付けするための技術
US11423056B2 (en) Content discovery systems and methods
Shen et al. Linking named entities in tweets with knowledge base via user interest modeling
US10535106B2 (en) Selecting user posts related to trending topics on online social networks
US20120078906A1 (en) Automated generation and discovery of user profiles
BR112020018013A2 (pt) Assistência computadorizada utilizando base de conhecimentos por inteligência artificial
WO2014107440A2 (en) Social media impact assessment
US11568274B2 (en) Surfacing unique facts for entities
JP2011165169A (ja) 推奨システムおよび推奨プログラム
JP6777807B2 (ja) コンピュータシステムからのユーザ情報の収集
US10262041B2 (en) Scoring mechanism for discovery of extremist content
WO2023108980A1 (zh) 基于文本对抗样例的信息推送方法及装置
US10482390B2 (en) Information discovery system
US20240134914A1 (en) Content based related view recommendations
Chang et al. Improving recency ranking using twitter data
EP2613275B1 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
Raghav et al. Bigdata fog based cyber physical system for classifying, identifying and prevention of SARS disease
JP6111938B2 (ja) 情報処理プログラム及び情報処理装置
Moise The technical hashtag in Twitter data: A hadoop experience
CN114281990A (zh) 文档分类方法及装置、电子设备和介质
Lim et al. ClaimFinder: A Framework for Identifying Claims in Microblogs.
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
CN117807293B (zh) 一种证据信息按需组织与精准分发方法
US10936665B2 (en) Graphical match policy for identifying duplicative data
JP2016153965A (ja) 検索システム及び検索方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170227

R150 Certificate of patent or registration of utility model

Ref document number: 6111938

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees