JP7375861B2

JP7375861B2 - 関連スコア算出システム、方法およびプログラム

Info

Publication number: JP7375861B2
Application number: JP2022108819A
Authority: JP
Inventors: 洋介本橋; 昌子今西
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2017-11-06
Filing date: 2022-07-06
Publication date: 2023-11-08
Anticipated expiration: 2037-11-06
Also published as: JP6972935B2; JP2019086940A; JP7103496B2; JP2021192237A; JP2022133401A

Description

本発明は、人と単語との関連の強さを数値化する関連スコア算出システム、関連スコア算出方法および関連スコア算出プログラムに関する。

特許文献１には、パーソナルコンピュータまたは携帯情報端末に導入されているアプリケーションプログラムがどの程度使用されているかを判定するために必要な情報を含む操作ログによって、ユーザが使用しているアプリケーションプログラムを判定する情報提供装置が記載されている。また、特許文献１には、情報提供装置が、ユーザがどの程度アプリケーションプログラムを使用しているかを判定したり、ユーザのアプリケーションプログラムに対する知識レベルを判定したりすることも記載されている。

特許文献２には、プロファイルデータベースに、人材に関する情報の登録、削除、更新等を行い、プロファイル情報を参照して検索キーワードに合致する人材を検索する人材検索システムが記載されている。また、特許文献２には、人が著作者となっている文書のキーワードを抽出し、上位キーワードを得ることによって、人材の専門分野や業務についての情報を得ることが記載されている。

特開２０１３－３７５８４号公報特開２００５－３２７０２８号公報

企業等の組織内において、特定の分野や技術に精通している人や、あるプロジェクトに参加したことのある人を見つけられることが好ましい。また、ある人が精通している分野、技術や、その人が参加したことのあるプロジェクトを容易に知ることができることが好ましい。しかし、大企業等の大きな組織では、「誰がどの分野やどの技術に詳しいか」、「誰がどのプロジェクトに参加したことがあるか」等は、長年、その組織にいないと分からない知識となってしまう。特に、「過去において、誰がどの分野やどの技術に詳しかったか」、「過去において、誰がどのプロジェクトに参加したか」等の情報については、その傾向が強くなる。そのため、特に、新入社員や派遣社員にとって、聞きたいことを誰にきけばよいのか分からなくなってしまう。その結果、例えば、製品開発の効率が低下する場合が生じ得る。

そのため、本発明の発明者らは、組織内の人と、単語との関連の強さを明確化できることが好ましいと考えた。本発明の発明者らは、例えば、ある人と、「人工知能」という単語の関連の強さを明確化できれば、その人が、「人工知能」の分野や技術に詳しいかどうかや、その人が「人工知能」に関するプロジェクトに参加したことがあるかどうかを推定しやすいと考えた。

そこで、本発明は、組織内の人と単語との関連の強さを明確化することができる関連スコア算出システム、関連スコア算出方法および関連スコア算出プログラムを提供することを目的とする。

本発明による検索システムは、検索者からキーワードを受け付けるキーワード受付部と、一のユーザの各ファイルの操作時間のうち、キーワードをファイル名に含む各ファイルの操作時間の総和に基づいて、キーワードに関連するユーザを検索する検索部とを備える。

本発明による検索方法は、コンピュータが、検索者からキーワードを受け付け、一のユーザの各ファイルの操作時間のうち、キーワードをファイル名に含む各ファイルの操作時間の総和に基づいて、キーワードに関連するユーザを検索する。

本発明による検索プログラムは、コンピュータに、検索者からキーワードを受け付ける処理と、一のユーザの各ファイルの操作時間のうち、キーワードをファイル名に含む各ファイルの操作時間の総和に基づいて、キーワードに関連するユーザを検索する処理とを実行させる。

本発明による検索システムは、検索者からキーワードを受け付けるキーワード受付部と、一のユーザのイベントの参加時間のうち、キーワードをイベント名に含む各イベントの参加時間の総和に基づいて、キーワードに関連するユーザを検索する検索部とを備える。

本発明による検索方法は、コンピュータが、検索者からキーワードを受け付け、一のユーザのイベントの参加時間のうち、キーワードをイベント名に含む各イベントの参加時間の総和に基づいて、キーワードに関連するユーザを検索する。

本発明による検索プログラムは、コンピュータに、検索者からキーワードを受け付ける処理と、一のユーザのイベントの参加時間のうち、キーワードをイベント名に含む各イベントの参加時間の総和に基づいて、キーワードに関連するユーザを検索する処理とを実行させる。

本発明によれば、組織内の人と単語との関連の強さを明確化することができる。

本発明の第１の実施形態の関連スコア算出システムの構成例を示すブロック図である。操作ログの例を示す模式図である。ユーザと単語の組合せ毎に算出された関連スコアの例を示す模式図である。第１の実施形態の関連スコア算出システムの処理経過の例を示すフローチャートである。第１の実施形態の変形例を示すブロック図である。記憶部に記憶されているユーザ名と単語と関連スコアとの組の例を示す模式図である。本発明の第２の実施形態の関連スコア算出システムの構成例を示すブロック図である。関連スコア算出結果（ユーザ名と単語と関連スコアとの組の集合）の例を示す模式図である。第１のテーブルの例を示す模式図である。第２のテーブルの例を示す模式図である。第２の実施形態の処理経過の例を示すフローチャートである。選択ユーザとキーワード単語の検索スコアを算出する処理の例を示すフローチャートである。スコア算出対象単語とキーワードユーザ名の検索スコアを算出する処理の例を示すフローチャートである。本発明の第３の実施形態の関連スコア算出システムの構成例を示すブロック図である。クラスタリング結果を示す画面の例を示す模式図である。第４の実施形態の関連スコア算出システムの構成例を示すブロック図である。スケジュール情報の例を示す模式図である。本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。本発明の概要を示すブロック図である。本発明の概要の他の例を示すブロック図である。

以下、本発明の実施形態を図面を参照して説明する。

実施形態１．
図１は、本発明の第１の実施形態の関連スコア算出システムの構成例を示すブロック図である。ただし、図１では、通信ネットワークを介して本発明の関連スコア算出システムに接続されている装置も図示している。

本発明の関連スコア算出システム１には、通信ネットワーク１０を介して、パーソナルコンピュータ（以下、ＰＣと記す。）９１が接続されている。

ＰＣ９１は、例えば、会社や企業等の組織に属する人によって使用される。各ＰＣ９１は、１つの組織内に設けられているものとする。以下、組織が会社である場合を例にして説明する。ただし、ＰＣ９１を使用する人が属する組織は会社や企業でなくてもよい。また、組織は、複数の会社等によって形成される組織であってもよく、また、１つの会社や企業等の一部門であってもよい。

個々のＰＣ９１は、ファイルを操作するユーザによって、ファイルに関する１つの操作ログを作成し、記憶する。後述するように、各ＰＣ９１が記憶している操作ログは、関連スコア算出システム１（より具体的には、関連スコア算出システム１の収集部２）によって収集される。

図２は、ＰＣ９１で作成される操作ログの例を示す模式図である。操作ログは、例えば、ファイル名と、ファイルを操作したユーザのユーザ名と、操作の内容と、その操作が行われた日時とを関連付けている（図２参照）。図２では、便宜的に、操作ログの番号も図示している。なお、図２は、操作ログの例であり、操作ログは、図２に示す例に限定されない。

ＰＣ９１は、操作ログに、ファイル名として、パス名を含むファイル名を記述する。

また、ＰＣ９１は、操作ログに記述するユーザ名を、例えば、ユーザがＰＣ９１にログインする際に用いるＩＤ（Identification）から判定すればよい。ただし、ＰＣ９１がユーザ名を判定する方法は、この方法に限定されない。

なお、各実施形態では、ユーザＩＤ（ユーザの識別情報）として、ユーザ名を用いる。

操作ログに記述される操作内容の例として、例えば、「ファイルオープン」、「キータッチ」、「更新（保存）」、「ファイルクローズ」等が挙げられる。ただし、操作ログに記述される操作の内容は、これらに限定されず、「新規作成」等であってもよい。

例えば、ユーザ「山田」が、２０１７年１０月１０日の１３時１５分に、ファイル“/・・/人工知能/・・/Ａ社の機械学習.pptx”を開いた場合、ＰＣ９１は、図２に例示する１番目の操作ログを作成する。また、例えば、ユーザ「山田」が、２０１７年１０月１０日の１３時１６分に、そのファイルに対して、キータッチ（キー入力）を行った場合、ＰＣ９１は、図２に例示する２番目の操作ログを作成する。また、例えば、ユーザ「山田」が、２０１７年１０月１０日の１５時１７分に、そのファイルを更新（保存）した場合、ＰＣ９１は、図２に例示するｍ－１番目の操作ログを作成する。また、例えば、ユーザ「山田」が、２０１７年１０月１０日の１５時４５分に、そのファイルを閉じた場合には、ＰＣ９１は、図２に例示するｍ番目の操作ログを作成する。

図２に示すｍ＋１番目からｎ番目までの操作ログは、ユーザ「山田」が別のファイル“/・・/人工知能/・・/ディープラーニング.docx”を操作した際における操作ログの例である。

各ＰＣ９１は、それぞれ、同様に、ユーザがファイルに対して操作を行う毎に、操作ログを追加し、記憶していく。

関連スコア算出システム１は、収集部２と、単語抽出部３と、スコア算出部４と、記憶部５とを備える。

収集部２は、各ＰＣ９１から、各ＰＣ９１に記憶されている操作ログを収集する。図２に示すように、個々の操作ログは、パス名を含むファイル名と、そのファイル名を有するファイルを使用したユーザのユーザ名とを含む。個々の操作ログは、ユーザと単語との関連の強さを表す指標値である関連スコアを導出可能な情報も含む。図２に示す例では、「日時」および「操作」として記載された情報が、関連スコアを導出可能な情報に該当する。ただし、関連スコアは、１つの操作ログからは導出されず、複数の操作ログから導出される。

単語抽出部３は、収集部２によって収集された各操作ログに記述されている各ファイル名（パス名を含むファイル名）に対して形態素解析を実行することによって、パス名を含むファイル名に含まれている単語を抽出する。ただし、単語抽出部３は、同一の単語を、重複して抽出しない。例えば、単語抽出部３は、「人工知能」という単語を既に抽出している場合、２回目以降に抽出された「人工知能」という単語については無視する。

例えば、単語抽出部３は、“/・・/人工知能/・・/Ａ社の機械学習.pptx”というパス名を含むファイル名に対して形態素解析を実行することによって、「人工知能」、「Ａ社」、「機械学習」等の単語を抽出する。なお、以下の説明において、各ユーザが属している会社（組織）が「Ａ社」であるものとして説明する。

さらに、例えば、単語抽出部３は、“/・・/人工知能/・・/ディープラーニング.docx”というパス名を含むファイル名に対して形態素解析を実行することによって、「人工知能」、「ディープラーニング」等の単語を抽出する。ただし、前述のように、「人工知能」は既に抽出されているので、単語抽出部３は、ここで抽出された「人工知能」という単語については無視する。

単語抽出部３は、同様の処理を、各操作ログに記述されている各ファイル名に対して行うことによって、単語の集合を得る。これらの単語は、互いに異なる。

スコア算出部４は、ファイルを操作した各ユーザと、単語抽出部３によって抽出された各単語の組合せ毎に、ユーザと単語との関連の強さを表す指標値である関連スコアを算出する。なお、ユーザは、操作ログに記述されるユーザ名で表される。

なお、本発明の第２の実施形態等では、単語同士の関連の強さを表す指標値も用いる。本発明において、ユーザと単語との関連の強さを表す指標値を「関連スコア」と称し、単語同士の関連の強さを表す指標値を「関連度」と称することによって、２種類の指標値を区別する。

スコア算出部４は、ユーザ（ユーザ名）と単語の組合せ毎に、関連スコアを算出し、そのユーザ名と単語と関連スコアとの組を記憶部５に記憶させる。

記憶部５は、ユーザ（ユーザ名）と単語と関連スコアとの組を記憶する記憶装置である。

関連スコアの算出方法は、複数、存在する。以下、関連スコアの算出方法として、３種類の方法を説明する。以下に示す３種類のいずれの方法においても、スコア算出部４は、ユーザと単語の組合せ毎に、関連スコアを算出し、記憶部５に記憶させる。

第１の算出方法は、一のユーザ（以下、ユーザＵと記す。）と一の単語（以下、単語Ｗと記す。）の関連スコアとして、単語Ｗをファイル名に含む各ファイルについてのユーザＵの操作時間の総和を算出する方法である。操作時間が長いほど、ユーザＵと単語Ｗの関連が強く、操作時間が短いほど、ユーザＵと単語Ｗの関連が弱いと言える。従って、操作時間を、関連スコアとして用いることができる。

ここではまず、実質参照時間を操作時間として扱う場合を例にして説明する。

なお、ファイル名は、パス名を含むファイル名である。従って、単語Ｗがパス名の方に含まれている場合であっても、単語Ｗはファイル名に含まれているものとして扱う。この点は、後述の第２の算出方法および第３の算出方法においても同様である。

実質参照時間は、ＰＣ９１において、ファイルの内容を表しているウィンドウがアクティブになっている時間（すなわち、ファイルの内容を表しているウィンドウがユーザから見て一番手前に表示されている時間）である。

関連スコアの第１の算出方法では、スコア算出部４は、単語Ｗをファイル名に含む各ファイルについてのユーザＵの実質参照時間の総和を算出し、その総和を、ユーザＵと単語Ｗの関連スコアとする。

キータッチが行われていれば、ファイルの内容を表すウィンドウはアクティブである。従って、例えば、スコア算出部４は、単語Ｗをファイル名に含む１つのファイルに関して、ユーザＵによってキータッチが続けて行われている状態を操作ログから判断し、その状態における最初のキータッチ時刻から、最後のキータッチ時刻までの時間を、そのファイルにおけるユーザＵの実質参照時間とする。

さらに、単語Ｗをファイル名に含み、ユーザＵに操作された他のファイルがあれば、スコア算出部４は、そのファイルに関しても同様に、実質参照時間を算出する。

そして、スコア算出部４は、単語Ｗをファイル名に含み、ユーザＵに操作されたファイル毎に算出した実質参照時間の総和を算出し、その総和をユーザＵと単語Ｗの関連スコアとする。

また、操作ログにおいて、アクティブ状態となった開始時刻および終了時刻を明示しているのであれば、スコア算出部４は、操作ログにおいて明示されているそれらの時刻に基づいて、実質参照時間を算出してもよい。

また、スコア算出部４は、ファイルオープンからファイルクローズまでの時間を操作時間として算出してもよい。この場合、スコア算出部４は、単語Ｗをファイル名に含み、ユーザＵに操作されたファイル毎に、ファイルオープンからファイルクローズまでの時間を算出し、その時間の総和をユーザＵと単語Ｗの関連スコアとすればよい。

なお、実質参照時間を操作時間として扱うことが好ましい。

関連スコアの第２の算出方法は、一のユーザ（ユーザＵ）と一の単語（単語Ｗ）の関連スコアとして、単語Ｗをファイル名に含む各ファイルをユーザＵが操作した際のキータッチの回数の総和を算出する方法である。キータッチの回数が多いほど、単語Ｗをファイル名に含むファイルをユーザＵが操作した量が多いことになる。よって、キータッチの回数が多いほど、ユーザＵと単語Ｗの関連が強く、キータッチの回数が少ないほど、ユーザＵと単語Ｗの関連が弱いと言える。従って、キータッチの回数を、関連スコアとして用いることができる。

第２の算出方法では、スコア算出部４は、操作ログを参照して、単語Ｗをファイル名に含む一つのファイルをユーザＵが操作した際のキータッチの回数をカウントすることによって、そのファイルにおけるキータッチの回数を求める。

さらに、単語Ｗをファイル名に含み、ユーザＵに操作された他のファイルがあれば、スコア算出部４は、そのファイルに関しても同様に、キータッチの回数を求める。

そして、スコア算出部４は、単語Ｗをファイル名に含み、ユーザＵに操作されたファイル毎に算出したキータッチの回数の総和を算出し、その総和をユーザＵと単語Ｗの関連スコアとする。

関連スコアの第３の算出方法は、一のユーザ（ユーザＵ）と一の単語（単語Ｗ）の関連スコアを、次に説明する２つの割合に基づいて算出する方法である。この２つの割合のうち、一方の割合をＲ_１と記し、もう一方の割合をＲ_２と記す。

Ｒ_１は、単語Ｗをファイル名に含む各ファイルについての組織内の全ユーザの操作時間の総和に対する、単語Ｗをファイル名に含む各ファイルについてのユーザＵの操作時間の総和の割合である。すなわち、Ｒ_１は、以下に示す式（１）で表される。

Ｒ_２は、個々の単語に着目した場合における、着目した単語をファイル名に含む各ファイルについてのユーザＵの操作時間の総和に対する、単語Ｗをファイル名に含む各ファイルについてのユーザＵの操作時間の総和の割合である。すなわち、Ｒ_２は、以下に示す式（２）で表される。

Ｒ_１について説明する。単語Ｗをファイル名に含む各ファイルについてのユーザＵの操作時間の総和（式（１）の右辺の分子）は、前述の第１の算出方法で算出される関連スコアに相当する。すなわち、スコア算出部４は、前述の第１の算出方法で説明した方法で、単語Ｗをファイル名に含む各ファイルについてのユーザＵの操作時間の総和を算出すればよい。

単語Ｗをファイル名に含む各ファイルについての組織内の全ユーザの操作時間の総和（式（１）の右辺の分母）について説明する。スコア算出部４は、単語Ｗをファイル名に含む各ファイルについての、組織内の一人目のユーザの操作時間の総和も、前述の第１の算出方法で説明した方法で算出する。同様に、スコア算出部４は、単語をＷファイル名に含む各ファイルについての、組織内の二人目のユーザの操作時間の総和も、前述の第１の算出方法で説明した方法で算出する。同様に、スコア算出部４は、組織に属する一人一人について、単語Ｗをファイル名に含む各ファイルについてのユーザの操作時間の総和を算出する。さらに、スコア算出部４は、組織に属する一人一人について算出した「単語Ｗをファイル名に含む各ファイルについてのユーザの操作時間の総和」の総和を算出する。この値が、単語Ｗをファイル名に含む各ファイルについての組織内の全ユーザの操作時間の総に該当する。

例えば、単語Ｗが「人工知能」であり、ユーザＵが「山田」であるとする。また、山田が属する組織「Ａ社」に３００人のユーザがいるとする。この場合、スコア算出部４は、「人工知能」をファイル名に含むファイルについてのユーザ「山田」の操作時間の総和を、式（１）の右辺の分子として求める。また、スコア算出部４は、「人工知能」をファイル名に含むファイルについてのユーザの操作時間の総和を、３００人の個々のユーザ毎に算出し、さらに、個々のユーザ毎に算出した「操作時間の総和」の総和を、式（１）の右辺の分母として求める。そして、スコア算出部４は、式（１）によって、Ｒ_１を算出する。

次に、Ｒ_２について説明する。式（２）の右辺の分子は、式（１）の右辺の分子と同じである。従って、スコア算出部４は、前述の第１の算出方法で説明した方法で、単語Ｗをファイル名に含む各ファイルについてのユーザＵの操作時間の総和を算出すればよい。

個々の単語に着目した場合における、着目した単語をファイル名に含む各ファイルについてのユーザＵの操作時間の総和（式（２）の右辺の分母）について説明する。スコア算出部４は、単語抽出部３によって抽出された個々の単語に着目する（換言すれば、個々の単語を１つ１つ選択する）。そして、スコア算出部４は、着目した単語（選択した単語）をファイル名に含む各ファイルについてのユーザＵの操作時間の総和を、前述の第１の算出方法で説明した方法で算出する。スコア算出部４は、次の単語に着目し（換言すれば、次の単語を選択し）、着目した単語（選択した単語）をファイル名に含む各ファイルについてのユーザＵの操作時間の総和を、前述の第１の算出方法で説明した方法で算出する。このように、スコア算出部４は、単語毎に、単語をファイル名に含む各ファイルについてのユーザＵの操作時間の総和を算出する。そして、スコア算出部４は、単語毎に算出した「単語をファイル名に含む各ファイルについてのユーザＵの操作時間の総和」の総和を算出する。この値が、式（２）の右辺の分母に該当する。「個々の単語に着目した場合における、着目した単語をファイル名に含む各ファイルについてのユーザＵの操作時間の総和（式（２）の右辺の分母）」は、「単語をファイル名に含む各ファイルについてのユーザＵの操作時間の総和を単語毎に求めた場合における前記総和の総和」であると言うことができる。

例えば、前述の例のように、単語Ｗが「人工知能」であり、ユーザＵが「山田」であるとする。この場合、スコア算出部４は、「人工知能」をファイル名に含むファイルについてのユーザ「山田」の操作時間の総和を、式（２）の右辺の分子として求める。また、スコア算出部４は、「人工知能」、「Ａ社」、「ディープラーニング」等の抽出された単語毎に、単語をファイル名に含むファイルについてのユーザ「山田」の操作時間の総和を算出する。さらに、個々の単語毎に算出した「操作時間の総和」の総和を、式（２）の右辺の分母として、求める。そして、スコア算出部４は、式（２）によって、Ｒ_２を算出する。

スコア算出部４は、Ｒ_１，Ｒ_２を求めた後、ユーザＵと単語Ｗの関連スコアを、以下に示す式（３）によって算出する。

関連スコア＝Ｒ_１×ｌｏｇ（Ｒ_２）・・・（３）

この第３の算出方法で関連スコアを算出した場合、組織に属する多くの人に関連のある単語については、関連スコアの値が低くなり、組織に属する特定の人に関連のある単語については、関連スコアの値が高くなる。例えば、各ユーザはＡ社に属しているので、「Ａ社」という単語は、各ユーザと関連があると考えられる。しかし、「Ａ社」という単語と、各ユーザの関連が強いということは、自明であると言える。そのため、「Ａ社」という単語と各ユーザの関連スコアを高くしても、あまり意味がなく、関連スコアを低くした方が好ましい。また、組織に属する特定のユーザのみが、「人工知能」という単語と関連している場合、そのユーザと「人工知能」という単語の関連スコアは高くした方が好ましい。第３の算出方法では、そのように、関連スコアを算出することができる。

図３は、ユーザと単語の組合せ毎に算出された関連スコアの例を示す模式図である。図３に示す第１の関連スコアは、第１の算出方法で算出された関連スコアである。第２の関連スコアは、第２の算出方法で算出された関連スコアである。第３の関連スコアは、第３の算出方法で算出された関連スコアである。図３では、３種類の関連スコアを図示したが、スコア算出部４は、いずれか１種類の関連スコアを算出すればよい。ただし、スコア算出部４は、２種類以上の関連スコアを算出してもよい。

既に説明したように、スコア算出部４は、ユーザと単語の組合せ毎に、関連スコアを算出し、ユーザ名と単語と関連スコアとの組を記憶部５に記憶させる。

収集部２は、例えば、関連スコア算出プログラムに従って動作するコンピュータのＣＰＵ（Central Processing Unit ）およびそのコンピュータの通信インタフェースによって実現される。例えば、ＣＰＵが、コンピュータのプログラム記憶装置等のプログラム記録媒体から関連スコア算出プログラムを読み込み、関連スコア算出プログラムに従って、通信インタフェースを用いて、収集部２として動作すればよい。また、単語抽出部３およびスコア算出部４も、例えば、関連スコア算出プログラムに従って動作する上記のコンピュータのＣＰＵによって実現される。すなわち、上記のように、関連スコア算出プログラムを読み込んだＣＰＵが、関連スコア算出プログラムに従って、単語抽出部３およびスコア算出部４として動作すればよい。記憶部５は、上記のコンピュータの記憶装置によって実現される。また、収集部２、単語抽出部３およびスコア算出部４がそれぞれ別々のハードウェアによって実現されてもよい。

また、関連スコア算出システム１は、２つ以上の物理的に分離した装置が有線または無線で接続されている構成であってもよい。この点は、後述する他の実施形態でも同様である。

次に、第１の実施形態の処理経過について説明する。図４は、第１の実施形態の関連スコア算出システムの処理経過の例を示すフローチャートである。なお、既に説明した事項については、詳細な説明を省略する。

まず、収集部２が、会社内に設けられている各ＰＣ９１から、操作ログを収集する（ステップＳ１）。

次に、単語抽出部３が、各操作ログに記述されているファイル名（パス名を含むファイル名）に対して形態素解析を行うことにより、単語を抽出する（ステップＳ２）。

次に、スコア算出部４が、各操作ログに基づいて、操作ログに記述されているユーザ名と、ステップＳ２で抽出された単語との組み合わせ毎に、そのユーザ名が表わすユーザと単語との関連の強さを表す関連スコアを算出。そして、スコア算出部４は、ユーザ名と単語と関連スコアとの組を記憶部５に記憶させる（ステップＳ３）。スコア算出部４は、前述の第１の算出方法、第２の算出方法、および、第３の算出方法のうちの、いずれの方法で関連スコアを算出してもよい。

この結果、記憶部５には、ユーザ名と単語と関連スコアとの組が複数組、記憶される。

本実施形態によれば、スコア算出部４が、各操作ログに基づいて、ユーザと単語の組合せ毎に、関連スコアを算出する。そして、前述の第１の算出方法、第２の算出方法、および、第３の算出方法は、いずれも、基本的に、単語Ｗをファイル名に含むファイルに対するユーザＵの操作の量（キータッチの回数、操作時間等）が多いほど、関連スコアとして大きな値を算出する。従って、ユーザと単語の組合せ毎に、ユーザと単語との関連の強さが、適切に数値化される。よって、組織内の人と単語との関連の強さを明確化することができる。

次に、第１の実施形態の変形例について説明する。図５は、第１の実施形態の変形例を示すブロック図である。図５に示す関連スコア算出システム１は、収集部２、単語抽出部３、スコア算出部４および記憶部５に加えて、キーワード受付部６と、検索部７と、出力部８とを備える。図１に示す要素と同様の要素については、図１と同一の符号を付し、説明を省略する。

以下に示す例では、ユーザ名と、単語と、前述の第３の算出方法によって算出された関連スコアとの組が、複数、記憶部５に記憶されているものとして説明する。図６は、記憶部５に記憶されている複数の組の例を示す模式図である。

図５に例示する関連スコア算出システム１は、単語を検索キーワードとして受け付け、その単語に応じたユーザのユーザ名を検索する。あるいは、関連スコア算出システム１は、ユーザ名を検索キーワードとして受け付け、そのユーザ名に応じた単語を検索する。また、関連スコア算出システム１は、上記の２種類の検索をそれぞれ実行可能であってもよい。

キーワード受付部６は、検索者から検索キーワードを受け付ける。

検索部７は、検索キーワードに応じて、検索を実行する。

出力部８は、検索結果を出力する。

なお、キーワード受付部６は、例えば、検索者の使用する端末装置（図示略）から、通信ネットワークを介して、検索キーワードを受け付け、出力部８は、その端末装置に対して、検索結果を送信すればよい。以下、このようにキーワード受付部６が検索キーワードを受け付け、出力部８がこのように検索結果を出力する場合を例にして説明する。ただし、検索キーワードの受け付け態様や、検索結果の出力態様は、この例に限定されない。例えば、キーワード受付部６は、関連スコア算出システム１が備える入力デバイス（図示略）を介して検索キーワードを受け付けてもよい。また、出力部８は、関連スコア算出システム１が備えるディスプレイ装置（図示略）に検索結果を出力（表示）してもよい。

キーワード受付部６および出力部８は、収集部２と同様に、例えば、関連スコア算出プログラムに従って動作するコンピュータのＣＰＵおよびそのコンピュータの通信インタフェースによって実現される。また、検索部７は、関連スコア算出プログラムに従って動作するそのコンピュータのＣＰＵによって実現される。また、キーワード受付部６、検索部７、出力部８、および他の構成要素がそれぞれ別々のハードウェアによって実現されてもよい。

次に、関連スコア算出システム１が、単語を検索キーワードとして受け付け、その単語に応じたユーザのユーザ名を検索する処理の例について説明する。

まず、キーワード受付部６が、検索者から単語を検索キーワードとして受け付ける。

次に、検索部７が、記憶部５に記憶されている、ユーザ名と単語と関連スコアとの組の中から、検索キーワードに該当する単語と、閾値（例えば、０．５）以上の関連スコアを含む組を特定し、その組に含まれているユーザ名を検索結果として特定する。

例えば、キーワード受付部６が検索キーワードとして、「人工知能」という単語を受け付けたとする。また、上記の閾値が０．５であるとする。この場合、検索部７は、図６に例示する複数の組の中から、「人工知能」という単語と、０．５以上の関連スコアを含む組を特定する。本例では、図６に示す１番目の組が特定される。検索部７は、特定した組含まれるユーザ名「山田」を検索結果として得る。出力部８は、その検索結果を出力する。なお、検索部７は、「人工知能」という単語と、０．５以上の関連スコアを含む組が複数存在するならば、その組を全て特定し、その各組から得られるユーザ名を検索結果とする。従って、検索結果として得られるユーザ名は１つとは限らない。出力部８は、検索結果として得た複数のユーザ名を、関連スコアの高い順に並べて出力してもよい。

このように、単語からユーザ名が検索できるので、検索者は、検索キーワードとして指定した単語が表わす分野、技術、プロジェクト等に強く関わったユーザのユーザ名を容易に知ることができる。

次に、関連スコア算出システム１が、ユーザ名をキーワードとして受け付け、そのユーザ名に応じた単語を検索する処理の例について説明する。

まず、キーワード受付部６が、検索者からユーザ名を検索キーワードとして受け付ける。

次に、検索部７が、記憶部５に記憶されている、ユーザ名と単語と関連スコアとの組の中から、検索キーワードに該当するユーザ名と、閾値（例えば、０．５）以上の関連スコアを含む組を特定し、その組に含まれている単語を検索結果として特定する。このとき、検索キーワードに該当するユーザ名と、閾値以上の関連スコアを含む組が複数存在するならば、検索部７は、その組を全て特定し、その各組から得られる単語を検索結果とする。従って、検索結果として得られる単語は１つとは限らない。出力部８は、検索結果として得た複数の単語を、関連スコアの高い順に並べて出力してもよい。

例えば、キーワード受付部６が検索キーワードとして、「山田」というユーザ名を受け付けたとする。また、上記の閾値が０．５であるとする。この場合、検索部７は、図６に例示する複数の組の中から、「山田」というユーザ名と、０．５以上の関連スコアを含む組を特定する。本例では、図６に示す１番目の組、３番目の組および４番目の組が特定される。検索部７は、特定した各組に含まれる単語を検索結果として得る。すなわち、検索部７は、「人工知能」、「機械学習」および「ディープラーニング」を検索結果として得る。出力部８は、その検索結果を出力する。

このように、ユーザ名から単語を検索できるので、検索者は、検索キーワードとして指定したユーザ名を有する人が精通している分野、技術等を容易に推定したり、その人が参加したことがあるプロジェクト等を容易に推定したりすることができる。

なお、上記の閾値“０．５”は例示であり、閾値は０．５でなくてもよい。また、閾値は、関連スコアの算出方法に応じて定めておけばよい。

実施形態２．
図７は、本発明の第２の実施形態の関連スコア算出システムの構成例を示すブロック図である。第１の実施形態の関連スコア算出システム（図１参照）や第１の実施形態の変形例（図５参照）に示す構成要素と同様の構成要素については、図１や図５に示す符号と同一の符号を付し、説明を省略する。

第２の実施形態では、関連スコア算出システム１は、収集部２と、単語抽出部３と、スコア算出部４と、記憶部５と、第１のテーブル生成部１１と、第２のテーブル生成部１２と、キーワード受付部６と、検索部１７と、出力部８とを備える。

収集部２、単語抽出部３およびスコア算出部４は、第１の実施形態（図１参照）や、第１の実施形態の変形例（図５参照）で示したそれらの各要素と同様である。

また、キーワード受付部６および出力部８は、第１の実施形態の変形例（図５参照）で示したそれらの各要素と同様である。

記憶部５は、第１の実施形態（図１参照）や、第１の実施形態の変形例（図５参照）における記憶部５と同様である。ただし、本実施形態では、記憶部５は、ユーザ名と単語と関連スコアとの組を複数組記憶するだけでなく、後述の第１のテーブル２１および第２のテーブル２２も記憶する。以下、スコア算出部４が記憶部５に記憶させる、ユーザ名と単語と関連スコアとの組の集合（例えば、図６に例示する複数の組）を関連スコア算出結果２０と記す。

また、本実施形態では、スコア算出部４が、前述の第３の算出方法で関連スコアを算出する場合を例にして説明する。ただし、スコア算出部４は、前述の第１の算出方法または第２の算出方法で関連スコアを算出してもよい。

以下の説明では、スコア算出部４が、既に関連スコアを算出し、記憶部５に関連スコア算出結果２０を記憶させているものとして説明する。図８は、関連スコア算出結果２０（ユーザ名と単語と関連スコアとの組の集合）の例を示す模式図である。ここでは、図８に例示する関連スコア算出結果２０が記憶部５に記憶されている場合を例にして説明する。

第１のテーブル生成部１１は、関連スコア算出結果２０に基づいて、第１のテーブル２１を生成し、記憶部５に記憶させる。第１のテーブル２１は、ユーザＩＤと、単語と、関連スコアとの関係を記述したテーブルである。より具体的には、第１のテーブル２１は、関連スコア算出結果２０に含まれているユーザ名を縦軸と横軸のうちの一方の軸に並べ、関連スコア算出結果２０に含まれている単語を他方の軸に並べ、ユーザ名と単語とが交差する欄に、そのユーザ名を有するユーザとその単語の関連スコアを記述したテーブルである。

本例では、第１のテーブル生成部１１が、第１のテーブルを生成する際に、ユーザ名を縦軸に並べ、単語を横軸に並べる場合を例にして説明するが、第１のテーブル生成部１１は、ユーザ名を横軸に並べ、単語を縦軸に並べてもよい。

また、第１のテーブル生成部１１は、ユーザ名を軸に沿って並べる際、同一ユーザのユーザ名を重複させずに並べる。例えば、図８に示す関連スコア算出結果２０において、１番目の組にもユーザ名「山田」が含まれ、２番目の組にもユーザ名「山田」が含まれている。このユーザ名「山田」は、同一ユーザのユーザ名である。従って、第１のテーブル生成部１１は、ユーザ名を軸に沿って並べる際、ユーザ名「山田」を１回並べればよい。

同様に、第１のテーブル生成部１１は、単語を軸に沿って並べる際、同一の単語を重複させずに並べる。例えば、図８に示す関連スコア算出結果２０において、複数の組で「人工知能」という単語が含まれている。しかし、第１のテーブル生成部１１は、単語を軸に沿って並べる際、「人工知能」という単語を一回並べればよい。

第１のテーブル生成部１１によって生成される第１のテーブルの例を、図９に示す。第１のテーブル生成部１１は、関連スコア算出結果２０に含まれているユーザ名（「山田」、「鈴木」、「田中」等）を、縦軸の方向に沿って並べる（図９参照）。また、第１のテーブル生成部１１は、関連スコア算出結果２０に含まれている単語（「人工知能」、「Ａ社」、「機械学習」、「ディープラーニング」等）を、横軸の方向に沿って並べる（図９参照）。

そして、第１のテーブル生成部１１は、ユーザ名と単語とが交差する欄に、そのユーザ名を有するユーザとその単語の関連スコアを記述する。例えば、図８に示す例で、ユーザ名「山田」と単語「人工知能」の関連スコアは、“０．８０”である。従って、第１のテーブル生成部１１は、第１のテーブル２１において、「山田」と「人工知能」とが交差する欄に“０．８０”を記述する（図９参照）。また、例えば、図８に示す例で、ユーザ名「山田」と単語「Ａ社」の関連スコアは、“０．１０”である。従って、第１のテーブル生成部１１は、第１のテーブル２１において、「山田」と「Ａ社」とが交差する欄に“０．１０”を記述する。第１のテーブル生成部１１は、ユーザ名と単語とが交差する欄毎に、同様に、関連スコアを記述する。

第１のテーブル生成部１１は、上記のようにして生成した第１のテーブル２１を、記憶部５に記憶させる。

第２のテーブル生成部１２は、第１のテーブル２１に基づいて、第２のテーブル２２を生成し、記憶部５に記憶させる。第２のテーブルは、第１のテーブルに基づいて算出した単語同士の関連の強さを表す関連度を記述したテーブルである。より具体的には、第２のテーブル２２は、縦軸と横軸の両方に単語を並べ、単語同士が交差する欄に、第１のテーブル２１に基づいて算出したその単語同士の関連の強さを表す関連度を記述したテーブルである。既に説明したように、本発明では、ユーザと単語との関連の強さを表す指標値を「関連スコア」と称し、単語同士の関連の強さを表す指標値を「関連度」と称することによって、２種類の指標値を区別する。

図１０は、第２のテーブルの例を示す模式図である。本例では、第２のテーブル生成部１２が、縦軸、横軸それぞれに、第１のテーブル２１と同じ順番で単語を並べる場合を例にして説明する。例えば、図９に例示する第１のテーブルでは、単語が、「人工知能」、「Ａ社」、「機械学習」、「ディープラーニング」、・・・の順に並べられている。第２のテーブル生成部１２は、第２のテーブルの縦軸、横軸それぞれにおいても、その順番と同じ順番で単語を並べる（図１０参照）。

そして、第２のテーブル生成部１２は、１つの単語と１つの単語との組合せ毎に、その単語同士の関連の強さを表す関連度を算出し、その単語同士が交差する欄に、その関連度を記述する。なお、第２のテーブル生成部１２は、同一の単語同士に関しても、関連度を算出する。例えば、第２のテーブル生成部１２は、「人工知能」と「人工知能」の関連度も算出する。

ここで、単語同士の関連度について説明する。まず、図９に例示する第１のテーブ２１において、「人工知能」と「機械学習」という２つの単語に着目した場合について説明する。

「人工知能」と個々のユーザの関連スコアを、第１のテーブル２１におけるユーザ名順に並べると、以下のようになる。

０．８０，０．２０，０．６０，０．４３，・・・

また、「機械学習」と個々のユーザの関連スコアを、第１のテーブル２１におけるユーザ名順に並べると、以下のようになる。

０．７９，０．２２，０．５８，０．４５，・・・

上記の関連スコアの並びにおける関連スコアの変化の傾向は似ていると言える。この場合、「人工知能」と「機械学習」の関連度は高いことになる。

次に、「人工知能」と「Ａ社」という２つの単語に着目した場合について説明する。

前述のように、「人工知能」と個々のユーザの関連スコアを、第１のテーブル２１におけるユーザ名順に並べると、以下のようになる。

０．８０，０．２０，０．６０，０．４３，・・・

また、「Ａ社」と個々のユーザの関連スコアを、第１のテーブル２１におけるユーザ名順に並べると、以下のようになる。

０．１０，０．４０，０．３５，０．０５，・・・

上記の関連スコアの並びにおける関連スコアの変化の傾向は似ていないと言える。この場合、「人工知能」と「Ａ社」の関連度は低いことになる。

第２のテーブル生成部１２は、単語同士の関連度として、単語同士の相関係数を算出すればよい。ここでは、単語ｗ_１と単語ｗ_２の関連度として、単語ｗ_１と単語ｗ_２の相関係数を算出する場合について説明する。単語ｗ_１と単語ｗ_２の相関係数は、より具体的には、単語ｗ_１と個々のユーザの関連スコアの並びと、単語ｗ_２と個々のユーザの関連スコアの並びとの相関関数である。

１つの単語と個々のユーザの関連スコアを、第１のテーブル２１におけるユーザ名順に並べた場合における関連スコア（数値）の並びを、その単語の系列と称することとする。例えば、図９に示す例において、「人工知能」の系列は、以下のようになる。

０．８０，０．２０，０．６０，０．４３，・・・

単語ｗ_１の系列が（ｘ_１，ｘ_２，・・・，ｘ_ｎ）であるとする。そして、この系列をｘとする。なお、図９に示す例では、単語の系列は、数値を縦方向に並べたものであるが、ここでは、便宜的に、（ｘ_１，ｘ_２，・・・，ｘ_ｎ）と横に並べて示す。この点は、次に述べる単語ｗ_２についても同様である。

また、単語ｗ_２の系列が（ｙ_１，ｙ_２，・・・，ｙ_ｎ）であるとする。そして、この系列をｙとする。

上記のように系列に属する関連スコアの数をｎ個とする。

第２のテーブル生成部１２は、単語ｗ_１と単語ｗ_２の関連度として、ｘとｙの相関係数を算出すればよい。ｘとｙの相関係数をｒとする。第２のテーブル生成部１２は、以下に示す式（４）の計算により、ｘとｙの相関係数ｒを算出する。

式（４）において、ｓ_ｘｙは、ｘとｙの共分散である。また、ｓ_ｘは、ｘの標準偏差であり、ｓ_ｙは、ｙの標準偏差である。ｘ_ｉは、ｘにおけるｉ番目の関連スコアである。ｙ_ｉは、ｙにおけるｉ番目の関連スコアである。

は、ｘの平均値である。

は、ｙの平均値である。

第２のテーブル生成部１２は、１つの単語と１つの単語との組合せ毎に、式（４）の計算により、相関係数を算出し、その相関係数を関連度として、第２のテーブル２２に記述する。組み合わせをなす２つの単語が異なる単語である場合、その２つの単語の関連度は、第２のテーブル２２において、２箇所に記述される。例えば、図１０に示す例において、「人工知能」と「Ａ社」の関連度は、第１行第２列と、第２行第１列にそれぞれ記述される。

第２のテーブル生成部１２は、上記のようにして生成した第２のテーブル２２を、記憶部５に記憶させる。

第２の実施形態の関連スコア算出システム１は、単語を検索キーワードとして受け付け、その単語に応じたユーザのユーザ名を検索する。あるいは、第２の実施形態の関連スコア算出システム１は、ユーザ名を検索キーワードとして受け付け、そのユーザ名に応じた単語を検索する。また、第２の実施形態の関連スコア算出システム１は、上記の２種類の検索をそれぞれ実行可能であってもよい。

検索者に指定された単語に応じたユーザのユーザ名を検索する場合、キーワード受付部６が、検索者から単語を検索キーワードとして受け付ける。そして、検索部１７は、第１のテーブル２１および第２のテーブル２２に基づいて、検索キーワードに該当する単語に応じたユーザ名を検索する。

また、検索者に指定されたユーザ名に応じた単語を検索する場合、キーワード受付部６が、検索者からユーザ名を検索キーワードとして受け付ける。そして、検索部１７は、第１のテーブル２１および第２のテーブル２２に基づいて、検索キーワードに該当するユーザ名に応じた単語を検索する。

第２の実施形態において、収集部２、キーワード受付部６および出力部８は、関連スコア算出プログラムに従って動作するコンピュータのＣＰＵおよびそのコンピュータの通信インタフェースによって実現される。例えば、ＣＰＵが、コンピュータのプログラム記憶装置等のプログラム記録媒体から関連スコア算出プログラムを読み込み、関連スコア算出プログラムに従って、通信インタフェースを用いて、収集部２、キーワード受付部６および出力部８として動作すればよい。また、単語抽出部３、スコア算出部４、第１のテーブル生成部１１、第２のテーブル生成部１２および検索部１７も、例えば、関連スコア算出プログラムに従って動作する上記のコンピュータのＣＰＵによって実現される。すなわち、上記のように、関連スコア算出プログラムを読み込んだＣＰＵが、関連スコア算出プログラムに従って、単語抽出部３、スコア算出部４、第１のテーブル生成部１１、第２のテーブル生成部１２および検索部１７として動作すればよい。また、収集部２、キーワード受付部６、出力部８、単語抽出部３、スコア算出部４、第１のテーブル生成部１１、第２のテーブル生成部１２および検索部１７がそれぞれ別々のハードウェアによって実現されてもよい。

図１１は、第２の実施形態の処理経過の例を示すフローチャートである。第１の実施形態で説明した動作と同様の動作や、第２の実施形態で既に説明した動作については、詳細な説明を省略する。

ステップＳ１～ステップＳ３は、第１の実施形態におけるステップＳ１～Ｓ３（図４参照）と同様であり、説明を省略する。

ステップＳ３の次に、第１のテーブル生成部１１は、関連スコア算出結果２０に基づいて、第１のテーブル２１（図９参照）を生成し、第１のテーブル２１を記憶部５に記憶させる（ステップＳ４）。第１のテーブル２１を生成する動作については、既に説明したので、ここでは説明を省略する。

次に、第２のテーブル生成部１２は、第１のテーブル２１に基づいて、第２のテーブル２２（図１０参照）を生成し、第２のテーブル２２を記憶部５に記憶させる（ステップＳ５）。第２のテーブル２２を生成する動作についても、既に説明したので、ここでは説明を省略する。

第１のテーブル２１および第２のテーブル２２が生成された後に、キーワード受付部６は、検索者から、検索キーワードを受け付ける（ステップＳ６）。キーワード受付部６は、検索キーワードとして、単語を受け付けてもよい。また、キーワード受付部６は、検索キーワードとして、ユーザ名を受け付けてもよい。

次に、検索部１７は、第１のテーブル２１および第２のテーブル２２に基づいて、検索キーワードに応じた検索結果を求める（ステップＳ７）。検索キーワードが単語である場合、検索部１７は、第１のテーブル２１および第２のテーブル２２に基づいて、その単語に応じたユーザ名を検索する。また、検索キーワードがユーザ名である場合、検索部１７は、第１のテーブル２１および第２のテーブル２２に基づいて、そのユーザ名に応じた単語を検索する。ステップＳ７の動作の詳細については、後述する。

ステップＳ７の後、出力部８が検索結果を出力する（ステップＳ８）。出力部８が検索結果を出力する態様は、第１の実施形態の変形例と同様である。

次に、ステップＳ７の動作について説明する。まず、ステップＳ６において、キーワード受付部６が選択キーワードとして単語を受け付け、検索部１７が単語に応じたユーザ名を検索する場合について説明する。以下、検索キーワードに該当する単語を、キーワード単語と記す。

検索部１７は、個々のユーザ名を順次選択し、選択したユーザ名（以下、選択ユーザ名と記す。）とキーワード単語の検索スコアを算出する。検索スコアは、選択ユーザ名を有するユーザと単語の関連の強さを示す指標値であるが、既に説明した関連スコアを用いて算出され、関連スコアとは算出方法が異なる。そのため、以下の説明では、関連スコアと区別して、検索スコアという語を用いる。

検索部１７が、１つの選択ユーザ名を選択しているとする。検索部１７が選択ユーザ名とキーワード単語の検索スコアを算出する動作について説明する。図１２は、選択ユーザとキーワード単語の検索スコアを算出する処理の例を示すフローチャートである。

まず、検索部１７は、選択ユーザ名の検索スコアの値を０に初期化する（ステップＳ１１）。

次に、検索部１７は、第１のテーブルの軸（第２テーブルの軸でもよい。）に並べられている単語の中から、未だステップＳ１２で選択されていない単語を１つ選択する（ステップＳ１２）。ステップＳ１２で選択した単語を、以下、選択単語と記す。なお、選択単語がキーワード単語と同一である場合もあり得る。

次に、検索部１７は、キーワード単語と選択単語の関連度と、選択ユーザ名と選択単語の関連スコアとの積を算出する（ステップＳ１３）。検索部１７は、ステップＳ１３で用いる関連度を第２のテーブルから読み込み、ステップＳ１３で用いる関連スコアを第１のテーブルから読み込めばよい。

次に、検索部１７は、ステップＳ１３で算出した積を、検索スコアに加算する（ステップＳ１４）。

次に、検索部１７は、ステップＳ１２で選択されていない単語があるか否かを判定する（ステップＳ１５）。未選択の単語がある場合（ステップＳ１５のＹｅｓ）、検索部１７は、ステップＳ１２以降の処理を繰り返す。

未選択の単語がない場合（ステップＳ１５のＮｏ）、検索部１７は、その時点における検索スコアの値を、選択ユーザ名とキーワード単語の検索スコアとして確定し、処理を終了する。

上記の検索スコアの算出処理は、以下の式（５）で表すことができる。

式（５）において、単語ｉは、ｉ番目に選択された選択単語を意味する。

例えば、図９に示す第１のテーブル２１と図１０に示す第２のテーブル２２が記憶部５に記憶されているとする。そして、キーワード単語（検索キーワードに該当する単語）が「人工知能」であり、選択ユーザ名が「山田」であるとする。この場合、検索部１７は、以下の式によって、選択ユーザ名「山田」とキーワード単語「人工知能」の検索スコアを算出する（図９、図１０を参照）。

検索スコア＝1.00×0.80＋0.07×0.10＋0.87×0.79＋0.79×0.82＋・・・

また、選択ユーザ名が「鈴木」であるとする。この場合、検索部１７は、以下の式によって、選択ユーザ名「鈴木」とキーワード単語「人工知能」の検索スコアを算出する（図９、図１０を参照）。

検索スコア＝1.00×0.20＋0.07×0.40＋0.87×0.22＋0.79×0.18＋・・・

検索部１７は、第１のテーブル２１に記述されているユーザ名毎に、上記の処理によって検索スコアを得る。そして、検索部１７は、検索スコアが閾値以上になっているユーザ名を検索結果として得る。従って、検索結果として得られるユーザ名は、複数個となり得る。出力部８は、検索結果として得られたユーザ名を出力する。出力部８は、検索結果として得た複数のユーザ名を、検索スコアの高い順に並べて出力してもよい。

この検索方法では、単語同士の関連度を示す第２のテーブルも用いている。従って、検索者が検索キーワードとして指定した単語との関連度が高い別の単語との関連が強いユーザのユーザ名も検索結果として得ることができる。

例えば、各ユーザが属している会社において、「レッドロケッツ」および「グリーンロケッツ」が重要な製品の製品名であり、その二つの製品の関連性が強いとする。この場合、上記の検索方法によれば、「レッドロケッツ」を検索キーワードにした場合であっても、「レッドロケッツ」と関連の強いユーザのユーザ名だけでなく、「レッドロケッツ」と関連性のある「グリーンロケッツ」と関連の強いユーザのユーザ名も検索結果として得ることができる。従って、検索者が検索キーワードとして指定した単語に基づいて、ユーザ名を幅広く検索することができる。

また、本実施形態では、会社に設けられたＰＣ９１から収集した操作ログに含まれる単語を用いて、第２のテーブルを生成する。従って、上記に例示したような「レッドロケッツ」および「グリーンロケッツ」等のその会社独自で用いることの多い単語を、第２のテーブルに含めることができる。仮に、第１のテーブルや第２のテーブルを人手で作成する場合、膨大な手間がかかるだけでなく、組織独自で用いる単語等は、第１のテーブルおよび第２のテーブルから漏れやすい。従って、組織独自で用いる単語も漏らさずに、第１のテーブルや第２のテーブルを容易に作成することができ、さらに上記のように、検索キーワードとして指定した単語に基づいて、ユーザ名を幅広く検索することができる。

次に、ステップＳ６において、キーワード受付部６が選択キーワードとしてユーザ名を受け付け、検索部１７がユーザ名に応じた単語を検索する場合について説明する。以下、検索キーワードに該当するユーザ名を、キーワードユーザ名と記す。

検索部１７は、個々の単語を順次選択し、選択した単語とキーワードユーザ名の検索スコアを算出する。この選択された単語をスコア算出対象単語と記す。また、１つのスコア算出対象単語を選択した後にも、後述の説明で示すように、別途、単語を順次選択する（後述の図１３におけるステップＳ２２を参照）。後述のステップＳ２２で選択される単語を、選択単語と記す。

検索部１７が、１つのスコア算出対象単語を選択しているとする。以下に、検索部１７がスコア算出対象単語とキーワードユーザ名の検索スコアを算出する動作について説明する。図１３は、スコア算出対象単語とキーワードユーザ名の検索スコアを算出する処理の例を示すフローチャートである。

まず、検索部１７は、スコア算出対象単語の検索スコアの値を０に初期化する（ステップＳ２１）。

次に、検索部１７は、第１のテーブルの軸（第２テーブルの軸でもよい。）に並べられている単語の中から、未だステップＳ２２で選択されていない単語を１つ選択する（ステップＳ２２）。既に述べたように、ステップＳ２２で選択した単語を、選択単語と記す。なお、選択単語がスコア算出対象単語と同一である場合もあり得る。

次に、検索部１７は、キーワードユーザ名と選択単語の関連スコアと、スコア算出対象単語と選択単語の関連度との積を算出する（ステップＳ２３）。検索部１７は、ステップＳ２３で用いる関連スコアを第１のテーブルから読み込み、ステップＳ２３で用いる関連度を第２のテーブルから読み込めばよい。

次に、検索部１７は、ステップＳ２３で算出した積を、検索スコアに加算する（ステップＳ２４）。

次に、検索部１７は、ステップＳ２２で選択されていない単語があるか否かを判定する（ステップＳ２５）。未選択の単語がある場合（ステップＳ２５のＹｅｓ）、検索部１７は、ステップＳ２２以降の処理を繰り返す。

未選択の単語がない場合（ステップＳ２５のＮｏ）、検索部１７は、その時点における検索スコアの値を、スコア算出対象単語とキーワードユーザ名の検索スコアとして確定し、処理を終了する。

上記の検索スコアの算出処理は、以下の式（６）で表すことができる。

式（６）において、単語ｉは、ｉ番目に選択された選択単語を意味する。

例えば、図９に示す第１のテーブル２１と図１０に示す第２のテーブル２２が記憶部５に記憶されているとする。そして、キーワードユーザ名（検索キーワードに該当するユーザ名）が「山田」であり、スコア算出対象単語が「人工知能」であるとする。この場合、検索部１７は、以下の式によって、スコア算出対象単語「人工知能」とキーワードユーザ名「山田」の検索スコアを算出する（図９、図１０を参照）。

検索スコア＝0.08×1.00＋0.10×0.07＋0.79×0.87＋0.82×0.79＋・・・

また、スコア算出対象単語が「Ａ社」であるとする。この場合、検索部１７は、以下の式によって、スコア算出対象単語が「Ａ社」とキーワードユーザ名「山田」の検索スコアを算出する（図９、図１０を参照）。

検索スコア＝0.08×0.07＋0.10×1.00＋0.79×0.09＋0.82×0.11＋・・・

検索部１７は、順次選択するスコア算出対象単語毎に、上記の処理によって検索スコアを得る。そして、そして、検索部１７は、検索スコアが閾値以上になっている単語を検索結果として得る。従って、検索結果として得られる単語は、複数個となり得る。出力部８は、検索結果として得られた単語を出力する。出力部８は、検索結果として得た複数の単語を、検索スコアの高い順に並べて出力してもよい。

上記のようにユーザ名から単語を検索する検索方法においても、単語同士の関連度を示す第２のテーブルも用いている。従って、検索者が指定したキーワードユーザ名が表わすユーザ名との関連度が高い単語だけでなく、その単語との関連が強い別の単語も検索結果として得ることができる。

例えば、前述の例のように、各ユーザが属している会社において、「レッドロケッツ」および「グリーンロケッツ」が重要な製品の製品名であり、その二つの製品の関連性が強いとする。そして、ユーザ「山田」と単語「レッドロケッツ」との関連が強いとする。この場合、検索者がキーワードユーザ名として「山田」を指定した場合、「山田」と関連の強い単語「レッドロケッツ」だけでなく、単語「レッドロケッツ」と関連の強い「グリーンロケッツ」も検索結果として得ることができる。「レッドロケッツ」と「グリーンロケッツ」との関連が強いので、「レッドロケッツ」との関連が強い「山田」は、「グリーンロケッツ」とも関連が強いと考えられる。上記の方法によれば、検索キーワードとして指定されたユーザ名が示すユーザと関連が強いと考えられる単語を幅広く検索することができる。

また、組織独自で用いる単語も漏らさずに、第１のテーブルや第２のテーブルを容易に作成することができるという点については、既に説明した通りである。

以上に説明したように、本実施形態では、キーワード受付部６が選択キーワードとして単語を受け付け、検索部１７が単語に応じたユーザ名を検索する場合、ユーザ名を幅広く検索することができる。また、キーワード受付部６が選択キーワードとしてユーザ名を受け付け、検索部１７がユーザ名に応じた単語を検索する場合、単語を幅広く検索することができる。また、組織独自で用いる単語も漏らさずに、第１のテーブルや第２のテーブルを容易に作成することができる。

実施形態３．
図１４は、本発明の第３の実施形態の関連スコア算出システムの構成例を示すブロック図である。第３の実施形態の関連スコア算出システムは、第２の実施形態の関連スコア算出システム（図７参照）が備える構成要素に加え、さらに、クラスタリング部３１と、クラスタ出力部３２と、除外対象単語受付部３３とを備える。図１４において、図７に示す要素と同様の要素については、図７と同一の符号を付し、説明を省略する。なお、第１のテーブル生成部１１および第２のテーブル生成部１２はそれぞれ、第２の実施形態で説明した動作に加え、後述の動作も行う。

クラスタリング部３１は、第２のテーブル２２（例えば、図１０を参照）を記憶部５から読み込み、第２のテーブル２２に基づいて、第２のテーブル２２に記述されている単語に対してクラスタリングを行う。クラスタリング部３１は、例えば、ｋ－ｍｅａｎｓ法または階層型クラスタリングアルゴリズム等のクラスタリング方法によって、単語に対するクラスタリングを行う。ｋ－ｍｅａｎｓ法または階層型クラスタリングアルゴリズム等のクラスタリング方法では、第２のテーブル２２を入力データとして、第２のテーブル２２の軸に並ぶ単語に対してクラスタリングを行うことができる。クラスタリング部３１は、各クラスタに対して、クラスタの識別情報として、例えば、クラスタ番号を付し、クラスタとそのクラスタに属する単語との関係を、クラスタリング結果２３として記憶部５に記憶させる。

クラスタ出力部３２は、例えば、関連スコア算出システム１の管理者（以下、単に管理者と記す。）の端末装置（図示略）から、通信ネットワークを介して、クラスタリング結果の出力要求を受け付け、その出力要求に応じて、クラスタリング結果を示す画面の画面情報を、その端末装置（図示略）に送信する。図１５は、クラスタリング結果を示す画面の例を示す模式図である。クラスタリング結果を示す画面では、例えば、クラスタ毎に、クラスタ番号と、クラスタに属する各単語が表示される。また、各クラスタ番号および各単語とともに、それぞれチェックボックス４１が表示される。図１５に示すように、各クラスタに属する単語の数は異なっていてよい。また、クラスタリング結果を示す画面には、確定ボタン４２が含まれる。

クラスタ出力部３２は、通信ネットワークを介して、管理者の端末装置からクラスタリング結果の出力要求を受け付けると、記憶部５からクラスタリング結果２３を読み込む。そして、クラスタ出力部３２は、クラスタリング結果２３に基づいて、クラスタ番号と、そのクラスタ番号が示すクラスタに属する単語を表示するとともに、各クラスタ番号および各単語とともにそれぞれチェックボックス４１を表示し、さらに、確定ボタン４２も含む画面（例えば、図１５に例示する画面）の画面情報を生成する。そして、クラスタ出力部３２は、通信ネットワークを介して、その画面情報を管理者の端末装置に送信する。

管理者の端末装置は、クラスタ出力部３２からその画面情報を受信すると、その画面情報に基づいて、例えば、図１５に例示する画面を表示する。

管理者は、図１５に例示する画面（単語のクラスタリング結果を表示する画面）を確認し、管理者が除外すべきと判断した単語に対応するチェックボックス４１にチェックを入れる。また、管理者は、１つのクラスタに属する単語全てを除外すべきであると判断した場合、そのクラスタに対応するチェックボックス４１にチェックを入れる。単語に対応するチェックボックス４１にチェックが入れられたということは、その単語を除外すべきと判断されたことを意味する。また、クラスタに対応するチェックボックス４１にチェックが入れられたということは、そのクラスタに属する単語全てを除外すべきであると判断されたことを意味する。また、ここで、「除外すべき」とは、第１のテーブルの横軸および第２のテーブルの各軸に並ぶ単語から除外すべきであるということを意味する。

確定ボタン４２は、各単語に対する、除外すべきか否かの判断が完了したことを入力するためのボタンである。管理者の端末装置は、管理者によって確定ボタン４２をクリックされると、どのチェックボックス４１にチェックが入れられたかに応じて、管理者が除外すべきと判断した単語を判定し、管理者によって除外すべきと判断された単語を、関連スコア算出システム１に送信する。

関連スコア算出システム１の除外対象単語受付部３３は、管理者の端末装置が送信した単語（管理者によって、除外すべきと判断された単語）を、通信ネットワークを介して、受信する。除外対象単語受付部３３が受信する単語は、１つとは限らない。除外対象単語受付部３３は、第１のテーブルの横軸および第２のテーブルの各軸に並ぶ単語から除外すべき単語の指定を受け付けていると言うことができる。

除外対象単語受付部３３は、管理者の端末装置から受信した単語（除外すべき単語）を第１のテーブル生成部１１に通知する。第１のテーブル生成部１１は、その単語の通知を受けると、既に生成済みの第１のテーブル２１の横軸に並ぶ単語から、通知された単語を除外して、第１のテーブル２１を再度生成する。そして、第１のテーブル生成部１１は、記憶部５に記憶されている第１のテーブル２１を、再度生成した第１のテーブル２１で置き換える。

第１のテーブル生成部１１が第１のテーブル２１を再度生成すると、第２のテーブル生成部１２は、新たに生成された第１のテーブル２１に基づいて、第２のテーブルを再度生成する。このとき、第２のテーブル生成部１２は、除外対象単語受付部３３が受信した単語を、各軸に並ぶ単語から除外して、第２のテーブルを生成する。そして、第２のテーブル生成部１２は、記憶部５に記憶されている第２のテーブル２２を、再度生成した第２のテーブル２２で置き換える。

第１のテーブル２１を再度生成する動作および第２のテーブル２２を再度生成する動作は、それぞれ、軸に並ぶ単語数が減少している点を除けば、第２の実施形態で説明した第１のテーブル２１を生成する動作および第２のテーブル２２を生成する動作と同様である。

クラスタ出力部３２および除外対象単語受付部３３は、例えば、関連スコア算出プログラムに従って動作するコンピュータのＣＰＵおよびそのコンピュータの通信インタフェースによって実現される。また、クラスタリング部３１は、関連スコア算出プログラムに従って動作するそのコンピュータのＣＰＵによって実現される。

本実施形態によれば、管理者によって、第１のテーブルおよび第２のテーブルから除外すべきと判断された単語を、第１のテーブルおよび第２のテーブルから除外することができる。その結果、例えば、ユーザ名を検索キーワードとして、単語の検索を行う場合、管理者が除外すべき単語として指定した単語を、検索結果に含まれないようにすることができる。

管理者によって、除外すべきと判断される単語の例について説明する。例えば、ユーザ「山田」が、新規作成したり閲覧したりするファイル名に、ユーザ名「山田」を含めることがあり得る。その場合、ユーザ名「山田」を検索キーワードとして、単語の検索を行う場合に、検索結果に「山田」という単語が含まれ得る。しかし、ユーザ名「山田」を検索キーワードとして単語の検索を行う場合に、検索結果に「山田」という単語が含まれていても、検索者にとってはあまり意味がない。

そこで、管理者は、例えば、図１５に例示する画面が表示された場合、明らかに、ユーザ名と同じ文字列であると考えられる単語「山田」は除外すべきであると判断し、図１５に示す単語「山田」に対応するチェックボックス４１にチェックを入れ、確定ボタン４２をクリックすればよい。その結果、第１のテーブル生成部１１は、横軸の単語の並びから「山田」を除外した、新たな第１のテーブルを生成する。続いて、第２のテーブル生成部１２は、縦軸および横軸それぞれの単語の並びから「山田」を除外した、新たな第２のテーブルを生成する。その結果、例えば、ユーザ名「山田」を検索キーワードとして単語の検索を行う場合に、検索結果に「山田」という単語が含まれないようにすることができる。

なお、クラスタ出力部３２は、クラスタリング結果を示す画面を、関連スコア算出システム１が備えるディスプレイ装置（図示略）に表示してもよい。また、除外対象単語受付部３３は、関連スコア算出システム１が備える入力デバイス（図示略）によって、そのディスプレイ装置に表示された画面に対する操作（チェックボックス４１へのチェックの入力、および、確定ボタン４２のクリック）を受け付け、その操作に応じて、除外すべき単語の指定を受け付けてもよい。

実施形態４．
第１の実施形態から第３の実施形態では、収集部２が操作ログを収集し、単語抽出部３が、各操作ログに記述されている各ファイル名から単語を抽出し、スコア算出部４が、ファイルを操作した各ユーザと抽出された各単語の組合せ毎に、関連スコアを算出する場合を示した。

第４の実施形態では、収集部がファイルの操作ログではなく、スケジュール情報を収集する場合を例にして説明する。

図１６は、第４の実施形態の関連スコア算出システムの構成例を示すブロック図である。図１６に示す関連スコア算出システム１は、第１の実施形態における収集部２、単語抽出部３およびスコア算出部４を、収集部５２、単語抽出部５３およびスコア算出部５４に置き換えたものである。記憶部５は、第１の実施形態における記憶部５と同様である。

また、図１６に示す関連スコア算出システム１は、組織に属する各人のスケジュール情報を保持するスケジュール管理サーバ６１に、通信ネットワーク１０を介して接続されている。

収集部５２は、スケジュール管理サーバ６１に記憶されている、組織に属する各人のスケジュール情報を、スケジュール管理サーバ６１から収集する。なお、スケジュール情報は個々のＰＣ（図１６において図示略）に記憶されていてもよい。この場合、収集部５２は、その個々のＰＣから組織に属する各人のスケジュール情報を収集すればよい。

以下、組織に属する人の識別情報を、人識別情報と記す。また、人識別情報として、例えば、「山田」等の人の名を用いる場合を例にして説明する。

図１７は、スケジュール情報の例を示す模式図である。スケジュール情報は、例えば、図１７に例示するように、組織に属する人の人識別情報と、イベント名と、そのイベント名を有するイベントにその人が関わった時間帯とが関連付けて記述されている。時間帯は、開始日時および終了日時によって表される。

図１７に示す１番目のスケジュール情報は、「山田」という人が、２０１７年８月１７日１０時から同日の１２時まで、「人工知能開発会議」に関わった（換言すれば、出席した）ということを表している。以下、ある人が、あるイベントに関わった時間をイベント参加時間と記す。１つのイベントに関するイベント参加時間は、そのイベントに関連付けて記述された終了日時から開始日時を減算して得られる時間である。

単語抽出部５３は、収集部５２によって収集された各スケジュール情報に記述されている各イベント名に対して形態素解析を実行することによって、イベント名に含まれている単語を抽出する。

ただし、単語抽出部５３は、同一の単語を、重複して抽出しない。例えば、単語抽出部５３は、「人工知能」という単語を既に抽出している場合、２回目以降に抽出された「人工知能」という単語については無視する。この点は、既に説明した単語抽出部３と同様である。

例えば、単語抽出部５３は、「人工知能開発会議」というイベント名に対して形態素解析を実行することによって、「人工知能」、「開発」、「会議」等の単語を抽出する。

単語抽出部５３は、この処理を、各スケジュール情報に記述されている各イベント名に対して行うことによって、単語の集合を得る。同一の単語は重複して抽出されないので、この集合に属する単語は、互いに異なる。

スコア算出部５４は、組織に属する各人と、単語抽出部５３によって抽出された各単語の組合せ毎に、人と単語との関連の強さを示す関連スコアを算出する。この関連スコアは、第１の実施形態から第３の実施形態までにおける関連スコアと同様である。ただし、第４の実施形態では、キータッチ回数は、関連スコアとして用いられない。すなわち、単語抽出部５３は、第１の実施形態で説明した第２の算出方法で関連スコアを算出することはない。

以下、第４の実施形態における関連スコアの算出方法として、２種類の方法を説明する。以下に示す２種類のいずれの方法においても、スコア算出部５４は、人と単語の組合せ毎に、関連スコアを算出し、記憶部５に記憶させる。

第４の実施形態における関連スコアの第１の算出方法は、第１の実施形態における関連スコアの第１の算出方法と同様の方法である。ただし、ファイルの操作時間の代わりに、イベント参加時間を用いる。

第４の実施形態における関連スコアの第１の算出方法は、一の人（以下、人Ｈと記す。）と一の単語（以下、単語Ｗと記す。）の関連スコアとして、単語Ｗをイベント名に含む各イベントへの人Ｈのイベント参加時間の総和を算出する方法である。イベント参加時間が長いほど、人Ｈと単語Ｗの関連が強く、イベント参加時間が短いほど、人Ｈと単語Ｗの関連が弱いと言える。従って、イベント参加時間を、関連スコアとして用いることができる。

第１の算出方法では、スコア算出部５４は、単語Ｗをイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和を算出し、その総和を、人Ｈと単語Ｗの関連スコアとする。

すなわち、スコア算出部５４は、単語Ｗをイベント名に含み、人Ｈが参加したイベント毎にイベント参加時間を算出し、その総和を、人Ｈと単語Ｗの関連スコアとする。

第４の実施形態における関連スコアの第２の算出方法は、第１の実施形態における関連スコアの第３の算出方法と同様の方法である。ただし、ファイルの操作時間の代わりに、イベント参加時間を用いる。

本実施形態における関連スコアの第２の算出方法は、一の人（人Ｈ）と一の単語（単語Ｗ）の関連スコアを、次に説明する２つの割合に基づいて算出する方法である。この２つの割合のうち、一方の割合をＱ_１と記し、もう一方の割合をＱ_２と記す。

Ｑ_１は、単語Ｗをイベント名に含む各イベントに対する組織内の全ての人のイベント参加時間の総和に対する、単語Ｗをイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和の割合である。すなわち、Ｑ_１は、以下に示す式（７）で表される。

Ｑ_２は、個々の単語に着目した場合における、着目した単語をイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和に対する、単語Ｗをイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和の割合である。すなわち、Ｑ２は、以下に示す式（８）で表される。

Ｑ_１について説明する。単語Ｗをイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和（式（７）の右辺の分子）は、前述の第１の算出方法で算出される関連スコアに相当する。すなわち、スコア算出部５４は、前述の第１の算出方法で説明した方法で、単語Ｗをイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和を算出すればよい。

単語Ｗをイベント名に含む各イベントに対する組織内の全ての人のイベント参加時間の総和（式（７）の右辺の分母）について、説明する。スコア算出部５４は、単語Ｗをイベント名に含む各イベントに対する、組織内の一人目の人のイベント参加時間の総和も、前述の第１の算出方法で説明した方法で算出する。同様に、スコア算出部５４は、単語Ｗをイベント名に含む各イベントに対する、組織内の二人目の人のイベント参加時間の総和も、前述の第１の算出方法で説明した方法で算出する。同様に、スコア算出部５４は、組織に属する一人一人について、単語Ｗをイベント名に含む各イベントに対する人のイベント参加時間の総和を算出する。さらに、スコア算出部５４は、組織に属する一人一人について算出した「単語Ｗをイベント名に含む各イベントに対する人のイベント参加時間の総和」の総和を算出する。この値が、単語Ｗをイベント名に含む各イベントに対する組織内の全ての人のイベント参加時間の総和に該当する。

スコア算出部５４は、上記のように算出した式（７）の右辺の分子、分母を用いて、式（７）の計算により、Ｑ_１を算出する。

次に、Ｑ_２について説明する。式（８）の右辺の分子は、式（７）の右辺の分子と同じである。従って、スコア算出部５４は、前述の第１の算出方法で説明した方法で、単語Ｗをイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和を算出すればよい。

個々の単語に着目した場合における、着目した単語をイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和（式（８）の右辺の分母）について説明する。スコア算出部５４は、単語抽出部５３によって抽出された個々の単語に着目する（換言すれば、個々の単語を１つ１つ選択する）。そして、スコア算出部５４は、着目した単語（選択した単語）をイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和を、前述の第１の算出方法で説明した方法で算出する。スコア算出部５４は、次の単語に着目し（換言すれば、次の単語を選択し）、着目した単語（選択した単語）をイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和を、前述の第１の算出方法で説明した方法で算出する。このように、スコア算出部５４は、単語毎に、単語をイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和を算出する。そして、スコア算出部５４は、単語毎に算出した「単語をイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和」の総和を算出する。この値が、式（８）の分母に該当する。「個々の単語に着目した場合における、着目した単語をイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和（式（８）の右辺の分母）」は、「単語をイベント名に含む各イベントに対する人Ｈのイベント参加時間の総和を単語毎に求めた場合における前記総和の総和」であると言うことができる。

スコア算出部５４は、上記のように算出した式（８）の右辺の分子、分母を用いて、式（８）の計算により、Ｑ_２を算出する。

スコア算出部５４は、Ｑ_１，Ｑ_２を求めた後、人Ｈと単語Ｗの関連スコアを、以下に示す式（９）によって算出する。

関連スコア＝Ｑ_１×ｌｏｇ（Ｑ_２）・・・（９）

第４の実施形態における第２の算出方法で関連スコアを算出した場合、第１の実施形態で説明した第３の算出方法で関連スコアを算出した場合と同様の効果が得られる。

収集部５２は、例えば、関連スコア算出プログラムに従って動作するコンピュータのＣＰＵおよびそのコンピュータの通信インタフェースによって実現される。例えば、ＣＰＵが、コンピュータのプログラム記憶装置等のプログラム記録媒体から関連スコア算出プログラムを読み込み、関連スコア算出プログラムに従って、通信インタフェースを用いて、収集部５２として動作すればよい。また、単語抽出部５３およびスコア算出部５４も、例えば、関連スコア算出プログラムに従って動作する上記のコンピュータのＣＰＵによって実現される。すなわち、上記のように、関連スコア算出プログラムを読み込んだＣＰＵが、関連スコア算出プログラムに従って、単語抽出部５３およびスコア算出部５４として動作すればよい。記憶部５は、上記のコンピュータの記憶装置によって実現される。また、収集部５２、単語抽出部５３およびスコア算出部５４がそれぞれ別々のハードウェアによって実現されてもよい。

第４の実施形態は、第１の実施形態の変形例（図５参照）、第２の実施形態（図７参照）、および第３の実施形態（図１４参照）に適用されてもよい。すなわち、第１の実施形態の変形例（図５参照）において、収集部２、単語抽出部３およびスコア算出部４を、第４の実施形態で説明した収集部５２、単語抽出部５３およびスコア算出部５４に置き換えてもよい。また、第２の実施形態（図７参照）において、収集部２、単語抽出部３およびスコア算出部４を、第４の実施形態で説明した収集部５２、単語抽出部５３およびスコア算出部５４に置き換えてもよい。また、第３の実施形態（図１４参照）において、収集部２、単語抽出部３およびスコア算出部４を、第４の実施形態で説明した収集部５２、単語抽出部５３およびスコア算出部５４に置き換えてもよい。

図１８は、本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。コンピュータ１０００は、ＣＰＵ１００１と、主記憶装置１００２と、補助記憶装置１００３と、インタフェース１００４と、通信インタフェース１００５とを備える。

本発明の各実施形態の関連スコア算出システム１は、コンピュータ１０００に実装される。関連スコア算出システム１の動作は、関連スコア算出プログラムの形式で補助記憶装置１００３に記憶されている。ＣＰＵ１００１は、その関連スコア算出プログラムを補助記憶装置１００３から読み出して主記憶装置１００２に展開し、その関連スコア算出プログラムに従って上記の処理を実行する。

補助記憶装置１００３は、一時的でない有形の媒体の例である。一時的でない有形の媒体の他の例として、インタフェース１００４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory ）、ＤＶＤ－ＲＯＭ（Digital Versatile Disk Read Only Memory ）、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ１０００に配信される場合、配信を受けたコンピュータ１０００がそのプログラムを主記憶装置１００２に展開し、上記の処理を実行してもよい。

また、プログラムは、前述の処理の一部を実現するためのものであってもよい。さらに、プログラムは、補助記憶装置１００３に既に記憶されている他のプログラムとの組み合わせで前述の処理を実現する差分プログラムであってもよい。

また、各構成要素の一部または全部は、汎用または専用の回路（circuitry ）、プロセッサ等やこれらの組み合わせによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。

各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

次に、本発明の概要について説明する。図１９は、本発明の概要を示すブロック図である。本発明の関連スコア算出システムは、収集部８２と、単語抽出部８３と、関連スコア算出部８４とを備える。

収集部８２（例えば、収集部２）は、ユーザがファイルを操作した記録である操作ログを、端末装置から収集する。

単語抽出部８３（例えば、単語抽出部３）は、各操作ログに記述されているファイル名から単語を抽出する。

関連スコア算出部８４（例えば、スコア算出部４）は、各操作ログに基づいて、ユーザと単語との関連の強さを表す関連スコアを算出する。

そのような構成によって、組織内の人と単語との関連の強さを明確化することができる。

図２０は、本発明の概要の他の例を示すブロック図である。本発明の関連スコア算出システムは、収集部８６と、単語抽出部８７と、関連スコア算出部８８とを備える。

収集部８６（例えば、収集部５２）は、人と、イベント名と、そのイベント名を有するイベントにその人が関わった時間帯とを記述したスケジュール情報を収集する。

単語抽出部８７（例えば、単語抽出部５３）は、各スケジュール情報に記述されているイベント名から単語を抽出する。

関連スコア算出部８８（例えば、スコア算出部５４）は、各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する。

そのような構成によっても、組織内の人と単語との関連の強さを明確化することができる。

上記の本発明の各実施形態は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。

（付記１）
ユーザがファイルを操作した記録である操作ログを、端末装置から収集する収集部と、
各操作ログに記述されているファイル名から単語を抽出する単語抽出部と、
各操作ログに基づいて、ユーザと単語との関連の強さを表す関連スコアを算出する関連スコア算出部とを備える
ことを特徴とする関連スコア算出システム。

（付記２）
関連スコア算出部は、一のユーザと一の単語の関連スコアとして、前記一の単語をファイル名に含む各ファイルについての前記一のユーザの操作時間の総和を算出する
付記１に記載の関連スコア算出システム。

（付記３）
関連スコア算出部は、一のユーザと一の単語の関連スコアとして、前記一の単語をファイル名に含む各ファイルを前記一のユーザが操作した際のキータッチの回数の総和を算出する
付記１に記載の関連スコア算出システム。

（付記４）
関連スコア算出部は、
一のユーザと一の単語の関連スコアを、
前記一の単語をファイル名に含む各ファイルについての組織内の全ユーザの操作時間の総和に対する、前記一の単語をファイル名に含む各ファイルについての前記一のユーザの操作時間の総和の割合と、
単語をファイル名に含む各ファイルについての前記一のユーザの操作時間の総和を単語毎に求めた場合における前記総和の総和に対する、前記一の単語をファイル名に含む各ファイルについての前記一のユーザの操作時間の総和の割合と
に基づいて算出する
付記１に記載の関連スコア算出システム。

（付記５）
検索キーワードを受け付けるキーワード受付部と、
検索キーワードに応じて検索を実行する検索部とを備え、
前記キーワード受付部は、
検索キーワードとして単語を受け付け、
前記検索部は、
関連スコアに基づいて、前記単語に応じたユーザＩＤを検索する
付記１から付記４のうちのいずれかに記載の関連スコア算出システム。

（付記６）
検索キーワードを受け付けるキーワード受付部と、
検索キーワードに応じて検索を実行する検索部とを備え、
前記キーワード受付部は、
検索キーワードとしてユーザＩＤを受け付け、
前記検索部は、
関連スコアに基づいて、前記ユーザＩＤに応じた単語を検索する
付記１から付記５のうちのいずれかに記載の関連スコア算出システム。

（付記７）
ユーザＩＤと、単語と、関連スコアとの関係を記述した第１のテーブルを生成する第１のテーブル生成部と、
第１のテーブルに基づいて算出した単語同士の関連の強さを表す関連度を記述した第２のテーブル生成する第２のテーブル生成部と、
検索キーワードを受け付けるキーワード受付部と、
検索キーワードに応じて検索を実行する検索部とを備え、
前記キーワード受付部は、
検索キーワードとして単語を受け付け、
前記検索部は、
前記第１のテーブルおよび前記第２のテーブルに基づいて、前記単語に応じたユーザＩＤを検索する
付記１から付記４のうちのいずれかに記載の関連スコア算出システム。

（付記８）
ユーザＩＤと、単語と、関連スコアとの関係を記述した第１のテーブルを生成する第１のテーブル生成部と、
第１のテーブルに基づいて算出した単語同士の関連の強さを表す関連度を記述した第２のテーブル生成する第２のテーブル生成部と、
検索キーワードを受け付けるキーワード受付部と、
検索キーワードに応じて検索を実行する検索部とを備え、
前記キーワード受付部は、
検索キーワードとしてユーザＩＤを受け付け、
前記検索部は、
前記第１のテーブルおよび前記第２のテーブルに基づいて、前記ユーザＩＤに応じた単語を検索する
付記１から付記４および付記７のうちのいずれかに記載の関連スコア算出システム。

（付記９）
第２のテーブルに基づいて、単語をクラスタリングするクラスタリング部と、
クラスタ毎に単語を提示する単語提示部と、
提示された単語のうち、第１のテーブルおよび第２のテーブルから除外すべき単語の指定を受け付ける削除対象受付部とを備え、
第１のテーブル生成部は、
除外すべき単語として指定された単語を除外して、第１のテーブルを再度、生成し、
第２のテーブル生成部は、
前記第１のテーブルに基づいて、第２のテーブルを再度、生成する
付記７または付記８に記載の関連スコア算出システム。

（付記１０）
人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集する収集部と、
各スケジュール情報に記述されているイベント名から単語を抽出する単語抽出部と、
各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する関連スコア算出部とを備える
ことを特徴とする関連スコア算出システム。

（付記１１）
ユーザがファイルを操作した記録である操作ログを、端末装置から収集し、
各操作ログに記述されているファイル名から単語を抽出し、
各操作ログに基づいて、ユーザと単語との関連の強さを表す関連スコアを算出する
ことを特徴とする関連スコア算出方法。

（付記１２）
人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集し、
各スケジュール情報に記述されているイベント名から単語を抽出し、
各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出することを特徴とする関連スコア算出方法。

（付記１３）
コンピュータに、
ユーザがファイルを操作した記録である操作ログを、端末装置から収集する収集処理、
各操作ログに記述されているファイル名から単語を抽出する単語抽出処理、および、
各操作ログに基づいて、ユーザと単語との関連の強さを表す関連スコアを算出する関連スコア算出処理
を実行させるための関連スコア算出プログラム。

（付記１４）
コンピュータに、
人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集する収集処理、
各スケジュール情報に記述されているイベント名から単語を抽出する単語抽出処理、および、
各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する関連スコア算出処理
を実行させるための関連スコア算出プログラム。

本発明は、人と単語との関連の強さを数値化する関連スコア算出システムに好適に適用される。

１関連スコア算出システム
２，５２収集部
３，５３単語抽出部
４，５４スコア算出部
５記憶部
６キーワード受付部
７，１７検索部
８出力部
３１クラスタリング部
３２クラスタ出力部
３３除外対象単語受付部

Claims

検索者からキーワードを受け付けるキーワード受付部と、
一のユーザの各ファイルの操作時間のうち、前記キーワードをファイル名に含む各ファイルの操作時間の総和に基づいて、前記キーワードに関連するユーザを検索する検索部と
を備える検索システム。
前記検索部は、
前記キーワードをファイル名に含む各ファイルについての組織内の全ユーザの操作時間の総和に対する、前記キーワードをファイル名に含む各ファイルについての前記一のユーザの操作時間の総和の割合に基づいて、前記キーワードに関連するユーザを検索する
請求項１に記載の検索システム。
前記操作時間は、ファイルの内容を表しているウィンドウがアクティブになっている時間である
請求項１又は２に記載の検索システム。
コンピュータが、
検索者からキーワードを受け付け、
一のユーザの各ファイルの操作時間のうち、前記キーワードをファイル名に含む各ファイルの操作時間の総和に基づいて、前記キーワードに関連するユーザを検索する
検索方法。
コンピュータに、
検索者からキーワードを受け付ける処理と、
一のユーザの各ファイルの操作時間のうち、前記キーワードをファイル名に含む各ファイルの操作時間の総和に基づいて、前記キーワードに関連するユーザを検索する処理と
を実行させる検索プログラム。
検索者からキーワードを受け付けるキーワード受付部と、
一のユーザのイベントの参加時間のうち、前記キーワードをイベント名に含む各イベントの参加時間の総和に基づいて、前記キーワードに関連するユーザを検索する検索部と
を備える検索システム。
前記検索部は、
前記キーワードをイベント名に含む各イベントについての組織内の全ユーザの参加時間の総和に対する、前記キーワードをイベント名に含む各イベントについての前記一のユーザの参加時間の総和の割合に基づいて、前記キーワードに関連するユーザを検索する
請求項６に記載の検索システム。
コンピュータが、
検索者からキーワードを受け付け、
一のユーザのイベントの参加時間のうち、前記キーワードをイベント名に含む各イベントの参加時間の総和に基づいて、前記キーワードに関連するユーザを検索する
検索方法。
コンピュータに、
検索者からキーワードを受け付ける処理と、
一のユーザのイベントの参加時間のうち、前記キーワードをイベント名に含む各イベントの参加時間の総和に基づいて、前記キーワードに関連するユーザを検索する処理と
を実行させる検索プログラム。