JP2021192237A - Related score calculation system, method and program - Google Patents

Related score calculation system, method and program Download PDF

Info

Publication number
JP2021192237A
JP2021192237A JP2021124963A JP2021124963A JP2021192237A JP 2021192237 A JP2021192237 A JP 2021192237A JP 2021124963 A JP2021124963 A JP 2021124963A JP 2021124963 A JP2021124963 A JP 2021124963A JP 2021192237 A JP2021192237 A JP 2021192237A
Authority
JP
Japan
Prior art keywords
word
event
unit
person
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021124963A
Other languages
Japanese (ja)
Other versions
JP7103496B2 (en
Inventor
洋介 本橋
Yosuke Motohashi
昌子 今西
Masako Imanishi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2021124963A priority Critical patent/JP7103496B2/en
Publication of JP2021192237A publication Critical patent/JP2021192237A/en
Priority to JP2022108819A priority patent/JP7375861B2/en
Application granted granted Critical
Publication of JP7103496B2 publication Critical patent/JP7103496B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

To provide a related score calculation system capable of clarifying the strength of the relationship between a person in an organization and a word.SOLUTION: A collection unit 86 collects schedule information describing a person, an event name, and a time zone in which the person has been involved in an event having the event name. A word extraction unit 87 extracts a word from the event names described in each piece of schedule information. A related score calculation unit 88 calculates a related score indicating a strength of a relationship between the person and the word based on each piece of schedule information.SELECTED DRAWING: Figure 20

Description

本発明は、人と単語との関連の強さを数値化する関連スコア算出システム、関連スコア算出方法および関連スコア算出プログラムに関する。 The present invention relates to a related score calculation system, a related score calculation method, and a related score calculation program for quantifying the strength of a relationship between a person and a word.

特許文献1には、パーソナルコンピュータまたは携帯情報端末に導入されているアプリケーションプログラムがどの程度使用されているかを判定するために必要な情報を含む操作ログによって、ユーザが使用しているアプリケーションプログラムを判定する情報提供装置が記載されている。また、特許文献1には、情報提供装置が、ユーザがどの程度アプリケーションプログラムを使用しているかを判定したり、ユーザのアプリケーションプログラムに対する知識レベルを判定したりすることも記載されている。 Patent Document 1 determines an application program used by a user by an operation log including information necessary for determining how much the application program installed in a personal computer or a personal digital assistant is used. The information providing device to be used is described. Further, Patent Document 1 also describes that the information providing device determines how much the user is using the application program and determines the knowledge level of the user for the application program.

特許文献2には、プロファイルデータベースに、人材に関する情報の登録、削除、更新等を行い、プロファイル情報を参照して検索キーワードに合致する人材を検索する人材検索システムが記載されている。また、特許文献2には、人が著作者となっている文書のキーワードを抽出し、上位キーワードを得ることによって、人材の専門分野や業務についての情報を得ることが記載されている。 Patent Document 2 describes a human resources search system that registers, deletes, updates, etc., information about human resources in a profile database, and searches for human resources that match the search keyword by referring to the profile information. Further, Patent Document 2 describes that information on the specialized field and business of human resources can be obtained by extracting keywords of a document in which a person is the author and obtaining high-ranking keywords.

特開2013−37584号公報Japanese Unexamined Patent Publication No. 2013-37584 特開2005−327028号公報Japanese Unexamined Patent Publication No. 2005-327028

企業等の組織内において、特定の分野や技術に精通している人や、あるプロジェクトに参加したことのある人を見つけられることが好ましい。また、ある人が精通している分野、技術や、その人が参加したことのあるプロジェクトを容易に知ることができることが好ましい。しかし、大企業等の大きな組織では、「誰がどの分野やどの技術に詳しいか」、「誰がどのプロジェクトに参加したことがあるか」等は、長年、その組織にいないと分からない知識となってしまう。特に、「過去において、誰がどの分野やどの技術に詳しかったか」、「過去において、誰がどのプロジェクトに参加したか」等の情報については、その傾向が強くなる。そのため、特に、新入社員や派遣社員にとって、聞きたいことを誰にきけばよいのか分からなくなってしまう。その結果、例えば、製品開発の効率が低下する場合が生じ得る。 It is preferable to be able to find people who are familiar with a specific field or technology or who have participated in a certain project within an organization such as a company. It is also preferable to be able to easily know the fields and technologies that a person is familiar with and the projects that the person has participated in. However, in a large organization such as a large company, "who is familiar with which field and which technology", "who has participated in which project", etc. become knowledge that can only be understood by the organization for many years. It ends up. In particular, the tendency becomes stronger for information such as "who was familiar with which field and which technology in the past" and "who participated in which project in the past". Therefore, especially for new employees and dispatched employees, it becomes difficult to know who to ask what they want to hear. As a result, for example, the efficiency of product development may decrease.

そのため、本発明の発明者らは、組織内の人と、単語との関連の強さを明確化できることが好ましいと考えた。本発明の発明者らは、例えば、ある人と、「人工知能」という単語の関連の強さを明確化できれば、その人が、「人工知能」の分野や技術に詳しいかどうかや、その人が「人工知能」に関するプロジェクトに参加したことがあるかどうかを推定しやすいと考えた。 Therefore, the inventors of the present invention considered that it is preferable to be able to clarify the strength of the relationship between the person in the organization and the word. For example, if the inventors of the present invention can clarify the strength of the relationship between a person and the word "artificial intelligence", whether the person is familiar with the field or technology of "artificial intelligence" and the person I thought it would be easy to estimate if he had participated in a project on "artificial intelligence".

そこで、本発明は、組織内の人と単語との関連の強さを明確化することができる関連スコア算出システム、関連スコア算出方法および関連スコア算出プログラムを提供することを目的とする。 Therefore, an object of the present invention is to provide a related score calculation system, a related score calculation method, and a related score calculation program that can clarify the strength of the relationship between a person and a word in an organization.

また、本発明による関連スコア算出システムは、人と、イベント名と、そのイベント名を有するイベントにその人が関わった時間帯とを記述したスケジュール情報を収集する収集部と、各スケジュール情報に記述されているイベント名から単語を抽出する単語抽出部と、各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する関連スコア算出部とを備え、関連スコア算出部が、一の人と一の単語の関連スコアを、一の単語をイベント名に含む各イベントについての組織内の全ての人のイベント参加時間の総和に対する、一の単語をイベント名に含む各イベントについての一の人のイベント参加時間の総和の割合と、単語をイベント名に含む各イベントについての一の人のイベント参加時間の総和を単語毎に求めた場合におけるその総和の総和に対する、一の単語をイベント名に含む各イベントについての一の人のイベント参加時間の総和の割合とに基づいて算出することを特徴とする。 Further, the related score calculation system according to the present invention describes a person, an event name, and a collection unit that collects schedule information describing the time zone in which the person was involved in the event having the event name, and each schedule information. It is equipped with a word extraction unit that extracts words from the event names, and a related score calculation unit that calculates a related score that indicates the strength of the relationship between a person and a word based on each schedule information. However, each event that includes one word in the event name for the total event participation time of all people in the organization for each event that includes one word in the event name and the related score of one person and one word. The ratio of the total event participation time of one person for each event and the total sum of event participation time of one person for each event that includes a word in the event name are calculated for each word. It is characterized in that it is calculated based on the ratio of the total event participation time of one person for each event including the word in the event name.

また、本発明による関連スコア算出方法は、コンピュータが、人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集し、各スケジュール情報に記述されているイベント名から単語を抽出し、各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出し、関連スコアを算出するときに、一の人と一の単語の関連スコアを、一の単語をイベント名に含む各イベントについての組織内の全ての人のイベント参加時間の総和に対する、一の単語をイベント名に含む各イベントについての一の人のイベント参加時間の総和の割合と、単語をイベント名に含む各イベントについての一の人のイベント参加時間の総和を単語毎に求めた場合におけるその総和の総和に対する、一の単語をイベント名に含む各イベントについての一の人のイベント参加時間の総和の割合とに基づいて算出することを特徴とする。 Further, in the related score calculation method according to the present invention, the computer collects schedule information describing a person, an event name, and a time zone in which the person is involved in an event having the event name, and describes the schedule information in each schedule information. Words are extracted from the event name, and based on each schedule information, the relation score indicating the strength of the relation between the person and the word is calculated, and when the relation score is calculated, one person and one word The related score of is the sum of the event participation time of all people in the organization for each event that includes one word in the event name, and the event participation time of one person for each event that includes one word in the event name. For each event that includes one word in the event name for each word when the ratio of the sum of the total and the sum of the event participation time of one person for each event that includes the word in the event name is calculated for each word. It is characterized in that it is calculated based on the ratio of the total event participation time of one person.

また、本発明による関連スコア算出プログラムは、コンピュータに、人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集する収集処理、各スケジュール情報に記述されているイベント名から単語を抽出する単語抽出処理、および、各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する関連スコア算出処理を実行させ、関連スコア算出処理で、一の人と一の単語の関連スコアを、一の単語をイベント名に含む各イベントについての組織内の全ての人のイベント参加時間の総和に対する、一の単語をイベント名に含む各イベントについての一の人のイベント参加時間の総和の割合と、単語をイベント名に含む各イベントについての一の人のイベント参加時間の総和を単語毎に求めた場合におけるその総和の総和に対する、一の単語をイベント名に含む各イベントについての一の人のイベント参加時間の総和の割合とに基づいて算出させることを特徴とする。 Further, the related score calculation program according to the present invention is a collection process for collecting schedule information describing a person, an event name, and a time zone in which the person is involved in an event having the event name, and each schedule information. A word extraction process for extracting words from the event name described in, and a related score calculation process for calculating a related score indicating the strength of the relationship between a person and a word based on each schedule information are executed and related. In the score calculation process, the related score of one person and one word is included in the event name. One word is used as the event name for the total event participation time of all people in the organization for each event. For each word, the ratio of the total event participation time of one person for each event including the event and the total event participation time of one person for each event containing a word in the event name are calculated for each word. , It is characterized in that it is calculated based on the ratio of the total event participation time of one person for each event including one word in the event name.

本発明によれば、組織内の人と単語との関連の強さを明確化することができる。 According to the present invention, it is possible to clarify the strength of the relationship between a person and a word in an organization.

本発明の第1の実施形態の関連スコア算出システムの構成例を示すブロック図である。It is a block diagram which shows the structural example of the related score calculation system of 1st Embodiment of this invention. 操作ログの例を示す模式図である。It is a schematic diagram which shows the example of the operation log. ユーザと単語の組合せ毎に算出された関連スコアの例を示す模式図である。It is a schematic diagram which shows the example of the relation score calculated for each combination of a user and a word. 第1の実施形態の関連スコア算出システムの処理経過の例を示すフローチャートである。It is a flowchart which shows the example of the processing progress of the relation score calculation system of 1st Embodiment. 第1の実施形態の変形例を示すブロック図である。It is a block diagram which shows the modification of 1st Embodiment. 記憶部に記憶されているユーザ名と単語と関連スコアとの組の例を示す模式図である。It is a schematic diagram which shows the example of the set of the user name, the word, and the relation score stored in the storage part. 本発明の第2の実施形態の関連スコア算出システムの構成例を示すブロック図である。It is a block diagram which shows the structural example of the related score calculation system of the 2nd Embodiment of this invention. 関連スコア算出結果(ユーザ名と単語と関連スコアとの組の集合)の例を示す模式図である。It is a schematic diagram which shows the example of the relation score calculation result (the set of the set of the user name, the word, and the relation score). 第1のテーブルの例を示す模式図である。It is a schematic diagram which shows the example of the 1st table. 第2のテーブルの例を示す模式図である。It is a schematic diagram which shows the example of the 2nd table. 第2の実施形態の処理経過の例を示すフローチャートである。It is a flowchart which shows the example of the processing progress of 2nd Embodiment. 選択ユーザとキーワード単語の検索スコアを算出する処理の例を示すフローチャートである。It is a flowchart which shows the example of the process of calculating the search score of a selected user and a keyword word. スコア算出対象単語とキーワードユーザ名の検索スコアを算出する処理の例を示すフローチャートである。It is a flowchart which shows the example of the process of calculating the search score of the score calculation target word and the keyword user name. 本発明の第3の実施形態の関連スコア算出システムの構成例を示すブロック図である。It is a block diagram which shows the structural example of the related score calculation system of the 3rd Embodiment of this invention. クラスタリング結果を示す画面の例を示す模式図である。It is a schematic diagram which shows the example of the screen which shows the clustering result. 第4の実施形態の関連スコア算出システムの構成例を示すブロック図である。It is a block diagram which shows the structural example of the related score calculation system of 4th Embodiment. スケジュール情報の例を示す模式図である。It is a schematic diagram which shows the example of the schedule information. 本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。It is a schematic block diagram which shows the structural example of the computer which concerns on each embodiment of this invention. 本発明の概要を示すブロック図である。It is a block diagram which shows the outline of this invention. 本発明の概要の他の例を示すブロック図である。It is a block diagram which shows another example of the outline of this invention.

以下、本発明の実施形態を図面を参照して説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.

実施形態1.
図1は、本発明の第1の実施形態の関連スコア算出システムの構成例を示すブロック図である。ただし、図1では、通信ネットワークを介して本発明の関連スコア算出システムに接続されている装置も図示している。
Embodiment 1.
FIG. 1 is a block diagram showing a configuration example of a related score calculation system according to the first embodiment of the present invention. However, FIG. 1 also illustrates a device connected to the related score calculation system of the present invention via a communication network.

本発明の関連スコア算出システム1には、通信ネットワーク10を介して、パーソナルコンピュータ(以下、PCと記す。)91が接続されている。 A personal computer (hereinafter referred to as a PC) 91 is connected to the related score calculation system 1 of the present invention via a communication network 10.

PC91は、例えば、会社や企業等の組織に属する人によって使用される。各PC91は、1つの組織内に設けられているものとする。以下、組織が会社である場合を例にして説明する。ただし、PC91を使用する人が属する組織は会社や企業でなくてもよい。また、組織は、複数の会社等によって形成される組織であってもよく、また、1つの会社や企業等の一部門であってもよい。 The PC 91 is used, for example, by a person who belongs to an organization such as a company or a company. It is assumed that each PC 91 is provided in one organization. Hereinafter, the case where the organization is a company will be described as an example. However, the organization to which the person who uses the PC91 belongs does not have to be a company or a company. Further, the organization may be an organization formed by a plurality of companies or the like, or may be a department of one company or a company or the like.

個々のPC91は、ファイルを操作するユーザによって、ファイルに関する1つの操作ログを作成し、記憶する。後述するように、各PC91が記憶している操作ログは、関連スコア算出システム1(より具体的には、関連スコア算出システム1の収集部2)によって収集される。 Each PC 91 creates and stores one operation log related to the file by the user who operates the file. As will be described later, the operation log stored in each PC 91 is collected by the related score calculation system 1 (more specifically, the collecting unit 2 of the related score calculation system 1).

図2は、PC91で作成される操作ログの例を示す模式図である。操作ログは、例えば、ファイル名と、ファイルを操作したユーザのユーザ名と、操作の内容と、その操作が行われた日時とを関連付けている(図2参照)。図2では、便宜的に、操作ログの番号も図示している。なお、図2は、操作ログの例であり、操作ログは、図2に示す例に限定されない。 FIG. 2 is a schematic diagram showing an example of an operation log created by the PC 91. The operation log associates, for example, the file name, the user name of the user who operated the file, the content of the operation, and the date and time when the operation was performed (see FIG. 2). In FIG. 2, the operation log numbers are also shown for convenience. Note that FIG. 2 is an example of an operation log, and the operation log is not limited to the example shown in FIG.

PC91は、操作ログに、ファイル名として、パス名を含むファイル名を記述する。 The PC 91 describes a file name including a path name as a file name in the operation log.

また、PC91は、操作ログに記述するユーザ名を、例えば、ユーザがPC91にログインする際に用いるID(Identification)から判定すればよい。ただし、PC91がユーザ名を判定する方法は、この方法に限定されない。 Further, the PC 91 may determine the user name described in the operation log from, for example, an ID (Identification) used when the user logs in to the PC 91. However, the method by which the PC 91 determines the user name is not limited to this method.

なお、各実施形態では、ユーザID(ユーザの識別情報)として、ユーザ名を用いる。 In each embodiment, a user name is used as a user ID (user identification information).

操作ログに記述される操作内容の例として、例えば、「ファイルオープン」、「キータッチ」、「更新(保存)」、「ファイルクローズ」等が挙げられる。ただし、操作ログに記述される操作の内容は、これらに限定されず、「新規作成」等であってもよい。 Examples of the operation contents described in the operation log include "file open", "key touch", "update (save)", "file close" and the like. However, the content of the operation described in the operation log is not limited to these, and may be "new creation" or the like.

例えば、ユーザ「山田」が、2017年10月10日の13時15分に、ファイル“/・・/人工知能/・・/A社の機械学習.pptx”を開いた場合、PC91は、図2に例示する1番目の操作ログを作成する。また、例えば、ユーザ「山田」が、2017年10月10日の13時16分に、そのファイルに対して、キータッチ(キー入力)を行った場合、PC91は、図2に例示する2番目の操作ログを作成する。また、例えば、ユーザ「山田」が、2017年10月10日の15時17分に、そのファイルを更新(保存)した場合、PC91は、図2に例示するm−1番目の操作ログを作成する。また、例えば、ユーザ「山田」が、2017年10月10日の15時45分に、そのファイルを閉じた場合には、PC91は、図2に例示するm番目の操作ログを作成する。 For example, if the user "Yamada" opens the file "/ .../ Artificial Intelligence / ... / A Company's Machine Learning.pptx" at 13:15 on October 10, 2017, the PC91 will be shown in the figure. Create the first operation log illustrated in 2. Further, for example, when the user "Yamada" performs a key touch (key input) on the file at 13:16 on October 10, 2017, the PC 91 is the second example illustrated in FIG. Create an operation log of. Further, for example, when the user "Yamada" updates (saves) the file at 15:17 on October 10, 2017, the PC 91 creates the m-1st operation log illustrated in FIG. do. Further, for example, when the user "Yamada" closes the file at 15:45 on October 10, 2017, the PC 91 creates the m-th operation log illustrated in FIG. 2.

図2に示すm+1番目からn番目までの操作ログは、ユーザ「山田」が別のファイル“/・・/人工知能/・・/ディープラーニング.docx”を操作した際における操作ログの例である。 The operation logs from the m + 1st to the nth shown in FIG. 2 are examples of operation logs when the user "Yamada" operates another file "/.../ artificial intelligence / ... / deep learning.docx". ..

各PC91は、それぞれ、同様に、ユーザがファイルに対して操作を行う毎に、操作ログを追加し、記憶していく。 Similarly, each PC 91 adds and stores an operation log each time the user performs an operation on the file.

関連スコア算出システム1は、収集部2と、単語抽出部3と、スコア算出部4と、記憶部5とを備える。 The related score calculation system 1 includes a collection unit 2, a word extraction unit 3, a score calculation unit 4, and a storage unit 5.

収集部2は、各PC91から、各PC91に記憶されている操作ログを収集する。図2に示すように、個々の操作ログは、パス名を含むファイル名と、そのファイル名を有するファイルを使用したユーザのユーザ名とを含む。個々の操作ログは、ユーザと単語との関連の強さを表す指標値である関連スコアを導出可能な情報も含む。図2に示す例では、「日時」および「操作」として記載された情報が、関連スコアを導出可能な情報に該当する。ただし、関連スコアは、1つの操作ログからは導出されず、複数の操作ログから導出される。 The collecting unit 2 collects the operation log stored in each PC 91 from each PC 91. As shown in FIG. 2, each operation log includes a file name including a path name and a user name of a user who used a file having the file name. Each operation log also contains information from which the association score, which is an index value indicating the strength of the association between the user and the word, can be derived. In the example shown in FIG. 2, the information described as "date and time" and "operation" corresponds to the information from which the related score can be derived. However, the related score is not derived from one operation log, but is derived from a plurality of operation logs.

単語抽出部3は、収集部2によって収集された各操作ログに記述されている各ファイル名(パス名を含むファイル名)に対して形態素解析を実行することによって、パス名を含むファイル名に含まれている単語を抽出する。ただし、単語抽出部3は、同一の単語を、重複して抽出しない。例えば、単語抽出部3は、「人工知能」という単語を既に抽出している場合、2回目以降に抽出された「人工知能」という単語については無視する。 The word extraction unit 3 performs morphological analysis on each file name (file name including the path name) described in each operation log collected by the collection unit 2 to obtain a file name including the path name. Extract the contained words. However, the word extraction unit 3 does not extract the same word in duplicate. For example, when the word extraction unit 3 has already extracted the word "artificial intelligence", the word "artificial intelligence" extracted from the second time onward is ignored.

例えば、単語抽出部3は、“/・・/人工知能/・・/A社の機械学習.pptx”というパス名を含むファイル名に対して形態素解析を実行することによって、「人工知能」、「A社」、「機械学習」等の単語を抽出する。なお、以下の説明において、各ユーザが属している会社(組織)が「A社」であるものとして説明する。 For example, the word extraction unit 3 performs morphological analysis on a file name including the path name “/ ・ ・ / artificial intelligence / ・ ・ / machine learning of company A.pptx” to obtain “artificial intelligence”. Extract words such as "Company A" and "machine learning". In the following description, it is assumed that the company (organization) to which each user belongs is "Company A".

さらに、例えば、単語抽出部3は、“/・・/人工知能/・・/ディープラーニング.docx”というパス名を含むファイル名に対して形態素解析を実行することによって、「人工知能」、「ディープラーニング」等の単語を抽出する。ただし、前述のように、「人工知能」は既に抽出されているので、単語抽出部3は、ここで抽出された「人工知能」という単語については無視する。 Further, for example, the word extraction unit 3 performs morphological analysis on a file name including the path name “/ ・ ・ / artificial intelligence / ・ ・ / deep learning.docx” to obtain “artificial intelligence” and “artificial intelligence”. Extract words such as "deep learning". However, as described above, since "artificial intelligence" has already been extracted, the word extraction unit 3 ignores the word "artificial intelligence" extracted here.

単語抽出部3は、同様の処理を、各操作ログに記述されている各ファイル名に対して行うことによって、単語の集合を得る。これらの単語は、互いに異なる。 The word extraction unit 3 obtains a set of words by performing the same processing for each file name described in each operation log. These words are different from each other.

スコア算出部4は、ファイルを操作した各ユーザと、単語抽出部3によって抽出された各単語の組合せ毎に、ユーザと単語との関連の強さを表す指標値である関連スコアを算出する。なお、ユーザは、操作ログに記述されるユーザ名で表される。 The score calculation unit 4 calculates the association score, which is an index value indicating the strength of the association between the user and the word, for each combination of each user who operated the file and each word extracted by the word extraction unit 3. The user is represented by a user name described in the operation log.

なお、本発明の第2の実施形態等では、単語同士の関連の強さを表す指標値も用いる。本発明において、ユーザと単語との関連の強さを表す指標値を「関連スコア」と称し、単語同士の関連の強さを表す指標値を「関連度」と称することによって、2種類の指標値を区別する。 In the second embodiment of the present invention, an index value indicating the strength of the relationship between words is also used. In the present invention, the index value indicating the strength of the relationship between the user and the word is referred to as "relationship score", and the index value indicating the strength of the relationship between words is referred to as "relevance degree". Distinguish between values.

スコア算出部4は、ユーザ(ユーザ名)と単語の組合せ毎に、関連スコアを算出し、そのユーザ名と単語と関連スコアとの組を記憶部5に記憶させる。 The score calculation unit 4 calculates a related score for each combination of a user (user name) and a word, and stores the set of the user name, the word, and the related score in the storage unit 5.

記憶部5は、ユーザ(ユーザ名)と単語と関連スコアとの組を記憶する記憶装置である。 The storage unit 5 is a storage device that stores a set of a user (user name), a word, and a related score.

関連スコアの算出方法は、複数、存在する。以下、関連スコアの算出方法として、3種類の方法を説明する。以下に示す3種類のいずれの方法においても、スコア算出部4は、ユーザと単語の組合せ毎に、関連スコアを算出し、記憶部5に記憶させる。 There are multiple methods for calculating the related score. Hereinafter, three types of methods will be described as methods for calculating the related score. In any of the three types of methods shown below, the score calculation unit 4 calculates the related score for each combination of the user and the word, and stores it in the storage unit 5.

第1の算出方法は、一のユーザ(以下、ユーザUと記す。)と一の単語(以下、単語Wと記す。)の関連スコアとして、単語Wをファイル名に含む各ファイルについてのユーザUの操作時間の総和を算出する方法である。操作時間が長いほど、ユーザUと単語Wの関連が強く、操作時間が短いほど、ユーザUと単語Wの関連が弱いと言える。従って、操作時間を、関連スコアとして用いることができる。 The first calculation method is the user U for each file containing the word W in the file name as the association score between one user (hereinafter referred to as user U) and one word (hereinafter referred to as word W). It is a method of calculating the total operation time of. It can be said that the longer the operation time, the stronger the relationship between the user U and the word W, and the shorter the operation time, the weaker the relationship between the user U and the word W. Therefore, the operation time can be used as a related score.

ここではまず、実質参照時間を操作時間として扱う場合を例にして説明する。 Here, first, a case where the actual reference time is treated as the operation time will be described as an example.

なお、ファイル名は、パス名を含むファイル名である。従って、単語Wがパス名の方に含まれている場合であっても、単語Wはファイル名に含まれているものとして扱う。この点は、後述の第2の算出方法および第3の算出方法においても同様である。 The file name is a file name including a path name. Therefore, even if the word W is included in the path name, the word W is treated as if it is included in the file name. This point is the same in the second calculation method and the third calculation method described later.

実質参照時間は、PC91において、ファイルの内容を表しているウィンドウがアクティブになっている時間(すなわち、ファイルの内容を表しているウィンドウがユーザから見て一番手前に表示されている時間)である。 The actual reference time is the time during which the window representing the contents of the file is active on the PC91 (that is, the time when the window representing the contents of the file is displayed in the foreground when viewed from the user). be.

関連スコアの第1の算出方法では、スコア算出部4は、単語Wをファイル名に含む各ファイルについてのユーザUの実質参照時間の総和を算出し、その総和を、ユーザUと単語Wの関連スコアとする。 In the first calculation method of the association score, the score calculation unit 4 calculates the sum of the actual reference times of the user U for each file including the word W in the file name, and the sum is the relationship between the user U and the word W. Let it be a score.

キータッチが行われていれば、ファイルの内容を表すウィンドウはアクティブである。従って、例えば、スコア算出部4は、単語Wをファイル名に含む1つのファイルに関して、ユーザUによってキータッチが続けて行われている状態を操作ログから判断し、その状態における最初のキータッチ時刻から、最後のキータッチ時刻までの時間を、そのファイルにおけるユーザUの実質参照時間とする。 If a key touch has been made, the window showing the contents of the file is active. Therefore, for example, the score calculation unit 4 determines from the operation log the state in which the key touch is continuously performed by the user U for one file containing the word W in the file name, and the first key touch time in that state is determined. The time from to the last key touch time is taken as the actual reference time of the user U in the file.

さらに、単語Wをファイル名に含み、ユーザUに操作された他のファイルがあれば、スコア算出部4は、そのファイルに関しても同様に、実質参照時間を算出する。 Further, if the file name includes the word W and there is another file operated by the user U, the score calculation unit 4 similarly calculates the actual reference time for that file.

そして、スコア算出部4は、単語Wをファイル名に含み、ユーザUに操作されたファイル毎に算出した実質参照時間の総和を算出し、その総和をユーザUと単語Wの関連スコアとする。 Then, the score calculation unit 4 includes the word W in the file name, calculates the sum of the actual reference times calculated for each file operated by the user U, and sets the sum as the related score between the user U and the word W.

また、操作ログにおいて、アクティブ状態となった開始時刻および終了時刻を明示しているのであれば、スコア算出部4は、操作ログにおいて明示されているそれらの時刻に基づいて、実質参照時間を算出してもよい。 If the operation log clearly indicates the start time and end time of the active state, the score calculation unit 4 calculates the actual reference time based on those times specified in the operation log. You may.

また、スコア算出部4は、ファイルオープンからファイルクローズまでの時間を操作時間として算出してもよい。この場合、スコア算出部4は、単語Wをファイル名に含み、ユーザUに操作されたファイル毎に、ファイルオープンからファイルクローズまでの時間を算出し、その時間の総和をユーザUと単語Wの関連スコアとすればよい。 Further, the score calculation unit 4 may calculate the time from the file opening to the file closing as the operation time. In this case, the score calculation unit 4 includes the word W in the file name, calculates the time from the file opening to the file closing for each file operated by the user U, and the sum of the times is the sum of the time for the user U and the word W. It can be a related score.

なお、実質参照時間を操作時間として扱うことが好ましい。 It is preferable to treat the actual reference time as the operation time.

関連スコアの第2の算出方法は、一のユーザ(ユーザU)と一の単語(単語W)の関連スコアとして、単語Wをファイル名に含む各ファイルをユーザUが操作した際のキータッチの回数の総和を算出する方法である。キータッチの回数が多いほど、単語Wをファイル名に含むファイルをユーザUが操作した量が多いことになる。よって、キータッチの回数が多いほど、ユーザUと単語Wの関連が強く、キータッチの回数が少ないほど、ユーザUと単語Wの関連が弱いと言える。従って、キータッチの回数を、関連スコアとして用いることができる。 The second calculation method of the relation score is a key touch when the user U operates each file containing the word W in the file name as the relation score of one user (user U) and one word (word W). This is a method of calculating the total number of times. As the number of key touches increases, the amount of operations by the user U on the file containing the word W in the file name increases. Therefore, it can be said that the greater the number of key touches, the stronger the relationship between the user U and the word W, and the smaller the number of key touches, the weaker the relationship between the user U and the word W. Therefore, the number of key touches can be used as the related score.

第2の算出方法では、スコア算出部4は、操作ログを参照して、単語Wをファイル名に含む一つのファイルをユーザUが操作した際のキータッチの回数をカウントすることによって、そのファイルにおけるキータッチの回数を求める。 In the second calculation method, the score calculation unit 4 refers to the operation log and counts the number of key touches when the user U operates one file containing the word W in the file name. Find the number of key touches in.

さらに、単語Wをファイル名に含み、ユーザUに操作された他のファイルがあれば、スコア算出部4は、そのファイルに関しても同様に、キータッチの回数を求める。 Further, if the file name includes the word W and there is another file operated by the user U, the score calculation unit 4 similarly obtains the number of key touches for that file.

そして、スコア算出部4は、単語Wをファイル名に含み、ユーザUに操作されたファイル毎に算出したキータッチの回数の総和を算出し、その総和をユーザUと単語Wの関連スコアとする。 Then, the score calculation unit 4 includes the word W in the file name, calculates the total number of key touches calculated for each file operated by the user U, and sets the total as the related score between the user U and the word W. ..

関連スコアの第3の算出方法は、一のユーザ(ユーザU)と一の単語(単語W)の関連スコアを、次に説明する2つの割合に基づいて算出する方法である。この2つの割合のうち、一方の割合をRと記し、もう一方の割合をRと記す。 The third method of calculating the association score is a method of calculating the association score of one user (user U) and one word (word W) based on the two ratios described below. Of these two ratios, one ratio is referred to as R 1 and the other ratio is referred to as R 2 .

は、単語Wをファイル名に含む各ファイルについての組織内の全ユーザの操作時間の総和に対する、単語Wをファイル名に含む各ファイルについてのユーザUの操作時間の総和の割合である。すなわち、Rは、以下に示す式(1)で表される。 R 1 is, to the sum of the operation times of all the users in the organization for each file containing the word W in the file name, which is the ratio of the sum of the operation time of the user U for each file containing the word W in the file name. That is, R 1 is represented by the following equation (1).

Figure 2021192237
Figure 2021192237

は、個々の単語に着目した場合における、着目した単語をファイル名に含む各ファイルについてのユーザUの操作時間の総和に対する、単語Wをファイル名に含む各ファイルについてのユーザUの操作時間の総和の割合である。すなわち、Rは、以下に示す式(2)で表される。 R 2 is the operation time of the user U for each file containing the word W in the file name with respect to the total operation time of the user U for each file containing the word of interest in the file name when focusing on each word. It is the ratio of the total of. That is, R 2 is represented by the following equation (2).

Figure 2021192237
Figure 2021192237

について説明する。単語Wをファイル名に含む各ファイルについてのユーザUの操作時間の総和(式(1)の右辺の分子)は、前述の第1の算出方法で算出される関連スコアに相当する。すなわち、スコア算出部4は、前述の第1の算出方法で説明した方法で、単語Wをファイル名に含む各ファイルについてのユーザUの操作時間の総和を算出すればよい。 R 1 will be described. The sum of the operation times of the user U (the numerator on the right side of the equation (1)) for each file containing the word W in the file name corresponds to the association score calculated by the first calculation method described above. That is, the score calculation unit 4 may calculate the total operation time of the user U for each file including the word W in the file name by the method described in the first calculation method described above.

単語Wをファイル名に含む各ファイルについての組織内の全ユーザの操作時間の総和(式(1)の右辺の分母)について説明する。スコア算出部4は、単語Wをファイル名に含む各ファイルについての、組織内の一人目のユーザの操作時間の総和も、前述の第1の算出方法で説明した方法で算出する。同様に、スコア算出部4は、単語をWファイル名に含む各ファイルについての、組織内の二人目のユーザの操作時間の総和も、前述の第1の算出方法で説明した方法で算出する。同様に、スコア算出部4は、組織に属する一人一人について、単語Wをファイル名に含む各ファイルについてのユーザの操作時間の総和を算出する。さらに、スコア算出部4は、組織に属する一人一人について算出した「単語Wをファイル名に含む各ファイルについてのユーザの操作時間の総和」の総和を算出する。この値が、単語Wをファイル名に含む各ファイルについての組織内の全ユーザの操作時間の総に該当する。 The sum of the operation times of all users in the organization for each file containing the word W in the file name (the denominator on the right side of the equation (1)) will be described. The score calculation unit 4 also calculates the total operation time of the first user in the organization for each file containing the word W in the file name by the method described in the first calculation method described above. Similarly, the score calculation unit 4 also calculates the total operation time of the second user in the organization for each file containing the word in the W file name by the method described in the first calculation method described above. Similarly, the score calculation unit 4 calculates the total operation time of the user for each file including the word W in the file name for each person belonging to the organization. Further, the score calculation unit 4 calculates the sum of "the sum of the user's operation times for each file containing the word W in the file name" calculated for each person belonging to the organization. This value corresponds to the total operating time of all users in the organization for each file containing the word W in the file name.

例えば、単語Wが「人工知能」であり、ユーザUが「山田」であるとする。また、山田が属する組織「A社」に300人のユーザがいるとする。この場合、スコア算出部4は、「人工知能」をファイル名に含むファイルについてのユーザ「山田」の操作時間の総和を、式(1)の右辺の分子として求める。また、スコア算出部4は、「人工知能」をファイル名に含むファイルについてのユーザの操作時間の総和を、300人の個々のユーザ毎に算出し、さらに、個々のユーザ毎に算出した「操作時間の総和」の総和を、式(1)の右辺の分母として求める。そして、スコア算出部4は、式(1)によって、Rを算出する。 For example, assume that the word W is "artificial intelligence" and the user U is "Yamada". Further, it is assumed that there are 300 users in the organization "Company A" to which Yamada belongs. In this case, the score calculation unit 4 obtains the total operation time of the user "Yamada" for the file containing "artificial intelligence" in the file name as the numerator on the right side of the equation (1). Further, the score calculation unit 4 calculates the total operation time of the user for the file containing "artificial intelligence" in the file name for each of 300 individual users, and further calculates the "operation" for each individual user. The sum of "sum of time" is calculated as the denominator on the right side of equation (1). Then, the score calculation unit 4 calculates R 1 by the equation (1).

次に、Rについて説明する。式(2)の右辺の分子は、式(1)の右辺の分子と同じである。従って、スコア算出部4は、前述の第1の算出方法で説明した方法で、単語Wをファイル名に含む各ファイルについてのユーザUの操作時間の総和を算出すればよい。 Next, R 2 will be described. The molecule on the right side of the formula (2) is the same as the molecule on the right side of the formula (1). Therefore, the score calculation unit 4 may calculate the total operation time of the user U for each file including the word W in the file name by the method described in the first calculation method described above.

個々の単語に着目した場合における、着目した単語をファイル名に含む各ファイルについてのユーザUの操作時間の総和(式(2)の右辺の分母)について説明する。スコア算出部4は、単語抽出部3によって抽出された個々の単語に着目する(換言すれば、個々の単語を1つ1つ選択する)。そして、スコア算出部4は、着目した単語(選択した単語)をファイル名に含む各ファイルについてのユーザUの操作時間の総和を、前述の第1の算出方法で説明した方法で算出する。スコア算出部4は、次の単語に着目し(換言すれば、次の単語を選択し)、着目した単語(選択した単語)をファイル名に含む各ファイルについてのユーザUの操作時間の総和を、前述の第1の算出方法で説明した方法で算出する。このように、スコア算出部4は、単語毎に、単語をファイル名に含む各ファイルについてのユーザUの操作時間の総和を算出する。そして、スコア算出部4は、単語毎に算出した「単語をファイル名に含む各ファイルについてのユーザUの操作時間の総和」の総和を算出する。この値が、式(2)の右辺の分母に該当する。「個々の単語に着目した場合における、着目した単語をファイル名に含む各ファイルについてのユーザUの操作時間の総和(式(2)の右辺の分母)」は、「単語をファイル名に含む各ファイルについてのユーザUの操作時間の総和を単語毎に求めた場合における前記総和の総和」であると言うことができる。 The sum of the operation times of the user U (the denominator on the right side of the equation (2)) for each file including the word of interest in the file name when focusing on each word will be described. The score calculation unit 4 pays attention to the individual words extracted by the word extraction unit 3 (in other words, selects each individual word one by one). Then, the score calculation unit 4 calculates the total operation time of the user U for each file including the word of interest (selected word) in the file name by the method described in the first calculation method described above. The score calculation unit 4 focuses on the next word (in other words, selects the next word), and sums up the operation time of the user U for each file containing the focused word (selected word) in the file name. , Calculate by the method described in the above-mentioned first calculation method. In this way, the score calculation unit 4 calculates the total operation time of the user U for each file including the word in the file name for each word. Then, the score calculation unit 4 calculates the sum of "the sum of the operation times of the user U for each file including the word in the file name" calculated for each word. This value corresponds to the denominator on the right side of equation (2). "The total operation time of the user U for each file containing the word of interest in the file name when focusing on each word (the denominator on the right side of equation (2))" is "each including the word in the file name." It can be said that it is "the sum of the sums when the sum of the operation times of the user U for the file is obtained for each word".

例えば、前述の例のように、単語Wが「人工知能」であり、ユーザUが「山田」であるとする。この場合、スコア算出部4は、「人工知能」をファイル名に含むファイルについてのユーザ「山田」の操作時間の総和を、式(2)の右辺の分子として求める。また、スコア算出部4は、「人工知能」、「A社」、「ディープラーニング」等の抽出された単語毎に、単語をファイル名に含むファイルについてのユーザ「山田」の操作時間の総和を算出する。さらに、個々の単語毎に算出した「操作時間の総和」の総和を、式(2)の右辺の分母として、求める。そして、スコア算出部4は、式(2)によって、Rを算出する。 For example, as in the above example, it is assumed that the word W is "artificial intelligence" and the user U is "Yamada". In this case, the score calculation unit 4 obtains the total operation time of the user "Yamada" for the file containing "artificial intelligence" in the file name as the numerator on the right side of the equation (2). In addition, the score calculation unit 4 sums up the operation time of the user "Yamada" for the file containing the word in the file name for each extracted word such as "artificial intelligence", "company A", and "deep learning". calculate. Further, the sum of the "sum of operation times" calculated for each word is obtained as the denominator on the right side of the equation (2). Then, the score calculation unit 4 calculates R 2 by the equation (2).

スコア算出部4は、R,Rを求めた後、ユーザUと単語Wの関連スコアを、以下に示す式(3)によって算出する。 After obtaining R 1 and R 2 , the score calculation unit 4 calculates the related score between the user U and the word W by the following equation (3).

関連スコア=R×log(R) ・・・(3) Related score = R 1 x log (R 2 ) ・ ・ ・ (3)

この第3の算出方法で関連スコアを算出した場合、組織に属する多くの人に関連のある単語については、関連スコアの値が低くなり、組織に属する特定の人に関連のある単語については、関連スコアの値が高くなる。例えば、各ユーザはA社に属しているので、「A社」という単語は、各ユーザと関連があると考えられる。しかし、「A社」という単語と、各ユーザの関連が強いということは、自明であると言える。そのため、「A社」という単語と各ユーザの関連スコアを高くしても、あまり意味がなく、関連スコアを低くした方が好ましい。また、組織に属する特定のユーザのみが、「人工知能」という単語と関連している場合、そのユーザと「人工知能」という単語の関連スコアは高くした方が好ましい。第3の算出方法では、そのように、関連スコアを算出することができる。 When the association score is calculated by this third calculation method, the value of the association score is low for words related to many people belonging to the organization, and the value of the association score is low for words related to a specific person belonging to the organization. The value of the related score is high. For example, since each user belongs to company A, the word "company A" is considered to be related to each user. However, it can be said that it is self-evident that the word "Company A" is strongly related to each user. Therefore, it does not make much sense to increase the association score between the word "Company A" and each user, and it is preferable to decrease the association score. Further, when only a specific user belonging to an organization is associated with the word "artificial intelligence", it is preferable that the association score between the user and the word "artificial intelligence" is high. In the third calculation method, the related score can be calculated as such.

図3は、ユーザと単語の組合せ毎に算出された関連スコアの例を示す模式図である。図3に示す第1の関連スコアは、第1の算出方法で算出された関連スコアである。第2の関連スコアは、第2の算出方法で算出された関連スコアである。第3の関連スコアは、第3の算出方法で算出された関連スコアである。図3では、3種類の関連スコアを図示したが、スコア算出部4は、いずれか1種類の関連スコアを算出すればよい。ただし、スコア算出部4は、2種類以上の関連スコアを算出してもよい。 FIG. 3 is a schematic diagram showing an example of the association score calculated for each combination of the user and the word. The first association score shown in FIG. 3 is the association score calculated by the first calculation method. The second association score is the association score calculated by the second calculation method. The third association score is the association score calculated by the third calculation method. Although three types of related scores are shown in FIG. 3, the score calculation unit 4 may calculate any one type of related score. However, the score calculation unit 4 may calculate two or more types of related scores.

既に説明したように、スコア算出部4は、ユーザと単語の組合せ毎に、関連スコアを算出し、ユーザ名と単語と関連スコアとの組を記憶部5に記憶させる。 As described above, the score calculation unit 4 calculates the association score for each combination of the user and the word, and stores the pair of the user name, the word, and the association score in the storage unit 5.

収集部2は、例えば、関連スコア算出プログラムに従って動作するコンピュータのCPU(Central Processing Unit )およびそのコンピュータの通信インタフェースによって実現される。例えば、CPUが、コンピュータのプログラム記憶装置等のプログラム記録媒体から関連スコア算出プログラムを読み込み、関連スコア算出プログラムに従って、通信インタフェースを用いて、収集部2として動作すればよい。また、単語抽出部3およびスコア算出部4も、例えば、関連スコア算出プログラムに従って動作する上記のコンピュータのCPUによって実現される。すなわち、上記のように、関連スコア算出プログラムを読み込んだCPUが、関連スコア算出プログラムに従って、単語抽出部3およびスコア算出部4として動作すればよい。記憶部5は、上記のコンピュータの記憶装置によって実現される。また、収集部2、単語抽出部3およびスコア算出部4がそれぞれ別々のハードウェアによって実現されてもよい。 The collecting unit 2 is realized by, for example, a CPU (Central Processing Unit) of a computer operating according to a related score calculation program and a communication interface of the computer. For example, the CPU may read the related score calculation program from a program recording medium such as a program storage device of a computer, and operate as the collecting unit 2 by using the communication interface according to the related score calculation program. Further, the word extraction unit 3 and the score calculation unit 4 are also realized by, for example, the CPU of the above-mentioned computer that operates according to the related score calculation program. That is, as described above, the CPU that has read the related score calculation program may operate as the word extraction unit 3 and the score calculation unit 4 according to the related score calculation program. The storage unit 5 is realized by the storage device of the above-mentioned computer. Further, the collection unit 2, the word extraction unit 3, and the score calculation unit 4 may be realized by separate hardware.

また、関連スコア算出システム1は、2つ以上の物理的に分離した装置が有線または無線で接続されている構成であってもよい。この点は、後述する他の実施形態でも同様である。 Further, the related score calculation system 1 may be configured such that two or more physically separated devices are connected by wire or wirelessly. This point is the same in other embodiments described later.

次に、第1の実施形態の処理経過について説明する。図4は、第1の実施形態の関連スコア算出システムの処理経過の例を示すフローチャートである。なお、既に説明した事項については、詳細な説明を省略する。 Next, the processing progress of the first embodiment will be described. FIG. 4 is a flowchart showing an example of the processing progress of the related score calculation system of the first embodiment. The details of the matters already described will be omitted.

まず、収集部2が、会社内に設けられている各PC91から、操作ログを収集する(ステップS1)。 First, the collection unit 2 collects operation logs from each PC 91 provided in the company (step S1).

次に、単語抽出部3が、各操作ログに記述されているファイル名(パス名を含むファイル名)に対して形態素解析を行うことにより、単語を抽出する(ステップS2)。 Next, the word extraction unit 3 extracts words by performing morphological analysis on the file names (file names including path names) described in each operation log (step S2).

次に、スコア算出部4が、各操作ログに基づいて、操作ログに記述されているユーザ名と、ステップS2で抽出された単語との組み合わせ毎に、そのユーザ名が表わすユーザと単語との関連の強さを表す関連スコアを算出。そして、スコア算出部4は、ユーザ名と単語と関連スコアとの組を記憶部5に記憶させる(ステップS3)。スコア算出部4は、前述の第1の算出方法、第2の算出方法、および、第3の算出方法のうちの、いずれの方法で関連スコアを算出してもよい。 Next, the score calculation unit 4 sets the user and the word represented by the user name for each combination of the user name described in the operation log and the word extracted in step S2 based on each operation log. Calculate the association score that represents the strength of the association. Then, the score calculation unit 4 stores the set of the user name, the word, and the related score in the storage unit 5 (step S3). The score calculation unit 4 may calculate the related score by any of the above-mentioned first calculation method, second calculation method, and third calculation method.

この結果、記憶部5には、ユーザ名と単語と関連スコアとの組が複数組、記憶される。 As a result, a plurality of pairs of the user name, the word, and the related score are stored in the storage unit 5.

本実施形態によれば、スコア算出部4が、各操作ログに基づいて、ユーザと単語の組合せ毎に、関連スコアを算出する。そして、前述の第1の算出方法、第2の算出方法、および、第3の算出方法は、いずれも、基本的に、単語Wをファイル名に含むファイルに対するユーザUの操作の量(キータッチの回数、操作時間等)が多いほど、関連スコアとして大きな値を算出する。従って、ユーザと単語の組合せ毎に、ユーザと単語との関連の強さが、適切に数値化される。よって、組織内の人と単語との関連の強さを明確化することができる。 According to the present embodiment, the score calculation unit 4 calculates the related score for each combination of the user and the word based on each operation log. Then, in each of the above-mentioned first calculation method, second calculation method, and third calculation method, basically, the amount of operation of the user U on the file containing the word W in the file name (key touch). The larger the number of times, the operation time, etc.), the larger the value is calculated as the related score. Therefore, the strength of the relationship between the user and the word is appropriately quantified for each combination of the user and the word. Therefore, it is possible to clarify the strength of the relationship between a person and a word in an organization.

次に、第1の実施形態の変形例について説明する。図5は、第1の実施形態の変形例を示すブロック図である。図5に示す関連スコア算出システム1は、収集部2、単語抽出部3、スコア算出部4および記憶部5に加えて、キーワード受付部6と、検索部7と、出力部8とを備える。図1に示す要素と同様の要素については、図1と同一の符号を付し、説明を省略する。 Next, a modification of the first embodiment will be described. FIG. 5 is a block diagram showing a modified example of the first embodiment. The related score calculation system 1 shown in FIG. 5 includes a keyword reception unit 6, a search unit 7, and an output unit 8 in addition to the collection unit 2, the word extraction unit 3, the score calculation unit 4, and the storage unit 5. The same elements as those shown in FIG. 1 are designated by the same reference numerals as those shown in FIG. 1, and the description thereof will be omitted.

以下に示す例では、ユーザ名と、単語と、前述の第3の算出方法によって算出された関連スコアとの組が、複数、記憶部5に記憶されているものとして説明する。図6は、記憶部5に記憶されている複数の組の例を示す模式図である。 In the example shown below, it is assumed that a plurality of pairs of the user name, the word, and the related score calculated by the above-mentioned third calculation method are stored in the storage unit 5. FIG. 6 is a schematic diagram showing an example of a plurality of sets stored in the storage unit 5.

図5に例示する関連スコア算出システム1は、単語を検索キーワードとして受け付け、その単語に応じたユーザのユーザ名を検索する。あるいは、関連スコア算出システム1は、ユーザ名を検索キーワードとして受け付け、そのユーザ名に応じた単語を検索する。また、関連スコア算出システム1は、上記の2種類の検索をそれぞれ実行可能であってもよい。 The related score calculation system 1 illustrated in FIG. 5 accepts a word as a search keyword and searches for the user name of the user corresponding to the word. Alternatively, the related score calculation system 1 accepts the user name as a search keyword and searches for a word corresponding to the user name. Further, the related score calculation system 1 may be able to execute each of the above two types of searches.

キーワード受付部6は、検索者から検索キーワードを受け付ける。 The keyword reception unit 6 receives a search keyword from a searcher.

検索部7は、検索キーワードに応じて、検索を実行する。 The search unit 7 executes a search according to the search keyword.

出力部8は、検索結果を出力する。 The output unit 8 outputs the search result.

なお、キーワード受付部6は、例えば、検索者の使用する端末装置(図示略)から、通信ネットワークを介して、検索キーワードを受け付け、出力部8は、その端末装置に対して、検索結果を送信すればよい。以下、このようにキーワード受付部6が検索キーワードを受け付け、出力部8がこのように検索結果を出力する場合を例にして説明する。ただし、検索キーワードの受け付け態様や、検索結果の出力態様は、この例に限定されない。例えば、キーワード受付部6は、関連スコア算出システム1が備える入力デバイス(図示略)を介して検索キーワードを受け付けてもよい。また、出力部8は、関連スコア算出システム1が備えるディスプレイ装置(図示略)に検索結果を出力(表示)してもよい。 The keyword receiving unit 6 receives a search keyword from, for example, a terminal device (not shown) used by the searcher via a communication network, and the output unit 8 transmits the search result to the terminal device. do it. Hereinafter, a case where the keyword receiving unit 6 accepts the search keyword and the output unit 8 outputs the search result in this way will be described as an example. However, the mode of accepting search keywords and the mode of outputting search results are not limited to this example. For example, the keyword receiving unit 6 may accept a search keyword via an input device (not shown) included in the related score calculation system 1. Further, the output unit 8 may output (display) the search result to a display device (not shown) included in the related score calculation system 1.

キーワード受付部6および出力部8は、収集部2と同様に、例えば、関連スコア算出プログラムに従って動作するコンピュータのCPUおよびそのコンピュータの通信インタフェースによって実現される。また、検索部7は、関連スコア算出プログラムに従って動作するそのコンピュータのCPUによって実現される。また、キーワード受付部6、検索部7、出力部8、および他の構成要素がそれぞれ別々のハードウェアによって実現されてもよい。 Similar to the collection unit 2, the keyword reception unit 6 and the output unit 8 are realized by, for example, a CPU of a computer operating according to a related score calculation program and a communication interface of the computer. Further, the search unit 7 is realized by the CPU of the computer that operates according to the related score calculation program. Further, the keyword reception unit 6, the search unit 7, the output unit 8, and other components may be realized by separate hardware.

次に、関連スコア算出システム1が、単語を検索キーワードとして受け付け、その単語に応じたユーザのユーザ名を検索する処理の例について説明する。 Next, an example of a process in which the related score calculation system 1 accepts a word as a search keyword and searches for a user name of a user corresponding to the word will be described.

まず、キーワード受付部6が、検索者から単語を検索キーワードとして受け付ける。 First, the keyword reception unit 6 accepts a word from a searcher as a search keyword.

次に、検索部7が、記憶部5に記憶されている、ユーザ名と単語と関連スコアとの組の中から、検索キーワードに該当する単語と、閾値(例えば、0.5)以上の関連スコアを含む組を特定し、その組に含まれているユーザ名を検索結果として特定する。 Next, the search unit 7 associates the word corresponding to the search keyword with the word corresponding to the search keyword from the set of the user name, the word, and the association score stored in the storage unit 5, and the association of the threshold value (for example, 0.5) or more. Identify the set that includes the score, and identify the user names included in that set as search results.

例えば、キーワード受付部6が検索キーワードとして、「人工知能」という単語を受け付けたとする。また、上記の閾値が0.5であるとする。この場合、検索部7は、図6に例示する複数の組の中から、「人工知能」という単語と、0.5以上の関連スコアを含む組を特定する。本例では、図6に示す1番目の組が特定される。検索部7は、特定した組含まれるユーザ名「山田」を検索結果として得る。出力部8は、その検索結果を出力する。なお、検索部7は、「人工知能」という単語と、0.5以上の関連スコアを含む組が複数存在するならば、その組を全て特定し、その各組から得られるユーザ名を検索結果とする。従って、検索結果として得られるユーザ名は1つとは限らない。出力部8は、検索結果として得た複数のユーザ名を、関連スコアの高い順に並べて出力してもよい。 For example, suppose that the keyword reception unit 6 accepts the word "artificial intelligence" as a search keyword. Further, it is assumed that the above threshold value is 0.5. In this case, the search unit 7 identifies a group including the word "artificial intelligence" and a related score of 0.5 or more from the plurality of sets illustrated in FIG. In this example, the first set shown in FIG. 6 is specified. The search unit 7 obtains the user name "Yamada" included in the specified group as a search result. The output unit 8 outputs the search result. If there are a plurality of pairs including the word "artificial intelligence" and a related score of 0.5 or more, the search unit 7 identifies all the pairs and searches for the user name obtained from each pair. And. Therefore, the number of user names obtained as a search result is not limited to one. The output unit 8 may output a plurality of user names obtained as search results in descending order of the related score.

このように、単語からユーザ名が検索できるので、検索者は、検索キーワードとして指定した単語が表わす分野、技術、プロジェクト等に強く関わったユーザのユーザ名を容易に知ることができる。 Since the user name can be searched from the word in this way, the searcher can easily know the user name of the user who is strongly involved in the field, technology, project, etc. represented by the word designated as the search keyword.

次に、関連スコア算出システム1が、ユーザ名をキーワードとして受け付け、そのユーザ名に応じた単語を検索する処理の例について説明する。 Next, an example of a process in which the related score calculation system 1 accepts a user name as a keyword and searches for a word corresponding to the user name will be described.

まず、キーワード受付部6が、検索者からユーザ名を検索キーワードとして受け付ける。 First, the keyword reception unit 6 accepts a user name as a search keyword from a searcher.

次に、検索部7が、記憶部5に記憶されている、ユーザ名と単語と関連スコアとの組の中から、検索キーワードに該当するユーザ名と、閾値(例えば、0.5)以上の関連スコアを含む組を特定し、その組に含まれている単語を検索結果として特定する。このとき、検索キーワードに該当するユーザ名と、閾値以上の関連スコアを含む組が複数存在するならば、検索部7は、その組を全て特定し、その各組から得られる単語を検索結果とする。従って、検索結果として得られる単語は1つとは限らない。出力部8は、検索結果として得た複数の単語を、関連スコアの高い順に並べて出力してもよい。 Next, the search unit 7 has a user name corresponding to the search keyword and a threshold value (for example, 0.5) or more from the set of the user name, the word, and the related score stored in the storage unit 5. Identify the set that contains the relevant score, and identify the words contained in that set as search results. At this time, if there are a plurality of pairs including the user name corresponding to the search keyword and the related score equal to or higher than the threshold value, the search unit 7 identifies all the pairs, and the word obtained from each pair is used as the search result. do. Therefore, the number of words obtained as a search result is not limited to one. The output unit 8 may output a plurality of words obtained as search results in descending order of the related score.

例えば、キーワード受付部6が検索キーワードとして、「山田」というユーザ名を受け付けたとする。また、上記の閾値が0.5であるとする。この場合、検索部7は、図6に例示する複数の組の中から、「山田」というユーザ名と、0.5以上の関連スコアを含む組を特定する。本例では、図6に示す1番目の組、3番目の組および4番目の組が特定される。検索部7は、特定した各組に含まれる単語を検索結果として得る。すなわち、検索部7は、「人工知能」、「機械学習」および「ディープラーニング」を検索結果として得る。出力部8は、その検索結果を出力する。 For example, it is assumed that the keyword reception unit 6 accepts the user name "Yamada" as a search keyword. Further, it is assumed that the above threshold value is 0.5. In this case, the search unit 7 identifies a group including the user name "Yamada" and a related score of 0.5 or more from the plurality of groups illustrated in FIG. In this example, the first set, the third set, and the fourth set shown in FIG. 6 are specified. The search unit 7 obtains the words included in each specified set as the search result. That is, the search unit 7 obtains "artificial intelligence", "machine learning", and "deep learning" as search results. The output unit 8 outputs the search result.

このように、ユーザ名から単語を検索できるので、検索者は、検索キーワードとして指定したユーザ名を有する人が精通している分野、技術等を容易に推定したり、その人が参加したことがあるプロジェクト等を容易に推定したりすることができる。 In this way, since the word can be searched from the user name, the searcher can easily estimate the field, technology, etc. that the person having the user name specified as the search keyword is familiar with, or that the person participated. It is possible to easily estimate a certain project or the like.

なお、上記の閾値“0.5”は例示であり、閾値は0.5でなくてもよい。また、閾値は、関連スコアの算出方法に応じて定めておけばよい。 The above threshold value “0.5” is an example, and the threshold value does not have to be 0.5. Further, the threshold value may be set according to the calculation method of the related score.

実施形態2.
図7は、本発明の第2の実施形態の関連スコア算出システムの構成例を示すブロック図である。第1の実施形態の関連スコア算出システム(図1参照)や第1の実施形態の変形例(図5参照)に示す構成要素と同様の構成要素については、図1や図5に示す符号と同一の符号を付し、説明を省略する。
Embodiment 2.
FIG. 7 is a block diagram showing a configuration example of the related score calculation system according to the second embodiment of the present invention. The same components as those shown in the related score calculation system of the first embodiment (see FIG. 1) and the modified example of the first embodiment (see FIG. 5) are referred to as reference numerals shown in FIGS. 1 and 5. The same reference numerals are given, and the description thereof will be omitted.

第2の実施形態では、関連スコア算出システム1は、収集部2と、単語抽出部3と、スコア算出部4と、記憶部5と、第1のテーブル生成部11と、第2のテーブル生成部12と、キーワード受付部6と、検索部17と、出力部8とを備える。 In the second embodiment, the related score calculation system 1 includes a collection unit 2, a word extraction unit 3, a score calculation unit 4, a storage unit 5, a first table generation unit 11, and a second table generation. A unit 12, a keyword reception unit 6, a search unit 17, and an output unit 8 are provided.

収集部2、単語抽出部3およびスコア算出部4は、第1の実施形態(図1参照)や、第1の実施形態の変形例(図5参照)で示したそれらの各要素と同様である。 The collection unit 2, the word extraction unit 3, and the score calculation unit 4 are the same as those of the first embodiment (see FIG. 1) and the modified examples of the first embodiment (see FIG. 5). be.

また、キーワード受付部6および出力部8は、第1の実施形態の変形例(図5参照)で示したそれらの各要素と同様である。 Further, the keyword receiving unit 6 and the output unit 8 are the same as the respective elements shown in the modified example (see FIG. 5) of the first embodiment.

記憶部5は、第1の実施形態(図1参照)や、第1の実施形態の変形例(図5参照)における記憶部5と同様である。ただし、本実施形態では、記憶部5は、ユーザ名と単語と関連スコアとの組を複数組記憶するだけでなく、後述の第1のテーブル21および第2のテーブル22も記憶する。以下、スコア算出部4が記憶部5に記憶させる、ユーザ名と単語と関連スコアとの組の集合(例えば、図6に例示する複数の組)を関連スコア算出結果20と記す。 The storage unit 5 is the same as the storage unit 5 in the first embodiment (see FIG. 1) and the modified example of the first embodiment (see FIG. 5). However, in the present embodiment, the storage unit 5 not only stores a plurality of sets of the user name, the word, and the related score, but also stores the first table 21 and the second table 22, which will be described later. Hereinafter, a set of a set of a user name, a word, and a related score (for example, a plurality of sets illustrated in FIG. 6) stored in the storage unit 5 by the score calculation unit 4 is referred to as a related score calculation result 20.

また、本実施形態では、スコア算出部4が、前述の第3の算出方法で関連スコアを算出する場合を例にして説明する。ただし、スコア算出部4は、前述の第1の算出方法または第2の算出方法で関連スコアを算出してもよい。 Further, in the present embodiment, the case where the score calculation unit 4 calculates the related score by the above-mentioned third calculation method will be described as an example. However, the score calculation unit 4 may calculate the related score by the above-mentioned first calculation method or the second calculation method.

以下の説明では、スコア算出部4が、既に関連スコアを算出し、記憶部5に関連スコア算出結果20を記憶させているものとして説明する。図8は、関連スコア算出結果20(ユーザ名と単語と関連スコアとの組の集合)の例を示す模式図である。ここでは、図8に例示する関連スコア算出結果20が記憶部5に記憶されている場合を例にして説明する。 In the following description, it is assumed that the score calculation unit 4 has already calculated the related score and the storage unit 5 stores the related score calculation result 20. FIG. 8 is a schematic diagram showing an example of the related score calculation result 20 (a set of a set of a user name, a word, and a related score). Here, a case where the related score calculation result 20 illustrated in FIG. 8 is stored in the storage unit 5 will be described as an example.

第1のテーブル生成部11は、関連スコア算出結果20に基づいて、第1のテーブル21を生成し、記憶部5に記憶させる。第1のテーブル21は、ユーザIDと、単語と、関連スコアとの関係を記述したテーブルである。より具体的には、第1のテーブル21は、関連スコア算出結果20に含まれているユーザ名を縦軸と横軸のうちの一方の軸に並べ、関連スコア算出結果20に含まれている単語を他方の軸に並べ、ユーザ名と単語とが交差する欄に、そのユーザ名を有するユーザとその単語の関連スコアを記述したテーブルである。 The first table generation unit 11 generates the first table 21 based on the related score calculation result 20, and stores it in the storage unit 5. The first table 21 is a table describing the relationship between the user ID, the word, and the related score. More specifically, in the first table 21, the user names included in the related score calculation result 20 are arranged on one of the vertical axis and the horizontal axis, and are included in the related score calculation result 20. It is a table in which words are arranged on the other axis and the association score of the user having the user name and the word is described in the column where the user name and the word intersect.

本例では、第1のテーブル生成部11が、第1のテーブルを生成する際に、ユーザ名を縦軸に並べ、単語を横軸に並べる場合を例にして説明するが、第1のテーブル生成部11は、ユーザ名を横軸に並べ、単語を縦軸に並べてもよい。 In this example, when the first table generation unit 11 generates the first table, the case where the user names are arranged on the vertical axis and the words are arranged on the horizontal axis will be described as an example. The generation unit 11 may arrange the user names on the horizontal axis and the words on the vertical axis.

また、第1のテーブル生成部11は、ユーザ名を軸に沿って並べる際、同一ユーザのユーザ名を重複させずに並べる。例えば、図8に示す関連スコア算出結果20において、1番目の組にもユーザ名「山田」が含まれ、2番目の組にもユーザ名「山田」が含まれている。このユーザ名「山田」は、同一ユーザのユーザ名である。従って、第1のテーブル生成部11は、ユーザ名を軸に沿って並べる際、ユーザ名「山田」を1回並べればよい。 Further, when arranging the user names along the axis, the first table generation unit 11 arranges the user names of the same user without duplication. For example, in the related score calculation result 20 shown in FIG. 8, the user name “Yamada” is also included in the first group, and the user name “Yamada” is also included in the second group. This user name "Yamada" is a user name of the same user. Therefore, when arranging the user names along the axis, the first table generation unit 11 may arrange the user names "Yamada" once.

同様に、第1のテーブル生成部11は、単語を軸に沿って並べる際、同一の単語を重複させずに並べる。例えば、図8に示す関連スコア算出結果20において、複数の組で「人工知能」という単語が含まれている。しかし、第1のテーブル生成部11は、単語を軸に沿って並べる際、「人工知能」という単語を一回並べればよい。 Similarly, when arranging the words along the axis, the first table generation unit 11 arranges the same words without duplication. For example, in the related score calculation result 20 shown in FIG. 8, the word "artificial intelligence" is included in a plurality of sets. However, the first table generation unit 11 may arrange the word "artificial intelligence" once when arranging the words along the axis.

第1のテーブル生成部11によって生成される第1のテーブルの例を、図9に示す。第1のテーブル生成部11は、関連スコア算出結果20に含まれているユーザ名(「山田」、「鈴木」、「田中」等)を、縦軸の方向に沿って並べる(図9参照)。また、第1のテーブル生成部11は、関連スコア算出結果20に含まれている単語(「人工知能」、「A社」、「機械学習」、「ディープラーニング」等)を、横軸の方向に沿って並べる(図9参照)。 An example of the first table generated by the first table generation unit 11 is shown in FIG. The first table generation unit 11 arranges the user names (“Yamada”, “Suzuki”, “Tanaka”, etc.) included in the related score calculation result 20 along the direction of the vertical axis (see FIG. 9). .. Further, the first table generation unit 11 sets the words (“artificial intelligence”, “company A”, “machine learning”, “deep learning”, etc.) included in the related score calculation result 20 in the direction of the horizontal axis. Arrange along (see FIG. 9).

そして、第1のテーブル生成部11は、ユーザ名と単語とが交差する欄に、そのユーザ名を有するユーザとその単語の関連スコアを記述する。例えば、図8に示す例で、ユーザ名「山田」と単語「人工知能」の関連スコアは、“0.80”である。従って、第1のテーブル生成部11は、第1のテーブル21において、「山田」と「人工知能」とが交差する欄に“0.80”を記述する(図9参照)。また、例えば、図8に示す例で、ユーザ名「山田」と単語「A社」の関連スコアは、“0.10”である。従って、第1のテーブル生成部11は、第1のテーブル21において、「山田」と「A社」とが交差する欄に“0.10”を記述する。第1のテーブル生成部11は、ユーザ名と単語とが交差する欄毎に、同様に、関連スコアを記述する。 Then, the first table generation unit 11 describes the association score between the user having the user name and the word in the column where the user name and the word intersect. For example, in the example shown in FIG. 8, the association score between the user name “Yamada” and the word “artificial intelligence” is “0.80”. Therefore, the first table generation unit 11 describes "0.80" in the column where "Yamada" and "artificial intelligence" intersect in the first table 21 (see FIG. 9). Further, for example, in the example shown in FIG. 8, the related score of the user name “Yamada” and the word “Company A” is “0.10”. Therefore, the first table generation unit 11 describes "0.10" in the column where "Yamada" and "Company A" intersect in the first table 21. The first table generation unit 11 similarly describes the related score for each column where the user name and the word intersect.

第1のテーブル生成部11は、上記のようにして生成した第1のテーブル21を、記憶部5に記憶させる。 The first table generation unit 11 stores the first table 21 generated as described above in the storage unit 5.

第2のテーブル生成部12は、第1のテーブル21に基づいて、第2のテーブル22を生成し、記憶部5に記憶させる。第2のテーブルは、第1のテーブルに基づいて算出した単語同士の関連の強さを表す関連度を記述したテーブルである。より具体的には、第2のテーブル22は、縦軸と横軸の両方に単語を並べ、単語同士が交差する欄に、第1のテーブル21に基づいて算出したその単語同士の関連の強さを表す関連度を記述したテーブルである。既に説明したように、本発明では、ユーザと単語との関連の強さを表す指標値を「関連スコア」と称し、単語同士の関連の強さを表す指標値を「関連度」と称することによって、2種類の指標値を区別する。 The second table generation unit 12 generates a second table 22 based on the first table 21, and stores it in the storage unit 5. The second table is a table describing the degree of relevance representing the strength of the relevance between words calculated based on the first table. More specifically, in the second table 22, words are arranged on both the vertical axis and the horizontal axis, and in the column where the words intersect, the strength of the relationship between the words calculated based on the first table 21 is strong. It is a table that describes the degree of relevance that represents the value. As described above, in the present invention, the index value indicating the strength of the relationship between the user and the word is referred to as "relationship score", and the index value indicating the strength of the relationship between words is referred to as "relevance degree". Distinguish between two types of index values.

図10は、第2のテーブルの例を示す模式図である。本例では、第2のテーブル生成部12が、縦軸、横軸それぞれに、第1のテーブル21と同じ順番で単語を並べる場合を例にして説明する。例えば、図9に例示する第1のテーブルでは、単語が、「人工知能」、「A社」、「機械学習」、「ディープラーニング」、・・・の順に並べられている。第2のテーブル生成部12は、第2のテーブルの縦軸、横軸それぞれにおいても、その順番と同じ順番で単語を並べる(図10参照)。 FIG. 10 is a schematic diagram showing an example of the second table. In this example, a case where the second table generation unit 12 arranges words in the same order as the first table 21 on each of the vertical axis and the horizontal axis will be described as an example. For example, in the first table illustrated in FIG. 9, words are arranged in the order of "artificial intelligence", "company A", "machine learning", "deep learning", and so on. The second table generation unit 12 arranges words in the same order on the vertical axis and the horizontal axis of the second table (see FIG. 10).

そして、第2のテーブル生成部12は、1つの単語と1つの単語との組合せ毎に、その単語同士の関連の強さを表す関連度を算出し、その単語同士が交差する欄に、その関連度を記述する。なお、第2のテーブル生成部12は、同一の単語同士に関しても、関連度を算出する。例えば、第2のテーブル生成部12は、「人工知能」と「人工知能」の関連度も算出する。 Then, the second table generation unit 12 calculates the degree of relevance indicating the strength of the relevance between the words for each combination of one word and one word, and puts the relevance in the column where the words intersect. Describe the degree of relevance. The second table generation unit 12 calculates the degree of relevance even for the same words. For example, the second table generation unit 12 also calculates the degree of relevance between "artificial intelligence" and "artificial intelligence".

ここで、単語同士の関連度について説明する。まず、図9に例示する第1のテーブ21において、「人工知能」と「機械学習」という2つの単語に着目した場合について説明する。 Here, the degree of relevance between words will be described. First, in the first power strip 21 illustrated in FIG. 9, a case where two words "artificial intelligence" and "machine learning" are focused on will be described.

「人工知能」と個々のユーザの関連スコアを、第1のテーブル21におけるユーザ名順に並べると、以下のようになる。 The association scores of "artificial intelligence" and individual users are arranged in the order of user names in the first table 21 as follows.

0.80, 0.20, 0.60, 0.43,・・・ 0.80, 0.20, 0.60, 0.43, ...

また、「機械学習」と個々のユーザの関連スコアを、第1のテーブル21におけるユーザ名順に並べると、以下のようになる。 Further, the related scores of "machine learning" and each user are arranged in the order of user names in the first table 21 as follows.

0.79, 0.22, 0.58, 0.45, ・・・ 0.79, 0.22, 0.58, 0.45, ...

上記の関連スコアの並びにおける関連スコアの変化の傾向は似ていると言える。この場合、「人工知能」と「機械学習」の関連度は高いことになる。 It can be said that the tendency of the change of the related score in the above-mentioned sequence of the related score is similar. In this case, the degree of relevance between "artificial intelligence" and "machine learning" is high.

次に、「人工知能」と「A社」という2つの単語に着目した場合について説明する。 Next, a case where the two words "artificial intelligence" and "company A" are focused on will be described.

前述のように、「人工知能」と個々のユーザの関連スコアを、第1のテーブル21におけるユーザ名順に並べると、以下のようになる。 As described above, the related scores of "artificial intelligence" and individual users are arranged in the order of user names in the first table 21 as follows.

0.80, 0.20, 0.60, 0.43,・・・ 0.80, 0.20, 0.60, 0.43, ...

また、「A社」と個々のユーザの関連スコアを、第1のテーブル21におけるユーザ名順に並べると、以下のようになる。 Further, the related scores of "Company A" and each user are arranged in the order of user names in the first table 21 as follows.

0.10, 0.40,0.35, 0.05, ・・・ 0.10, 0.40, 0.35, 0.05, ...

上記の関連スコアの並びにおける関連スコアの変化の傾向は似ていないと言える。この場合、「人工知能」と「A社」の関連度は低いことになる。 It can be said that the tendency of the change of the related score in the above-mentioned sequence of related scores is not similar. In this case, the degree of relevance between "artificial intelligence" and "company A" is low.

第2のテーブル生成部12は、単語同士の関連度として、単語同士の相関係数を算出すればよい。ここでは、単語wと単語wの関連度として、単語wと単語wの相関係数を算出する場合について説明する。単語wと単語wの相関係数は、より具体的には、単語wと個々のユーザの関連スコアの並びと、単語wと個々のユーザの関連スコアの並びとの相関関数である。 The second table generation unit 12 may calculate the correlation coefficient between words as the degree of relevance between words. Here, as relevance of a word w 1 and word w 2, it will be described for calculating a correlation coefficient of words w 1 and word w 2. Correlation coefficient of words w 1 and word w 2, more specifically, the arrangement of words w 1 and related scores for individual users, the correlation function of the sequence of words w 2 and associated scores for individual users be.

1つの単語と個々のユーザの関連スコアを、第1のテーブル21におけるユーザ名順に並べた場合における関連スコア(数値)の並びを、その単語の系列と称することとする。例えば、図9に示す例において、「人工知能」の系列は、以下のようになる。 The sequence of related scores (numerical values) when the related scores of one word and each user are arranged in the order of user names in the first table 21 is referred to as a sequence of the words. For example, in the example shown in FIG. 9, the series of "artificial intelligence" is as follows.

0.80, 0.20, 0.60, 0.43,・・・ 0.80, 0.20, 0.60, 0.43, ...

単語wの系列が(x,x,・・・,x)であるとする。そして、この系列をxとする。なお、図9に示す例では、単語の系列は、数値を縦方向に並べたものであるが、ここでは、便宜的に、(x,x,・・・,x)と横に並べて示す。この点は、次に述べる単語wについても同様である。 It is assumed that the sequence of the word w 1 is (x 1 , x 2 , ..., X n). Then, let x be this series. In the example shown in FIG. 9, the word sequence is a series of words arranged in the vertical direction, but here, for convenience, (x 1 , x 2 , ..., X n ) and horizontally. Shown side by side. This is also true for the word w 2 described next.

また、単語wの系列が(y,y,・・・,y)であるとする。そして、この系列をyとする。 Further, it is assumed that the sequence of words w 2 is (y 1 , y 2 , ..., Y n). Then, let y be this series.

上記のように系列に属する関連スコアの数をn個とする。 As described above, the number of related scores belonging to the series is n.

第2のテーブル生成部12は、単語wと単語wの関連度として、xとyの相関係数を算出すればよい。xとyの相関係数をrとする。第2のテーブル生成部12は、以下に示す式(4)の計算により、xとyの相関係数rを算出する。 Second table generator 12, a relevance of words w 1 and word w 2, may be calculated a correlation coefficient of x and y. Let r be the correlation coefficient between x and y. The second table generation unit 12 calculates the correlation coefficient r between x and y by the calculation of the following equation (4).

Figure 2021192237
Figure 2021192237

式(4)において、sxyは、xとyの共分散である。また、sは、xの標準偏差であり、sは、yの標準偏差である。xは、xにおけるi番目の関連スコアである。yは、yにおけるi番目の関連スコアである。 In equation (4), s xy is a covariance of x and y. Further, s x is the standard deviation of x, and sy is the standard deviation of y. x i is the i-th association score in x. y i is the i-th association score in y.

Figure 2021192237
は、xの平均値である。
Figure 2021192237
Is the average value of x.

Figure 2021192237
は、yの平均値である。
Figure 2021192237
Is the average value of y.

第2のテーブル生成部12は、1つの単語と1つの単語との組合せ毎に、式(4)の計算により、相関係数を算出し、その相関係数を関連度として、第2のテーブル22に記述する。組み合わせをなす2つの単語が異なる単語である場合、その2つの単語の関連度は、第2のテーブル22において、2箇所に記述される。例えば、図10に示す例において、「人工知能」と「A社」の関連度は、第1行第2列と、第2行第1列にそれぞれ記述される。 The second table generation unit 12 calculates the correlation coefficient by the calculation of the equation (4) for each combination of one word and one word, and uses the correlation coefficient as the degree of relevance as the second table. 22 is described. When two words in a combination are different words, the degree of relevance of the two words is described in two places in the second table 22. For example, in the example shown in FIG. 10, the degree of relevance between "artificial intelligence" and "company A" is described in the first row and the second column and the second row and the first column, respectively.

第2のテーブル生成部12は、上記のようにして生成した第2のテーブル22を、記憶部5に記憶させる。 The second table generation unit 12 stores the second table 22 generated as described above in the storage unit 5.

第2の実施形態の関連スコア算出システム1は、単語を検索キーワードとして受け付け、その単語に応じたユーザのユーザ名を検索する。あるいは、第2の実施形態の関連スコア算出システム1は、ユーザ名を検索キーワードとして受け付け、そのユーザ名に応じた単語を検索する。また、第2の実施形態の関連スコア算出システム1は、上記の2種類の検索をそれぞれ実行可能であってもよい。 The related score calculation system 1 of the second embodiment accepts a word as a search keyword and searches for the user name of the user corresponding to the word. Alternatively, the related score calculation system 1 of the second embodiment accepts the user name as a search keyword and searches for a word corresponding to the user name. Further, the related score calculation system 1 of the second embodiment may be capable of executing each of the above two types of searches.

検索者に指定された単語に応じたユーザのユーザ名を検索する場合、キーワード受付部6が、検索者から単語を検索キーワードとして受け付ける。そして、検索部17は、第1のテーブル21および第2のテーブル22に基づいて、検索キーワードに該当する単語に応じたユーザ名を検索する。 When searching for a user name of a user corresponding to a word designated as a searcher, the keyword receiving unit 6 accepts the word from the searcher as a search keyword. Then, the search unit 17 searches for the user name corresponding to the word corresponding to the search keyword based on the first table 21 and the second table 22.

また、検索者に指定されたユーザ名に応じた単語を検索する場合、キーワード受付部6が、検索者からユーザ名を検索キーワードとして受け付ける。そして、検索部17は、第1のテーブル21および第2のテーブル22に基づいて、検索キーワードに該当するユーザ名に応じた単語を検索する。 Further, when searching for a word corresponding to the user name designated by the searcher, the keyword receiving unit 6 accepts the user name from the searcher as a search keyword. Then, the search unit 17 searches for a word corresponding to the user name corresponding to the search keyword based on the first table 21 and the second table 22.

第2の実施形態において、収集部2、キーワード受付部6および出力部8は、関連スコア算出プログラムに従って動作するコンピュータのCPUおよびそのコンピュータの通信インタフェースによって実現される。例えば、CPUが、コンピュータのプログラム記憶装置等のプログラム記録媒体から関連スコア算出プログラムを読み込み、関連スコア算出プログラムに従って、通信インタフェースを用いて、収集部2、キーワード受付部6および出力部8として動作すればよい。また、単語抽出部3、スコア算出部4、第1のテーブル生成部11、第2のテーブル生成部12および検索部17も、例えば、関連スコア算出プログラムに従って動作する上記のコンピュータのCPUによって実現される。すなわち、上記のように、関連スコア算出プログラムを読み込んだCPUが、関連スコア算出プログラムに従って、単語抽出部3、スコア算出部4、第1のテーブル生成部11、第2のテーブル生成部12および検索部17として動作すればよい。また、収集部2、キーワード受付部6、出力部8、単語抽出部3、スコア算出部4、第1のテーブル生成部11、第2のテーブル生成部12および検索部17がそれぞれ別々のハードウェアによって実現されてもよい。 In the second embodiment, the collection unit 2, the keyword reception unit 6, and the output unit 8 are realized by the CPU of the computer operating according to the related score calculation program and the communication interface of the computer. For example, the CPU reads a related score calculation program from a program recording medium such as a program storage device of a computer, and operates as a collecting unit 2, a keyword receiving unit 6, and an output unit 8 using a communication interface according to the related score calculation program. Just do it. Further, the word extraction unit 3, the score calculation unit 4, the first table generation unit 11, the second table generation unit 12, and the search unit 17 are also realized by, for example, the CPU of the above computer operating according to the related score calculation program. To. That is, as described above, the CPU that has read the related score calculation program performs the word extraction unit 3, the score calculation unit 4, the first table generation unit 11, the second table generation unit 12, and the search according to the related score calculation program. It may operate as a unit 17. Further, the collection unit 2, the keyword reception unit 6, the output unit 8, the word extraction unit 3, the score calculation unit 4, the first table generation unit 11, the second table generation unit 12, and the search unit 17 have separate hardware. May be realized by.

図11は、第2の実施形態の処理経過の例を示すフローチャートである。第1の実施形態で説明した動作と同様の動作や、第2の実施形態で既に説明した動作については、詳細な説明を省略する。 FIG. 11 is a flowchart showing an example of the processing progress of the second embodiment. Detailed description of the operation similar to the operation described in the first embodiment and the operation already described in the second embodiment will be omitted.

ステップS1〜ステップS3は、第1の実施形態におけるステップS1〜S3(図4参照)と同様であり、説明を省略する。 Steps S1 to S3 are the same as steps S1 to S3 (see FIG. 4) in the first embodiment, and the description thereof will be omitted.

ステップS3の次に、第1のテーブル生成部11は、関連スコア算出結果20に基づいて、第1のテーブル21(図9参照)を生成し、第1のテーブル21を記憶部5に記憶させる(ステップS4)。第1のテーブル21を生成する動作については、既に説明したので、ここでは説明を省略する。 After step S3, the first table generation unit 11 generates the first table 21 (see FIG. 9) based on the related score calculation result 20, and stores the first table 21 in the storage unit 5. (Step S4). Since the operation of generating the first table 21 has already been described, the description thereof will be omitted here.

次に、第2のテーブル生成部12は、第1のテーブル21に基づいて、第2のテーブル22(図10参照)を生成し、第2のテーブル22を記憶部5に記憶させる(ステップS5)。第2のテーブル22を生成する動作についても、既に説明したので、ここでは説明を省略する。 Next, the second table generation unit 12 generates a second table 22 (see FIG. 10) based on the first table 21, and stores the second table 22 in the storage unit 5 (step S5). ). Since the operation of generating the second table 22 has already been described, the description thereof will be omitted here.

第1のテーブル21および第2のテーブル22が生成された後に、キーワード受付部6は、検索者から、検索キーワードを受け付ける(ステップS6)。キーワード受付部6は、検索キーワードとして、単語を受け付けてもよい。また、キーワード受付部6は、検索キーワードとして、ユーザ名を受け付けてもよい。 After the first table 21 and the second table 22 are generated, the keyword receiving unit 6 receives the search keyword from the searcher (step S6). The keyword reception unit 6 may accept a word as a search keyword. Further, the keyword receiving unit 6 may accept a user name as a search keyword.

次に、検索部17は、第1のテーブル21および第2のテーブル22に基づいて、検索キーワードに応じた検索結果を求める(ステップS7)。検索キーワードが単語である場合、検索部17は、第1のテーブル21および第2のテーブル22に基づいて、その単語に応じたユーザ名を検索する。また、検索キーワードがユーザ名である場合、検索部17は、第1のテーブル21および第2のテーブル22に基づいて、そのユーザ名に応じた単語を検索する。ステップS7の動作の詳細については、後述する。 Next, the search unit 17 obtains search results according to the search keyword based on the first table 21 and the second table 22 (step S7). When the search keyword is a word, the search unit 17 searches for a user name corresponding to the word based on the first table 21 and the second table 22. When the search keyword is a user name, the search unit 17 searches for a word corresponding to the user name based on the first table 21 and the second table 22. The details of the operation of step S7 will be described later.

ステップS7の後、出力部8が検索結果を出力する(ステップS8)。出力部8が検索結果を出力する態様は、第1の実施形態の変形例と同様である。 After step S7, the output unit 8 outputs the search result (step S8). The mode in which the output unit 8 outputs the search result is the same as the modification of the first embodiment.

次に、ステップS7の動作について説明する。まず、ステップS6において、キーワード受付部6が選択キーワードとして単語を受け付け、検索部17が単語に応じたユーザ名を検索する場合について説明する。以下、検索キーワードに該当する単語を、キーワード単語と記す。 Next, the operation of step S7 will be described. First, in step S6, a case where the keyword receiving unit 6 accepts a word as a selection keyword and the search unit 17 searches for a user name corresponding to the word will be described. Hereinafter, the word corresponding to the search keyword is referred to as a keyword word.

検索部17は、個々のユーザ名を順次選択し、選択したユーザ名(以下、選択ユーザ名と記す。)とキーワード単語の検索スコアを算出する。検索スコアは、選択ユーザ名を有するユーザと単語の関連の強さを示す指標値であるが、既に説明した関連スコアを用いて算出され、関連スコアとは算出方法が異なる。そのため、以下の説明では、関連スコアと区別して、検索スコアという語を用いる。 The search unit 17 sequentially selects individual user names, and calculates a search score for the selected user name (hereinafter referred to as a selected user name) and a keyword word. The search score is an index value indicating the strength of the association between the user having the selected user name and the word, but it is calculated using the association score already described, and the calculation method is different from the association score. Therefore, in the following description, the term search score is used to distinguish it from the related score.

検索部17が、1つの選択ユーザ名を選択しているとする。検索部17が選択ユーザ名とキーワード単語の検索スコアを算出する動作について説明する。図12は、選択ユーザとキーワード単語の検索スコアを算出する処理の例を示すフローチャートである。 It is assumed that the search unit 17 has selected one selected user name. The operation of the search unit 17 to calculate the search score of the selected user name and the keyword word will be described. FIG. 12 is a flowchart showing an example of a process of calculating the search score of the selected user and the keyword word.

まず、検索部17は、選択ユーザ名の検索スコアの値を0に初期化する(ステップS11)。 First, the search unit 17 initializes the value of the search score of the selected user name to 0 (step S11).

次に、検索部17は、第1のテーブルの軸(第2テーブルの軸でもよい。)に並べられている単語の中から、未だステップS12で選択されていない単語を1つ選択する(ステップS12)。ステップS12で選択した単語を、以下、選択単語と記す。なお、選択単語がキーワード単語と同一である場合もあり得る。 Next, the search unit 17 selects one word that has not yet been selected in step S12 from the words arranged on the axis of the first table (may be the axis of the second table) (step). S12). The word selected in step S12 is hereinafter referred to as a selected word. The selected word may be the same as the keyword word.

次に、検索部17は、キーワード単語と選択単語の関連度と、選択ユーザ名と選択単語の関連スコアとの積を算出する(ステップS13)。検索部17は、ステップS13で用いる関連度を第2のテーブルから読み込み、ステップS13で用いる関連スコアを第1のテーブルから読み込めばよい。 Next, the search unit 17 calculates the product of the degree of relevance between the keyword word and the selected word and the relevance score between the selected user name and the selected word (step S13). The search unit 17 may read the relevance degree used in step S13 from the second table and the relevance score used in step S13 from the first table.

次に、検索部17は、ステップS13で算出した積を、検索スコアに加算する(ステップS14)。 Next, the search unit 17 adds the product calculated in step S13 to the search score (step S14).

次に、検索部17は、ステップS12で選択されていない単語があるか否かを判定する(ステップS15)。未選択の単語がある場合(ステップS15のYes)、検索部17は、ステップS12以降の処理を繰り返す。 Next, the search unit 17 determines whether or not there is a word not selected in step S12 (step S15). If there is an unselected word (Yes in step S15), the search unit 17 repeats the processes after step S12.

未選択の単語がない場合(ステップS15のNo)、検索部17は、その時点における検索スコアの値を、選択ユーザ名とキーワード単語の検索スコアとして確定し、処理を終了する。 When there is no unselected word (No in step S15), the search unit 17 determines the value of the search score at that time as the search score of the selected user name and the keyword word, and ends the process.

上記の検索スコアの算出処理は、以下の式(5)で表すことができる。 The above search score calculation process can be expressed by the following equation (5).

Figure 2021192237
Figure 2021192237

式(5)において、単語iは、i番目に選択された選択単語を意味する。 In equation (5), the word i means the i-th selected selected word.

例えば、図9に示す第1のテーブル21と図10に示す第2のテーブル22が記憶部5に記憶されているとする。そして、キーワード単語(検索キーワードに該当する単語)が「人工知能」であり、選択ユーザ名が「山田」であるとする。この場合、検索部17は、以下の式によって、選択ユーザ名「山田」とキーワード単語「人工知能」の検索スコアを算出する(図9、図10を参照)。 For example, it is assumed that the first table 21 shown in FIG. 9 and the second table 22 shown in FIG. 10 are stored in the storage unit 5. Then, it is assumed that the keyword word (word corresponding to the search keyword) is "artificial intelligence" and the selected user name is "Yamada". In this case, the search unit 17 calculates the search score of the selected user name "Yamada" and the keyword word "artificial intelligence" by the following formula (see FIGS. 9 and 10).

検索スコア=1.00×0.80+0.07×0.10+0.87×0.79+0.79×0.82+・・・ Search score = 1.00 x 0.80 + 0.07 x 0.10 + 0.87 x 0.79 + 0.79 x 0.82 + ...

また、選択ユーザ名が「鈴木」であるとする。この場合、検索部17は、以下の式によって、選択ユーザ名「鈴木」とキーワード単語「人工知能」の検索スコアを算出する(図9、図10を参照)。 Further, it is assumed that the selected user name is "Suzuki". In this case, the search unit 17 calculates the search score of the selected user name "Suzuki" and the keyword word "artificial intelligence" by the following formula (see FIGS. 9 and 10).

検索スコア=1.00×0.20+0.07×0.40+0.87×0.22+0.79×0.18+・・・ Search score = 1.00 x 0.20 + 0.07 x 0.40 + 0.87 x 0.22 + 0.79 x 0.18 + ...

検索部17は、第1のテーブル21に記述されているユーザ名毎に、上記の処理によって検索スコアを得る。そして、検索部17は、検索スコアが閾値以上になっているユーザ名を検索結果として得る。従って、検索結果として得られるユーザ名は、複数個となり得る。出力部8は、検索結果として得られたユーザ名を出力する。出力部8は、検索結果として得た複数のユーザ名を、検索スコアの高い順に並べて出力してもよい。 The search unit 17 obtains a search score by the above processing for each user name described in the first table 21. Then, the search unit 17 obtains a user name whose search score is equal to or higher than the threshold value as a search result. Therefore, the number of user names obtained as a search result may be plural. The output unit 8 outputs the user name obtained as the search result. The output unit 8 may output a plurality of user names obtained as search results in descending order of search score.

この検索方法では、単語同士の関連度を示す第2のテーブルも用いている。従って、検索者が検索キーワードとして指定した単語との関連度が高い別の単語との関連が強いユーザのユーザ名も検索結果として得ることができる。 This search method also uses a second table showing the degree of relevance between words. Therefore, the user name of a user who is strongly related to another word which is highly related to the word specified by the searcher as the search keyword can also be obtained as the search result.

例えば、各ユーザが属している会社において、「レッドロケッツ」および「グリーンロケッツ」が重要な製品の製品名であり、その二つの製品の関連性が強いとする。この場合、上記の検索方法によれば、「レッドロケッツ」を検索キーワードにした場合であっても、「レッドロケッツ」と関連の強いユーザのユーザ名だけでなく、「レッドロケッツ」と関連性のある「グリーンロケッツ」と関連の強いユーザのユーザ名も検索結果として得ることができる。従って、検索者が検索キーワードとして指定した単語に基づいて、ユーザ名を幅広く検索することができる。 For example, in the company to which each user belongs, "Red Rockets" and "Green Rockets" are product names of important products, and the two products are strongly related. In this case, according to the above search method, even if "Red Rockets" is used as the search keyword, not only the user name of the user who is strongly related to "Red Rockets" but also the user name related to "Red Rockets". The user name of a user who is strongly related to a certain "Green Rockets" can also be obtained as a search result. Therefore, it is possible to search a wide range of user names based on the words specified by the searcher as the search keyword.

また、本実施形態では、会社に設けられたPC91から収集した操作ログに含まれる単語を用いて、第2のテーブルを生成する。従って、上記に例示したような「レッドロケッツ」および「グリーンロケッツ」等のその会社独自で用いることの多い単語を、第2のテーブルに含めることができる。仮に、第1のテーブルや第2のテーブルを人手で作成する場合、膨大な手間がかかるだけでなく、組織独自で用いる単語等は、第1のテーブルおよび第2のテーブルから漏れやすい。従って、組織独自で用いる単語も漏らさずに、第1のテーブルや第2のテーブルを容易に作成することができ、さらに上記のように、検索キーワードとして指定した単語に基づいて、ユーザ名を幅広く検索することができる。 Further, in the present embodiment, the second table is generated by using the words included in the operation log collected from the PC 91 provided in the company. Therefore, words often used by the company such as "Red Rockets" and "Green Rockets" as exemplified above can be included in the second table. If the first table and the second table are manually created, not only is it time-consuming, but also words and the like used by the organization are likely to leak from the first table and the second table. Therefore, it is possible to easily create the first table and the second table without leaking the words used by the organization, and as described above, a wide range of user names are used based on the words specified as the search keywords. You can search.

次に、ステップS6において、キーワード受付部6が選択キーワードとしてユーザ名を受け付け、検索部17がユーザ名に応じた単語を検索する場合について説明する。以下、検索キーワードに該当するユーザ名を、キーワードユーザ名と記す。 Next, in step S6, a case where the keyword receiving unit 6 accepts a user name as a selection keyword and the search unit 17 searches for a word corresponding to the user name will be described. Hereinafter, the user name corresponding to the search keyword is referred to as a keyword user name.

検索部17は、個々の単語を順次選択し、選択した単語とキーワードユーザ名の検索スコアを算出する。この選択された単語をスコア算出対象単語と記す。また、1つのスコア算出対象単語を選択した後にも、後述の説明で示すように、別途、単語を順次選択する(後述の図13におけるステップS22を参照)。後述のステップS22で選択される単語を、選択単語と記す。 The search unit 17 sequentially selects individual words and calculates a search score for the selected word and the keyword user name. This selected word is referred to as a score calculation target word. Further, even after selecting one score calculation target word, the words are separately sequentially selected as described later (see step S22 in FIG. 13 described later). The word selected in step S22 described later is referred to as a selected word.

検索部17が、1つのスコア算出対象単語を選択しているとする。以下に、検索部17がスコア算出対象単語とキーワードユーザ名の検索スコアを算出する動作について説明する。図13は、スコア算出対象単語とキーワードユーザ名の検索スコアを算出する処理の例を示すフローチャートである。 It is assumed that the search unit 17 has selected one score calculation target word. The operation of the search unit 17 to calculate the search score of the score calculation target word and the keyword user name will be described below. FIG. 13 is a flowchart showing an example of a process of calculating the search score of the score calculation target word and the keyword user name.

まず、検索部17は、スコア算出対象単語の検索スコアの値を0に初期化する(ステップS21)。 First, the search unit 17 initializes the value of the search score of the score calculation target word to 0 (step S21).

次に、検索部17は、第1のテーブルの軸(第2テーブルの軸でもよい。)に並べられている単語の中から、未だステップS22で選択されていない単語を1つ選択する(ステップS22)。既に述べたように、ステップS22で選択した単語を、選択単語と記す。なお、選択単語がスコア算出対象単語と同一である場合もあり得る。 Next, the search unit 17 selects one word that has not yet been selected in step S22 from the words arranged on the axis of the first table (may be the axis of the second table) (step). S22). As described above, the word selected in step S22 is referred to as a selected word. The selected word may be the same as the score calculation target word.

次に、検索部17は、キーワードユーザ名と選択単語の関連スコアと、スコア算出対象単語と選択単語の関連度との積を算出する(ステップS23)。検索部17は、ステップS23で用いる関連スコアを第1のテーブルから読み込み、ステップS23で用いる関連度を第2のテーブルから読み込めばよい。 Next, the search unit 17 calculates the product of the relevance score between the keyword user name and the selected word and the relevance degree between the score calculation target word and the selected word (step S23). The search unit 17 may read the association score used in step S23 from the first table and the association degree used in step S23 from the second table.

次に、検索部17は、ステップS23で算出した積を、検索スコアに加算する(ステップS24)。 Next, the search unit 17 adds the product calculated in step S23 to the search score (step S24).

次に、検索部17は、ステップS22で選択されていない単語があるか否かを判定する(ステップS25)。未選択の単語がある場合(ステップS25のYes)、検索部17は、ステップS22以降の処理を繰り返す。 Next, the search unit 17 determines whether or not there is a word not selected in step S22 (step S25). If there is an unselected word (Yes in step S25), the search unit 17 repeats the processes after step S22.

未選択の単語がない場合(ステップS25のNo)、検索部17は、その時点における検索スコアの値を、スコア算出対象単語とキーワードユーザ名の検索スコアとして確定し、処理を終了する。 When there is no unselected word (No in step S25), the search unit 17 determines the value of the search score at that time as the search score of the word to be scored and the keyword user name, and ends the process.

上記の検索スコアの算出処理は、以下の式(6)で表すことができる。 The above search score calculation process can be expressed by the following equation (6).

Figure 2021192237
Figure 2021192237

式(6)において、単語iは、i番目に選択された選択単語を意味する。 In equation (6), the word i means the i-th selected selected word.

例えば、図9に示す第1のテーブル21と図10に示す第2のテーブル22が記憶部5に記憶されているとする。そして、キーワードユーザ名(検索キーワードに該当するユーザ名)が「山田」であり、スコア算出対象単語が「人工知能」であるとする。この場合、検索部17は、以下の式によって、スコア算出対象単語「人工知能」とキーワードユーザ名「山田」の検索スコアを算出する(図9、図10を参照)。 For example, it is assumed that the first table 21 shown in FIG. 9 and the second table 22 shown in FIG. 10 are stored in the storage unit 5. Then, it is assumed that the keyword user name (user name corresponding to the search keyword) is "Yamada" and the score calculation target word is "artificial intelligence". In this case, the search unit 17 calculates the search score of the score calculation target word "artificial intelligence" and the keyword user name "Yamada" by the following formula (see FIGS. 9 and 10).

検索スコア=0.08×1.00+0.10×0.07+0.79×0.87+0.82×0.79+・・・ Search score = 0.08 x 1.00 + 0.10 x 0.07 + 0.79 x 0.87 + 0.82 x 0.79 + ...

また、スコア算出対象単語が「A社」であるとする。この場合、検索部17は、以下の式によって、スコア算出対象単語が「A社」とキーワードユーザ名「山田」の検索スコアを算出する(図9、図10を参照)。 Further, it is assumed that the word for which the score is calculated is "Company A". In this case, the search unit 17 calculates the search score for the score calculation target word "Company A" and the keyword user name "Yamada" by the following formula (see FIGS. 9 and 10).

検索スコア=0.08×0.07+0.10×1.00+0.79×0.09+0.82×0.11+・・・ Search score = 0.08 x 0.07 + 0.10 x 1.00 + 0.79 x 0.09 + 0.82 x 0.11 + ...

検索部17は、順次選択するスコア算出対象単語毎に、上記の処理によって検索スコアを得る。そして、そして、検索部17は、検索スコアが閾値以上になっている単語を検索結果として得る。従って、検索結果として得られる単語は、複数個となり得る。出力部8は、検索結果として得られた単語を出力する。出力部8は、検索結果として得た複数の単語を、検索スコアの高い順に並べて出力してもよい。 The search unit 17 obtains a search score by the above processing for each score calculation target word to be sequentially selected. Then, the search unit 17 obtains a word whose search score is equal to or higher than the threshold value as a search result. Therefore, the number of words obtained as a search result may be plural. The output unit 8 outputs the word obtained as the search result. The output unit 8 may output a plurality of words obtained as search results in descending order of search score.

上記のようにユーザ名から単語を検索する検索方法においても、単語同士の関連度を示す第2のテーブルも用いている。従って、検索者が指定したキーワードユーザ名が表わすユーザ名との関連度が高い単語だけでなく、その単語との関連が強い別の単語も検索結果として得ることができる。 In the search method for searching for a word from a user name as described above, a second table showing the degree of relevance between words is also used. Therefore, not only a word having a high degree of relevance to the user name represented by the keyword user name designated by the searcher but also another word having a strong relevance to the word can be obtained as a search result.

例えば、前述の例のように、各ユーザが属している会社において、「レッドロケッツ」および「グリーンロケッツ」が重要な製品の製品名であり、その二つの製品の関連性が強いとする。そして、ユーザ「山田」と単語「レッドロケッツ」との関連が強いとする。この場合、検索者がキーワードユーザ名として「山田」を指定した場合、「山田」と関連の強い単語「レッドロケッツ」だけでなく、単語「レッドロケッツ」と関連の強い「グリーンロケッツ」も検索結果として得ることができる。「レッドロケッツ」と「グリーンロケッツ」との関連が強いので、「レッドロケッツ」との関連が強い「山田」は、「グリーンロケッツ」とも関連が強いと考えられる。上記の方法によれば、検索キーワードとして指定されたユーザ名が示すユーザと関連が強いと考えられる単語を幅広く検索することができる。 For example, as in the above example, in the company to which each user belongs, "Red Rockets" and "Green Rockets" are product names of important products, and it is assumed that the two products are strongly related. Then, it is assumed that the user "Yamada" and the word "Red Rockets" are strongly related. In this case, if the searcher specifies "Yamada" as the keyword user name, not only the word "Red Rockets" that is strongly related to "Yamada" but also the word "Green Rockets" that is strongly related to the word "Red Rockets" will be searched. Can be obtained as. Since "Red Rockets" and "Green Rockets" are strongly related, "Yamada", which is strongly related to "Red Rockets", is considered to be strongly related to "Green Rockets". According to the above method, it is possible to search a wide range of words that are considered to be strongly related to the user indicated by the user name specified as the search keyword.

また、組織独自で用いる単語も漏らさずに、第1のテーブルや第2のテーブルを容易に作成することができるという点については、既に説明した通りである。 Further, as described above, the first table and the second table can be easily created without leaking the words used by the organization.

以上に説明したように、本実施形態では、キーワード受付部6が選択キーワードとして単語を受け付け、検索部17が単語に応じたユーザ名を検索する場合、ユーザ名を幅広く検索することができる。また、キーワード受付部6が選択キーワードとしてユーザ名を受け付け、検索部17がユーザ名に応じた単語を検索する場合、単語を幅広く検索することができる。また、組織独自で用いる単語も漏らさずに、第1のテーブルや第2のテーブルを容易に作成することができる。 As described above, in the present embodiment, when the keyword receiving unit 6 accepts a word as a selection keyword and the search unit 17 searches for a user name corresponding to the word, the user name can be widely searched. Further, when the keyword receiving unit 6 accepts a user name as a selection keyword and the search unit 17 searches for a word corresponding to the user name, the word can be widely searched. In addition, the first table and the second table can be easily created without leaking the words used by the organization.

実施形態3.
図14は、本発明の第3の実施形態の関連スコア算出システムの構成例を示すブロック図である。第3の実施形態の関連スコア算出システムは、第2の実施形態の関連スコア算出システム(図7参照)が備える構成要素に加え、さらに、クラスタリング部31と、クラスタ出力部32と、除外対象単語受付部33とを備える。図14において、図7に示す要素と同様の要素については、図7と同一の符号を付し、説明を省略する。なお、第1のテーブル生成部11および第2のテーブル生成部12はそれぞれ、第2の実施形態で説明した動作に加え、後述の動作も行う。
Embodiment 3.
FIG. 14 is a block diagram showing a configuration example of the related score calculation system according to the third embodiment of the present invention. In addition to the components included in the related score calculation system of the second embodiment (see FIG. 7), the related score calculation system of the third embodiment further includes a clustering unit 31, a cluster output unit 32, and excluded words. It is equipped with a reception unit 33. In FIG. 14, the same elements as those shown in FIG. 7 are designated by the same reference numerals as those in FIG. 7, and the description thereof will be omitted. The first table generation unit 11 and the second table generation unit 12 perform the operations described later in addition to the operations described in the second embodiment, respectively.

クラスタリング部31は、第2のテーブル22(例えば、図10を参照)を記憶部5から読み込み、第2のテーブル22に基づいて、第2のテーブル22に記述されている単語に対してクラスタリングを行う。クラスタリング部31は、例えば、k−means法または階層型クラスタリングアルゴリズム等のクラスタリング方法によって、単語に対するクラスタリングを行う。k−means法または階層型クラスタリングアルゴリズム等のクラスタリング方法では、第2のテーブル22を入力データとして、第2のテーブル22の軸に並ぶ単語に対してクラスタリングを行うことができる。クラスタリング部31は、各クラスタに対して、クラスタの識別情報として、例えば、クラスタ番号を付し、クラスタとそのクラスタに属する単語との関係を、クラスタリング結果23として記憶部5に記憶させる。 The clustering unit 31 reads the second table 22 (see, for example, FIG. 10) from the storage unit 5, and clusters the words described in the second table 22 based on the second table 22. conduct. The clustering unit 31 clusters words by, for example, a clustering method such as a k-means method or a hierarchical clustering algorithm. In a clustering method such as the k-means method or a hierarchical clustering algorithm, clustering can be performed on words arranged on the axis of the second table 22 using the second table 22 as input data. The clustering unit 31 assigns, for example, a cluster number to each cluster as cluster identification information, and stores the relationship between the cluster and the word belonging to the cluster in the storage unit 5 as the clustering result 23.

クラスタ出力部32は、例えば、関連スコア算出システム1の管理者(以下、単に管理者と記す。)の端末装置(図示略)から、通信ネットワークを介して、クラスタリング結果の出力要求を受け付け、その出力要求に応じて、クラスタリング結果を示す画面の画面情報を、その端末装置(図示略)に送信する。図15は、クラスタリング結果を示す画面の例を示す模式図である。クラスタリング結果を示す画面では、例えば、クラスタ毎に、クラスタ番号と、クラスタに属する各単語が表示される。また、各クラスタ番号および各単語とともに、それぞれチェックボックス41が表示される。図15に示すように、各クラスタに属する単語の数は異なっていてよい。また、クラスタリング結果を示す画面には、確定ボタン42が含まれる。 The cluster output unit 32 receives, for example, a clustering result output request from a terminal device (not shown) of an administrator of the related score calculation system 1 (hereinafter, simply referred to as an administrator) via a communication network. In response to the output request, the screen information of the screen showing the clustering result is transmitted to the terminal device (not shown). FIG. 15 is a schematic diagram showing an example of a screen showing a clustering result. On the screen showing the clustering result, for example, the cluster number and each word belonging to the cluster are displayed for each cluster. In addition, a check box 41 is displayed together with each cluster number and each word. As shown in FIG. 15, the number of words belonging to each cluster may be different. Further, the screen showing the clustering result includes a confirmation button 42.

クラスタ出力部32は、通信ネットワークを介して、管理者の端末装置からクラスタリング結果の出力要求を受け付けると、記憶部5からクラスタリング結果23を読み込む。そして、クラスタ出力部32は、クラスタリング結果23に基づいて、クラスタ番号と、そのクラスタ番号が示すクラスタに属する単語を表示するとともに、各クラスタ番号および各単語とともにそれぞれチェックボックス41を表示し、さらに、確定ボタン42も含む画面(例えば、図15に例示する画面)の画面情報を生成する。そして、クラスタ出力部32は、通信ネットワークを介して、その画面情報を管理者の端末装置に送信する。 When the cluster output unit 32 receives a clustering result output request from the administrator's terminal device via the communication network, the cluster output unit 32 reads the clustering result 23 from the storage unit 5. Then, the cluster output unit 32 displays the cluster number and the word belonging to the cluster indicated by the cluster number based on the clustering result 23, displays each cluster number and the check box 41 together with each word, and further. The screen information of the screen including the confirmation button 42 (for example, the screen illustrated in FIG. 15) is generated. Then, the cluster output unit 32 transmits the screen information to the terminal device of the administrator via the communication network.

管理者の端末装置は、クラスタ出力部32からその画面情報を受信すると、その画面情報に基づいて、例えば、図15に例示する画面を表示する。 When the administrator's terminal device receives the screen information from the cluster output unit 32, the administrator's terminal device displays, for example, the screen illustrated in FIG. 15 based on the screen information.

管理者は、図15に例示する画面(単語のクラスタリング結果を表示する画面)を確認し、管理者が除外すべきと判断した単語に対応するチェックボックス41にチェックを入れる。また、管理者は、1つのクラスタに属する単語全てを除外すべきであると判断した場合、そのクラスタに対応するチェックボックス41にチェックを入れる。単語に対応するチェックボックス41にチェックが入れられたということは、その単語を除外すべきと判断されたことを意味する。また、クラスタに対応するチェックボックス41にチェックが入れられたということは、そのクラスタに属する単語全てを除外すべきであると判断されたことを意味する。また、ここで、「除外すべき」とは、第1のテーブルの横軸および第2のテーブルの各軸に並ぶ単語から除外すべきであるということを意味する。 The administrator confirms the screen illustrated in FIG. 15 (the screen displaying the clustering result of the word), and checks the check box 41 corresponding to the word determined to be excluded by the administrator. If the administrator determines that all words belonging to one cluster should be excluded, the check box 41 corresponding to that cluster is checked. The fact that the check box 41 corresponding to a word is checked means that it is determined that the word should be excluded. Further, the fact that the check box 41 corresponding to the cluster is checked means that it is determined that all the words belonging to the cluster should be excluded. Further, here, "to be excluded" means that the word should be excluded from the words arranged on the horizontal axis of the first table and each axis of the second table.

確定ボタン42は、各単語に対する、除外すべきか否かの判断が完了したことを入力するためのボタンである。管理者の端末装置は、管理者によって確定ボタン42をクリックされると、どのチェックボックス41にチェックが入れられたかに応じて、管理者が除外すべきと判断した単語を判定し、管理者によって除外すべきと判断された単語を、関連スコア算出システム1に送信する。 The confirmation button 42 is a button for inputting that the determination as to whether or not to exclude each word has been completed. When the confirmation button 42 is clicked by the administrator, the terminal device of the administrator determines a word that the administrator has determined to be excluded according to which check box 41 is checked, and the administrator determines. Words determined to be excluded are transmitted to the related score calculation system 1.

関連スコア算出システム1の除外対象単語受付部33は、管理者の端末装置が送信した単語(管理者によって、除外すべきと判断された単語)を、通信ネットワークを介して、受信する。除外対象単語受付部33が受信する単語は、1つとは限らない。除外対象単語受付部33は、第1のテーブルの横軸および第2のテーブルの各軸に並ぶ単語から除外すべき単語の指定を受け付けていると言うことができる。 The exclusion target word reception unit 33 of the related score calculation system 1 receives the words transmitted by the terminal device of the administrator (words determined by the administrator to be excluded) via the communication network. The number of words received by the exclusion target word reception unit 33 is not limited to one. It can be said that the exclusion target word reception unit 33 accepts the designation of words to be excluded from the words arranged on the horizontal axis of the first table and each axis of the second table.

除外対象単語受付部33は、管理者の端末装置から受信した単語(除外すべき単語)を第1のテーブル生成部11に通知する。第1のテーブル生成部11は、その単語の通知を受けると、既に生成済みの第1のテーブル21の横軸に並ぶ単語から、通知された単語を除外して、第1のテーブル21を再度生成する。そして、第1のテーブル生成部11は、記憶部5に記憶されている第1のテーブル21を、再度生成した第1のテーブル21で置き換える。 The exclusion target word reception unit 33 notifies the first table generation unit 11 of the words (words to be excluded) received from the terminal device of the administrator. Upon receiving the notification of the word, the first table generation unit 11 excludes the notified word from the words arranged on the horizontal axis of the already generated first table 21, and re-uses the first table 21. Generate. Then, the first table generation unit 11 replaces the first table 21 stored in the storage unit 5 with the regenerated first table 21.

第1のテーブル生成部11が第1のテーブル21を再度生成すると、第2のテーブル生成部12は、新たに生成された第1のテーブル21に基づいて、第2のテーブルを再度生成する。このとき、第2のテーブル生成部12は、除外対象単語受付部33が受信した単語を、各軸に並ぶ単語から除外して、第2のテーブルを生成する。そして、第2のテーブル生成部12は、記憶部5に記憶されている第2のテーブル22を、再度生成した第2のテーブル22で置き換える。 When the first table generation unit 11 regenerates the first table 21, the second table generation unit 12 regenerates the second table based on the newly generated first table 21. At this time, the second table generation unit 12 excludes the words received by the exclusion target word reception unit 33 from the words arranged on each axis to generate the second table. Then, the second table generation unit 12 replaces the second table 22 stored in the storage unit 5 with the second table 22 generated again.

第1のテーブル21を再度生成する動作および第2のテーブル22を再度生成する動作は、それぞれ、軸に並ぶ単語数が減少している点を除けば、第2の実施形態で説明した第1のテーブル21を生成する動作および第2のテーブル22を生成する動作と同様である。 The operation of regenerating the first table 21 and the operation of regenerating the second table 22 are the first described in the second embodiment, except that the number of words arranged on the axis is reduced. It is the same as the operation of generating the table 21 and the operation of generating the second table 22.

クラスタ出力部32および除外対象単語受付部33は、例えば、関連スコア算出プログラムに従って動作するコンピュータのCPUおよびそのコンピュータの通信インタフェースによって実現される。また、クラスタリング部31は、関連スコア算出プログラムに従って動作するそのコンピュータのCPUによって実現される。 The cluster output unit 32 and the exclusion target word reception unit 33 are realized, for example, by the CPU of a computer operating according to the related score calculation program and the communication interface of the computer. Further, the clustering unit 31 is realized by the CPU of the computer that operates according to the related score calculation program.

本実施形態によれば、管理者によって、第1のテーブルおよび第2のテーブルから除外すべきと判断された単語を、第1のテーブルおよび第2のテーブルから除外することができる。その結果、例えば、ユーザ名を検索キーワードとして、単語の検索を行う場合、管理者が除外すべき単語として指定した単語を、検索結果に含まれないようにすることができる。 According to the present embodiment, words determined by the administrator to be excluded from the first table and the second table can be excluded from the first table and the second table. As a result, for example, when searching for a word using a user name as a search keyword, the word specified by the administrator as a word to be excluded can be prevented from being included in the search result.

管理者によって、除外すべきと判断される単語の例について説明する。例えば、ユーザ「山田」が、新規作成したり閲覧したりするファイル名に、ユーザ名「山田」を含めることがあり得る。その場合、ユーザ名「山田」を検索キーワードとして、単語の検索を行う場合に、検索結果に「山田」という単語が含まれ得る。しかし、ユーザ名「山田」を検索キーワードとして単語の検索を行う場合に、検索結果に「山田」という単語が含まれていても、検索者にとってはあまり意味がない。 Here are some examples of words that the administrator decides should be excluded. For example, the user name "Yamada" may be included in the file name newly created or browsed by the user "Yamada". In that case, when searching for a word using the user name "Yamada" as a search keyword, the word "Yamada" may be included in the search result. However, when searching for a word using the user name "Yamada" as a search keyword, even if the search result includes the word "Yamada", it does not make much sense to the searcher.

そこで、管理者は、例えば、図15に例示する画面が表示された場合、明らかに、ユーザ名と同じ文字列であると考えられる単語「山田」は除外すべきであると判断し、図15に示す単語「山田」に対応するチェックボックス41にチェックを入れ、確定ボタン42をクリックすればよい。その結果、第1のテーブル生成部11は、横軸の単語の並びから「山田」を除外した、新たな第1のテーブルを生成する。続いて、第2のテーブル生成部12は、縦軸および横軸それぞれの単語の並びから「山田」を除外した、新たな第2のテーブルを生成する。その結果、例えば、ユーザ名「山田」を検索キーワードとして単語の検索を行う場合に、検索結果に「山田」という単語が含まれないようにすることができる。 Therefore, for example, when the screen illustrated in FIG. 15 is displayed, the administrator determines that the word "Yamada", which is clearly considered to be the same character string as the user name, should be excluded, and FIG. 15 Check the check box 41 corresponding to the word "Yamada" shown in 1 and click the confirm button 42. As a result, the first table generation unit 11 generates a new first table excluding "Yamada" from the sequence of words on the horizontal axis. Subsequently, the second table generation unit 12 generates a new second table by excluding "Yamada" from the sequence of words on the vertical axis and the horizontal axis. As a result, for example, when searching for a word using the user name "Yamada" as a search keyword, it is possible to prevent the word "Yamada" from being included in the search results.

なお、クラスタ出力部32は、クラスタリング結果を示す画面を、関連スコア算出システム1が備えるディスプレイ装置(図示略)に表示してもよい。また、除外対象単語受付部33は、関連スコア算出システム1が備える入力デバイス(図示略)によって、そのディスプレイ装置に表示された画面に対する操作(チェックボックス41へのチェックの入力、および、確定ボタン42のクリック)を受け付け、その操作に応じて、除外すべき単語の指定を受け付けてもよい。 The cluster output unit 32 may display a screen showing the clustering result on a display device (not shown) included in the related score calculation system 1. Further, the exclusion target word receiving unit 33 operates on the screen displayed on the display device by the input device (not shown) included in the related score calculation system 1 (input of a check in the check box 41 and the confirmation button 42). (Click) may be accepted, and the designation of words to be excluded may be accepted according to the operation.

実施形態4.
第1の実施形態から第3の実施形態では、収集部2が操作ログを収集し、単語抽出部3が、各操作ログに記述されている各ファイル名から単語を抽出し、スコア算出部4が、ファイルを操作した各ユーザと抽出された各単語の組合せ毎に、関連スコアを算出する場合を示した。
Embodiment 4.
In the first to third embodiments, the collection unit 2 collects the operation log, the word extraction unit 3 extracts words from each file name described in each operation log, and the score calculation unit 4 Shown the case where the association score is calculated for each combination of each user who operated the file and each extracted word.

第4の実施形態では、収集部がファイルの操作ログではなく、スケジュール情報を収集する場合を例にして説明する。 In the fourth embodiment, a case where the collecting unit collects schedule information instead of the operation log of the file will be described as an example.

図16は、第4の実施形態の関連スコア算出システムの構成例を示すブロック図である。図16に示す関連スコア算出システム1は、第1の実施形態における収集部2、単語抽出部3およびスコア算出部4を、収集部52、単語抽出部53およびスコア算出部54に置き換えたものである。記憶部5は、第1の実施形態における記憶部5と同様である。 FIG. 16 is a block diagram showing a configuration example of the related score calculation system of the fourth embodiment. The related score calculation system 1 shown in FIG. 16 replaces the collection unit 2, the word extraction unit 3, and the score calculation unit 4 in the first embodiment with the collection unit 52, the word extraction unit 53, and the score calculation unit 54. be. The storage unit 5 is the same as the storage unit 5 in the first embodiment.

また、図16に示す関連スコア算出システム1は、組織に属する各人のスケジュール情報を保持するスケジュール管理サーバ61に、通信ネットワーク10を介して接続されている。 Further, the related score calculation system 1 shown in FIG. 16 is connected to the schedule management server 61 that holds the schedule information of each person belonging to the organization via the communication network 10.

収集部52は、スケジュール管理サーバ61に記憶されている、組織に属する各人のスケジュール情報を、スケジュール管理サーバ61から収集する。なお、スケジュール情報は個々のPC(図16において図示略)に記憶されていてもよい。この場合、収集部52は、その個々のPCから組織に属する各人のスケジュール情報を収集すればよい。 The collection unit 52 collects the schedule information of each person belonging to the organization stored in the schedule management server 61 from the schedule management server 61. The schedule information may be stored in individual PCs (not shown in FIG. 16). In this case, the collecting unit 52 may collect the schedule information of each person belonging to the organization from the individual PCs.

以下、組織に属する人の識別情報を、人識別情報と記す。また、人識別情報として、例えば、「山田」等の人の名を用いる場合を例にして説明する。 Hereinafter, the identification information of the person belonging to the organization is referred to as the person identification information. Further, a case where a person's name such as "Yamada" is used as the person identification information will be described as an example.

図17は、スケジュール情報の例を示す模式図である。スケジュール情報は、例えば、図17に例示するように、組織に属する人の人識別情報と、イベント名と、そのイベント名を有するイベントにその人が関わった時間帯とが関連付けて記述されている。時間帯は、開始日時および終了日時によって表される。 FIG. 17 is a schematic diagram showing an example of schedule information. The schedule information is described, for example, as illustrated in FIG. 17, in which the person identification information of a person belonging to the organization, the event name, and the time zone in which the person was involved in the event having the event name are associated with each other. .. The time zone is represented by the start date and time and the end date and time.

図17に示す1番目のスケジュール情報は、「山田」という人が、2017年8月17日10時から同日の12時まで、「人工知能開発会議」に関わった(換言すれば、出席した)ということを表している。以下、ある人が、あるイベントに関わった時間をイベント参加時間と記す。1つのイベントに関するイベント参加時間は、そのイベントに関連付けて記述された終了日時から開始日時を減算して得られる時間である。 In the first schedule information shown in Fig. 17, a person named "Yamada" was involved in the "Artificial Intelligence Development Conference" from 10:00 on August 17, 2017 to 12:00 on the same day (in other words, attended). It represents that. Hereinafter, the time when a person is involved in a certain event is referred to as the event participation time. The event participation time for one event is the time obtained by subtracting the start date and time from the end date and time described in association with the event.

単語抽出部53は、収集部52によって収集された各スケジュール情報に記述されている各イベント名に対して形態素解析を実行することによって、イベント名に含まれている単語を抽出する。 The word extraction unit 53 extracts words included in the event name by performing morphological analysis on each event name described in each schedule information collected by the collection unit 52.

ただし、単語抽出部53は、同一の単語を、重複して抽出しない。例えば、単語抽出部53は、「人工知能」という単語を既に抽出している場合、2回目以降に抽出された「人工知能」という単語については無視する。この点は、既に説明した単語抽出部3と同様である。 However, the word extraction unit 53 does not extract the same word in duplicate. For example, when the word extraction unit 53 has already extracted the word "artificial intelligence", the word "artificial intelligence" extracted from the second time onward is ignored. This point is the same as the word extraction unit 3 already described.

例えば、単語抽出部53は、「人工知能開発会議」というイベント名に対して形態素解析を実行することによって、「人工知能」、「開発」、「会議」等の単語を抽出する。 For example, the word extraction unit 53 extracts words such as "artificial intelligence", "development", and "meeting" by performing morphological analysis on the event name "artificial intelligence development meeting".

単語抽出部53は、この処理を、各スケジュール情報に記述されている各イベント名に対して行うことによって、単語の集合を得る。同一の単語は重複して抽出されないので、この集合に属する単語は、互いに異なる。 The word extraction unit 53 obtains a set of words by performing this process for each event name described in each schedule information. Words that belong to this set are different from each other because the same word is not extracted more than once.

スコア算出部54は、組織に属する各人と、単語抽出部53によって抽出された各単語の組合せ毎に、人と単語との関連の強さを示す関連スコアを算出する。この関連スコアは、第1の実施形態から第3の実施形態までにおける関連スコアと同様である。ただし、第4の実施形態では、キータッチ回数は、関連スコアとして用いられない。すなわち、単語抽出部53は、第1の実施形態で説明した第2の算出方法で関連スコアを算出することはない。 The score calculation unit 54 calculates a related score indicating the strength of the relationship between the person and the word for each combination of each person belonging to the organization and each word extracted by the word extraction unit 53. This association score is the same as the association score in the first embodiment to the third embodiment. However, in the fourth embodiment, the number of key touches is not used as the related score. That is, the word extraction unit 53 does not calculate the related score by the second calculation method described in the first embodiment.

以下、第4の実施形態における関連スコアの算出方法として、2種類の方法を説明する。以下に示す2種類のいずれの方法においても、スコア算出部54は、人と単語の組合せ毎に、関連スコアを算出し、記憶部5に記憶させる。 Hereinafter, two types of methods will be described as methods for calculating the related score in the fourth embodiment. In any of the two types of methods shown below, the score calculation unit 54 calculates a related score for each combination of a person and a word and stores it in the storage unit 5.

第4の実施形態における関連スコアの第1の算出方法は、第1の実施形態における関連スコアの第1の算出方法と同様の方法である。ただし、ファイルの操作時間の代わりに、イベント参加時間を用いる。 The first calculation method of the association score in the fourth embodiment is the same method as the first calculation method of the association score in the first embodiment. However, the event participation time is used instead of the file operation time.

第4の実施形態における関連スコアの第1の算出方法は、一の人(以下、人Hと記す。)と一の単語(以下、単語Wと記す。)の関連スコアとして、単語Wをイベント名に含む各イベントへの人Hのイベント参加時間の総和を算出する方法である。イベント参加時間が長いほど、人Hと単語Wの関連が強く、イベント参加時間が短いほど、人Hと単語Wの関連が弱いと言える。従って、イベント参加時間を、関連スコアとして用いることができる。 In the first calculation method of the association score in the fourth embodiment, the word W is used as an event as the association score of one person (hereinafter referred to as person H) and one word (hereinafter referred to as word W). This is a method of calculating the total event participation time of person H for each event included in the name. It can be said that the longer the event participation time, the stronger the relationship between the person H and the word W, and the shorter the event participation time, the weaker the relationship between the person H and the word W. Therefore, the event participation time can be used as a related score.

第1の算出方法では、スコア算出部54は、単語Wをイベント名に含む各イベントに対する人Hのイベント参加時間の総和を算出し、その総和を、人Hと単語Wの関連スコアとする。 In the first calculation method, the score calculation unit 54 calculates the total event participation time of the person H for each event including the word W in the event name, and the total is used as the related score between the person H and the word W.

すなわち、スコア算出部54は、単語Wをイベント名に含み、人Hが参加したイベント毎にイベント参加時間を算出し、その総和を、人Hと単語Wの関連スコアとする。 That is, the score calculation unit 54 includes the word W in the event name, calculates the event participation time for each event in which the person H participates, and sets the total as the related score between the person H and the word W.

第4の実施形態における関連スコアの第2の算出方法は、第1の実施形態における関連スコアの第3の算出方法と同様の方法である。ただし、ファイルの操作時間の代わりに、イベント参加時間を用いる。 The second calculation method of the association score in the fourth embodiment is the same method as the third calculation method of the association score in the first embodiment. However, the event participation time is used instead of the file operation time.

本実施形態における関連スコアの第2の算出方法は、一の人(人H)と一の単語(単語W)の関連スコアを、次に説明する2つの割合に基づいて算出する方法である。この2つの割合のうち、一方の割合をQと記し、もう一方の割合をQと記す。 The second method of calculating the association score in the present embodiment is a method of calculating the association score of one person (person H) and one word (word W) based on the two ratios described below. Of the two proportions, describing one ratio of the Q 1, mark the other ratio between Q 2.

は、単語Wをイベント名に含む各イベントに対する組織内の全ての人のイベント参加時間の総和に対する、単語Wをイベント名に含む各イベントに対する人Hのイベント参加時間の総和の割合である。すなわち、Qは、以下に示す式(7)で表される。 Q 1 is, for all of the people of the events of participation time the sum of the organization for each event, including the word W in the event name, there is a percentage of the sum of the events participation time of people H for each event, including the word W in the event name .. That is, Q 1 is represented by the following equation (7).

Figure 2021192237
Figure 2021192237

は、個々の単語に着目した場合における、着目した単語をイベント名に含む各イベントに対する人Hのイベント参加時間の総和に対する、単語Wをイベント名に含む各イベントに対する人Hのイベント参加時間の総和の割合である。すなわち、Q2は、以下に示す式(8)で表される。 Q 2 is, in the case of focusing on individual words, to the sum of events participation time of people H for each event, including the word that focuses on the event name, event participation time of people H for each event, including the word W in the event name It is the ratio of the total of. That is, Q2 is represented by the following equation (8).

Figure 2021192237
Figure 2021192237

について説明する。単語Wをイベント名に含む各イベントに対する人Hのイベント参加時間の総和(式(7)の右辺の分子)は、前述の第1の算出方法で算出される関連スコアに相当する。すなわち、スコア算出部54は、前述の第1の算出方法で説明した方法で、単語Wをイベント名に含む各イベントに対する人Hのイベント参加時間の総和を算出すればよい。 Q 1 will be explained. The sum of the event participation times of the person H for each event including the word W in the event name (the numerator on the right side of the equation (7)) corresponds to the association score calculated by the first calculation method described above. That is, the score calculation unit 54 may calculate the total event participation time of the person H for each event including the word W in the event name by the method described in the first calculation method described above.

単語Wをイベント名に含む各イベントに対する組織内の全ての人のイベント参加時間の総和(式(7)の右辺の分母)について、説明する。スコア算出部54は、単語Wをイベント名に含む各イベントに対する、組織内の一人目の人のイベント参加時間の総和も、前述の第1の算出方法で説明した方法で算出する。同様に、スコア算出部54は、単語Wをイベント名に含む各イベントに対する、組織内の二人目の人のイベント参加時間の総和も、前述の第1の算出方法で説明した方法で算出する。同様に、スコア算出部54は、組織に属する一人一人について、単語Wをイベント名に含む各イベントに対する人のイベント参加時間の総和を算出する。さらに、スコア算出部54は、組織に属する一人一人について算出した「単語Wをイベント名に含む各イベントに対する人のイベント参加時間の総和」の総和を算出する。この値が、単語Wをイベント名に含む各イベントに対する組織内の全ての人のイベント参加時間の総和に該当する。 The sum of the event participation times of all the people in the organization for each event including the word W in the event name (the denominator on the right side of the equation (7)) will be described. The score calculation unit 54 also calculates the total event participation time of the first person in the organization for each event including the word W in the event name by the method described in the first calculation method described above. Similarly, the score calculation unit 54 also calculates the total event participation time of the second person in the organization for each event including the word W in the event name by the method described in the first calculation method described above. Similarly, the score calculation unit 54 calculates the total event participation time of a person for each event including the word W in the event name for each person belonging to the organization. Further, the score calculation unit 54 calculates the sum of "the sum of the event participation time of a person for each event including the word W in the event name" calculated for each person belonging to the organization. This value corresponds to the sum of the event participation times of all people in the organization for each event including the word W in the event name.

スコア算出部54は、上記のように算出した式(7)の右辺の分子、分母を用いて、式(7)の計算により、Qを算出する。 Score calculation unit 54, the molecules of the right-hand side of formula (7) calculated as described above, by using a denominator, the calculation of equation (7), and calculates the Q 1.

次に、Qについて説明する。式(8)の右辺の分子は、式(7)の右辺の分子と同じである。従って、スコア算出部54は、前述の第1の算出方法で説明した方法で、単語Wをイベント名に含む各イベントに対する人Hのイベント参加時間の総和を算出すればよい。 Next, the Q 2 will be described. The molecule on the right side of the formula (8) is the same as the molecule on the right side of the formula (7). Therefore, the score calculation unit 54 may calculate the total event participation time of the person H for each event including the word W in the event name by the method described in the first calculation method described above.

個々の単語に着目した場合における、着目した単語をイベント名に含む各イベントに対する人Hのイベント参加時間の総和(式(8)の右辺の分母)について説明する。スコア算出部54は、単語抽出部53によって抽出された個々の単語に着目する(換言すれば、個々の単語を1つ1つ選択する)。そして、スコア算出部54は、着目した単語(選択した単語)をイベント名に含む各イベントに対する人Hのイベント参加時間の総和を、前述の第1の算出方法で説明した方法で算出する。スコア算出部54は、次の単語に着目し(換言すれば、次の単語を選択し)、着目した単語(選択した単語)をイベント名に含む各イベントに対する人Hのイベント参加時間の総和を、前述の第1の算出方法で説明した方法で算出する。このように、スコア算出部54は、単語毎に、単語をイベント名に含む各イベントに対する人Hのイベント参加時間の総和を算出する。そして、スコア算出部54は、単語毎に算出した「単語をイベント名に含む各イベントに対する人Hのイベント参加時間の総和」の総和を算出する。この値が、式(8)の分母に該当する。「個々の単語に着目した場合における、着目した単語をイベント名に含む各イベントに対する人Hのイベント参加時間の総和(式(8)の右辺の分母)」は、「単語をイベント名に含む各イベントに対する人Hのイベント参加時間の総和を単語毎に求めた場合における前記総和の総和」であると言うことができる。 The sum of the event participation time of the person H for each event including the focused word in the event name (denominator on the right side of the equation (8)) when focusing on each word will be described. The score calculation unit 54 pays attention to the individual words extracted by the word extraction unit 53 (in other words, each individual word is selected one by one). Then, the score calculation unit 54 calculates the total event participation time of the person H for each event including the word of interest (selected word) in the event name by the method described in the first calculation method described above. The score calculation unit 54 focuses on the next word (in other words, selects the next word), and sums up the event participation time of the person H for each event including the focused word (selected word) in the event name. , Calculate by the method described in the above-mentioned first calculation method. In this way, the score calculation unit 54 calculates the total event participation time of the person H for each event including the word in the event name for each word. Then, the score calculation unit 54 calculates the total of "the total of the event participation time of the person H for each event including the word in the event name" calculated for each word. This value corresponds to the denominator of the equation (8). "When focusing on individual words, the sum of the event participation times of person H for each event that includes the focused word in the event name (the denominator on the right side of equation (8))" is "each including the word in the event name. It can be said that it is the total sum of the total sum of the event participation times of the person H for the event for each word.

スコア算出部54は、上記のように算出した式(8)の右辺の分子、分母を用いて、式(8)の計算により、Qを算出する。 Score calculation unit 54, the molecules of the right-hand side of Equation (8) calculated as described above, by using a denominator, the calculation of equation (8), and calculates the Q 2.

スコア算出部54は、Q,Qを求めた後、人Hと単語Wの関連スコアを、以下に示す式(9)によって算出する。 Score calculation unit 54, after obtaining the Q 1, Q 2, the relevance score of human H and words W, is calculated by the equation (9) below.

関連スコア=Q×log(Q) ・・・(9) Related score = Q 1 x log (Q 2 ) ・ ・ ・ (9)

第4の実施形態における第2の算出方法で関連スコアを算出した場合、第1の実施形態で説明した第3の算出方法で関連スコアを算出した場合と同様の効果が得られる。 When the related score is calculated by the second calculation method in the fourth embodiment, the same effect as when the related score is calculated by the third calculation method described in the first embodiment can be obtained.

収集部52は、例えば、関連スコア算出プログラムに従って動作するコンピュータのCPUおよびそのコンピュータの通信インタフェースによって実現される。例えば、CPUが、コンピュータのプログラム記憶装置等のプログラム記録媒体から関連スコア算出プログラムを読み込み、関連スコア算出プログラムに従って、通信インタフェースを用いて、収集部52として動作すればよい。また、単語抽出部53およびスコア算出部54も、例えば、関連スコア算出プログラムに従って動作する上記のコンピュータのCPUによって実現される。すなわち、上記のように、関連スコア算出プログラムを読み込んだCPUが、関連スコア算出プログラムに従って、単語抽出部53およびスコア算出部54として動作すればよい。記憶部5は、上記のコンピュータの記憶装置によって実現される。また、収集部52、単語抽出部53およびスコア算出部54がそれぞれ別々のハードウェアによって実現されてもよい。 The collecting unit 52 is realized by, for example, a CPU of a computer operating according to a related score calculation program and a communication interface of the computer. For example, the CPU may read the related score calculation program from a program recording medium such as a program storage device of a computer, and operate as the collecting unit 52 using the communication interface according to the related score calculation program. Further, the word extraction unit 53 and the score calculation unit 54 are also realized by, for example, the CPU of the above-mentioned computer that operates according to the related score calculation program. That is, as described above, the CPU that has read the related score calculation program may operate as the word extraction unit 53 and the score calculation unit 54 according to the related score calculation program. The storage unit 5 is realized by the storage device of the above-mentioned computer. Further, the collection unit 52, the word extraction unit 53, and the score calculation unit 54 may be realized by separate hardware.

第4の実施形態は、第1の実施形態の変形例(図5参照)、第2の実施形態(図7参照)、および第3の実施形態(図14参照)に適用されてもよい。すなわち、第1の実施形態の変形例(図5参照)において、収集部2、単語抽出部3およびスコア算出部4を、第4の実施形態で説明した収集部52、単語抽出部53およびスコア算出部54に置き換えてもよい。また、第2の実施形態(図7参照)において、収集部2、単語抽出部3およびスコア算出部4を、第4の実施形態で説明した収集部52、単語抽出部53およびスコア算出部54に置き換えてもよい。また、第3の実施形態(図14参照)において、収集部2、単語抽出部3およびスコア算出部4を、第4の実施形態で説明した収集部52、単語抽出部53およびスコア算出部54に置き換えてもよい。 The fourth embodiment may be applied to a modification of the first embodiment (see FIG. 5), a second embodiment (see FIG. 7), and a third embodiment (see FIG. 14). That is, in the modified example of the first embodiment (see FIG. 5), the collection unit 2, the word extraction unit 3, and the score calculation unit 4 are divided into the collection unit 52, the word extraction unit 53, and the score described in the fourth embodiment. It may be replaced with the calculation unit 54. Further, in the second embodiment (see FIG. 7), the collection unit 2, the word extraction unit 3 and the score calculation unit 4 are combined with the collection unit 52, the word extraction unit 53 and the score calculation unit 54 described in the fourth embodiment. May be replaced with. Further, in the third embodiment (see FIG. 14), the collection unit 2, the word extraction unit 3 and the score calculation unit 4 are combined with the collection unit 52, the word extraction unit 53 and the score calculation unit 54 described in the fourth embodiment. May be replaced with.

図18は、本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。コンピュータ1000は、CPU1001と、主記憶装置1002と、補助記憶装置1003と、インタフェース1004と、通信インタフェース1005とを備える。 FIG. 18 is a schematic block diagram showing a configuration example of a computer according to each embodiment of the present invention. The computer 1000 includes a CPU 1001, a main storage device 1002, an auxiliary storage device 1003, an interface 1004, and a communication interface 1005.

本発明の各実施形態の関連スコア算出システム1は、コンピュータ1000に実装される。関連スコア算出システム1の動作は、関連スコア算出プログラムの形式で補助記憶装置1003に記憶されている。CPU1001は、その関連スコア算出プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、その関連スコア算出プログラムに従って上記の処理を実行する。 The related score calculation system 1 of each embodiment of the present invention is implemented in the computer 1000. The operation of the related score calculation system 1 is stored in the auxiliary storage device 1003 in the form of the related score calculation program. The CPU 1001 reads the related score calculation program from the auxiliary storage device 1003, deploys it to the main storage device 1002, and executes the above processing according to the related score calculation program.

補助記憶装置1003は、一時的でない有形の媒体の例である。一時的でない有形の媒体の他の例として、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD−ROM(Compact Disk Read Only Memory )、DVD−ROM(Digital Versatile Disk Read Only Memory )、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000がそのプログラムを主記憶装置1002に展開し、上記の処理を実行してもよい。 Auxiliary storage 1003 is an example of a non-temporary tangible medium. Other examples of non-temporary tangible media include magnetic disks, optical magnetic disks, CD-ROMs (Compact Disk Read Only Memory), DVD-ROMs (Digital Versatile Disk Read Only Memory), which are connected via interface 1004. Examples include semiconductor memory. Further, when this program is distributed to the computer 1000 by a communication line, the distributed computer 1000 may expand the program to the main storage device 1002 and execute the above processing.

また、プログラムは、前述の処理の一部を実現するためのものであってもよい。さらに、プログラムは、補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで前述の処理を実現する差分プログラムであってもよい。 Further, the program may be for realizing a part of the above-mentioned processing. Further, the program may be a difference program that realizes the above-mentioned processing in combination with another program already stored in the auxiliary storage device 1003.

また、各構成要素の一部または全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組み合わせによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。 Further, a part or all of each component may be realized by a general-purpose or dedicated circuitry, a processor, or a combination thereof. These may be composed of a single chip or may be composed of a plurality of chips connected via a bus. A part or all of each component may be realized by the combination of the circuit or the like and the program described above.

各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。 When a part or all of each component is realized by a plurality of information processing devices and circuits, the plurality of information processing devices and circuits may be centrally arranged or distributed. For example, the information processing device, the circuit, and the like may be realized as a form in which each is connected via a communication network, such as a client-and-server system and a cloud computing system.

次に、本発明の概要について説明する。図19は、本発明の概要を示すブロック図である。本発明の関連スコア算出システムは、収集部82と、単語抽出部83と、関連スコア算出部84とを備える。 Next, the outline of the present invention will be described. FIG. 19 is a block diagram showing an outline of the present invention. The related score calculation system of the present invention includes a collecting unit 82, a word extraction unit 83, and a related score calculation unit 84.

収集部82(例えば、収集部2)は、ユーザがファイルを操作した記録である操作ログを、端末装置から収集する。 The collection unit 82 (for example, the collection unit 2) collects an operation log, which is a record of the user operating the file, from the terminal device.

単語抽出部83(例えば、単語抽出部3)は、各操作ログに記述されているファイル名から単語を抽出する。 The word extraction unit 83 (for example, the word extraction unit 3) extracts words from the file names described in each operation log.

関連スコア算出部84(例えば、スコア算出部4)は、各操作ログに基づいて、ユーザと単語との関連の強さを表す関連スコアを算出する。 The related score calculation unit 84 (for example, the score calculation unit 4) calculates a related score indicating the strength of the relationship between the user and the word based on each operation log.

そのような構成によって、組織内の人と単語との関連の強さを明確化することができる。 Such a structure can clarify the strength of the relationship between a person and a word in an organization.

図20は、本発明の概要の他の例を示すブロック図である。本発明の関連スコア算出システムは、収集部86と、単語抽出部87と、関連スコア算出部88とを備える。 FIG. 20 is a block diagram showing another example of the outline of the present invention. The related score calculation system of the present invention includes a collecting unit 86, a word extraction unit 87, and a related score calculation unit 88.

収集部86(例えば、収集部52)は、人と、イベント名と、そのイベント名を有するイベントにその人が関わった時間帯とを記述したスケジュール情報を収集する。 The collecting unit 86 (for example, the collecting unit 52) collects schedule information describing a person, an event name, and a time zone in which the person is involved in an event having the event name.

単語抽出部87(例えば、単語抽出部53)は、各スケジュール情報に記述されているイベント名から単語を抽出する。 The word extraction unit 87 (for example, the word extraction unit 53) extracts words from the event names described in each schedule information.

関連スコア算出部88(例えば、スコア算出部54)は、各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する。 The related score calculation unit 88 (for example, the score calculation unit 54) calculates a related score indicating the strength of the relationship between a person and a word based on each schedule information.

そのような構成によっても、組織内の人と単語との関連の強さを明確化することができる。 Such a structure can also clarify the strength of the relationship between a person and a word in an organization.

上記の本発明の各実施形態は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。 Each of the above embodiments of the present invention may be described as in the appendix below, but is not limited to the following.

(付記1)
ユーザがファイルを操作した記録である操作ログを、端末装置から収集する収集部と、
各操作ログに記述されているファイル名から単語を抽出する単語抽出部と、
各操作ログに基づいて、ユーザと単語との関連の強さを表す関連スコアを算出する関連スコア算出部とを備える
ことを特徴とする関連スコア算出システム。
(Appendix 1)
A collection unit that collects operation logs, which are records of user operations on files, from terminal devices.
A word extractor that extracts words from the file names described in each operation log,
A related score calculation system including a related score calculation unit that calculates a related score indicating the strength of the relationship between a user and a word based on each operation log.

(付記2)
関連スコア算出部は、一のユーザと一の単語の関連スコアとして、前記一の単語をファイル名に含む各ファイルについての前記一のユーザの操作時間の総和を算出する
付記1に記載の関連スコア算出システム。
(Appendix 2)
The related score calculation unit calculates the total operation time of the one user for each file containing the one word in the file name as the related score of one user and one word. The related score described in Appendix 1. Calculation system.

(付記3)
関連スコア算出部は、一のユーザと一の単語の関連スコアとして、前記一の単語をファイル名に含む各ファイルを前記一のユーザが操作した際のキータッチの回数の総和を算出する
付記1に記載の関連スコア算出システム。
(Appendix 3)
The related score calculation unit calculates the total number of key touches when the one user operates each file containing the one word in the file name as the related score of one user and one word. Appendix 1 Related score calculation system described in.

(付記4)
関連スコア算出部は、
一のユーザと一の単語の関連スコアを、
前記一の単語をファイル名に含む各ファイルについての組織内の全ユーザの操作時間の総和に対する、前記一の単語をファイル名に含む各ファイルについての前記一のユーザの操作時間の総和の割合と、
単語をファイル名に含む各ファイルについての前記一のユーザの操作時間の総和を単語毎に求めた場合における前記総和の総和に対する、前記一の単語をファイル名に含む各ファイルについての前記一のユーザの操作時間の総和の割合と
に基づいて算出する
付記1に記載の関連スコア算出システム。
(Appendix 4)
The related score calculation unit
The related score of one user and one word,
The ratio of the total operation time of the one user for each file containing the one word to the total operation time of all users in the organization for each file containing the one word in the file name. ,
The one user for each file containing the one word in the file name with respect to the sum of the sums when the sum of the operation times of the one user for each file containing the word is obtained for each word. The related score calculation system described in Appendix 1, which is calculated based on the ratio of the total operation time of.

(付記5)
検索キーワードを受け付けるキーワード受付部と、
検索キーワードに応じて検索を実行する検索部とを備え、
前記キーワード受付部は、
検索キーワードとして単語を受け付け、
前記検索部は、
関連スコアに基づいて、前記単語に応じたユーザIDを検索する
付記1から付記4のうちのいずれかに記載の関連スコア算出システム。
(Appendix 5)
The keyword reception department that accepts search keywords and
It is equipped with a search unit that executes a search according to the search keyword.
The keyword reception department
Accept words as search keywords,
The search unit
The related score calculation system according to any one of Supplements 1 to 4, which searches for a user ID corresponding to the word based on the related score.

(付記6)
検索キーワードを受け付けるキーワード受付部と、
検索キーワードに応じて検索を実行する検索部とを備え、
前記キーワード受付部は、
検索キーワードとしてユーザIDを受け付け、
前記検索部は、
関連スコアに基づいて、前記ユーザIDに応じた単語を検索する
付記1から付記5のうちのいずれかに記載の関連スコア算出システム。
(Appendix 6)
The keyword reception department that accepts search keywords and
It is equipped with a search unit that executes a search according to the search keyword.
The keyword reception department
Accepts user ID as a search keyword,
The search unit
The related score calculation system according to any one of Supplements 1 to 5, which searches for a word corresponding to the user ID based on the related score.

(付記7)
ユーザIDと、単語と、関連スコアとの関係を記述した第1のテーブルを生成する第1のテーブル生成部と、
第1のテーブルに基づいて算出した単語同士の関連の強さを表す関連度を記述した第2のテーブル生成する第2のテーブル生成部と、
検索キーワードを受け付けるキーワード受付部と、
検索キーワードに応じて検索を実行する検索部とを備え、
前記キーワード受付部は、
検索キーワードとして単語を受け付け、
前記検索部は、
前記第1のテーブルおよび前記第2のテーブルに基づいて、前記単語に応じたユーザIDを検索する
付記1から付記4のうちのいずれかに記載の関連スコア算出システム。
(Appendix 7)
A first table generator that generates a first table that describes the relationship between a user ID, a word, and a related score.
A second table generator that describes the degree of relevance that represents the strength of the relevance between words calculated based on the first table, and a second table generator that generates the second table.
The keyword reception department that accepts search keywords and
It is equipped with a search unit that executes a search according to the search keyword.
The keyword reception department
Accept words as search keywords,
The search unit
The related score calculation system according to any one of Supplementary note 1 to Supplementary note 4, which searches for a user ID corresponding to the word based on the first table and the second table.

(付記8)
ユーザIDと、単語と、関連スコアとの関係を記述した第1のテーブルを生成する第1のテーブル生成部と、
第1のテーブルに基づいて算出した単語同士の関連の強さを表す関連度を記述した第2のテーブル生成する第2のテーブル生成部と、
検索キーワードを受け付けるキーワード受付部と、
検索キーワードに応じて検索を実行する検索部とを備え、
前記キーワード受付部は、
検索キーワードとしてユーザIDを受け付け、
前記検索部は、
前記第1のテーブルおよび前記第2のテーブルに基づいて、前記ユーザIDに応じた単語を検索する
付記1から付記4および付記7のうちのいずれかに記載の関連スコア算出システム。
(Appendix 8)
A first table generator that generates a first table that describes the relationship between a user ID, a word, and a related score.
A second table generator that describes the degree of relevance that represents the strength of the relevance between words calculated based on the first table, and a second table generator that generates the second table.
The keyword reception department that accepts search keywords and
It is equipped with a search unit that executes a search according to the search keyword.
The keyword reception department
Accepts user ID as a search keyword,
The search unit
The related score calculation system according to any one of Supplementary note 1, Supplementary note 4, and Supplementary note 7, which searches for a word according to the user ID based on the first table and the second table.

(付記9)
第2のテーブルに基づいて、単語をクラスタリングするクラスタリング部と、
クラスタ毎に単語を提示する単語提示部と、
提示された単語のうち、第1のテーブルおよび第2のテーブルから除外すべき単語の指定を受け付ける削除対象受付部とを備え、
第1のテーブル生成部は、
除外すべき単語として指定された単語を除外して、第1のテーブルを再度、生成し、
第2のテーブル生成部は、
前記第1のテーブルに基づいて、第2のテーブルを再度、生成する
付記7または付記8に記載の関連スコア算出システム。
(Appendix 9)
A clustering part that clusters words based on the second table,
A word presentation unit that presents words for each cluster,
It is equipped with a deletion target reception unit that accepts the designation of words to be excluded from the first table and the second table among the presented words.
The first table generator is
Exclude the word specified as the word to be excluded, generate the first table again, and
The second table generator is
The related score calculation system according to Appendix 7 or Appendix 8, which regenerates the second table based on the first table.

(付記10)
人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集する収集部と、
各スケジュール情報に記述されているイベント名から単語を抽出する単語抽出部と、
各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する関連スコア算出部とを備える
ことを特徴とする関連スコア算出システム。
(Appendix 10)
A collection unit that collects schedule information that describes a person, an event name, and a time zone in which the person was involved in an event having the event name.
A word extractor that extracts words from the event names described in each schedule information,
A related score calculation system including a related score calculation unit that calculates a related score indicating the strength of the relationship between a person and a word based on each schedule information.

(付記11)
ユーザがファイルを操作した記録である操作ログを、端末装置から収集し、
各操作ログに記述されているファイル名から単語を抽出し、
各操作ログに基づいて、ユーザと単語との関連の強さを表す関連スコアを算出する
ことを特徴とする関連スコア算出方法。
(Appendix 11)
The operation log, which is a record of the user operating the file, is collected from the terminal device and
Extract words from the file names described in each operation log and
A related score calculation method characterized in that a related score indicating the strength of the relationship between a user and a word is calculated based on each operation log.

(付記12)
人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集し、
各スケジュール情報に記述されているイベント名から単語を抽出し、
各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する ことを特徴とする関連スコア算出方法。
(Appendix 12)
Collect schedule information that describes the person, the event name, and the time zone in which the person was involved in the event having the event name.
Extract words from the event names described in each schedule information,
A related score calculation method characterized in that a related score indicating the strength of a person-word relationship is calculated based on each schedule information.

(付記13)
コンピュータに、
ユーザがファイルを操作した記録である操作ログを、端末装置から収集する収集処理、
各操作ログに記述されているファイル名から単語を抽出する単語抽出処理、および、
各操作ログに基づいて、ユーザと単語との関連の強さを表す関連スコアを算出する関連スコア算出処理
を実行させるための関連スコア算出プログラム。
(Appendix 13)
On the computer
Collection processing that collects operation logs, which are records of user operations on files, from terminal devices.
Word extraction processing that extracts words from the file names described in each operation log, and
A related score calculation program for executing a related score calculation process that calculates a related score indicating the strength of the relationship between a user and a word based on each operation log.

(付記14)
コンピュータに、
人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集する収集処理、
各スケジュール情報に記述されているイベント名から単語を抽出する単語抽出処理、および、
各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する関連スコア算出処理
を実行させるための関連スコア算出プログラム。
(Appendix 14)
On the computer
A collection process that collects schedule information that describes a person, an event name, and a time zone in which the person was involved in an event having the event name.
Word extraction process that extracts words from the event name described in each schedule information, and
A related score calculation program for executing a related score calculation process that calculates a related score that indicates the strength of the relationship between a person and a word based on each schedule information.

本発明は、人と単語との関連の強さを数値化する関連スコア算出システムに好適に適用される。 The present invention is suitably applied to a related score calculation system that quantifies the strength of a relationship between a person and a word.

1 関連スコア算出システム
2,52 収集部
3,53 単語抽出部
4,54 スコア算出部
5 記憶部
6 キーワード受付部
7,17 検索部
8 出力部
31 クラスタリング部
32 クラスタ出力部
33 除外対象単語受付部
1 Related score calculation system 2,52 Collection unit 3,53 Word extraction unit 4,54 Score calculation unit 5 Storage unit 6 Keyword reception unit 7,17 Search unit 8 Output unit 31 Clustering unit 32 Cluster output unit 33 Excluded word reception unit

Claims (3)

人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集する収集部と、
各スケジュール情報に記述されているイベント名から単語を抽出する単語抽出部と、
各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する関連スコア算出部とを備え、
前記関連スコア算出部は、
一の人と一の単語の関連スコアを、
前記一の単語をイベント名に含む各イベントについての組織内の全ての人のイベント参加時間の総和に対する、前記一の単語をイベント名に含む各イベントについての前記一の人のイベント参加時間の総和の割合と、
単語をイベント名に含む各イベントについての前記一の人のイベント参加時間の総和を単語毎に求めた場合における前記総和の総和に対する、前記一の単語をイベント名に含む各イベントについての前記一の人のイベント参加時間の総和の割合と
に基づいて算出する
ことを特徴とする関連スコア算出システム。
A collection unit that collects schedule information that describes a person, an event name, and a time zone in which the person was involved in an event having the event name.
A word extractor that extracts words from the event names described in each schedule information,
It is equipped with a related score calculation unit that calculates a related score that indicates the strength of the relationship between a person and a word based on each schedule information.
The related score calculation unit
The related score of one person and one word,
The total event participation time of the one person for each event containing the one word in the event name with respect to the total event participation time of all persons in the organization for each event containing the one word in the event name. Percentage and
The above-mentioned one for each event containing the one word in the event name with respect to the total of the total of the sum of the event participation times of the one person for each event including the word in the event name. A related score calculation system characterized in that it is calculated based on the ratio of the total time of a person's participation in an event.
コンピュータが、
人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集し、
各スケジュール情報に記述されているイベント名から単語を抽出し、
各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出し、
前記関連スコアを算出するときに、
一の人と一の単語の関連スコアを、
前記一の単語をイベント名に含む各イベントについての組織内の全ての人のイベント参加時間の総和に対する、前記一の単語をイベント名に含む各イベントについての前記一の人のイベント参加時間の総和の割合と、
単語をイベント名に含む各イベントについての前記一の人のイベント参加時間の総和を単語毎に求めた場合における前記総和の総和に対する、前記一の単語をイベント名に含む各イベントについての前記一の人のイベント参加時間の総和の割合と
に基づいて算出する
ことを特徴とする関連スコア算出方法。
The computer
Collect schedule information that describes the person, the event name, and the time zone in which the person was involved in the event having the event name.
Extract words from the event names described in each schedule information,
Based on each schedule information, a relation score indicating the strength of the relation between a person and a word is calculated.
When calculating the relevant score,
The related score of one person and one word,
The total event participation time of the one person for each event containing the one word in the event name with respect to the total event participation time of all persons in the organization for each event containing the one word in the event name. Percentage and
The above-mentioned one for each event containing the one word in the event name with respect to the total of the total of the sum of the event participation times of the one person for each event including the word in the event name. A related score calculation method characterized in that it is calculated based on the ratio of the total time of a person's participation in an event.
コンピュータに、
人と、イベント名と、前記イベント名を有するイベントに前記人が関わった時間帯とを記述したスケジュール情報を収集する収集処理、
各スケジュール情報に記述されているイベント名から単語を抽出する単語抽出処理、および、
各スケジュール情報に基づいて、人と単語との関連の強さを表す関連スコアを算出する関連スコア算出処理を実行させ、
前記関連スコア算出処理で、
一の人と一の単語の関連スコアを、
前記一の単語をイベント名に含む各イベントについての組織内の全ての人のイベント参加時間の総和に対する、前記一の単語をイベント名に含む各イベントについての前記一の人のイベント参加時間の総和の割合と、
単語をイベント名に含む各イベントについての前記一の人のイベント参加時間の総和を単語毎に求めた場合における前記総和の総和に対する、前記一の単語をイベント名に含む各イベントについての前記一の人のイベント参加時間の総和の割合と
に基づいて算出させる
ための関連スコア算出プログラム。
On the computer
A collection process that collects schedule information that describes a person, an event name, and a time zone in which the person was involved in an event having the event name.
Word extraction process that extracts words from the event name described in each schedule information, and
Based on each schedule information, the related score calculation process that calculates the related score indicating the strength of the relationship between the person and the word is executed.
In the related score calculation process,
The related score of one person and one word,
The total event participation time of the one person for each event containing the one word in the event name with respect to the total event participation time of all persons in the organization for each event containing the one word in the event name. Percentage and
The above-mentioned one for each event containing the one word in the event name with respect to the total of the total of the sum of the event participation times of the one person for each event including the word in the event name. A related score calculation program for calculating based on the ratio of the total time a person participates in an event.
JP2021124963A 2017-11-06 2021-07-30 Related score calculation system, method and program Active JP7103496B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021124963A JP7103496B2 (en) 2017-11-06 2021-07-30 Related score calculation system, method and program
JP2022108819A JP7375861B2 (en) 2017-11-06 2022-07-06 Related score calculation systems, methods and programs

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017213570A JP6972935B2 (en) 2017-11-06 2017-11-06 Related score calculation system, method and program
JP2021124963A JP7103496B2 (en) 2017-11-06 2021-07-30 Related score calculation system, method and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017213570A Division JP6972935B2 (en) 2017-11-06 2017-11-06 Related score calculation system, method and program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022108819A Division JP7375861B2 (en) 2017-11-06 2022-07-06 Related score calculation systems, methods and programs

Publications (2)

Publication Number Publication Date
JP2021192237A true JP2021192237A (en) 2021-12-16
JP7103496B2 JP7103496B2 (en) 2022-07-20

Family

ID=66764176

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2017213570A Active JP6972935B2 (en) 2017-11-06 2017-11-06 Related score calculation system, method and program
JP2021124963A Active JP7103496B2 (en) 2017-11-06 2021-07-30 Related score calculation system, method and program
JP2022108819A Active JP7375861B2 (en) 2017-11-06 2022-07-06 Related score calculation systems, methods and programs

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017213570A Active JP6972935B2 (en) 2017-11-06 2017-11-06 Related score calculation system, method and program

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022108819A Active JP7375861B2 (en) 2017-11-06 2022-07-06 Related score calculation systems, methods and programs

Country Status (1)

Country Link
JP (3) JP6972935B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7443691B2 (en) 2019-07-29 2024-03-06 日本電気株式会社 Relevance evaluation method, relevance evaluation device, program
JP7404694B2 (en) 2019-07-29 2023-12-26 日本電気株式会社 Relevance evaluation method, relevance evaluation device, program
US20230042969A1 (en) * 2020-02-25 2023-02-09 Nec Corporation Item classification assistance system, method, and program
JP7353247B2 (en) 2020-07-31 2023-09-29 ウーブン・バイ・トヨタ株式会社 Information search and display system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055179A (en) * 2008-08-26 2010-03-11 Nec Corp Person search system and person search method
JP2011048449A (en) * 2009-08-25 2011-03-10 Nippon Telegr & Teleph Corp <Ntt> Device and method for generating user behavioral characteristic information, and program
JP2014203319A (en) * 2013-04-08 2014-10-27 日本電信電話株式会社 Facility-related keyword determination device
JP2016071731A (en) * 2014-09-30 2016-05-09 ダイキン工業株式会社 Human resource retrieval device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3722672B2 (en) * 2000-06-30 2005-11-30 シャープ株式会社 Designated word related person information extracting device, computer-readable recording medium recording designated word related person information extracting program, and set word related person frequency counting device
JP2011237912A (en) * 2010-05-07 2011-11-24 Nec Corp Retrieval device
US20140310037A1 (en) * 2013-04-16 2014-10-16 Cisco Technology, Inc. Skills, Expertise, Abilities and Interests Tagging in a Software Environment
US20160380950A1 (en) 2015-06-26 2016-12-29 International Business Machines Corporation System and method for detecting expertise via meeting participation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055179A (en) * 2008-08-26 2010-03-11 Nec Corp Person search system and person search method
JP2011048449A (en) * 2009-08-25 2011-03-10 Nippon Telegr & Teleph Corp <Ntt> Device and method for generating user behavioral characteristic information, and program
JP2014203319A (en) * 2013-04-08 2014-10-27 日本電信電話株式会社 Facility-related keyword determination device
JP2016071731A (en) * 2014-09-30 2016-05-09 ダイキン工業株式会社 Human resource retrieval device

Also Published As

Publication number Publication date
JP6972935B2 (en) 2021-11-24
JP2019086940A (en) 2019-06-06
JP7103496B2 (en) 2022-07-20
JP7375861B2 (en) 2023-11-08
JP2022133401A (en) 2022-09-13

Similar Documents

Publication Publication Date Title
JP7103496B2 (en) Related score calculation system, method and program
US7792786B2 (en) Methodologies and analytics tools for locating experts with specific sets of expertise
Ratkiewicz et al. Detecting and tracking the spread of astroturf memes in microblog streams
CN109690529B (en) Compiling documents into a timeline by event
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
US11907659B2 (en) Item recall method and system, electronic device and readable storage medium
CN104978332B (en) User-generated content label data generation method, device and correlation technique and device
US20060288272A1 (en) Computer-implemented method, system, and program product for developing a content annotation lexicon
CN108733791B (en) Network event detection method
US20160034426A1 (en) Creating Cohesive Documents From Social Media Messages
Petrovich Science mapping and science maps
Wainer et al. How productivity and impact differ across computer science subareas
CN111190965A (en) Text data-based ad hoc relationship analysis system and method
KR101741249B1 (en) System and method for generating category
KR20160120583A (en) Knowledge Management System and method for data management based on knowledge structure
Tandjung et al. Topic modeling with latent-dirichlet allocation for the discovery of state-of-the-art in research: A literature review
KR102025813B1 (en) Device and method for chronological big data curation system
KR101105798B1 (en) Apparatus and method refining keyword and contents searching system and method
JP2014102625A (en) Information retrieval system, program, and method
JP2006099753A (en) Grouping method of names and keywords, and program, storage medium and device therefor
CN113868508B (en) Writing material query method and device, electronic equipment and storage medium
Dai et al. MOETA: a novel text-mining model for collecting and analysing competitive intelligence
CN104778247B (en) A kind of information retrieval method and device based on data-oriented resource
Wu et al. Dynamically identifying roles in social media by mapping real world
Chen et al. Temporal evolution of the migration-related topics on social media

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210730

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220620

R151 Written notification of patent or utility model registration

Ref document number: 7103496

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151