JP2018195204A - Information processing apparatus, information processing method, and information processing program - Google Patents

Information processing apparatus, information processing method, and information processing program Download PDF

Info

Publication number
JP2018195204A
JP2018195204A JP2017100271A JP2017100271A JP2018195204A JP 2018195204 A JP2018195204 A JP 2018195204A JP 2017100271 A JP2017100271 A JP 2017100271A JP 2017100271 A JP2017100271 A JP 2017100271A JP 2018195204 A JP2018195204 A JP 2018195204A
Authority
JP
Japan
Prior art keywords
item
period
items
information processing
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017100271A
Other languages
Japanese (ja)
Other versions
JP6982404B2 (en
Inventor
勉 真田
Tsutomu Sanada
勉 真田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017100271A priority Critical patent/JP6982404B2/en
Publication of JP2018195204A publication Critical patent/JP2018195204A/en
Application granted granted Critical
Publication of JP6982404B2 publication Critical patent/JP6982404B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

To provide an information processing apparatus, an information processing method, and an information processing program that can reduce processing time required for extraction of related items and accurately extract the related items.SOLUTION: A server device 3 comprises: an item extraction part 332 that extracts related items related to predetermined themes from history information in which a plurality of records including the processing history of a plurality of items are recorded. The item extraction part 332 extracts related item candidates from the history information in a first period, and extracts related items in the first period from the related item candidates and related items in a second period.SELECTED DRAWING: Figure 2

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, and an information processing program.

従来、各ユーザのユーザ端末から行動履歴(処理履歴)を取得して記録部に蓄積し、蓄積した行動履歴を分析することで、例えば、ユーザの次の行動を予測する情報処理装置が知られている(例えば、特許文献1参照)。   2. Description of the Related Art Conventionally, for example, an information processing apparatus that predicts a user's next action by acquiring an action history (processing history) from each user's user terminal, storing the action history in a recording unit, and analyzing the accumulated action history is known. (For example, refer to Patent Document 1).

特開2016−38822号公報JP 2016-38822 A

ところで、蓄積された行動履歴を分析する際には最初に、当該行動履歴から所定の分析テーマ(例えば自動車の販売など)と関係する項目(以下、「関係項目」と呼ぶ)を抽出する必要がある。
行動履歴は、例えば、行動の種類や、送信元のデバイスの種類毎に項目分けされているが、近年、IoT(Internet of Things)の普及などにより、インターネットに接続されているデバイスの種類が増加しているため、行動履歴の項目数が増大し、分析対象の行動履歴のデータサイズも増大している。このため、関係項目の抽出処理に多くの時間を要するようになった。
抽出処理の時間を短縮するためには、例えば、蓄積された行動履歴のうち所定期間(例えば直近の1か月間)の行動履歴から、関係項目を抽出する方法もあるが、この方法では、前記所定期間以外の行動履歴は完全に無視されるため、関係項目を精度よく抽出できないという問題がある。
By the way, when analyzing the accumulated action history, it is necessary to first extract an item (hereinafter referred to as “related item”) related to a predetermined analysis theme (for example, car sales) from the action history. is there.
For example, the action history is divided into items according to the type of action and the type of the source device. In recent years, the number of devices connected to the Internet has increased due to the spread of IoT (Internet of Things). Therefore, the number of items in the action history has increased, and the data size of the action history to be analyzed has also increased. For this reason, much time has been required for the process of extracting related items.
In order to shorten the time of the extraction process, for example, there is a method of extracting a related item from an action history of a predetermined period (for example, the latest one month) among accumulated action histories. Since the action history other than the predetermined period is completely ignored, there is a problem that related items cannot be extracted with high accuracy.

本発明の目的は、関係項目の抽出に要する処理時間を短縮し、かつ、関係項目を精度よく抽出できる情報処理装置、情報処理方法及び情報処理プログラムを提供することにある。   An object of the present invention is to provide an information processing apparatus, an information processing method, and an information processing program capable of reducing the processing time required for extracting related items and accurately extracting related items.

本発明の情報処理装置は、複数項目の処理履歴を含むレコードが複数記録された履歴情報から、所定の分析テーマに関係する関係項目を抽出する項目抽出部を備え、前記項目抽出部は、第1期間の前記履歴情報から関係項目候補を抽出し、前記関係項目候補と第2期間の前記関係項目とから、前記第1期間における前記関係項目を抽出することを特徴とする。   An information processing apparatus according to the present invention includes an item extraction unit that extracts a related item related to a predetermined analysis theme from history information in which a plurality of records including processing histories of a plurality of items are recorded. The related item candidate is extracted from the history information of one period, and the related item in the first period is extracted from the related item candidate and the related item of the second period.

本発明における、第1期間の関係項目候補を抽出する処理は、第1期間における履歴情報から、分析テーマに関係する項目の候補を抽出すればよいので時間がかからない。また、抽出した関係項目候補と、第2期間の関係項目とから、第1期間の関係項目を抽出する処理は、抽出対象の項目数が絞られているため時間がかからない。このため、上記2つの抽出処理にかかる時間を合わせた時間は、例えば第1と第2期間を含んだ全期間の履歴情報から第1期間の関係項目を抽出する時間と比べて短い。
また、第1期間の履歴情報から抽出した関係項目候補と、すでに抽出されている第2期間の関係項目とから、第1期間の関係項目を抽出するため、第1期間以外の期間において関係項目として抽出されていた項目を加味して、第1期間の関係項目を抽出できる。
以上のように、本発明によれば、関係項目を迅速かつ精度よく抽出できる。
The process of extracting the related item candidates in the first period in the present invention does not take time because it is sufficient to extract candidate items related to the analysis theme from the history information in the first period. Further, the process of extracting the related items in the first period from the extracted related item candidates and the related items in the second period does not take time because the number of items to be extracted is narrowed down. For this reason, the total time required for the two extraction processes is shorter than the time for extracting the related items of the first period from the history information of all periods including the first and second periods, for example.
In addition, in order to extract the relation item of the first period from the relation item candidate extracted from the history information of the first period and the relation item of the second period that has already been extracted, the relation item in the period other than the first period In consideration of the items extracted as, the related items in the first period can be extracted.
As described above, according to the present invention, related items can be extracted quickly and accurately.

本発明の実施形態における情報処理システムの概略構成を示す図。The figure which shows schematic structure of the information processing system in embodiment of this invention. 実施形態におけるサーバ装置の概略構成を示す図。The figure which shows schematic structure of the server apparatus in embodiment. 実施形態における履歴情報の一例を示す図。The figure which shows an example of the log | history information in embodiment. 実施形態における目的変数記録部のデータ構造の一例を示す図。The figure which shows an example of the data structure of the objective variable recording part in embodiment. 実施形態における関係項目抽出処理を示すフローチャート。The flowchart which shows the related item extraction process in embodiment. 実施形態における関係項目候補抽出処理を示すフローチャート。The flowchart which shows the related item candidate extraction process in embodiment. 実施形態における目的変数が対応付けられた履歴情報を説明する図。The figure explaining the history information with which the objective variable in the embodiment was matched.

[実施形態]
以下、本発明の実施形態を図面に基づいて説明する。
[情報処理システムの構成]
図1は、情報処理システム1の概略構成を示す図である。
情報処理システム1では、複数のユーザ端末2と、サーバ装置3とがインターネットなどのネットワークを介して通信可能となるように接続されている。
近年、IoTの普及により、ネットワークに接続されるユーザ端末2の数が多くなっており、ユーザ端末2から送信される行動履歴は、膨大なデータ量となっている。サーバ装置3は、ユーザ端末2から送信される膨大なデータ量の行動履歴を分析する。
具体的に、サーバ装置3は、ユーザ端末2から送信されたユーザの行動履歴を、ネットワークを介して取得し、蓄積する。そして、蓄積した行動履歴を分析して、当該行動履歴の各項目のうち、所定の分析テーマ(例えば、自動車の販売など)に関係する関係項目を抽出する。すなわち、分析テーマに対して重要な項目を抽出する。
所定の分析テーマに関係する関係項目を抽出できれば、所定の処理を実行できる。所定の処理としては、例えば、広告効果を向上させるために、当該関係項目の実行頻度が高いユーザを、当該分析テーマとの関連度が高いユーザとして予想・抽出し、当該分析テーマに関する広告を、抽出したユーザに提供する処理があげられる。
以下、情報処理システム1の各構成について詳細に説明する。
[Embodiment]
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[Configuration of information processing system]
FIG. 1 is a diagram illustrating a schematic configuration of the information processing system 1.
In the information processing system 1, a plurality of user terminals 2 and a server device 3 are connected so as to be communicable via a network such as the Internet.
In recent years, with the spread of IoT, the number of user terminals 2 connected to the network has increased, and the action history transmitted from the user terminals 2 has a huge amount of data. The server device 3 analyzes an action history of a huge amount of data transmitted from the user terminal 2.
Specifically, the server device 3 acquires and accumulates the user action history transmitted from the user terminal 2 via the network. Then, the accumulated action history is analyzed, and among the items of the action history, related items related to a predetermined analysis theme (for example, car sales) are extracted. In other words, important items for the analysis theme are extracted.
If a related item related to a predetermined analysis theme can be extracted, a predetermined process can be executed. As the predetermined process, for example, in order to improve the advertising effect, a user with a high execution frequency of the related item is predicted and extracted as a user with a high degree of association with the analysis theme, and an advertisement related to the analysis theme is The process provided to the extracted user can be given.
Hereinafter, each configuration of the information processing system 1 will be described in detail.

[ユーザ端末の構成]
ユーザ端末2は、ユーザに関連付けられたコンピュータや家庭用電気製品や車載装置などのデバイスである。コンピュータとしては、例えばスマートフォンやタブレット等の携帯型端末や、パーソナルコンピュータ(PC)等の固定型端末等を例示できる。家庭用電気製品としては、テレビジョンや冷蔵庫などを例示できる。
[User terminal configuration]
The user terminal 2 is a device associated with the user, such as a computer, a household electrical appliance, or an in-vehicle device. Examples of the computer include a portable terminal such as a smartphone and a tablet, and a fixed terminal such as a personal computer (PC). Examples of household electric appliances include televisions and refrigerators.

例えば、ユーザ端末2がコンピュータである場合、ユーザ端末2は、ユーザが閲覧したウェブページや動画などのコンテンツを示す情報や、検索したキーワード等を、行動履歴として取得する。
ユーザ端末2がテレビジョンである場合、ユーザ端末2は、ユーザが試聴したテレビ番組、視聴した時刻、視聴したチャンネル等を、行動履歴として取得する。
ユーザ端末2が冷蔵庫である場合、ユーザ端末2は、扉の開閉回数や開閉時間、庫内に出し入れされた商品を示す情報等を、行動履歴として取得する。
ユーザ端末2が車載装置である場合、ユーザ端末2は、自動車の走行していた時刻、位置情報、スピードと加速度、自動車に備えられた装置の動作状況等を、行動履歴として取得する。
そして、ユーザ端末2は、取得した行動履歴を、例えば所定時間間隔で、ネットワークを介してサーバ装置3に送信する。
For example, when the user terminal 2 is a computer, the user terminal 2 acquires information indicating content such as a web page or a video viewed by the user, a searched keyword, and the like as an action history.
When the user terminal 2 is a television, the user terminal 2 acquires, as an action history, a television program that the user has auditioned, a viewing time, a viewing channel, and the like.
When the user terminal 2 is a refrigerator, the user terminal 2 acquires information such as the number of times the door is opened and closed, the opening and closing time, information indicating a product put in and out of the warehouse, and the like as an action history.
When the user terminal 2 is a vehicle-mounted device, the user terminal 2 acquires, as an action history, the time when the vehicle was traveling, position information, speed and acceleration, the operating status of the device provided in the vehicle, and the like.
Then, the user terminal 2 transmits the acquired action history to the server device 3 via the network, for example, at predetermined time intervals.

[サーバ装置の構成]
図2は、サーバ装置3の概略構成を示すブロック図である。
サーバ装置3は、コンピュータにより構成され、本発明の情報処理装置として機能する。このサーバ装置3は、ネットワークに接続され、ユーザ端末2との通信を可能とするサーバ通信部31と、サーバ記録部32と、サーバ制御部33などを含んで構成されている。
[Configuration of server device]
FIG. 2 is a block diagram illustrating a schematic configuration of the server device 3.
The server device 3 is configured by a computer and functions as an information processing device of the present invention. The server device 3 is configured to include a server communication unit 31, a server recording unit 32, a server control unit 33, and the like that are connected to a network and enable communication with the user terminal 2.

[サーバ記録部の構成]
サーバ記録部32は、例えばメモリ、ハードディスクなどにより構成されたデータ記録装置である。
サーバ記録部32には、サーバ装置3を制御するための各種プログラムが記録される。さらに、このサーバ記録部32は、履歴情報記録部321と、項目テーブル記録部322と、目的変数記録部323とを備えている。
[Configuration of server recording unit]
The server recording unit 32 is a data recording device configured with, for example, a memory, a hard disk, and the like.
Various programs for controlling the server device 3 are recorded in the server recording unit 32. Further, the server recording unit 32 includes a history information recording unit 321, an item table recording unit 322, and an objective variable recording unit 323.

図3は、履歴情報記録部321に記録された履歴情報321Aのデータ構造の一例を示す図である。
履歴情報321Aには、ユーザ端末2から送信された複数項目の行動履歴(処理履歴)が1行に並んだレコード(1行のデータ)が、複数行記録される。レコードは、ユーザID毎及び期間(例えば日や月や年)毎に生成される。本実施形態では、レコードは月毎に生成される場合を想定する。
図3に示す履歴情報321Aには、ユーザID「0001」、「0002」、「0003」…に関係付けられた第A期間(例えば8月)のレコード「A0001」、「A0002」、「A0003」…と、第B期間(例えば9月)のレコード「B0001」、「B0002」、「B0003」…とが記録されている。
本実施形態では、詳しくは後述するが、月が更新される毎に、直前の月における関係項目が抽出される。そして、関係項目が抽出された月の行動履歴は、履歴情報321Aから削除される。図3に示す履歴情報321Aは、9月になった際に、これから8月の関係項目を抽出する段階の状態を示している。
FIG. 3 is a diagram illustrating an example of a data structure of the history information 321 </ b> A recorded in the history information recording unit 321.
In the history information 321A, a plurality of records (one line of data) in which action histories (processing histories) of a plurality of items transmitted from the user terminal 2 are arranged in one line are recorded. A record is generated for each user ID and each period (for example, day, month, or year). In the present embodiment, it is assumed that the record is generated every month.
The history information 321A shown in FIG. 3 includes records “A0001”, “A0002”, “A0003” in the A period (for example, August) related to the user IDs “0001”, “0002”, “0003”. ... And records “B0001”, “B0002”, “B0003”... In the B period (for example, September) are recorded.
In this embodiment, as will be described in detail later, each time the month is updated, the related items in the immediately preceding month are extracted. And the action history of the month from which the related item was extracted is deleted from the history information 321A. The history information 321 </ b> A shown in FIG. 3 indicates a state in which the related items for August are extracted from September.

行動履歴の項目は、行動の種類、及び、行動履歴の送信元のユーザ端末2の種類などによって分けられている。
例えば、項目としては、「PCによる自動車関連ページの閲覧」、「PCによる不動産関連ページの検索」、「スマートフォン(SP)による自動車関連ページの閲覧」、「SPによる不動産関連ページの検索」、「テレビジョンによるドラマの閲覧」、「冷蔵庫内への牛乳の新規投入」、「自動車の利用」などが例示できる。
そして、各レコードには、行動履歴として、項目毎の実行回数が記録される。
The action history items are classified according to the type of action and the type of user terminal 2 that is the sender of the action history.
For example, as items, “browsing automobile related pages by PC”, “search for real estate related pages by PC”, “browsing automobile related pages by smartphone (SP)”, “search for real estate related pages by SP”, “ “Drama viewing by television”, “New milk input into refrigerator”, “Use of car”, etc.
In each record, the number of executions for each item is recorded as an action history.

項目テーブル記録部322には、分析テーマ毎及び分析期間毎に生成された関係項目テーブルが記録されている。
分析テーマとしては、「自動車の販売」や「男性未婚者」などを例示できる。分析期間は、本実施形態では1ヶ月である。
関係項目テーブルは、後述する項目抽出部332によって生成される。関係項目テーブルは、履歴情報321Aの項目のうち、該当する分析期間において該当する分析テーマと関係する項目(関係項目)を示すテーブルである。関係項目テーブルの生成方法の詳細については後述する。
In the item table recording unit 322, a related item table generated for each analysis theme and each analysis period is recorded.
Examples of analysis themes include “car sales” and “male unmarried”. The analysis period is one month in this embodiment.
The related item table is generated by an item extraction unit 332 described later. The related item table is a table showing items (related items) related to the corresponding analysis theme in the corresponding analysis period among the items of the history information 321A. Details of the method of generating the related item table will be described later.

目的変数記録部323には、図4に示すように、履歴情報321Aの各レコードに対する、分析テーマ毎の既知の目的変数が記録される。
目的変数は、分析テーマに対して、レコードの各項目を入力条件(説明変数)とした場合に、当該レコードが分析テーマにマッチする度合いを示す値(出力)である。目的変数は、例えば、0以上1以下の値で示され、レコードが分析テーマに完全にマッチする場合は、「1」とされ、分析テーマに完全にマッチしない場合は、「0」とされる。
分析テーマに対してレコードがマッチしているか否かが、例えば、行動履歴やアンケートやユーザ登録情報などによって既に得られている場合は、当該レコードに対応した目的変数の正解が得られる。すなわち、当該目的変数が既知となる。本実施形態では、既知の目的変数が、該当するレコード及び分析テーマに関連付けられて目的変数記録部323に記録される。
例えば、分析テーマが「自動車の販売」である場合、レコードに対応するユーザが、当該レコードに対応する期間に実際に自動車を購入した場合は、当該レコードの既知の目的変数として「1」が記録される。また、自動車を購入しなかった場合は、当該レコードの既知の目的変数として「0」が記録される。自動車を購入したか否かが不明な場合は、既知の目的変数は記録されず、空白のままである。
また、例えば、分析テーマが「男性未婚者」であれば、レコードに対応するユーザが男性未婚者と判明している場合は、当該レコードの既知の目的変数として「1」が記録され、女性又は男性既婚者と判明している場合は、当該レコードの既知の目的変数として「0」が記録される。男性未婚者か否かが不明な場合は、既知の目的変数は記録されず、空白のままである。
As shown in FIG. 4, the objective variable recording unit 323 records a known objective variable for each analysis theme for each record of the history information 321A.
The objective variable is a value (output) indicating the degree to which the record matches the analysis theme when each item of the record is set as an input condition (explanatory variable) for the analysis theme. The objective variable is indicated by, for example, a value between 0 and 1, and is “1” when the record completely matches the analysis theme, and is “0” when the record does not completely match the analysis theme. .
For example, if the record is matched with the analysis theme, for example, by the action history, the questionnaire, the user registration information, or the like, the correct answer of the objective variable corresponding to the record is obtained. That is, the objective variable is known. In the present embodiment, a known objective variable is recorded in the objective variable recording unit 323 in association with the corresponding record and analysis theme.
For example, when the analysis theme is “sales of automobiles”, when a user corresponding to a record actually purchases an automobile during a period corresponding to the record, “1” is recorded as a known objective variable of the record. Is done. If the car is not purchased, “0” is recorded as a known objective variable of the record. If it is unclear whether the car was purchased or not, the known objective variable is not recorded and remains blank.
Also, for example, if the analysis theme is “male unmarried”, if the user corresponding to the record is known to be a male unmarried, “1” is recorded as a known objective variable of the record, If it is known that the man is married, “0” is recorded as a known objective variable of the record. If it is unknown whether a man is unmarried, a known objective variable is not recorded and remains blank.

[サーバ制御部の構成]
図2に戻り、サーバ制御部33は、CPU(Central Processing Unit)などの演算回路、RAM(Random Access Memory)などの記録回路により構成され、サーバ記録部32などに記録されている情報処理プログラム(ソフトウェア)を実行することで、行動履歴取得部331、項目抽出部332、記録制御部333として機能する。
行動履歴取得部331は、各ユーザ端末2から送信された行動履歴を取得する。
項目抽出部332は、履歴情報321Aから、分析テーマに関係する項目を抽出し、関係項目テーブルを生成する。
記録制御部333は、行動履歴取得部331が取得した行動履歴を、履歴情報記録部321に記録させたり、履歴情報記録部321に記録されている行動履歴を削除したりする。また、項目抽出部332が生成した関係項目テーブルを、項目テーブル記録部322に記録させる。
[Configuration of server control unit]
Returning to FIG. 2, the server control unit 33 includes an arithmetic circuit such as a CPU (Central Processing Unit) and a recording circuit such as a RAM (Random Access Memory), and an information processing program (recorded in the server recording unit 32 or the like). By executing (software), it functions as an action history acquisition unit 331, an item extraction unit 332, and a recording control unit 333.
The behavior history acquisition unit 331 acquires the behavior history transmitted from each user terminal 2.
The item extraction unit 332 extracts items related to the analysis theme from the history information 321A, and generates a related item table.
The recording control unit 333 causes the history information recording unit 321 to record the behavior history acquired by the behavior history acquisition unit 331, or deletes the behavior history recorded in the history information recording unit 321. The related item table generated by the item extraction unit 332 is recorded in the item table recording unit 322.

[関係項目抽出処理]
次に、サーバ装置3が実行する関係項目抽出処理について説明する。
本実施形態では、サーバ装置3は、月が更新される毎に、直前の月を分析期間(第1期間)に設定して関係項目抽出処理を実行する。
図5は、関係項目抽出処理を示すフローチャートである。
関係項目抽出処理が実行されると、項目抽出部332は、予め設定された分析テーマから1つの分析テーマを取得する(ステップS11)。分析テーマは、例えば「自動車の販売」や「男性未婚者」などである。
[Related Item Extraction Processing]
Next, the related item extraction process executed by the server device 3 will be described.
In this embodiment, every time the month is updated, the server device 3 sets the immediately preceding month as the analysis period (first period) and executes the related item extraction process.
FIG. 5 is a flowchart showing the related item extraction process.
When the related item extraction process is executed, the item extraction unit 332 acquires one analysis theme from preset analysis themes (step S11). The analysis theme is, for example, “car sales” or “male unmarried”.

次に、項目抽出部332は、分析期間に対応する履歴情報321Aから、分析テーマに関係する関係項目候補を抽出する関係項目候補抽出処理S20を実行する。
図6は、関係項目候補抽出処理S20を示すフローチャートである。
図6に示すように、関係項目候補抽出処理S20が実行されると、項目抽出部332は、履歴情報321Aから、分析期間に対応する履歴情報(第1期間の履歴情報)を読み出す(ステップS21)。
例えば、項目抽出部332は、分析期間が「8月」の場合、図3に示す履歴情報321Aのうち、8月のレコードであるレコード「A0001」、「A0002」、「A0003」…を読み出す。
Next, the item extraction unit 332 executes a related item candidate extraction process S20 for extracting related item candidates related to the analysis theme from the history information 321A corresponding to the analysis period.
FIG. 6 is a flowchart showing the related item candidate extraction process S20.
As illustrated in FIG. 6, when the related item candidate extraction process S20 is executed, the item extraction unit 332 reads history information (history information of the first period) corresponding to the analysis period from the history information 321A (step S21). ).
For example, when the analysis period is “August”, the item extraction unit 332 reads records “A0001”, “A0002”, “A0003”,..., Which are records of August, from the history information 321A illustrated in FIG.

次に、項目抽出部332は、図7に示すように、読み出した各レコードに対して、目的変数記録部323から、該当するレコード及び分析テーマに関係付けられた既知の目的変数を読み出して対応付ける(ステップS22)。   Next, as shown in FIG. 7, the item extraction unit 332 reads and associates each read record with a known objective variable related to the corresponding record and analysis theme from the objective variable recording unit 323. (Step S22).

図6に戻り、次に、分析テーマに対する履歴情報321Aの各項目の関係の深さ(関係度)を求めるため、項目抽出部332は、各項目(説明変数)に基づいて分析テーマの目的変数を算出する目的変数算出モデルを生成する。
目的変数算出モデルには、線形回帰モデル又はロジスティック回帰モデルを用いることができる。本実施形態では、目的変数算出モデルとして、例えば、次式(1)で表される線形回帰モデルが用いられる。式(1)において、S(x)は分析テーマxの目的変数である。nは項目を区別する番号であり、Vnはn番目の説明変数であり、項目毎の実行回数を示し、Wn(x)は、VnがS(x)に貢献する貢献度を決める重み係数を示す。
Returning to FIG. 6, next, in order to obtain the depth of relationship (relationship) of each item of the history information 321 </ b> A with respect to the analysis theme, the item extraction unit 332 determines the objective variable of the analysis theme based on each item (explanatory variable) An objective variable calculation model for calculating is generated.
As the objective variable calculation model, a linear regression model or a logistic regression model can be used. In the present embodiment, for example, a linear regression model represented by the following equation (1) is used as the objective variable calculation model. In Expression (1), S (x) is an objective variable of the analysis theme x. n is a number for distinguishing items, Vn is an nth explanatory variable, indicating the number of executions for each item, and Wn (x) is a weighting factor that determines the contribution degree that Vn contributes to S (x). Show.

Figure 2018195204
Figure 2018195204

すなわち、S(x)は、項目毎の実行回数のそれぞれに、対応する重み係数を掛けた値の総和である。
つまり、式(1)のWn(x)は、項目nのS(x)に対する貢献度、すなわち、項目nと分析テーマxの目的変数との関係度を示す。このため、Wn(x)を求めることで、各項目nと分析テーマxとの関係度を求めることができる。
That is, S (x) is the sum of values obtained by multiplying the number of executions for each item by the corresponding weight coefficient.
That is, Wn (x) in Equation (1) indicates the degree of contribution of item n to S (x), that is, the degree of relationship between item n and the objective variable of analysis theme x. For this reason, the degree of relationship between each item n and the analysis theme x can be obtained by obtaining Wn (x).

Wn(x)を求めるには、ステップS22で既知の目的変数を対応付けたレコード毎に、各項目の値を式(1)右辺のVnに代入し、(1)により求めたS(x)と既知の値との誤差が最小となるように、Wn(x)の値を求めることができる。
これにより、履歴情報321Aの各項目に対して、分析テーマに対する関係度を算出できる(ステップS23)。
そして、項目抽出部332は、履歴情報321Aに含まれる項目のうち、関係度が高い方から所定数の項目を、関係項目候補として抽出する(ステップS24)。所定数は、本実施形態では例えば10個に設定されている。なお、当該所定数は、固定値ではなく、分析期間や分析テーマに応じて変化させてもよい。こうして、項目抽出部332は、関係項目候補抽出処理S20を終了する。
To obtain Wn (x), for each record associated with a known objective variable in step S22, the value of each item is substituted into Vn on the right side of equation (1), and S (x) obtained by (1) And the value of Wn (x) can be obtained so that the error between the value and the known value is minimized.
Thereby, the degree of relation to the analysis theme can be calculated for each item of the history information 321A (step S23).
Then, the item extracting unit 332 extracts a predetermined number of items from the items with higher relationship among the items included in the history information 321A as related item candidates (step S24). The predetermined number is set to 10 in this embodiment, for example. Note that the predetermined number is not a fixed value, and may be changed according to an analysis period or an analysis theme. Thus, the item extraction unit 332 ends the related item candidate extraction process S20.

図5に戻り、関係項目候補抽出処理S20が実行された後、項目抽出部332は、既に当該分析テーマに対する分析が終了している既分析期間(第2期間)に対応した関係項目テーブルを、項目テーブル記録部322から読み出す(ステップS12)。本実施形態では、既分析期間は、分析期間の1つ前の月に相当する。例えば、分析期間が8月であれば、ステップS12では、前月7月の関係項目テーブルを読み出す。   Returning to FIG. 5, after the related item candidate extraction process S <b> 20 is executed, the item extraction unit 332 displays a related item table corresponding to the already analyzed period (second period) in which the analysis on the analysis theme has already been completed. Read from the item table recording unit 322 (step S12). In the present embodiment, the already analyzed period corresponds to the month immediately before the analyzed period. For example, if the analysis period is August, in step S12, the related item table for July of the previous month is read.

次に、項目抽出部332は、ステップS24で抽出した関係項目候補、及び、ステップS12で抽出した既分析期間の関係項目テーブルに含まれる関係項目を合わせたものの中から、分析テーマに対する関係が深い所定数の関係項目を抽出する(ステップS13)。当該所定数は、本実施形態では、例えば関係項目候補の数と同じ10個に設定されている。なお、当該所定数は、固定値ではなく、分析期間や分析テーマに応じて異なる値を採用してもよい。   Next, the item extraction unit 332 is deeply related to the analysis theme from the combination of the related item candidates extracted in step S24 and the related items included in the related item table of the already analyzed period extracted in step S12. A predetermined number of related items are extracted (step S13). In the present embodiment, the predetermined number is set to ten, which is the same as the number of related item candidates, for example. Note that the predetermined number is not a fixed value, and a different value may be adopted depending on the analysis period and the analysis theme.

具体的に、ステップS13では、図7に示した既知の目的変数が対応付けられた分析期間のレコード毎に、上記式(1)に対して、抽出した関係項目候補及び既分析期間の関係項目の実行回数をVnに代入し、右辺の値を求める。そして既知の目的変数との誤差が最小となるような、Wn(x)の値を求めることができる。そして、項目抽出部332は、関係項目候補及び既分析期間の関係項目のうち、関係度が高い方から所定数の項目を、分析期間における関係項目として抽出する。
この場合、履歴情報321Aに含まれる項目のうち、関係項目候補及び既分析期間の関係項目以外の項目が除外された状態で、Wn(x)の値が求められる。このため、当該Wn(x)の値は、関係項目候補抽出処理S20で算出した値とは異なるものとなる。この結果、関係項目候補としては見落とされているが、既分析期間の関係項目として抽出されていた項目が、分析期間における関係項目として抽出される場合もある。又は、偶発的に関係項目候補として抽出された項目が、分析期間における関係項目として抽出されない場合もある。このようにして、分析期間における関係項目を、既分析期間の関係項目を加味して抽出できる。
Specifically, in step S13, for each record in the analysis period associated with the known objective variable shown in FIG. Is substituted for Vn, and the value on the right side is obtained. Then, a value of Wn (x) that minimizes an error from a known objective variable can be obtained. Then, the item extraction unit 332 extracts a predetermined number of items from the relationship item candidates and the relationship items in the already analyzed period, from the one having a higher degree of relationship, as the relationship items in the analysis period.
In this case, among the items included in the history information 321A, the value of Wn (x) is obtained in a state where items other than the related item candidate and related items in the already analyzed period are excluded. For this reason, the value of the Wn (x) is different from the value calculated in the related item candidate extraction process S20. As a result, an item that has been overlooked as a related item candidate but has been extracted as a related item in the already analyzed period may be extracted as a related item in the analyzed period. Or, an item that is accidentally extracted as a related item candidate may not be extracted as a related item in the analysis period. In this way, the related items in the analysis period can be extracted in consideration of the related items in the already analyzed period.

そして、項目抽出部332は、抽出した関係項目が含まれた関係項目テーブルを生成する。そして、記録制御部333は、分析テーマ、分析期間、生成された関係項目テーブルを、互いに関係付けて項目テーブル記録部322に記録させる(ステップS14)。   Then, the item extraction unit 332 generates a related item table including the extracted related items. The recording control unit 333 records the analysis theme, the analysis period, and the generated related item table in the item table recording unit 322 in association with each other (step S14).

次に、記録制御部333は、分析期間において、予め設定されたすべての分析テーマに対して、関係項目テーブルが生成されたか否かを判定する(ステップS15)。
ステップS15でNOと判定された場合、サーバ制御部33は、処理をステップS11に戻す。これにより、すべての分析テーマに対して関係項目テーブルが生成されるまで、ステップS11,S20,S12〜S15の処理が繰り返し実行される。
そして、すべての分析テーマに対して関係項目テーブルが生成され、ステップS15でYESと判定された場合、当該分析期間の履歴情報は不要となり、記録制御部333が、履歴情報321Aから、分析期間に対応する履歴情報を削除する(ステップS16)。例えば、分析期間が8月の場合、図3に示す履歴情報321Aから、8月に対応するレコード「A0001」、「A0002」、「A0003」…を削除する。これにより、履歴情報321Aのデータサイズを縮小できる。そして、サーバ制御部33は、関係項目抽出処理を終了する。
Next, the recording control unit 333 determines whether or not a related item table has been generated for all analysis themes set in advance during the analysis period (step S15).
When it determines with NO by step S15, the server control part 33 returns a process to step S11. Thereby, the process of step S11, S20, S12-S15 is repeatedly performed until a related item table is produced | generated with respect to all the analysis themes.
When the related item table is generated for all analysis themes and it is determined YES in step S15, the history information for the analysis period is not necessary, and the recording control unit 333 performs the analysis from the history information 321A to the analysis period. Corresponding history information is deleted (step S16). For example, when the analysis period is August, records “A0001”, “A0002”, “A0003”... Corresponding to August are deleted from the history information 321A shown in FIG. Thereby, the data size of the history information 321A can be reduced. Then, the server control unit 33 ends the related item extraction process.

[実施形態の作用効果]
本実施形態では、関係項目抽出処理において、項目抽出部332は、分析期間の履歴情報から、分析テーマに関係する関係項目候補を抽出する。そして、抽出した関係項目候補と、既分析期間の関係項目とから、分析期間の関係項目を抽出する。
ここで、分析期間の関係項目候補を抽出する処理は、分析期間(例えば1か月)だけの履歴情報から分析テーマに関係する項目を抽出すればよいので時間がかからない。また、抽出した関係項目候補(例えば10個)と、既分析期間の関係項目(例えば10個)を合わせたものから、分析期間の関係項目を抽出する処理は、抽出対象の項目数が絞られているため時間がかからない。このため、上記2つの抽出処理にかかる時間を合わせた時間は、例えば全期間の履歴情報(行動履歴の蓄積を開始してから蓄積された全ての行動履歴が記録された履歴情報)から分析期間の関係項目を抽出する時間と比べて短い。
また、分析期間の履歴情報から抽出した関係項目候補と、既分析期間の関係項目とから、分析期間の関係項目を抽出するため、分析期間以外の期間において関係項目として抽出された項目を加味して、分析期間の関係項目を抽出できる。
以上のように、上記構成によれば、関係項目を迅速かつ精度よく抽出できる。
[Effects of Embodiment]
In the present embodiment, in the related item extraction process, the item extraction unit 332 extracts related item candidates related to the analysis theme from the history information of the analysis period. Then, the relationship item of the analysis period is extracted from the extracted relationship item candidate and the relationship item of the already analyzed period.
Here, the process of extracting the related item candidates for the analysis period does not take time because it is only necessary to extract items related to the analysis theme from the history information for the analysis period (for example, one month). In addition, in the process of extracting the relationship items in the analysis period from the combination of the extracted relationship item candidates (for example, 10 items) and the relationship items in the already analyzed period (for example, 10 items), the number of items to be extracted is reduced. Because it does not take time. For this reason, the combined time of the above two extraction processes is, for example, the analysis period from the history information of all periods (history information in which all the action histories accumulated since the start of accumulation of action histories) is recorded. It is shorter than the time for extracting the related items.
In addition, in order to extract the relationship item of the analysis period from the relationship item candidate extracted from the history information of the analysis period and the relationship item of the already analyzed period, the items extracted as the relationship item in the period other than the analysis period are considered. Thus, the related items of the analysis period can be extracted.
As described above, according to the above configuration, related items can be extracted quickly and accurately.

また、本実施形態では、例えば、月が更新される毎に、直前の月を分析期間とし、分析期間よりも前の月を既分析期間として、関係項目抽出処理が行われる。この場合、一度関係項目として抽出されたが、時間の経過とともに関係度が低下した項目や、ある時期だけ偶発的に関係項目として抽出された項目は、月毎の分析を繰り返すことで、関係項目から外れていく。この結果、関係項目は月毎の作業により改良されていく。また、実施形態のように分析期間よりも1つ前の月、すなわち前々月を既分析期間とする場合は、分析期間よりも1つ前の月の関係項目テーブルがあれば分析期間の関係項目を抽出できるため、記録制御部333は、分析期間よりも2つ以上前の月の関係項目テーブルを、項目テーブル記録部322から削除してもよい。この場合、項目テーブル記録部322の記録容量を小さくできる。   In this embodiment, for example, each time a month is updated, the related item extraction process is performed with the immediately preceding month as the analysis period and the month before the analysis period as the already analyzed period. In this case, items that have been extracted as related items once, but whose relationship level has decreased over time, or items that have been extracted as related items only for a certain period of time, are analyzed by repeating the monthly analysis. Get out of it. As a result, related items are improved by monthly work. Further, when the previous analysis period is the month one month before the analysis period as in the embodiment, if there is a related item table for the month one month before the analysis period, the relation item of the analysis period is displayed. Since it can be extracted, the recording control unit 333 may delete the related item table of two or more months before the analysis period from the item table recording unit 322. In this case, the recording capacity of the item table recording unit 322 can be reduced.

本実施形態では、関係項目抽出処理において、記録制御部333は、分析期間において、すべての分析テーマに対して関係項目テーブルを生成した場合、履歴情報321Aから、当該分析期間の履歴情報を削除する。
この構成によれば、履歴情報321Aのデータサイズを小さくすることができ、履歴情報記録部321の記録容量を小さくできる。
In the present embodiment, in the related item extraction process, the recording control unit 333 deletes the history information of the analysis period from the history information 321A when the related item table is generated for all analysis themes in the analysis period. .
According to this configuration, the data size of the history information 321A can be reduced, and the recording capacity of the history information recording unit 321 can be reduced.

本実施形態では、関係項目抽出処理において、項目抽出部332は、関係項目候補及び関係項目を抽出する際、予め設定された個数(例えば10個)の項目を抽出する。
この構成によれば、例えば、抽出された関係項目候補及び既分析期間の関係項目の項目数は予め設定された個数の高々2倍であり、膨大な数になることがないため、分析期間の関係項目を抽出する処理にかかる時間が長くなることを防止できる。
In this embodiment, in the related item extraction process, the item extraction unit 332 extracts a preset number (for example, 10) of items when extracting related item candidates and related items.
According to this configuration, for example, the number of items of the extracted related item candidates and the related items in the already analyzed period is at most twice the preset number and does not become an enormous number. It is possible to prevent an increase in the time required for the process of extracting the related items.

[変形例]
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の目的を達成できる範囲で、以下に示される変形をも含むものである。
[Modification]
In addition, this invention is not limited to embodiment mentioned above, In the range which can achieve the objective of this invention, the deformation | transformation shown below is also included.

[変形例1]
前記実施形態では、関係項目抽出処理において、項目抽出部332は、関係項目候補及び関係項目を抽出する際、予め設定された個数の項目を抽出しているが、これに限定されない。
例えば、項目抽出部332は、関係項目候補及び関係項目を抽出する際、分析テーマに対する関係度が所定閾値以上の項目をすべて抽出してもよい。
この構成によれば、例えば、関係度が高い方から予め設定された個数の項目を抽出する場合と比べて、分析テーマに深く関係する項目を漏れなく抽出できる。
[Modification 1]
In the embodiment, in the related item extraction process, the item extraction unit 332 extracts a preset number of items when extracting related item candidates and related items. However, the present invention is not limited to this.
For example, when extracting the related item candidates and the related items, the item extracting unit 332 may extract all items whose degree of relationship with the analysis theme is equal to or greater than a predetermined threshold.
According to this configuration, for example, items deeply related to the analysis theme can be extracted without omission compared to a case where a predetermined number of items are extracted from a higher degree of relationship.

[変形例2]
前記実施形態では、履歴情報の各項目の関係度を算出し、算出した関係度に基づいて、関係項目候補及び関係項目を抽出しているが、これに限定されない。
例えば、次のようにして、関係項目を抽出してもよい。
すなわち、まず、図7に示した既知の目的変数が対応付けられた履歴情報のすべてを用いて、目的変数を予測する決定木モデル又はニューラルネットワークモデルなどの予測モデル(基準予測モデル)を生成する。
次に、前記履歴情報からどれか1つの項目の行動履歴を削除した履歴情報を生成し、当該履歴情報を用いて、同様に目的変数を予測する予測モデル(比較予測モデル)を生成する。
この比較予測モデルを生成する処理は、履歴情報から行動履歴を削除する項目を順に変えて繰り返し行う。これにより、履歴情報の項目数と同じ数の比較予測モデルが生成される。
次に、各比較予測モデルの予測値を、基準予測モデルの予測値と比較する。ここで、基準予測モデルの予測値と比較予測モデルの予測値の差が大きいほど、当該比較予測モデルの作成において削除されていた項目と分析テーマとの関係度は高いと判断できる。このため、当該差が大きい方から所定数の比較予測モデルを抽出し、それぞれの比較予測モデルの作成において削除されていた項目を、関係項目候補又は関係項目として抽出する。
[Modification 2]
In the embodiment, the relationship level of each item of the history information is calculated, and the related item candidate and the related item are extracted based on the calculated relationship level. However, the present invention is not limited to this.
For example, the related items may be extracted as follows.
That is, first, a prediction model (reference prediction model) such as a decision tree model or a neural network model for predicting an objective variable is generated using all of the history information associated with the known objective variable shown in FIG. .
Next, history information obtained by deleting the action history of any one item from the history information is generated, and a prediction model (comparison prediction model) that similarly predicts the objective variable is generated using the history information.
The process of generating the comparative prediction model is repeatedly performed by sequentially changing items for deleting the action history from the history information. Thereby, the same number of comparison prediction models as the number of items of history information are generated.
Next, the prediction value of each comparative prediction model is compared with the prediction value of the reference prediction model. Here, it can be determined that the larger the difference between the prediction value of the reference prediction model and the prediction value of the comparative prediction model, the higher the degree of relationship between the item deleted in the creation of the comparative prediction model and the analysis theme. For this reason, a predetermined number of comparison prediction models are extracted from the one with the larger difference, and the items deleted in the creation of the respective comparison prediction models are extracted as related item candidates or related items.

[変形例3]
前記実施形態では、分析期間において、すべての分析テーマに対して関係項目が抽出されたとき、記録制御部333は、履歴情報321Aから当該分析期間の行動履歴を削除しているが、これに限定されない。
例えば、履歴情報321Aから当該分析期間の行動履歴を削除せずに残しておいてもよい。この場合は、例えば、後で分析テーマが追加された場合でも、当該分析テーマに関係する関係項目を抽出できる。なお、当該分析期間の行動履歴は、分析が行われてから1年間等の一定期間経過後、記録制御部333によって履歴情報321Aから削除するようにしてもよい。例えば、所定の月の関係項目を抽出した場合、1年前の同じ月の履歴情報を履歴情報321Aから削除する。これにより常時、1年分の履歴情報が蓄積されている状態を維持できる。
[Modification 3]
In the embodiment, when related items are extracted for all analysis themes in the analysis period, the recording control unit 333 deletes the action history of the analysis period from the history information 321A. Not.
For example, the behavior history of the analysis period may be left without being deleted from the history information 321A. In this case, for example, even when an analysis theme is added later, related items related to the analysis theme can be extracted. Note that the behavior history during the analysis period may be deleted from the history information 321A by the recording control unit 333 after a certain period of time such as one year has passed since the analysis was performed. For example, when related items for a predetermined month are extracted, history information for the same month one year ago is deleted from the history information 321A. Thus, it is possible to maintain a state where history information for one year is always accumulated.

[変形例4]
前記実施形態では、項目抽出部332は、月毎に関係項目を抽出しているが、これに限定されない。すなわち、月だけではなく、日や年等の所定期間毎に関係項目を抽出してもよい。なお、当該所定期間は、前記実施形態のように毎回同じ長さでもよいし、途中で変えてもよい。
[Modification 4]
In the embodiment, the item extraction unit 332 extracts related items for each month, but is not limited thereto. That is, you may extract a related item not only for a month but for every predetermined period, such as a day and a year. In addition, the said predetermined period may be the same length every time like the said embodiment, and may change in the middle.

[変形例5]
前記実施形態及び前記変形例4では、項目抽出部332は、月などの所定期間が更新される毎に、直前の期間を分析期間に設定して関係項目を抽出しているが、これに限定されない。例えば、任意のタイミングで、任意の期間を分析期間に設定して関係項目を抽出してもよい。
また、前記実施形態では、分析期間の1つ前の期間を、既分析期間として設定しているが、これに限定されない。例えば、月毎に関係項目を抽出する場合、分析期間の1年前の同じ月を既分析期間として設定してもよい。又は、日毎に関係項目を抽出する場合、分析期間の1か月前の同じ日を既分析期間として設定してもよい。また、分析期間よりも後の期間において既に分析が行われている期間がある場合は、当該後の期間を既分析期間として設定してもよい。このようにさまざまな期間を既分析期間に設定してもよい。
[Modification 5]
In the embodiment and the modification 4, the item extraction unit 332 extracts the related items by setting the immediately preceding period as the analysis period every time a predetermined period such as a month is updated. Not. For example, the related items may be extracted by setting an arbitrary period as an analysis period at an arbitrary timing.
Moreover, in the said embodiment, although the period immediately before an analysis period is set as an already-analyzed period, it is not limited to this. For example, when extracting related items for each month, the same month one year before the analysis period may be set as the already analyzed period. Or when extracting a related item for every day, you may set the same day one month before an analysis period as an already-analyzed period. In addition, when there is a period in which analysis is already performed in a period after the analysis period, the subsequent period may be set as the already analyzed period. In this way, various periods may be set as the analyzed period.

[変形例6]
また、既分析期間として、2つ以上の期間を設定し、分析期間の関係項目候補と、当該2つ以上の期間における関係項目とに基づいて、分析期間の関係項目を抽出してもよい。例えば、分析期間の関係項目を、関係項目候補と、1つ前の期間及び2つ前の期間の関係項目とに基づいて抽出してもよい。
[Modification 6]
Further, two or more periods may be set as the analyzed period, and the related items of the analysis period may be extracted based on the related item candidates of the analysis period and the related items in the two or more periods. For example, the related items of the analysis period may be extracted based on the related item candidates and the related items of the previous period and the previous period.

[変形例7]
また、項目抽出部332は、関係項目候補を抽出した後、項目テーブル記録部322から、当該関係項目候補と項目が類似している関係項目テーブルを抽出し、当該関係項目候補と、抽出した関係項目テーブルの関係項目とに基づいて、分析期間の関係項目を抽出してもよい。
具体的には、項目抽出部332は、関係項目候補を抽出した後、項目テーブル記録部322から、分析テーマが同じ関係項目テーブルをすべて抽出する。そして、抽出した各関係項目テーブルに対して、関係項目候補との類似度を算出する。類似度は、例えば、関係項目テーブルに含まれる関係項目と関係項目候補との相関係数でもよい。そして、算出した類似度を予め設定された閾値と比較し、類似度が閾値以上の関係項目テーブルを抽出する。
そして、項目抽出部332は、関係項目候補と、類似度が閾値以上の関係項目テーブルに含まれる関係項目とに基づいて、分析期間の関係項目を抽出する。
分析期間において抽出された関係項目候補と類似した関係項目テーブルに含まれる各項目は、分析期間においても分析テーマとの関係度が高いと予想される。上記構成によれば、重要な項目が漏れることを抑制できるため、関係項目をより高い精度で抽出できる。
なお、変形例5−7の場合、変形例3のように履歴情報321Aに過去の行動履歴を削除せず残しておき、項目テーブル記録部322に過去に生成した関係項目テーブルを削除せずに残しておく。そして、項目抽出部332は、分析期間に該当する行動履歴、及び、既分析期間に該当する関係項目テーブルを用いて、関係項目を抽出する。
[Modification 7]
Further, after extracting the related item candidates, the item extracting unit 332 extracts a related item table whose items are similar to the related item candidates from the item table recording unit 322, and extracts the related item candidates and the extracted relationship. Based on the related items in the item table, the related items in the analysis period may be extracted.
Specifically, the item extraction unit 332 extracts all the related item tables having the same analysis theme from the item table recording unit 322 after extracting the related item candidates. Then, the degree of similarity with the related item candidate is calculated for each extracted related item table. The similarity may be, for example, a correlation coefficient between a related item included in the related item table and a related item candidate. Then, the calculated similarity is compared with a preset threshold, and a related item table having a similarity equal to or higher than the threshold is extracted.
Then, the item extraction unit 332 extracts the relation item of the analysis period based on the relation item candidate and the relation item included in the relation item table whose similarity is equal to or higher than the threshold.
Each item included in the related item table similar to the related item candidate extracted in the analysis period is expected to have a high degree of relationship with the analysis theme even in the analysis period. According to the above configuration, since important items can be prevented from leaking, related items can be extracted with higher accuracy.
In the case of the modified example 5-7, the past action history is not deleted in the history information 321A as in the modified example 3, and the related item table generated in the past is not deleted in the item table recording unit 322. Leave it. Then, the item extraction unit 332 extracts related items using the action history corresponding to the analysis period and the related item table corresponding to the already analyzed period.

[変形例8]
前記実施形態では、関係項目抽出処理において、項目抽出部332は、予め設定されたすべての分析テーマに対して、関係項目を抽出しているが、これに限定されない。
例えば、ユーザが設定した任意の分析テーマに対してのみ、関係項目を抽出してもよい。
[Modification 8]
In the embodiment, in the related item extraction process, the item extraction unit 332 extracts related items for all analysis themes set in advance, but the present invention is not limited to this.
For example, the related items may be extracted only for an arbitrary analysis theme set by the user.

[変形例9]
前記実施形態において、分析期間の関係項目を抽出する場合、関係項目候補及び既分析期間の関係項目に加えて、予め設定された必須項目も、分析期間の関係項目として抽出してもよい。又は、関係項目候補及び既分析期間の関係項目から、予め設定された削除項目を最初に削除して、残りの項目から、分析期間の関係項目を抽出してもよい。必須項目や削除項目は、例えば分析テーマや分析期間に応じて設定される。例えば、分析テーマや分析期間との関係度が高いことが予め判明している項目を、必須項目として設定したり、また、分析テーマや分析期間との関係度が低いことが予め判明している項目を、削除項目として設定したりしてもよい。
又は、既分析期間の関係項目は用いずに、関係項目候補及び必須項目だけに基づいて、分析期間の関係項目を抽出してもよい。つまり、本発明では、関係項目候補に加えて、既分析期間の関係項目や必須項目など、分析期間又は分析テーマなどに応じて設定される設定項目にも基づいて、分析期間の関係項目を抽出してもよい。
[Modification 9]
In the above-described embodiment, when extracting the related item of the analysis period, in addition to the related item candidate and the related item of the already analyzed period, a preset essential item may be extracted as the related item of the analysis period. Alternatively, a preset deletion item may be deleted first from the relationship item candidate and the relationship item of the already analyzed period, and the relationship item of the analysis period may be extracted from the remaining items. The essential items and the deletion items are set according to the analysis theme and the analysis period, for example. For example, items that have been found to have a high degree of relationship with the analysis theme or analysis period are set as required items, or have a low degree of relationship with the analysis theme or analysis period. An item may be set as a deletion item.
Alternatively, the related items of the analysis period may be extracted based on only the related item candidates and the essential items without using the related items of the already analyzed period. That is, in the present invention, in addition to the related item candidates, the related items of the analysis period are extracted based on the setting items set according to the analysis period or the analysis theme, such as related items and required items of the already analyzed period. May be.

[変形例10]
前記実施形態では、行動履歴取得部331は、ユーザ端末2から送信された行動履歴を取得しているが、これに限定されない。
例えば、行動履歴取得部331は、サーバ装置3とは別にネットワークに接続された、行動履歴を記録した記録装置から、通信により当該行動履歴を取得してもよい。
[Modification 10]
In the said embodiment, although the action history acquisition part 331 has acquired the action history transmitted from the user terminal 2, it is not limited to this.
For example, the behavior history acquisition unit 331 may acquire the behavior history by communication from a recording device that records the behavior history connected to the network separately from the server device 3.

[変形例11]
前記実施形態では、ユーザ端末2から取得される処理履歴(行動履歴)から、分析テーマに関係する関係項目を抽出する例をあげているが、本発明はこれに限定されない。
例えば、工場の製造ラインに設置されている各製造装置に設けられたセンサーなどのデバイスから取得される処理履歴から、分析テーマに関係する関係項目を抽出する場合にも、本発明を適用できる。この場合、履歴情報の各レコードは、例えば、製品のロット毎に生成される。
[Modification 11]
In the above embodiment, an example in which the related items related to the analysis theme are extracted from the processing history (behavior history) acquired from the user terminal 2, but the present invention is not limited to this.
For example, the present invention can also be applied to a case where related items related to an analysis theme are extracted from a processing history acquired from a device such as a sensor provided in each manufacturing apparatus installed in a manufacturing line of a factory. In this case, each record of the history information is generated for each product lot, for example.

1…情報処理システム、2…ユーザ端末(デバイス)、3…サーバ装置(情報処理装置)、31…サーバ通信部、32…サーバ記録部、33…サーバ制御部、321…履歴情報記録部、321A…履歴情報、322…項目テーブル記録部、323…目的変数記録部、331…行動履歴取得部、332…項目抽出部、333…記録制御部。   DESCRIPTION OF SYMBOLS 1 ... Information processing system, 2 ... User terminal (device), 3 ... Server apparatus (information processing apparatus), 31 ... Server communication part, 32 ... Server recording part, 33 ... Server control part, 321 ... History information recording part, 321A ... History information, 322 ... Item table recording unit, 323 ... Objective variable recording unit, 331 ... Action history acquisition unit, 332 ... Item extraction unit, 333 ... Recording control unit.

Claims (8)

複数項目の処理履歴を含むレコードが複数記録された履歴情報から、所定の分析テーマに関係する関係項目を抽出する項目抽出部を備え、
前記項目抽出部は、
第1期間の前記履歴情報から関係項目候補を抽出し、前記関係項目候補と第2期間の前記関係項目とから、前記第1期間における前記関係項目を抽出する
ことを特徴とする情報処理装置。
An item extraction unit that extracts a related item related to a predetermined analysis theme from history information in which a plurality of records including a processing history of a plurality of items is recorded,
The item extraction unit includes:
A related item candidate is extracted from the history information in the first period, and the related item in the first period is extracted from the related item candidate and the related item in the second period.
請求項1に記載の情報処理装置において、
前記第1期間の前記関係項目が抽出された場合、前記履歴情報から前記第1期間の前記履歴情報を削除する記録制御部を備える
ことを特徴とする情報処理装置。
The information processing apparatus according to claim 1,
An information processing apparatus comprising: a recording control unit that deletes the history information of the first period from the history information when the related item of the first period is extracted.
請求項1又は請求項2に記載の情報処理装置において、
前記項目抽出部は、前記関係項目候補及び前記関係項目を抽出する際、予め設定された個数の項目を抽出する
ことを特徴とする情報処理装置。
The information processing apparatus according to claim 1 or 2,
The item extraction unit extracts a predetermined number of items when extracting the related item candidates and the related items.
請求項1又は請求項2に記載の情報処理装置において、
前記項目抽出部は、前記関係項目候補及び前記関係項目を抽出する際、項目毎の前記分析テーマに対する関係度を算出し、算出した前記関係度が所定閾値以上である項目を抽出する
ことを特徴とする情報処理装置。
The information processing apparatus according to claim 1 or 2,
The item extraction unit, when extracting the related item candidate and the related item, calculates a degree of relation with respect to the analysis theme for each item, and extracts an item whose calculated degree of relation is a predetermined threshold value or more. Information processing apparatus.
請求項1から請求項4のいずれか1項に記載の情報処理装置において、
前記項目抽出部は、所定期間毎に前記関係項目を抽出し、
前記第2期間は、前記第1期間よりも前の期間である
ことを特徴とする情報処理装置。
The information processing apparatus according to any one of claims 1 to 4,
The item extraction unit extracts the related items every predetermined period,
The information processing apparatus, wherein the second period is a period before the first period.
請求項1から請求項5のいずれか1項に記載の情報処理装置において、
前記処理履歴はユーザの行動履歴であり、
前記処理履歴は、ユーザに関連付けられたデバイスから取得され、前記デバイスの種類毎に項目が分けられている
ことを特徴とする情報処理装置。
The information processing apparatus according to any one of claims 1 to 5,
The processing history is a user's behavior history,
The information processing apparatus, wherein the processing history is acquired from a device associated with a user, and items are divided for each type of the device.
コンピュータにより情報を処理させる情報処理方法であって、
前記コンピュータは、
複数項目の処理履歴を含むレコードが複数記録された履歴情報から、所定の分析テーマに関係する関係項目を抽出するステップを備え、
前記ステップでは、
第1期間の前記履歴情報から関係項目候補を抽出し、
前記関係項目候補と第2期間の前記関係項目とから、前記第1期間における前記関係項目を抽出する
ことを特徴とする情報処理方法。
An information processing method for processing information by a computer,
The computer
A step of extracting related items related to a predetermined analysis theme from history information in which a plurality of records including processing histories of a plurality of items are recorded;
In the step,
Extract related item candidates from the history information of the first period,
The information processing method, wherein the relation item in the first period is extracted from the relation item candidate and the relation item in the second period.
コンピュータに読み込まれ実行される情報処理プログラムであって、
前記コンピュータを、請求項1から請求項6のいずれか1項に記載の情報処理装置として機能させる
ことを特徴とする情報処理プログラム。
An information processing program that is read and executed by a computer,
An information processing program for causing the computer to function as the information processing apparatus according to any one of claims 1 to 6.
JP2017100271A 2017-05-19 2017-05-19 Information processing equipment, information processing methods and information processing programs Active JP6982404B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017100271A JP6982404B2 (en) 2017-05-19 2017-05-19 Information processing equipment, information processing methods and information processing programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017100271A JP6982404B2 (en) 2017-05-19 2017-05-19 Information processing equipment, information processing methods and information processing programs

Publications (2)

Publication Number Publication Date
JP2018195204A true JP2018195204A (en) 2018-12-06
JP6982404B2 JP6982404B2 (en) 2021-12-17

Family

ID=64570471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017100271A Active JP6982404B2 (en) 2017-05-19 2017-05-19 Information processing equipment, information processing methods and information processing programs

Country Status (1)

Country Link
JP (1) JP6982404B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020194390A (en) * 2019-05-29 2020-12-03 ヤマハ発動機株式会社 Circuit board production system, production line data management device, and production line data management method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225814A (en) * 2007-03-13 2008-09-25 Fujitsu Ltd Work analysis program and work analysis device
JP2009187293A (en) * 2008-02-06 2009-08-20 Nec Corp Time-series data analysis system, method and program
JP2010216912A (en) * 2009-03-16 2010-09-30 Fuji Xerox Co Ltd Detected data processing apparatus and program
JP2013065244A (en) * 2011-09-20 2013-04-11 Toshiba Corp Information processor and log management method
JP2015001822A (en) * 2013-06-14 2015-01-05 ヤンマー株式会社 Prediction apparatus, prediction method, and computer program
WO2015079647A1 (en) * 2013-11-28 2015-06-04 日本電気株式会社 Information processing device and information processing method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225814A (en) * 2007-03-13 2008-09-25 Fujitsu Ltd Work analysis program and work analysis device
JP2009187293A (en) * 2008-02-06 2009-08-20 Nec Corp Time-series data analysis system, method and program
JP2010216912A (en) * 2009-03-16 2010-09-30 Fuji Xerox Co Ltd Detected data processing apparatus and program
JP2013065244A (en) * 2011-09-20 2013-04-11 Toshiba Corp Information processor and log management method
JP2015001822A (en) * 2013-06-14 2015-01-05 ヤンマー株式会社 Prediction apparatus, prediction method, and computer program
WO2015079647A1 (en) * 2013-11-28 2015-06-04 日本電気株式会社 Information processing device and information processing method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020194390A (en) * 2019-05-29 2020-12-03 ヤマハ発動機株式会社 Circuit board production system, production line data management device, and production line data management method

Also Published As

Publication number Publication date
JP6982404B2 (en) 2021-12-17

Similar Documents

Publication Publication Date Title
US10394917B2 (en) User-trained searching application system and method
US9082084B2 (en) Facilitating machine learning in an online social network
US10938927B2 (en) Machine learning techniques for processing tag-based representations of sequential interaction events
AU2014284401B2 (en) Method and apparatus for determining user browsing behavior
US20220122099A1 (en) Analytical precursor mining for personalized recommendation
CN110020104B (en) News processing method and device, storage medium and computer equipment
US9064016B2 (en) Ranking search results using result repetition
US20160364490A1 (en) Method, system and computer readable medium for creating a profile of a user based on user behavior
US20150278706A1 (en) Method, Predictive Analytics System, and Computer Program Product for Performing Online and Offline Learning
US20170255862A1 (en) Method and system for user profiling for content recommendation
IL234134A (en) Method of machine learning classes of search queries
CN110245475B (en) Identity verification method and device
CN103488465A (en) Method and system for recommending functional configuration
US20200259895A1 (en) Maintenance of a persistent master identifier for clusters of user identifiers across a plurality of devices
WO2017052953A1 (en) Client-side web usage data collection
US20150348059A1 (en) System and method for determining the shopping phase of a shopper
CN112613938A (en) Model training method and device and computer equipment
CN108319628B (en) User interest determination method and device
Verachtert et al. Are We Forgetting Something? Correctly Evaluate a Recommender System With an Optimal Training Window.
US10824626B2 (en) Historical cognitive analysis for search result ranking
JP6982404B2 (en) Information processing equipment, information processing methods and information processing programs
JP2018195099A (en) Character analyzing device, device for generating model for character analysis, and character analyzing program
JP7312134B2 (en) LEARNING DEVICE, LEARNING METHOD AND LEARNING PROGRAM
CN104657397B (en) Information processing method and terminal
CN114254204A (en) Data processing method, device, medium and electronic equipment

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211119

R150 Certificate of patent or registration of utility model

Ref document number: 6982404

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350