JP2018181234A - Data management apparatus, data management method, and program - Google Patents

Data management apparatus, data management method, and program Download PDF

Info

Publication number
JP2018181234A
JP2018181234A JP2017084326A JP2017084326A JP2018181234A JP 2018181234 A JP2018181234 A JP 2018181234A JP 2017084326 A JP2017084326 A JP 2017084326A JP 2017084326 A JP2017084326 A JP 2017084326A JP 2018181234 A JP2018181234 A JP 2018181234A
Authority
JP
Japan
Prior art keywords
data
log
sampling
editing
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017084326A
Other languages
Japanese (ja)
Other versions
JP6971053B2 (en
Inventor
康夫 遠峯
Yasuo Tomine
康夫 遠峯
彰真 吉野
Akimasa Yoshino
彰真 吉野
文 十川
Fumi Togawa
文 十川
一樹 大利
Kazuki Otoshi
一樹 大利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017084326A priority Critical patent/JP6971053B2/en
Publication of JP2018181234A publication Critical patent/JP2018181234A/en
Application granted granted Critical
Publication of JP6971053B2 publication Critical patent/JP6971053B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a data management apparatus which can manage log data in a format suitable to analysis, while suppressing the volume, a data management method, and a program.SOLUTION: A data management apparatus includes: an acquisition unit which acquires log data to be acquired in accordance with an access from a terminal device; a sampling unit which executes first sampling processing on data over a first period included in the log data, focusing on a first item included in the log data, to generate a first sampling log, and executes second sampling processing focusing a second item to generate a second sampling log; and an invalidation unit which invalidates the data over the first period included in the log data, and invalidates the first sampling log and second sampling log over a second period longer than the first period.SELECTED DRAWING: Figure 4

Description

本発明は、データ管理装置、データ管理方法、およびプログラムに関する。   The present invention relates to a data management device, a data management method, and a program.

従来、ウェブページを提供するシステムにおいては、ユーザが端末装置を用いてウェブページにアクセスした履歴を示すアクセスログを取得して記憶装置に保管する運用が行われている。また、この保管されたアクセスログを解析することで、ウェブページのアクセス回数やウェブページにアクセスしたユーザの情報などを把握する方法が提案されている(例えば、特許文献1参照)。   2. Description of the Related Art Conventionally, in a system for providing a web page, an operation is performed in which an access log indicating a history of access to a web page by a user using a terminal device is acquired and stored in a storage device. Further, there has been proposed a method of grasping the access count of a web page, the information of the user who accessed the web page, and the like by analyzing the stored access log (see, for example, Patent Document 1).

特開2014−22821号公報JP 2014-22821 A

上述のアクセスログが長期間にわたって保管される場合、このアクセスログを記憶する記憶装置の容量が逼迫してしまう場合がある。この対策として、アクセスログを定期的に削除する運用が行われている。しかしながら、削除時には不要と判断されたアクセスログであっても、将来的に実施される解析処理において必要となる場合がある。このため、容量を抑えつつ解析に必要なアクセスログを保管する方法が求められている。   If the above access log is stored for a long time, the capacity of the storage device storing the access log may be exhausted. As a countermeasure against this, an operation to delete access logs regularly is performed. However, even an access log determined to be unnecessary at the time of deletion may be required in analysis processing to be performed in the future. Therefore, there is a need for a method of storing access logs necessary for analysis while suppressing the capacity.

また、従来のアクセスログの解析処理では、アクセスログそのものを処理対象としている。しかしながら、容量が大きなアクセスログを処理した場合、処理装置の負荷が増大し、解析処理に時間を要する場合がある。このため、解析が容易な形式でアクセスログを保管する方法が求められている。   Further, in the conventional access log analysis processing, the access log itself is a processing target. However, when an access log with a large capacity is processed, the load on the processing apparatus may increase, which may require time for analysis processing. Therefore, there is a need for a method of storing access logs in a format that is easy to analyze.

本発明は、このような事情を考慮してなされたものであり、容量を抑えつつ解析処理に適した形式でログデータを保管することが可能なデータ管理装置、データ管理方法、およびプログラムを提供することを目的の一つとする。   The present invention has been made in consideration of such circumstances, and provides a data management apparatus, data management method, and program capable of storing log data in a format suitable for analysis processing while suppressing the capacity. One of the goals.

本発明の一態様は、端末装置によるアクセスに応じて取得されるログデータを取得する取得部と、前記取得部によって取得された前記ログデータに含まれるデータのうち第1の期間が経過したデータに対して、前記ログデータに含まれる第1の項目に着目した第1のサンプリング処理を行って第1のサンプリングログを生成するとともに前記ログデータに含まれる第2の項目に着目した第2のサンプリング処理を行って第2のサンプリングログを生成するサンプリング部と、前記取得部によって取得された前記ログデータに含まれるデータのうち前記第1の期間が経過したデータを無効化するとともに前記サンプリング部によって生成された前記第1のサンプリングログおよび第2のサンプリングログのうち前記第1の期間よりも長い第2の期間が経過した前記第1のサンプリングログおよび第2のサンプリングログを無効化する無効化部とを備えるデータ管理装置である。   One aspect of the present invention is an acquisition unit that acquires log data acquired according to an access by a terminal device, and data in which a first period has elapsed among data included in the log data acquired by the acquisition unit. And a first sampling process focusing on the first item included in the log data to generate a first sampling log and a second focusing on the second item included in the log data. A sampling unit that performs sampling processing to generate a second sampling log, invalidates data of which the first period has elapsed among data included in the log data acquired by the acquisition unit, and the sampling unit A second of the first sampling log and the second sampling log generated by During a data management device and a disabling unit for disabling the first sampling logs and second sampling log has passed.

本発明の一態様によれば、容量を抑えつつ解析処理に適した形式でログデータを管理することが可能である。   According to one aspect of the present invention, it is possible to manage log data in a format suitable for analysis processing while suppressing the capacity.

データ管理システム1の一例を示す構成図である。FIG. 1 is a block diagram showing an example of a data management system 1; ログデータLの一例を示す図である。It is a figure which shows an example of log data L. FIG. データ管理装置7によるデータ管理の概念を示す図である。FIG. 6 is a diagram showing the concept of data management by the data management device 7; データ管理装置7の機能構成の一例を示すブロック図である。FIG. 6 is a block diagram showing an example of a functional configuration of a data management device 7; データ管理装置7による処理の流れの一例を示すフローチャートである。5 is a flowchart showing an example of the flow of processing by the data management device 7; サンプリングログSL(行動ログ)の一例を示す図である。It is a figure which shows an example of sampling log SL (action log). サンプリングログSL(コンテンツログ)の一例を示す図である。It is a figure which shows an example of sampling log SL (content log). 編集データED(属性データ)の一例を示す図である。It is a figure which shows an example of edit data ED (attribute data). 編集データED(メタデータ)の一例を示す図である。It is a figure which shows an example of edit data ED (metadata).

以下、図面を参照し、本発明のデータ管理装置、データ管理方法、およびプログラムの実施形態について説明する。本発明のデータ管理装置は、例えば、ウェブページなどの電子ページへのアクセスに応じて取得されるログデータに対してサンプリング処理、編集処理、無効化処理などを行うことで、データの保管期間、保管するデータの内容などを適宜設定し、ログデータの管理を行う。電子ページには、ブラウザによって参照されるウェブページの他、アプリケーションプログラムによって参照されるアプリページが含まれてよい。以下の説明では、ウェブページに着目して説明を行う。   Hereinafter, embodiments of a data management apparatus, a data management method, and a program of the present invention will be described with reference to the drawings. The data management apparatus according to the present invention performs, for example, sampling processing, editing processing, invalidation processing, and the like on log data acquired in response to access to an electronic page such as a web page, whereby the data storage period, Set the contents of stored data, etc. as appropriate, and manage log data. The electronic page may include, in addition to the web page referenced by the browser, the application page referenced by the application program. The following description focuses on web pages.

[全体構成]
図1は、データ管理システム1の一例を示す構成図である。データ管理システム1は、例えば、一以上の端末装置3と、一以上のサービス提供装置5と、一以上のデータ管理装置7とを備える。端末装置3と、サービス提供装置5と、データ管理装置7とは、ネットワークNWによって互いに接続されており、このネットワークNWを介して互いに通信する。ネットワークNWは、例えば、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、専用回線、無線基地局、プロバイダなどを含む。
[overall structure]
FIG. 1 is a block diagram showing an example of the data management system 1. The data management system 1 includes, for example, one or more terminal devices 3, one or more service providing devices 5, and one or more data management devices 7. The terminal device 3, the service providing device 5, and the data management device 7 are connected to one another by a network NW, and communicate with each other via the network NW. The network NW includes, for example, a wide area network (WAN), a local area network (LAN), the Internet, a dedicated line, a wireless base station, a provider, and the like.

[端末装置]
端末装置3は、サービス提供装置5が提供するサービスを利用するユーザによって操作される。端末装置3は、例えば、パーソナルコンピュータ、スマートフォンなどの携帯電話やタブレット端末、PDA(Personal Digital Assistant)などのコンピュータ装置である。
[Terminal device]
The terminal device 3 is operated by the user who uses the service provided by the service providing device 5. The terminal device 3 is, for example, a computer device such as a personal computer, a mobile phone such as a smart phone, a tablet terminal, or a PDA (Personal Digital Assistant).

端末装置3は、ユーザから所定の操作を受け付けると、予めインストールされたブラウザを介してサービス提供装置5が提供するウェブページにアクセスする。例えば、サービス提供装置5が提供するウェブページは、ニュースサイト、ショッピングサイト、検索サイト、オークションサイト、SNS(Social Networking Service)サイトなどを構成するページである。   When the terminal device 3 receives a predetermined operation from the user, the terminal device 3 accesses a web page provided by the service providing device 5 through a browser installed in advance. For example, the web page provided by the service providing apparatus 5 is a page configuring a news site, a shopping site, a search site, an auction site, a social networking service (SNS) site, and the like.

[サービス提供装置]
サービス提供装置5は、インターネット上において、上述したニュースサイトやショッピングサイトなどのウェブページを提供するウェブサーバ装置であってよいし、アプリケーションが起動された端末装置3と通信を行って、各種情報の受け渡しを行うアプリケーションサーバ装置であってもよい。サービス提供装置5は、自身が提供するウェブページへの端末装置3によるアクセスに応じて取得されるログデータLを出力する。
[Service Providing Device]
The service providing device 5 may be a web server device that provides web pages such as the above-described news site and shopping site on the Internet, and communicates with the terminal device 3 on which the application has been started to communicate various information It may be an application server device that performs delivery. The service providing device 5 outputs log data L acquired in response to access by the terminal device 3 to a web page provided by itself.

図2は、ログデータLの一例を示す図である。ログデータLには、例えば、端末装置3を利用するユーザを識別する「ユーザID10」、ウェブページに関連付けされたコンテンツを識別する「コンテンツID11」、端末装置3からのアクセスを処理した日付を示す「日付12」、端末装置3からのアクセスを受けたウェブページのURL(Uniform Resource Locator)を示す「対象URL13」、対象URLへの遷移元のウェブページのURLを示す「遷移元URL14」などが含まれる。   FIG. 2 is a diagram showing an example of the log data L. As shown in FIG. The log data L indicates, for example, "user ID 10" for identifying a user who uses the terminal device 3, "content ID 11" for identifying content associated with a web page, and date when access from the terminal device 3 was processed. "Date 12", "Target URL 13" indicating the URL (Uniform Resource Locator) of the web page accessed by the terminal device 3, "Transition source URL 14" indicating the URL of the web page of the transition source to the target URL, etc. included.

「ユーザID10」は、例えば、ユーザが端末装置3を用いてサービス提供装置5にアクセスする際にログインを行っている場合におけるログインIDを含む。あるいは、「ユーザID10」は、端末装置3に備えられたウェブブラウザごとに管理されるクッキー(HTTP cookie)に関する情報や、端末装置3のIPアドレスなどを含む。   The “user ID 10” includes, for example, a login ID in the case where the user is logging in when accessing the service providing apparatus 5 using the terminal device 3. Alternatively, the “user ID 10” includes information on a cookie (HTTP cookie) managed for each web browser provided in the terminal device 3, an IP address of the terminal device 3, and the like.

「コンテンツID11」は、例えば、ウェブページに関連付けされたコンテンツである商品、サービスなどを識別する識別子である。例えば、ウェブページが「商品A」を購入するショッピングサイトである場合、このウェブページには、「商品A」を示すコンテンツIDが関連付けされている。また、例えば、ウェブページが「スポーツA」のニュースを提供するニュースサイトである場合、このウェブページには、「スポーツA」を示すコンテンツIDが関連付けされている。ウェブページとコンテンツとの関連付けを示すデータは、例えば、サービス提供装置5または外部の記憶装置に記憶される各種マスタに記憶されていてよい。   The “content ID 11” is, for example, an identifier that identifies a product, a service, or the like that is content associated with the web page. For example, in the case where the web page is a shopping site for purchasing "Product A", a content ID indicating "Product A" is associated with this web page. Also, for example, when the web page is a news site that provides the news of "sports A", a content ID indicating "sports A" is associated with this web page. Data indicating the association between the web page and the content may be stored, for example, in various masters stored in the service providing device 5 or an external storage device.

ログデータLには、例えば、端末装置3がウェブページにアクセスする度に、一行のデータが追加される。ログデータLは、例えば、日毎、週毎などの任意のタイミングで作成されるテキストデータである。   For example, one line of data is added to the log data L each time the terminal device 3 accesses a web page. The log data L is, for example, text data created at an arbitrary timing such as every day or every week.

[データ管理装置]
データ管理装置7は、例えば、サービス提供装置5が提供するウェブページまたはアプリケーションプログラムによって参照されるアプリページのログデータLを取得し、取得したログデータLの管理を行う。
[Data management device]
The data management device 7 acquires, for example, log data L of a web page provided by the service providing device 5 or an application page referenced by an application program, and manages the acquired log data L.

図3は、データ管理装置7によるデータ管理の概念を示す図である。データ管理装置7では、ログデータLに含まれるデータを3つの段階に分けて管理する。この3つの段階には、例えば、短期保管段階、長期保管段階、および無期限保管段階が含まれる。   FIG. 3 is a view showing the concept of data management by the data management device 7. The data management device 7 manages data included in the log data L in three stages. The three phases include, for example, a short term storage phase, a long term storage phase, and an indefinite storage phase.

短期保管段階は、ログデータLそのものを保管する段階である。この短期保管段階では、例えば、過去1年間のログデータLが保管される。   The short-term storage phase is a phase where the log data L itself is stored. At this short-term storage stage, for example, log data L of the past one year is stored.

長期保管段階は、ログデータLに対して所定のサンプリング処理を行ったサンプリングログSLを保管する段階である。この長期保管段階では、例えば、上述の短期保管段階よりも長い過去3年間のサンプリングログSLが保管される。このサンプリングログSLには、例えば、ログデータLに含まれるデータに対して、「ユーザ」に関連する項目に着目してサンプリング処理を行った結果得られた「行動ログAL」と、「コンテンツ」に関連する項目に着目してサンプリング処理を行った結果得られた「コンテンツログCL」とが含まれる。   The long-term storage step is a step of storing a sampling log SL obtained by performing predetermined sampling processing on the log data L. In this long-term storage phase, for example, sampling logs SL of the past three years longer than the above-mentioned short-term storage phase are stored. In this sampling log SL, for example, “action log AL” obtained as a result of performing sampling processing on data included in the log data L, focusing on items related to “user”, “content” And “content log CL” obtained as a result of performing sampling processing focusing on items related to

無期限期保管段階は、ログデータLに対して所定の編集処理を行った編集データEDを保管する段階である。この無期限保管段階では、例えば、保管期間は設けられず、過去の全ての編集データEDが保管される。この編集データEDには、例えば、ログデータLに含まれるデータに対して、「ユーザ」に関連する項目に着目して編集処理を行った結果得られた「属性データAD」と、「コンテンツ」に関連する項目に着目して編集処理を行った結果得られた「メタデータMD」とが含まれる。   The indefinite period storage step is a step of storing edited data ED obtained by performing predetermined editing processing on the log data L. In this indefinite storage stage, for example, no storage period is provided, and all past edit data ED is stored. In this editing data ED, for example, “attribute data AD” obtained as a result of performing editing processing on data included in the log data L, focusing on items related to the “user”, “content” And “metadata MD” obtained as a result of performing the editing process paying attention to the item related to.

図4は、データ管理装置7の機能構成の一例を示すブロック図である。データ管理装置7は、例えば、取得部20と、サンプリング部22と、編集部24と、無効化部26と、記憶部28とを備える。記憶部28は、例えば、ログデータ記憶部30と、サンプリングログ記憶部32と、編集データ記憶部34とを備える。データ管理装置7に含まれる各機能部は、複数の装置に分散されてもよい。例えば、サンプリング部22と他の機能部とは別体の装置によって実現されてもよい。記憶部28は、NAS(Network Attached Storage)などの記憶装置であってもよい。   FIG. 4 is a block diagram showing an example of a functional configuration of the data management device 7. The data management device 7 includes, for example, an acquisition unit 20, a sampling unit 22, an editing unit 24, an invalidation unit 26, and a storage unit 28. The storage unit 28 includes, for example, a log data storage unit 30, a sampling log storage unit 32, and an editing data storage unit 34. Each functional unit included in the data management device 7 may be distributed to a plurality of devices. For example, the sampling unit 22 and another functional unit may be realized by a separate device. The storage unit 28 may be a storage device such as NAS (Network Attached Storage).

取得部20、サンプリング部22、編集部24、および無効化部26は、例えば、CPU(Central Processing Unit)などのプロセッサが、記憶部28に記憶されたプログラム(ソフトウェア)を実行することにより実現される。プログラムは、例えば、ネットワークNWを介してアプリケーションサーバからダウンロードされてもよいし、予めデータ管理装置7にプリインストールされていてもよい。また、これらの機能部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。   The acquisition unit 20, the sampling unit 22, the editing unit 24, and the invalidation unit 26 are realized, for example, by a processor such as a central processing unit (CPU) executing a program (software) stored in the storage unit 28. Ru. The program may be downloaded from the application server via the network NW, for example, or may be preinstalled on the data management device 7 in advance. Also, these functional units may be realized by hardware such as LSI (Large Scale Integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programmable Gate Array), etc. Cooperation between software and hardware It may be realized by

記憶部28は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置などによって実現されてよい。   The storage unit 28 may be realized by, for example, a random access memory (RAM), a read only memory (ROM), a hard disk drive (HDD), a flash memory, or a hybrid storage device in which a plurality of these are combined. .

取得部20は、ネットワークNWを介して、サービス提供装置5からログデータLを取得する。取得部20は、サービス提供装置5から取得したログデータLをログデータ記憶部30に記憶させる。   The acquisition unit 20 acquires log data L from the service providing device 5 via the network NW. The acquisition unit 20 stores the log data L acquired from the service providing device 5 in the log data storage unit 30.

サンプリング部22は、取得部20によって取得されたログデータLに含まれるデータのうち、第1の期間が経過したログデータLに対してサンプリング処理を行い、サンプリングログSLを生成する。サンプリング部22は、生成したサンプリングログSLを、サンプリングログ記憶部32に記憶させる。例えば、サンプリング部22は、ログデータLがサービス提供装置5によって日毎に作成される日次のテキストデータである場合、作成後1年以上経過したテキストデータに対してサンプリング処理を行う。   The sampling unit 22 performs sampling processing on the log data L for which the first period has elapsed among the data included in the log data L acquired by the acquisition unit 20, and generates a sampling log SL. The sampling unit 22 stores the generated sampling log SL in the sampling log storage unit 32. For example, when the log data L is daily text data created on a daily basis by the service providing device 5, the sampling unit 22 performs sampling processing on text data one year or more after creation.

(サンプリング処理)
サンプリング部22は、第1の期間が経過したログデータLに対してデータのサンプリング(データの間引き)を行う。このサンプリング処理は、例えば、「ユーザ」に関連する第1の項目に着目して行う第1のサンプリング処理と、「コンテンツ」に関連する第2の項目に着目して行う第2のサンプリング処理とを含む。
(Sampling process)
The sampling unit 22 performs data sampling (data thinning) on the log data L for which the first period has elapsed. The sampling process includes, for example, a first sampling process performed focusing on a first item related to the “user”, and a second sampling process performed based on a second item related to the “content”. including.

「ユーザ」に関連する第1の項目に着目して行う第1のサンプリング処理は、例えば、ログデータLにおいて、「ユーザ」に関連する「ユーザID10」の項目のデータが存在するログデータを抽出するサンプリング処理、特定のフォーマットの「ユーザID10」のログデータを抽出するサンプリング処理などを含む。   The first sampling process performed focusing on the first item related to the “user” extracts, for example, log data in which data of the item “user ID 10” related to the “user” exists in the log data L Sampling processing, sampling processing for extracting log data of “user ID 10” of a specific format, and the like.

「コンテンツ」に関連する第2の項目に着目して行う第2のサンプリング処理は、例えば、ログデータLにおいて、特定のコンテンツと関連付けされた「コンテンツID11」を含むデータを抽出するサンプリング処理などを含む。   The second sampling process performed focusing on the second item related to “content” is, for example, a sampling process for extracting data including “content ID 11” associated with a specific content in the log data L. Including.

また、サンプリング部22には、サンプリング処理によりサンプリングされるログデータの割合(以下、「サンプリングレート」と呼ぶ)が設定されている。例えば、サンプリング部22は、サンプリングレートに基づいて、サンプリングログSLの量の調整を行う。なお、サンプリング部22は、上述の行単位でのログデータのサンプリングの他、列単位での項目毎のサンプリング処理を行ってもよい。   Further, in the sampling unit 22, a ratio of log data sampled by the sampling process (hereinafter, referred to as "sampling rate") is set. For example, the sampling unit 22 adjusts the amount of the sampling log SL based on the sampling rate. The sampling unit 22 may perform sampling processing for each item in column units in addition to sampling of log data in row units described above.

また、サンプリング部22は、ログデータLに対するサンプリング処理を段階的に行ってもよい。例えば、サンプリング部22は、第1の期間が経過したログデータLに対して第1のサンプリング処理を行った後、所定の期間が経過した後に第2のサンプリング処理を行ってもよい。さらに、サンプリング部22は、この第2のサンプリング処理が行われたデータに対して、所定の期間が経過した後に第3のサンプリング処理を行ってもよい。このような二段階以上のサンプリング処理により、サンプリングログSLの短期保管、中期保管、長期保管といった段階的な保管期間の設定が可能となる。   In addition, the sampling unit 22 may perform sampling processing on the log data L in stages. For example, the sampling unit 22 may perform the second sampling process after a predetermined period has elapsed after performing the first sampling process on the log data L in which the first period has elapsed. Furthermore, the sampling unit 22 may perform the third sampling process on the data subjected to the second sampling process after a predetermined period has elapsed. Such two or more stages of sampling processing make it possible to set a phased storage period such as short-term storage, medium-term storage, and long-term storage of the sampling log SL.

編集部24は、取得部20によって取得されたログデータLに対して編集処理を行って編集データEDを生成する。編集部24は、生成した編集データEDを、編集データ記憶部34に記憶させる。例えば、編集部24は、ログデータLがサービス提供装置5によって日毎に作成される日次のテキストデータである場合、このテキストデータに対して編集処理を行う。   The editing unit 24 performs editing processing on the log data L acquired by the acquisition unit 20 to generate edited data ED. The editing unit 24 stores the generated editing data ED in the editing data storage unit 34. For example, when the log data L is daily text data created on a daily basis by the service providing device 5, the editing unit 24 performs editing processing on the text data.

(編集処理)
上述の編集処理は、例えば、「ユーザ」に関連する第1の項目に着目して行う第1の編集処理と、「コンテンツ」に関連する第2の項目に着目して行う第2の編集処理とを含む。
(Editing process)
The above-mentioned editing process is performed, for example, by performing a first editing process focusing on the first item related to the "user" and a second editing process focusing on the second item related to the "content". And.

「ユーザ」に関連する第1の項目に着目して行う第1の編集処理は、例えば、ログデータLにおいて、「ユーザ」に関連する「ユーザID10」の項目毎に、その他の項目を意味ベースの属性化したカラム(属性)に集約あるいは置き換え、その他の項目の並び替えおよび無効化、ログデータの並び替えなどを行い、目的に応じた所定の形式の編集データED(属性データAD)を生成する。   The first editing process performed focusing on the first item related to “user” is, for example, in the log data L, meaning-based other items for each item of “user ID 10” related to “user”. Consolidate or replace in the attributeized column (attribute), rearrange and invalidate other items, rearrange log data, etc., and generate edit data ED (attribute data AD) in a predetermined format according to the purpose. Do.

「コンテンツ」に関連する第2の項目に着目して行う第2の編集処理は、例えば、ログデータLにおいて、「コンテンツ」に関連する「コンテンツID11」毎に、その他の項目を意味ベースの属性化したカラム(属性)に集約あるいは置き換え、その他の項目の並び替えおよび無効化、ログデータの並び替えなどを行い、目的に応じた所定の形式の編集データを生成する。   The second editing process performed focusing on the second item related to “content” is, for example, in the log data L, attribute-based attributes of other items for each “content ID 11” related to “content”. It consolidates or replaces in the converted columns (attributes), rearranges and invalidates other items, rearranges log data, etc., and generates editing data of a predetermined format according to the purpose.

無効化部26は、ログデータ記憶部30に記憶されたログデータLに含まれるデータのうち、第1の期間が経過したデータを無効化する。ログデータLの無効化とは、例えば、ログデータ記憶部30からログデータLを物理的または論理的に削除することを言う。ここで無効化の対象となるログデータLは、サンプリング部22によるサンプリング処理の対象となったログデータである。第1の期間は、例えば、「1年」などに設定される。ここで、ログデータLがサービス提供装置5によって日毎に作成される日次のテキストデータである場合、無効化部26は、作成後1年以上経過したテキストデータを無効化する。   The invalidation unit 26 invalidates, of the data included in the log data L stored in the log data storage unit 30, the data for which the first period has elapsed. Invalidation of the log data L means, for example, physically or logically deleting the log data L from the log data storage unit 30. Here, the log data L to be invalidated is the log data to be subjected to the sampling process by the sampling unit 22. The first period is set to, for example, "one year". Here, when the log data L is daily text data created by the service providing device 5 on a daily basis, the invalidation unit 26 invalidates text data one year or more after creation.

また、無効化部26は、サンプリングログ記憶部32に記憶されたサンプリングSLのうち、第2の期間が経過したサンプリングログSLを無効化する。この第2の期間は、上述の第1の期間よりも長い期間が設定される。第2の期間は、例えば、「3年」などに設定される。この場合、無効化部26は、サンプリング部22によって生成された後3年以上経過したサンプリングログSLを無効化する。なお、上記のようにサンプリング部22が段階的なサンプリング処理を行っている場合、無効化部26は、サンプリングログSLに対して個別に設定された期間に応じてサンプリングログS毎に上記の無効化処理を行ってよい。   Further, the invalidation unit 26 invalidates the sampling log SL of which the second period has elapsed among the sampling SLs stored in the sampling log storage unit 32. The second period is set to be longer than the above-described first period. The second period is set to, for example, "3 years". In this case, the invalidation unit 26 invalidates the sampling log SL that has been generated by the sampling unit 22 and has passed three years or more. As described above, when the sampling unit 22 performs the stepwise sampling process, the invalidation unit 26 invalidates the above-described invalidation for each sampling log S according to the period individually set for the sampling log SL. Processing may be performed.

ログデータ記憶部30は、取得部20によって取得されたログデータLを記憶する。サンプリングログ記憶部32は、サンプリング部22によって生成されたサンプリングログSLを記憶する。編集データ記憶部34は、編集部24によって生成された編集データEDを記憶する。   The log data storage unit 30 stores the log data L acquired by the acquisition unit 20. The sampling log storage unit 32 stores the sampling log SL generated by the sampling unit 22. The editing data storage unit 34 stores the editing data ED generated by the editing unit 24.

[データ管理装置の処理]
次に、図5から図9を参照しながらデータ管理装置7の動作について説明する。図5は、データ管理装置7による処理の流れの一例を示すフローチャートである。図5のフローチャートに示す処理は、日次、週次、月次などの所定のタイミングで開始される。或いは、この処理は、データ管理装置7の利用者による指示に応じて開始されてもよい。
[Process of data management device]
Next, the operation of the data management device 7 will be described with reference to FIGS. 5 to 9. FIG. 5 is a flow chart showing an example of the flow of processing by the data management device 7. The process shown in the flowchart of FIG. 5 is started at a predetermined timing such as daily, weekly or monthly. Alternatively, this process may be started in response to an instruction from the user of the data management device 7.

まず、取得部20は、ネットワークNWを介して、サービス提供装置5からログデータLを取得する(ステップS101)。取得部20は、取得したログデータLをログデータ記憶部30に記憶させる。   First, the acquiring unit 20 acquires log data L from the service providing apparatus 5 via the network NW (step S101). The acquisition unit 20 stores the acquired log data L in the log data storage unit 30.

次に、サンプリング部22によるサンプリング処理(ステップS103)および編集部24による編集処理(ステップS105)のいずれか一方、または双方が実施される。実施対象となる処理は、予め設定されたスケジュールまたは利用者による指示などに応じて決定される。   Next, one or both of the sampling process (step S103) by the sampling unit 22 and the editing process (step S105) by the editing unit 24 are performed. The processing to be performed is determined according to a preset schedule or an instruction from the user.

(サンプリング処理)
サンプリング部22は、取得部20によって取得されてログデータ記憶部30に記憶されているログデータLのうち、第1の期間が経過したログデータLを読み出してサンプリング処理を行い、サンプリングログSLを生成する(ステップS103)。サンプリング部22は、生成したサンプリングログSLをサンプリングログ記憶部32に記憶させる。
(Sampling process)
The sampling unit 22 reads the log data L for which the first period has elapsed from the log data L acquired by the acquisition unit 20 and stored in the log data storage unit 30, performs sampling processing, and outputs the sampling log SL. It generates (step S103). The sampling unit 22 stores the generated sampling log SL in the sampling log storage unit 32.

ここで、サンプリング部22は、ログデータLに含まれる項目のうち、「ユーザ」に関連する「ユーザID10」の項目に着目して第1のサンプリング処理を行い、サンプリングログSLとして行動ログAL(第1のサンプリングログ)を生成する。サンプリング部22は、例えば、ログデータLに含まれるデータのうち、ユーザID10の項目のデータが存在するデータをサンプリングする。   Here, the sampling unit 22 performs the first sampling process focusing on the item of “user ID 10” related to “user” among the items included in the log data L, and performs an action log AL (a sampling log SL) Generate the first sampling log). The sampling unit 22 samples, for example, data in which data of an item of the user ID 10 exists among data included in the log data L.

図6は、図2に示すログデータLから、ユーザID10の項目のデータが存在するログデータをサンプリングしたサンプリングログSLの一例を示す図である。図6に示すように、サンプリングログSLにおいては、ログデータLに含まれるデータのうち、3行目および6行目のユーザID10の項目のデータが存在しないデータは無効化されている。   FIG. 6 is a view showing an example of a sampling log SL obtained by sampling log data in which data of the item of the user ID 10 exists from the log data L shown in FIG. As shown in FIG. 6, in the sampling log SL, among the data included in the log data L, data in which the data of the item of the user ID 10 in the third and sixth rows do not exist is invalidated.

また、サンプリング部22は、ログデータLに含まれるデータの項目のうち、「コンテンツ」に関連する「コンテンツID11」の項目に着目して第2のサンプリング処理を行い、サンプリングログSLとしてコンテンツログCL(第2のサンプリングログ)を生成する。サンプリング部22は、例えば、ログデータLに含まれるデータのうち、コンテンツID11の項目のデータが特定の形式を有するデータをサンプリングする。   Further, the sampling unit 22 performs second sampling processing focusing on the item of “content ID 11” related to “content” among the items of data included in the log data L, and the content log CL is used as a sampling log SL. Generate (second sampling log). The sampling unit 22 samples, for example, data of which the data of the item of the content ID 11 has a specific format among the data included in the log data L.

図7は、図2に示すログデータLから、コンテンツID11の項目のデータが“00001”から“00099”の範囲であるログデータをサンプリングしたサンプリングログSLの一例を示す図である。図7に示すように、サンプリングログSLにおいては、ログデータLに含まれるデータのうち、コンテンツID11の項目のデータが“00001”から“00099”の範囲ではない5行目から7行目のデータは無効化されている。   FIG. 7 is a view showing an example of a sampling log SL obtained by sampling log data in the range of “00001” to “00099” in the data of the item of the content ID 11 from the log data L shown in FIG. As shown in FIG. 7, in the sampling log SL, data of the item of the content ID 11 among the data included in the log data L is the data of the fifth to seventh rows which are not in the range of “00001” to “00009”. Is disabled.

また、サンプリング部22は、予め設定されたサンプリングレートに基づいて、上述のサンプリングログSLに含まれるデータの量を調整する。例えば、サンプリングレートとして“30%”が設定されている場合、サンプリングログSLに含まれるデータのうち30%のデータが残るように調整を行う(70%のデータを無効化する)。   In addition, the sampling unit 22 adjusts the amount of data included in the above-described sampling log SL based on a preset sampling rate. For example, when “30%” is set as the sampling rate, adjustment is performed so that 30% of the data included in the sampling log SL remains (70% of data is invalidated).

(編集処理)
編集部24は、取得部20によって取得されてログデータ記憶部30に記憶されているログデータLに対して編集処理を行い、編集データEDを生成する(ステップS105)。編集部24は、生成した編集データEDを編集データ記憶部34に記憶させる。
(Editing process)
The editing unit 24 performs editing processing on the log data L acquired by the acquiring unit 20 and stored in the log data storage unit 30, and generates editing data ED (step S105). The editing unit 24 stores the generated editing data ED in the editing data storage unit 34.

編集部24は、ログデータLに含まれる項目のうち、「ユーザ」に関連する「ユーザID10」の項目に着目して第1の編集処理を行い、編集データEDとして属性データAD(第1の編集データ)を生成する。編集部24は、マスターデータまたは所定の処理ロジックに従う第1の編集処理を行い、編集データEDを生成する。編集部24は、例えば、ログデータLにおいて、各ユーザIDと関連付けされた対象URLのリンク先のページが男性向けまたは女性向けであるかや、アクセス対象のコンテンツの傾向を集計して、ユーザIDをキーとして、その他の項目を「性別」などの意味ベースの属性化したカラム(属性)に集約あるいは置き換える。なお、「ユーザID」と「属性」の対応付けは、ユーザがウェブページの会員登録時に入力したデータを参照することで行われてよい。   Among the items included in the log data L, the editing unit 24 performs a first editing process paying attention to the item of “user ID 10” related to “user”, and the attribute data AD (first Generate editing data). The editing unit 24 performs first editing processing according to master data or predetermined processing logic, and generates editing data ED. For example, in the log data L, the editing unit 24 counts whether the page of the link destination of the target URL associated with each user ID is for men or women, and counts the tendency of the content to be accessed. The other items are aggregated or replaced into a semantic-based attributeized column (attribute) such as "gender" with the key as a key. The association between the “user ID” and the “attribute” may be performed by referring to data input by the user at the time of membership registration of the web page.

図8は、図2に示すログデータLに対して第1の編集処理を行うことにより得られた編集データED(行動履歴データ)の一例を示す図である。図8では、「ユーザID」が“bbbbb”であるデータに対して、「属性1(性別)」が“男性”および「属性2(趣味)」が“スポーツ”が関連付けされたデータが示されている。このように「ユーザ」に関連する「ユーザID10」の項目に着目した編集処理を行うことデータ容量を圧縮することが可能である。また、このような編集データEDは、ユーザの行動の統計的なデータを把握することが容易である解析処理に適した形式となっている。なお、編集部24は、上記の「属性1(性別)」および「属性2(趣味)」に加えてあるいは代えて、年齢、アクセス頻度などの多様な属性情報を編集データEDに追加してよい。   FIG. 8 is a view showing an example of edit data ED (action history data) obtained by performing the first editing process on the log data L shown in FIG. In FIG. 8, data in which "attribute 1 (gender)" is associated with "male" and "attribute 2 (hobby)" is associated with "sport" is shown for data in which "user ID" is "bbbbb". ing. Thus, it is possible to compress the data volume by performing the editing process focusing on the item of “user ID 10” related to “user”. Further, such editing data ED has a format suitable for analysis processing in which statistical data of the user's behavior can be easily grasped. Note that the editing unit 24 may add various attribute information such as age and access frequency to the editing data ED in addition to or instead of the above “attribute 1 (sex)” and “attribute 2 (hobby)”. .

また、編集部24は、ログデータLに含まれる項目のうち、「コンテンツ」に関連する「コンテンツID11」の項目に着目して第2の編集処理を行い、編集データEDとしてメタデータMD(第2の編集データ)を生成する。編集部24は、マスターデータまたは所定の処理ロジックに従う第2の編集処理を行い、編集データEDを生成する。編集部24は、例えば、ログデータLに含まれるコンテンツIDをキーとして、その他の項目を「商品、サービス」などの意味ベースの属性化したカラム(属性)に集約あるいは置き換える。また、編集部24は、例えば、各コンテンツIDにアクセスしたユーザの傾向を集計して、「対象ユーザ」の属性を決定する。   Further, the editing unit 24 performs the second editing process paying attention to the item “content ID 11” related to “content” among the items included in the log data L, and generates the editing data ED as the metadata MD Generate 2) edit data. The editing unit 24 performs second editing processing according to master data or predetermined processing logic, and generates editing data ED. For example, with the content ID included in the log data L as a key, the editing unit 24 aggregates or replaces other items into a semantic-based attributeized column (attribute) such as "goods, services". Also, the editing unit 24 counts the tendency of the user who has accessed each content ID, for example, to determine the attribute of the “target user”.

図9は、図2に示すログデータLに対して第2の編集処理を行うことにより得られた編集データED(アクセス履歴データ)の一例を示す図である。図9では、「コンテンツID」が“00001”であるデータに対して、「属性1(商品、サービス)」が“スポーツ”および「属性2(対象ユーザ)」が“男性”が関連付けされたデータが示されている。このように「コンテンツ」に関連する「コンテンツID11」の項目に着目した編集処理を行うことデータ容量を圧縮することが可能である。また、このような編集データEDは、コンテンツIDと関連付けされたウェブページに対するユーザのアクセス状況を把握することが容易である解析処理に適した形式となっている。なお、編集部24は、上記の「属性1(商品、サービス)」および「属性2(対象ユーザ)」に加えてあるいは代えて、アクセス数などの多様な属性情報を編集データEDに追加してよい。   FIG. 9 is a view showing an example of edited data ED (access history data) obtained by performing the second editing process on the log data L shown in FIG. In FIG. 9, data in which “sport” for “attribute 1 (goods and services)” and “male” for “attribute 2 (target user)” are associated with data for which “content ID” is “00001”. It is shown. Thus, it is possible to compress the data volume by performing the editing process focusing on the item of "content ID 11" related to "content". Further, such edit data ED has a format suitable for analysis processing in which it is easy to grasp the user's access state to the web page associated with the content ID. Note that the editing unit 24 adds various attribute information such as the number of accesses to the editing data ED in addition to or instead of the above “attribute 1 (goods and services)” and “attribute 2 (target user)”. Good.

なお、各ウェブページに表示された画像に関連する情報などがログデータ記憶部30に記憶されている場合、編集部24は、この画像の色などの特徴量や、画像の種類(風画像景なのか、人物画像なのか)などに基づいて、編集データED(メタデータMD)を生成してもよい。   When the information related to the image displayed on each web page is stored in the log data storage unit 30, the editing unit 24 determines the feature amount such as the color of the image, the type of the image (the wind image landscape The edit data ED (metadata MD) may be generated on the basis of a human image or the like.

次に、無効化部26は、ログデータ記憶部30に記憶されたログデータLのうち、第1の期間が経過したログデータLを無効化し、サンプリングログ記憶部32に記憶されたサンプリングSLのうち、第2の期間が経過したサンプリングログSLを無効化する(ステップS107)。以上により、本フローチャートの処理を終了する。   Next, the invalidation unit 26 invalidates, of the log data L stored in the log data storage unit 30, the log data L for which the first period has elapsed, and the sampling SL stored in the sampling log storage unit 32. Among them, the sampling log SL for which the second period has elapsed is invalidated (step S107). Thus, the process of this flowchart is ended.

以上において説明した実施形態によれば、容量を抑えつつ解析処理に適した形式でログデータを管理することが可能である。サンプリングログSLの容量は、ログデータLよりも小さいため、必要な情報を残しつつ記憶部に記憶されるデータの容量を低減させることができる。このサンプリングログSLは、ログデータLを用いて所望のモデルの生成する際に利用されることが可能である。また、編集データEDは、解析に適した形式を有しており、解析における処理装置の負荷を軽減するとともに、処理時間を短縮することも可能である。また、編集データEDは無効化されることはないため、容量を抑えつつ必要な情報を残すことが可能である。   According to the embodiment described above, it is possible to manage log data in a format suitable for analysis processing while suppressing the capacity. Since the capacity of the sampling log SL is smaller than the log data L, it is possible to reduce the capacity of data stored in the storage unit while leaving necessary information. The sampling log SL can be used when generating a desired model using the log data L. Further, the editing data ED has a format suitable for analysis, and it is also possible to reduce the processing time as well as reduce the processing load on the analysis. Further, since the edited data ED is not invalidated, it is possible to keep necessary information while reducing the capacity.

なお、上述の実施形態においては、取得部20、サンプリング部22、および編集部24の各々が、ログデータL、サンプリングログSL、および編集データEDを、データ管理装置7内に設けられた記憶部28に記憶させる構成を説明した。しかしながら、取得部20、サンプリング部22、および編集部24の各々は、ログデータL、サンプリングログSL、および編集データEDを電気代の安価な地域(例えば、外国、地方など)に配置された記憶装置に送信するようにしてもよい。また、取得部20、サンプリング部22、および編集部24の各々は、ログデータL、サンプリングログSL、および編集データEDを磁気テープなどの外部の記憶媒体に出力してもよい。   In the above embodiment, each of the acquisition unit 20, the sampling unit 22, and the editing unit 24 is a storage unit in which the log data L, the sampling log SL, and the editing data ED are provided in the data management device 7. The configuration to be stored in 28 has been described. However, each of the acquisition unit 20, the sampling unit 22, and the editing unit 24 stores the log data L, the sampling log SL, and the editing data ED in an inexpensive area (for example, a foreign country, a region, etc.) It may be transmitted to the device. Further, each of the acquisition unit 20, the sampling unit 22, and the editing unit 24 may output the log data L, the sampling log SL, and the editing data ED to an external storage medium such as a magnetic tape.

また、上述の実施形態においては、サンプリング部22が、所定のサンプリングレートに基づいてサンプリング処理を行う構成を説明した。しかしながら、サンプリング部22が、記憶部28の空き容量を確認して、空き容量に応じてサンプリングレートを動的に変化させるようにしてもよい。   Moreover, in the above-mentioned embodiment, the structure which the sampling part 22 performs a sampling process based on the predetermined | prescribed sampling rate was demonstrated. However, the sampling unit 22 may check the free space of the storage unit 28 and dynamically change the sampling rate according to the free space.

また、上述の実施形態においては、サンプリング部22が、所定の「第1の期間」に基づいてサンプリング処理を行い、無効化部26が、所定の「第1の期間」および「第2の期間」に基づいて無効化処理を行う構成を説明した。しかしながら、サンプリング部22または無効化部26が、記憶部28の空き容量を確認して、空き容量に応じて「第1の期間」および「第2の期間」を動的に変化させるようにしてもよい。   Further, in the above-described embodiment, the sampling unit 22 performs the sampling process based on the predetermined “first period”, and the invalidation unit 26 performs the predetermined “first period” and the “second period”. The configuration for performing the invalidation processing based on the above has been described. However, the sampling unit 22 or the invalidation unit 26 checks the free space of the storage unit 28 to dynamically change the “first period” and the “second period” according to the free space. It is also good.

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。   As mentioned above, although the form for carrying out the present invention was explained using an embodiment, the present invention is not limited at all by such an embodiment, and various modification and substitution within the range which does not deviate from the gist of the present invention Can be added.

1‥データ管理システム、3‥端末装置、5‥サービス提供装置、7‥データ管理装置、20‥取得部、22‥サンプリング部、24‥編集部、26‥無効化部、28‥記憶部、30‥ログデータ記憶部、32‥サンプリングログ記憶部、34‥編集データ記憶部、NW‥ネットワーク   1. data management system 3. terminal device 5. service providing device 7. data management device 20 acquisition unit 22 sampling unit 24 editing unit 26 invalidation unit 28 storage unit 30 .. log data storage unit, 32 .. sampling log storage unit, 34 .. edit data storage unit, NW .. network

Claims (9)

端末装置によるアクセスに応じて取得されるログデータを取得する取得部と、
前記取得部によって取得された前記ログデータに含まれるデータのうち第1の期間が経過したデータに対して、前記ログデータに含まれる第1の項目に着目した第1のサンプリング処理を行って第1のサンプリングログを生成するとともに前記ログデータに含まれる第2の項目に着目した第2のサンプリング処理を行って第2のサンプリングログを生成するサンプリング部と、
前記取得部によって取得された前記ログデータに含まれるデータのうち前記第1の期間が経過したデータを無効化するとともに前記サンプリング部によって生成された前記第1のサンプリングログおよび第2のサンプリングログのうち前記第1の期間よりも長い第2の期間が経過した前記第1のサンプリングログおよび第2のサンプリングログを無効化する無効化部と
を備えるデータ管理装置。
An acquisition unit that acquires log data acquired according to access by the terminal device;
The first sampling process focusing on the first item included in the log data is performed on the data included in the log data acquired by the acquisition unit and for which the first period has elapsed, by performing first sampling processing A sampling unit that generates a sampling log and generates a second sampling log by performing a second sampling process focusing on a second item included in the log data while generating a sampling log of 1;
Among the data included in the log data acquired by the acquisition unit, data in which the first period has elapsed is invalidated and the first sampling log and the second sampling log generated by the sampling unit A data management apparatus, comprising: an invalidation unit that invalidates the first sampling log and the second sampling log of which the second period longer than the first period has elapsed.
前記取得部によって取得された前記ログデータに含まれるデータに対して、前記第1の項目に着目した第1の編集処理を行って第1の編集データを生成するとともに前記第2の項目に着目した第2の編集処理を行って第2の編集データを生成する編集部をさらに備える、
請求項1に記載のデータ管理装置。
A first editing process focusing on the first item is performed on data included in the log data acquired by the acquisition unit to generate a first editing data, and an attention is paid to the second item. Further comprising an editing unit which performs the second editing process described above to generate second editing data;
The data management device according to claim 1.
前記第1の項目は、前記端末装置を利用するユーザを識別する項目であり、
前記第2の項目は、前記端末装置によってアクセスされた電子ページと関連付けされたコンテンツを識別する項目である、
請求項1または2に記載のデータ管理装置。
The first item is an item identifying a user who uses the terminal device,
The second item is an item that identifies content associated with an electronic page accessed by the terminal device.
The data management device according to claim 1.
前記無効化部は、前記編集部によって生成された第1の編集データおよび第2の編集データを無効化しない、
請求項2に記載のデータ管理装置。
The invalidation unit does not invalidate the first editing data and the second editing data generated by the editing unit.
The data management device according to claim 2.
前記サンプリング部は、所定のサンプリングレートに基づいて、前記第1のサンプリング処理および第2のサンプリング処理を行う、
請求項1から4のいずれか一項に記載のデータ管理装置。
The sampling unit performs the first sampling process and the second sampling process based on a predetermined sampling rate.
The data management device according to any one of claims 1 to 4.
前記取得部、前記サンプリング部、および前記編集部の各々は、前記ログデータ、前記サンプリングログ、および前記編集データを、電気代の安価な地域に配置された記憶装置に送信する、
請求項2に記載のデータ管理装置。
Each of the acquisition unit, the sampling unit, and the editing unit transmits the log data, the sampling log, and the editing data to a storage device arranged in an inexpensive area of an electricity bill.
The data management device according to claim 2.
端末装置によるアクセスに応じて取得されるログデータを取得する取得部と、
前記取得部によって取得された前記ログデータに含まれるデータのうち第1の期間が経過したデータに対して、前記ログデータに含まれる第1の項目に着目した第1の編集処理を行って第1の編集データを生成するとともに前記ログデータに含まれる第2の項目に着目した第2の編集処理を行って第2の編集データを生成する編集部と
を備えるデータ管理装置。
An acquisition unit that acquires log data acquired according to access by the terminal device;
The first editing process focusing on the first item included in the log data is performed on the data included in the log data acquired by the acquisition unit and for which the first period has elapsed, by performing a first editing process A data management apparatus comprising: an editing unit that generates first editing data and performs second editing processing focusing on a second item included in the log data to generate second editing data.
コンピュータが、
端末装置によるアクセスに応じて取得されるログデータを取得し、
前記取得された前記ログデータに含まれるデータのうち第1の期間が経過したデータに対して、前記ログデータに含まれる第1の項目に着目した第1のサンプリング処理を行って第1のサンプリングログを生成するとともに前記ログデータに含まれる第2の項目に着目した第2のサンプリング処理を行って第2のサンプリングログを生成し、
前記取得された前記ログデータに含まれるデータのうち前記第1の期間が経過したデータを無効化するとともに前記生成された前記第1のサンプリングログおよび第2のサンプリングログのうち前記第1の期間よりも長い第2の期間が経過した前記第1のサンプリングログおよび第2のサンプリングログを無効化する、
データ管理方法。
The computer is
Acquire log data acquired according to access by a terminal device,
A first sampling process focusing on a first item included in the log data is performed on data in which a first period has elapsed among data included in the acquired log data, and a first sampling is performed Generating a second sampling log by performing a second sampling process focusing on a second item included in the log data while generating a log;
Of the data included in the acquired log data, data in which the first period has elapsed is invalidated, and the first period of the generated first sampling log and second sampling log is invalidated. Invalidating the first sampling log and the second sampling log after a second period longer than the second period has elapsed,
Data management method.
コンピュータに、
端末装置によるアクセスに応じて取得されるログデータを取得させ、
前記取得された前記ログデータに含まれるデータのうち第1の期間が経過したデータに対して、前記ログデータに含まれる第1の項目に着目した第1のサンプリング処理を行って第1のサンプリングログを生成するとともに前記アクセスログに含まれる第2の項目に着目した第2のサンプリング処理を行って第2のサンプリングログを生成させ、
前記取得された前記ログデータログデータに含まれるデータのうち前記第1の期間が経過したデータを無効化するとともに前記生成された前記第1のサンプリングログおよび第2のサンプリングログのうち前記第1の期間よりも長い第2の期間が経過した前記第1のサンプリングログおよび第2のサンプリングログを無効化させる、
プログラム。
On the computer
Have the log data acquired in response to the access by the terminal device be acquired,
A first sampling process focusing on a first item included in the log data is performed on data in which a first period has elapsed among data included in the acquired log data, and a first sampling is performed Generating a second sampling log by performing a second sampling process focusing on a second item included in the access log while generating a log;
Among the data included in the acquired log data log data, data in which the first period has elapsed is invalidated, and the first sampling log and the second sampling log that are generated are generated. Invalidating the first sampling log and the second sampling log after the second period longer than the second period has elapsed,
program.
JP2017084326A 2017-04-21 2017-04-21 Data management equipment, data management methods, and programs Active JP6971053B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017084326A JP6971053B2 (en) 2017-04-21 2017-04-21 Data management equipment, data management methods, and programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017084326A JP6971053B2 (en) 2017-04-21 2017-04-21 Data management equipment, data management methods, and programs

Publications (2)

Publication Number Publication Date
JP2018181234A true JP2018181234A (en) 2018-11-15
JP6971053B2 JP6971053B2 (en) 2021-11-24

Family

ID=64275604

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017084326A Active JP6971053B2 (en) 2017-04-21 2017-04-21 Data management equipment, data management methods, and programs

Country Status (1)

Country Link
JP (1) JP6971053B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505107A (en) * 2021-05-26 2021-10-15 中国再保险(集团)股份有限公司 Typhoon file compression method and compression system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011186516A (en) * 2010-03-04 2011-09-22 Nec Corp Log management method, log management program, and log management device
US20120030018A1 (en) * 2010-07-28 2012-02-02 Aol Inc. Systems And Methods For Managing Electronic Content
JP2012088843A (en) * 2010-10-18 2012-05-10 Nec Corp Filtering rule determination system, filtering rule determination method, filtering method, and program
JP2016157382A (en) * 2015-02-26 2016-09-01 富士ゼロックス株式会社 Information processing apparatus and information processing program
JP2017045217A (en) * 2015-08-26 2017-03-02 株式会社Screenホールディングス Log management device, log management method, and log management program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011186516A (en) * 2010-03-04 2011-09-22 Nec Corp Log management method, log management program, and log management device
US20120030018A1 (en) * 2010-07-28 2012-02-02 Aol Inc. Systems And Methods For Managing Electronic Content
JP2012088843A (en) * 2010-10-18 2012-05-10 Nec Corp Filtering rule determination system, filtering rule determination method, filtering method, and program
JP2016157382A (en) * 2015-02-26 2016-09-01 富士ゼロックス株式会社 Information processing apparatus and information processing program
JP2017045217A (en) * 2015-08-26 2017-03-02 株式会社Screenホールディングス Log management device, log management method, and log management program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
アンドリュー・S・タネンバウム, 外1名, コンピュータネットワーク, vol. 第5版, JPN6021006143, 17 September 2013 (2013-09-17), pages 74 - 78, ISSN: 0004450627 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505107A (en) * 2021-05-26 2021-10-15 中国再保险(集团)股份有限公司 Typhoon file compression method and compression system
CN113505107B (en) * 2021-05-26 2023-11-10 中国再保险(集团)股份有限公司 Typhoon file compression method and system

Also Published As

Publication number Publication date
JP6971053B2 (en) 2021-11-24

Similar Documents

Publication Publication Date Title
JP6549128B2 (en) System and method for guided user action
US20230208937A1 (en) Methods and apparatus to supplement web crawling with cached data from distributed devices
KR101514738B1 (en) Advertisement based on application-created social content
US20180034899A1 (en) Aggregating Plug-In Requests for Improved Client Performance
KR101777304B1 (en) Image cropping according to points of interest
US10043199B2 (en) Method, device and system for publishing merchandise information
US20140136936A1 (en) Spreadsheet functions to call rest api sources
US20150081431A1 (en) Posterior probability calculating apparatus, posterior probability calculating method, and non-transitory computer-readable recording medium
US20230034025A1 (en) Method and system for online user profiling
JP2017142796A (en) Identification and extraction of information
WO2019080662A1 (en) Information recommendation method, device and apparatus
JP6775510B2 (en) Terminals, terminal control methods, and programs
JP5905551B1 (en) Information processing device, terminal device, information processing method, and information processing program
CN107688568A (en) Acquisition method and device based on web page access behavior record
US8793236B2 (en) Method and apparatus using historical influence for success attribution in network site activity
WO2013106595A2 (en) Processing store visiting data
CN108170731A (en) Data processing method, device, computer storage media and server
CN104142975B (en) Microblog information promotion method, device and system
CN106980696B (en) Photo file classification method and device
US20160239533A1 (en) Identity workflow that utilizes multiple storage engines to support various lifecycles
CN105408894B (en) A kind of user identity classification determines method and device
CN112463868A (en) Data processing method, data processing system and computing device
CN107977678A (en) Method and apparatus for output information
JP2008097259A (en) Business support system and method using access analysis
JP6407318B2 (en) Information processing device, terminal device, information processing method, and information processing program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211101

R150 Certificate of patent or registration of utility model

Ref document number: 6971053

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350