JP2020154381A - Information processing system, information processing device, information processing method, and program - Google Patents
Information processing system, information processing device, information processing method, and program Download PDFInfo
- Publication number
- JP2020154381A JP2020154381A JP2019049583A JP2019049583A JP2020154381A JP 2020154381 A JP2020154381 A JP 2020154381A JP 2019049583 A JP2019049583 A JP 2019049583A JP 2019049583 A JP2019049583 A JP 2019049583A JP 2020154381 A JP2020154381 A JP 2020154381A
- Authority
- JP
- Japan
- Prior art keywords
- information
- log information
- service
- information processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 61
- 238000003672 processing method Methods 0.000 title claims abstract description 6
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 230000002776 aggregation Effects 0.000 claims abstract description 15
- 238000004220 aggregation Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims description 69
- 238000000034 method Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 21
- 239000006185 dispersion Substances 0.000 abstract 2
- 238000006243 chemical reaction Methods 0.000 description 35
- 238000007726 management method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000007906 compression Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Abstract
Description
本発明は、情報処理システム、情報処理装置、情報処理方法およびプログラムに関する。 The present invention relates to information processing systems, information processing devices, information processing methods and programs.
従来、時間経過とともに順次受け付けたログデータをログのフィールドに基づいて設定した一まとまりの操作ごとにグループ化する情報処理装置に関する技術情報が開示されている(特許文献1参照)。 Conventionally, technical information regarding an information processing apparatus that groups log data sequentially received with the passage of time for each set of operations set based on log fields has been disclosed (see Patent Document 1).
しかしながら、上記従来の技術では、ログの出力規格が統一されていない複数のサービスサーバからログを収集することについて十分に考慮されていない可能性があった。 However, in the above-mentioned conventional technique, there is a possibility that the collection of logs from a plurality of service servers whose log output standards are not unified is not sufficiently considered.
本発明は、このような事情を考慮してなされたものであり、複数のサービスサーバからログを好適に収集することができる情報処理システム、情報処理装置、情報処理方法およびプログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and provides an information processing system, an information processing device, an information processing method and a program capable of suitably collecting logs from a plurality of service servers. It is one of the purposes.
本発明の一態様は、複数のサービスサーバの利用状況に関する非構造化ログ情報を取得して、前記非構造化ログ情報を、少なくともサービス識別情報とタイムスタンプとに基づいてグループ化して記憶部に記憶させるログ収集部と、前記記憶部に記憶させる前記非構造化ログ情報を分散処理する分散処理部と、前記記憶部に記憶されたグループ化された前記非構造化ログ情報に対して利用者のアクセス権を管理するアクセス権限管理部と、グループ化され分散処理された前記非構造化ログ情報に対する利用者が参照する際の参照条件の指定を受け付ける集約・分析部と、を備える、情報処理システムである。 One aspect of the present invention is to acquire unstructured log information regarding the usage status of a plurality of service servers, and group the unstructured log information based on at least service identification information and a time stamp in a storage unit. A user for a log collecting unit to be stored, a distributed processing unit for distributed processing of the unstructured log information stored in the storage unit, and a grouped unstructured log information stored in the storage unit. Information processing that includes an access authority management unit that manages the access rights of the information processor and an aggregation / analysis unit that accepts the specification of reference conditions when the user refers to the unstructured log information that has been grouped and distributed. It is a system.
本発明の一態様によれば、複数のサービスサーバからログを好適に収集することができる。 According to one aspect of the present invention, logs can be suitably collected from a plurality of service servers.
以下、図面を参照し、本発明の情報処理システム、情報処理装置、情報処理方法およびプログラムの実施形態について説明する。 Hereinafter, embodiments of the information processing system, information processing apparatus, information processing method, and program of the present invention will be described with reference to the drawings.
〔概要〕
情報処理システムは、複数のサービスサーバの利用履歴(ログ)を収集し、サービスを横断して収集した利用履歴を展開することを支援するシステムである。
〔Overview〕
The information processing system is a system that collects usage histories (logs) of a plurality of service servers and supports the development of the collected usage histories across services.
複数のサービスサーバのそれぞれは、例えば、ユーザにより操作される端末装置からのリクエストに対応するウェブページを提供するウェブサーバ、アプリケーションが起動された端末装置と通信を行って各種情報の受け渡しを行ってコンテンツ情報を提供するアプリケーションサーバなどである。サービスサーバは、例えば、ニュースを提供するサービスやショッピングサービス、オークションサービス、マッチングサービス、金融決済サービス、ナビゲーションサービス、ウェブメールサービスなどを、ネットワークを介して提供する。 Each of the plurality of service servers, for example, communicates with a web server that provides a web page corresponding to a request from a terminal device operated by a user, and a terminal device on which an application is started to exchange various information. An application server that provides content information. The service server provides, for example, a news providing service, a shopping service, an auction service, a matching service, a financial payment service, a navigation service, a webmail service, and the like via a network.
サービスサーバのそれぞれが提供するサービスは、サービス特性に違いがあったり、サービス提供に用いるOS(Operation System)やミドルウェアに違いが合ったりするため、すべてのサービスサーバにおける利用履歴の出力規格を統一することは困難である場合がある。 Since the services provided by each service server have different service characteristics and the OS (Operation System) and middleware used to provide the service are different, the output standard of the usage history of all service servers is unified. Things can be difficult.
そこで、情報処理装置は、各サービスサーバのアプリケーション構成を大きく変更することなく出力可能な形式で利用履歴を出力させるようにし、複数のサービスサーバにより提供されるウェブページのエンドユーザの利用履歴を収集して、サービスごとにグループ化する。これにより、サービスサーバが提供するサービスの利用履歴を、他のサービスで自サービスのユーザ利用履歴と同様に参照させることを実現したり、統計データ収集などの別の用途に流用したりすることを可能にする。 Therefore, the information processing device outputs the usage history in a format that can be output without significantly changing the application configuration of each service server, and collects the usage history of the end user of the web page provided by a plurality of service servers. Then group by service. As a result, the usage history of the service provided by the service server can be referred to by other services in the same way as the user usage history of the own service, or it can be diverted to another purpose such as statistical data collection. enable.
情報処理システムは、例えば、一以上のプロセッサにより実現される情報処理装置を備える。情報処理装置は、複数の参照主体(サービスサーバを用いてサービスを提供するユーザ)により参照されるログデータを管理する装置である。ログデータとは、エンドユーザの利用端末においてサービスアプリケーションが実行されることで生じるイベントを時間経過に沿って記録される履歴を収集して記録したものである。 The information processing system includes, for example, an information processing device realized by one or more processors. The information processing device is a device that manages log data referred to by a plurality of reference subjects (users who provide services using a service server). The log data is a collection of records of events generated by the execution of a service application on an end user's terminal, which are recorded over time.
情報処理装置は、例えば、複数のサービスサーバのサービス提供、特にエンドユーザの利用状況に関する利用履歴である非構造化ログ情報を取得する取得部と、非構造化ログ情報に含まれる情報のうち、少なくともサービス識別情報とタイムスタンプとに基づいてグループ化してデータレイクに記憶させるグループ化部とを備える。 The information processing device includes, for example, an acquisition unit that acquires unstructured log information that is usage history related to service provision of a plurality of service servers, particularly usage status of end users, and information included in the unstructured log information. It is provided with a grouping unit that groups at least based on the service identification information and the time stamp and stores it in the data lake.
情報処理システムは、上述の情報処理装置に加え、例えば、複数のサービスサーバと、サービスサーバにより提供されるサービスを管理するユーザ(以下、サービス提供者)の利用端末と、サービスサーバにより提供されるサービスを利用するユーザ(以下、エンドユーザ)の利用端末とネットワークを介して接続される。 In addition to the above-mentioned information processing apparatus, the information processing system is provided by, for example, a plurality of service servers, terminals used by users who manage services provided by the service servers (hereinafter, service providers), and service servers. It is connected to the user terminal of the user who uses the service (hereinafter referred to as the end user) via the network.
データレイクは、データウェアハウス(DWH;Data Warehouse)などの記憶装置とは異なり、格納するデータのデータ構造を事前に把握しておきデータ格納のための事前設計をする必要がなく、非構造化データの記憶が可能である。データレイクは、非構造化データを記憶可能なリポジトリであると解釈されてもよい。データレイクに格納されたデータは、専用の分散処理装置を用いて読み出し時に解釈され、以後の分析等の処理に用いられる。 Unlike storage devices such as data warehouses (DWHs), data lakes are unstructured because there is no need to know the data structure of the data to be stored in advance and design in advance for data storage. Data can be stored. A data lake may be interpreted as a repository that can store unstructured data. The data stored in the data lake is interpreted at the time of reading using a dedicated distributed processing device, and is used for subsequent processing such as analysis.
[全体構成1]
図1は、情報処理システム1の利用環境を示す図である。情報処理システム1は、例えば、サービスサーバSS−1〜SS−N(Nは自然数)およびエンドユーザ端末T−1〜T−M(Mは自然数)と、サービス提供者端末Dと、ネットワークNWを介して通信する。ネットワークNWは、例えば、WAN(Wide Area Network)、LAN(Local Area Network)、インターネット、プロバイダ装置、無線基地局、専用回線などのうちの一部または全部を含む。以下の説明において、個々のサービスサーバSS−1〜SS−Nを区別しない場合には、単にサービスサーバSSと呼ぶ。また、以下の説明において、個々のエンドユーザ端末T−1〜T−Mを区別しない場合には、単にエンドユーザ端末Tと呼ぶ。
[Overall configuration 1]
FIG. 1 is a diagram showing a usage environment of the
エンドユーザ端末Tおよびサービス提供者端末Dは、例えば、スマートフォンなどの携帯電話、タブレット端末、パーソナルコンピュータ等である。サービス提供者端末Dは、操作に応じて、ログ情報の参照リクエスト(コマンド)を情報処理システム1に送信し、返信されたリクエストの処理結果をサービス提供者端末Dの表示部に表示する。
The end user terminal T and the service provider terminal D are, for example, a mobile phone such as a smartphone, a tablet terminal, a personal computer, and the like. The service provider terminal D transmits a log information reference request (command) to the
図2は、情報処理システム1の模式図である。情報処理システム1は、例えば、情報処理装置100と、分散処理装置200と、集約・分析装置300と、アクセス権限管理装置400とを備える。
FIG. 2 is a schematic diagram of the
情報処理装置100は、例えば、取得部110と、データレイク120と、グループ化部130とを備える。情報処理装置100のデータレイク120を除くこれらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予め情報処理装置100のHDDやフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで情報処理装置100のHDDやフラッシュメモリにインストールされてもよい。情報処理装置100は、「ログ収集部」の一例である。
The
取得部110は、サービスアプリケーションSAまたはサービスサーバSSから非構造化ログ情報Lを取得して、データレイク120に格納する。取得部110は、非構造化ログ情報Lをデータレイク120に格納するための適した形式に変更してもよく、例えば、非構造化ログ情報Lをシリアライズ(並び順を整えること)したり、バイナリ化したりしてからデータレイク120に格納する。非構造化ログ情報Lについては後述する。
The
取得部110は、例えば、サービスアプリケーションSAがサービスサーバSSにリクエスト送信するタイミングで、取得部110にもリクエスト送信に含まれる(またはリクエストに関係する)ログ情報を送信させるAPI通信を行わせることで、サービスアプリケーションSAから非構造化ログ情報Lを取得する。また、取得部110は、サービスサーバSSがサービスアプリケーションSAから送信されたリクエストを受信した結果として自サーバの記憶部にログ情報を格納する場合に、ログ情報の一部または全部を送信させるAPI通信を行わせることで、サービスサーバSSから非構造化ログ情報Lを取得する。このように取得部110による非構造化ログ情報Lを取得する処理は、REST APIと称される場合がある。
For example, when the service application SA transmits a request to the service server SS, the
取得部110は、例えば、Apache Kafkaなどのメッセージキュー機能を有するオープンソースによって実現されてもよい。
The
なお、取得部110は、複数設けられてもよく、サービスサーバSSごとに専用の取得部110が設けられてもよいし、一つの取得部110が複数のサービスサーバSSから非構造化ログ情報Lを取得するものであってもよい。
A plurality of
グループ化部130は、データレイク120に格納された非構造化ログ情報Lに含まれる情報のうち、少なくともサービス識別情報に基づいて非構造化ログ情報Lをグループ化して分散処理装置200に出力する。グループ化部130は、グループ化した非構造化ログ情報Lを圧縮してもよい。グループ化部130によるグループ化処理については後述する。
The
[非構造化ログ情報]
図3は、非構造化ログ情報Lの一例を示す図である。非構造化ログ情報Lには、少なくとも、サービスを識別するための情報(以下、サービス識別情報LE)が含まれる。なお、非構造化ログ情報Lにサービス識別情報LEが含まれない場合には、取得部110が非構造化ログ情報Lの出力元のサービスサーバSSを識別して、サービス識別情報LEを追記してもよい。
[Unstructured log information]
FIG. 3 is a diagram showing an example of unstructured log information L. The unstructured log information L includes at least information for identifying a service (hereinafter, service identification information LE). If the unstructured log information L does not include the service identification information LE, the
なお、以下の説明において、サービス識別情報LEは、サービス種別の大区分であるProjectと、Projectよりも粒度の細かい分類区分であるDatasetとを含むものとして説明する。図4は、グループ化部130によるグループ化処理を模式的に示す図である。例えば、サービス識別情報LEに含まれるProjectがProject1“ショッピング”である場合、DatasetはDataset10“トップページ”、Dataset11“特集ページ”、Dataset12“商品紹介ページ”、Dataset13“購入手続きページ”などのようにウェブページの特性やサービスの内容を区分する情報が含まれる。
In the following description, the service identification information LE will be described as including Project, which is a major classification of service types, and Dataset, which is a classification classification having a finer particle size than Project. FIG. 4 is a diagram schematically showing the grouping process by the
非構造化ログ情報Lに含まれる構成要素や構成要素の並び順は、サービス提供者によって設定可能であり、構成要素の追加、削除、並び順変更などが随時行われてもよい。また、サービスサーバSSの提供するウェブページの種別や特性に応じて、それぞれのウェブページごとに異なる構成の非構造化ログ情報Lが出力されてもよい。 The components and the order of the components included in the unstructured log information L can be set by the service provider, and the components may be added, deleted, or the order may be changed at any time. Further, unstructured log information L having a different configuration may be output for each web page according to the type and characteristics of the web page provided by the service server SS.
非構造化ログ情報Lは、例えば、サービスアプリケーションSAやエンドユーザ端末Tのブラウザから、HTMLのPOSTメソッドを用いて情報処理システム1に送信される。なお、非構造化ログ情報Lは、サービスアプリケーションSAからサービスサーバSSに送信されるログ情報と同一であってもよいし、サービスアプリケーションSAからサービスサーバSSに送信されるログ情報の一部が用いられてもよい。取得部110は、例えば、図示のようにJSON(JavaScript(登録商標) Object Notation)形式のログファイルとして非構造化ログ情報Lを取得して、データレイク120に格納する。
The unstructured log information L is transmitted to the
[全体構成2]
図2に戻り、分散処理装置200は、例えば、Hadoop(登録商標)などに代表される分散型ストレージによって実現されるものであって、構造化されていないメタデータを複数のデータに分割し、分割した其々のデータに対して、並列に処理を行う装置である。分散処理装置200は、「分散処理部」の一例である。
[Overall configuration 2]
Returning to FIG. 2, the distributed
集約・分析装置300は、例えば、Hiveなどに代表されるデータウェアハウス構築環境を実現するための装置であって、データレイク120に格納された非構造化ログ情報Lを集約したり、問い合わせしたり、分析したりする。集約・分析装置300は、サービス提供者端末Dにより送信されるHQL(Hibernate Query Language)を受け付ける。HQLは、リレーショナルデータベースの管理や操作を行うための問い合わせ言語であるSQL(Structured Query Language)に似た規約で記述可能な問い合わせ言語である。分散処理装置200および集約・分析装置300は、「収集・分析部」の一例である。
The aggregation /
アクセス権限管理装置400は、サービス提供者が他のサービスを提供するサービスサーバSSのログ情報にアクセスしてもよいか否かを管理する。サービス提供者は、自らが管理するサービスサーバSSのログ情報のうち、他のサービス提供者に公開してもよいものや公開しないものをアクセス権限管理装置400にあらかじめ設定しておく。アクセス権限管理装置400は、「アクセス権限管理部」の一例である。
The access
[グループ化処理]
図5は、グループ化部130によるグループ化処理について説明するための図である。グループ化部130によるグループ化処理は、例えば、4回の段階的な変換処理から構成される。
[Grouping process]
FIG. 5 is a diagram for explaining the grouping process by the
グループ化部130は、第1の変換として、非構造化ログ情報Lをシリアライズし、さらに非構造化ログ情報Lをバイナリ化する。グループ化部130は、第1の変換の処理結果を、例えば、所定の第1所定時間(例えば、1[min])の単位ごとにファイル化する(図5の(1))。
As the first conversion, the
次に、グループ化部130は、第1の変換の処理結果が第1の所定個数(例えば、10[個])になった場合、すなわち10[min]のログ情報が集まったら、第2の変換を開始する。グループ化部130は、例えば、第1の変換の処理結果をサービスごとに分類して、分類結果を集約したファイルに変換する(図5の(2))。
Next, when the processing result of the first conversion becomes the first predetermined number (for example, 10 [pieces]), that is, when the log information of 10 [min] is collected, the
次に、グループ化部130は、第2の変換の処理結果が第2の所定個数(例えば、6[個])になった場合、すなわち60[min]のログ情報が集まったら、第3の変換を開始する。グループ化部130は、例えば、第2の変換の処理結果を1つのファイルに集約する(図5の(3))。
Next, when the processing result of the second conversion becomes the second predetermined number (for example, 6 [pieces]), that is, when the log information of 60 [min] is collected, the
次に、グループ化部130は、第4の変換として、第3の変換の処理結果を圧縮し、アクセス権限の設定を行う。グループ化部130は、第3の変換の処理結果を、第4の変換における圧縮処理によって、例えば、MDS(Multiple-Dimension-Spread)形式ファイルに変換される(図5の(4))。MDSは、スキーマレスな圧縮を実現することができるオープンソースである。なお、第4の変換における圧縮処理は、ORC形式ファイル(Hiveにおいて用いられるのに好適なファイルフォーマット)、LZ4形式ファイル(LZ4アルゴリズムと称される圧縮アルゴリズムで圧縮されたファイル)などのスキーマ参照を要する方式で変換されてもよい。グループ化部130は、ORC形式またはLZ4形式で変換する場合、各サービスのスキーマの名称や構成が格納されたスキーマ情報SDBを参照する。
Next, as the fourth conversion, the
[利用シーン]
図6は、サービス提供者による情報処理システム1の利用シーンについて説明するための図である。サービスAを管理するサービス提供者Pは、例えば、「サービスBの木曜日の閲覧結果と金曜日の閲覧結果を比較参照したい」と考え、情報処理システム1を利用するものとして説明する。
[Use scene]
FIG. 6 is a diagram for explaining a usage scene of the
まず、集約・分析装置300は、サービス提供者端末Dから「サービスBの木曜日の閲覧結果と金曜日の閲覧結果を比較参照したい」というサービス提供者PのHQLリクエストを送信する(ステップS1)。次に、集約・分析装置300は、HQLリクエストによって参照されるデータがサービス提供者Pに参照されてもよいデータであるか否か、すなわちサービス提供者Pにアクセス権限があるか否かを、アクセス権限管理装置400に問い合わせ(ステップS2)、そのアクセス権限の問い合わせ結果(ステップS3)に応じて、ステップS4以降の処理を行うか否かを決定する。簡略化のため、ステップS2およびS3においてサービス提供者Pにはアクセス権限があると判定されたものとして説明する。
First, the aggregation /
次に、集約・分析装置300は、受信したHQLリクエストを解釈して分散処理装置200に送信する(ステップS4)。次に、分散処理装置200は、ステップS4において受信したHQLリクエストの解釈結果に基づいて、データレイク120に格納されたデータにアクセスし(ステップS5)、データレイク120はステップS3においてアクセスされたデータを分散処理装置200に送信し(ステップS6)、それによって分散処理装置200および集約・分析装置300はステップS2において受信したHQLリクエストの解釈結果に対応する応答をサービス提供者端末Dに送信する(ステップS7、S8)。
Next, the aggregation /
以上のように、サービス提供者Pは、サービス提供者端末Dを介して情報処理システム1にHQLリクエストを送信することで、自らが管理するサービスAとは異なるサービスBにおけるログ情報を参照することができる。なお、分散処理装置200は、既にデータレイク120に格納されたデータを自装置の分散ファイルシステム下に蓄積する処理が終了している場合などには、ステップS5およびステップS6に該当する処理は省略されてもよい。
As described above, the service provider P transmits an HQL request to the
[処理フロー ログ収集]
以下、情報処理システム1の処理フローについて説明する。図7は、情報処理システム1によりサービスに関連する非構造化ログ情報Lが収集されるまでの処理の流れの一例を示すタイミングチャートである。
[Processing flow log collection]
Hereinafter, the processing flow of the
まず、サービスアプリケーションSAまたはサービスサーバSSは、エンドユーザによる利用履歴をログ出力する(ステップS10)。次に、情報処理装置100の取得部110は、ステップS10において出力されたログ情報を非構造化ログ情報Lの形式で取得して(ステップS12)、所定の形式に変換して(ステップS14)、データレイク120に格納する(ステップS16)。次に分散処理装置200は、データレイク120に格納された非構造化ログ情報Lに対して分散処理を行う(ステップS18)。なお、ステップS14およびステップS18に対応付いた処理詳細は後述するため、ここでの説明は割愛する。以上、本タイミングチャートの処理の説明を終了する。
First, the service application SA or the service server SS outputs the usage history by the end user as a log (step S10). Next, the
[処理フロー ログ参照]
図8は、情報処理システム1により収集された非構造化ログ情報Lが参照されるまでの処理の流れの一例を示すタイミングチャートである。
[Refer to processing flow log]
FIG. 8 is a timing chart showing an example of the processing flow until the unstructured log information L collected by the
まず、サービス提供者端末Dは、サービス提供者の参照したい内容が反映されたHQLリクエストを情報処理システム1に送信する(ステップS20)。次に、情報処理システム1の集約・分析装置300は、ステップS20において送信されたHQLリクエストを受け付け(ステップS22)、サービス提供者にアクセス権限があるか否かの判定を行う(ステップS24)。
First, the service provider terminal D transmits an HQL request reflecting the content that the service provider wants to refer to to the information processing system 1 (step S20). Next, the aggregation /
サービス提供者にアクセス権限がない場合、集約・分析装置300は、参照権限がないことを示すエラー情報をサービス提供者端末Dに送信して処理を終了する(ステップS26)。サービス提供者にアクセス権限がある場合、分散処理装置200は、ステップS22において受信されたHQLリクエストに対する応答を生成し(ステップS28)、処理結果をサービス提供者端末Dに送信する(ステップS30)。以上、本タイミングチャートの処理の説明を終了する。
If the service provider does not have the access authority, the aggregation /
[処理フロー ログ変換]
図9は情報処理システム1により収集された非構造化ログ情報Lが変換される処理の流れの一例を示すタイミングチャートである。なお、図9に示すフローチャートは、図7のステップS14およびステップS18に対応付いたものである。また、図9に示すフローチャートは、図5に示した処理の流れの一例に対応付いたものである。
[Processing flow log conversion]
FIG. 9 is a timing chart showing an example of a processing flow in which the unstructured log information L collected by the
まず、取得部110は非構造化ログ情報Lを取得する(ステップS100)。次に、取得部110は、取得したログ情報を第1の変換(例えば、シリアライズやバイナリ化)を行う(ステップS102)。
First, the
次に、分散処理装置200は、第2の変換の条件(例えば、第1の変換の処理結果が第1の所定個数になったことなど)を満たすか否かを判定する(ステップS104)。第2の変換の条件を満たすと判定されなかった場合、分散処理装置200は、ステップS100に処理を戻す。第2の変換の条件を満たすと判定された場合、分散処理装置200は、第2の変換処理(例えば、第1の変換の処理結果をサービスごとに分類して、分類結果を集約したファイルに変換する処理)を行う(ステップS106)。
Next, the distributed
次に、分散処理装置200は、第3の変換の条件(例えば、第2の変換の処理結果が第2の所定個数になったことなど)を満たすか否かを判定する(ステップS108)。第3の変換の条件を満たすと判定されなかった場合、分散処理装置200は、ステップS100に処理を戻す。第3の変換の条件を満たすと判定された場合、分散処理装置200は、第3の変換処理(例えば、所定個数の第2の変換の処理結果を1つのファイルに集約する処理)を行う(ステップS110)。
Next, the distributed
次に、分散処理装置200は、第4の変換の条件(例えば、所定の処理時間になることなど)を満たすか否かを判定する(ステップS112)。第4の変換の条件を満たすと判定されなかった場合、分散処理装置200は、ステップS100に処理を戻す。第4の変換の条件を満たすと判定された場合、分散処理装置200は、第4の変換処理(例えば、第3の変換の処理結果をアーカイブ化する処理)を行う(ステップS114)。以上、本フローチャートの処理の説明を終了する。
Next, the distributed
以上、説明したように、本実施形態の情報処理システム1は、複数のサービスサーバSS−1〜サービスサーバSS―Nの利用状況に関する非構造化ログ情報Lを取得する取得部110と、非構造化ログ情報Lに含まれる情報を、少なくともサービス識別情報LEとタイムスタンプとに基づいてグループ化してデータレイク120に記憶させるグループ化部130と、データレイク120に記憶させる非構造化ログ情報Lを分散処理する分散処理装置200と、データレイク120に記憶されたグループ化された非構造化ログ情報Lに対するサービス提供者のアクセス権限を管理するアクセス権限管理装置400と、グループ化され分散処理された非構造化ログ情報Lに対してHQLなどの形式でサービス提供者が参照する際の参照条件の指定を受け付ける集約・分析装置300と、を備えることで、複数のサービスサーバSSから非構造化ログ情報Lを好適に収集することができ、さらにサービス提供者に他のサービスのログ情報を参照させることができる。
As described above, the
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although the embodiments for carrying out the present invention have been described above using the embodiments, the present invention is not limited to these embodiments, and various modifications and substitutions are made without departing from the gist of the present invention. Can be added.
1 情報処理システム
100 情報処理装置
110 取得部
130 グループ化部
200 分散処理装置
300 集約・分析装置
400 アクセス権限管理装置
SS サービスサーバ
1
Claims (5)
前記記憶部に記憶させる前記非構造化ログ情報を分散処理する分散処理部と、
前記記憶部に記憶されたグループ化された前記非構造化ログ情報に対する利用者のアクセス権を管理するアクセス権限管理部と、
グループ化され分散処理された前記非構造化ログ情報に対して利用者が参照する際の参照条件の指定を受け付ける集約・分析部と、
を備える、情報処理システム。 A log collection unit that acquires unstructured log information related to the usage status of a plurality of service servers, groups the unstructured log information based on at least service identification information and a time stamp, and stores it in a storage unit.
A distributed processing unit that performs distributed processing of the unstructured log information stored in the storage unit,
An access authority management unit that manages user access rights to the grouped unstructured log information stored in the storage unit, and
An aggregation / analysis unit that accepts the specification of reference conditions when the user refers to the unstructured log information that has been grouped and distributed.
An information processing system equipped with.
前記非構造化ログ情報に含まれる情報を、少なくともサービス識別情報に基づいてグループ化して記憶部に記憶させるグループ化部と、
を備える、情報処理装置。 An acquisition unit that acquires unstructured log information related to the service provision of multiple service servers,
A grouping unit that groups the information included in the unstructured log information based on at least the service identification information and stores it in the storage unit.
Information processing device equipped with.
請求項2に記載の情報処理装置。 The grouping unit groups the unstructured log information stepwise by a predetermined number or a predetermined time based on the time stamp included in the unstructured log information, and the grouped unstructured log. The information is compressed and stored in the storage unit.
The information processing device according to claim 2.
複数のサービスサーバの利用状況に関する非構造化ログ情報を取得し、
前記非構造化ログ情報に含まれる情報のうち、少なくともサービス識別情報とタイムスタンプとに基づいてグループ化して記憶部に記憶させる、
情報処理方法。 The computer
Get unstructured log information about the usage status of multiple service servers
Of the information included in the unstructured log information, the information is grouped based on at least the service identification information and the time stamp and stored in the storage unit.
Information processing method.
複数のサービスサーバの利用状況に関する非構造化ログ情報を取得させ、
前記非構造化ログ情報に含まれる情報のうち、少なくともサービス識別情報とタイムスタンプとに基づいてグループ化して記憶部に記憶させる処理を行わせる、
プログラム。 On the computer
Get unstructured log information about the usage status of multiple service servers
Of the information included in the unstructured log information, a process of grouping the information based on at least the service identification information and the time stamp and storing the information in the storage unit is performed.
program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019049583A JP2020154381A (en) | 2019-03-18 | 2019-03-18 | Information processing system, information processing device, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019049583A JP2020154381A (en) | 2019-03-18 | 2019-03-18 | Information processing system, information processing device, information processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020154381A true JP2020154381A (en) | 2020-09-24 |
Family
ID=72558967
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019049583A Pending JP2020154381A (en) | 2019-03-18 | 2019-03-18 | Information processing system, information processing device, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020154381A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11360985B1 (en) | 2020-12-28 | 2022-06-14 | Coupang Corp. | Method for loading data and electronic apparatus therefor |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002251500A (en) * | 2001-02-22 | 2002-09-06 | Nippon Telegr & Teleph Corp <Ntt> | System and method for collecting log information |
JP2009231095A (en) * | 2008-03-24 | 2009-10-08 | Seiko Epson Corp | Discharge lamp lighting device and its control method as well as projector |
JP2013037403A (en) * | 2011-08-03 | 2013-02-21 | Canon Inc | Log management system, log management method, application server, and log server |
JP2013161342A (en) * | 2012-02-07 | 2013-08-19 | Hitachi Solutions Ltd | Method, system and program for generating file list, and file list generation device |
JP2013214148A (en) * | 2012-03-30 | 2013-10-17 | Toshiba Corp | Message conversion device, and message conversion program |
JP2014029587A (en) * | 2012-07-31 | 2014-02-13 | Sony Corp | Information processing device, information processing method, and information processing system |
JP2014167698A (en) * | 2013-02-28 | 2014-09-11 | Toshiba Tec Corp | Log file processor and log file processing program |
US20150227598A1 (en) * | 2014-02-13 | 2015-08-13 | Amazon Technologies, Inc. | Log data service in a virtual environment |
JP6396615B1 (en) * | 2018-02-01 | 2018-09-26 | 株式会社ソフトギア | Information processing program, information processing apparatus, and debugging system |
JP2018205807A (en) * | 2017-05-30 | 2018-12-27 | 株式会社リコー | Information processing device, information processing system, information processing method and program |
-
2019
- 2019-03-18 JP JP2019049583A patent/JP2020154381A/en active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002251500A (en) * | 2001-02-22 | 2002-09-06 | Nippon Telegr & Teleph Corp <Ntt> | System and method for collecting log information |
JP2009231095A (en) * | 2008-03-24 | 2009-10-08 | Seiko Epson Corp | Discharge lamp lighting device and its control method as well as projector |
JP2013037403A (en) * | 2011-08-03 | 2013-02-21 | Canon Inc | Log management system, log management method, application server, and log server |
JP2013161342A (en) * | 2012-02-07 | 2013-08-19 | Hitachi Solutions Ltd | Method, system and program for generating file list, and file list generation device |
JP2013214148A (en) * | 2012-03-30 | 2013-10-17 | Toshiba Corp | Message conversion device, and message conversion program |
JP2014029587A (en) * | 2012-07-31 | 2014-02-13 | Sony Corp | Information processing device, information processing method, and information processing system |
JP2014167698A (en) * | 2013-02-28 | 2014-09-11 | Toshiba Tec Corp | Log file processor and log file processing program |
US20150227598A1 (en) * | 2014-02-13 | 2015-08-13 | Amazon Technologies, Inc. | Log data service in a virtual environment |
JP2018205807A (en) * | 2017-05-30 | 2018-12-27 | 株式会社リコー | Information processing device, information processing system, information processing method and program |
JP6396615B1 (en) * | 2018-02-01 | 2018-09-26 | 株式会社ソフトギア | Information processing program, information processing apparatus, and debugging system |
Non-Patent Citations (4)
Title |
---|
善明 晃由: "Amebaにおけるログ解析基盤の変遷", WEBとデータベースに関するフォーラム 情報処理学会シンポジウムシリーズ, vol. 第2013巻 第5号, JPN6021046221, 27 November 2013 (2013-11-27), JP, ISSN: 0004786250 * |
島田 優子: "真実のデータをつかめ リアルタイムDWHへの挑戦", 日経コンピュータ, vol. 第782号, JPN6022021784, 12 May 2011 (2011-05-12), JP, pages 16 - 31, ISSN: 0004887116 * |
牧田 光晴 ほか: "大規模データ解析のAmebaサービスへの適用事例", WEBとデータベースに関するフォーラム(WEBDB FORUM 2012)論文集, vol. 第2012巻第5号, JPN6022021785, 20 November 2012 (2012-11-20), JP, ISSN: 0004887115 * |
石橋 勇人: "サーバー管理者の基礎知識", オープンソースマガジン, vol. 第2巻, JPN6021046223, 20 August 2005 (2005-08-20), JP, pages 78 - 85, ISSN: 0004887117 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11360985B1 (en) | 2020-12-28 | 2022-06-14 | Coupang Corp. | Method for loading data and electronic apparatus therefor |
US11734284B2 (en) | 2020-12-28 | 2023-08-22 | Coupang Corp. | Method for loading data and electronic apparatus therefor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110362544B (en) | Log processing system, log processing method, terminal and storage medium | |
US9934309B2 (en) | Query conversion for converting structured queries into unstructured queries for searching unstructured data | |
US11775501B2 (en) | Trace and span sampling and analysis for instrumented software | |
US9374375B2 (en) | Systems and methods for publishing datasets | |
EP3251031B1 (en) | Techniques for compact data storage of network traffic and efficient search thereof | |
US10282197B2 (en) | Open application lifecycle management framework | |
CN110431545A (en) | Inquiry is executed for structural data and unstructured data | |
CN111522922A (en) | Log information query method and device, storage medium and computer equipment | |
CN107885873B (en) | Method and apparatus for outputting information | |
CN106021583B (en) | Statistical method and system for page flow data | |
CN109388637A (en) | Data warehouse information processing method, device, system, medium | |
US11423096B2 (en) | Method and apparatus for outputting information | |
EP2802979A2 (en) | Processing store visiting data | |
US11681707B1 (en) | Analytics query response transmission | |
US11450419B1 (en) | Medication security and healthcare privacy systems | |
EP3937022A1 (en) | Method and apparatus of monitoring interface performance of distributed application, device and storage medium | |
JP2020154381A (en) | Information processing system, information processing device, information processing method, and program | |
CN112508720A (en) | Insurance client identity attribute screening method and screening device and electronic equipment | |
KR20220013108A (en) | System for providing intergration platform for collecting, processing and storaging of bigdata | |
US20230153357A1 (en) | Method of processing an observation information, electronic device and storage medium | |
EP2819028A2 (en) | Content management system | |
CN110740046B (en) | Method and device for analyzing service contract | |
CN112416699A (en) | Index data collection method and system | |
CN113297245A (en) | Method and device for acquiring execution information | |
CN112131215A (en) | Bottom-up database information acquisition method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201211 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220801 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221004 |