JP2018190281A - Data processing apparatus, data processing method, and program - Google Patents

Data processing apparatus, data processing method, and program Download PDF

Info

Publication number
JP2018190281A
JP2018190281A JP2017094048A JP2017094048A JP2018190281A JP 2018190281 A JP2018190281 A JP 2018190281A JP 2017094048 A JP2017094048 A JP 2017094048A JP 2017094048 A JP2017094048 A JP 2017094048A JP 2018190281 A JP2018190281 A JP 2018190281A
Authority
JP
Japan
Prior art keywords
data
unit
viewpoint
scale
statistic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017094048A
Other languages
Japanese (ja)
Other versions
JP6795448B2 (en
Inventor
理基 鈴木
Masaki Suzuki
理基 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2017094048A priority Critical patent/JP6795448B2/en
Publication of JP2018190281A publication Critical patent/JP2018190281A/en
Application granted granted Critical
Publication of JP6795448B2 publication Critical patent/JP6795448B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a data processing apparatus or the like capable of detecting fault by performing analysis for multidimensional and multi-scale data.SOLUTION: A statistics data processing apparatus includes: a statistics data comparison part for comparing comparison object data with reference data which are statistics data based on data included in each combination of a point of view and a scale with respect to at least one point of view and a plurality of scales for each point of view; and a fault range determination part for determining a range deemed to be abnormal among a plurality of ranges of the point of view on the basis of comparison result by the statistics data comparison part.SELECTED DRAWING: Figure 1

Description

本発明は、データ処理装置、データ処理方法およびプログラムに関する。   The present invention relates to a data processing device, a data processing method, and a program.

交通あるいはヘルスケアなど様々な分野において、所定の対象の時系列データを検出することが行われている。このような時系列データから検出対象の異常を即座に発見することが重要な場合がある。
また、時系列データのサンプル数が膨大になりかつ常に次々とデータが発生するストリームデータを処理の対象とする場合も多い。
In various fields such as traffic and healthcare, time-series data of a predetermined target is detected. In some cases, it is important to immediately detect an abnormality to be detected from such time-series data.
Further, there are many cases where stream data in which the number of samples of time series data is enormous and data is always generated one after another is processed.

異常を検出する方法としては、事前知識を用いて異常を検出する方法と、異常として外れ値を検出する方法とに大別される。
事前知識を用いて異常を検出する方法では、特定の条件を満たす時系列データが発生したときに異常の発生として当該異常を検出するが、未知の事象に対応することができない。また、事前知識を用いて異常を検出する方法では、前提条件が仮定されている場合が多いため、前提条件が変化するときには、その都度、特定の条件を修正する必要がある。また、この方法では、事前知識を学習する必要がある。このような点を補うために、機械学習を利用することも考えられるが、十分に高速な処理は確立されていない。
The method for detecting an abnormality is roughly classified into a method for detecting an abnormality using prior knowledge and a method for detecting an outlier as an abnormality.
In the method of detecting an abnormality using prior knowledge, when time-series data satisfying a specific condition occurs, the abnormality is detected as the occurrence of the abnormality, but an unknown event cannot be dealt with. In addition, in the method of detecting an abnormality using prior knowledge, a precondition is often assumed, and therefore, when the precondition changes, it is necessary to correct a specific condition each time. This method also requires prior knowledge to be learned. In order to compensate for this point, it may be possible to use machine learning, but a sufficiently high-speed process has not been established.

こうした事情から、ストリームデータを対象として、外れ値を検出する方法の確立および高度化が重要となる。
例えば、外れ値を検出する技術は従前から存在しているが、特にストリームデータを対象とするときに、十分に高速な処理が行われない場合があった。異常が発生するときを予測することが困難な状況では、常に異常の発生の有無を監視する必要があり、時系列データを構成するデータが次々と発生する速度と比べて十分に高速な処理を実現する必要があった。
Under these circumstances, it is important to establish and enhance a method for detecting outliers for stream data.
For example, techniques for detecting outliers have existed for some time, but there have been cases where sufficiently high-speed processing has not been performed, particularly when stream data is targeted. In situations where it is difficult to predict when an anomaly will occur, it is necessary to constantly monitor whether an anomaly has occurred, and processing that is sufficiently faster than the rate at which the data constituting the time-series data occurs one after another It was necessary to realize.

一例として、非特許文献1では、t−digestと呼ばれる技術が提案されている。t−digestは、値の集合に対してその分布を推定するデータ構造を有し、例えば、ストリームデータを対象としてその分布を推定することが可能である。
しかしながら、t−digestだけでは、十分に高速な処理を実現することが困難な場合があった。
As an example, Non-Patent Document 1 proposes a technique called t-digest. The t-digest has a data structure for estimating the distribution of a set of values. For example, the distribution can be estimated for stream data.
However, there are cases where it is difficult to realize sufficiently high-speed processing with only t-digest.

TED DUNNING AND OTMAR ERTL、“COMPUTING EXTREMELY ACCURATE QUANTILES USING t−DIGESTS”、[online]、[平成29年4月12日検索]、インターネット<URL:https://github.com/tdunning/t-digest/blob/master/docs/t-digest-paper/histo.pdf>TED DUNING AND OTMAR ERTL, "COMPUTING EXTREME ACCURATE QUANTILES USING t-DIESTS", [online], [April 12, 2017 search], Internet <URL: https://github.com/tdunning/t-gest blob / master / docs / t-digest-paper / histo.pdf>

従来では、多次元およびマルチスケールのデータ解析を行うことが困難である場合があった。なお、t−digestでは、多次元およびマルチスケールについては想定されていなかった。   Conventionally, it has been difficult to perform multidimensional and multiscale data analysis. In t-digest, multidimensional and multiscale were not assumed.

本発明は、このような事情を考慮してなされたもので、多次元およびマルチスケールのデータ解析を行うことで異常を検出することを可能とするデータ処理装置、データ処理方法およびプログラムを提供することを課題とする。   The present invention has been made in consideration of such circumstances, and provides a data processing apparatus, a data processing method, and a program that can detect an abnormality by performing multidimensional and multiscale data analysis. This is the issue.

一構成例として、少なくとも1個の観点および前記観点ごとの複数のスケールについて、前記観点と前記スケールとの組み合わせごとに含まれるデータに基づく統計量データである基準データと比較対象データとを比較する統計量データ比較部と、前記統計量データ比較部による比較の結果に基づいて、前記観点の複数の範囲のなかで異常があるとみなされる範囲を判定する異常範囲判定部と、を備える統計量データ処理装置である。   As one configuration example, for at least one viewpoint and a plurality of scales for each viewpoint, reference data that is statistical data based on data included for each combination of the viewpoint and the scale is compared with comparison target data. A statistic comprising: a statistic data comparison unit; and an abnormal range determination unit that determines a range considered to be abnormal among the plurality of ranges of the viewpoint based on a result of comparison by the statistic data comparison unit A data processing device.

本発明によれば、多次元およびマルチスケールのデータ解析を行うことで異常を検出することを可能とすることができる。   According to the present invention, it is possible to detect anomalies by performing multidimensional and multiscale data analysis.

本発明の一実施形態(第1実施形態)に係るデータ処理システムの概略的な構成を示すブロック図である。1 is a block diagram showing a schematic configuration of a data processing system according to an embodiment (first embodiment) of the present invention. 本発明の一実施形態に係る統計量データ処理装置の概略的な構成を示すブロック図である。It is a block diagram which shows the schematic structure of the statistic data processing apparatus which concerns on one Embodiment of this invention. 本発明の一実施形態に係る統計量データ群の一例のデータ構造を模式的に示す図である。It is a figure which shows typically the data structure of an example of the statistics data group which concerns on one Embodiment of this invention. 本発明の一実施形態に係る統計量データに基づく異常検出処理の概要を示す図である。It is a figure which shows the outline | summary of the abnormality detection process based on statistic data based on one Embodiment of this invention. 本発明の一実施形態に係る基準となる統計量データの一例を示す図である。It is a figure which shows an example of the statistics data used as the reference | standard which concerns on one Embodiment of this invention. 本発明の一実施形態に係る基準となる統計量データの他の一例を示す図である。It is a figure which shows another example of the statistics data used as the reference | standard which concerns on one Embodiment of this invention. 本発明の一実施形態に係る解析対象となる統計量データの一例を示す図である。It is a figure which shows an example of the statistics data used as the analysis object which concerns on one Embodiment of this invention. 本発明の一実施形態に係る時刻範囲ごとにおける統計量データの比較結果の一例を示す図である。It is a figure which shows an example of the comparison result of the statistics data for every time range which concerns on one Embodiment of this invention. 本発明の一実施形態に係る異常期間の判定処理の一例を説明するための図である。It is a figure for demonstrating an example of the determination process of the abnormal period which concerns on one Embodiment of this invention. 本発明の一実施形態に係る統計量データ処理装置において行われる異常の有無を検出するための処理の手順の一例を示す図である。It is a figure which shows an example of the procedure of the process for detecting the presence or absence of abnormality performed in the statistic data processing apparatus which concerns on one Embodiment of this invention. 本発明の一実施形態(第2実施形態)に係るデータ処理システムの概略的な構成を示すブロック図である。It is a block diagram which shows the schematic structure of the data processing system which concerns on one Embodiment (2nd Embodiment) of this invention.

以下、図面を参照し、本発明の実施形態について説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

(第1実施形態)
[データ処理システム]
図1は、本発明の一実施形態(第1実施形態)に係るデータ処理システム1の概略的な構成を示すブロック図である。
データ処理システム1は、n(nは2以上の整数とする。)個の端末装置11−1〜11−nと、統計量データ処理装置12と、データベース13と、ネットワーク21を備える。
ネットワーク21としては、有線または無線の任意のネットワークが用いられてもよく、例えば、インターネットあるいはWi−Fi(登録商標)のネットワークなどが用いられてもよい。
データベース13は、本実施形態では、統計量データ処理装置12とは別に備えられるが、他の例として、統計量データ処理装置12に一体化されていてもよい。
(First embodiment)
[Data processing system]
FIG. 1 is a block diagram showing a schematic configuration of a data processing system 1 according to an embodiment (first embodiment) of the present invention.
The data processing system 1 includes n (n is an integer of 2 or more) terminal devices 11-1 to 11-n, a statistic data processing device 12, a database 13, and a network 21.
As the network 21, a wired or wireless arbitrary network may be used. For example, the Internet or a Wi-Fi (registered trademark) network may be used.
Although the database 13 is provided separately from the statistic data processing device 12 in this embodiment, as another example, the database 13 may be integrated with the statistic data processing device 12.

統計量データ処理装置12は、端末装置11−1〜11−nに関する所定の対象のデータを取得して解析する。本実施形態では、当該データは、所定の対象の時系列データについて、サンプル数が膨大(ビックデータ)になりかつ常に次々とデータが発生するストリームデータであるとする。   The statistic data processing device 12 acquires and analyzes predetermined target data regarding the terminal devices 11-1 to 11-n. In the present embodiment, it is assumed that the data is stream data in which the number of samples is enormous (big data) and data is always generated one after another with respect to predetermined target time-series data.

所定の対象のデータとしては、任意のデータが用いられてもよく、例えば、IoT(Internet on Things)に関するデータが用いられてもよく、あるいは、他のデータが用いられてもよい。
具体例として、所定の対象のデータとしては、任意のシステムにおけるデータが用いられてもよく、例えば、車両などの交通システムに関するデータ、人などのヘルスケアシステムに関するデータ、製品を生産などする工場システムに関するデータ、証券などの金融システムに関するデータ、有線または無線の通信システムに関するデータなどが用いられてもよい。また、任意のシステムにおいて、所定の対象のデータとしては、様々なデータが用いられてもよく、例えば、温度に関するデータ、湿度に関するデータ、速度に関するデータ、加速度に関するデータ、画像に関するデータ、酸素などの物質の濃度に関するデータ、品質に関するデータ、株価に関するデータ、通信信号に関するデータ、端末装置(本実施形態では、端末装置11−1〜11−n)の位置に関するデータ、端末装置が存在する領域に関するデータなどが用いられてもよい。
Arbitrary data may be used as the predetermined target data. For example, data on IoT (Internet on Things) may be used, or other data may be used.
As a specific example, data in an arbitrary system may be used as the predetermined target data. For example, data related to transportation systems such as vehicles, data related to healthcare systems such as people, and factory systems that produce products Data relating to financial systems such as securities, data relating to wired or wireless communication systems, and the like may be used. In addition, in an arbitrary system, various data may be used as predetermined target data. For example, data related to temperature, data related to humidity, data related to speed, data related to acceleration, data related to images, data related to oxygen, etc. Data relating to substance concentration, data relating to quality, data relating to stock prices, data relating to communication signals, data relating to positions of terminal devices (terminal devices 11-1 to 11-n in the present embodiment), data relating to areas where terminal devices exist. Etc. may be used.

また、所定の対象のデータを検出する手法としては、様々な手法が用いられてもよい。
一例として、それぞれの端末装置11−1〜11−nにおいて、当該それぞれの端末装置11−1〜11−nに関する所定の対象のデータを検出する構成が用いられてもよい。この構成では、それぞれの端末装置11−1〜11−nは、所定の対象のデータを検出する検出部を備え、当該検出部により検出されたデータを、ネットワーク21を介して、統計量データ処理装置12に送信する。当該検出部は、例えば、センサー、あるいは、撮像装置(カメラ)であってもよい。ここで、撮像装置(カメラ)も、センサーの一例であると捉えられてもよい。
なお、それぞれの端末装置11−1〜11−nは、IoTの端末装置であってもよく、あるいは、他の端末装置であってもよい。
Various methods may be used as a method for detecting predetermined target data.
As an example, in each of the terminal devices 11-1 to 11-n, a configuration for detecting predetermined target data related to each of the terminal devices 11-1 to 11-n may be used. In this configuration, each of the terminal devices 11-1 to 11-n includes a detection unit that detects data of a predetermined target, and the data detected by the detection unit is subjected to statistical data processing via the network 21. Transmit to device 12. The detection unit may be, for example, a sensor or an imaging device (camera). Here, the imaging device (camera) may also be regarded as an example of a sensor.
Each of the terminal devices 11-1 to 11-n may be an IoT terminal device or may be another terminal device.

他の例として、データ処理システム1は、端末装置11−1〜11−nとは別の検出装置(図示を省略)を備えてもよい。この構成では、当該検出装置は、それぞれの端末装置11−1〜11−nに関する所定の対象のデータを検出する検出部を有しており、当該検出部により検出されたデータを、ネットワーク21を介して、統計量データ処理装置12に送信する。   As another example, the data processing system 1 may include a detection device (not shown) different from the terminal devices 11-1 to 11-n. In this configuration, the detection device includes a detection unit that detects predetermined target data regarding each of the terminal devices 11-1 to 11-n, and the data detected by the detection unit is transmitted to the network 21. To the statistic data processing device 12.

当該検出装置は、例えば、所定の領域の画像を撮像する撮像装置(カメラ)を備えてもよく、当該画像に基づいて、当該所定の領域に存在する端末装置11−1〜11−nの数のデータなどを所定の対象のデータとして検出してもよい。
当該検出装置は、例えば、所定の領域に存在する端末装置11−1〜11−nと無線または有線で通信する通信部を備えてもよく、この通信の結果に基づいて、当該所定の領域に存在する端末装置11−1〜11−nの数のデータなどを所定の対象のデータとして検出してもよい。
当該検出装置は、例えば、端末装置11−1〜11−nから発信される信号を取得する信号取得部を備えてもよく、当該信号の状況に基づいて、当該信号の発生頻度あるいは遅延度などを表すデータなどを所定の対象のデータとして検出してもよい。
The detection device may include, for example, an imaging device (camera) that captures an image of a predetermined region, and the number of terminal devices 11-1 to 11-n existing in the predetermined region based on the image. Or the like may be detected as predetermined target data.
The detection apparatus may include, for example, a communication unit that communicates with the terminal devices 11-1 to 11-n existing in a predetermined area wirelessly or by wire. Based on the result of the communication, the detection apparatus Data of the number of existing terminal apparatuses 11-1 to 11-n may be detected as predetermined target data.
The detection device may include, for example, a signal acquisition unit that acquires signals transmitted from the terminal devices 11-1 to 11-n. Based on the state of the signal, the frequency of occurrence of the signal or the degree of delay, etc. May be detected as predetermined target data.

本実施形態では、それぞれの端末装置11−1〜11−nは、ネットワーク21を介して、他の装置(例えば、統計量データ処理装置12など)と通信することが可能である。なお、それぞれの端末装置11−1〜11−nは、有線または無線により、ネットワーク21との間で通信接続する。
他の例として、それぞれの端末装置11−1〜11−nは、通信機能を備えなくてもよい。
In the present embodiment, each of the terminal devices 11-1 to 11-n can communicate with other devices (for example, the statistics data processing device 12) via the network 21. Each of the terminal devices 11-1 to 11-n is connected for communication with the network 21 by wire or wireless.
As another example, each of the terminal devices 11-1 to 11-n may not have a communication function.

また、それぞれの端末装置11−1〜11−nとしては、例えば、同じ構成を有する端末装置が用いられてもよく、あるいは、異なる構成を有する端末装置が含まれてもよい。
また、それぞれの端末装置11−1〜11−nは、例えば、物に付加あるいは装着などされてもよく、あるいは、人により携帯あるいは装着などされてもよい。当該物としては、任意のものであってもよく、例えば、自動車などの車両、あるいは、電化製品などであってもよい。
Moreover, as each terminal device 11-1 to 11-n, for example, a terminal device having the same configuration may be used, or a terminal device having a different configuration may be included.
Each of the terminal devices 11-1 to 11-n may be added to or attached to an object, or may be carried or attached by a person. As the said thing, arbitrary things may be sufficient, for example, vehicles, such as a motor vehicle, or an electric appliance.

また、端末装置11−1〜11−nとは別の検出装置は、例えば、統計量データ処理装置12に備えられてもよい。この構成では、統計量データ処理装置12は、当該検出装置により検出されたデータを取得して解析する。   In addition, a detection device other than the terminal devices 11-1 to 11-n may be provided in the statistic data processing device 12, for example. In this configuration, the statistic data processing device 12 acquires and analyzes the data detected by the detection device.

[統計量データ処理装置]
図2は、本発明の一実施形態に係る統計量データ処理装置12の概略的な構成を示すブロック図である。
統計量データ処理装置12は、入力部111と、出力部112と、記憶部113と、通信部114と、制御部115を備える。
制御部115は、データ取得部131と、統計量データ処理部132と、データ出力制御部133を備える。
統計量データ処理部132は、観点設定部151と、スケール設定部152と、統計量データ群生成部153と、統計量データ比較部154と、異常範囲判定部155を備える。
[Statistics data processor]
FIG. 2 is a block diagram showing a schematic configuration of the statistic data processing apparatus 12 according to an embodiment of the present invention.
The statistics data processing device 12 includes an input unit 111, an output unit 112, a storage unit 113, a communication unit 114, and a control unit 115.
The control unit 115 includes a data acquisition unit 131, a statistic data processing unit 132, and a data output control unit 133.
The statistic data processing unit 132 includes a viewpoint setting unit 151, a scale setting unit 152, a statistic data group generation unit 153, a statistic data comparison unit 154, and an abnormal range determination unit 155.

入力部111は、外部から情報を入力する。入力部111は、例えば、ユーザ(人)により行われる操作を受け付ける操作部を有し、当該操作部により受け付けられた操作に応じた情報を入力する。入力部111は、例えば、外部の装置(例えば、記録媒体など)と接続されて当該外部の装置から出力される情報を入力する。
出力部112は、情報を出力する。出力部112は、例えば、画面を有しており、情報を画面に表示(出力)する。出力部112は、例えば、外部の装置(例えば、記録媒体など)と接続されて当該外部の装置に情報を出力する。
記憶部113は、情報を記憶する。なお、本実施形態では、記憶部113とデータベース13とは、任意に使い分けられてもよい。
通信部114は、情報を通信する。本実施形態では、通信部114は、ネットワーク21を介して、他の装置(例えば、端末装置11−1〜11−nあるいは別の検出装置)と情報を通信する。
The input unit 111 inputs information from the outside. The input unit 111 includes, for example, an operation unit that receives an operation performed by a user (person), and inputs information according to the operation received by the operation unit. For example, the input unit 111 is connected to an external device (for example, a recording medium) and inputs information output from the external device.
The output unit 112 outputs information. The output unit 112 has a screen, for example, and displays (outputs) information on the screen. The output unit 112 is connected to, for example, an external device (for example, a recording medium) and outputs information to the external device.
The storage unit 113 stores information. In the present embodiment, the storage unit 113 and the database 13 may be arbitrarily used.
The communication unit 114 communicates information. In the present embodiment, the communication unit 114 communicates information with other devices (for example, the terminal devices 11-1 to 11-n or another detection device) via the network 21.

制御部115は、統計量データ処理装置12における各種の制御を行う。
本実施形態では、記憶部113は、所定の制御プログラムおよびそのパラメーターの情報を記憶する。また、制御部115は、CPU(Central Processing Unit)を用いて構成される。そして、制御部115では、CPUが記憶部113に記憶された制御プログラムを、記憶部113に記憶されたパラメーターを使用して実行することで、各種の制御を行う。
The control unit 115 performs various controls in the statistic data processing apparatus 12.
In the present embodiment, the storage unit 113 stores information on a predetermined control program and its parameters. The control unit 115 is configured by using a CPU (Central Processing Unit). In the control unit 115, the CPU performs various types of control by executing the control program stored in the storage unit 113 using the parameters stored in the storage unit 113.

なお、統計量データ処理装置12について、図2に示した各処理部111〜115を備える構成は一例であり、他の構成が用いられてもよい。例えば、各処理部111〜115の機能の区分は、説明の便宜上のものであり、必ずしも図2に示した構成に限定されない。   In addition, about the statistics data processing apparatus 12, the structure provided with each process part 111-115 shown in FIG. 2 is an example, and another structure may be used. For example, the classification of the functions of the processing units 111 to 115 is for convenience of explanation, and is not necessarily limited to the configuration shown in FIG.

制御部115の機能について説明する。
データ取得部131は、解析対象となるデータとして、所定の対象のデータを取得する。
一例として、データ取得部131は、通信部114により他の装置(例えば、端末装置11−1〜11−nあるいは別の検出装置)から受信されたデータを、解析対象となるデータとして取得してもよい。
他の例として、データ取得部131は、過去に取得されたデータを順次データベース13に記憶しておき、当該データの処理を行うときに、当該データベース13から当該データを解析対象となるデータとして取得してもよい。
また、他の例として、所定の対象のデータが統計量データ処理装置12を経由せずにデータベース13に記憶される構成が用いられてもよく、この場合、データ取得部131は、当該データの処理を行うときに、当該データベース13から当該データを解析対象となるデータとして取得してもよい。
The function of the control unit 115 will be described.
The data acquisition unit 131 acquires predetermined target data as data to be analyzed.
As an example, the data acquisition unit 131 acquires data received from another device (for example, the terminal devices 11-1 to 11-n or another detection device) by the communication unit 114 as data to be analyzed. Also good.
As another example, the data acquisition unit 131 sequentially stores data acquired in the past in the database 13 and acquires the data from the database 13 as data to be analyzed when processing the data. May be.
As another example, a configuration in which predetermined target data is stored in the database 13 without passing through the statistics data processing device 12 may be used. In this case, the data acquisition unit 131 When performing processing, the data may be acquired from the database 13 as data to be analyzed.

統計量データ処理部132は、データ取得部131により取得されたデータについて統計的な処理を行い、その結果のデータ(本実施形態において、「統計量データ」ともいう。)を取得する。
なお、統計量データ処理部132では、例えば、データ取得部131によりリアルタイムで次々と取得されるデータ(新たに増えていくデータのまとまり)について処理を行う場合があってもよく、また、データ取得部131により取得された過去のデータ(新たに増えないデータのまとまり)について処理を行う場合があってもよい。
また、統計量データ処理部132は、統計量データに基づいて異常の有無に関する検出(判定)を行う。
The statistic data processing unit 132 performs a statistical process on the data acquired by the data acquisition unit 131, and acquires the resulting data (also referred to as “statistical data” in the present embodiment).
Note that the statistic data processing unit 132 may process, for example, data that is successively acquired in real time by the data acquisition unit 131 (a collection of newly increasing data). There may be a case where processing is performed on past data (a group of data that does not newly increase) acquired by the unit 131.
Further, the statistic data processing unit 132 performs detection (determination) regarding the presence or absence of abnormality based on the statistic data.

データ出力制御部133は、出力対象となるデータを出力部112により出力する制御を行う。この出力としては、例えば、文字、図形あるいはグラフなどの表示出力が用いられる。
出力対象となるデータとしては、任意のデータが用いられてもよく、例えば、データ取得部131により取得されたデータ、あるいは、統計量データ処理部132による処理により得られた結果のデータなどが用いられてもよい。また、統計量データ処理部132による処理により得られた結果のデータとしては、例えば、統計量データ群生成部153による処理により得られた結果のデータ、統計量データ比較部154による処理により得られた結果のデータ、あるいは、異常範囲判定部155による処理により得られた結果のデータのうちの1以上が用いられてもよい。
The data output control unit 133 controls the output unit 112 to output data to be output. As this output, for example, display output of characters, figures, graphs or the like is used.
Arbitrary data may be used as the data to be output. For example, data acquired by the data acquisition unit 131 or data obtained as a result of processing by the statistic data processing unit 132 is used. May be. The data obtained as a result of the processing by the statistic data processing unit 132 includes, for example, data obtained as a result of processing by the statistic data group generation unit 153 and processing by the statistic data comparison unit 154. One or more of the result data or the result data obtained by the processing by the abnormal range determination unit 155 may be used.

統計量データ処理部132について説明する。
観点設定部151は、解析対象のデータについて、観点(項目)を設定する。観点設定部151は、解析対象のデータについて、2個以上の観点を設定してもよい。
ここで、観点としては、任意の観点が用いられてもよく、例えば、時間(時刻)、領域(地域)、デバイス種別などが用いられてもよい。
また、観点設定部151は、例えば、あらかじめ定められた観点を設定してもよく、あるいは、ユーザなどから指示された観点を設定してもよい。観点があらかじめ定められる場合には、例えば、当該観点を特定する情報が記憶部113に記憶される。
The statistic data processing unit 132 will be described.
The viewpoint setting unit 151 sets viewpoints (items) for the analysis target data. The viewpoint setting unit 151 may set two or more viewpoints for the data to be analyzed.
Here, any viewpoint may be used as the viewpoint, and for example, time (time), area (region), device type, or the like may be used.
In addition, the viewpoint setting unit 151 may set a predetermined viewpoint, or may set a viewpoint instructed by a user or the like. When the viewpoint is determined in advance, for example, information specifying the viewpoint is stored in the storage unit 113.

スケール設定部152は、それぞれの観点について、スケール(粒度)を設定する。スケール設定部152は、それぞれの観点について、2個以上のスケールを設定してもよい。
ここで、スケールとしては、任意の大きさを有するスケールが用いられてもよい。
例えば、時間のスケールとして、1秒のスケール、1分のスケール、1時間のスケール、1日のスケール、あるいは、他の任意の大きさのスケールが用いられてもよい。
例えば、領域のスケールとして、地区のスケール、市区町村のスケール、都道府県のスケール、全国のスケール、あるいは、他の任意の大きさのスケールが用いられてもよい。
例えば、デバイス種別のスケールとして、機種のスケール、メーカーのスケール、OS(Operating System)のスケール、あるいは、他の任意の種別(属性)のスケールが用いられてもよい。
スケール設定部152は、例えば、それぞれの観点について、あらかじめ定められたスケールを設定してもよく、あるいは、ユーザなどから指示されたスケールを設定してもよい。スケールがあらかじめ定められる場合には、例えば、当該スケールを特定する情報が記憶部113に記憶される。
The scale setting unit 152 sets a scale (granularity) for each viewpoint. The scale setting unit 152 may set two or more scales for each viewpoint.
Here, as the scale, a scale having an arbitrary size may be used.
For example, a scale of 1 second, a scale of 1 minute, a scale of 1 hour, a scale of 1 day, or any other scale may be used as the time scale.
For example, an area scale, a city scale, a prefecture scale, a national scale, or any other scale may be used as the area scale.
For example, as the device type scale, a model scale, a manufacturer scale, an OS (Operating System) scale, or another arbitrary type (attribute) scale may be used.
For example, the scale setting unit 152 may set a predetermined scale for each viewpoint, or may set a scale instructed by a user or the like. When the scale is determined in advance, for example, information for specifying the scale is stored in the storage unit 113.

統計量データ群生成部153は、データ取得部131により取得されたデータについて、観点設定部151により設定された観点およびスケール設定部152により設定されたスケールに基づいて、統計的な処理を行うことで、複数の統計量データの集合(本実施形態において、「統計量データ群」ともいう。)を生成する。
本実施形態では、統計量データ群生成部153は、多次元およびマルチスケールのデータ解析を行った結果のデータを、統計量データ群(本実施形態において、「多次元マルチスケール統計量データ群」ともいう。)として生成する。
ここで、本実施形態では、次元は観点を表わしており、多次元は複数の観点があることを表わしている。
また、本実施形態では、マルチスケールは、複数のスケールがあることを表わしている。
The statistics data group generation unit 153 performs statistical processing on the data acquired by the data acquisition unit 131 based on the viewpoint set by the viewpoint setting unit 151 and the scale set by the scale setting unit 152. Thus, a set of a plurality of statistical data (also referred to as “statistical data group” in the present embodiment) is generated.
In the present embodiment, the statistic data group generation unit 153 converts the data obtained as a result of multidimensional and multiscale data analysis into a statistic data group (in this embodiment, “multidimensional multiscale statistic data group”). It is also generated as
Here, in this embodiment, the dimension represents a viewpoint, and the multidimension represents a plurality of viewpoints.
In the present embodiment, the multi-scale indicates that there are a plurality of scales.

統計量データ比較部154は、基準となる統計量データと、解析対象となる統計量データとを比較する。本実施形態では、統計量データ比較部154は、複数の異なるスケールについて、基準となる統計量データと、解析対象となる統計量データとを比較する。
ここで、基準となる統計量データは、例えば、データ取得部131により取得されてもよく、あるいは、統計量データ群生成部153により生成された統計量データ群に含まれる統計量データが用いられてもよい。
また、解析対象となる統計量データは、例えば、データ取得部131により取得されてもよく、あるいは、データ取得部131により取得されたデータに基づいて統計量データ処理部132(例えば、統計量データ比較部154)により生成された統計量データが用いられてもよく、あるいは、統計量データ群生成部153により生成された統計量データ群に含まれる統計量データが用いられてもよい。
The statistical data comparison unit 154 compares the standard statistical data with the statistical data to be analyzed. In the present embodiment, the statistic data comparison unit 154 compares the statistic data serving as a reference with the statistic data to be analyzed for a plurality of different scales.
Here, the reference statistical data may be acquired by the data acquisition unit 131, for example, or statistical data included in the statistical data group generated by the statistical data group generation unit 153 is used. May be.
The statistical data to be analyzed may be acquired by the data acquisition unit 131, for example, or based on the data acquired by the data acquisition unit 131, the statistical data processing unit 132 (for example, statistical data) The statistic data generated by the comparison unit 154) may be used, or the statistic data included in the statistic data group generated by the statistic data group generation unit 153 may be used.

異常範囲判定部155は、統計量データ比較部154による比較の結果に基づいて、解析対象となる統計量データについて、異常が発生した範囲(本実施形態では、時刻(時間)の範囲であり、「異常期間」ともいう。)を判定する。なお、この判定は、例えば、推定的な判定であってもよい。
本実施形態では、解析対象となる統計量データについて、異常範囲判定部155により異常期間が判定されたことによって、異常が存在することを検出する。
The abnormal range determination unit 155 is a range in which an abnormality has occurred in the statistical data to be analyzed based on the result of the comparison by the statistical data comparison unit 154 (in this embodiment, a range of time (time), (Also referred to as “abnormal period”). This determination may be, for example, an estimation determination.
In the present embodiment, the presence of an abnormality is detected when the abnormal range is determined by the abnormal range determination unit 155 for the statistical data to be analyzed.

[統計量データ群のデータ構造の例]
図3は、本発明の一実施形態に係る統計量データ群201の一例のデータ構造を模式的に示す図である。
図3の例では、当該統計量データ群201は、統計量データ処理部132により時系列データが処理された結果である多次元マルチスケール統計量データ群となっている。当該統計量データ群201は、時系列データを対象として多次元およびマルチスケールに拡張された分布データ(本実施形態では、統計量データ)の構造を有する。
図3の例では、複数の観点として、時間、領域、デバイス種別が用いられている。また、それぞれの観点について、複数のスケール(マルチスケール)が用いられている。
[Example of data structure of statistical data group]
FIG. 3 is a diagram schematically showing an example of the data structure of the statistic data group 201 according to the embodiment of the present invention.
In the example of FIG. 3, the statistical data group 201 is a multidimensional multiscale statistical data group that is a result of processing time-series data by the statistical data processing unit 132. The statistic data group 201 has a structure of distribution data (in this embodiment, statistic data) extended to multi-dimensional and multi-scale for time series data.
In the example of FIG. 3, time, region, and device type are used as a plurality of viewpoints. Further, for each viewpoint, a plurality of scales (multiscale) are used.

図3の例では、時間に関する複数のスケールとして、時間スケールs0、時間スケールs1、時間スケールs2が用いられている。一例として、時間スケールs0は「10秒」であり、時間スケールs1は「20秒」であり、時間スケールs2は「40秒」である。
また、領域に関する複数のスケールとして、領域スケールA1、領域スケールA2、領域スケールA3が用いられている。一例として、領域スケールA1は「東京」であり、領域スケールA2は「関東」であり、領域スケールA3は「日本(全国)」である。
また、デバイス種別に関する複数のスケールとして、デバイス種別スケールD1、デバイス種別スケールD2が用いられている。一例として、デバイス種別スケールD1は「特定の機種A1」であり、デバイス種別スケールD2は「特定のメーカーB1」である。
In the example of FIG. 3, a time scale s0, a time scale s1, and a time scale s2 are used as a plurality of time scales. As an example, the time scale s0 is “10 seconds”, the time scale s1 is “20 seconds”, and the time scale s2 is “40 seconds”.
Further, as a plurality of scales related to the region, a region scale A1, a region scale A2, and a region scale A3 are used. As an example, the area scale A1 is “Tokyo”, the area scale A2 is “Kanto”, and the area scale A3 is “Japan (nationwide)”.
Further, a device type scale D1 and a device type scale D2 are used as a plurality of scales related to the device type. As an example, the device type scale D1 is “specific model A1”, and the device type scale D2 is “specific manufacturer B1”.

また、図3の例では、時刻を表す軸の方向(矢印)を示してある。時刻の範囲(時間の区分)として、時刻範囲t0、時刻範囲t1、時刻範囲t2、時刻範囲t3が用いられている。時刻範囲t0は「0秒以上10秒未満」であり、時刻範囲t1は「10秒以上20秒未満」であり、時刻範囲t2は「20秒以上30秒未満」であり、時刻範囲t3は「30秒以上40秒未満」である。
なお、時刻の初期値(本実施形態では、0秒)としては、任意のタイミングが用いられてもよい。
In the example of FIG. 3, the direction (arrow) of the axis representing the time is shown. As a time range (time division), a time range t0, a time range t1, a time range t2, and a time range t3 are used. The time range t0 is “0 seconds to less than 10 seconds”, the time range t1 is “10 seconds to less than 20 seconds”, the time range t2 is “20 seconds to less than 30 seconds”, and the time range t3 is “ 30 seconds or more and less than 40 seconds ".
An arbitrary timing may be used as the initial time value (0 seconds in the present embodiment).

ここで、1個の時間スケールと、1個の領域スケールと、1個のデバイス種別スケールが特定されて、当該時間スケールに応じた1個の時刻範囲が特定されると、単位となる統計量データ(本実施形態において、「単位統計量データ」ともいう。)が特定される。
1個の時間スケールと、1個の領域スケールと、1個のデバイス種別スケールと、当該時間スケールに応じた1個の時刻範囲によって特定される単位統計量データは、当該時刻範囲の最大の時刻から当該時間スケールだけ過去に遡った時刻までの間に属し、かつ、当該領域スケールに属し、かつ、当該デバイス種別スケールに属するデータについて、統計量データ処理部132によって統計的な演算を行うことにより得られた統計量データに相当する。
Here, when one time scale, one region scale, and one device type scale are specified, and one time range corresponding to the time scale is specified, a unit statistic Data (also referred to as “unit statistic data” in the present embodiment) is specified.
The unit statistic data specified by one time scale, one area scale, one device type scale, and one time range corresponding to the time scale is the maximum time in the time range. The statistical data processing unit 132 performs a statistical calculation on the data belonging to the time scale and the time that goes back to the past by the time scale and belonging to the area scale and the device type scale. It corresponds to the obtained statistical data.

図3の例では、時間スケールs0かつ時刻範囲t3に該当する6個の単位統計量データ211〜213、221〜223と、時間スケールs1かつ時刻範囲t3に該当する6個の単位統計量データ311〜313、321〜323と、時間スケールs2かつ時刻範囲t3に該当する6個の単位統計量データ411〜413、421〜423だけに符号を付してあり、他の単位統計量データについては符号を省略してある。   In the example of FIG. 3, six unit statistical data 211 to 213 and 221 to 223 corresponding to the time scale s0 and the time range t3, and six unit statistical data 311 corresponding to the time scale s1 and the time range t3. .., 313, 321-323, and the six unit statistical data 411-413, 421-423 corresponding to the time scale s2 and the time range t3 are provided with symbols, and the other unit statistical data are encoded. Is omitted.

一例として、単位統計量データ211は、時間スケールS0(10秒)、領域スケールA1(東京)、デバイス種別スケールD1(特定の機種A1)、時刻範囲t3(30秒以上40秒未満)に該当する。そして、当該単位統計量データ211は、時刻が30秒以上40秒未満に属し、かつ、領域が東京に属し、かつ、デバイス種別が特定の機種A1に属するデータに基づいて得られた統計量データである。すなわち、当該データは、時刻が30秒以上40秒未満に発生し、東京に存在する端末装置11−1〜11−nにおいて発生し、デバイス種別が特定の機種A1である当該端末装置11−1〜11−nにおいて発生したデータであることを意味する。当該単位統計量データは、このようなデータの集合を用いて得られた統計量データである。   As an example, the unit statistics data 211 corresponds to the time scale S0 (10 seconds), the area scale A1 (Tokyo), the device type scale D1 (specific model A1), and the time range t3 (30 seconds to less than 40 seconds). . The unit statistical data 211 is statistical data obtained based on data belonging to a time belonging to 30 seconds or more and less than 40 seconds, a region belonging to Tokyo, and a device type belonging to a specific model A1. It is. That is, the data is generated in the terminal devices 11-1 to 11-n that exist in Tokyo at a time of 30 seconds or more and less than 40 seconds, and the terminal device 11-1 whose device type is the specific model A1. Means that the data occurred in -11-n. The unit statistical data is statistical data obtained using such a set of data.

ここで、単位統計量データとしては、任意の統計量のデータが用いられてもよく、例えば、順序統計に関する任意の値のデータが用いられてもよく、あるいは、平均値のデータが用いられてもよい。
順序統計に関する値としては、例えば、中央値が用いられてもよい。なお、一般に、処理対象となる複数のデータが同じである場合、平均値を取得(演算)する処理よりも、中央値を取得する処理の方が、処理時間が短くなると考えられる。
また、順序統計に関する値としては、例えば、累積分布関数(CDF:Cumulative Distribution Function)の値が用いられてもよく、あるいは、確率分布関数(PDF:Probability Density Function)の値が用いられてもよい。
Here, as the unit statistic data, data of an arbitrary statistic may be used. For example, data of an arbitrary value related to order statistics may be used, or data of an average value may be used. Also good.
As a value related to order statistics, for example, a median value may be used. In general, when a plurality of pieces of data to be processed are the same, it is considered that the processing time for the median value is shorter than the processing for acquiring (calculating) the average value.
In addition, as a value related to order statistics, for example, a value of a cumulative distribution function (CDF) may be used, or a value of a probability distribution function (PDF: Probability Density Function) may be used. .

図3の例では、それぞれの四角(直方体あるいは立方体)の単位が単位統計量データ(単位統計量データ211〜213、221〜223、311〜313、321〜323、411〜413、421〜423など)に相当する。
なお、統計量データ群生成部153は、任意の手法を用いて、単位統計量データを取得してもよく、例えば、既存の技術であるt−digestの技術(例えば、非特許文献1など参照。)を用いて単位統計量データを演算して取得してもよい。本実施形態では、統計量データ群は、複数の単位統計量データを含んで構成される。
In the example of FIG. 3, the unit of each square (cuboid or cube) is unit statistical data (unit statistical data 211-213, 221-223, 311-313, 321-323, 411-413, 421-423, etc. ).
Note that the statistic data group generation unit 153 may acquire unit statistic data using an arbitrary technique. For example, the t-digest technique (for example, see Non-Patent Document 1 or the like) that is an existing technique. .) May be used to calculate and obtain unit statistics data. In the present embodiment, the statistical data group includes a plurality of unit statistical data.

また、1個の観点について用いられる複数のスケールとしては、例えば、すべてについて互いに包含関係にある複数のスケールが用いられてもよく、あるいは、すべてについて互いに包含関係にない複数のスケールが用いられてもよく、あるいは、一部のみについて包含関係にある複数のスケールが用いられてもよい。
すべてについて互いに包含関係にある複数のスケールとしては、領域のスケールを例とすると、例えば、「東京」、「関東」、「日本」がある。
すべてについて互いに包含関係にない複数のスケールとしては、領域のスケールを例とすると、例えば、「東京」、「千葉」、「茨城」がある。
一部のみについて包含関係にある複数のスケールとしては、領域のスケールを例とすると、例えば、「東京」、「関東」(東京を含む。)、「大阪」がある。
In addition, as a plurality of scales used for one viewpoint, for example, a plurality of scales that are inclusive relation to each other may be used, or a plurality of scales that are not inclusive relation to each other are used. Alternatively, a plurality of scales that are inclusive in only part of them may be used.
As a plurality of scales that are inclusive of each other, for example, the scale of the region is “Tokyo”, “Kanto”, and “Japan”.
Examples of the plurality of scales that are not inclusive of each other include, for example, “Tokyo”, “Chiba”, and “Ibaraki”, taking the scale of the region as an example.
As a plurality of scales that are inclusive in only a part, taking the scale of the area as an example, there are, for example, “Tokyo”, “Kanto” (including Tokyo), and “Osaka”.

[統計量データ処理部において行われる異常検出処理]
図4は、本発明の一実施形態に係る統計量データに基づく異常検出処理の概要を示す図である。
本実施形態では、解析対象(比較対象)のデータおよび基準となるデータとして、複数の端末装置11−1〜11−nについて、レイテンシー(Latency)に関するデータが用いられている。レイテンシーとしては、それぞれの端末装置11−1〜11−nから送信された要求に対して応答が到来するまでの時間(遅延時間)が用いられている。
ここで、それぞれの端末装置11−1〜11−nはそれぞれ異なる人に所持されているとする。そして、説明の便宜上、平日には決まった時間に通勤ラッシュがあり、休日には通勤ラッシュが無いとする。また、通常、平日には朝の通勤ラッシュと夕方の通勤ラッシュがあるが、本例では、朝の通勤ラッシュのみを示し、夕方の通勤ラッシュを省略する。
[Abnormality detection processing performed in the statistics data processing unit]
FIG. 4 is a diagram showing an outline of the abnormality detection process based on the statistic data according to the embodiment of the present invention.
In the present embodiment, as data to be analyzed (comparison target) and reference data, data regarding latency is used for the plurality of terminal devices 11-1 to 11-n. As the latency, a time (delay time) until a response comes to the request transmitted from each of the terminal devices 11-1 to 11-n is used.
Here, it is assumed that each of the terminal devices 11-1 to 11-n is owned by a different person. For convenience of explanation, it is assumed that there is a commuting rush at a fixed time on weekdays and no commuting rush on holidays. In general, there are morning commuting rush and evening commuting rush on weekdays, but in this example, only morning commuting rush is shown, and evening commuting rush is omitted.

図4の例では、解析対象のデータ521に基づいて、解析対象の統計量データ群522が生成されている。本実施形態では、解析対象の統計量データ群522は、異常の有無を検出する対象となる1日分のデータに基づいて生成されている。
また、図4の例では、基準となるデータ511として、過去の30日分のそれぞれの日について、1日分のデータに基づいて生成された統計量データ群511−1〜511−30が用いられている。ここで、基準となるデータ511が取得された30日については、異常が発生していないとし、正常な基準のデータが取得されたとする。
In the example of FIG. 4, an analysis target statistical data group 522 is generated based on the analysis target data 521. In the present embodiment, the statistical data group 522 to be analyzed is generated based on data for one day that is a target for detecting the presence or absence of abnormality.
In the example of FIG. 4, the statistical data groups 511-1 to 511-30 generated based on the data for one day are used as the reference data 511 for each of the past 30 days. It has been. Here, it is assumed that no abnormality has occurred on the 30th day from which the reference data 511 is acquired, and normal reference data is acquired.

統計量データ比較部154は、基準となるデータ511と、解析対象となる統計量データ群522とを比較する処理(比較処理523)を行う。
異常範囲判定部155は、このような比較の結果に基づいて、統計量データについて異常範囲を判定する処理(本例では、異常な分布を検出する異常検出処理524)を行う。これにより、異常範囲判定部155は、解析対象となる統計量データ群について、異常範囲525を判定する。
本実施形態では、異常範囲525が存在した場合には異常があることが検出(判定)され、異常範囲525が存在しない場合には異常が無いことが検出(判定)される。
なお、本例では、異常範囲525として、時刻(時間)の範囲である異常期間を検出(判定)する場合について説明する。
The statistic data comparison unit 154 performs processing (comparison processing 523) for comparing the reference data 511 and the statistical data group 522 to be analyzed.
Based on the result of such comparison, the abnormal range determination unit 155 performs processing (in this example, an abnormality detection process 524 for detecting an abnormal distribution) for determining an abnormal range for the statistic data. Thereby, the abnormal range determination unit 155 determines the abnormal range 525 for the statistical data group to be analyzed.
In the present embodiment, when the abnormal range 525 exists, it is detected (determined) that there is an abnormality, and when there is no abnormal range 525, it is detected (determined) that there is no abnormality.
In this example, a case where an abnormal period that is a time (time) range is detected (determined) as the abnormal range 525 will be described.

図5〜図7を参照して、統計量データの例を示す。なお、図5〜図7に示される統計量データは、説明の便宜上、人為的に作成したものであり、データ分布の時間推移を表す。
図5は、本発明の一実施形態に係る基準となる統計量データの一例を示す図である。
図5の例では、平日(Weekday)における統計量データを示してある。
図5に示されるグラフにおいて、横軸は1日分の24時間(時刻0amから時刻12pmまで)について時刻を表わしており、縦軸はそれぞれの端末装置11−1〜11−nのレイテンシー[ms]を表わしている。
このグラフには、それぞれの端末装置11−1〜11−nについて検出されたレイテンシーを示してある。
また、このグラフには、複数の端末装置11−1〜11−nのレイテンシーについて、順序統計におけるパーセンタイル特性を示してある。具体的には、10パーセンタイルの特性611、25パーセンタイルの特性612、50パーセンタイルの特性613、75パーセンタイルの特性614、90パーセンタイルの特性615を示してある。
また、本例では、平日には8am前後に通勤ラッシュがあり、傾向としてレイテンシーが1日のなかで最大になるとする。
An example of statistical data is shown with reference to FIGS. Note that the statistical data shown in FIGS. 5 to 7 are artificially created for convenience of explanation, and represent the time transition of the data distribution.
FIG. 5 is a diagram showing an example of statistical data serving as a reference according to an embodiment of the present invention.
In the example of FIG. 5, statistical data on weekdays is shown.
In the graph shown in FIG. 5, the horizontal axis represents time for one day of 24 hours (from time 0 am to time 12 pm), and the vertical axis represents the latency [ms of each terminal device 11-1 to 11-n]. ].
In this graph, the latency detected about each terminal device 11-1 to 11-n is shown.
In addition, this graph shows the percentile characteristics in order statistics for the latencies of the plurality of terminal apparatuses 11-1 to 11-n. Specifically, a 10th percentile characteristic 611, a 25th percentile characteristic 612, a 50th percentile characteristic 613, a 75th percentile characteristic 614, and a 90th percentile characteristic 615 are shown.
In this example, it is assumed that there is a commuting rush at around 8 am on weekdays, and that the latency is the largest in the day.

図6は、本発明の一実施形態に係る基準となる統計量データの他の一例を示す図である。
図6の例では、休日(Weekend)における統計量データを示してある。
図6に示されるグラフにおいて、横軸は1日分の24時間(時刻0amから時刻12pmまで)について時刻を表わしており、縦軸はそれぞれの端末装置11−1〜11−nのレイテンシー[ms]を表わしている。
このグラフには、それぞれの端末装置11−1〜11−nについて検出されたレイテンシーを示してある。
また、このグラフには、複数の端末装置11−1〜11−nのレイテンシーについて、順序統計におけるパーセンタイル特性を示してある。具体的には、10パーセンタイルの特性621、25パーセンタイルの特性622、50パーセンタイルの特性623、75パーセンタイルの特性624、90パーセンタイルの特性625を示してある。
また、本例では、休日には通勤ラッシュが無く、傾向としてレイテンシーが特に大きくなる期間が観測されないとする。
FIG. 6 is a diagram illustrating another example of statistical data serving as a reference according to an embodiment of the present invention.
In the example of FIG. 6, statistical data on holidays is shown.
In the graph shown in FIG. 6, the horizontal axis represents time for one day of 24 hours (from time 0 am to time 12 pm), and the vertical axis represents the latency [ms of each terminal device 11-1 to 11-n]. ].
In this graph, the latency detected about each terminal device 11-1 to 11-n is shown.
In addition, this graph shows the percentile characteristics in order statistics for the latencies of the plurality of terminal apparatuses 11-1 to 11-n. Specifically, a 10th percentile characteristic 621, a 25th percentile characteristic 622, a 50th percentile characteristic 623, a 75th percentile characteristic 624, and a 90th percentile characteristic 625 are shown.
Further, in this example, it is assumed that there is no commuting rush on a holiday and a period in which the latency is particularly large as a tendency is not observed.

図7は、本発明の一実施形態に係る解析対象となる統計量データの一例を示す図である。
図7の例では、平日(Weekday)における統計量データを示してある。
図7に示されるグラフにおいて、横軸は1日分の24時間(時刻0amから時刻12pmまで)について時刻を表わしており、縦軸はそれぞれの端末装置11−1〜11−nのレイテンシー[ms]を表わしている。
このグラフには、それぞれの端末装置11−1〜11−nについて検出されたレイテンシーを示してある。
また、このグラフには、複数の端末装置11−1〜11−nのレイテンシーについて、順序統計におけるパーセンタイル特性を示してある。具体的には、10パーセンタイルの特性631、25パーセンタイルの特性632、50パーセンタイルの特性633、75パーセンタイルの特性634、90パーセンタイルの特性635を示してある。
また、本例では、このグラフには、8am前後に通勤ラッシュがあり、傾向としてレイテンシーが1日のなかで最大になるが、基準となるデータ(ここでは、図5の例)と比べて異常なデータ分布になっているとする。具体的には、図7の例では、10パーセンタイルの特性631と25パーセンタイルの特性632とが正常時(基準時)と比べて近くなっている。
FIG. 7 is a diagram showing an example of statistical data to be analyzed according to an embodiment of the present invention.
In the example of FIG. 7, statistical data on weekdays is shown.
In the graph shown in FIG. 7, the horizontal axis represents time for one day of 24 hours (from time 0 am to time 12 pm), and the vertical axis represents the latency [ms of each terminal apparatus 11-1 to 11-n]. ].
In this graph, the latency detected about each terminal device 11-1 to 11-n is shown.
In addition, this graph shows the percentile characteristics in order statistics for the latencies of the plurality of terminal apparatuses 11-1 to 11-n. Specifically, the 10th percentile characteristic 631, the 25th percentile characteristic 632, the 50th percentile characteristic 633, the 75th percentile characteristic 634, and the 90th percentile characteristic 635 are shown.
In this example, this graph has a commuting rush around 8am, and the trend is that the latency is the maximum in one day, but it is abnormal compared to the reference data (here, the example in FIG. 5). Suppose that the data distribution is as follows. Specifically, in the example of FIG. 7, the 10th percentile characteristic 631 and the 25th percentile characteristic 632 are closer than normal (reference time).

本例では、基準となる30日分の統計量データとして、図5に示されるような平日(ここでは、月−金)の統計量データが22日分取得されており、図6に示されるような休日(ここでは、土−日)の統計量データが8日分取得されている。
そして、本例では、統計量データ処理部132は、平日の統計量データを基準として用いるとともに、休日の統計量データを別の基準として用いる。このため、統計量データ比較部154は、解析対象となる1日分の統計量データと基準となる22日分の平日の統計量データとを比較する処理と、解析対象となる1日分の統計量データと基準となる8日分の休日の統計量データとを比較する処理とのうちの1以上を行う。
In this example, statistical data for weekdays as shown in FIG. 5 (for example, Monday-Friday) as shown in FIG. 5 is acquired as 22 days of reference statistical data, which is shown in FIG. Statistical data for such a holiday (here, Saturday-Sun) is acquired for 8 days.
In this example, the statistic data processing unit 132 uses the weekday statistic data as a reference, and the holiday statistic data as another reference. For this reason, the statistical data comparison unit 154 compares the processing for comparing the statistical data for one day to be analyzed with the statistical data for weekdays for the standard 22 days, and the data for one day to be analyzed. One or more of the processes for comparing the statistical data with the statistical data of the holiday for 8 days serving as a reference is performed.

図8は、本発明の一実施形態に係る時刻範囲ごとにおける統計量データの比較結果の一例を示す図である。
図8の例では、図5に示される基準となる平日の統計量データと、図7に示される解析対象となる統計量データとを比較する。また、基準となる平日の統計量データとしては、22日分のデータが使用され、それぞれの日ごとに1日分の統計量データが使用される。このような22日分のデータはクラスタとなっている。また、解析対象となる統計量データとしては、1日分のデータが使用され、その日の1日分の統計量データが使用される。
FIG. 8 is a diagram showing an example of the comparison result of the statistic data for each time range according to the embodiment of the present invention.
In the example of FIG. 8, the standard weekday statistical data shown in FIG. 5 is compared with the statistical data to be analyzed shown in FIG. Further, 22 days of data is used as standard weekday statistical data, and one day of statistical data is used for each day. Such data for 22 days is a cluster. Further, as statistical data to be analyzed, data for one day is used, and statistical data for one day of the day is used.

図8の例では、時刻範囲は、30分ごとの範囲となっており、具体的には、6時から6時30分(6:00 to 6:30)までの範囲、6時30分から7時(6:30 to 7:00)までの範囲、7時から7時30分(7:00 to 7:30)までの範囲、7時30分から8時(7:30 to 8:00)までの範囲、8時から8時30分(8:00 to 8:30)までの範囲、8時30分から9時(8:30 to 9:00)までの範囲となっている。   In the example of FIG. 8, the time range is a range of every 30 minutes, specifically, a range from 6 o'clock to 6:30 (6:00 to 6:30), 6:30 to 7 Range from Hours (6:30 to 7:00), Range from 7:00 to 7:30 (7:00 to 7:30), from 7:30 to 8:00 (7:30 to 8:00) The range is from 8 o'clock to 8:30 (8:00 to 8:30), and from 8:30 to 9 o'clock (8:30 to 9:00).

また、図8の例では、観点「時間」のスケール(時間スケール)として、30分のスケールが用いられている。この30分の時間スケールの期間は、30分ごとの時刻範囲の期間と合わせられている。
また、図8の例では、平面的に図示してあるが、時間以外の任意の数の観点が用いられてもよい。この場合、図8に示されるそれぞれの時刻範囲におけるデータは、時間以外のそれぞれの観点のスケールについても所定の大きさのスケールが設定されたときのデータとなる。
Further, in the example of FIG. 8, a scale of 30 minutes is used as a scale (time scale) of the viewpoint “time”. This 30-minute time scale period is combined with a time range period of every 30 minutes.
Further, in the example of FIG. 8, although illustrated in a plan view, any number of viewpoints other than time may be used. In this case, the data in each time range shown in FIG. 8 is data when a scale having a predetermined size is set for each scale other than time.

図8の例では、それぞれの時刻範囲において、基準となる平日の統計量データに相当する値(本実施形態において、「基準値」ともいう。)が22個示されており、クラスタを形成している。また、解析対象となる統計量データに相当する値(本実施形態において、「対象値」ともいう。)が1個示されている。
なお、図8の例では、時刻範囲(6:00 to 6:30)における1個の基準値711に符号を付してあり、他の基準値については符号を省略してある。また、それぞれの時刻範囲における1個の対象値721〜726に符号を付してある。
In the example of FIG. 8, in each time range, 22 values (also referred to as “reference values” in this embodiment) corresponding to the standard weekday statistic data are shown, forming a cluster. ing. Further, one value (also referred to as “target value” in the present embodiment) corresponding to statistical data to be analyzed is shown.
In the example of FIG. 8, one reference value 711 in the time range (6:00 to 6:30) is denoted by a reference sign, and the other reference values are omitted from the reference sign. Moreover, the code | symbol is attached | subjected to the one target value 721-726 in each time range.

統計量データ比較部154は、それぞれの時刻範囲において、複数(本例では、22個)の基準値と1個の対象値(それぞれの時刻範囲における対象値721〜726)との距離を表す値を演算する。
ここで、当該距離としては、任意の距離が用いられてもよく、例えば、CDF−based Jensen−Shannon距離、あるいは、PDF−based Jensen−Shannon距離が用いられてもよく、他の例として、それぞれの日のパーセンタイル値を特徴量化して、ユークリッド距離が用いられてもよい。
The statistic data comparison unit 154 represents a distance between a plurality of (22 in this example) reference values and one target value (target values 721 to 726 in each time range) in each time range. Is calculated.
Here, as the distance, an arbitrary distance may be used. For example, a CDF-based Jensen-Shannon distance or a PDF-based Jensen-Shannon distance may be used. The Euclidean distance may be used by characterizing the percentile value of the day.

解析対象となる統計量データが異常を含まない時刻範囲では、当該統計量データは基準となるクラスタ(本例では、基準となる平日のクラスタ、あるいは、基準となる休日のクラスタ)に含まれるが、解析対象となる統計量データが異常を含む時刻範囲では、当該統計量データは基準となるクラスタに含まれない。   In the time range in which the statistical data to be analyzed does not include any abnormality, the statistical data is included in the reference cluster (in this example, the reference weekday cluster or the reference holiday cluster). In the time range in which the statistical data to be analyzed includes an abnormality, the statistical data is not included in the reference cluster.

図9は、本発明の一実施形態に係る異常期間の判定処理の一例を説明するための図である。
図8の例では、時間スケールが30分である場合の例を示した。異常範囲判定部155は、時間スケールが30分である場合と、さらに、他の任意の数の異なる期間(異なる時間の長さ)を有する時間スケールについても、統計量データ比較部154による比較処理を行わせる。本例では、異常範囲判定部155は、時間スケールが1分、10分、30分、60分(=1時間)のそれぞれである場合について、統計量データ比較部154による比較処理を行わせる。
FIG. 9 is a diagram for explaining an example of an abnormal period determination process according to an embodiment of the present invention.
In the example of FIG. 8, an example in which the time scale is 30 minutes is shown. The abnormal range determination unit 155 performs comparison processing by the statistic data comparison unit 154 for the case where the time scale is 30 minutes and for time scales having any other number of different periods (different lengths of time). To do. In this example, the abnormal range determination unit 155 causes the statistical data comparison unit 154 to perform comparison processing when the time scale is 1 minute, 10 minutes, 30 minutes, and 60 minutes (= 1 hour).

図9に示されるグラフにおいて、横軸は6時(6:00)から10時(10:00)までの時刻を表わしており、縦軸はLOF(Local Outlier Factor)の値を表わしている。ここで、LOFとしては、それぞれの時刻範囲における22個の基準値のクラスタと1個の対象値721〜726とのLOFが用いられている。当該LOFは、当該対象値721〜726が当該クラスタから外れている度合いを表す。
図9の例では、時間スケール「1分」が用いられたときにおけるLOFの特性811、時間スケール「10分」が用いられたときにおけるLOFの特性812、時間スケール「30分」が用いられたときにおけるLOFの特性813、時間スケール「60分」が用いられたときにおけるLOFの特性814を示してある。なお、これら複数の異なる時間スケールの期間は、例えば、始点(図3の例では、時刻範囲t0の始点)のタイミングが合わせられている。
In the graph shown in FIG. 9, the horizontal axis represents the time from 6:00 (6:00) to 10:00 (10:00), and the vertical axis represents the value of LOF (Local Operator Factor). Here, as the LOF, LOFs of 22 reference value clusters and one target value 721 to 726 in each time range are used. The LOF represents the degree to which the target values 721 to 726 are out of the cluster.
In the example of FIG. 9, the LOF characteristic 811 when the time scale “1 minute” is used, the LOF characteristic 812 when the time scale “10 minutes” is used, and the time scale “30 minutes” are used. The LOF characteristic 813 at the time and the LOF characteristic 814 when the time scale “60 minutes” is used are shown. Note that the timings of the start points (in the example of FIG. 3, the start point of the time range t0) are matched in the plurality of different time scale periods.

統計量データ処理装置12では、例えば記憶部113に、LOFに関する所定の閾値Q1が設定されている。
異常範囲判定部155は、まず、あらかじめ定められた複数の異なる時間スケールのそれぞれ(本例では、1分、10分、30分、60分)について、演算されたLOFが所定の閾値Q1を超えるか否かを判定する。この判定の結果、異常範囲判定部155は、1個以上の時間スケールにおいてLOFが所定の閾値Q1を超える期間の全体を、異常期間の候補として、取得する。図9の例では、異常期間の候補は、7時から9時までとなる。なお、当該異常期間の候補は、例えば、LOFが所定の閾値Q1を超える厳密な期間が用いられてもよく、あるいは、あらかじめ定められた区切り(例えば、1分単位の区切り、あるいは、5分単位の区切りなど)の期間が用いられて、当該厳密な期間からずれてもよい。
In the statistic data processing apparatus 12, for example, a predetermined threshold value Q <b> 1 related to LOF is set in the storage unit 113.
First, the abnormal range determination unit 155 calculates the calculated LOF exceeds a predetermined threshold value Q1 for each of a plurality of predetermined different time scales (in this example, 1 minute, 10 minutes, 30 minutes, and 60 minutes). It is determined whether or not. As a result of this determination, the abnormal range determination unit 155 acquires the entire period in which the LOF exceeds the predetermined threshold value Q1 on one or more time scales as an abnormal period candidate. In the example of FIG. 9, the abnormal period candidates are from 7:00 to 9:00. As the abnormal period candidate, for example, a strict period in which the LOF exceeds a predetermined threshold Q1 may be used, or a predetermined interval (for example, a unit of 1 minute or a unit of 5 minutes) Period may be used to deviate from the exact period.

次に、異常範囲判定部155は、異常期間の候補について、複数の時刻範囲を設定して、統計量データ比較部154による比較処理を行わせる。
本例では、異常範囲判定部155は、異常期間の候補である7時から9時までの期間について、既に使用された最小の時間スケールである1分を使用して、開始時刻と終了時刻とのそれぞれを1分ずつずらした時刻範囲を設定する。具体的には、異常範囲判定部155は、開始時刻を7時から8時59分まで1分ごとにとり、終了時刻を7時1分から9時まで1分ごとにとり、当該開始時刻と当該終了時刻とのすべての組み合わせの時刻範囲を設定する。つまり、7時から7時1分まで、7時から7時2分まで、7時から7時3分まで、・・・、7時から8時59分まで、7時1分から7時2分まで、7時1分から7時3分まで、・・・、8時58分から8時59分まで、8時58分から9時まで、8時59分から9時まで、の時刻範囲が設定される。なお、開始時刻の方が終了時刻よりも早くなる組み合わせだけが使用される。本例では、(開始時刻、終了時刻)の組み合わせの数が、{120×119÷2}となる。
Next, the abnormal range determination unit 155 sets a plurality of time ranges for the abnormal period candidates, and causes the statistical data comparison unit 154 to perform comparison processing.
In this example, the abnormal range determination unit 155 uses the minimum time scale that has already been used for the period from 7 o'clock to 9 o'clock which is a candidate for the abnormal period, and uses the start time and end time. A time range in which each of these is shifted by 1 minute is set. Specifically, the abnormal range determination unit 155 takes the start time every minute from 7 o'clock to 8:59 and the end time every 7 minutes from 7 o'clock to 9 o'clock, and the start time and the end time Set the time range for all combinations with. In other words, from 7 o'clock to 7: 01, from 7 o'clock to 7: 02, from 7 o'clock to 7: 3 ..., from 7 o'clock to 8: 59, from 7 o'clock to 7: 02 The time ranges from 7:01 to 7: 3,..., 8:58 to 8:59, 8:58 to 9 and 8:59 to 9 are set. Note that only combinations in which the start time is earlier than the end time are used. In this example, the number of combinations of (start time, end time) is {120 × 119/2}.

図9の例では、異常範囲判定部155は、設定した複数の時刻範囲のうちで、7時から8時30分までの時刻範囲について演算されたLOFが最大となることを判定する。そして、異常範囲判定部155は、当該時刻範囲に相当する期間(7時から8時30分までの範囲)を異常範囲815(ANORMALY FACTOR)であると判定する。
なお、本実施形態では、異常範囲判定部155は、常に(例えば、一定期間ごとに)、複数の時間スケールのそれぞれ(本例では、1分、10分、30分、60分)におけるLOFが所定の閾値Q1を超えるか否かを判定しており、LOFが所定の閾値Q1を超えた場合に、それ以降の処理として、複数の時刻範囲におけるLOFについて最大となる時刻範囲を判定する処理へ移行する。
In the example of FIG. 9, the abnormal range determination unit 155 determines that the LOF calculated for the time range from 7 o'clock to 8:30 is the maximum among the set time ranges. Then, the abnormal range determination unit 155 determines that the period corresponding to the time range (range from 7 o'clock to 8:30) is the abnormal range 815 (ANORMALY FACTOR).
In the present embodiment, the abnormal range determination unit 155 always (for example, every fixed period) has a LOF at each of a plurality of time scales (in this example, 1 minute, 10 minutes, 30 minutes, and 60 minutes). When it is determined whether or not the predetermined threshold value Q1 is exceeded, and the LOF exceeds the predetermined threshold value Q1, as a subsequent process, a process is performed for determining a time range that is maximum for the LOF in a plurality of time ranges. Transition.

このように、異常範囲判定部155は、事前に取得された基準となる値(平常値)に対して、解析対象となる値(対象値)が乖離している度合いに基づいて、外れ値(異常値)であるか否かを判定する。
なお、基準となる値(平常値)は、例えば、機械学習などを用いて学習されてもよい。
As described above, the abnormal range determination unit 155 determines the outlier (based on the degree of deviation of the value (target value) to be analyzed from the reference value (normal value) acquired in advance. It is determined whether or not (abnormal value).
The reference value (normal value) may be learned using, for example, machine learning.

ここで、異常期間の候補を検出するために最初に設定される時間スケールについて、その大きさ、あるいは、その数としては、それぞれ、任意であってもよい。
また、異常範囲判定部155は、異常期間の候補を検出するために最初に設定された時間スケールにおいて異常が無いことが判定された場合には、例えば、その異常検出処理を終了する。
また、異常期間の候補が検出された後に、検出された異常期間の候補に対して、さらに時刻範囲を設定して異常期間を判定する場合における当該時刻範囲について、その範囲、あるいは、その数としては、それぞれ、任意であってもよい。
Here, the size or the number of time scales initially set for detecting abnormal period candidates may be arbitrary.
In addition, when it is determined that there is no abnormality in the time scale that is initially set in order to detect an abnormal period candidate, the abnormal range determination unit 155 ends the abnormality detection process, for example.
Further, after the abnormal period candidates are detected, the time range in the case where the abnormal period is determined by further setting the time range for the detected abnormal period candidates, as the range or the number thereof. Each may be arbitrary.

また、本実施形態では、時刻(あるいは、時間)の観点に関する指標(時間スケール、時刻範囲)について異常期間を判定する場合を示したが、他の例として、時刻(あるいは、時間)以外の観点に関する指標(例えば、当該観点のスケール、当該観点の範囲)について異常範囲を判定することが行われてもよい。時刻(あるいは、時間)以外の観点としては、例えば、領域の観点、あるいは、デバイス種別の観点などが用いられてもよい。
また、本実施形態では、1個の観点(時刻(あるいは、時間)の観点)について異常範囲を判定する場合を示したが、他の例として、2個以上の異なる観点の組み合わせについて異常範囲を判定することが行われてもよい。
また、本実施形態では、複数の基準値のクラスタと対象値との距離を演算して用いたが、他の構成例として、複数の基準値のクラスタの代わりに、当該クラスタにおける1個の代表値が用いられてもよい。当該クラスタにおける1個の代表値としては、例えば、当該クラスタに含まれる値の平均値(あるいは、重心値)が用いられてもよい。
Further, in the present embodiment, the case where the abnormal period is determined for the index (time scale, time range) regarding the viewpoint of time (or time) has been described. However, as another example, the viewpoint other than the time (or time) An abnormality range may be determined for an index related to (for example, the scale of the viewpoint, the range of the viewpoint). As a viewpoint other than the time (or time), for example, an area viewpoint or a device type viewpoint may be used.
In the present embodiment, the case where the abnormal range is determined for one viewpoint (time (or time) viewpoint) has been described. As another example, the abnormal range is determined for a combination of two or more different viewpoints. The determination may be performed.
In this embodiment, the distance between the target value and the cluster of the plurality of reference values is calculated and used. However, as another configuration example, one representative in the cluster is used instead of the plurality of reference value clusters. A value may be used. As one representative value in the cluster, for example, an average value (or centroid value) of values included in the cluster may be used.

なお、基準となる統計量データとしては、基準となる平日の統計量データの代わりに、図6に示される基準となる休日の統計量データが用いられてもよい。
また、他の構成例として、複数種類(例えば、平日と休日)の基準となる統計量データと解析対象となる統計量データとを並列的に比較してもよい。この場合、例えば、比較処理が行われるタイミングごとに、複数種類の基準となる統計量データ(本実施形態の場合、複数種類のクラスタ)のなかで解析対象となる統計量データに最も近いもの(本実施形態の場合、距離が最小となる1個のクラスタ)を比較対象とする手法が用いられてもよい。
Note that, as the standard statistical data, the standard holiday statistical data shown in FIG. 6 may be used instead of the standard weekday statistical data.
As another configuration example, statistical data serving as a reference for a plurality of types (for example, weekdays and holidays) and statistical data to be analyzed may be compared in parallel. In this case, for example, at the timing at which the comparison processing is performed, the closest statistical data to be analyzed among statistical data serving as a plurality of types of reference (in this embodiment, a plurality of types of clusters) ( In the case of the present embodiment, a method may be used in which a single cluster having a minimum distance) is compared.

[統計量データ処理装置において行われる処理の例]
図10は、本発明の一実施形態に係る統計量データ処理装置12において行われる異常の有無を検出するための処理の手順の一例を示す図である。
本実施形態では、異常範囲判定部155は、統計量データ比較部154、観点設定部151、スケール設定部152にそれぞれの処理を行わせて、異常範囲を判定する処理を行う。
なお、本例は一例であり、他の任意の処理手順が用いられてもよい。
[Example of processing performed in statistical data processing apparatus]
FIG. 10 is a diagram illustrating an example of a processing procedure for detecting the presence / absence of an abnormality performed in the statistic data processing apparatus 12 according to an embodiment of the present invention.
In the present embodiment, the abnormal range determination unit 155 performs processing for determining the abnormal range by causing the statistic data comparison unit 154, the viewpoint setting unit 151, and the scale setting unit 152 to perform respective processes.
In addition, this example is an example and other arbitrary processing procedures may be used.

(ステップS1)
統計量データ比較部154は、異常範囲判定のための基準となるデータ(基準データ)を取得する。
(ステップS2)
統計量データ比較部154は、異常範囲判定のための対象となるデータ(対象データ)を取得する。
(ステップS3)
観点設定部151は、異常範囲判定の処理に使用する観点を設定する。
(ステップS4)
スケール設定部152は、異常範囲判定の処理に使用するスケールを設定する。
(ステップS5)
統計量データ比較部154は、設定された観点および設定されたスケールを使用して、基準データと対象データとを比較する。
(ステップS6)
異常範囲判定部155は、統計量データ比較部154による比較処理の結果に基づいて、異常範囲を判定し、これにより、異常の有無が検出される。なお、異常範囲判定部155は、比較処理の条件を複数種類に変更して、統計量データ比較部154による比較処理を行わせて、異常範囲を判定してもよい。比較処理の条件としては、例えば、観点、スケール、範囲(時刻範囲など)のうちの1以上に関する条件であってもよい。
(Step S1)
The statistic data comparison unit 154 acquires data (reference data) serving as a reference for determining an abnormal range.
(Step S2)
The statistic data comparison unit 154 acquires data (target data) that is a target for the abnormal range determination.
(Step S3)
The viewpoint setting unit 151 sets the viewpoint used for the abnormal range determination process.
(Step S4)
The scale setting unit 152 sets a scale to be used for abnormal range determination processing.
(Step S5)
The statistic data comparison unit 154 compares the reference data with the target data using the set viewpoint and the set scale.
(Step S6)
The abnormal range determination unit 155 determines an abnormal range based on the result of the comparison process by the statistic data comparison unit 154, thereby detecting the presence or absence of an abnormality. In addition, the abnormal range determination unit 155 may determine the abnormal range by changing the comparison processing conditions to a plurality of types and causing the statistical data comparison unit 154 to perform comparison processing. The condition for the comparison process may be, for example, a condition regarding one or more of a viewpoint, a scale, and a range (such as a time range).

[第1実施形態のまとめ]
以上のように、本実施形態に係るデータ処理システム1では、統計量データ処理装置12において、多次元およびマルチスケールのデータ解析を行うことで異常を検出することを可能とすることができる。
本実施形態に係る統計量データ群のデータ構造では、例えば、複数の観点および複数のスケールで、異常の発生などの事象を監視して検出することなどが可能であり、様々な観点および様々なスケールの事象を並列に監視して検出することなどが可能である。この場合に、本実施形態に係る統計量データ群のデータ構造では、例えば、発生した事象がいずれの観点およびいずれのスケールでの事象であるかを判定することが可能である。具体例として、広い領域のスケールで事象が発生した場合には、広い領域にわたる原因による事象であると推定することができ、また、特定の領域のスケールで事象が発生した場合には、当該特定の領域に限られた原因による事象であると推定することができる。
ここで、本実施形態では、端末装置11−1〜11−nに関する値について統計量データを処理する構成としたが、他の任意の値について統計量データを処理する構成が実施されてもよい。
[Summary of First Embodiment]
As described above, in the data processing system 1 according to the present embodiment, the statistic data processing apparatus 12 can detect anomalies by performing multidimensional and multiscale data analysis.
In the data structure of the statistic data group according to the present embodiment, for example, it is possible to monitor and detect an event such as the occurrence of an abnormality from a plurality of viewpoints and a plurality of scales. It is possible to monitor and detect scale events in parallel. In this case, in the data structure of the statistic data group according to the present embodiment, for example, it is possible to determine which viewpoint and at which scale the generated event is an event. As a specific example, if an event occurs in a wide area scale, it can be estimated that the event is caused by a cause in a wide area, and if an event occurs in a specific area scale, It can be presumed that the event is caused by a cause limited to the region.
Here, in this embodiment, although it was set as the structure which processes statistics data about the value regarding the terminal devices 11-1 to 11-n, the structure which processes statistics data about another arbitrary value may be implemented. .

(第2実施形態)
[データ処理システム]
図11は、本発明の一実施形態(第2実施形態)に係るデータ処理システム1001の概略的な構成を示すブロック図である。
データ処理システム1001は、n個の端末装置11−1〜11−nと、統計量データ処理装置1011と、データベース1012と、単位統計量データ生成装置1021と、ネットワーク21を備える。ここで、端末装置11−1〜11−nと、ネットワーク21は、図1に示されるものと同様であり、説明の便宜上、同じ符号を付してある。
また、データベース1012は、図1に示されるデータベース13と同様に、データを記憶する機能を有する。
(Second Embodiment)
[Data processing system]
FIG. 11 is a block diagram showing a schematic configuration of a data processing system 1001 according to one embodiment (second embodiment) of the present invention.
The data processing system 1001 includes n terminal devices 11-1 to 11-n, a statistic data processing device 1011, a database 1012, a unit statistic data generation device 1021, and a network 21. Here, the terminal devices 11-1 to 11-n and the network 21 are the same as those shown in FIG. 1, and are given the same reference numerals for convenience of explanation.
Further, the database 1012 has a function of storing data, similar to the database 13 shown in FIG.

本実施形態に係るデータ処理システム1001について、図1に示されるデータ処理システム1との相違点について説明する。図11の例では、図1の例と比べて、単位統計量データ生成装置1021を備えている点と、統計量データ処理装置1011により行われる処理の一部が、相違する。
単位統計量データ生成装置1021は、t−digestの技術(例えば、非特許文献1など参照。)により実行することが可能な処理の全部または一部を行う機能を有している。本実施形態では、単位統計量データ生成装置1021は、t−digestの技術を用いて、解析対象のデータ、観点を特定する情報、および、それぞれの観点のスケールを特定する情報に基づいて、単位統計量データを生成する機能を有する。
なお、単位統計量データ生成装置1021としては、例えば、統計量データ処理装置1011を管理する者により管理されてもよく、あるいは、他の者によって提供される単位統計量データ生成装置1021を利用する構成が用いられてもよい。
Differences between the data processing system 1001 according to the present embodiment and the data processing system 1 shown in FIG. 1 will be described. The example of FIG. 11 is different from the example of FIG. 1 in that the unit statistics data generation device 1021 is provided and a part of the processing performed by the statistics data processing device 1011 is different.
The unit statistic data generation apparatus 1021 has a function of performing all or part of processing that can be executed by the t-digest technique (for example, see Non-patent Document 1). In the present embodiment, the unit statistic data generation apparatus 1021 uses the t-digest technique to determine the unit based on the data to be analyzed, the information for specifying the viewpoint, and the information for specifying the scale of each viewpoint. It has a function to generate statistical data.
The unit statistic data generation device 1021 may be managed by a person who manages the statistic data processing device 1011 or the unit statistic data generation device 1021 provided by another person is used. A configuration may be used.

統計量データ処理装置1011は、図1に示される統計量データ処理装置12との相違点として、単位統計量データ生成装置1021により行われる処理については当該単位統計量データ生成装置1021に当該処理を要求して処理結果を受ける構成としてある。
本実施形態では、統計量データ群生成部153は、単位統計量データを生成する処理を要求する信号を、通信部114によりネットワーク21を介して、単位統計量データ生成装置1021に送信する。当該信号には、単位統計量データを生成するために必要な情報が含まれ、例えば、解析対象のデータ(または、それを特定する情報)、1個以上の観点を特定する情報、および、それぞれの観点のスケールを特定する情報が含まれる。
単位統計量データ生成装置1021は、このような要求の信号を受信した場合、当該要求に応じて単位統計量データを生成し、生成された単位統計量データを含む信号を、ネットワーク21を介して、統計量データ処理装置1011に送信する。
統計量データ群生成部153は、単位統計量データ生成装置1021から通信部114により受信された単位統計量データを使用(利用)して、統計量データ群を生成する。
The statistic data processing device 1011 is different from the statistic data processing device 12 shown in FIG. 1 in that the unit statistic data generating device 1021 performs the processing for the processing performed by the unit statistic data generating device 1021. It is configured to request and receive processing results.
In the present embodiment, the statistic data group generation unit 153 transmits a signal requesting processing for generating unit statistic data to the unit statistic data generation apparatus 1021 via the network 21 by the communication unit 114. The signal includes information necessary for generating unit statistic data, for example, data to be analyzed (or information for specifying it), information for specifying one or more viewpoints, and each Contains information that identifies the scale of the viewpoint.
When the unit statistic data generation apparatus 1021 receives such a request signal, the unit statistic data generation apparatus 1021 generates unit statistic data in response to the request, and sends a signal including the generated unit statistic data via the network 21. And sent to the statistics data processing apparatus 1011.
The statistic data group generation unit 153 uses (uses) the unit statistic data received by the communication unit 114 from the unit statistic data generation apparatus 1021 to generate a statistic data group.

(以上の実施形態のまとめ)
一構成例として、少なくとも1個の観点および観点ごとの複数のスケールについて、観点とスケールとの組み合わせごとに含まれるデータに基づく統計量データである基準データと比較対象データとを比較する統計量データ比較部(図2の例では、統計量データ比較部154)と、統計量データ比較部による比較の結果に基づいて、観点の複数の範囲のなかで異常があるとみなされる範囲を判定する異常範囲判定部(図2の例では、異常範囲判定部155)と、を備える統計量データ処理装置(図1、図11の例では、統計量データ処理装置12、1011)である。
一構成例として、異常範囲判定部は、統計量データ比較部による比較の結果に基づいて、異常があるとみなされる観点の範囲候補(異常範囲の候補)を判定し、異常範囲判定部は、観点の範囲候補に含まれる複数の範囲のなかで、基準データと比較対象データとの差を表すLOFが最大となる範囲を、異常があるとみなされる範囲として、判定する。
一構成例として、統計量データ比較部は、複数の基準データと比較対象データとを比較する。
一構成例として、基準データと比較対象データとのうちの一方または両方は、複数の異なる観点および観点ごとの複数の異なるスケールについて、観点とスケールとの組み合わせごとに含まれるデータに基づく統計量データを有する統計量データ群(図3の例では、統計量データ群201)から取得される。
一構成例として、統計量データ比較部が、少なくとも1個の観点および観点ごとの複数のスケールについて、観点とスケールとの組み合わせごとに含まれるデータに基づく統計量データである基準データと比較対象データとを比較し、異常範囲判定部が、統計量データ比較部による比較の結果に基づいて、観点の複数の範囲のなかで異常があるとみなされる範囲を判定する、統計量データ処理方法(図1、図11の例では、統計量データ処理装置12、1011により行われる処理の方法)である。
一構成例として、統計量データ比較部が、少なくとも1個の観点および観点ごとの複数のスケールについて、観点とスケールとの組み合わせごとに含まれるデータに基づく統計量データである基準データと比較対象データとを比較するステップと、異常範囲判定部が、統計量データ比較部による比較の結果に基づいて、観点の複数の範囲のなかで異常があるとみなされる範囲を判定するステップと、をコンピュータに実行させるためのプログラム(図1、図11の例では、統計量データ処理装置12、1011を構成するコンピュータ)である。
(Summary of the above embodiments)
As one configuration example, for at least one viewpoint and a plurality of scales for each viewpoint, statistical data for comparing reference data, which is statistical data based on data included for each combination of viewpoints and scales, and comparison target data An abnormality for determining a range that is considered to be abnormal among a plurality of ranges of viewpoints based on a comparison result by the comparison unit (statistical data comparison unit 154 in the example of FIG. 2) and the statistical data comparison unit A statistic data processing device (in the example of FIGS. 1 and 11, the statistic data processing devices 12 and 1011) including a range determination unit (in the example of FIG. 2, an abnormal range determination unit 155).
As an example of the configuration, the abnormal range determination unit determines range candidates (abnormal range candidates) of viewpoints considered to be abnormal based on the result of comparison by the statistic data comparison unit, and the abnormal range determination unit Among the plurality of ranges included in the viewpoint range candidates, a range in which the LOF representing the difference between the reference data and the comparison target data is maximized is determined as a range that is considered to be abnormal.
As one configuration example, the statistic data comparison unit compares a plurality of reference data with comparison target data.
As one configuration example, one or both of the reference data and the comparison target data is statistical data based on data included in each combination of viewpoints and scales for different viewpoints and different scales for each viewpoint. Is obtained from the statistic data group (in the example of FIG. 3, the statistic data group 201).
As one configuration example, the statistical data comparison unit includes, for at least one viewpoint and a plurality of scales for each viewpoint, reference data and comparison target data that are statistics data based on data included for each combination of viewpoints and scales. And a statistical data processing method in which an abnormal range determination unit determines a range considered to be abnormal among a plurality of ranges of viewpoints based on a result of comparison by the statistical data comparison unit (see FIG. 1, in the example of FIG. 11, a method of processing performed by the statistic data processing devices 12 and 1011).
As one configuration example, the statistical data comparison unit includes, for at least one viewpoint and a plurality of scales for each viewpoint, reference data and comparison target data that are statistics data based on data included for each combination of viewpoints and scales. And a step in which an abnormal range determination unit determines a range that is considered to be abnormal among a plurality of ranges of viewpoints based on a result of comparison by the statistical data comparison unit. A program to be executed (in the example of FIGS. 1 and 11, a computer configuring the statistic data processing devices 12 and 1011).

以上に示した実施形態に係る各装置(例えば、統計量データ処理装置12、1011など)の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体(記憶媒体)に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、処理を行ってもよい。
なお、ここでいう「コンピュータシステム」とは、オペレーティング・システムあるいは周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、フラッシュメモリ等の書き込み可能な不揮発性メモリ、DVD(Digital Versatile Disc)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに、「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークあるいは電話回線等の通信回線を介してプログラムが送信された場合のサーバあるいはクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記のプログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)あるいは電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記のプログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、上記のプログラムは、前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
A program for realizing the function of each device (for example, the statistic data processing device 12, 1011, etc.) according to the embodiment described above is recorded on a computer-readable recording medium (storage medium), and this recording medium Processing may be performed by causing the computer system to read and execute the program recorded in the above.
Here, the “computer system” may include hardware such as an operating system or peripheral devices.
The “computer-readable recording medium” means a flexible disk, a magneto-optical disk, a ROM (Read Only Memory), a writable non-volatile memory such as a flash memory, a portable medium such as a DVD (Digital Versatile Disc), A storage device such as a hard disk built in a computer system.
Furthermore, the “computer-readable recording medium” refers to a volatile memory (for example, DRAM (DRAM) inside a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. Dynamic Random Access Memory)) that holds a program for a certain period of time is also included.
The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
Further, the above program may be for realizing a part of the functions described above. Further, the above program may be a so-called difference file (difference program) that can realize the above-described functions in combination with a program already recorded in the computer system.

以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。   As mentioned above, although embodiment of this invention was explained in full detail with reference to drawings, the concrete structure is not restricted to this embodiment, The design change etc. of the range which does not deviate from the summary of this invention are included.

1、1001…データ処理システム、11−1〜11−n…端末装置、12、1011…統計量データ処理装置、13、1012…データベース、21…ネットワーク、111…入力部、112…出力部、113…記憶部、114…通信部、115…制御部、131…データ取得部、132…統計量データ処理部、133…データ出力制御部、151…観点設定部、152…スケール設定部、153…統計量データ群生成部、154…統計量データ比較部、155…異常範囲判定部、201、511−1〜511−30、522…統計量データ群、211〜213、221〜223、311〜313、321〜323、411〜413、421〜423…単位統計量データ、511…基準となるデータ、521…解析対象のデータ、523…比較処理、524…異常検出処理、525…異常範囲、611〜615、621〜625、631〜635、811〜814…特性、711…基準値、721〜726…対象値、1021…単位統計量データ生成装置、Q1…閾値 DESCRIPTION OF SYMBOLS 1,1001 ... Data processing system, 11-1 to 11-n ... Terminal device, 12, 1011 ... Statistics data processing device, 13, 1012 ... Database, 21 ... Network, 111 ... Input part, 112 ... Output part, 113 ... storage unit 114 ... communication unit 115 ... control unit 131 ... data acquisition unit 132 ... statistic data processing unit 133 ... data output control unit 151 ... viewpoint setting unit 152 ... scale setting unit 153 ... statistics Quantity data group generation unit, 154... Statistics data comparison part, 155... Abnormal range determination part, 201, 511-1 to 511-30, 522... Statistics data group, 211 to 213, 221 to 223, 311 to 313, 321 to 323, 411 to 413, 421 to 423... Unit statistics data, 511..., Reference data, 521. Comparison processing, 524 ... abnormal detection processing, 525 ... abnormal range, 611-615, 621-625, 631-635, 811-814 ... characteristics, 711 ... reference value, 721-726 ... target value, 1021 ... unit statistic data Generator, Q1 ... threshold

Claims (6)

少なくとも1個の観点および前記観点ごとの複数のスケールについて、前記観点と前記スケールとの組み合わせごとに含まれるデータに基づく統計量データである基準データと比較対象データとを比較する統計量データ比較部と、
前記統計量データ比較部による比較の結果に基づいて、前記観点の複数の範囲のなかで異常があるとみなされる範囲を判定する異常範囲判定部と、
を備える統計量データ処理装置。
A statistic data comparison unit that compares reference data, which is statistical data based on data included in each combination of the viewpoint and the scale, and comparison target data with respect to at least one viewpoint and a plurality of scales for each viewpoint. When,
An abnormal range determination unit that determines a range that is considered to be abnormal among a plurality of ranges of the viewpoint, based on a result of comparison by the statistical data comparison unit;
A statistics data processing apparatus comprising:
前記異常範囲判定部は、前記統計量データ比較部による比較の結果に基づいて、異常があるとみなされる前記観点の範囲候補を判定し、
前記異常範囲判定部は、前記観点の前記範囲候補に含まれる複数の範囲のなかで、前記基準データと前記比較対象データとの差を表すLOFが最大となる範囲を、異常があるとみなされる範囲として、判定する、
請求項1に記載の統計量データ処理装置。
The abnormal range determination unit determines a range candidate of the viewpoint that is considered to be abnormal based on a result of the comparison by the statistical data comparison unit,
The abnormal range determination unit is considered to be abnormal in a range in which a LOF representing a difference between the reference data and the comparison target data is maximum among a plurality of ranges included in the range candidates of the viewpoint. Judging as a range,
The statistic data processing apparatus according to claim 1.
前記統計量データ比較部は、複数の前記基準データと前記比較対象データとを比較する、
請求項1または請求項2のいずれか1項に記載の統計量データ処理装置。
The statistic data comparison unit compares a plurality of the reference data with the comparison target data.
The statistic data processing apparatus according to claim 1.
前記基準データと前記比較対象データとのうちの一方または両方は、複数の異なる前記観点および前記観点ごとの複数の異なる前記スケールについて、前記観点と前記スケールとの組み合わせごとに含まれるデータに基づく統計量データを有する統計量データ群から取得される、
請求項1から請求項3のいずれか1項に記載の統計量データ処理装置。
One or both of the reference data and the comparison target data are statistics based on data included for each combination of the viewpoint and the scale with respect to a plurality of different viewpoints and a plurality of different scales for each viewpoint. Obtained from a statistic data group having quantity data,
The statistics data processing apparatus according to any one of claims 1 to 3.
統計量データ比較部が、少なくとも1個の観点および前記観点ごとの複数のスケールについて、前記観点と前記スケールとの組み合わせごとに含まれるデータに基づく統計量データである基準データと比較対象データとを比較し、
異常範囲判定部が、前記統計量データ比較部による比較の結果に基づいて、前記観点の複数の範囲のなかで異常があるとみなされる範囲を判定する、
統計量データ処理方法。
The statistic data comparison unit includes, for at least one viewpoint and a plurality of scales for each viewpoint, reference data and comparison target data that are statistics data based on data included for each combination of the viewpoint and the scale. Compare and
An abnormal range determination unit determines a range that is considered to be abnormal among a plurality of ranges of the viewpoint based on a result of comparison by the statistical data comparison unit,
Statistics data processing method.
統計量データ比較部が、少なくとも1個の観点および前記観点ごとの複数のスケールについて、前記観点と前記スケールとの組み合わせごとに含まれるデータに基づく統計量データである基準データと比較対象データとを比較するステップと、
異常範囲判定部が、前記統計量データ比較部による比較の結果に基づいて、前記観点の複数の範囲のなかで異常があるとみなされる範囲を判定するステップと、
をコンピュータに実行させるためのプログラム。
The statistic data comparison unit includes, for at least one viewpoint and a plurality of scales for each viewpoint, reference data and comparison target data that are statistics data based on data included for each combination of the viewpoint and the scale. A step of comparing;
An abnormal range determining unit, based on a result of comparison by the statistical data comparing unit, determining a range that is considered to be abnormal among a plurality of ranges of the viewpoint;
A program that causes a computer to execute.
JP2017094048A 2017-05-10 2017-05-10 Data processing equipment, data processing methods and programs Active JP6795448B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017094048A JP6795448B2 (en) 2017-05-10 2017-05-10 Data processing equipment, data processing methods and programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017094048A JP6795448B2 (en) 2017-05-10 2017-05-10 Data processing equipment, data processing methods and programs

Publications (2)

Publication Number Publication Date
JP2018190281A true JP2018190281A (en) 2018-11-29
JP6795448B2 JP6795448B2 (en) 2020-12-02

Family

ID=64478589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017094048A Active JP6795448B2 (en) 2017-05-10 2017-05-10 Data processing equipment, data processing methods and programs

Country Status (1)

Country Link
JP (1) JP6795448B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220143954A (en) * 2020-03-13 2022-10-25 엔비전 디지털 인터내셔널 피티이 리미티드 Method and apparatus, device and storage medium for determining an operating state of a photovoltaic array

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100100558A1 (en) * 2000-02-28 2010-04-22 Hyperroll, Inc. Method of servicing query statements from a client machine using a database management system (DBMS) employing a relational datastore and a multi-dimensional database (MDDB)
JP2011122985A (en) * 2009-12-11 2011-06-23 Ricoh Co Ltd Printed material inspection apparatus, printed material inspection method, program and storage medium
WO2012073526A1 (en) * 2010-12-03 2012-06-07 株式会社日立製作所 Data processing system, and data processing device
JP2016201088A (en) * 2015-04-10 2016-12-01 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Anomaly detection system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100100558A1 (en) * 2000-02-28 2010-04-22 Hyperroll, Inc. Method of servicing query statements from a client machine using a database management system (DBMS) employing a relational datastore and a multi-dimensional database (MDDB)
JP2011122985A (en) * 2009-12-11 2011-06-23 Ricoh Co Ltd Printed material inspection apparatus, printed material inspection method, program and storage medium
WO2012073526A1 (en) * 2010-12-03 2012-06-07 株式会社日立製作所 Data processing system, and data processing device
JP2016201088A (en) * 2015-04-10 2016-12-01 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Anomaly detection system and method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220143954A (en) * 2020-03-13 2022-10-25 엔비전 디지털 인터내셔널 피티이 리미티드 Method and apparatus, device and storage medium for determining an operating state of a photovoltaic array
KR102522011B1 (en) * 2020-03-13 2023-04-14 엔비전 디지털 인터내셔널 피티이 리미티드 Method and apparatus, device and storage medium for determining the operating state of a photovoltaic array
US11736062B2 (en) 2020-03-13 2023-08-22 Envision Digital International Pte. Ltd. Method and apparatus for determining operating state of photovoltaic array, device and storage medium

Also Published As

Publication number Publication date
JP6795448B2 (en) 2020-12-02

Similar Documents

Publication Publication Date Title
US10679135B2 (en) Periodicity analysis on heterogeneous logs
US11551111B2 (en) Detection and use of anomalies in an industrial environment
JPWO2016116961A1 (en) Information processing apparatus and information processing method
CN110929799B (en) Method, electronic device, and computer-readable medium for detecting abnormal user
JP6313516B1 (en) Information processing apparatus, information processing method, and computer program
US11720820B2 (en) Operational support system and method
JP2016099863A (en) Abnormal value detection device and operation method thereof
CN114444074A (en) Abnormal block chain link point detection method and device
CN115085196A (en) Power load predicted value determination method, device, equipment and computer readable medium
JP2020071845A (en) Abnormality detection device, abnormality detection method, and abnormality detection program
JP7292368B2 (en) A non-transitory computer-readable storage medium storing a method for identifying a device using attributes and location signatures from the device, a server of uniquely generated identifiers for the method, and a sequence of instructions for the method
JP2012186667A (en) Network fault detection apparatus, network fault detection method of network fault detection apparatus, and network fault detection program
KR102469664B1 (en) Anomaly detection method and system
JP2019105871A (en) Abnormality candidate extraction program, abnormality candidate extraction method and abnormality candidate extraction apparatus
US11527091B2 (en) Analyzing apparatus, control method, and program
JP6795448B2 (en) Data processing equipment, data processing methods and programs
CN113383328A (en) Cloud platform and method for efficiently processing collected data
JP2017162046A (en) Sensor data processing apparatus, sensor data processing system, sensor data processing method, and sensor data processing program
US10372719B2 (en) Episode mining device, method and non-transitory computer readable medium of the same
CN112685799B (en) Device fingerprint generation method and device, electronic device and computer readable medium
CN113296990B (en) Method and device for recognizing abnormity of time sequence data
JP6213665B2 (en) Information processing apparatus and clustering method
JP2018190280A (en) Data processing apparatus, data processing method, program, and data structure
JP6295850B2 (en) Information processing apparatus, information processing method, and information processing program
WO2016143337A1 (en) Information processing device, information processing method, and recording medium

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170511

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190610

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201112

R150 Certificate of patent or registration of utility model

Ref document number: 6795448

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150