JP5219783B2 - Unauthorized access detection device, unauthorized access detection program, recording medium, and unauthorized access detection method - Google Patents

Unauthorized access detection device, unauthorized access detection program, recording medium, and unauthorized access detection method Download PDF

Info

Publication number
JP5219783B2
JP5219783B2 JP2008326805A JP2008326805A JP5219783B2 JP 5219783 B2 JP5219783 B2 JP 5219783B2 JP 2008326805 A JP2008326805 A JP 2008326805A JP 2008326805 A JP2008326805 A JP 2008326805A JP 5219783 B2 JP5219783 B2 JP 5219783B2
Authority
JP
Japan
Prior art keywords
profile
prediction
accesses
profiles
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008326805A
Other languages
Japanese (ja)
Other versions
JP2010152431A (en
Inventor
裕之 榊原
誠司 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2008326805A priority Critical patent/JP5219783B2/en
Publication of JP2010152431A publication Critical patent/JP2010152431A/en
Application granted granted Critical
Publication of JP5219783B2 publication Critical patent/JP5219783B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、アクセス数の時系列データをプロファイルとして用いてアクセス数の異常検知を行うAnomaly検知を実行する不正アクセス検知装置、不正アクセス検知プログラム、不正アクセス検知方法に関する。   The present invention relates to an unauthorized access detection apparatus, an unauthorized access detection program, and an unauthorized access detection method for executing anomaly detection for detecting an access number abnormality using time-series data of the number of accesses as a profile.

ネットワーク上の不正アクセス発生の検知手段として、正常な状態のアクセス数をプロファイルとして定義・学習し、観測されたアクセス数がプロファイルから逸脱していることを検出する方法がある。これをAnomaly検知という。このようなネットワークの時系列データの分析において、正常な状態のアクセス数の傾向が設備の変更などにより変動する場合がある。変動後は、変動前に定義したプロファイルを使用すると正しく分析できないため、変動後の正常な状態のアクセス数をプロファイルとして再学習することが一般的である。再学習の期間は分析が行えないため、再学習期間を短縮するために予測プロファイルを生成し分析を継続する技術として特許文献1がある。この方式を使用すれば、例えば、最低1週間必要だった再学習期間が1日以下に短縮できる。
特開2008−146157号公報、ネットワーク異常判定装置
As a means for detecting the occurrence of unauthorized access on the network, there is a method of defining and learning the number of accesses in a normal state as a profile and detecting that the observed number of accesses deviates from the profile. This is called anomaly detection. In the analysis of time series data of such a network, the tendency of the number of accesses in a normal state may fluctuate due to a change in equipment. After the change, the profile defined before the change cannot be correctly analyzed, so that the number of accesses in the normal state after the change is generally relearned as a profile. Since the analysis cannot be performed during the relearning period, Patent Document 1 discloses a technique for generating a prediction profile and continuing the analysis in order to shorten the relearning period. If this method is used, for example, the relearning period required for at least one week can be shortened to one day or less.
JP 2008-146157 A, Network Abnormality Determination Device

特許文献1では、正常な状態のアクセス数の時系列データが変動した後、1つの予測プロファイルのみを使用する。予測プロファイルが実測値よりも大きく生成されれば、実測値が予測プロファイルに隠れて検知漏れが発生し、小さく生成されていれば実測値が予測プロファイルよりも飛び出るため誤検知が発生するという課題があった。また、正常な状態のアクセス数の週内変動などは予測プロファイルに反映していないため、週内変動などがあるデータに対して予測プロファイルが適切ではなく、分析の精度に影響する場合があるという課題があった。   In Patent Document 1, only one prediction profile is used after time-series data of the number of accesses in a normal state fluctuates. If the predicted profile is generated larger than the actual measured value, the actual measured value is hidden behind the predicted profile and a detection failure occurs.If the predicted profile is generated smaller, the actual measured value pops out from the predicted profile, resulting in false detection. there were. In addition, since fluctuations in the number of accesses in the normal state within the week are not reflected in the prediction profile, the prediction profile is not appropriate for data with fluctuations within the week, which may affect the accuracy of the analysis. There was a problem.

この発明は、誤検知の発生が少なく、また、週内変動がある場合にも適切である予測プロファイルを生成する不正アクセス検知装置の提供を目的とする。   An object of the present invention is to provide an unauthorized access detection apparatus that generates a prediction profile that is less likely to cause erroneous detection and that is appropriate even when there is a variation within a week.

この発明の不正アクセス検知装置は、
アクセス数の時系列データをプロファイルとして用いてアクセス数の異常検知を行うAnomaly検知を実行する不正アクセス検知装置において、
正常と認められる過去のアクセス数からなる正常時系列データと、前記正常時系列データの改変に使用する改変情報とを入力し、所定の生成規則に従うことにより、前記改変情報を使用して前記正常時系列データから将来のアクセス数の異常検知に使用する使用プロファイルの候補となる複数の予測プロファイルを生成する予測プロファイル生成部と、
前記予測プロファイル生成部によって生成された前記複数の予測プロファイルのなかから、所定の決定基準に合致する予測プロファイルを前記使用プロファイルとして決定する使用プロファイル決定部と
を備えたことを特徴とする。
The unauthorized access detection device of the present invention
In an unauthorized access detection apparatus that performs anomaly detection for detecting an abnormality in the number of accesses using time-series data of the number of accesses as a profile,
Input normal time-series data consisting of the number of past accesses recognized as normal and modification information used for modification of the normal time-series data, and follow the predetermined generation rules to use the normal information using the modification information. A prediction profile generation unit that generates a plurality of prediction profiles that are candidates for use profiles to be used for detecting an abnormality in the number of future accesses from time-series data;
And a usage profile determination unit that determines, as the usage profile, a prediction profile that matches a predetermined determination criterion from among the plurality of prediction profiles generated by the prediction profile generation unit.

この発明により、誤検知の発生が少ない予測プロファイルを生成する不正アクセス検知装置を提供できる。   According to the present invention, it is possible to provide an unauthorized access detection apparatus that generates a prediction profile with less occurrence of erroneous detection.

実施の形態1.
図1〜図20を用いて実施の形態1を説明する。
Embodiment 1 FIG.
The first embodiment will be described with reference to FIGS.

図1は、コンピュータで実現される不正アクセス検知装置100の外観の一例を示す図である。図1において、不正アクセス検知装置100は、システムユニット830、CRT(Cathode・Ray・Tube)やLCD(液晶)の表示画面を有する表示装置813、キーボード814(Key・Board:K/B)、マウス815、FDD817(Flexible・Disk・ Drive)、コンパクトディスク装置818(CDD:Compact Disk Drive)、プリンタ装置819などのハードウェア資源を備え、これらはケーブルや信号線で接続されている。システムユニット830はネットワークに接続している。   FIG. 1 is a diagram showing an example of the appearance of an unauthorized access detection device 100 realized by a computer. In FIG. 1, an unauthorized access detection device 100 includes a system unit 830, a display device 813 having a CRT (Cathode / Ray / Tube) or LCD (liquid crystal) display screen, a keyboard 814 (Key / Board: K / B), a mouse. 815, FDD817 (Flexible Disk Drive), compact disk device 818 (CDD: Compact Disk Drive), printer device 819, and the like are provided with hardware resources, and these are connected by cables and signal lines. The system unit 830 is connected to the network.

図2は、コンピュータで実現される不正アクセス検知装置100のハードウェア資源の一例を示す図である。図2において、不正アクセス検知装置100は、プログラムを実行するCPU810(Central Processing Unit:中央処理装置、処理装置ともいう)を備えている。CPU810は、バス825を介してROM(Read Only Memory)811、RAM(Random Access Memory)812、表示装置813、キーボード814、マウス815、通信ボード816、FDD817、CDD818、プリンタ装置819、磁気ディスク装置820と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置820の代わりに、光ディスク装置、フラッシュメモリなどの記憶装置でもよい。   FIG. 2 is a diagram illustrating an example of hardware resources of the unauthorized access detection device 100 realized by a computer. In FIG. 2, the unauthorized access detection device 100 includes a CPU 810 (Central Processing Unit: also called a central processing unit or processing device) that executes a program. The CPU 810 is connected to a ROM (Read Only Memory) 811, a RAM (Random Access Memory) 812, a display device 813, a keyboard 814, a mouse 815, a communication board 816, an FDD 817, a CDD 818, a printer device 819, and a magnetic disk device 820 via a bus 825. And control these hardware devices. Instead of the magnetic disk device 820, a storage device such as an optical disk device or a flash memory may be used.

RAM812は、揮発性メモリの一例である。ROM811、FDD817、CDD818、磁気ディスク装置820等の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部、格納部、バッファの一例である。通信ボード816、キーボード814、FDD817などは、入力部、入力装置の一例である。また、通信ボード816、表示装置813、プリンタ装置819などは、出力部、出力装置の一例である。   The RAM 812 is an example of a volatile memory. Storage media such as the ROM 811, the FDD 817, the CDD 818, and the magnetic disk device 820 are examples of nonvolatile memories. These are examples of a storage device or a storage unit, a storage unit, and a buffer. The communication board 816, the keyboard 814, the FDD 817, and the like are examples of an input unit and an input device. The communication board 816, the display device 813, the printer device 819, and the like are examples of an output unit and an output device.

通信ボード816は、LAN(Local Area Netwirk)等のネットワークに接続されている。通信ボード816は、LANに限らず、インターネット、ISDN等のWAN(ワイドエリアネットワーク)などに接続されていても構わない。   The communication board 816 is connected to a network such as a LAN (Local Area Network). The communication board 816 may be connected not only to the LAN but also to a WAN (wide area network) such as the Internet or ISDN.

磁気ディスク装置820には、オペレーティングシステム821(OS)、ウィンドウシステム822、プログラム群823、ファイル群824が記憶されている。プログラム群823のプログラムは、CPU810、オペレーティングシステム821、ウィンドウシステム822により実行される。   The magnetic disk device 820 stores an operating system 821 (OS), a window system 822, a program group 823, and a file group 824. The programs in the program group 823 are executed by the CPU 810, the operating system 821, and the window system 822.

上記プログラム群823には、以下に述べる実施の形態の説明において「〜部」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU810により読み出され実行される。   The program group 823 stores a program for executing a function described as “unit” in the description of the embodiment described below. The program is read and executed by the CPU 810.

ファイル群824には、以下に述べる実施の形態の説明において、「使用プロファイル」、「カウント151」、「プロファイル候補」、「予測プロファイル」などとして説明する情報や、「〜の判定結果」、「〜の算出結果」、「〜の選択結果」、「〜の生成結果」、「〜の処理結果」として説明する情報や、データや信号値や変数値やパラメータなどが、「〜ファイル」や「〜データベース」の各項目として記憶されている。「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU810によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示などのCPUの動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。   In the file group 824, information described as “use profile”, “count 151”, “profile candidate”, “prediction profile”, etc., “determination result of”, “ Information described as “calculation result of”, “selection result of”, “generation result of”, “processing result of”, data, signal values, variable values, parameters, etc. ~ "Database" is stored as each item. The “˜file” and “˜database” are stored in a recording medium such as a disk or a memory. Information, data, signal values, variable values, and parameters stored in a storage medium such as a disk or memory are read out to the main memory or cache memory by the CPU 810 via a read / write circuit, and extracted, searched, referenced, compared, and calculated. Used for CPU operations such as calculation, processing, output, printing, and display. Information, data, signal values, variable values, and parameters are temporarily stored in the main memory, cache memory, and buffer memory during the CPU operations of extraction, search, reference, comparison, operation, calculation, processing, output, printing, and display. Is remembered.

また、以下に述べる実施の形態の説明においては、データや信号値は、RAM812のメモリ、FDD817のフレキシブルディスク、CDD818のコンパクトディスク、磁気ディスク装置820の磁気ディスク、その他光ディスク、ミニディスク、DVD(Digital・Versatile・Disk)等の記録媒体に記録される。また、データや信号は、バス825や信号線やケーブルその他の伝送媒体によりオンライン伝送される。   In the description of the embodiments described below, data and signal values are stored in RAM 812 memory, FDD 817 flexible disk, CDD 818 compact disk, magnetic disk device 820 magnetic disk, other optical disks, mini disks, DVD (Digital). -It records on recording media, such as Versatile and Disk. Data and signals are transmitted on-line via the bus 825, signal lines, cables, and other transmission media.

また、以下に述べる実施の形態の説明において、「〜部」として説明するものは、「手段」、「〜回路」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明するものは、ROM811に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU810により読み出され、CPU810により実行される。すなわち、プログラムは、以下に述べる「〜部」としてコンピュータを機能させるものである。あるいは、以下に述べる「〜部」の手順や方法をコンピュータに実行させるものである。   Further, in the description of the embodiments described below, what is described as “to part” may be “means”, “to circuit”, and “to device”, and “to step” and “to”. “Procedure” and “˜Process” may be used. That is, what is described as “˜unit” may be realized by firmware stored in the ROM 811. Alternatively, it may be implemented only by software, or only by hardware such as elements, devices, substrates, and wirings, by a combination of software and hardware, or by a combination of firmware. Firmware and software are stored as programs in a recording medium such as a magnetic disk, a flexible disk, an optical disk, a compact disk, a mini disk, and a DVD. The program is read by the CPU 810 and executed by the CPU 810. That is, the program causes the computer to function as “to part” described below. Alternatively, the procedure or method of “to part” described below is executed by a computer.

図3は、実施の形態1における不正アクセス検知装置100の構成図である。図3に示すように、不正アクセス検知装置100は、データ取得部101、集計部102、分析部103、プロファイル定義部104、予測プロファイル生成部105、プロファイル選択部106を備える。また、分析部103は、カウント処理部1031、プロファイル処理部1032、演算部1033、逸脱確認部1034を備える。プロファイル定義部104は、使用プロファイル蓄積部1041、カウント蓄積部1042、プロファイル候補蓄積部1043を備える。予測プロファイル生成部105は、差異定義部1051、差異反映部1052を備える。   FIG. 3 is a configuration diagram of the unauthorized access detection device 100 according to the first embodiment. As illustrated in FIG. 3, the unauthorized access detection apparatus 100 includes a data acquisition unit 101, a totaling unit 102, an analysis unit 103, a profile definition unit 104, a prediction profile generation unit 105, and a profile selection unit 106. The analysis unit 103 includes a count processing unit 1031, a profile processing unit 1032, a calculation unit 1033, and a departure confirmation unit 1034. The profile definition unit 104 includes a use profile storage unit 1041, a count storage unit 1042, and a profile candidate storage unit 1043. The prediction profile generation unit 105 includes a difference definition unit 1051 and a difference reflection unit 1052.

また、プロファイル選択部106と分析部103とは、後述のように複数の予測プロファイルの中から使用プロファイルとするべき予測プロファイルを決定する使用プロファイル決定部を構成する。   In addition, the profile selection unit 106 and the analysis unit 103 constitute a usage profile determination unit that determines a prediction profile to be used from a plurality of prediction profiles, as will be described later.

図3において、
(1)データ取得部101は、ネットワーク機器のログ150を取り込む。
(2)集計部102は、ネットワーク機器のログ150から、特定の集計期間における特定条件下の集計値をカウント151として出力する。
(3)分析部103は、プロファイル定義部104からプロファイル152を受け取り、特定の統計分析によりカウント151がプロファイル152に対して異常か否か分析する。
(4)プロファイル定義部104は、正常状態のカウントの集合であるプロファイルを保持する。
(5)予測プロファイル生成部105は、プロファイル152と、アクセス数の変動後のアクセス数の平均予測値などの環境変化情報161から、予測プロファイル154を1つ以上生成する。
(6)プロファイル選択部106は、複数生成された予測プロファイルを用いて分析した複数の分析結果から、最適な予測プロファイルを判定し、その結果である選択された予測プロファイル156をプロファイル定義部104に通知する。
In FIG.
(1) The data acquisition unit 101 captures the network device log 150.
(2) The totaling unit 102 outputs the total value under a specific condition in a specific total period as a count 151 from the log 150 of the network device.
(3) The analysis unit 103 receives the profile 152 from the profile definition unit 104 and analyzes whether the count 151 is abnormal with respect to the profile 152 by specific statistical analysis.
(4) The profile definition unit 104 holds a profile that is a set of counts in a normal state.
(5) The prediction profile generation unit 105 generates one or more prediction profiles 154 from the profile 152 and the environment change information 161 such as the average predicted value of the number of accesses after the change in the number of accesses.
(6) The profile selection unit 106 determines an optimal prediction profile from a plurality of analysis results analyzed using a plurality of generated prediction profiles, and the selected prediction profile 156 as a result thereof is sent to the profile definition unit 104. Notice.

(A:学習の動作)
図4は学習動作を示すシーケンスである。図3、図4を参照して、学習の動作について説明する。不正アクセス検知装置100における検知開始前の準備動作を「学習」と呼ぶ。データ取得部101は、正常な状態として扱う期間のネットワークトラフィックデータ(例えば、ネットワーク機器のログ150を1週間分)を受信し(S101)、集計部102に渡す(S102)。ネットワークトラフィックデータとして、例えば、図5の様なIDS(Intrusion Detection System)のログファイルを取り込む。
(A: Learning action)
FIG. 4 is a sequence showing the learning operation. The learning operation will be described with reference to FIGS. The preparatory operation before the start of detection in the unauthorized access detection device 100 is referred to as “learning”. The data acquisition unit 101 receives network traffic data (for example, the log 150 of the network device for one week) for a period treated as a normal state (S101), and passes it to the aggregation unit 102 (S102). As the network traffic data, for example, an IDS (Intrusion Detection System) log file as shown in FIG. 5 is fetched.

次に集計部102は、データ取得部101から受け取ったネットワークトラフィックデータ(ログ150)から、時系列データを生成する(S103)。図6は集計部102が生成した時系列データ(概念図)の一例を示している。ここでは、例として宛先ポートが445のアクセス数の時系列データを生成する。集計部102は、定められた集計時間、例えば5分間において、そのログ中の、「宛先ポート445のアクセスの出現個数」を数え上げる。これを集計時間毎に順に行うと、宛先ポート445のアクセス数の時系列データが生成できる。   Next, the totaling unit 102 generates time-series data from the network traffic data (log 150) received from the data acquisition unit 101 (S103). FIG. 6 shows an example of time-series data (conceptual diagram) generated by the counting unit 102. Here, as an example, time-series data of the number of accesses with a destination port of 445 is generated. The totaling unit 102 counts the “number of appearances of access to the destination port 445” in the log during a predetermined totaling time, for example, 5 minutes. If this is performed in order for each total time, time-series data of the number of accesses of the destination port 445 can be generated.

例えば、図5のログの例であれば、「06/04/18、12:00」から5分間の間にDstPort(宛先)445は3個の出現個数である。この作業を5分ごとに行えば、宛先ポート445について5分集計のアクセス数の時系列データが生成される。ここで、集計値=その集計期間におけるアクセス数である。ログデータが1週間分であれば、60分×24時間×7日=10080分の期間であり、5分で割れば2016個の集計値から構成されるアクセス数の時系列データが得られる。このようにして得られた時系列データをグラフ化したのが、図6である。横軸は時刻(集計タイミング)、縦軸はアクセス数を示している。   For example, in the example of the log in FIG. 5, DstPort (destination) 445 is the number of appearances for 3 minutes from “06/04/18, 12:00” for 5 minutes. If this operation is performed every 5 minutes, the time-series data of the access count of the 5-minute count is generated for the destination port 445. Here, the total value = the number of accesses in the total period. If the log data is for one week, it is a period of 60 minutes × 24 hours × 7 days = 1,080 minutes, and if divided by 5 minutes, time-series data of the number of accesses composed of 2016 total values is obtained. FIG. 6 is a graph of the time series data obtained in this way. The horizontal axis represents time (aggregation timing), and the vertical axis represents the number of accesses.

この様にして集計部102により得られたアクセス数の時系列データは、図7の時系列データ157のような集計時刻、集計間隔、集計値(アクセス数)のフォーマットで列挙されたデータとして扱う。   The time series data of the number of accesses obtained in this way by the totaling unit 102 is handled as data enumerated in the format of the total time, total interval, and total value (number of accesses) like the time series data 157 of FIG. .

集計部102は、時系列データ157をプロファイル定義部104に渡す(S104)。プロファイル定義部104は、時系列データ157を使用プロファイル蓄積部1041にプロファイルとして保存する。ここでは、図8の様に、現在のプロファイル201として蓄積される(S105)。   The aggregation unit 102 passes the time series data 157 to the profile definition unit 104 (S104). The profile definition unit 104 stores the time series data 157 as a profile in the usage profile storage unit 1041. Here, as shown in FIG. 8, the current profile 201 is stored (S105).

(B:検知動作)
図9は検知動作を示すシーケンスである。図9を参照して、プロファイルを用いた検知動作について説明する。データ取得部101は、ネットワーク機器のログ150を5分間ぶん新たに受信し(S201)、集計部102に渡す(S202)。
(B: Detection operation)
FIG. 9 is a sequence showing the detection operation. A detection operation using a profile will be described with reference to FIG. The data acquisition unit 101 newly receives the network device log 150 for five minutes (S201), and passes it to the counting unit 102 (S202).

集計部102は、集計条件に従い集計を行う。集計条件としては、例えば、宛先ポート445の5分間のアクセス数の集計を行う(S203)。集計の結果は、「カウント151」として分析部103に渡す(S204)。図5を例に示せば、「06/04/18、12:00」から5分間の間に宛先ポート445は3個の出現個数であり、出現個数=集計値がアクセス数に該当する。図10にカウント151のフォーマットを示す。   The aggregation unit 102 performs aggregation according to the aggregation condition. As the aggregation condition, for example, the number of accesses for 5 minutes of the destination port 445 is aggregated (S203). The result of the aggregation is passed to the analysis unit 103 as “count 151” (S204). For example, in FIG. 5, the destination port 445 has three appearances in 5 minutes from “06/04/18, 12:00”, and the number of appearances = total value corresponds to the number of accesses. FIG. 10 shows the format of the count 151.

分析部103では、以下の処理を行う。カウント151がプロファイル定義部104の使用プロファイル蓄積部1041に保存さているプロファイルと比較し、統計的に異常か否かを分析する(S205)。分析の方法は、3σ法や、主成分分析、AutoRegressiveMovingAverageモデルなどがあるが、ここでは、ある特定のアルゴリズムを使用するものとする。   The analysis unit 103 performs the following processing. The count 151 is compared with the profile stored in the usage profile storage unit 1041 of the profile definition unit 104, and whether or not it is statistically abnormal is analyzed (S205). The analysis method includes a 3σ method, a principal component analysis, an AutoRegressive MovingAverage model, and the like. Here, a specific algorithm is used.

分析部103は、カウント151が統計的に異常であれば、異常として、検知結果153を出力する。それ以外は正常として検知結果153を出力する。   If the count 151 is statistically abnormal, the analysis unit 103 outputs the detection result 153 as abnormal. Otherwise, the detection result 153 is output as normal.

(C:検知動作の詳細)
図11は分析部103における検知動作の詳細を示すシーケンスである。図11を参照して、分析部103における検知動作の詳細を説明する。図11において、プロファイル152は、使用プロファイル蓄積部1041における現在のプロファイル201であり、プロファイル処理部1032に入力される(S2051)。分析対象であるカウント151はカウント処理部1031に入力される(S2052)。
(C: Details of detection operation)
FIG. 11 is a sequence showing details of the detection operation in the analysis unit 103. The details of the detection operation in the analysis unit 103 will be described with reference to FIG. In FIG. 11, a profile 152 is the current profile 201 in the usage profile storage unit 1041, and is input to the profile processing unit 1032 (S2051). The count 151 to be analyzed is input to the count processing unit 1031 (S2052).

例として、統計分析のアルゴリズムを3σ法とする。   As an example, the algorithm of statistical analysis is a 3σ method.

プロファイル処理部1032では、使用プロファイル蓄積部1041から渡されたプロファイル152(現在のプロファイル201、この例では図8に示す3月の1ヶ月間のもの)から、時系列データ(ここでは、集計値の羅列)とその構成数を計算する(S2053)。時系列データは、9、2、15、・・・、11である。その構成数は3月の5分毎の集計なので12×24×31=8928であり、集計値の値が記録された行数に一致する。これらを、演算部1033に入力する(S2054)。   In the profile processing unit 1032, time-series data (here, the aggregated value) is obtained from the profile 152 (current profile 201, in this example, one month of March shown in FIG. 8) passed from the usage profile storage unit 1041. And the number of components thereof are calculated (S2053). Time series data are 9, 2, 15,. Since the number of components is totaled every 5 minutes in March, it is 12 × 24 × 31 = 8928, and the value of the total value matches the number of rows recorded. These are input to the calculation unit 1033 (S2054).

カウント処理部1031は、この例ではカウント151のフォーマットから集計値(xとする)のみを取り出し、演算部1033に入力する(S2055)。図10の例であれば、x=3である。   In this example, the count processing unit 1031 extracts only the total value (x) from the format of the count 151 and inputs it to the calculation unit 1033 (S2055). In the example of FIG. 10, x = 3.

演算部1033は、プロファイル処理部1032からの時系列データとその個数から、その平均μ、分散σを計算し(S2056)、カウント処理部1031から取得した集計値xと共に、逸脱確認部1034に入力する(S2057)。 The computing unit 1033 calculates the average μ and variance σ 2 from the time series data from the profile processing unit 1032 and the number thereof (S2056), and sends the total value x acquired from the count processing unit 1031 to the deviation confirmation unit 1034. Input (S2057).

逸脱確認部1034は、μ+3σ<xであるかを確認(S2058)し、検知結果を出力する(S2059)。逸脱条件を満たせば逸脱として判定し、異常検知を示す情報を出力する。逸脱条件を満たさない場合は正常を示す情報を出力する。これが検知結果153である。検知結果153は、例えば、異常検知の場合は1、正常の場合は0で表す。   The departure confirmation unit 1034 confirms whether μ + 3σ <x (S2058), and outputs the detection result (S2059). If the departure condition is satisfied, it is determined as departure and information indicating abnormality detection is output. When the deviation condition is not satisfied, information indicating normality is output. This is the detection result 153. The detection result 153 is represented by 1 for abnormality detection and 0 for normal detection, for example.

ここでは、演算部1033による統計分析のアルゴリズムが3σの場合について説明したが、他の統計分析のアルゴリズムでも、入力されたカウント151をカウント処理部1031で前記他の統計分析のアルゴリズムに適した形に前処理し、、またプロファイル152をプロファイル処理部1032で前記他の統計分析のアルゴリズムに適した形に前処理し、演算部1033で前記他の統計分析のアルゴリズムで処理し、その結果を逸脱確認部1034でプロファイルから逸脱しているか判定する。統計分析のアルゴリズムによりこれらの構成要素の処理が変わるが、基本的な役割は以上に述べたとおりである。   Here, the case where the statistical analysis algorithm by the arithmetic unit 1033 is 3σ has been described. However, in another statistical analysis algorithm, the input count 151 is converted into a form suitable for the other statistical analysis algorithm by the count processing unit 1031. The profile 152 is preprocessed in a form suitable for the other statistical analysis algorithm by the profile processing unit 1032 and processed by the other statistical analysis algorithm by the arithmetic unit 1033, and the result is deviated. The confirmation unit 1034 determines whether the profile deviates. The processing of these components varies depending on the algorithm of statistical analysis, but the basic role is as described above.

当動作を、06/04/18、12:05以降も、5分おきにログを取り込み、5分おきに集計されたカウント151に対して逸脱確認を行う。その場合、プロファイルは毎回の動作において同じである。すなわち、プロファイルの分析(平均μ、分散σの算出)は最初に算出したものを使用し、各集計値Xについて逸脱判定を行う。以上が、プロファイルを使用した異常検知動作である。 In this operation as well, after 06/04/18, 12:05, logs are taken every 5 minutes and the deviation is confirmed against the count 151 counted every 5 minutes. In that case, the profile is the same in every operation. That is, profile analysis (calculation of average μ and variance σ 2 ) uses the first calculation and performs deviation determination for each aggregate value X. The above is the abnormality detection operation using the profile.

前述の図8は、分析を継続している間のプロファイル定義部104の内部状態を示している。プロファイル定義部104はカウント151を集計の都度受け取り、カウント蓄積部1042に蓄積する(蓄積カウント202)。例えば、4月の1ヶ月間において分析を実施している場合、カウント151を継続的に蓄積することで、4月の全てのアクセス数の時系列データをカウント蓄積部1042に保持することになる。4月に検知が発生しなければ、この時系列データを4月のプロファイル203としてプロファイル候補蓄積部1043に保存する。このプロファイル候補蓄積部1043に保存された時系列データは後述するように、予測プロファイルの生成に使用される。   FIG. 8 described above shows the internal state of the profile definition unit 104 while the analysis is continued. The profile definition unit 104 receives the count 151 every time it is aggregated, and accumulates it in the count accumulation unit 1042 (accumulation count 202). For example, when the analysis is performed for one month in April, the time series data of all the number of accesses in April is held in the count accumulation unit 1042 by continuously accumulating the count 151. . If no detection occurs in April, the time series data is stored in the profile candidate accumulation unit 1043 as the April profile 203. The time series data stored in the profile candidate accumulation unit 1043 is used for generating a prediction profile, as will be described later.

次に、設備変更などにより監視対象のネットワーク上の計算機の数が変動するなど、正常な状態のアクセス数の時系列データが変動する場合の分析について説明する。   Next, a description will be given of an analysis when the time-series data of the number of accesses in a normal state fluctuates, for example, the number of computers on the monitored network fluctuates due to equipment change or the like.

例えばWindows(登録商標)を搭載した計算機の数が増加する場合、Windows(登録商標)の通信が利用する宛先ポート445のアクセスも増加する。もし、宛先ポート445のプロファイルを、計算機の増加前と同じものを使用していた場合、計算機の増加後の分析において正常な宛先ポート445のアクセスの増加が異常として分析される可能性がある。なぜならば、計算機の増加後に宛先ポート445のアクセスが増加しており、現在使用しているプロファイルと比較した場合に増加している状態なので分析部103は、統計的に異常と判断するからである。   For example, when the number of computers equipped with Windows (registered trademark) increases, the access of the destination port 445 used by the communication of Windows (registered trademark) also increases. If the same profile of the destination port 445 as before the increase of the computers is used, there is a possibility that the increase in the access of the normal destination port 445 is analyzed as an abnormality in the analysis after the increase of the computers. This is because the access of the destination port 445 has increased after the increase in the number of computers, and the analysis unit 103 determines that it is statistically abnormal because it is increasing when compared with the profile currently used. .

図12を例に挙げると、「5/1(木曜日)、00:00」に設備変更があり、宛先ポート445のアクセス数が4月と比較して増加している。現在使用している使用プロファイル(3月の時系列データ)に対して4月のアクセス数は異常ではない(不正アクセスではない)が、4月よりも5月は増加しているため、分析部103によって現在使用しているプロファイルと比較した場合に異常と判断される。   Taking FIG. 12 as an example, there is a facility change at “5/1 (Thursday), 00:00”, and the number of accesses to the destination port 445 is increased compared to April. The number of accesses in April is not abnormal (not unauthorized access) for the current usage profile (time series data in March), but it has increased in May than in April. 103 is determined to be abnormal when compared with the currently used profile.

ここで、設備変更により計算機が10台から100台に増えたとする。例として分析アルゴリズムとして3σ法を利用している場合、計算機の数が増える前は「平均10アクセス/5分、標準偏差2」であったものが、計算機の数が増えたことにより、「平均100アクセス/5分、標準偏差10」になったとする。計算機の増加する前のプロファイルに基づけば、正常なアクセス数の範囲は(10+3×σ)/5分、σ=2であり、これに対して計算機増加後の平均アクセス数100/5分を比較すると、異常と判断される。   Here, it is assumed that the number of computers has increased from 10 to 100 due to the equipment change. As an example, when the 3σ method is used as an analysis algorithm, before the number of computers increased, it was “average 10 accesses / 5 minutes, standard deviation 2”, but the number of computers increased. Assume that the standard deviation is 10 "for 100 accesses / 5 minutes. Based on the profile before the increase of computers, the range of normal access is (10 + 3 × σ) / 5 min, σ = 2, and the average access count after computer increase is compared with 100/5 min Then, it is judged as abnormal.

この様に、設備の変更など、不正アクセスではない原因によりアクセス数が増加した場合は、異常として検知するべきではない。従って、この場合は、プロファイル自体も計算機の増加を考慮したプロファイルに変更する必用がある。   In this way, when the number of accesses increases due to non-illegal access such as a change in equipment, it should not be detected as abnormal. Therefore, in this case, it is necessary to change the profile itself to a profile that takes into account the increase in computers.

例えば、5/1(木)において、設備変更として監視対象の計算機数が10台から100台に増えるとする。この場合、月間の宛先ポート445の平均アクセス数は計算機が増加した分比例して増加するとして、このシステム外において予め平均アクセス数の予測が分かっているとする。この様に設備変更後の平均アクセス数の予測がたっている場合は、平均アクセス数の予測値を利用し予測プロファイルを生成する。   For example, in 5/1 (Thu), it is assumed that the number of computers to be monitored increases from 10 to 100 as equipment change. In this case, it is assumed that the average number of accesses of the destination port 445 per month increases in proportion to the increase in the number of computers, and the prediction of the average number of accesses is known in advance outside this system. In this way, when the average access count after the equipment change is predicted, a prediction profile is generated using the predicted value of the average access count.

(D:予測プロファイルの生成動作)
図13は予測プロファイルの生成過程を示すシーケンスである。図13を参照して予測プロファイルの生成を説明する。差異定義部1051は、、5/1(木曜日)、0時に5月の宛先ポート445宛の平均アクセス数の予測値を環境変化情報161(改変情報の一例)として予め受け取る(S301)。例えば、キーボードなどの入力装置から環境変化情報161を入力する。この場合、予測値である平均アクセス数が100であるとする。
(D: Prediction profile generation operation)
FIG. 13 is a sequence showing a process of generating a prediction profile. The generation of the prediction profile will be described with reference to FIG. The difference definition unit 1051 receives in advance, as environment change information 161 (an example of modification information), an estimated value of the average access count addressed to the destination port 445 in May at 0/1 (Thursday) at 0 o'clock (S301). For example, the environment change information 161 is input from an input device such as a keyboard. In this case, it is assumed that the average number of accesses, which is a predicted value, is 100.

(予測プロファイル生成部105の動作)
予測プロファイル生成部105の差異定義部1051は、プロファイル定義部104のプロファイル候補蓄積部1043が保存している4月のプロファイル203(正常時系列データの一例)を受け取り(S302)、平均値を求める(S303)。図3に示したように、4月のプロファイル203は、プロファイル152として渡される。ここで、4月の平均値が10(10/5分)であったとする。次にこの平均値と5月の予測アクセス数の差Δ(100−10=90)を求める(S304)。これを差異10551とする。差異定義部1051は、差異10551を差異反映部1052に渡す(S305)。
(Operation of prediction profile generation unit 105)
The difference definition unit 1051 of the prediction profile generation unit 105 receives the April profile 203 (an example of normal time series data) stored in the profile candidate accumulation unit 1043 of the profile definition unit 104 (S302), and obtains an average value. (S303). As shown in FIG. 3, the April profile 203 is passed as a profile 152. Here, it is assumed that the average value in April is 10 (10/5 minutes). Next, a difference Δ (100−10 = 90) between the average value and the predicted number of accesses in May is obtained (S304). This is designated as a difference 10551. The difference defining unit 1051 passes the difference 10551 to the difference reflecting unit 1052 (S305).

(差異反映部1052の動作)
図14に示すように、予測プロファイル生成部105の差異反映部1052は、4月のプロファイル203の全ての集計時刻のカウントに差異10551であるΔ(90)を足して、変動後の予測プロファイルを生成する(S306)。図14では、4月のプロファイル203のフォーマットにおいて、各集計値にΔを足したデータを予測プロファイルとして生成する。
(Operation of the difference reflection unit 1052)
As shown in FIG. 14, the difference reflection unit 1052 of the prediction profile generation unit 105 adds Δ (90) that is the difference 10551 to the count of all count times of the April profile 203 to obtain a predicted profile after change. Generate (S306). In FIG. 14, in the format of the April profile 203, data obtained by adding Δ to each total value is generated as a prediction profile.

ここで、複数のプロファイルを生成するため、差異反映部1052は、Δを0.5倍〜2.0倍まで0.1刻みで計算した0.5*Δ〜2.0*Δを用意し、4月のプロファイル203にこれらを足したものを複数のプロファイルとして生成する(所定の生成規則の一例)。例えば、図15において、予測プロファイル1は、4月のプロファイル203に0.5*Δを足したものである。   Here, in order to generate a plurality of profiles, the difference reflection unit 1052 prepares 0.5 * Δ to 2.0 * Δ obtained by calculating Δ in increments of 0.1 from 0.5 times to 2.0 times. A profile obtained by adding these to the April profile 203 is generated as a plurality of profiles (an example of a predetermined generation rule). For example, in FIG. 15, the prediction profile 1 is obtained by adding 0.5 * Δ to the profile 203 in April.

図16は、0.5*Δ〜2.0*Δを生成する処理を示すフローチャートである。このフローチャートでは、j=1の場合が、0.5*Δの生成(Δ1)、j=16の場合が、2.0*Δの生成(Δ16)に相当する。   FIG. 16 is a flowchart showing a process for generating 0.5 * Δ to 2.0 * Δ. In this flowchart, the case of j = 1 corresponds to the generation of 0.5 * Δ (Δ1), and the case of j = 16 corresponds to the generation of 2.0 * Δ (Δ16).

図17は、予測プロファイル1〜16を生成する処理を示すフローチャートである。Ciは4月のプロファイル203の集計値であり、5分集計で30日なので、データの数は、8640個である。このフローチャートでは、j=1の場合に出力されるX(i,1)(iは1〜8640)が予測プロファイル1の生成であり、j=16の場合に出力されるX(i,16)(iは1〜8640)が予測プロファイル16に相当する。4月のプロファイル203の、「集計時刻、集計間隔、該当する集計値に対してΔjを足した値」、をProf_jに保存する。図18は、Prof_1の例を示す図である。   FIG. 17 is a flowchart illustrating a process for generating the prediction profiles 1 to 16. Ci is the total value of the profile 203 in April, and since it is 30 days by totaling 5 minutes, the number of data is 8640. In this flowchart, X (i, 1) (i is 1 to 8640) output when j = 1 is the generation of the prediction profile 1, and X (i, 16) output when j = 16. (I is 1 to 8640) corresponds to the prediction profile 16. “A total time, a total interval, and a value obtained by adding Δj to the corresponding total value” of the April profile 203 are stored in Prof_j. FIG. 18 is a diagram illustrating an example of Prof_1.

(E:最適な予測プロファイル選択の動作)
図19は最適な予測プロファイルの選択動作を示すシーケンスである。図19を参照して、5/1(木)00:05以降における不正アクセス検知装置の動作を説明する。5/1、00:05において、データ取得部101は、ネットワーク機器のログ150(5分間ぶん)を受け取り(S401)、集計部0102に出力する(S402)。集計部102は宛先ポート445の5分間のアクセス数を集計し(S403)、カウント151として出力する(S404)。分析部103のプロファイル処理部1032は、差異反映部1052から複数の予測プロファイルを受け取る(S405)。
(E: Operation for selecting the optimal prediction profile)
FIG. 19 is a sequence showing the selection operation of the optimum prediction profile. The operation of the unauthorized access detection device after 5/1 (Thursday) 00:05 will be described with reference to FIG. At 5/1, 00:05, the data acquisition unit 101 receives the network device log 150 (5 minutes) (S401), and outputs it to the counting unit 0102 (S402). The totaling unit 102 totals the number of accesses for 5 minutes of the destination port 445 (S403), and outputs it as a count 151 (S404). The profile processing unit 1032 of the analysis unit 103 receives a plurality of prediction profiles from the difference reflection unit 1052 (S405).

分析部103は、カウント151(図20におけるi=1相当)に対して、予測プロファイル生成部105から受け取った複数の予測プロファイル154(図20におけるj=1〜16)を用いて分析する。当例では、予測プロファイルは、予測プロファイル1〜16の16個である。   The analysis unit 103 analyzes the count 151 (corresponding to i = 1 in FIG. 20) using a plurality of prediction profiles 154 (j = 1 to 16 in FIG. 20) received from the prediction profile generation unit 105. In this example, the prediction profiles are 16 prediction profiles 1 to 16.

まず、分析部103で使用している統計分析のアルゴリズムを用いて、予測プロファイル1の予測プロファイルを用いて分析する。次に、予測プロファイル2を用いて分析する(S406)。内容は図11の検知動作の場合と同様である。すなわち、図19のS406−1において、演算部1033は、予測プロファイル1〜16を統計処理し、それぞれについて平均μ、分散σを算出する。S406−2において、逸脱確認部1034は、予測プロファイル1〜16を対象として、カウント151の値が異常かどうかを「μ+3σ<x」の式により判定する。この様にして、予測プロファイル16を用いた分析まで繰り返し行う。 First, analysis is performed using the prediction profile of the prediction profile 1 using the statistical analysis algorithm used in the analysis unit 103. Next, it analyzes using the prediction profile 2 (S406). The contents are the same as those in the detection operation of FIG. That is, in S406-1 of FIG. 19, the calculation unit 1033 performs statistical processing on the prediction profiles 1 to 16, and calculates the average μ and the variance σ 2 for each. In S <b> 406-2, the departure confirmation unit 1034 determines whether the value of the count 151 is abnormal for the prediction profiles 1 to 16 using the expression “μ + 3σ <x”. In this way, the analysis using the prediction profile 16 is repeated.

各々の分析の結果(図20におけるR(j,i))は、プロファイル選択部106に予測プロファイルによる分析結果155として送られ(S407)、プロファイル選択部106に蓄積される。以上が、5/1(木)0時00分のカウント151に対する分析であるが、これを、5/1(木)23時59分59秒までの1日のアクセス数のカウントについて行う。蓄積された分析結果155をR(j,i)(j=1〜16、i=1〜288)とする。jは予測プロファイル1〜16を意味し、iは5/1(木)00:05の集計値〜5/2(木)00:00の集計値(5/1(木)23時59分59秒までの集計)288個(1日ぶん)を意味する。   The result of each analysis (R (j, i) in FIG. 20) is sent to the profile selection unit 106 as the analysis result 155 based on the prediction profile (S407) and stored in the profile selection unit 106. The above is the analysis for the count 151 of 5/1 (Thursday) 0:00. This is performed for the count of the number of accesses per day until 5/1 (Thursday) 23:59:59. Assume that the accumulated analysis result 155 is R (j, i) (j = 1 to 16, i = 1 to 288). j means prediction profiles 1 to 16, and i is an aggregate value of 5/1 (Thu) 00:05 to an aggregate value of 5/2 (Thu) 00:00 (5/1 (Thu) 23:59:59 288 counts (per day).

(プロファイル選択部106の選択動作)
5/2(木)00:00において、プロファイル選択部106は自身に蓄積された、R(j,i)を用いて、適切なプロファイルを選択する(S408)。プロファイル選択部106は、1日の分析の間に検知が発生した予測プロファイルは、プロファイルとして適切では無いと判断し削除する。図20は、プロファイル選択部106がプロファイルを削除する処理を示す。図20は、S34、S35、S36,S37と進みS37からS34に戻るループは、ある予測プロファイルを対象とした場合に、各5分ごとのカウント151が異常かどうかを判定する処理である。R(j,i)は分析結果155(異常=1、あるいは正常=0)であり、例えば、予測プロファイル1を使った場合の、5/1(木)0時00分の分析結果155はR(1,1)、5/2(木)0時00分の分析結果はR(1,288)である。Prof_jが予測プロファイルであり、jが予測プロファイルの番号である。つまり、予測プロファイル1はProf_1である。
(Selection operation of profile selection unit 106)
At 5/2 (Thursday) 00:00, the profile selection unit 106 selects an appropriate profile using R (j, i) stored in itself (S408). The profile selection unit 106 determines that the predicted profile that has been detected during the day of analysis is not appropriate as a profile and deletes it. FIG. 20 shows a process in which the profile selection unit 106 deletes a profile. FIG. 20 is a process of determining whether or not the count 151 every five minutes is abnormal when a certain prediction profile is targeted, in the loop that goes from S37 to S34 and goes back to S34. R (j, i) is the analysis result 155 (abnormality = 1 or normal = 0). For example, when the prediction profile 1 is used, the analysis result 155 at 5/1 (Thursday) 0:00 is R The analysis result of (1,1), 5/2 (Thursday) 0:00 is R (1,288). Prof_j is the prediction profile, and j is the number of the prediction profile. That is, the prediction profile 1 is Prof_1.

当処理の結果、例えば、図20において、予測プロファイル1〜予測プロファイル9を用いた分析で異常検知が発生した場合、予測プロファイル1〜9が削除(S39)される。削除する理由は、異常検知が発生した予測プロファイルは、プロファイルとして実測値よりも小さかったため適切では無いからである。   As a result of this processing, for example, when abnormality detection occurs in the analysis using the prediction profiles 1 to 9 in FIG. 20, the prediction profiles 1 to 9 are deleted (S39). The reason for deleting is that the predicted profile in which the abnormality detection has occurred is not appropriate because it is smaller than the actually measured value as the profile.

プロファイル選択部106は、残った予測プロファイルの中において、一番小さいn*Δを採用したプロファイルを、以後予測プロファイルとして利用(決定)する(所定の決定基準の一例)。図15においては、予測プロファイル10を採用する。   The profile selection unit 106 uses (determines) a profile that employs the smallest n * Δ among the remaining prediction profiles as a prediction profile thereafter (an example of a predetermined determination criterion). In FIG. 15, the prediction profile 10 is adopted.

残った予測プロファイルは、検知が発生しない程度の大きさであるが、大きすぎると実測値が隠れて検知しなくなってしまうので、残った予測プロファイルの中で一番小さい予測プロファイルを適切なものとして残す。   The remaining prediction profile is a size that does not cause detection, but if it is too large, the actual measurement value will be hidden and will not be detected, so the smallest prediction profile among the remaining prediction profiles is appropriate. leave.

図3において、上記の様に、選択された予測プロファイル156(この例では予測プロファイル10)がプロファイル選択部106からプロファイル定義部104に渡され、新しい使用プロファイルとして使用プロファイル蓄積部1041に上書き保存され、5/2(木)00:05以降の分析(検知)には、この新しい使用プロファイルが使用される。5月の検知が異常検知の発生が無い場合には、カウント蓄積部1042に蓄積されたカウント151の5月分のデータが、プロファイル候補蓄積部1043にプロファイル候補として格納されるが、同時に、この5月のプロファイル候補は使用プロファイル蓄積部1041に使用プロファイルとして上書きされる。すなわち、6月の分析には、使用プロファイルとして、異常が検知されなかった5月のカウント151(一月ぶん)が使用される。   In FIG. 3, as described above, the selected prediction profile 156 (in this example, the prediction profile 10) is transferred from the profile selection unit 106 to the profile definition unit 104, and overwritten and saved in the use profile storage unit 1041 as a new use profile. This new usage profile is used for analysis (detection) after 5/2 (Thu) 00:05. If there is no abnormality detection in May, the data for May of the count 151 stored in the count storage unit 1042 is stored as profile candidates in the profile candidate storage unit 1043. The May profile candidate is overwritten in the usage profile storage unit 1041 as a usage profile. That is, for the analysis in June, the May count 151 in which no abnormality was detected is used as the usage profile.

本実施の形態1では、変動後のアクセス数が増加することを前提に記述したが、減少する場合でも同じように差異を求めることで、減少後の複数の予測プロファイルを生成し、同じ方法で最適な予測プロファイルを選択することができる。つまり、この場合は、差異10551がマイナスの値をとるだけであり、各部が同じ動作を行うだけで対応できる。   In the first embodiment, the description has been made on the assumption that the number of accesses after fluctuation increases. However, even when the number of accesses decreases, a plurality of reduced prediction profiles are generated by the same method, and the same method is used. An optimal prediction profile can be selected. That is, in this case, the difference 10551 only takes a negative value, and can be dealt with only by performing the same operation for each unit.

以上の様に、実施の形態1では、設備の変動により正常な状態のアクセス数が変動する場合において、予め変動後の平均アクセス数が分かっている場合は、これを利用することにより現在のプロファイルの平均値と比較し、差異を求め、この差異に複数の比率を掛け、現在のプロファイルに反映することで複数の予測プロファイルを生成する。複数の予測プロファイルを用いて設備の変動後の1日のデータを分析し、適切な予測プロファイルを選択することにより、以後の分析において、誤検知や検知漏れを低減できる効果がある。また、予測プロファイルの生成では、現在のプロファイルに差異Δを足す方式をとることにより、現在のプロファイルの周期変動などの傾向を反映した予測プロファイルを生成可能である。   As described above, in the first embodiment, when the number of accesses in a normal state fluctuates due to equipment fluctuations, if the average number of accesses after fluctuation is known in advance, the current profile can be obtained by using this. Are compared with the average value, and a difference is obtained. The difference is multiplied by a plurality of ratios and reflected in the current profile to generate a plurality of prediction profiles. By analyzing the data for one day after the change of equipment using a plurality of prediction profiles and selecting an appropriate prediction profile, it is possible to reduce false detections and omissions in subsequent analysis. Further, in the generation of a prediction profile, a prediction profile reflecting a tendency such as a periodic variation of the current profile can be generated by adding a difference Δ to the current profile.

実施の形態2.
次に図21〜図24を参照して実施の形態2を説明する。実施の形態1では、予め5月の予想平均アクセス数が分かっている場合に、これを利用して予測プロファイルを生成した。実施の形態2では、予測平均アクセス数が分からない場合の実施形態を説明する。
Embodiment 2. FIG.
Next, a second embodiment will be described with reference to FIGS. In the first embodiment, when the expected average number of accesses in May is known in advance, a prediction profile is generated using this. In the second embodiment, an embodiment in which the predicted average access count is not known will be described.

設備変更後の平均アクセス数が予測できない場合は、設備変更後の1日(ある曜日)のデータ(この例では5月1日の一日間のデータ)を観測して実施の形態1の環境変化情報161に相当するデータを算出し、設備変更前の同じ曜日のデータとの差分を用いて、予測プロファイルを生成する。   If the average number of accesses after the equipment change cannot be predicted, the environment change according to the first embodiment is observed by observing data on one day (a day of the week) after the equipment change (in this example, data for one day on May 1). Data corresponding to the information 161 is calculated, and a prediction profile is generated using a difference from data on the same day of the week before the equipment change.

(A:5月1日の一日間の学習動作)
5/1(木曜日)の設備変更後、5/1(木)の一日間のみの学習を行う。この動作は、実施の形態1に示した学習動作であるが、実施の形態2では、集計部102が時系列データ157をプロファイル定義部104に渡す場合、プロファイル定義部104は、時系列データ157をカウント蓄積部1042に保存する。つまりこの場合、図4におけるS105では、時系列データ157がカウント蓄積部1042に保存される。
(A: Learning operation for one day on May 1)
After the equipment change on 5/1 (Thursday), learning will be conducted for only one day on 5/1 (Thursday). This operation is the learning operation shown in the first embodiment. In the second embodiment, when the counting unit 102 passes the time series data 157 to the profile definition unit 104, the profile definition unit 104 uses the time series data 157. Is stored in the count storage unit 1042. That is, in this case, the time series data 157 is stored in the count storage unit 1042 in S105 in FIG.

(B:予測プロファイルの生成の動作)
図21は、実施の形態2における予測プロファイルを生成する動作を示す図である。図21を参照して予測プロファイルの生成動作を説明する。
(B: Prediction profile generation operation)
FIG. 21 is a diagram illustrating an operation of generating a prediction profile in the second embodiment. The prediction profile generation operation will be described with reference to FIG.

プロファイル定義部104は、カウント蓄積部1042に蓄積された時系列データ157(5/1の一日分の288個のデータ)から、5/1(木)の1日のカウントの平均値であるμthr304(改変情報の一例)を計算し、予測プロファイル生成部105の差異定義部1051に渡す(S501)。   The profile definition unit 104 is an average value of the daily count of 5/1 (Thursday) from the time series data 157 (288 data for 5/1 day) stored in the count storage unit 1042. μthr 304 (an example of modification information) is calculated and passed to the difference definition unit 1051 of the prediction profile generation unit 105 (S501).

(差異定義部1051)
次に、予測プロファイル生成部105における差異定義部1051は、プロファイル定義部104からプロファイル候補蓄積部1043が保存している4月のプロファイル203(正常時系列データの一例)を受け取り(S502)、4月における木曜日のカウントである木曜日のカウント301を取り出し、平均値μ’thr303を求める(4/3(木),10(木),17(木),24(木)のアクセス数の平均値)(S503)。
さらに、
Δ=μthr304−μ’thr303
を計算する(S504)。この処理を図22に示す。
差異定義部1051は、このΔを差異10551として差異反映部1052に渡す(S505)。
(Difference definition unit 1051)
Next, the difference definition unit 1051 in the prediction profile generation unit 105 receives the April profile 203 (an example of normal time series data) stored in the profile candidate accumulation unit 1043 from the profile definition unit 104 (S502), 4 The Thursday count 301, which is the Thursday count in the month, is extracted to obtain the average value μ ′ thr 303 (average value of the access counts of 4/3 (Thu), 10 (Thu), 17 (Thu), 24 (Thu)) (S503).
further,
Δ = μthr304−μ′thr303
Is calculated (S504). This process is shown in FIG.
The difference defining unit 1051 passes this Δ as the difference 10551 to the difference reflecting unit 1052 (S505).

(差異反映部1052)
予測プロファイル生成部105における差異反映部1052は、図23に示すように、4月のプロファイル203の全ての時刻のカウントに差異定義部1051から受け取った差異10551であるΔを足して、変動後の予測プロファイルを生成する(S506)。
(Difference reflection unit 1052)
As shown in FIG. 23, the difference reflection unit 1052 in the prediction profile generation unit 105 adds Δ which is the difference 10551 received from the difference definition unit 1051 to the count of all times of the profile 203 in April, and after the change, A prediction profile is generated (S506).

差異反映部1052による予測プロファイルの生成(所定の生成規則)は実施の形態1と同様である。すなわち、複数の予測プロファイルを生成するため、Δを0.5倍〜2.0倍まで0.1刻みで計算した0.5*Δ〜2.0*Δを用意し、4月のプロファイル203にこれらを足したものを複数の予測プロファイルとして用意する。これらを予測プロファイル1〜予測プロファイル16とする。このように、Δと4月のプロファイル203を使用した複数の予測プロファイルの生成方法は実施の形態1と同じである。   The prediction profile generation (predetermined generation rule) by the difference reflection unit 1052 is the same as in the first embodiment. That is, in order to generate a plurality of prediction profiles, 0.5 * Δ to 2.0 * Δ calculated from 0.1 to 0.5 times from Δ to 0.5 times is prepared, and the April profile 203 is prepared. Are added to these as a plurality of prediction profiles. These are designated as prediction profile 1 to prediction profile 16. As described above, the method for generating a plurality of prediction profiles using Δ and the April profile 203 is the same as that in the first embodiment.

(C:最適な予測プロファイルの選択)
図24は、実施の形態2における最適な予測プロファイルを選択する動作を示す図である。図24を参照して最適な予測プロファイルの選択動作を説明する。実施に形態1と異なり、実施の形態1の場合、検知対象とする5/1の一日分のデータ(i=1〜288)は既に取得されている。
(C: Selection of optimal prediction profile)
FIG. 24 is a diagram illustrating an operation of selecting an optimal prediction profile in the second embodiment. The optimal prediction profile selection operation will be described with reference to FIG. Unlike the first embodiment, in the first embodiment, 5/1 day's worth of data (i = 1 to 288) to be detected has already been acquired.

分析部103は、5/1の一日分のカウント151をカウント蓄積部1042から取得(S601)し、予測プロファイル1〜16を差異反映部1052から取得する(S602)。分析部103は、プロファイル定義部104のカウント蓄積部1042に保存されている蓄積カウント202における5/1(木)の1日のカウントについて、5分おきの集計値に対して、各予測プロファイル1〜16を使用して分析(異常検知)を行う(S603)。   The analysis unit 103 acquires the count 151 for 5/1 day from the count storage unit 1042 (S601), and acquires the prediction profiles 1 to 16 from the difference reflection unit 1052 (S602). The analysis unit 103 determines each prediction profile 1 for the aggregated value every 5 minutes with respect to the count of 5/1 (Thursday) in the accumulation count 202 stored in the count accumulation unit 1042 of the profile definition unit 104. The analysis (abnormality detection) is performed using ~ 16 (S603).

すなわち、分析部103で使用している統計分析のアルゴリズムを用いて、5/1(木)の5分おきのカウント全てに対して、予測プロファイル1を用いて分析する。次に、予測プロファイル2を用いて同様に分析する。この様にして、予測プロファイル16を用いた分析まで繰り返し行う。   That is, using the statistical analysis algorithm used in the analysis unit 103, all the counts every 5 minutes of 5/1 (tree) are analyzed using the prediction profile 1. Next, the same analysis is performed using the prediction profile 2. In this way, the analysis using the prediction profile 16 is repeated.

各々の分析の結果R(j、i)は、プロファイル選択部106に予測プロファイル1〜16を用いた分析結果155として送られ、プロファイル選択部106に蓄積される。   Each analysis result R (j, i) is sent to the profile selection unit 106 as an analysis result 155 using the prediction profiles 1 to 16 and stored in the profile selection unit 106.

5/2(木)の0時0分において、プロファイル選択部106は、自身に蓄積された、5/1(木)1日分の分析結果を用いて、適切なプロファイルを選択する(S604)。選択の方法は、実施の形態1におけるプロファイル選択部106が行う選択と同じである。選択された予測プロファイルは、使用プロファイル蓄積部1041に上書きされる(S605)。   At 02:00 on 5/2 (Thursday), the profile selection unit 106 selects an appropriate profile using the analysis results for 5/1 (Thursday) accumulated in itself (S604). . The selection method is the same as the selection performed by the profile selection unit 106 in the first embodiment. The selected prediction profile is overwritten in the usage profile storage unit 1041 (S605).

実施の形態2では、実施の形態1と同様に、変動後のアクセス数が増加することを前提に記述したが、減少する場合でも同じように差異10551を求めることで、減少後の複数の予測プロファイルを生成し、同じ方法で最適な予測プロファイルを選択することができる。つまり、この場合は、差異10551がマイナスの値をとるだけであり、各部が同じ動作を行うだけで対応できる。   In the second embodiment, as described in the first embodiment, the description has been made on the assumption that the number of accesses after the fluctuation increases. Profiles can be generated and optimal prediction profiles can be selected in the same way. That is, in this case, the difference 10551 only takes a negative value, and can be dealt with only by performing the same operation for each unit.

以上の様に、実施の形態2では、設備の変動により正常な状態のアクセス数の時系列データが変動する場合において、変動後の予測の平均アクセス数が分かっていない場合は、変動後の1日のデータを学習し、学習した曜日の現在のプロファイルのカウントの平均を求め、これらの差異を求め、この差異に複数の比率を掛け、現在のプロファイルに反映することで複数の予測プロファイルを生成する。複数の予測プロファイルを用いて設備の変動後の1日のデータを分析し、適切な予測プロファイルを選択することにより、以後の分析において、誤検知や検知漏れを低減できる効果がある。また、予測プロファイルの生成では、現在のプロファイルに差異Δを足す方式をとることにより、現在のプロファイルの周期変動などの傾向を反映した予測プロファイルを生成可能である。   As described above, in the second embodiment, when the time-series data of the number of accesses in the normal state fluctuates due to the fluctuation of the equipment, if the average number of accesses after the fluctuation is unknown, Learn the day data, find the average of the current profile counts for the days of the week learned, find these differences, multiply this difference by multiple ratios, and reflect in the current profile to generate multiple prediction profiles To do. By analyzing the data for one day after the change of equipment using a plurality of prediction profiles and selecting an appropriate prediction profile, it is possible to reduce false detections and omissions in subsequent analysis. Further, in the generation of a prediction profile, a prediction profile reflecting a tendency such as a periodic variation of the current profile can be generated by adding a difference Δ to the current profile.

実施の形態3.
(装置外からパラメータ入力)
実施の形態3は、差分Δに乗じる0.5倍等の数値を外部からパラメータとして入力する実施形態である。実施の形態1、2では、複数のプロファイルを準備する際に、例としてΔを0.5倍〜2.0倍まで0.1刻みで指定しているが、他の倍数、刻みでもよく、装置外からパラメータで与える方式で実現する。図25において、パラメータ10551は、倍率最大値10552、倍率最小値10553、生成個数10554、刻み幅10555で与える。倍率最大値10552は実施の形態1では2.0に相当し、倍率最小値10553は0.5に相当する。刻み幅10555は、0.1に相当する。刻み幅を与えない場合は、代わりに生成個数10554を与え、差異定義部1051は以下を計算し、結果を刻み幅の代わりとする。
すなわち、
刻み幅=(倍率最大値−倍率最大値)/生成個数とする。
Embodiment 3 FIG.
(Parameter input from outside the device)
In the third embodiment, a numerical value such as 0.5 times multiplied by the difference Δ is input as a parameter from the outside. In the first and second embodiments, when preparing a plurality of profiles, Δ is specified in increments of 0.1 from 0.5 to 2.0 times as an example, but other multiples and increments may be used. It is realized by a method of giving parameters from outside the device. In FIG. 25, a parameter 10551 is given by a maximum magnification value 10552, a minimum magnification value 10553, a generated number 10554, and a step size 10555. The maximum magnification value 10552 corresponds to 2.0 in the first embodiment, and the minimum magnification value 10553 corresponds to 0.5. The step size 10555 corresponds to 0.1. When the step size is not given, the generation number 10554 is given instead, and the difference defining unit 1051 calculates the following, and uses the result as the step size instead.
That is,
Step width = (maximum magnification value−maximum magnification value) / number of generations.

実施の形態4.
(分析日数をm日)
実施の形態1、実施の形態2では、生成した複数の予測プロファイルの選択において、複数の予測プロファイルを用いて1日ぶんの分析を行い、異常を検知した予測プロファイルを削除し、異常検知しなかった予測プロファイルの中で1番小さいものを選択した。本実施の形態4では、選択するための分析期間をm日とし、その期間において、検知した予測プロファイルを削除し、検知しなかった予測プロファイルの中で1番小さいものを選択する。
Embodiment 4 FIG.
(Analysis days are m days)
In the first embodiment and the second embodiment, in the selection of a plurality of generated prediction profiles, the analysis is performed for one day using the plurality of prediction profiles, the prediction profile in which the abnormality is detected is deleted, and the abnormality is not detected. The smallest prediction profile was selected. In the fourth embodiment, the analysis period for selection is m days, and the detected prediction profile is deleted during that period, and the smallest prediction profile is selected among the prediction profiles that were not detected.

実施の形態5.
(ビジネスアワーにのみ加算)
実施の形態1、2では、現在のプロファイル全体に、n*Δを足して予測プロファイルを生成した。しかし、土日、夜間はプロファイル変動前と変動後で変化が無く、平日のビジネスアワーのみ変化があることが分かっている場合は、プロファイルにおいて平日のビジネスアワーの部分にのみ、n*Δを足してもよい。例えば、図26の様に、平日の昼アクセス数が多く、夜はアクセス数は少なく、土日はアクセス数が少ない場合、設備変更による変動後も同様の傾向が想定される場合は、平日のビジネスアワー(例:9時〜17時)にのみn*Δを足し、それ以外は足さないで予測プロファイルを生成する。
Embodiment 5 FIG.
(Add only to business hours)
In Embodiments 1 and 2, a prediction profile is generated by adding n * Δ to the entire current profile. However, if it is known that there is no change before and after the profile change on Saturdays, Sundays and nights, and there is only a change in business hours on weekdays, only n * Δ is added to the business hours part on weekdays in the profile. Also good. For example, as shown in FIG. 26, if the number of weekday accesses is large, the number of accesses is small at night, the number of accesses is small on Saturdays and Sundays, The prediction profile is generated by adding n * Δ only during the hour (for example, from 9 o'clock to 17 o'clock) and not adding the others.

以上の様に、当実施の形態5では、ビジネスアワーの変動を考慮した適切な予測プロファイルを生成することが可能である。   As described above, in the fifth embodiment, it is possible to generate an appropriate prediction profile that takes into account fluctuations in business hours.

実施の形態6.
(d>kの場合に予測プロファイルを削除)
実施の形態1、2では、予測プロファイルの選択において、図20のフローで、d>0の場合にProf_jを削除(S39)したが、d>0の分岐をd>kとする。kはプロファイル選択部106に与えるパラメータであり、例えば、k=10であれば、そのプロファイルを使用し10回以上検知が発生した場合に削除することになる。このように、異常を検知した回数が閾値を超えた場合に削除するようにする。
Embodiment 6 FIG.
(Delete prediction profile when d> k)
In the first and second embodiments, Prof_j is deleted when d> 0 in the flow of FIG. 20 in the selection of the prediction profile (S39), but the branch of d> 0 is d> k. k is a parameter given to the profile selection unit 106. For example, if k = 10, the profile is used and deleted when detection is performed 10 times or more. In this way, deletion is performed when the number of times an abnormality is detected exceeds a threshold value.

実施の形態7.
(平均の比によって予測プロファイルを生成)
実施の形態1では、差異定義部1051は、現在のプロファイルの平均値と、平均値の予測値の差を差異10551として計算した。また、実施の形態2では、差異定義部1051は、現在のプロファイルの木曜日の平均値と、5/1(木)の平均値の差を差異10551として計算した。本実施の形態7では、これらの平均値の差を差異10551として計算するのではなく、比を差異10551として求めても良い。
Embodiment 7 FIG.
(Generate forecast profile by average ratio)
In the first embodiment, the difference defining unit 1051 calculates the difference between the average value of the current profile and the predicted value of the average value as the difference 10551. In the second embodiment, the difference defining unit 1051 calculates the difference 10551 as the difference between the average value of Thursday of the current profile and the average value of 5/1 (Thu). In the seventh embodiment, the difference between these average values may not be calculated as the difference 10551, but the ratio may be obtained as the difference 10551.

つまり、実施の形態1では、
Δ=「平均値の予測値」/「現在のプロファイルの木曜日の平均値」
であり、実施の形態2では、
Δ=「5/1(木)の平均値」/「現在のプロファイルの木曜日の平均値」
である。
That is, in the first embodiment,
Δ = “Predicted value of average value” / “Average value of current profile on Thursday”
In the second embodiment,
Δ = “average value of 5/1 (Thu)” / “average value of current profile on Thursday”
It is.

この場合、図17の「Xij=Ci+Δj」を「Xij=Ci*Δj」に変更する。   In this case, “Xij = Ci + Δj” in FIG. 17 is changed to “Xij = Ci * Δj”.

実施の形態8.
(予測プロファイルの補正)
実施の形態1、実施の形態2では、生成した複数の予測プロファイルの選択において、複数の予測プロファイルを用いて1日分析を行い、異常検知された予測プロファイルを削除した。本実施の形態8では、全ての予測プロファイルにおいて異常検知が発生しなかった場合に予測プロファイルの補正を行うものである。実施の形態1、実施の形態2ではΔを0.5倍〜2.0倍まで0.1刻みで計算した0.5*Δ〜2.0*Δを用意して複数の予測プロファイルを生成したが、異常検知が発生しないということはこれらで生成した予測プロファイルでは実測値に対して大きいということである。よって、Δに掛ける倍率を最低の0.5の1/10を刻みとして、0.05*Δ〜0.45*Δを差異として新しい予測プロファイルを生成し、これらの予測プロファイルで検知するか試みる。
Embodiment 8 FIG.
(Prediction profile correction)
In the first embodiment and the second embodiment, in the selection of a plurality of generated prediction profiles, one day analysis is performed using a plurality of prediction profiles, and the abnormality-detected prediction profile is deleted. In the eighth embodiment, the prediction profile is corrected when abnormality detection does not occur in all the prediction profiles. In the first and second embodiments, a plurality of prediction profiles are generated by preparing 0.5 * Δ to 2.0 * Δ in which Δ is calculated in increments of 0.1 from 0.5 to 2.0. However, the fact that abnormality detection does not occur means that the predicted profile generated by these is larger than the actually measured value. Therefore, a new prediction profile is generated with 0.05 * Δ to 0.45 * Δ as a difference, with the multiplication factor Δ multiplied by 1/10 of the lowest 0.5, and it is tried to detect with these prediction profiles. .

上記でも検知しない場合は、0.05の1/10を刻みとして、同様に、0.005*Δ〜0.045*Δを差異として新しい予測プロファイルを生成し(所定の補正規則の一例)、これらの予測プロファイルで検知するか試み、これを繰り返す。   In the case where the above is not detected, a new prediction profile is generated with a difference of 0.005 * Δ to 0.045 * Δ in increments of 1/10 of 0.05 (an example of a predetermined correction rule), Try to detect with these prediction profiles and repeat.

つまり、本実施の形態8では、予測プロファイルの生成において使用した差異が大きかった場合に、さらに小さい差異を使用して予測プロファイルを再生成し、検知するまで予測プロファイルの再生成を繰り返すことで(所定の補正規則の一例)、最適な予測プロファイルを選択するものである。本実施の形態8では、実施の形態1、2を例として、予測プロファイルの再生成用の差異を0.05の1/10を基準としたが、他の割合、生成の個数でも良い。   That is, in the eighth embodiment, when the difference used in the generation of the prediction profile is large, the prediction profile is regenerated using the smaller difference, and the prediction profile is regenerated until it is detected ( An example of a predetermined correction rule) is to select an optimal prediction profile. In Embodiment 8, taking Embodiments 1 and 2 as an example, the difference for regenerating a prediction profile is set to 1/10 of 0.05, but other ratios and the number of generations may be used.

以上の様に、当実施の形態8では、最初に生成した複数の予測プロファイルが適切でなかった場合に、さらに複数の予測プロファイルを作り選択することが可能である。   As described above, in the eighth embodiment, when a plurality of first generated prediction profiles are not appropriate, it is possible to create and select a plurality of prediction profiles.

実施の形態9.
(選択する際に使用するアルゴリズム)
実施の形態1、実施の形態2では、予測プロファイルを選択する際の分析アルゴリズムとして、検知に用いる統計分析のアルゴリズムをそのまま使用した。本実施の形態9では、予測プロファイルを選択するために別の統計分析のアルゴリズムを適用しても良い。例えば、検知に3σ(平均+3σを超えたら検知)を利用している場合において、予測プロファイルの選択においては、これを1σ(平均+σを超えたら検知)とし、分析を行い選択の判断を行っても良い。他の例として、例えば、特開2008−146157号公報に示されるスライディングウィンドウを使用したPCA(Principal Component Analysis:主成分分析)を適用して分析を行い、選択の判断を行っても良い。
Embodiment 9 FIG.
(Algorithm used for selection)
In the first and second embodiments, the statistical analysis algorithm used for detection is used as it is as the analysis algorithm for selecting the prediction profile. In the ninth embodiment, another statistical analysis algorithm may be applied to select a prediction profile. For example, when 3σ (detection when average + 3σ is exceeded) is used for detection, in selecting a prediction profile, this is set to 1σ (detection when average + σ is exceeded), analysis is performed, and selection is determined. Also good. As another example, for example, PCA (Principal Component Analysis) using a sliding window disclosed in Japanese Patent Application Laid-Open No. 2008-146157 may be applied to perform analysis to determine selection.

実施の形態10.
(1時間おきの平均アクセス数の反映)
実施の形態2では、設備変更後に1日観測したアクセス数の1日の平均値(5/1(木)の1日の平均)を求め、4月のプロファイルにおける同じ曜日の平均値を求めてその差を差異として、4月のプロファイル全体に反映した。本実施の形態10では、設備変更後に1日観測したアクセス数の1時間おきの(5分の集計値の)平均値を求め、4月のプロファイルにおける同じ曜日の1日の1時間おきの(5分の集計値の)平均値を求め、各1時間おきの差異を、4月のプロファイルの同時間帯に反映するものである。
Embodiment 10 FIG.
(Reflect the average number of accesses every hour)
In the second embodiment, the average value of daily accesses (average of 5/1 (Thursday)) of the number of accesses observed every day after the equipment change is obtained, and the average value of the same day of the week in the April profile is obtained. The difference was reflected in the entire April profile. In the tenth embodiment, an average value of the number of accesses observed every day after the equipment change (an aggregate value of 5 minutes) is obtained, and every hour of the day of the same day of the week in the April profile ( An average value (of 5 minutes of total values) is obtained, and each hourly difference is reflected in the same time zone of the April profile.

具体的には以下のように処理する。5/1(木)に観測したアクセス数の1時間おきの(5分の集計値の)平均値を以下の様に表す。
μthr_0_1(5/1(木)0時〜1時の5分の平均アクセス数)、
μthr_1_2(5/1(木)1時〜2時の5分の平均アクセス数)、
・・・
μthr_23_24(5/1(木)23時〜24時の5分の平均アクセス数)、
図22の、木曜日のカウント301から4月の木曜日の1時間おきの平均値を以下の様に表す。
μ’thr_0_1(4月の木曜日の0時〜1時の5分の平均アクセス数)、
μ’thr_1_2(4月の木曜日の1時〜2時の5分の平均アクセス数)、
・・・、
μ’thr_23_24(4月の木曜日の23時〜24時の5分の平均アクセス数)、
Specifically, the processing is as follows. The average value of the number of accesses observed every 5/1 (Thu) every hour (of the aggregate value of 5 minutes) is expressed as follows.
μthr — 0 — 1 (5/1 (Thursday) 0:00 to 1 o'clock average number of accesses for 5 minutes),
μthr_1_2 (5/1 (Thu) 1 to 2 o'clock average access count for 5 minutes),
...
μthr — 23 — 24 (5/1 (Thu) 5 minutes average access count from 23:00 to 24:00),
In FIG. 22, the average value every hour from Thursday count 301 to Thursday in April is expressed as follows.
μ'thr — 0 — 1 (average number of accesses for 5 minutes from 0 o'clock to 1 o'clock on Thursday in April),
μ'thr_1_2 (average number of accesses for 5 minutes from 1 o'clock to 2 o'clock on Thursday in April),
...
μ'thr_23_24 (average number of accesses for 5 minutes from 23:00 to 24:00 on Thursday in April),

次に以下を計算する。
Δ_0_1=μthr_0_1−μ’thr_0_1、
Δ_1_2=μthr_1_2−μ’thr_1_2、
・・・
Δ_23_24=μthr_23_24−μ’thr_23_24、
Then calculate:
Δ_0_1 = μthr — 0_1−μ′thr — 0_1,
Δ_1_2 = μthr_1_2−μ′thr_1_2,
...
Δ — 23 — 24 = μthr — 23 — 24−μ′thr — 23 — 24,

この各Δを4月のプロファイル203に適用する。ここではn=0.5とする。
4月1日0時〜1時における各5分の集計値+n*Δ_0_1、
4月1日1時〜2時における各5分の集計値+n*Δ_1_2、
・・・
4月1日23時〜24時における各5分の集計値+n*Δ_23_24、
4月2日0時〜1時における各5分の集計値+n*Δ_0_1、
4月2日1時〜2時における各5分の集計値+n*Δ_1_2、
・・・
4月2日23時〜24時における各5分の集計値+n*Δ_23_24、
以降、4月30日のデータまで同じように適用する。
Each Δ is applied to the April profile 203. Here, n = 0.5.
Total value of 5 minutes each from 0:00 to 1:00 on April 1 + n * Δ_0_1,
Total value of 5 minutes each from 1 to 2 on April 1 + n * Δ_1_2,
...
Total value of 5 minutes each from 23:00 to 24:00 on April 1 + n * Δ_23_24,
Total value of 5 minutes each from 0:00 to 1:00 on April 2, + n * Δ_0_1,
Total values for 5 minutes each from 1 am to 2 pm on April 2, + n * Δ_1_2,
...
Total value for each 5 minutes from 23:00 to 24:00 on April 2, + n * Δ_23_24,
Thereafter, the same applies to the data on April 30.

上記の計算を行えば、5/1(木)と4月の木曜日のアクセス数の1時間ごとの差異を、4月のプロファイル全体の同時間帯に反映した予測プロファイルを生成可能である。   If the above calculation is performed, it is possible to generate a prediction profile that reflects the hourly difference in the number of accesses between Thursday of April and Thursday in April in the same time zone of the entire April profile.

nを0.5〜2.0まで0.1刻みで変化させて上記計算を行えば、実施の形態2と同じように16個の予測プロファイルを生成できる。   If the above calculation is performed while changing n in increments of 0.1 from 0.5 to 2.0, 16 prediction profiles can be generated as in the second embodiment.

上記の例では、1時間ごとのΔを生成したが、0時〜6時、6時〜12時、12時〜18時、18時〜24時のように時間帯を分けて、時間大別の平均値を求め同様の処理を適用しても良い。或いは、1時間よりも細かい時間帯、例えば、30分ごとに同様の処理を行っても良い。   In the above example, Δ was generated every hour, but divided into time zones such as 0 o'clock to 6 o'clock, 6 o'clock to 12 o'clock, 12 o'clock to 18 o'clock, and 18 o'clock to 24 o'clock. A similar process may be applied by obtaining an average value of Alternatively, the same processing may be performed every time zone that is smaller than one hour, for example, every 30 minutes.

以上の様に、当実施の形態10では、アクセス数の変動後の時間ごとの細かい差異を反映できる。   As described above, the tenth embodiment can reflect a minute difference for each time after the number of accesses is changed.

実施の形態11.
(1週間の観測)
実施の形態2では、設備変更後に1日観測したアクセス数の1日の平均値を求め、4月のプロファイルにおける同じ曜日の平均値を求めその差を差異として、4月のプロファイル全体に反映した。本実施の形態では、設備変更後に7日観測したアクセス数の曜日別の平均値を求め、4月のプロファイルにおける同じ曜日の平均値を求め、同じ曜日の平均値の差を求め、曜日別の差異を4月のプロファイルの曜日ごとに反映するものである。
Embodiment 11 FIG.
(1 week observation)
In the second embodiment, the average value of the number of accesses observed every day after the facility change is obtained, the average value of the same day of the week in the April profile is obtained, and the difference is reflected in the entire April profile. . In this embodiment, the average value for each day of the number of accesses observed on the 7th after the equipment change is obtained, the average value for the same day in the April profile is obtained, the difference between the average values for the same day is obtained, The difference is reflected for each day of the April profile.

具体的には以下のように処理する。
5/1(木)〜5/7(水)に観測したアクセス数の1日の平均値を以下の様に表す。
μthr(5/1(木)の1日の平均アクセス数)、
μfri(5/2(金)の1日の平均アクセス数)、
・・・
μwed(5/7(水)の1日の平均アクセス数)、
図22の、4月のプロファイル203から各曜日の1日の平均値を以下の様に表す。
μ’thr(4月の木曜日の1日の平均アクセス数)、
μ’fri(4月の金曜日の1日の平均アクセス数)、
・・・
μ’wed(4月の水曜日の1日の平均アクセス数)、
Specifically, the processing is as follows.
The average daily number of accesses observed from 5/1 (Thu) to 5/7 (Wed) is expressed as follows.
μthr (average number of accesses per day of 5/1 (Thu)),
μfri (5/2 (Friday) average daily access),
...
μwed (average daily access on 5/7 (Wednesday)),
The average value of the day of each day of the week is represented as follows from the April profile 203 of FIG.
μ'thr (Average number of accesses per day on Thursday in April),
μ'fri (average number of accesses per day on Friday, April),
...
μ'wed (average daily access on Wednesday in April),

次に以下を計算する。
Δ_thr=μthr−μ’thr、
Δ_fri=μfri−μ’fri、
・・・
Δ_wed=μwed−μ’wed、
Then calculate:
Δ_thr = μthr−μ′thr,
Δ_fri = μfri−μ′fri,
...
Δ_wed = μwed−μ′wed,

この各Δを4月のプロファイル203 の各曜日に適用する。ここでは n=0.5とする。
4月の各木曜日の各5分の集計値+n*Δ_thr、
4月の各金曜日の各5分の集計値+n*Δ_fri、
・・・
4月の各水曜日の各5分の集計値+n*Δ_wed、
Each Δ is applied to each day of the week in the profile 203 in April. Here, n = 0.5.
Total value for each 5 minutes on each Thursday in April + n * Δ_thr,
Aggregate value of each 5 minutes on each Friday of April + n * Δ_fri,
...
Total value for each 5 minutes on each Wednesday in April + n * Δ_wed,

上記の計算を行えば、5/1(木)〜5/7(水)の1週間の各曜日と4月の各曜日のアクセス数の差異を、4月のプロファイル全体の同曜日に反映した予測プロファイルを生成可能である。実施の形態1では、1日のアクセス数の平均の差異を反映したが、本実施の形態12に従えば、観測期間は7日になるが、設備変更後の各曜日の差異を4月のプロファイルに反映することができる。   If the above calculation is performed, the difference in the number of accesses between each day of the week from 5/1 (Thursday) to 5/7 (Wednesday) and each day of April is reflected on the same day of the April profile as a whole. A prediction profile can be generated. In the first embodiment, the average difference in the number of accesses per day is reflected, but according to the present embodiment 12, the observation period is 7 days, but the difference in each day of the week after the equipment change is It can be reflected in the profile.

実施の形態12.
実施の形態1、2では、プロファイルとして3月や4月という単位ごとにプロファイルを使用して分析した。他の分析の形態として、ビジネスアワーとそれ以外にプロファイルを分けて持つ場合や、1時間おきや、曜日別にプロファイルを分けて分析を行う場合がある。
Embodiment 12 FIG.
In the first and second embodiments, analysis is performed using a profile for each unit such as March or April as a profile. As other forms of analysis, there are cases in which profiles are separately provided for business hours and other cases, or analysis is performed by dividing profiles for every hour or by day of the week.

例えば、ビジネスアワーとそれ以外にプロファイルを分けて持つ場合は、ビジネスアワーにおけるアクセス数の分析では、ビジネスアワー用のプロファイルを用いて逸脱を確認する。   For example, when the business hour and other profiles are separately provided, the analysis of the number of accesses in the business hour confirms the deviation using the business hour profile.

ビジネスアワーとそれ以外にプロファイルを分けて持つ場合で、設備変更によるアクセス数の変動後の平均の予測値μ’がある場合は次のようにする。ビジネスアワーとそれ以外のアクセス数のプロファイルを合わせた平均値μを求め、これらの平均値の差をΔ=μ’−μとし、ビジネスアワー用のプロファイル、ビジネスアワー以外のプロファイルにΔを反映することで、各々の予測プロファイルを生成する。設備変更によるアクセス数の変動後の平均の予測値が無い場合は次のようにする。設備変更後の1日において、ビジネスアワーとそれ以外のアクセス数を観測し、ビジネスアワーのアクセス数の平均値μ’bと、ビジネスアワー以外の平均値μ’nbを各々求め、現在のビジネスアワーのプロファイルの平均値μb、ビジネスアワー以外の平均値μnbに対して、
Δb=μ’b−μb、Δnb=μ’nb−μnb
を求める。Δbを現在のビジネスアワー用のプロファイルに、Δnbをビジネスアワー以外のプロファイルに反映することで、ビジネスアワーとそれ以外の予測プロファイルを生成できる。
When there are separate profiles for business hours and other cases, and there is an average predicted value μ ′ after the change in the number of accesses due to equipment changes, it is as follows. The average value μ of the business hour and other access count profiles is obtained, and the difference between these average values is Δ = μ′−μ, and Δ is reflected in the business hour profile and the non-business hour profile. Thus, each prediction profile is generated. If there is no average predicted value after the change in the number of accesses due to equipment changes, the following is done. One day after the equipment change, the number of business hours and other accesses was observed, and the average value μ′b of the business hours access and the average value μ′nb other than the business hours were obtained, respectively. For the average value μb of the profile and the average value μnb other than business hours,
Δb = μ′b−μb, Δnb = μ′nb−μnb
Ask for. By reflecting Δb in the profile for the current business hour and Δnb in the profile other than business hour, it is possible to generate a business hour and other predicted profiles.

1時間おきにプロファイルを持っている場合は、設備変更によるアクセス数の変動後の平均の予測値μ’がある場合は、1時間おきのプロファイルを全て足し平均値μを求め、これらの平均値の差をΔ=μ’−μとし、1時間おきのプロファイルにΔを反映することで、各々の予測プロファイルを生成する。設備変更によるアクセス数の変動後の平均の予測値が無い場合は次のようにする。設備変更後の1日において、1時間おきのアクセス数を観測し、1時間おきの平均値(μ’i,i=0〜23)を求める。次に、現在の1時間おきのプロファイルの平均値(μi,i=0〜23)を求める。Δi=μ’i−μi(i=0〜23)を求め、Δiを現在の1時間ごとのプロファイルに反映することで、各時間の予測プロファイルを生成できる。ここで、i=0は0時、i=23は23時を示す。   If there is a profile every hour, if there is an average predicted value μ ′ after the change in the number of accesses due to equipment changes, add all the profiles every hour to obtain the average value μ, and these average values Each prediction profile is generated by setting Δ = μ′−μ and reflecting Δ in the profile every other hour. If there is no average predicted value after the change in the number of accesses due to equipment changes, the following is done. On the first day after the equipment change, the number of accesses every hour is observed, and an average value (μ′i, i = 0 to 23) every hour is obtained. Next, the average value (μi, i = 0 to 23) of the current profile every hour is obtained. By obtaining Δi = μ′i−μi (i = 0 to 23) and reflecting Δi in the current hourly profile, a prediction profile for each time can be generated. Here, i = 0 indicates 0 and i = 23 indicates 23:00.

曜日別にプロファイルを持っている場合は、設備変更によるアクセス数の変動後の平均の予測値μ’がある場合は、曜日別のプロファイルを全て足し平均値μを求め、これらの平均値の差をΔ=μ’−μとし、曜日別のプロファイルにΔを反映することで、各々の予測プロファイルを生成する。設備変更によるアクセス数の変動後の平均の予測値が無い場合は次のようにする。設備変更後の1日において、アクセス数を観測し、1日の平均値μ’を求める。観測した曜日に該当する曜日のプロファイルの1日の平均値μを求める。これらの平均値の差異をΔ=μ’−μとする。このΔを各曜日のプロファイルに反映することで、各曜日の予測プロファイルを生成できる。   When there is a profile for each day of the week, if there is an average predicted value μ 'after fluctuations in the number of accesses due to equipment changes, add all the profiles for each day to obtain the average value μ, and calculate the difference between these average values. Each prediction profile is generated by setting Δ = μ′−μ and reflecting Δ in the profile for each day of the week. If there is no average predicted value after the change in the number of accesses due to equipment changes, the following is done. On the first day after the equipment change, the number of accesses is observed to obtain the average value μ ′ for the day. The daily average μ of the profile of the day corresponding to the observed day of the week is obtained. The difference between these average values is Δ = μ′−μ. By reflecting this Δ on the profile of each day of the week, a predicted profile of each day of the week can be generated.

上記の様に生成した予測プロファイルは、実施の形態1や2の様にΔに倍率を掛けることで複数生成でき、生成された予測プロファイルの選択は実施の形態1や2と同様の処理を行うことで選択できる。   A plurality of prediction profiles generated as described above can be generated by multiplying Δ by a factor as in the first and second embodiments, and selection of the generated prediction profile performs the same processing as in the first and second embodiments. Can be selected.

本実施の形態12では、プロファイルがビジネスアワーとそれ以外、時間別、曜日別などに分割されていても、設備変更によるアクセス数の変動後の平均の予測値がある場合、無い場合について、実施の形態1や2の考え方を応用して適切な予測プロファイルを生成することが可能である。   In the twelfth embodiment, even if the profile is divided into business hours and other times, by time, by day of the week, etc., there are cases where there is an average predicted value after fluctuation of the number of accesses due to equipment change, and there is no It is possible to generate an appropriate prediction profile by applying the ideas of forms 1 and 2.

以上の実施の形態では不正アクセス検知装置100を説明したが、不正アクセス検知装置100は、不正アクセス検知装置100の各構成要素が行う「不正アクセス検知方法」の実施形態として把握することもできる。また、不正アクセス検知装置100は、「〜部」の機能をコンピュータに実行させる「不正アクセス検知プログラム」の実施形態として把握することもできる。さらに、「不正アクセス検知プログラム」を記録したコンピュータ実行可能な「記録媒体」の実施形態として把握することも可能である。   Although the unauthorized access detection device 100 has been described in the above embodiment, the unauthorized access detection device 100 can also be understood as an embodiment of an “unauthorized access detection method” performed by each component of the unauthorized access detection device 100. The unauthorized access detection device 100 can also be understood as an embodiment of an “unauthorized access detection program” that causes a computer to execute the function of “˜ part”. Furthermore, it can be understood as an embodiment of a computer-executable “recording medium” in which an “unauthorized access detection program” is recorded.

以上の実施の形態では、ネットワークのアクセス数の時系列データのAnomaly検知において、正常な状態のアクセス数の傾向が変動した際に、変動した正常なアクセス数の再学習の期間を短縮するために予測プロファイルを利用する分析おいて、複数の予測プロファイルを生成する予測プロファイル生成部105と、複数の予測プロファイルによる分析を行い、最適な予測プロファイルを選択する使用プロファイル決定部とを備えた不正アクセス検知装置100を説明した。   In the above embodiment, when anomaly detection of time-series data of the number of accesses to the network changes the trend of the number of accesses in a normal state, in order to shorten the relearning period of the changed number of normal accesses In analysis using a prediction profile, unauthorized access detection provided with a prediction profile generation unit 105 that generates a plurality of prediction profiles, and a use profile determination unit that performs analysis using a plurality of prediction profiles and selects an optimal prediction profile The apparatus 100 has been described.

以上の実施の形態では、予測プロファイル生成部105は、予め入手した変動後の予測の平均アクセス数と現在のプロファイルの平均アクセス数との差異を求め、この変位に複数の倍率をかけ、現在のプロファイルに反映することで、現在のプロファイルの傾向を反映した予測プロファイルを複数生成する不正アクセス検知装置100を説明した。   In the above embodiment, the prediction profile generation unit 105 obtains a difference between the average access number of the prediction obtained after fluctuation obtained in advance and the average access number of the current profile, multiplies this displacement by a plurality of magnifications, The unauthorized access detection apparatus 100 that generates a plurality of predicted profiles reflecting the current profile trend by reflecting the profile has been described.

以上の実施の形態では、予測プロファイル生成部105は、変動した正常なアクセス数を1日観測し、観測した曜日と現在のプロファイルの曜日のデータを元に差異を求め、この差異に複数の倍率をかけ、現在のプロファイルに反映することで、現在のプロファイルの傾向を反映した予測プロファイルを複数生成する不正アクセス検知装置100を説明した。   In the above embodiment, the prediction profile generation unit 105 observes the changed number of normal accesses for one day, obtains a difference based on the observed day of the week and the current profile day of the week, and adds a plurality of magnifications to the difference. The unauthorized access detection apparatus 100 that generates a plurality of predicted profiles reflecting the current profile tendency by applying the above to the current profile has been described.

実施の形態1における不正アクセス検知装置100の外観の一例。1 shows an example of the appearance of an unauthorized access detection device 100 according to Embodiment 1. 実施の形態1における不正アクセス検知装置100のハードウェア構成。2 is a hardware configuration of the unauthorized access detection device 100 according to the first embodiment. 実施の形態1における不正アクセス検知装置100のブロック図。1 is a block diagram of an unauthorized access detection device 100 according to Embodiment 1. FIG. 実施の形態1における学習のシーケンス。The learning sequence in the first embodiment. 実施の形態1におけるログ150の例。An example of the log 150 in the first embodiment. 実施の形態1における集計部102の生成した時系列データの概念図。FIG. 3 is a conceptual diagram of time-series data generated by a counting unit 102 according to the first embodiment. 実施の形態1における時系列データ157を示す図。FIG. 6 shows time-series data 157 in the first embodiment. 実施の形態1におけるプロファイル定義部104の内部構成を示す図。FIG. 3 is a diagram illustrating an internal configuration of a profile definition unit 104 according to the first embodiment. 実施の形態1における検知動作のシーケンス。3 is a sequence of detection operations in the first embodiment. 実施の形態1におけるカウント151の例。An example of the count 151 in the first embodiment. 実施の形態1における検知動作の詳細のシーケンス。5 is a detailed sequence of a detection operation in the first embodiment. 実施の形態1における設備変更の場合のアクセス数変動を示す図。The figure which shows the access number fluctuation | variation in the case of the equipment change in Embodiment 1. FIG. 実施の形態1における予測プロファイル生成のシーケンス。The sequence of the prediction profile generation in Embodiment 1. FIG. 実施の形態1における予測プロファイルの生成を説明する図。FIG. 6 illustrates generation of a prediction profile in the first embodiment. 実施の形態1における生成される複数の予測プロファイルを説明する図。FIG. 6 is a diagram for explaining a plurality of prediction profiles generated in the first embodiment. 実施の形態1における変化ぶん生成のフローチャート。FIG. 5 is a flowchart of generation of change in the first embodiment. FIG. 実施の形態1における予測プロファイルの生成のフローチャート。5 is a flowchart for generating a prediction profile in the first embodiment. 実施の形態1における生成された予測プロファイル1を示す図。FIG. 5 is a diagram showing a prediction profile 1 generated in the first embodiment. 実施の形態1における最適な予測プロファイルの選択シーケンス。5 is a sequence for selecting an optimal prediction profile according to the first embodiment. 実施の形態1における予測プロファイルの選択のフローチャート。5 is a flowchart of selection of a prediction profile in the first embodiment. 実施の形態2における予測プロファイル生成のシーケンス。The sequence of the prediction profile generation in Embodiment 2. 実施の形態2における平均値μ、μ’の生成を説明する図。FIG. 10 is a diagram for explaining generation of average values μ and μ ′ in the second embodiment. 実施の形態2における予測プロファイルの生成を説明する図。FIG. 10 is a diagram for explaining generation of a prediction profile in the second embodiment. 実施の形態2における予測プロファイルの生成のシーケンス。A sequence for generating a prediction profile in the second embodiment. 実施の形態3におけるパラメータの入力を説明する図。FIG. 10 is a diagram for explaining input of parameters in the third embodiment. 実施の形態5におけるパラメータの入力を説明する図。FIG. 10 is a diagram for explaining input of parameters in the fifth embodiment.

符号の説明Explanation of symbols

100 不正アクセス検知装置、101 データ取得部、102 集計部、103 分析部、1031 カウント処理部、1032 プロファイル処理部、1033 演算部、1034 逸脱確認部、104 プロファイル定義部、1041 使用プロファイル蓄積部、1042 カウント蓄積部、1043 プロファイル候補蓄積部、105 予測プロファイル生成部、1051 差異定義部、1052 差異反映部、106 プロファイル選択部。   DESCRIPTION OF SYMBOLS 100 Unauthorized access detection apparatus, 101 Data acquisition part, 102 Total part, 103 Analysis part, 1031 Count processing part, 1032 Profile processing part, 1033 Operation part, 1034 Deviation confirmation part, 104 Profile definition part, 1041 Usage profile storage part, 1042 Count accumulation unit, 1043 Profile candidate accumulation unit, 105 Prediction profile generation unit, 1051 Difference definition unit, 1052 Difference reflection unit, 106 Profile selection unit.

Claims (9)

アクセス数の時系列データをプロファイルとして用いてアクセス数の異常検知を行うAnomaly検知を実行する不正アクセス検知装置において、
正常と認められる過去のアクセス数からなる正常時系列データと、前記正常時系列データの改変に使用する改変情報とを入力し、所定の生成規則に従うことにより、前記改変情報を使用して前記正常時系列データから将来のアクセス数の異常検知に使用する使用プロファイルの候補となる複数の予測プロファイルを生成する予測プロファイル生成部と、
前記予測プロファイル生成部によって生成された前記複数の予測プロファイルのなかから、所定の決定基準に合致する予測プロファイルを前記使用プロファイルとして決定する使用プロファイル決定部と
を備えたことを特徴とする不正アクセス検知装置。
In an unauthorized access detection apparatus that performs anomaly detection for detecting an abnormality in the number of accesses using time-series data of the number of accesses as a profile,
Input normal time-series data consisting of the number of past accesses recognized as normal and modification information used for modification of the normal time-series data, and follow the predetermined generation rules to use the normal information using the modification information. A prediction profile generation unit that generates a plurality of prediction profiles that are candidates for use profiles to be used for detecting an abnormality in the number of future accesses from time-series data;
An unauthorized access detection, comprising: a usage profile determination unit that determines, as the usage profile, a prediction profile that matches a predetermined determination criterion from among the plurality of prediction profiles generated by the prediction profile generation unit apparatus.
前記予測プロファイル生成部は、
アクセス数を検知する検知対象の設備を変更した場合の変更後の平均アクセス数の予測値を前記改変情報として入力すると共に前記正常時系列データの平均アクセス数を算出し、算出した前記平均アクセス数と入力した前記予測値とに基づいて、前記複数の予測プロファイルを生成することを特徴とする請求項1記載の不正アクセス検知装置。
The prediction profile generation unit
Input the predicted value of the average access count after the change when the detection target equipment for detecting the access count is changed as the modification information, calculate the average access count of the normal time series data, and calculate the average access count The unauthorized access detection apparatus according to claim 1, wherein the plurality of prediction profiles are generated on the basis of the prediction value input as.
前記予測プロファイル生成部は、
アクセス数を検知する検知対象の設備を変更した変更後におけるアクセス数をある曜日の1日間観測した観測結果に基づき算出された前記1日間における平均アクセス数を前記改変情報として入力すると共に前記正常時系列データにおける前記曜日と同じ曜日についての平均アクセス数を算出し、算出した前記平均アクセス数と入力した前記平均アクセス数とに基づいて、前記複数の予測プロファイルを生成することを特徴とする請求項1記載の不正アクセス検知装置。
The prediction profile generation unit
The average number of accesses in the one day calculated based on the observation result of observing the number of accesses after the change of the detection target equipment for detecting the number of accesses for one day on a certain day is input as the modification information and the normal time The average access count for the same day of the week in the series data is calculated, and the plurality of prediction profiles are generated based on the calculated average access count and the input average access count. The unauthorized access detection device according to 1.
前記使用プロファイル決定部は、前記所定の決定基準として、
前記予測プロファイルの期間に含まれる一定期間を対象として前記複数の予測プロファイルの前記予測プロファイルごとに前記予測プロファイルを用いたアクセス数の異常検知処理により異常が検知されるかどうかを判定して異常の検知結果に基づいて前記使用プロファイルを決定することを特徴とする請求項1〜3のいずれかに記載の不正アクセス検知装置。
The usage profile determination unit, as the predetermined determination criteria,
It is determined whether an abnormality is detected by an abnormality detection process for the number of accesses using the prediction profile for each prediction profile of the plurality of prediction profiles for a certain period included in the period of the prediction profile. The unauthorized access detection apparatus according to claim 1, wherein the usage profile is determined based on a detection result.
前記予測プロファイル生成部は、
前記使用プロファイル決定部による判定の結果、どの前記予測プロファイルについても異常が検出されなかった場合には、所定の補正規則に基づいて、前記複数の予測プロファイルの各予測プロファイルを補正し、
前記使用プロファイル決定部は、
補正後の前記予測プロファイルごとに前記補正後の予測プロファイルを用いたアクセス数の異常検知処理により異常が検知されるかどうかを前記所定の決定基準によって再度判定し、異常の検知結果に基づいて前記使用プロファイルを決定することを特徴とする請求項4記載の不正アクセス検知装置。
The prediction profile generation unit
As a result of the determination by the use profile determination unit, when no abnormality is detected for any of the prediction profiles, the prediction profiles of the plurality of prediction profiles are corrected based on a predetermined correction rule,
The usage profile determination unit
Whether or not an abnormality is detected by the abnormality detection process for the number of accesses using the corrected prediction profile for each of the corrected prediction profiles is determined again according to the predetermined determination criterion, and based on the detection result of the abnormality 5. The unauthorized access detection apparatus according to claim 4, wherein a usage profile is determined.
前記使用プロファイル決定部は、
現在においてプロファイルとして使用している時系列データを、決定された前記使用プロファイルに切り替え、前記使用プロファイルを使用してアクセス数の異常検知を行うことを特徴とする請求項1〜5の記載の不正アクセス検知装置。
The usage profile determination unit
6. The fraud according to claim 1, wherein time series data currently used as a profile is switched to the determined usage profile, and an abnormality in the number of accesses is detected using the usage profile. Access detection device.
コンピュータを、
正常と認められる過去のアクセス数からなる正常時系列データと、前記正常時系列データの改変に使用する改変情報とを入力し、所定の生成規則に従うことにより、前記改変情報を使用して前記正常時系列データから将来のアクセス数の異常検知に使用する使用プロファイルの候補となる複数の予測プロファイルを生成する予測プロファイル生成部、
前記予測プロファイル生成部によって生成された前記複数の予測プロファイルのなかから、所定の決定基準に合致する予測プロファイルを前記使用プロファイルとして決定する使用プロファイル決定部
として機能させるための不正アクセス検知プログラム。
Computer
Input normal time-series data consisting of the number of past accesses recognized as normal and modification information used for modification of the normal time-series data, and follow the predetermined generation rules to use the normal information using the modification information. A prediction profile generation unit that generates a plurality of prediction profiles that are candidates for use profiles to be used for detecting an abnormality in the number of future accesses from time-series data;
An unauthorized access detection program for functioning as a usage profile determination unit that determines, as the usage profile, a prediction profile that matches a predetermined determination criterion from among the plurality of prediction profiles generated by the prediction profile generation unit.
請求項7記載の不正アクセス検知プログラムを記録したコンピュータ読み取り可能な記録媒体。   A computer-readable recording medium on which the unauthorized access detection program according to claim 7 is recorded. アクセス数の時系列データをプロファイルとして用いてアクセス数の異常検知を行うAnomaly検知を実行する不正アクセス検知装置が行う不正アクセス検知方法において、
(1)予測プロファイル生成部が、
正常と認められる過去のアクセス数からなる正常時系列データと、前記正常時系列データの改変に使用する改変情報とを入力し、所定の生成規則に従うことにより、前記改変情報を使用して前記正常時系列データから将来のアクセス数の異常検知に使用する使用プロファイルの候補となる複数の予測プロファイルを生成し、
(2)使用プロファイル決定部が、
前記予測プロファイル生成部によって生成された前記複数の予測プロファイルのなかから、所定の決定基準に合致する予測プロファイルを前記使用プロファイルとして決定することを特徴とする不正アクセス検知方法。
In an unauthorized access detection method performed by an unauthorized access detection device that performs anomaly detection for detecting an abnormality in the number of accesses using time-series data of the number of accesses as a profile,
(1) The prediction profile generation unit
Input normal time-series data consisting of the number of past accesses recognized as normal and modification information used for modification of the normal time-series data, and follow the predetermined generation rules to use the normal information using the modification information. Generate multiple prediction profiles that are candidates for usage profiles to be used to detect anomalies in the number of future accesses from time series data,
(2) The usage profile determination unit
An unauthorized access detection method comprising: determining, as the usage profile, a prediction profile that matches a predetermined determination criterion from among the plurality of prediction profiles generated by the prediction profile generation unit.
JP2008326805A 2008-12-24 2008-12-24 Unauthorized access detection device, unauthorized access detection program, recording medium, and unauthorized access detection method Expired - Fee Related JP5219783B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008326805A JP5219783B2 (en) 2008-12-24 2008-12-24 Unauthorized access detection device, unauthorized access detection program, recording medium, and unauthorized access detection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008326805A JP5219783B2 (en) 2008-12-24 2008-12-24 Unauthorized access detection device, unauthorized access detection program, recording medium, and unauthorized access detection method

Publications (2)

Publication Number Publication Date
JP2010152431A JP2010152431A (en) 2010-07-08
JP5219783B2 true JP5219783B2 (en) 2013-06-26

Family

ID=42571489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008326805A Expired - Fee Related JP5219783B2 (en) 2008-12-24 2008-12-24 Unauthorized access detection device, unauthorized access detection program, recording medium, and unauthorized access detection method

Country Status (1)

Country Link
JP (1) JP5219783B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112018015014A2 (en) * 2016-01-24 2018-12-18 Kamran Hasan Syed artificial intelligence based computer security system
WO2018159362A1 (en) * 2017-03-03 2018-09-07 日本電信電話株式会社 Log analysis apparatus, log analysis method, and log analysis program
US10656190B2 (en) * 2017-04-13 2020-05-19 Oracle International Corporation Non-parametric statistical behavioral identification ecosystem for electricity fraud detection
JP6749957B2 (en) * 2018-03-01 2020-09-02 日本電信電話株式会社 Detection device, detection method, and detection program
WO2019176080A1 (en) * 2018-03-16 2019-09-19 サスメド株式会社 Fraud detection system and fraud detection device

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3668642B2 (en) * 1999-06-30 2005-07-06 キヤノンシステムソリューションズ株式会社 Data prediction method, data prediction apparatus, and recording medium
JP4705390B2 (en) * 2005-03-25 2011-06-22 富士通株式会社 Demand forecasting device
JP2007233849A (en) * 2006-03-02 2007-09-13 Nippon Telegr & Teleph Corp <Ntt> Information communication service analyzing method and system
JP2007265317A (en) * 2006-03-30 2007-10-11 Hitachi Ltd Method and system for predicting the number of visitors
JP2008146157A (en) * 2006-12-06 2008-06-26 Mitsubishi Electric Corp Network abnormality decision device

Also Published As

Publication number Publication date
JP2010152431A (en) 2010-07-08

Similar Documents

Publication Publication Date Title
CN108537544B (en) Real-time monitoring method and monitoring system for transaction system
US9954882B2 (en) Automatic baselining of anomalous event activity in time series data
US10216560B2 (en) Integration based anomaly detection service
US10248528B2 (en) System monitoring method and apparatus
Davis et al. Detection of calibration drift in clinical prediction models to inform model updating
Vilalta et al. Predictive algorithms in the management of computer systems
US9704382B2 (en) Method for calculating error rate of alarm
EP2357562A1 (en) System for assisting with execution of actions in response to detected events, method for assisting with execution of actions in response to detected events, assisting device, and computer program
JP5219783B2 (en) Unauthorized access detection device, unauthorized access detection program, recording medium, and unauthorized access detection method
US20160255109A1 (en) Detection method and apparatus
US9372734B2 (en) Outage window scheduler tool
CN108664603A (en) A kind of method and device of abnormal polymerization value that repairing time series data
WO2021185182A1 (en) Anomaly detection method and apparatus
CN112131075A (en) Method and equipment for detecting abnormity of stored monitoring data
CN115643193A (en) Network traffic anomaly detection method, device, equipment and medium
US20230421441A1 (en) State-based entity behavior analysis
EP2882139A1 (en) System and method for IT servers anomaly detection using incident consolidation
Dittman et al. Cost variance investigation: Markovian control of Markov processes
CN110399903B (en) Abnormal data detection method and device and computer readable storage medium
US20200334596A1 (en) Anomaly detection framework
Pak et al. Dual-mode deadbeat H2 FIR filtering for discrete-time systems
US20230061829A1 (en) Outlier detection apparatus and method
CN111241155B (en) Time sequence data abnormality detection method, device, equipment and storage medium
US11768915B1 (en) System, method, and computer program for anomaly detection in time-series data with mixed seasonality
US11030214B2 (en) System for identification of outlier groups

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111024

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130305

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees