JP4130445B2 - Abnormal data detection apparatus, abnormal data detection program, and abnormal data detection method - Google Patents

Abnormal data detection apparatus, abnormal data detection program, and abnormal data detection method Download PDF

Info

Publication number
JP4130445B2
JP4130445B2 JP2005096380A JP2005096380A JP4130445B2 JP 4130445 B2 JP4130445 B2 JP 4130445B2 JP 2005096380 A JP2005096380 A JP 2005096380A JP 2005096380 A JP2005096380 A JP 2005096380A JP 4130445 B2 JP4130445 B2 JP 4130445B2
Authority
JP
Japan
Prior art keywords
name
cgi
statistical information
input
information storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005096380A
Other languages
Japanese (ja)
Other versions
JP2006277414A (en
Inventor
徹 今野
友也 田中
正道 楯岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2005096380A priority Critical patent/JP4130445B2/en
Publication of JP2006277414A publication Critical patent/JP2006277414A/en
Application granted granted Critical
Publication of JP4130445B2 publication Critical patent/JP4130445B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an abnormal data detection device, an abnormal data detection program and an abnormal data detection method for determining whether access data is normal even when statistical information for the access data is not available. <P>SOLUTION: This abnormal data detection device is provided with: a data analysis means for calculating feature quantity for each CGI variation name of access data; a statistical information storage means for accumulating and storing statistical information including the mean value of the feature quantity and standard deviation for each CGI name; a statistical processing execution means for updating the statistical information stored in the storage means; an access determining means for determining whether or not the CGI names are stored in the storage means; a statistical abnormality determining means for determining whether the access data is normal in comparison between the feature quantity and the statistical information; and a directory name determining means for determining whether the access data is normal in comparison between the directory names at which CGIs are positioned depending on the input CGI names, and the directory names included in the CGI names stored in the storage means. <P>COPYRIGHT: (C)2007,JPO&amp;INPIT

Description

本発明は、異常データ検出装置、異常データ検出プログラム及び異常データ検出方法に関する。   The present invention relates to an abnormal data detection device, an abnormal data detection program, and an abnormal data detection method.

インターネット等の通信ネットワークにおける異常データの検出として、ファイアウォール等を介して所定のIPアドレス及びポート番号から受信したパケットについては通過させない方法が一般的である。しかし、このファイアウォールで防ぐことのできない攻撃は多様であるが、その中で、ウェブサーバ上のセキュリティーホール、即ちオペレーティングシステムやブラウザなどのソフトウェアのバグや脆弱性を狙った攻撃も多い。例えば、HTTPリクエストに特定の文字列が含まれていると、そのHTTPリクエストが解読され実行されることにより、ウェブサーバ上で稼働しているCGI(Common gateway Interface)等のソフトウェアが、バッファオーバーフローなどにより予期せぬ動作を引き起こすといったことが挙げられる。この様なウェブサーバ上のソフトウェアの脆弱性を狙った攻撃に対応するために、クライアントからウェブサーバに送信されるHTTPリクエストをアプリケーション層で中継及び解析し、予め既知の攻撃の特徴を格納した攻撃パターンファイルと比較し、マッチした場合にセッション中継を遮断することにより、ウェブサーバを防御する方法がある(例えば、特許文献1)。   As a method for detecting abnormal data in a communication network such as the Internet, a method in which a packet received from a predetermined IP address and port number via a firewall or the like is generally not passed. However, there are a variety of attacks that cannot be prevented by this firewall. Among them, there are many attacks aimed at security holes on web servers, that is, bugs and vulnerabilities in software such as operating systems and browsers. For example, if a specific character string is included in an HTTP request, the HTTP request is decrypted and executed, so that software such as CGI (Common Gateway Interface) running on the web server may cause a buffer overflow, etc. Cause unexpected behavior. In order to respond to such attacks targeting web server vulnerabilities, HTTP requests sent from the client to the web server are relayed and analyzed at the application layer, and the known attack characteristics are stored in advance. There is a method of defending a web server by blocking session relay when it matches with a pattern file (for example, Patent Document 1).

このような方法だけでは、攻撃パターンファイルに格納されていない未知の攻撃からはウェブサーバを防御することができないので、これを補うため、統計的な判定により異常データを検知する技術が開発された(例えば、非特許文献1)。これによると、ウェブサーバなどインターネットに接続された装置に送信されたアクセスデータについて、アクセスデータに含まれる値の範囲や文字種別などを分析し、その平均値や分散を求め、統計的に異常とされる閾値を計算する。更にその閾値に基づいて、あるアクセスデータが統計的に正常であるか異常であるかを判定することにより、そのアクセスデータが異常データに関わるものであるか否かを検出する。この技術は、予め与えられた既知の異常パターン或いは正常パターンからだけでは検出できない、未知の異常データを検出できることが期待されている。
特開2002−063084号公報 ISSN 0919−6072 情報処理学会研究報告 情処研報 Vol.2003,No.74 2003年7月17日〜18日発行 発行人 社団法人 情報処理学会 p.91〜96 「HTTPリクエスト解析による未知攻撃防御システム」 今野 徹、楯岡 正道
Since this method alone cannot protect the web server from unknown attacks that are not stored in the attack pattern file, a technology that detects abnormal data by statistical judgment has been developed to compensate for this. (For example, Non-Patent Document 1). According to this, for access data sent to devices connected to the Internet, such as web servers, the range of values and character types included in the access data are analyzed, the average value and variance are obtained, and statistically abnormal. Calculate the threshold value. Further, based on the threshold, it is determined whether or not the access data is statistically normal or abnormal, thereby detecting whether or not the access data is related to the abnormal data. This technique is expected to be able to detect unknown abnormality data that cannot be detected only from a known abnormality pattern or a normal pattern given in advance.
JP 2002-063084 A ISSN 0919-6072 Information Processing Society of Japan Research Report 2003, No. 74 July 17-18, 2003 Issued by Information Processing Society of Japan p. 91-96 "Unknown attack defense system based on HTTP request analysis" Toru Konno, Masamichi Sasaoka

しかし、上記した技術では、値の範囲や文字種別などは、統計処理を行う時点でアクセスされたことのあるCGIの変数に関して計算された閾値にもとづき判定するのであって、未記憶すなわち初めて現れたCGIの変数については統計的な判定をすることが出来ない。この様なアクセスについても適切に判定しないと、未知の不正アクセスに関する検出率や誤検出率を改善させることは出来ない。   However, in the above-described technique, the value range, character type, and the like are determined based on a threshold value calculated for a CGI variable that has been accessed at the time of statistical processing, and are not stored, that is, appear for the first time. CGI variables cannot be statistically determined. Unless such an access is properly determined, the detection rate and the false detection rate regarding unknown unauthorized access cannot be improved.

従って本発明の目的は、予め統計情報が利用できないアクセスデータに対しても、正常なアクセスデータであるか否かを判定することができる異常データ検出装置、異常データ検出プログラム及び異常データ検出方法を提供することである。   Therefore, an object of the present invention is to provide an abnormal data detection device, an abnormal data detection program, and an abnormal data detection method capable of determining whether or not normal access data is obtained even for access data for which statistical information cannot be used in advance. Is to provide.

上記課題を解決するために、本発明の特徴に係る異常データ検出装置によれば、CGI名とCGI変数名とを含むアクセスデータが入力されると、入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数名毎に異常データの特徴を示す特徴量を算出するデータ解析手段と、データ解析手段で算出された特徴量の平均値、標準偏差を含む統計情報を入力されたアクセスデータに含まれるCGI名毎に蓄積して記憶する統計情報記憶手段と、特徴量の平均値と標準偏差を含む統計情報を生成し、統計情報記憶手段に記憶された統計情報を更新する統計処理実行手段と、統計情報記憶手段を参照して入力されたアクセスデータに含まれるCGI名が統計情報記憶手段に記憶されているか否かを判定するアクセス判定手段と、アクセス判定手段で前記CGI名が統計情報記憶手段に記憶されていると判定された場合、データ解析手段で算出された特徴量と統計情報記憶手段に記憶される統計情報とを比較して、前記入力されたアクセスデータが正常であるか否かを判定する統計的異常判定手段と、アクセス判定手段でCGI名が統計情報記憶手段に記憶されていないと判定された場合、入力されたCGI名からCGIが位置するディレクトリ名を抽出し、このディレクトリ名と統計情報記憶手段に記憶されるCGI名に含まれるディレクトリ名とを比較して、入力されたアクセスデータが正常であるか否かを判定するディレクトリ名判定手段を有することを特徴とする。   In order to solve the above-described problem, according to the abnormal data detection apparatus according to the feature of the present invention, when access data including a CGI name and a CGI variable name is input, the parameter value included in the input access data is Based on the data analysis means for calculating the feature quantity indicating the feature of the abnormal data for each CGI variable name, and the statistical information including the average value and the standard deviation of the feature quantity calculated by the data analysis means in the input access data Statistical information storage means for accumulating and storing for each included CGI name, statistical processing execution means for generating statistical information including an average value and standard deviation of feature values, and updating the statistical information stored in the statistical information storage means An access determination means for determining whether or not the CGI name included in the access data input with reference to the statistical information storage means is stored in the statistical information storage means; When it is determined that the CGI name is stored in the statistical information storage unit by the test determination unit, the feature amount calculated by the data analysis unit is compared with the statistical information stored in the statistical information storage unit, Statistical abnormality determination means for determining whether or not the input access data is normal, and when the access determination means determines that the CGI name is not stored in the statistical information storage means, from the input CGI name The directory name where the CGI is located is extracted, and this directory name is compared with the directory name included in the CGI name stored in the statistical information storage means to determine whether the input access data is normal or not. It has a directory name judging means.

上記構成による本発明によれば、予め統計情報が利用できないアクセスデータに対しても、正常なアクセスデータであるか否かを判定することができる。   According to the present invention having the above-described configuration, it is possible to determine whether or not access data for which statistical information is not available is normal access data.

本発明によれば、予め統計情報が利用できないアクセスデータに対しても、正常なアクセスデータであるか否かを判定することができる異常データ検出装置、異常データ検出プログラム及び異常データ検出方法を提供することができる。   According to the present invention, there is provided an abnormal data detection device, an abnormal data detection program, and an abnormal data detection method capable of determining whether or not normal access data is available even for access data for which statistical information cannot be used in advance. can do.

以下、図面を参照して、本発明の実施の形態を説明する。   Embodiments of the present invention will be described below with reference to the drawings.

<第1の実施の形態>
図1を参照して、本発明の第1の実施の形態に係る異常データ検出装置を説明する。本発明の第1の実施の形態に係る異常データ検出装置は、接続されるネットワークを介して入力されるアクセスデータに関して、未知の異常データを検出する。
<First Embodiment>
With reference to FIG. 1, an abnormal data detection apparatus according to a first embodiment of the present invention will be described. The abnormal data detection apparatus according to the first embodiment of the present invention detects unknown abnormal data with respect to access data input via a connected network.

異常データ検出装置1は、図1に示すように、データ解析部11、アクセス判定部12、統計的異常判定部13、ディレクトリ名判定部14、統計処理実行部15及び統計情報テーブル16を有している。   As shown in FIG. 1, the abnormal data detection apparatus 1 includes a data analysis unit 11, an access determination unit 12, a statistical abnormality determination unit 13, a directory name determination unit 14, a statistical processing execution unit 15, and a statistical information table 16. ing.

具体的には、異常データ検出装置1は、インターネットやイントラネットなどの第1のネットワークセグメント2から入力した図示しない第1のネットワークセグメント2に接続されたクライアントコンピュータから出力された第2のネットワークセグメント3に接続された図示しないサーバ(Webサーバ)に対するアクセスデータが正常なアクセスデータである場合、入力したアクセスデータを第2のネットワークセグメント3に通過させる。   Specifically, the abnormal data detection apparatus 1 includes a second network segment 3 output from a client computer connected to the first network segment 2 (not shown) input from the first network segment 2 such as the Internet or an intranet. When the access data for a server (Web server) (not shown) connected to is normal access data, the input access data is passed through the second network segment 3.

一方、異常データ検出装置1は、第1のネットワークセグメント2から入力したアクセスデータが異常なアクセスデータである場合、アクセスデータを第2のネットワークセグメント3に通過させることなく破棄するか、アクセスデータに異常なアクセスデータである可能性がある旨の付加情報を添付し、第2のネットワークセグメント3へ通過させる。   On the other hand, when the access data input from the first network segment 2 is abnormal access data, the abnormal data detection device 1 discards the access data without passing it through the second network segment 3 or sets the access data as access data. Additional information indicating that there is a possibility of abnormal access data is attached and passed to the second network segment 3.

ここで、アクセスデータは、例えばHTTPリクエスト、SMTPリクエストなどの通信プロトコルに基づく情報である。異常データ検出装置1は、例えば一般的なコンピュータに異常データ検出プログラムなどのソフトウェアプログラムがインストールされ、そのソフトウェアプログラムが中央処理制御装置において実行されることにより実現される。   Here, the access data is information based on a communication protocol such as an HTTP request or an SMTP request. The abnormal data detection apparatus 1 is realized, for example, by installing a software program such as an abnormal data detection program in a general computer and executing the software program in the central processing control apparatus.

図2に示すように、本発明の第1の実施の形態に係る異常データ検出装置1は、中央処理制御装置101、ROM(Read Only Memory)102、RAM(Random Access Memory)103及び入出力インタフェース109が、バス110を介して接続されている。入出力インタフェース109には、入力装置104、表示装置105、通信制御装置106、記憶装置107及びリムーバブルディスク108が接続されている。   As shown in FIG. 2, the abnormal data detection apparatus 1 according to the first embodiment of the present invention includes a central processing control device 101, a ROM (Read Only Memory) 102, a RAM (Random Access Memory) 103, and an input / output interface. 109 are connected via the bus 110. An input device 104, a display device 105, a communication control device 106, a storage device 107, and a removable disk 108 are connected to the input / output interface 109.

中央処理制御装置101は、入力装置104からの入力信号に基づいてROM102から異常データ検出装置1を起動するためのブートプログラムを読み出して実行し、更に記憶装置107に記憶されたオペレーティングシステムを読み出す。更に中央処理制御装置101は、入力装置104や通信制御装置106などの入力信号に基づいて、各種装置の制御を行い、RAM103や記憶装置107などに記憶されたプログラム及びデータを読み出してRAM103にロードするとともに、RAM103から読み出されたプログラムのコマンドに基づいて、データの計算又は加工など、後述する一連の処理を実現する処理装置である。   The central processing control device 101 reads out and executes a boot program for starting up the abnormal data detection device 1 from the ROM 102 based on an input signal from the input device 104, and further reads out an operating system stored in the storage device 107. Further, the central processing control device 101 controls various devices based on input signals from the input device 104, the communication control device 106, etc., reads out programs and data stored in the RAM 103, the storage device 107, etc., and loads them into the RAM 103. In addition, the processing device implements a series of processes to be described later, such as data calculation or processing, based on a program command read from the RAM 103.

入力装置104は、操作者が各種の操作を入力するキーボード、マウスなどの入力デバイスにより構成されており、操作者の操作に基づいて入力信号を作成し、入出力インタフェース109及びバス111を介して中央処理制御装置101に送信される。表示装置105は、CRT(Cathode Ray Tube)ディスプレイや液晶ディスプレイなどであり、中央処理制御装置101からバス110及び入出力インタフェース109を介して表示装置105において表示させる出力信号を受信し、例えば中央処理制御装置101の処理結果などを表示する装置である。通信制御装置106は、LANカードやモデムなどの装置であり、異常データ検出装置を1インターネットやLANなどの通信ネットワークに接続する装置である。通信制御装置106を介して通信ネットワークと送受信したデータは入力信号又は出力信号として、入出力インタフェース109及びバス110を介して中央処理制御装置101に送受信される。   The input device 104 includes input devices such as a keyboard and a mouse through which an operator inputs various operations. The input device 104 generates an input signal based on the operation of the operator, and inputs via the input / output interface 109 and the bus 111. It is transmitted to the central processing control apparatus 101. The display device 105 is a CRT (Cathode Ray Tube) display, a liquid crystal display, or the like. The display device 105 receives an output signal to be displayed on the display device 105 from the central processing control device 101 via the bus 110 and the input / output interface 109. It is a device that displays the processing result of the control device 101 and the like. The communication control device 106 is a device such as a LAN card or a modem, and is a device that connects the abnormal data detection device to a communication network such as 1 Internet or LAN. Data transmitted / received to / from the communication network via the communication control device 106 is transmitted / received to / from the central processing control device 101 via the input / output interface 109 and the bus 110 as an input signal or an output signal.

記憶装置107は磁気ディスク装置であって、中央処理制御装置101で実行されるプログラムやデータが記憶されている。リムーバブルディスク108は、光ディスクやフレキシブルディスクのことであり、ディスクドライブによって読み書きされた信号は、入出力インタフェース109及びバス110を介して中央処理制御装置101に送受信される。   The storage device 107 is a magnetic disk device, and stores programs and data executed by the central processing control device 101. The removable disk 108 is an optical disk or a flexible disk, and signals read / written by the disk drive are transmitted / received to / from the central processing control apparatus 101 via the input / output interface 109 and the bus 110.

本発明の第1の実施の形態に係る異常データ検出装置1の記憶装置107には、異常データ検出プログラムが記憶されるとともに、統計情報テーブル16が記憶される。また、異常データ検出プログラムが異常データ検出装置1の中央処理制御装置101に読み込まれ実行されることによって、データ解析部11、アクセス判定部12、統計的異常判定部13、ディレクトリ名判定部14及び統計処理実行部15が異常データ検出装置1に実装される。   The storage device 107 of the abnormal data detection apparatus 1 according to the first embodiment of the present invention stores an abnormal data detection program and a statistical information table 16. In addition, the abnormal data detection program is read and executed by the central processing control device 101 of the abnormal data detection apparatus 1 so that the data analysis unit 11, the access determination unit 12, the statistical abnormality determination unit 13, the directory name determination unit 14, and the A statistical processing execution unit 15 is mounted on the abnormal data detection apparatus 1.

データ解析部11は、接続される第1のネットワークセグメント2からアクセスデータが入力されると、入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数毎に異常データの特徴を示す特徴量を算出する。また、データ解析部11は、算出した特徴量をアクセスデータとともにアクセス判定部12に出力する。   When the access data is input from the connected first network segment 2, the data analysis unit 11 is a feature amount indicating the characteristic of abnormal data for each CGI variable based on the parameter value included in the input access data. Is calculated. Further, the data analysis unit 11 outputs the calculated feature amount to the access determination unit 12 together with the access data.

図3は、第1のネットワークセグメントから異常データ検出装置1に入力されるアクセスデータの一例である。例えばデータ解析部11は、図3に示すようなHTTPリクエストのアクセスデータを解析してパラメータ値の特徴量を算出する。図3に示すアクセスデータを入力して解析する場合、データ解析部11は、CGI変数名1である変数「P」のパラメータ値1として数値である「123」を切り出す。また、CGI変数名2である変数「Q」のパラメータ値2としてASCII文字である「user」、CGI変数名3である変数「R」のパラメータ値3として数値である「456」を切り出す。各CGI変数名の値を切り出すと、データ解析部11は、切り出した値に基づいて特徴量を算出する。特徴量については、図7及び図8を用いて後述する。   FIG. 3 is an example of access data input to the abnormal data detection apparatus 1 from the first network segment. For example, the data analysis unit 11 analyzes the access data of the HTTP request as shown in FIG. 3 and calculates the feature value of the parameter value. When the access data shown in FIG. 3 is input and analyzed, the data analysis unit 11 cuts out the numerical value “123” as the parameter value 1 of the variable “P” that is the CGI variable name 1. Further, “user” that is an ASCII character is extracted as the parameter value 2 of the variable “Q” that is the CGI variable name 2, and “456” that is a numerical value is extracted as the parameter value 3 of the variable “R” that is the CGI variable name 3. When the value of each CGI variable name is cut out, the data analysis unit 11 calculates a feature amount based on the cut out value. The feature amount will be described later with reference to FIGS.

アクセス判定部12は、統計情報テーブル16を読み出して、入力されたアクセスデータに含まれるCGI名が統計情報テーブル16に存在するか否かを判定する。   The access determination unit 12 reads the statistical information table 16 and determines whether or not the CGI name included in the input access data exists in the statistical information table 16.

また、アクセス判定部12で統計情報テーブル16を参照した結果、該当するCGI名が統計情報テーブル16に存在すると判定された場合、アクセス判定部12は、アクセスデータと特徴量を統計的異常判定部13に対して出力する。一方、アクセス判定部12で統計情報テーブル16を参照した結果、該当するCGI名が統計情報テーブル16に存在しないと判定された場合、アクセス判定部12は、アクセスデータをディレクトリ名判定部14に対して出力する。   Further, as a result of referring to the statistical information table 16 by the access determination unit 12, when it is determined that the corresponding CGI name exists in the statistical information table 16, the access determination unit 12 displays the access data and the feature amount as a statistical abnormality determination unit. 13 is output. On the other hand, as a result of referring to the statistical information table 16 by the access determination unit 12, when it is determined that the corresponding CGI name does not exist in the statistical information table 16, the access determination unit 12 sends the access data to the directory name determination unit 14. Output.

統計的異常判定部13は、アクセス判定部12からアクセスデータと特徴量を入力すると、入力した特徴量と統計情報テーブル16に記憶される統計情報とを比較することにより、入力されたアクセスデータが正常であるか否かを判定する。また、統計的異常判定部13は、判定結果に基づいて、アクセスデータを第2のネットワークセグメント3に送信する。さらに、統計的異常判定部13は、判定結果に基づいて、特徴量を統計処理実行部15に出力する。   When the statistical abnormality determination unit 13 receives the access data and the feature amount from the access determination unit 12, the statistical abnormality determination unit 13 compares the input feature amount with the statistical information stored in the statistical information table 16. It is determined whether or not it is normal. Further, the statistical abnormality determination unit 13 transmits the access data to the second network segment 3 based on the determination result. Further, the statistical abnormality determination unit 13 outputs the feature amount to the statistical processing execution unit 15 based on the determination result.

具体的には、アクセスデータの特徴量に基づいた統計分布が算出された統計的に異常とみなしうる閾値を利用してアクセスデータが正常であるか否かを判定する。たとえば、パラメータ値について求められた特徴量が式1のf(x)の範囲内の場合、このパラメータ値を正常であると判定し、範囲外のときにパラメータ値を異常であると判定する。   Specifically, it is determined whether or not the access data is normal by using a statistically calculated threshold that can be regarded as statistically abnormal based on the feature amount of the access data. For example, when the feature amount obtained for the parameter value is within the range of f (x) in Expression 1, it is determined that the parameter value is normal, and when it is out of the range, the parameter value is determined to be abnormal.

μmn−Amn×σmn≦f(x)mn≦μmn+Amn×σmn ・・・(式1)
式1における平均値μと標準偏差σは、アクセスデータの特徴量の統計を取ることにより、図4に示すように決定される。この閾値係数Aは、本発明の第1の実施の形態に係る異常データ検出装置1では、「数値」、「メタキャラクタ」及び「バイナリコード」に対して、それぞれのパラメータ値に応じて定められる値である。具体的には、2〜11程度の値とするのが実用上好ましいが、これに限られず、最良の値が設定される。
μ mn −A mn × σ mn ≦ f (x) mn ≦ μ mn + A mn × σ mn (Equation 1)
The average value μ and the standard deviation σ in Equation 1 are determined as shown in FIG. 4 by taking the statistics of the feature amount of the access data. In the abnormal data detection apparatus 1 according to the first embodiment of the present invention, the threshold coefficient A is determined according to each parameter value for “numerical value”, “metacharacter”, and “binary code”. Value. Specifically, a value of about 2 to 11 is practically preferable, but is not limited to this, and the best value is set.

アクセスデータに含まれる全てのパラメータ値について正常と判定されると、統計的異常判定部13は、アクセスデータを正常なアクセスデータであると判定する。また、異常であると判定されたパラメータ値が含まれていた場合、アクセスデータは異常なアクセスデータであると判定する。   When it is determined that all parameter values included in the access data are normal, the statistical abnormality determination unit 13 determines that the access data is normal access data. If the parameter value determined to be abnormal is included, the access data is determined to be abnormal access data.

ディレクトリ名判定部14は、アクセス判定部12からアクセスデータを入力すると、入力したアクセスデータのCGI名からディレクトリ名と実CGI名とを抽出し、抽出した実CGI名に基づいて入力されたアクセスデータが正常であるか否かを判定する。また、ディレクトリ名判定部14は、判定結果に基づいて、アクセスデータを第2のネットワークセグメント3に送信する。さらに、ディレクトリ名判定部14は、アクセスデータに含まれるCGI名を統計情報テーブル16に蓄積して記憶させてもよい。   When the access data is input from the access determination unit 12, the directory name determination unit 14 extracts the directory name and the real CGI name from the CGI name of the input access data, and the access data input based on the extracted real CGI name It is determined whether or not is normal. Further, the directory name determination unit 14 transmits access data to the second network segment 3 based on the determination result. Further, the directory name determination unit 14 may accumulate and store the CGI name included in the access data in the statistical information table 16.

なお、ここでいう実CGI名とは、CGIがファイルとして実装されるように通常のファイル名を示す文字列であって、CGI名における最右のディレクトリ区切り文字(一般的に「/」、「\」や「¥」等の文字)より右側の文字列をいう。すなわち、最右のディレクトリ区切り文字とは、すなわちCGI名における最も後の区切り文字であり、最右の区切り文字よりも右側の文字列とは、最右の区切り文字よりも後側の文字列である。   The actual CGI name here is a character string indicating a normal file name so that the CGI is implemented as a file, and the rightmost directory delimiter (generally “/”, “ Characters on the right side of characters such as “\” and “¥”. That is, the rightmost directory delimiter is the last delimiter in the CGI name, and the character string on the right side of the rightmost delimiter is the character string on the rear side of the rightmost delimiter. is there.

また、ここでいうディレクトリ名とは、CGIのファイルを格納する場所を表すディレクトリ名を示す文字列であって、CGI名における最右のディレクトリ区切り文字より左側の文字列をいう。すなわち、最後のディレクトリ区切り文字より前の文字列がディレクトリ名である。   The directory name here is a character string indicating a directory name indicating a location where a CGI file is stored, and is a character string on the left side of the rightmost directory delimiter in the CGI name. That is, the character string before the last directory delimiter is the directory name.

具体的には、統計情報テーブル16を参照し、同一のディレクトリ名が存在する場合、ディレクトリ名判定部14は、入力されたアクセスデータは正常であると判定する。これは、学習期間の制約上、あらかじめ記憶出来ないCGIであっても、同一ディレクトリに他のCGIが存在することを根拠にして、誤検知を排除するものである。   Specifically, referring to the statistical information table 16, if the same directory name exists, the directory name determination unit 14 determines that the input access data is normal. This eliminates false detection on the basis that another CGI exists in the same directory even if the CGI cannot be stored in advance due to restrictions on the learning period.

一方、統計情報テーブル16を参照し、同一のディレクトリ名が存在しない場合、入力されたアクセスデータは異常であると判定する。これは、現実的に正当なアクセスであるディレクトリには複数の正当なCGIが含まれているという傾向と、攻撃のアクセスで使用されるディレクトリ名は正当なものとは大きく異なっているという傾向とを利用したものである。   On the other hand, referring to the statistical information table 16, if the same directory name does not exist, it is determined that the input access data is abnormal. This is because there is a tendency that a directory that is actually legitimate access includes a plurality of legitimate CGIs, and that a directory name used for attack access is significantly different from a legitimate one. Is used.

図5は、アクセスデータからディレクトリ名と実CGI名とを抽出する一例を説明する図である。図5に示すアクセスデータが入力されると、ディレクトリ名判定部14は、最右のディレクトリ区切り文字よりも右側の文字列である「cgi-bin/users/bob」をディレクトリ名としてCGI名から抽出し、また、最右のディレクトリ区切り文字よりも左側の文字列である「search.cgi」を実CGI名として抽出する。   FIG. 5 is a diagram illustrating an example of extracting a directory name and a real CGI name from access data. When the access data shown in FIG. 5 is input, the directory name determination unit 14 extracts “cgi-bin / users / bob”, which is a character string on the right side of the rightmost directory delimiter, from the CGI name as a directory name. In addition, “search.cgi”, which is a character string on the left side of the rightmost directory delimiter, is extracted as an actual CGI name.

こうして得られたディレクトリ名について、ディレクトリ名判定部14は、統計情報テーブル16に記憶される各CGI名を参照し、同一のディレクトリ名が存在するか否かを検索する。   For the directory name thus obtained, the directory name determination unit 14 refers to each CGI name stored in the statistical information table 16 and searches whether the same directory name exists.

なお、正常と判定されたディレクトリ名を含むCGI名を統計情報テーブル16に記憶させた場合、その後、さらに同じCGI名を含むアクセスデータが入力され、統計情報テーブル16に蓄積して記憶して十分なアクセス回数のデータが得られた後は、このCGI名を含むアクセスデータが入力された場合、統計的異常判定をすることが出来るようになる。   If the CGI name including the directory name determined to be normal is stored in the statistical information table 16, then access data including the same CGI name is further input and accumulated and stored in the statistical information table 16. After the data of the number of times of access is obtained, when the access data including the CGI name is input, it becomes possible to make a statistical abnormality determination.

統計情報テーブル16は、特徴量の平均値、標準偏差及びアクセス回数を含む統計情報を記憶している。例えば図6に示すように、各CGI名とCGI変数名の組み合わせについて統計情報を記憶する。図6(a)に示す例では、統計情報テーブル16は、CGI名とCGI変数名の組み合わせについて統計情報に対応するポインタ変数が記述されている。   The statistical information table 16 stores statistical information including an average value of feature values, a standard deviation, and the number of accesses. For example, as shown in FIG. 6, statistical information is stored for each combination of CGI name and CGI variable name. In the example shown in FIG. 6A, the statistical information table 16 describes pointer variables corresponding to statistical information for combinations of CGI names and CGI variable names.

たとえば、CGI名b及びCGI変数名2と関連付けられる統計情報2bとして記憶されるポインタ変数は、図6(b)に示す統計情報2bと関連付けられている。図6(b)に示す統計情報2bは、「数値」、「メタキャラクタ」及び「バイナリコード」に対して、特徴量に基づいて求められた「平均値」及び「標準偏差」を記憶している。また、統計情報2bは、このCGI名とCGI変数名の組み合わせに対する「アクセス回数」を記憶している。   For example, a pointer variable stored as statistical information 2b associated with CGI name b and CGI variable name 2 is associated with statistical information 2b shown in FIG. The statistical information 2b shown in FIG. 6B stores “average value” and “standard deviation” obtained based on the feature amount for “numerical value”, “metacharacter”, and “binary code”. Yes. Further, the statistical information 2b stores “access count” for the combination of the CGI name and the CGI variable name.

統計処理実行部15は、データ解析部11において算出された特徴量のうちアクセスデータとして正常と判定されたアクセスデータについて、平均値と標準偏差とアクセス回数とを含む統計情報を生成する。そして、生成された統計情報を統計情報テーブル16に記憶させる。   The statistical processing execution unit 15 generates statistical information including an average value, a standard deviation, and the number of accesses for the access data determined to be normal as the access data among the feature amounts calculated by the data analysis unit 11. Then, the generated statistical information is stored in the statistical information table 16.

特徴量の計算にあっては、Webサーバに対するアクセスデータとして入力されたパケットデータに含まれているCGI変数名の値(パラメータ)から求められた特徴量をCGI変数名に対する特徴量として扱う。   In the calculation of the feature amount, the feature amount obtained from the value (parameter) of the CGI variable name included in the packet data input as access data to the Web server is handled as the feature amount for the CGI variable name.

例えばアクセスデータとして図7に示す第1〜第4のパケットデータが入力された場合は、CGI変数の「数値」、「メタキャラクタ」及び「バイナリコード」について求められた特徴量は、図8に示すような数値データとして表現される。「メタキャラクタ」とは、HTTP等の通信プロトコルにおいて特殊な意味を持つ文字のことである。   For example, when the first to fourth packet data shown in FIG. 7 are input as the access data, the feature quantities obtained for the “numerical value”, “metacharacter”, and “binary code” of the CGI variables are shown in FIG. It is expressed as numerical data as shown. The “metacharacter” is a character having a special meaning in a communication protocol such as HTTP.

図7(a)は、第1のパケットデータであり、CGI変数名2の「Q」の値は数値「12345」である。また、図7(b)は、第2のパケットデータであり、CGI変数名2の「Q」の値はASCII文字「abcde」である。さらに、図7(c)は、第3のパケットデータであり、CGI変数名2の「Q」の値はメタキャラクタ「”‘;」である。さらに、図7(d)は、第4のパケットデータであり、CGI変数名2の「Q」値はバイナリコード「△△△△」である。なお、この「△」はバイナリコードを仮想的に図示している。また、ここで「cgi-bin/users/bob/search.cgi」は「CGI名b」である。   FIG. 7A shows the first packet data, and the value of “Q” in the CGI variable name 2 is the numerical value “12345”. FIG. 7B shows second packet data, and the value of “Q” in CGI variable name 2 is the ASCII character “abcde”. Further, FIG. 7C shows the third packet data, and the value of “Q” in the CGI variable name 2 is the metacharacter “” ′; ”. FIG. 7D shows the fourth packet data, and the “Q” value of the CGI variable name 2 is the binary code “ΔΔΔΔ”. Note that this “Δ” virtually illustrates the binary code. Here, “cgi-bin / users / bob / search.cgi” is “CGI name b”.

このように、第1〜第4のパケットデータに含まれるCGI変数名2である「Q」の値について、パラメータ値における「数値」、「メタキャラクタ」及び「バイナリコード」の総数を特徴量として扱う。   Thus, for the value of “Q” that is CGI variable name 2 included in the first to fourth packet data, the total number of “numerical value”, “metacharacter”, and “binary code” in the parameter value is used as a feature amount. deal with.

図8は、図7で示したアクセスデータを例にして生成された特徴量データの一例である。第1のパケットデータの「Q」のパラメータ値に「数値」が含まれる数は「5」であり、「メタキャラクタ」及び「バイナリコード」は含まれていない。そのため、第1のパケットデータの特徴量は、それぞれ「5、0、0」となる。また、第2のパケットデータの「Q」のパラメータ値には「数値」、「メタキャラクタ」及び「バイナリコード」のいずれも含まれていないため、第2のパケットデータの特徴量は、それぞれ「0、0、0」となる。同様に第3のパケットデータでは「メタキャラクタ」が3つ含まれているから特徴量は「0、3、0」となり、第4のパケットデータでは「バイナリコード」が4つ含まれているから特徴量は「0、0、4」となる。   FIG. 8 is an example of feature data generated using the access data shown in FIG. 7 as an example. The number including “numerical value” in the parameter value of “Q” of the first packet data is “5”, and “metacharacter” and “binary code” are not included. Therefore, the feature amounts of the first packet data are “5, 0, 0”, respectively. Since the parameter value of “Q” of the second packet data does not include any of “numerical value”, “metacharacter”, and “binary code”, the feature amount of the second packet data is “ 0, 0, 0 ". Similarly, since the third packet data includes three “metacharacters”, the feature amount is “0, 3, 0”, and the fourth packet data includes four “binary codes”. The feature amount is “0, 0, 4”.

なお、図6(b)に示した統計情報2bは、この図8に示した特徴量に基づいて生成されたものであって、統計処理実行部15により計算される。例えば、「数値」の「平均値」は、第1〜第4のパケットデータの「数値」の特徴量の合計である「5」をアクセス回数「4」で割ることにより求めている。また、「メタキャラクタ」と「バイナリコード」に対する「平均値」も第1から第4のパケットデータの「メタキャラクタ」と「バイナリコード」の特徴量の合計をアクセス回数「4」で割ることにより求めている。また、「標準偏差」は、第1から第4のパケットデータの特徴量及び平均値を利用して求める。   The statistical information 2b shown in FIG. 6B is generated based on the feature quantity shown in FIG. 8, and is calculated by the statistical processing execution unit 15. For example, the “average value” of “numerical values” is obtained by dividing “5”, which is the sum of the “numerical value” feature amounts of the first to fourth packet data, by the access count “4”. Also, the “average value” for “metacharacter” and “binary code” is also obtained by dividing the total of the feature quantities of “metacharacter” and “binary code” of the first to fourth packet data by the number of accesses “4”. Seeking. The “standard deviation” is obtained by using the feature values and average values of the first to fourth packet data.

(異常データ検出処理)
次に、図9に示すフローチャートを参照して、本発明の第1の実施の形態に係る異常データ検出装置1における異常データ検出処理を説明する。
(Abnormal data detection processing)
Next, the abnormal data detection process in the abnormal data detection apparatus 1 according to the first embodiment of the present invention will be described with reference to the flowchart shown in FIG.

異常データ検出装置1のデータ解析部11に、異常データ検出装置1と接続される第1のネットワークセグメント2を介してアクセスデータが入力されると(S001でYES)、データ解析部11は、アクセスデータを解析して特徴量を算出し、入力したアクセスデータと共に出力する(S002)。   When access data is input to the data analysis unit 11 of the abnormal data detection device 1 via the first network segment 2 connected to the abnormal data detection device 1 (YES in S001), the data analysis unit 11 The feature amount is calculated by analyzing the data, and is output together with the input access data (S002).

アクセスデータは図3に示したようなHTTPリクエストのアクセスデータである。特徴量の算出は、図8に示したようにデータの「数値」、「メタキャラクタ」及び「バイナリコード」の各文字種類についての数を求めることにより、算出される。   The access data is HTTP request access data as shown in FIG. The feature amount is calculated by obtaining the number of each character type of “numerical value”, “metacharacter”, and “binary code” of the data as shown in FIG.

アクセス判定部12は、アクセスデータと特徴量を入力すると、入力されたアクセスデータのCGI名が統計情報テーブル16に存在するか否かを判定する(S003)。   When the access data and the feature amount are input, the access determination unit 12 determines whether or not the CGI name of the input access data exists in the statistical information table 16 (S003).

ステップS003の判定でアクセスデータのCGI名が統計情報テーブルに存在する場合(S003でYES)、アクセス判定部12は、入力されたアクセスデータに含まれるCGI変数について正常/異常の判定処理を実行し、アクセスデータ及び特徴量とともに統計的異常判定部13に出力する(S004)。正常/異常の判定処理としては具体的に、ステップS002で算出された特徴量が規定の範囲内である場合、CGI変数に対する値を正常と判定する。また、特徴量が規定の範囲外である場合、CGI変数に対する値を異常と判定する。   If the CGI name of the access data exists in the statistical information table in the determination in step S003 (YES in S003), the access determination unit 12 performs normal / abnormal determination processing for the CGI variable included in the input access data. The access data and the feature amount are output to the statistical abnormality determination unit 13 (S004). Specifically, the normal / abnormal determination process determines that the value for the CGI variable is normal when the feature amount calculated in step S002 is within a specified range. If the feature amount is outside the specified range, the value for the CGI variable is determined to be abnormal.

統計的異常判定部13は、アクセス判定部からアクセスデータ及び特徴量を入力すると、アクセスデータに含まれている全てのCGI変数のパラメータ値が正常であるか否かを判定する。例えば、図3に示したアクセスデータの場合、CGI名変数1〜3のパラメータ値の全てが「正常」であるか否かを判定する(S005)。   When the statistical abnormality determination unit 13 inputs the access data and the feature amount from the access determination unit, the statistical abnormality determination unit 13 determines whether or not the parameter values of all the CGI variables included in the access data are normal. For example, in the case of the access data shown in FIG. 3, it is determined whether or not all the parameter values of the CGI name variables 1 to 3 are “normal” (S005).

アクセスデータに含まれていた全てのCGI変数が「正常」である場合(S005でYES)、統計的異常判定部13は、アクセスデータを「正常」であると判定する(S006)。一方、アクセスデータに「異常」と判定されたCGI変数が一つでも含まれていた場合(S005でNO)、統計的異常判定部13は、アクセスデータを「異常」と判定する(S007)。   If all the CGI variables included in the access data are “normal” (YES in S005), the statistical abnormality determination unit 13 determines that the access data is “normal” (S006). On the other hand, when the access data includes at least one CGI variable determined to be “abnormal” (NO in S005), the statistical abnormality determination unit 13 determines that the access data is “abnormal” (S007).

ステップS007において、入力されたアクセスデータを「正常」であると判定すると、統計的異常判定部13は、算出された特徴量を統計処理実行部15に出力する(S008)。   If it is determined in step S007 that the input access data is “normal”, the statistical abnormality determination unit 13 outputs the calculated feature value to the statistical processing execution unit 15 (S008).

統計処理実行部15は、得られた特徴量から統計情報を再計算するとともに、算出した統計情報について統計情報テーブル16を更新して記憶させる(S009)。   The statistical processing execution unit 15 recalculates the statistical information from the obtained feature amount, and updates and stores the statistical information table 16 for the calculated statistical information (S009).

その後、統計的異常判定部13は、判定結果に基づいてアクセスデータを第2のネットワークセグメント3に送出する(S010)。   Thereafter, the statistical abnormality determination unit 13 sends the access data to the second network segment 3 based on the determination result (S010).

ステップS003において、アクセスデータのCGI名が統計情報テーブル16に存在しないと判定された場合(S003でNO)、アクセス判定部12は、算出された特徴量及びアクセスデータをディレクトリ名判定部14に出力し、ディレクトリ名判定部14は、ディレクトリ名判定処理を実行する(S011)。このステップS011におけるディレクトリ名判定処理については、後に詳述する。   If it is determined in step S003 that the CGI name of the access data does not exist in the statistical information table 16 (NO in S003), the access determination unit 12 outputs the calculated feature amount and access data to the directory name determination unit 14 Then, the directory name determination unit 14 executes a directory name determination process (S011). The directory name determination process in step S011 will be described in detail later.

(ディレクトリ名判定処理)
続いて、図10に示すフローチャートを用いて、ステップS011のディレクトリ名判定処理について説明する。
(Directory name judgment processing)
Next, the directory name determination process in step S011 will be described using the flowchart shown in FIG.

ディレクトリ名判定部14は、アクセスデータからディレクトリ名を抽出する(S201)。ディレクトリ名の抽出は、図5を用いて上述したように、最右のディレクトリ区切り文字を利用して行う。続いて、ディレクトリ名判定部14は、当該ディレクトリ名と同一のディレクトリ名を持つCGI名が統計情報テーブル16に存在するか否かを判定する(S202)。   The directory name determination unit 14 extracts a directory name from the access data (S201). The directory name is extracted by using the rightmost directory delimiter as described above with reference to FIG. Subsequently, the directory name determination unit 14 determines whether or not a CGI name having the same directory name as the directory name exists in the statistical information table 16 (S202).

ステップS202において、当該ディレクトリ名が統計情報テーブル16に存在することが判定された場合(S202でYES)、ディレクトリ名判定部14は、入力されたアクセスデータを「正常」であると判定し(S203)、アクセスデータのCGI名を統計情報テーブル16を更新して記憶させる(S204)。   When it is determined in step S202 that the directory name exists in the statistical information table 16 (YES in S202), the directory name determination unit 14 determines that the input access data is “normal” (S203). ), The statistical information table 16 is updated and stored in the CGI name of the access data (S204).

一方、ステップS202において、当該ディレクトリ名が統計情報テーブル16に存在しないことが判定された場合(S202でNO)、ディレクトリ名判定部14は、入力されたアクセスデータを「異常」と判定する(S205)。   On the other hand, when it is determined in step S202 that the directory name does not exist in the statistical information table 16 (NO in S202), the directory name determination unit 14 determines that the input access data is “abnormal” (S205). ).

その後、ディレクトリ名判定部14は、判定結果に基づいて、第1のネットワークセグメント2から入力したアクセスデータを第2のネットワークセグメント3に送出する(S206)。具体的には上述したように、アクセスデータが正常なアクセスデータである場合、入力したアクセスデータを第2のネットワークセグメント3に通過させる。一方、アクセスデータが異常なアクセスデータである場合、アクセスデータを第2のネットワークセグメント3に通過させることなく破棄するか、アクセスデータに異常なアクセスデータである可能性がある旨の付加情報を添付し、第2のネットワークセグメント3へ通過させる。   Thereafter, the directory name determination unit 14 sends the access data input from the first network segment 2 to the second network segment 3 based on the determination result (S206). Specifically, as described above, when the access data is normal access data, the input access data is passed through the second network segment 3. On the other hand, if the access data is abnormal access data, the access data is discarded without passing through the second network segment 3, or additional information is attached to the access data that may be abnormal access data. To the second network segment 3.

上述したように、本発明の第1の実施の形態によれば、本来正常なアクセスを誤って攻撃と判定される誤検知が削減される。また、統計的な判定が出来ない場合でも、あらかじめ記憶していないCGI名であっても、同一ディレクトリに他のCGI名が存在するかどうかを根拠にし、未知の攻撃の検知率を維持することが出来る。   As described above, according to the first embodiment of the present invention, false detection in which normal access is erroneously determined as an attack is reduced. In addition, even if statistical determination cannot be made, even if the CGI name is not stored in advance, the detection rate of unknown attacks should be maintained based on whether another CGI name exists in the same directory. I can do it.

<第2の実施の形態>
図11を参照して、本発明の第2の実施の形態に係る異常データ検出装置1aを説明する。
<Second Embodiment>
With reference to FIG. 11, an abnormal data detection apparatus 1a according to a second embodiment of the present invention will be described.

本発明の第2の実施の形態に係る異常データ検出装置1aは、第1の実施の形態に係る異常データ検出装置1と比較して、ディレクトリ名判定部14aに、アクセス数参照手段141を有する点で異なる。他の構成については、上述した実施の形態1に係る異常データ検出装置1と同一であるため、説明を省略する。   The abnormal data detection device 1a according to the second embodiment of the present invention has an access number reference means 141 in the directory name determination unit 14a, as compared with the abnormal data detection device 1 according to the first embodiment. It is different in point. Since other configurations are the same as those of the abnormal data detection apparatus 1 according to the first embodiment described above, the description thereof is omitted.

アクセス数参照手段141は、アクセスデータが正常か異常を判定するため、統計情報テーブル16を参照し、同一のディレクトリ名をもつCGI名を検索する際、検索されたCGI名のアクセス回数を参照する。   The access number reference unit 141 refers to the statistical information table 16 to determine whether the access data is normal or abnormal, and refers to the access count of the retrieved CGI name when searching for a CGI name having the same directory name. .

参照したアクセス数が予め定められる所定数以上のアクセス数である場合、ディレクトリ名判定部14aは、入力されたアクセスデータを「正常」と判定し、アクセス数が所定数以上のアクセス数でない場合、入力されたアクセスデータを「異常」と判定する。また、ディレクトリ名判定部14bは、判定結果に基づいて、アクセスデータを第2のネットワークセグメント3に送出する。   When the referred access number is a predetermined access number or more, the directory name determination unit 14a determines that the input access data is “normal”, and when the access number is not the predetermined access number or more, It is determined that the input access data is “abnormal”. Further, the directory name determination unit 14 b sends the access data to the second network segment 3 based on the determination result.

ここで、CGI名ごとのアクセス数を保持するために、本発明の第2の実施の形態に係る異常データ検出装置1aの統計情報テーブル16aは、図12に示す様に、アクセス回数を記憶している。   Here, in order to hold the number of accesses for each CGI name, the statistical information table 16a of the abnormal data detection apparatus 1a according to the second embodiment of the present invention stores the number of accesses as shown in FIG. ing.

図12(a)の統計情報テーブル16aにおいては、各CGI名毎にアクセス回数を記憶するようになっている。このアクセス回数は、当該CGI名における各々のCGI変数のアクセス回数(すなわち図12(b)におけるアクセス回数)の合計として計算される。   In the statistical information table 16a in FIG. 12A, the number of accesses is stored for each CGI name. This number of accesses is calculated as the sum of the number of accesses of each CGI variable in the CGI name (that is, the number of accesses in FIG. 12B).

図13を用いて、異常データ検出装置1aに入力されたアクセスデータについて、ディレクトリ名判定部14aにおけるディレクトリ名の抽出処理を説明する。図13(a)は、異常データ検出装置1aに入力されるアクセスデータでの一例であり、図13(b)は、過去に正常と判定されたアクセスデータの一例である。   With reference to FIG. 13, the directory name extraction processing in the directory name determination unit 14a for the access data input to the abnormal data detection apparatus 1a will be described. FIG. 13A is an example of access data input to the abnormal data detection apparatus 1a, and FIG. 13B is an example of access data that has been determined to be normal in the past.

図14に示すフローチャートを用いて、本発明の第2の実施の形態に係る異常データ検出装置1aにおけるディレクトリ名判定部14aの処理を説明する。なお、異常データ検出装置1aにおける他の処理は、上述した異常データ検出装置1の処理と同一であるため、説明を省略する。   Processing of the directory name determination unit 14a in the abnormal data detection apparatus 1a according to the second embodiment of the present invention will be described using the flowchart shown in FIG. Since other processes in the abnormal data detection apparatus 1a are the same as the processes of the abnormal data detection apparatus 1 described above, the description thereof is omitted.

ディレクトリ名判定部14aは、アクセスデータからディレクトリ名を抽出する(S301)。その後、ディレクトリ名判定部14aは、抽出されたディレクトリ名と同一のディレクトリ名を含むCGI名を統計情報テーブル16aで記憶される全てのCGI名について検索する(S302,S303)。   The directory name determination unit 14a extracts a directory name from the access data (S301). Thereafter, the directory name determination unit 14a searches for all CGI names stored in the statistical information table 16a for CGI names including the same directory name as the extracted directory name (S302, S303).

CGI名が統計情報テーブル16aから検索された場合(S303でNO)、アクセス数参照手段141は、統計情報テーブル16aから対象としているCGI名のアクセス回数を参照し、そのアクセス数が所定数より多いか否かを判定する(S304)。   When the CGI name is retrieved from the statistical information table 16a (NO in S303), the access count reference means 141 refers to the access count of the target CGI name from the statistical information table 16a, and the access count is greater than the predetermined number. It is determined whether or not (S304).

ステップS304における判定の結果、所定数以上である場合(S304でYES)、ディレクトリ名判定部14aは、入力されたアクセスデータを「正常」と判定し(S305)、アクセスデータのCGI名を統計情報テーブル16aに追加して記憶する(S306)。   As a result of the determination in step S304, if the number is greater than or equal to the predetermined number (YES in S304), the directory name determination unit 14a determines that the input access data is “normal” (S305), and the CGI name of the access data is statistical information. It is added and stored in the table 16a (S306).

ここで、その一例として、図12及び図13を用いて具体的に説明する。なお、図13(b)に示すCGI名dが統計情報テーブル16aに含まれて記憶され、そのアクセス回数が「2500」であるとする。   Here, as an example, a specific description will be given with reference to FIGS. It is assumed that the CGI name d shown in FIG. 13B is included and stored in the statistical information table 16a, and the access count is “2500”.

例えば、ディレクトリ名判定部14aが、図13(a)に示すアクセスデータを入力した場合、そのアクセスデータからディレクトリ名として「/cgi-bin/users/bob」を抽出する。また、同一のディレクトリ名である「/cgi-bin/users/bob」を含むCGI名として、統計情報テーブル16aからCGI名dが検索されたとする。ここで、所定数として「200」が定められていた場合、CGI名dのアクセス数は「2500」であるため、ディレクトリ名判定部14aは入力されたアクセスデータを「正常」と判定する。   For example, when the directory name determination unit 14a inputs the access data shown in FIG. 13A, “/ cgi-bin / users / bob” is extracted from the access data as the directory name. Further, it is assumed that the CGI name d is retrieved from the statistical information table 16a as a CGI name including the same directory name “/ cgi-bin / users / bob”. Here, when “200” is determined as the predetermined number, the number of accesses of the CGI name d is “2500”, and therefore the directory name determination unit 14a determines that the input access data is “normal”.

一方、ステップS304における判定の結果、所定数以上でない場合(S304でNO)、ステップS302に戻り、ディレクトリ名判定部14aは、他の同一のディレクトリ名を含むCGI名を統計情報テーブル16aから検索する(S304)。ステップS302で統計情報テーブル16aにアクセスデータに含まれるディレクトリ名を含むCGI名が存在しないことが判定された場合(S303でYES)、ディレクトリ名判定部14aは、入力されたアクセスデータを「異常」と判定する(S307)。   On the other hand, if the result of determination in step S304 is not greater than or equal to the predetermined number (NO in S304), the process returns to step S302, and the directory name determination unit 14a searches the statistical information table 16a for other CGI names including the same directory name. (S304). If it is determined in step S302 that the CGI name including the directory name included in the access data does not exist in the statistical information table 16a (YES in S303), the directory name determination unit 14a determines that the input access data is “abnormal”. (S307).

その後、ディレクトリ名判定部14aは、判定結果に基づいて、第1のネットワークセグメント2から受信したアクセスデータを第2のネットワークセグメントに送信する(S308)。   Thereafter, the directory name determination unit 14a transmits the access data received from the first network segment 2 to the second network segment based on the determination result (S308).

上述したように、本発明の第2の実施の形態の係る異常データ検出装置1aでは、ディレクトリ名判定部14aにアクセス数参照手段141を備えることにより、同一ディレクトリ名を含む他のCGI名についてそのアクセス数が一定数に満たないものを排除する。これにより、正当性のより高いCGIのみを根拠として誤検出を排除することができる。   As described above, in the abnormal data detection apparatus 1a according to the second exemplary embodiment of the present invention, the directory name determination unit 14a includes the access number reference unit 141, so that other CGI names including the same directory name can be obtained. Eliminate those with less than a certain number of accesses. As a result, it is possible to eliminate erroneous detection based only on CGI with higher legitimacy.

<第3の実施の形態>
図15を参照して、本発明の第3の実施の形態に係る異常データ検出装置1bを説明する。
<Third Embodiment>
With reference to FIG. 15, an abnormal data detection apparatus 1b according to a third embodiment of the present invention will be described.

本発明の第3の実施の形態に係る異常データ検出装置1bは、第1の実施の形態に係る異常データ検出装置1と比較して、ディレクトリ名判定部14bに前方一致判定手段142を有している点で異なる。他の構成については、上述した実施の形態1に係る異常データ検出装置1と同一であるため、説明を省略する。   The abnormal data detection apparatus 1b according to the third embodiment of the present invention has a forward match determination unit 142 in the directory name determination unit 14b, as compared with the abnormal data detection apparatus 1 according to the first embodiment. Is different. Since other configurations are the same as those of the abnormal data detection apparatus 1 according to the first embodiment described above, the description thereof is omitted.

前方一致判定手段142は、統計情報テーブル16に記憶されるCGI名に含まれるディレクトリ名について文字列ごとに区間を設定し、入力されたアクセスデータに含まれるディレクトリ名と前方一致するか否かを判定する。具体的には、アクセスデータに含まれるCGI名から最右の文字列の区間から順に除いた文字列と同一のディレクトリ名を有するCGI名が統計情報テーブル16に存在するか否かを判定する。   The forward match determination unit 142 sets a section for each character string for the directory name included in the CGI name stored in the statistical information table 16, and determines whether or not the forward match with the directory name included in the input access data. judge. Specifically, it is determined whether or not the CGI name having the same directory name as the character string obtained by sequentially removing the CGI name included in the access data from the rightmost character string section exists in the statistical information table 16.

前方一致判定手段142で前方一致すると判定された場合、ディレクトリ名判定部14bは入力されたアクセスデータをアクセスデータについては「正常」と判定し、前方一致しないと判定された場合、「異常」と判定する。また、ディレクトリ名判定部14は、第2のネットワークセグメント3にアクセスデータを送出する。   When the forward match determination unit 142 determines that there is a forward match, the directory name determination unit 14b determines that the input access data is “normal” for the access data, and when it is determined that the forward match does not match, it is “abnormal”. judge. Further, the directory name determination unit 14 sends access data to the second network segment 3.

図16を用いて、異常データ検出装置1bに入力されたアクセスデータについて、前方一致判定手段142における前方一致の判定処理について説明する。この前方一致の判定処理の結果はディレクトリ名判定部14bにおける、ディレクトリ名判定処理において利用される。ここで、ディレクトリ名が他のディレクトリ名と前方一致するとは、ディレクトリ区切り文字で区切られる区間について、ディレクトリ名の最左からみて連続的に、文字列として少なくとも一つ以上、一致する区間が存在することをいう。   With reference to FIG. 16, a description will be given of the forward match determination process in the forward match determination unit 142 for the access data input to the abnormal data detection device 1b. The result of the forward matching determination process is used in the directory name determination process in the directory name determination unit 14b. Here, a directory name is forward-matched with another directory name means that there is a section that matches at least one or more character strings continuously as viewed from the leftmost of the directory name with respect to the section delimited by the directory delimiter character. That means.

具体的には、本発明の第3の実施の形態にかかる異常データ検出装置1bにおいては、前方一致する区間数のレベルを、対象とするCGI名のディレクトリ名がどの程度アクセスデータから抽出されたディレクトリ名を含んでいるかという観点で定義し、基点から左方向を正のレベル(もとのディレクトリ名が深い)とし、基点から右方向を負のレベル(もとのディレクトリ名が浅い)とする。   Specifically, in the abnormal data detection device 1b according to the third exemplary embodiment of the present invention, how much the directory name of the target CGI name is extracted from the access data at the level of the number of sections that coincide with each other. Define from the viewpoint of whether the directory name is included, the left direction from the base point is a positive level (the original directory name is deep), and the right direction from the base point is a negative level (the original directory name is shallow) .

図16(a)は、入力された正常であるか否かを判定するアクセスデータの一例であり、図16(b)〜図16(e)は、統計情報テーブル16bに記憶されるCGI名が含まれる過去に受信したアクセスデータの一例である。   FIG. 16A is an example of access data for determining whether or not the input is normal. FIGS. 16B to 16E show the CGI names stored in the statistical information table 16b. It is an example of the access data received in the past contained.

図16(a)に示す入力されたアクセスデータからは、まず、CGI名における最右のディレクトリ区切り文字が抽出され、それより右を「ディレクトリ名」として抽出し、それより左を「実CGI名」として抽出する。また、この最右のディレクトリ名区切り文字を前方一致の基点とし、それより左を正のレベルとし、それより右を負のレベルとする。   From the input access data shown in FIG. 16A, first, the rightmost directory delimiter in the CGI name is extracted, the right is extracted as “directory name”, and the left is extracted as “real CGI name”. ". Further, the rightmost directory name delimiter is used as a base point for forward matching, the left side is set as a positive level, and the right side is set as a negative level.

図16(b)に示すCGI名は、判定の対象となるアクセスデータに含まれるディレクトリ名に「/cgi-bin/users/bob」に対して、ディレクトリ名「/cgi-bin/users」が前方一致する。ここで、入力されたアクセスデータに含まれるディレクトリ名のうち、正のレベルに1区間のみ異なるため、そのレベルは+1であると定義する。   In the CGI name shown in FIG. 16B, the directory name “/ cgi-bin / users” is ahead of “/ cgi-bin / users / bob” in the directory name included in the access data to be determined. Match. Here, among the directory names included in the input access data, since only one section differs from the positive level, the level is defined as +1.

図16(c)に示すCGI名は、判定の対象となるアクセスデータに含まれるディレクトリ名に対して、ディレクトリ名「/cgi-bin」が前方一致する。ここで、入力されたアクセスデータに含まれるディレクトリ名のうち、正のレベルに2区間のみ異なるため、そのレベルは+2であると定義する。   In the CGI name shown in FIG. 16C, the directory name “/ cgi-bin” matches the directory name included in the access data to be determined. Here, among the directory names included in the input access data, since only two sections differ from the positive level, the level is defined as +2.

図16(d)に示すCGI名は、判定の対象となるアクセスデータに含まれるディレクトリ名に対して、一致するディレクトリ名が全く含まれておらず、ディレクトリ名が前方一致せず、また、レベルも定義されない。なお、実CGI名はたまたま一致している例を示しているが、実CGI名は前方一致に関係はない。   The CGI name shown in FIG. 16D does not include any directory name that matches the directory name included in the access data to be determined, the directory name does not match forward, and the level Is also not defined. In addition, although the example in which the real CGI name coincides is shown, the real CGI name is not related to the forward coincidence.

図16(d)に示すCGI名は、判定の対象となるアクセスデデータに含まれるディレクトリ名に対して、ディレクトリ名「/cgi-bin/users/bob」に加えて「/local」が逆に含まれており、更に負のレベルに前方一致している。なお、図16(d)に示す例では、レベルは−1であると定義する。   In the CGI name shown in FIG. 16D, “/ local” is reversed in addition to the directory name “/ cgi-bin / users / bob” with respect to the directory name included in the access data to be determined. It is included and further matches the negative level forward. In the example shown in FIG. 16D, the level is defined to be -1.

前方一致判定手段142は、このように前方一致を判定しており、この前方一致を利用して、前方一致のレベルが一定値以上である場合、入力されたアクセスデータが正常であると判定する。例えば、前方一致のレベルが+1以上である場合を正常と判定することが好ましい。   The forward coincidence determining unit 142 determines forward coincidence in this way, and using this forward coincidence, when the level of forward coincidence is a predetermined value or more, it determines that the input access data is normal. . For example, it is preferable to determine that the front matching level is +1 or more as normal.

これは、実際のWebサーバを鑑みたとき、ディレクトリ構成は既存の状態から時系列的に順に深く掘り下げられていくことが多く、あるアクセスデータのCGI名が既存のCGI名に対してより大きいレベル(正のレベル)で前方一致するということは、そのCGI名は既存のディレクトリ構成において深く掘り下げられたものであるということができ、それゆえ、正当なディレクトリ名であるという根拠になりうるためである。   This is because when considering an actual Web server, the directory structure is often deeper in order from the existing state in time series, and the CGI name of certain access data is higher than the existing CGI name. Matching forward at (positive level) is because the CGI name can be deeply drilled down in the existing directory structure, and can therefore be a valid directory name. is there.

図16に示す例において、前方一致判定手段142がアクセスデータが正常であるか否かを判定する際、前方一致のレベル+1以上であることをもって正常と判定している場合を考えると、統計情報テーブルにおいて図16(b)または図16(c)のようにレベル+1以上で前方一致するCGI名が存在するときはアクセスデータは正常と判定される一方で、統計情報テーブルにおいて図16(b)または図16(c)のようなCGI名が存在せず図16(d)または図16(e)のように前方一致しないか若しくは負のレベルで前方一致するようなCGI名しか存在しないときはアクセスデータは異常と判定される。   In the example illustrated in FIG. 16, when the forward match determination unit 142 determines whether the access data is normal or not, the statistical information is determined based on the fact that the forward match level is equal to or higher than +1. In the table, when there is a CGI name that matches the level +1 or higher as shown in FIG. 16B or 16C, the access data is determined to be normal, while in the statistical information table, FIG. Or, when there is no CGI name as shown in FIG. 16C and there is only a CGI name that does not match forward as shown in FIG. 16D or FIG. The access data is determined to be abnormal.

上述したように、第3の実施の形態に係る異常データ検出装置1bでは、前方一致を判定することによって、完全一致するディレクトリ名を記憶していない場合であっても、誤検出を削減することができるという効果がある。   As described above, in the abnormal data detection device 1b according to the third embodiment, by detecting a forward match, it is possible to reduce false detection even when a directory name that completely matches is not stored. There is an effect that can be.

上記のように、本発明の実施の形態によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなる。   As described above, the embodiments of the present invention have been described. However, it should not be understood that the descriptions and drawings constituting a part of this disclosure limit the present invention. From this disclosure, various alternative embodiments, examples, and operational techniques will be apparent to those skilled in the art.

本発明はここでは記載していない様々な実施の形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明に記載した事項と自明な特許請求の範囲に係る発明特定事項によってのみ定められるものである。   It goes without saying that the present invention includes various embodiments not described herein. Therefore, the technical scope of the present invention is defined only by the matters described in the above description and the invention specific matters according to the obvious claims.

本発明の第1の実施の形態に係る異常データ検出装置のブロック図である。It is a block diagram of the abnormal data detection apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る異常データ検出装置のハードウェア構成図である。It is a hardware block diagram of the abnormal data detection apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る異常データ検出装置に入力されるアクセスデータを説明する図である。It is a figure explaining the access data input into the abnormal data detection apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る異常データ検出装置で異常の判定に用いられる特徴量の一例である。It is an example of the feature-value used for abnormality determination with the abnormal data detection apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る異常データ検出装置のディレクトリ名判定部において、CGI名からディレクトリ名と実CGI名を抽出する方法を説明する図である。It is a figure explaining the method to extract a directory name and a real CGI name from a CGI name in the directory name determination part of the abnormal data detection apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る異常データ検出装置で記憶される統計情報テーブルの一例である。It is an example of the statistical information table memorize | stored with the abnormal data detection apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る異常データ検出装置に入力されるアクセスデータを説明する図である。It is a figure explaining the access data input into the abnormal data detection apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る異常データ検出装置で求められる特徴量データの一例である。It is an example of the feature-value data calculated | required with the abnormal data detection apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る異常データ検出装置の処理を説明するフローチャートである。It is a flowchart explaining the process of the abnormal data detection apparatus which concerns on the 1st Embodiment of this invention.


本発明の第1の実施の形態に係る異常データ検出装置のディレクトリ名判定部におけるディレクトリ名判定処理を説明するフローチャートである。It is a flowchart explaining the directory name determination process in the directory name determination part of the abnormal data detection apparatus which concerns on the 1st Embodiment of this invention. 本発明の第2の実施の形態に係る異常データ検出装置のブロック図である。It is a block diagram of the abnormal data detection apparatus which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施の形態に係る異常データ検出装置で記憶される統計情報テーブルの一例である。It is an example of the statistical information table memorize | stored with the abnormal data detection apparatus which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施の形態に係る異常データ検出装置に入力されるアクセスデータの一例を説明する図である。It is a figure explaining an example of the access data input into the abnormal data detection apparatus which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施の形態に係る異常データ検出装置のディレクトリ名判定部におけるディレクトリ名判定処理を説明するフローチャートである。It is a flowchart explaining the directory name determination process in the directory name determination part of the abnormal data detection apparatus which concerns on the 2nd Embodiment of this invention. 本発明の第3の実施の形態に係る異常データ検出装置のブロック図である。It is a block diagram of the abnormal data detection apparatus which concerns on the 3rd Embodiment of this invention. 本発明の第3の実施の形態に係る異常データ検出装置に入力されるアクセスデータの一例を説明する図である。It is a figure explaining an example of the access data input into the abnormal data detection apparatus which concerns on the 3rd Embodiment of this invention.

符号の説明Explanation of symbols

1,1a,1b…異常データ検出装置
2…第1のネットワークセグメント
3…第2のネットワークセグメント
11…データ解析部
12…アクセス判定部
13…統計的異常判定部
14…ディレクトリ名判定部
14a…アクセス数参照手段
14a…ディレクトリ名判定部
14b…ディレクトリ名判定部
15…統計処理実行部
16,16a…統計情報テーブル
101…中央処理制御装置
102…ROM
103…RAM
104…入力装置
105…表示装置
106…通信制御装置
107…記憶装置
108…リムーバブルディスク
109…入出力インタフェース
110…バス
141…アクセス数参照手段
141…ディレクトリ名判定手段
142…前方一致判定手段
DESCRIPTION OF SYMBOLS 1, 1a, 1b ... Abnormal data detection apparatus 2 ... 1st network segment 3 ... 2nd network segment 11 ... Data analysis part 12 ... Access determination part 13 ... Statistical abnormality determination part 14 ... Directory name determination part 14a ... Access Number reference means 14a ... directory name determination unit 14b ... directory name determination unit 15 ... statistical processing execution unit 16, 16a ... statistical information table 101 ... central processing control device 102 ... ROM
103 ... RAM
DESCRIPTION OF SYMBOLS 104 ... Input device 105 ... Display apparatus 106 ... Communication control device 107 ... Memory | storage device 108 ... Removable disk 109 ... Input-output interface 110 ... Bus 141 ... Access number reference means 141 ... Directory name determination means 142 ... Forward matching determination means

Claims (15)

CGI名とCGI変数名とを含むアクセスデータが入力されると、前記入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数名毎に異常データの特徴を示す特徴量を算出するデータ解析手段と、
前記データ解析手段で算出された特徴量の平均値、標準偏差を含む統計情報を前記入力されたアクセスデータに含まれるCGI名毎に蓄積して記憶する統計情報記憶手段と、
前記特徴量の平均値と標準偏差を含む統計情報を生成し、前記統計情報記憶手段に記憶された統計情報を更新する統計処理実行手段と、
前記統計情報記憶手段を参照して前記入力されたアクセスデータに含まれるCGI名が前記統計情報記憶手段に記憶されているか否かを判定するアクセス判定手段と、
前記アクセス判定手段で前記CGI名が前記統計情報記憶手段に記憶されていると判定された場合、前記データ解析手段で算出された特徴量と前記統計情報記憶手段に記憶されている統計情報とを比較して、前記入力されたアクセスデータが正常であるか否かを判定する統計的異常判定手段と、
前記アクセス判定手段で前記CGI名が前記統計情報記憶手段に記憶されていないと判定された場合、前記入力されたCGI名からCGIが位置するディレクトリ名を抽出し、このディレクトリ名と前記統計情報記憶手段に記憶されている他のCGI名に含まれるディレクトリ名とを比較して、前記入力されたアクセスデータが正常であるか否かを判定するとともに、前記CGI名を含むアクセスデータの入力回数をカウントし、前記CGI名を含むアクセスデータの入力回数が所定回数となったとき、前記CGI名と統計情報を前記統計情報記憶手段に追加するディレクトリ名判定手段と、
を備えることを特徴とする異常データ検出装置。
When access data including a CGI name and a CGI variable name is input, data analysis that calculates a feature amount indicating the characteristic of abnormal data for each CGI variable name based on a parameter value included in the input access data Means,
Statistical information storage means for accumulating and storing statistical information including average values and standard deviations of feature amounts calculated by the data analysis means for each CGI name included in the input access data;
Statistical processing execution means for generating statistical information including an average value and standard deviation of the feature amount, and updating the statistical information stored in the statistical information storage means,
Access determination means for determining whether or not a CGI name included in the inputted access data with reference to the statistical information storage means is stored in the statistical information storage means;
When the access determination means determines that the CGI name is stored in the statistical information storage means, the feature amount calculated by the data analysis means and the statistical information stored in the statistical information storage means In comparison, statistical abnormality determination means for determining whether or not the input access data is normal,
When the access determination means determines that the CGI name is not stored in the statistical information storage means, the directory name where the CGI is located is extracted from the input CGI name, and the directory name and the statistical information storage are extracted. The directory name included in another CGI name stored in the means is compared to determine whether or not the input access data is normal, and the number of times the access data including the CGI name is input is determined. A directory name determination unit that counts and adds the CGI name and statistical information to the statistical information storage unit when the number of times of input of the access data including the CGI name reaches a predetermined number ;
An abnormal data detection device comprising:
CGI名とCGI変数名とを含むアクセスデータが入力されると、前記入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数名毎に異常データの特徴を示す特徴量を算出するデータ解析手段と、
前記データ解析手段で算出された特徴量の平均値、標準偏差、アクセス回数を含む統計情報をCGI名毎に蓄積して記憶する統計情報記憶手段と、
前記特徴量の平均値と標準偏差とアクセス回数を含む統計情報を生成し、前記統計情報記憶手段に記憶された統計情報を更新する統計処理実行手段と、
前記統計情報記憶手段を参照して前記入力されたアクセスデータに含まれるCGI名が前記統計情報記憶手段に記憶されているか否かを判定するアクセス判定手段と、
前記アクセス判定手段で前記CGI名が前記統計情報記憶手段に記憶されていると判定された場合、前記データ解析手段で算出された特徴量と前記統計情報記憶手段に記憶されている統計情報とを比較して、前記入力されたアクセスデータが正常であるか否かを判定する統計的異常判定手段と、
前記アクセス判定手段で前記CGI名が前記統計情報記憶手段に記憶されていないと判定された場合、前記入力されたCGI名からCGIが位置するディレクトリ名を抽出し、このディレクトリ名と同一のディレクトリ名を含むCGI名が前記統計情報記憶手段に記憶されている、かつ、前記同一のディレクトリ名を含む他のCGI名に関連付けられるアクセス回数が所定の数以上である場合、前記入力されたアクセスデータが正常であると判定するとともに、前記CGI名を含むアクセスデータの入力回数をカウントし、前記CGI名を含むアクセスデータの入力回数が所定回数となったとき、前記CGI名と統計情報を前記統計情報記憶手段に追加するディレクトリ名判定手段と、
を備えることを特徴とする異常データ検出装置。
When access data including a CGI name and a CGI variable name is input, data analysis that calculates a feature amount indicating the characteristic of abnormal data for each CGI variable name based on a parameter value included in the input access data Means,
Statistical information storage means for accumulating and storing statistical information including average values, standard deviations, and access counts of feature amounts calculated by the data analysis means for each CGI name;
Statistical processing execution means for generating statistical information including an average value, standard deviation, and number of accesses of the feature quantity, and updating statistical information stored in the statistical information storage means,
Access determination means for determining whether or not a CGI name included in the inputted access data with reference to the statistical information storage means is stored in the statistical information storage means;
When the access determination means determines that the CGI name is stored in the statistical information storage means, the feature amount calculated by the data analysis means and the statistical information stored in the statistical information storage means In comparison, statistical abnormality determination means for determining whether or not the input access data is normal,
When the access determination means determines that the CGI name is not stored in the statistical information storage means, the directory name where the CGI is located is extracted from the input CGI name, and the same directory name as this directory name Is stored in the statistical information storage means , and the number of accesses associated with another CGI name including the same directory name is equal to or greater than a predetermined number, the input access data is When it is determined that the access data including the CGI name is input, the access data including the CGI name is counted. Directory name determination means to be added to the storage means ;
An abnormal data detection device comprising:
CGI名とCGI変数名とを含むアクセスデータが入力されると、前記入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数名毎に異常データの特徴を示す特徴量を算出するデータ解析手段と、
前記データ解析手段で算出された特徴量の平均値、標準偏差を含む統計情報を前記入力されたアクセスデータに含まれるCGI名毎に蓄積して記憶する統計情報記憶手段と、
前記特徴量の平均値と標準偏差とを含む統計情報を生成し、前記統計情報記憶手段に記憶された統計情報を更新する統計処理実行手段と、
前記統計情報記憶手段を参照して前記入力されたアクセスデータに含まれるCGI名が統計情報記憶手段に存在するか否かを判定するアクセス判定手段と、
前記アクセス判定手段で前記CGI名が前記統計情報記憶手段に記憶されていると判定された場合、データ解析手段で算出された特徴量と前記統計情報記憶手段に記憶されている統計情報とを比較して、前記入力されたアクセスデータが正常であるか否かを判定する統計的異常判定手段と、
前記アクセス判定手段で前記CGI名が前記統計情報記憶手段に記憶されていないと判定された場合、前記入力されたCGI名からCGIが位置するディレクトリ名を抽出し、この抽出されたディレクトリ名と前記統計情報記憶手段に記憶されている他のCGI名に含まれるディレクトリ名とを比較して前方一致する場合、前記入力されたアクセスデータが正常であるか否かを判定するとともに、前記CGI名を含むアクセスデータの入力回数をカウントし、前記CGI名を含むアクセスデータの入力回数が所定回数となったとき、前記CGI名と統計情報を前記統計情報記憶手段に追加するディレクトリ名判定手段と、
を備えることを特徴とする異常データ検出装置。
When access data including a CGI name and a CGI variable name is input, data analysis that calculates a feature amount indicating the characteristic of abnormal data for each CGI variable name based on a parameter value included in the input access data Means,
Statistical information storage means for accumulating and storing statistical information including average values and standard deviations of feature amounts calculated by the data analysis means for each CGI name included in the input access data;
Statistical processing execution means for generating statistical information including an average value and a standard deviation of the feature amount, and updating statistical information stored in the statistical information storage means,
Access determination means for determining whether or not a CGI name included in the input access data is present in the statistical information storage means with reference to the statistical information storage means;
If the CGI name the access determination means is determined to be stored in the statistical information storage means, compares the statistical information stored in the statistical information storage means, wherein the amount calculated by the data analysis means And a statistical abnormality determination means for determining whether or not the input access data is normal,
If the CGI name the access determination means is determined not to be stored in the statistical information storage unit, extracts the directory name CGI is located from said input CGI name, said this extracted directory name When comparing with a directory name included in another CGI name stored in the statistical information storage means to make a forward match, it is determined whether or not the input access data is normal, and the CGI name is A directory name determination unit that counts the number of times of access data including, and adds the CGI name and statistical information to the statistical information storage unit when the number of times of input of access data including the CGI name reaches a predetermined number ;
An abnormal data detection device comprising:
前記ディレクトリ名判定手段は、前記CGI名から最右のディレクトリ区切り文字より左をディレクトリ名として抽出することを特徴とする請求項1乃至3のいずれか1に記載の異常データ検出装置。   4. The abnormal data detection apparatus according to claim 1, wherein the directory name determination unit extracts the left of the CGI name from the rightmost directory delimiter as a directory name. 5. 前記ディレクトリ名判定手段は、前記CGI名から最右のディレクトリ区切り文字より左をディレクトリ名として抽出し、前記抽出されたディレクトリ名と前記統計情報記憶手段に記憶されるCGI名に含まれるディレクトリ名とが同一でない場合、ディレクトリ名について文字列毎に区間を設定し、前記抽出されたディレクトリ名から最右の文字列の区間から順に除いた文字列と同一のディレクトリ名を有するCGI名が統計情報に存在する場合に前方一致すると判定することを特徴とする請求項3に記載の異常データ検出装置。   The directory name determination means extracts the left of the rightmost directory separator from the CGI name as a directory name, and the extracted directory name and the directory name included in the CGI name stored in the statistical information storage means If the directory names are not the same, a section is set for each character string for the directory name, and the CGI name having the same directory name as the character string obtained by sequentially removing the extracted directory name from the rightmost character string section is included in the statistical information. The abnormal data detection device according to claim 3, wherein when there exists, it is determined that the front matches. CGI名とCGI変数名とを含むアクセスデータが入力されると、前記入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数名毎に異常データの特徴を示す特徴量を算出するデータ解析ステップと、
特徴量の平均値と標準偏差を含む統計情報を生成し、前記データ解析ステップで算出された特徴量の平均値、標準偏差を含む統計情報を前記入力されたアクセスデータに含まれるCGI名毎に統計情報記憶手段に更新して記憶させる統計処理実行ステップと、
前記統計情報記憶手段を参照して前記入力されたアクセスデータに含まれるCGI名が記憶されているか否かを判定するアクセス判定ステップと、
前記アクセス判定ステップで前記CGI名が前記統計情報記憶手段に記憶されていると判定された場合、前記データ解析ステップで算出された特徴量と前記統計情報記憶手段に記憶されている統計情報とを比較して、前記入力されたアクセスデータが正常であるか否かを判定する統計的異常判定ステップと、
前記アクセス判定ステップで前記CGI名が前記統計情報記憶手段に記憶されていないと判定された場合、前記入力されたCGI名からCGIが位置するディレクトリ名を抽出し、このディレクトリ名と前記統計情報記憶手段に記憶されている他のCGI名に含まれるディレクトリ名とを比較して、前記入力されたアクセスデータが正常であるか否かを判定するとともに、前記CGI名を含むアクセスデータの入力回数をカウントし、前記CGI名を含むアクセスデータの入力回数が所定回数となったとき、前記CGI名と統計情報を前記統計情報記憶手段に追加するディレクトリ名判定ステップと、
をコンピュータに実行させることを特徴とする異常データ検出プログラム。
When access data including a CGI name and a CGI variable name is input, data analysis that calculates a feature amount indicating the characteristic of abnormal data for each CGI variable name based on a parameter value included in the input access data Steps,
Statistical information including the average value and standard deviation of the feature amount is generated, and the statistical information including the average value and standard deviation of the feature amount calculated in the data analysis step is generated for each CGI name included in the input access data. A statistical processing execution step to be updated and stored in the statistical information storage means;
An access determination step of determining whether or not a CGI name included in the input access data is stored with reference to the statistical information storage means;
When it is determined in the access determination step that the CGI name is stored in the statistical information storage unit, the feature amount calculated in the data analysis step and the statistical information stored in the statistical information storage unit are In comparison, a statistical abnormality determination step of determining whether or not the input access data is normal;
If it is determined in the access determination step that the CGI name is not stored in the statistical information storage means, a directory name where the CGI is located is extracted from the input CGI name, and the directory name and the statistical information storage are extracted. The directory name included in another CGI name stored in the means is compared to determine whether or not the input access data is normal, and the number of times the access data including the CGI name is input is determined. A directory name determining step of counting and adding the CGI name and statistical information to the statistical information storage means when the number of times of input of access data including the CGI name reaches a predetermined number ;
An abnormal data detection program for causing a computer to execute.
CGI名とCGI変数名とを含むアクセスデータが入力されると、前記入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数名毎に異常データの特徴を示す特徴量を算出するデータ解析ステップと、
前記特徴量の平均値と標準偏差とアクセス回数を含む統計情報を生成し、前記データ解析手段で算出された特徴量の平均値、標準偏差、アクセス回数を含む統計情報をCGI名毎に統計情報記憶手段に更新して記憶させる統計処理実行ステップと、
前記統計情報記憶手段を参照して前記入力されたアクセスデータに含まれるCGI名が記憶されているか否かを判定するアクセス判定ステップと、
前記アクセス判定ステップで前記CGI名が前記統計情報記憶手段に記憶されていると判定された場合、前記データ解析ステップで算出された特徴量と前記統計情報記憶手段に記憶されている統計情報とを比較して、前記入力されたアクセスデータが正常であるか否かを判定する統計的異常判定ステップと、
前記アクセス判定ステップで前記CGI名が前記統計情報記憶手段に記憶されていないと判定された場合、前記入力されたCGI名からCGIが位置するディレクトリ名を抽出し、このディレクトリ名と同一のディレクトリ名を含むCGI名が前記統計情報記憶手段に記憶されている、かつ、前記同一のディレクトリ名を含む他のCGI名に関連付けられるアクセス回数が所定の数以上である場合、前記入力されたアクセスデータが正常であると判定するとともに、前記CGI名を含むアクセスデータの入力回数をカウントし、前記CGI名を含むアクセスデータの入力回数が所定回数となったとき、前記CGI名と統計情報を前記統計情報記憶手段に追加するディレクトリ名判定ステップと、
をコンピュータに実行させることを特徴とする異常データ検出プログラム。
When access data including a CGI name and a CGI variable name is input, data analysis that calculates a feature amount indicating the characteristic of abnormal data for each CGI variable name based on a parameter value included in the input access data Steps,
Statistical information including the average value, standard deviation, and access count of the feature amount is generated, and statistical information including the average value, standard deviation, and access count of the feature amount calculated by the data analysis unit is statistical information for each CGI name. A statistical processing execution step to be updated and stored in the storage means;
An access determination step of determining whether or not a CGI name included in the input access data is stored with reference to the statistical information storage means;
When it is determined in the access determination step that the CGI name is stored in the statistical information storage unit, the feature amount calculated in the data analysis step and the statistical information stored in the statistical information storage unit are In comparison, a statistical abnormality determination step of determining whether or not the input access data is normal;
If it is determined in the access determination step that the CGI name is not stored in the statistical information storage means, the directory name where the CGI is located is extracted from the input CGI name, and the directory name identical to this directory name Is stored in the statistical information storage means , and the number of accesses associated with another CGI name including the same directory name is equal to or greater than a predetermined number, the input access data is When it is determined that the access data including the CGI name is input, the access data including the CGI name is counted. and directory name judgment step to be added to the storage means,
An abnormal data detection program for causing a computer to execute.
CGI名とCGI変数名とを含むアクセスデータが入力されると、前記入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数名毎に異常データの特徴を示す特徴量を算出するデータ解析ステップと、
前記特徴量の平均値と標準偏差とを含む統計情報を生成し、前記データ解析ステップで算出された特徴量の平均値、標準偏差を含む統計情報を前記入力されたアクセスデータに含まれるCGI名毎に統計情報記憶手段に更新して記憶させる統計処理実行ステップと、
前記統計情報記憶手段を参照して前記入力されたアクセスデータに含まれるCGI名が存在するか否かを判定するアクセス判定ステップと、
前記アクセス判定ステップで前記CGI名が前記統計情報記憶手段に記憶されていると判定された場合、データ解析ステップで算出された特徴量と前記統計情報記憶手段に記憶されている統計情報とを比較して、前記入力されたアクセスデータが正常であるか否かを判定する統計的異常判定ステップと、
前記アクセス判定ステップで前記CGI名が前記統計情報記憶手段に記憶されていないと判定された場合、前記入力されたCGI名からCGIが位置するディレクトリ名を抽出し、この抽出されたディレクトリ名と前記統計情報記憶手段に記憶されている他のCGI名に含まれるディレクトリ名とを比較して前方一致する場合、前記入力されたアクセスデータが正常であるか否かを判定するとともに、前記CGI名を含むアクセスデータの入力回数をカウントし、前記CGI名を含むアクセスデータの入力回数が所定回数となったとき、前記CGI名と統計情報を前記統計情報記憶手段に追加するディレクトリ名判定ステップと、
をコンピュータに実行させることを特徴とする異常データ検出プログラム。
When access data including a CGI name and a CGI variable name is input, data analysis that calculates a feature amount indicating the characteristic of abnormal data for each CGI variable name based on a parameter value included in the input access data Steps,
Statistical information including the average value and standard deviation of the feature value is generated, and the CGI name included in the input access data includes the statistical value including the average value and standard deviation of the feature value calculated in the data analysis step. A statistical processing execution step for updating and storing in the statistical information storage means each time;
An access determination step of determining whether or not a CGI name included in the input access data exists with reference to the statistical information storage unit;
When it is determined in the access determination step that the CGI name is stored in the statistical information storage unit, the feature amount calculated in the data analysis step is compared with the statistical information stored in the statistical information storage unit A statistical abnormality determination step for determining whether or not the input access data is normal;
If the CGI name the access determining step is determined not to be stored in the statistical information storage unit, extracts the directory name CGI is located from said input CGI name, said this extracted directory name When comparing with a directory name included in another CGI name stored in the statistical information storage means to make a forward match, it is determined whether or not the input access data is normal, and the CGI name is counting the number of inputs of the access data including, when the input number of accesses data including the CGI name is a predetermined number of times, and the directory name judgment step of adding the CGI names and statistics on the statistical information storage means,
An abnormal data detection program for causing a computer to execute.
前記ディレクトリ名判定ステップは、前記CGI名から最右のディレクトリ区切り文字より左をディレクトリ名として抽出することを特徴とする請求項6乃至8のいずれか1に記載の異常データ検出プログラム。   The abnormal data detection program according to any one of claims 6 to 8, wherein the directory name determination step extracts the left of the CGI name from the rightmost directory delimiter as a directory name. 前記ディレクトリ名判定ステップは、前記CGI名から最右のディレクトリ区切り文字より左をディレクトリ名として抽出し、前記抽出されたディレクトリ名と前記統計情報記憶手段に記憶されるCGI名に含まれるディレクトリ名とが同一でない場合、ディレクトリ名について文字列毎に区間を設定し、前記抽出されたディレクトリ名から最右の文字列の区間を順に除いた文字列と同一のディレクトリ名を有するCGI名が統計情報に存在する場合に前方一致すると判定することを特徴とする請求項8に記載の異常データ検出プログラム。   The directory name determining step extracts the left of the rightmost directory delimiter from the CGI name as a directory name, and the extracted directory name and the directory name included in the CGI name stored in the statistical information storage means Are not identical, a section is set for each character string for the directory name, and the CGI name having the same directory name as the character string obtained by sequentially removing the rightmost character string section from the extracted directory name is included in the statistical information. The abnormal data detection program according to claim 8, wherein when there exists, it is determined that the front matches. CGI名とCGI変数名とを含むアクセスデータが入力されると、前記入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数名毎に異常データの特徴を示す特徴量を算出するデータ解析ステップと、
特徴量の平均値と標準偏差を含む統計情報を生成し、前記データ解析ステップで算出された特徴量の平均値、標準偏差を含む統計情報を前記入力されたアクセスデータに含まれるCGI名毎に統計情報記憶手段に更新して記憶させる統計処理実行ステップと、
前記統計情報記憶手段を参照して前記入力されたアクセスデータに含まれるCGI名が記憶されているか否かを判定するアクセス判定ステップと、
前記アクセス判定ステップで前記CGI名が前記統計情報記憶手段に記憶されていると判定された場合、前記データ解析ステップで算出された特徴量と前記統計情報記憶手段に記憶されている統計情報とを比較して、前記入力されたアクセスデータが正常であるか否かを判定する統計的異常判定ステップと、
前記アクセス判定ステップで前記CGI名が前記統計情報記憶手段に記憶されていないと判定された場合、前記入力されたCGI名からCGIが位置するディレクトリ名を抽出し、このディレクトリ名と前記統計情報記憶手段に記憶されている他のCGI名に含まれるディレクトリ名とを比較して、前記入力されたアクセスデータが正常であるか否かを判定するとともに、前記CGI名を含むアクセスデータの入力回数をカウントし、前記CGI名を含むアクセスデータの入力回数が所定回数となったとき、前記CGI名と統計情報を前記統計情報記憶手段に追加するディレクトリ名判定ステップと、
を有することを特徴とする異常データ検出方法。
When access data including a CGI name and a CGI variable name is input, data analysis that calculates a feature amount indicating the characteristic of abnormal data for each CGI variable name based on a parameter value included in the input access data Steps,
Statistical information including the average value and standard deviation of the feature amount is generated, and the statistical information including the average value and standard deviation of the feature amount calculated in the data analysis step is generated for each CGI name included in the input access data. A statistical processing execution step to be updated and stored in the statistical information storage means;
An access determination step of determining whether or not a CGI name included in the input access data is stored with reference to the statistical information storage means;
When it is determined in the access determination step that the CGI name is stored in the statistical information storage unit, the feature amount calculated in the data analysis step and the statistical information stored in the statistical information storage unit are In comparison, a statistical abnormality determination step of determining whether or not the input access data is normal;
When it is determined in the access determination step that the CGI name is not stored in the statistical information storage means, a directory name where the CGI is located is extracted from the input CGI name, and the directory name and the statistical information storage are extracted. The directory name included in another CGI name stored in the means is compared to determine whether or not the input access data is normal, and the number of times the access data including the CGI name is input is determined. A directory name determining step of counting and adding the CGI name and statistical information to the statistical information storage means when the number of times of input of access data including the CGI name reaches a predetermined number ;
A method for detecting abnormal data, comprising:
CGI名とCGI変数名とを含むアクセスデータが入力されると、前記入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数名毎に異常データの特徴を示す特徴量を算出するデータ解析ステップと、
前記特徴量の平均値と標準偏差とアクセス回数を含む統計情報を生成し、前記データ解析手段で算出された特徴量の平均値、標準偏差、アクセス回数を含む統計情報をCGI名毎に統計情報記憶手段に記憶された統計情報を更新する統計処理実行ステップと、
前記統計情報記憶手段を参照して前記入力されたアクセスデータに含まれるCGI名が統計情報記憶手段に記憶されているか否かを判定するアクセス判定ステップと、
前記アクセス判定ステップで前記CGI名が前記統計情報記憶手段に記憶されていると判定された場合、前記データ解析ステップで算出された特徴量と前記統計情報記憶手段に記憶されている統計情報とを比較して、前記入力されたアクセスデータが正常であるか否かを判定する統計的異常判定ステップと、
前記アクセス判定ステップで前記CGI名が前記統計情報記憶手段に記憶されていないと判定された場合、前記入力されたCGI名からCGIが位置するディレクトリ名を抽出し、このディレクトリ名と同一のディレクトリ名を含むCGI名が前記統計情報記憶手段に記憶されている、かつ、前記同一のディレクトリ名を含む他のCGI名に関連付けられるアクセス回数が所定の数以上である場合、前記入力されたアクセスデータが正常であると判定するとともに、前記CGI名を含むアクセスデータの入力回数をカウントし、前記CGI名を含むアクセスデータの入力回数が所定回数となったとき、前記CGI名と統計情報を前記統計情報記憶手段に追加するディレクトリ名判定ステップと、
を有することを特徴とする異常データ検出方法。
When access data including a CGI name and a CGI variable name is input, data analysis that calculates a feature amount indicating the characteristic of abnormal data for each CGI variable name based on a parameter value included in the input access data Steps,
Statistical information including the average value, standard deviation, and access count of the feature amount is generated, and statistical information including the average value, standard deviation, and access count of the feature amount calculated by the data analysis unit is statistical information for each CGI name. A statistical processing execution step for updating the statistical information stored in the storage means;
An access determination step of determining whether or not a CGI name included in the input access data is stored in the statistical information storage unit with reference to the statistical information storage unit;
Wherein when said at access decision step CGI name is determined to be stored in the statistical information storage means, and a statistical information stored in the statistical information storage unit and the data analysis feature amount calculated in the step In comparison, a statistical abnormality determination step of determining whether or not the input access data is normal;
Wherein when said at access decision step CGI name is determined not to be stored in the statistical information storage unit, it extracts the directory name CGI is positioned from CGI name that is the input, the same directory name and the directory name Is stored in the statistical information storage means , and the number of accesses associated with another CGI name including the same directory name is equal to or greater than a predetermined number, the input access data is When it is determined that the access data including the CGI name is input, the access data including the CGI name is counted. and directory name judgment step to be added to the storage means,
A method for detecting abnormal data, comprising:
CGI名とCGI変数名とを含むアクセスデータが入力されると、前記入力されたアクセスデータに含まれるパラメータ値に基づいて、CGI変数名毎に異常データの特徴を示す特徴量を算出するデータ解析ステップと、
前記特徴量の平均値と標準偏差とを含む統計情報を生成し、前記データ解析ステップで算出された特徴量の平均値、標準偏差を含む統計情報を前記入力されたアクセスデータに含まれるCGI名毎に統計情報記憶手段に更新して記憶させる統計処理実行ステップと、
前記統計情報記憶手段を参照して前記入力されたアクセスデータに含まれるCGI名が存在するか否かを判定するアクセス判定ステップと、
前記アクセス判定ステップで前記CGI名が統計情報記憶手段に記憶されていると判定された場合、データ解析ステップで算出された特徴量と前記統計情報記憶手段に記憶されている統計情報とを比較して、前記入力されたアクセスデータが正常であるか否かを判定する統計的異常判定ステップと、
前記アクセス判定ステップで前記CGI名が統計情報記憶手段に記憶されていないと判定された場合、前記入力されたCGI名からCGIが位置するディレクトリ名を抽出し、この抽出されたディレクトリ名と前記統計情報記憶手段に記憶されている他のCGI名に含まれるディレクトリ名とを比較して前方一致する場合、前記入力されたアクセスデータが正常であるか否かを判定するとともに、前記CGI名を含むアクセスデータの入力回数をカウントし、前記CGI名を含むアクセスデータの入力回数が所定回数となったとき、前記CGI名と統計情報を前記統計情報記憶手段に追加するディレクトリ名判定ステップと、
を有することを特徴とする異常データ検出方法。
When access data including a CGI name and a CGI variable name is input, data analysis that calculates a feature amount indicating the characteristic of abnormal data for each CGI variable name based on a parameter value included in the input access data Steps,
Statistical information including the average value and standard deviation of the feature value is generated, and the CGI name included in the input access data includes the statistical value including the average value and standard deviation of the feature value calculated in the data analysis step. A statistical processing execution step for updating and storing in the statistical information storage means each time;
An access determination step of determining whether or not a CGI name included in the input access data exists with reference to the statistical information storage unit;
When it is determined in the access determination step that the CGI name is stored in the statistical information storage unit, the feature amount calculated in the data analysis step is compared with the statistical information stored in the statistical information storage unit. A statistical abnormality determination step for determining whether or not the input access data is normal;
If it is determined in the access determination step that the CGI name is not stored in the statistical information storage means, the directory name where the CGI is located is extracted from the input CGI name, and the extracted directory name and the statistics When comparing with a directory name included in another CGI name stored in the information storage means to make a forward match, it is determined whether or not the input access data is normal and includes the CGI name A directory name determination step of counting the number of times of access data input and adding the CGI name and statistical information to the statistical information storage means when the number of times of input of access data including the CGI name reaches a predetermined number ;
A method for detecting abnormal data, comprising:
前記ディレクトリ名判定ステップは、前記CGI名から最右のディレクトリ区切り文字より左をディレクトリ名として抽出することを特徴とする請求項11乃至13のいずれか1に記載の異常データ検出方法。   The abnormal data detection method according to claim 11, wherein in the directory name determination step, the left of the rightmost directory delimiter is extracted as a directory name from the CGI name. 前記ディレクトリ名判定ステップは、前記CGI名から最右のディレクトリ区切り文字より左をディレクトリ名として抽出し、前記抽出されたディレクトリ名と前記統計情報記憶手段に記憶されるCGI名に含まれるディレクトリ名とが同一でない場合、ディレクトリ名について文字列毎に区間を設定し、前記抽出されたディレクトリ名から最右の文字列の区間を順に除いた文字列と同一のディレクトリ名を有するCGI名が統計情報に存在する場合に前方一致すると判定することを特徴とする請求項13に記載の異常データ検出方法。   The directory name determining step extracts the left of the rightmost directory delimiter from the CGI name as a directory name, and the extracted directory name and the directory name included in the CGI name stored in the statistical information storage means Are not identical, a section is set for each character string for the directory name, and the CGI name having the same directory name as the character string obtained by sequentially removing the rightmost character string section from the extracted directory name is included in the statistical information. The abnormal data detection method according to claim 13, wherein when there exists, it is determined that there is a forward match.
JP2005096380A 2005-03-29 2005-03-29 Abnormal data detection apparatus, abnormal data detection program, and abnormal data detection method Expired - Fee Related JP4130445B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005096380A JP4130445B2 (en) 2005-03-29 2005-03-29 Abnormal data detection apparatus, abnormal data detection program, and abnormal data detection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005096380A JP4130445B2 (en) 2005-03-29 2005-03-29 Abnormal data detection apparatus, abnormal data detection program, and abnormal data detection method

Publications (2)

Publication Number Publication Date
JP2006277414A JP2006277414A (en) 2006-10-12
JP4130445B2 true JP4130445B2 (en) 2008-08-06

Family

ID=37212099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005096380A Expired - Fee Related JP4130445B2 (en) 2005-03-29 2005-03-29 Abnormal data detection apparatus, abnormal data detection program, and abnormal data detection method

Country Status (1)

Country Link
JP (1) JP4130445B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6033021B2 (en) * 2012-09-24 2016-11-30 三菱スペース・ソフトウエア株式会社 Unauthorized communication detection device, cyber attack detection system, computer program, and unauthorized communication detection method
WO2019225228A1 (en) * 2018-05-21 2019-11-28 日本電信電話株式会社 Learning method, learning device, and learning program
CN117195273B (en) * 2023-11-07 2024-02-06 闪捷信息科技有限公司 Data leakage detection method and device based on time sequence data anomaly detection

Also Published As

Publication number Publication date
JP2006277414A (en) 2006-10-12

Similar Documents

Publication Publication Date Title
US8863293B2 (en) Predicting attacks based on probabilistic game-theory
US9507944B2 (en) Method for simulation aided security event management
US10721244B2 (en) Traffic feature information extraction method, traffic feature information extraction device, and traffic feature information extraction program
US8577829B2 (en) Extracting information from unstructured data and mapping the information to a structured schema using the naïve bayesian probability model
JP6201614B2 (en) Log analysis apparatus, method and program
KR100862187B1 (en) A Method and a Device for Network-Based Internet Worm Detection With The Vulnerability Analysis and Attack Modeling
US8549314B2 (en) Password generation methods and systems
JP2019021294A (en) SYSTEM AND METHOD OF DETERMINING DDoS ATTACKS
CN106549980B (en) Malicious C &amp; C server determination method and device
JP6200101B2 (en) Analysis apparatus, analysis system, analysis method, and analysis program
CN110959158A (en) Information processing apparatus, information processing method, and information processing program
CN112738107B (en) Network security evaluation method, device, equipment and storage medium
EP3242240B1 (en) Malicious communication pattern extraction device, malicious communication pattern extraction system, malicious communication pattern extraction method and malicious communication pattern extraction program
CN107426136B (en) Network attack identification method and device
JP6962374B2 (en) Log analyzer, log analysis method and program
JP4130445B2 (en) Abnormal data detection apparatus, abnormal data detection program, and abnormal data detection method
CN113691491A (en) Method and device for detecting malicious domain name in domain name system
JP7019533B2 (en) Attack detection device, attack detection system, attack detection method and attack detection program
CN114285639B (en) Website safety protection method and device
JP4852124B2 (en) Abnormal data detection apparatus, abnormal data detection method, and abnormal data detection program
JP6602799B2 (en) Security monitoring server, security monitoring method, program
JP4371981B2 (en) Abnormal data detection apparatus, abnormal data detection method, and abnormal data detection program
CN110197066B (en) Virtual machine monitoring method and system in cloud computing environment
CN113553584A (en) Method, system and storage medium for detecting unknown threats of industrial internet security
WO2019225251A1 (en) Learning method, learning device and learning program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080509

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080521

R150 Certificate of patent or registration of utility model

Ref document number: 4130445

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140530

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees