JP4420850B2 - Flow class estimation method, apparatus and program - Google Patents

Flow class estimation method, apparatus and program Download PDF

Info

Publication number
JP4420850B2
JP4420850B2 JP2005114116A JP2005114116A JP4420850B2 JP 4420850 B2 JP4420850 B2 JP 4420850B2 JP 2005114116 A JP2005114116 A JP 2005114116A JP 2005114116 A JP2005114116 A JP 2005114116A JP 4420850 B2 JP4420850 B2 JP 4420850B2
Authority
JP
Japan
Prior art keywords
flow
class
attribute
management table
ajk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005114116A
Other languages
Japanese (ja)
Other versions
JP2006295576A (en
Inventor
達哉 森
亮一 川原
憲昭 上山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005114116A priority Critical patent/JP4420850B2/en
Publication of JP2006295576A publication Critical patent/JP2006295576A/en
Application granted granted Critical
Publication of JP4420850B2 publication Critical patent/JP4420850B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、通信網におけるあるリンクを経由するフローのクラスを推定し、フローを管理するフロークラス推定方法ならびにその装置に関する。   The present invention relates to a flow class estimation method and apparatus for estimating a flow class passing through a certain link in a communication network and managing the flow.

IPネットワークが広く利用されてくるに伴い、ネットワークトラヒック管理技術の重要性が高まってきている。特に、トラヒックの単位としてフローを利用することにより、木目の細かいネットワーク管理を実現することができる。フローは、TCP(Transmission Control Protocol)のコネクションや発着ホストのペアなど、共通の特徴を持ったパケットの集合として定義される。   As IP networks are widely used, the importance of network traffic management technology is increasing. In particular, by using a flow as a traffic unit, fine network management can be realized. A flow is defined as a set of packets having common characteristics, such as a TCP (Transmission Control Protocol) connection and a pair of sending and receiving hosts.

ネットワークに到来するフローを監視し、フローが到来すると同時に、そのフローの特性が把握できれば有用である。例えば、回線を圧迫するような巨大なフロー(異常フロー)を、その到来と共に迅速に特定できれば、そのフローの送信レートを速やかに制限することにより、回線が輻輳状態に陥ることを回避できる。
このように、フローの特性(例えば、正常フロー・異常フロー等)に応じてフローのクラス分けを行い、クラスに応じた制御を行うことにより、効果的なネットワーク管理が可能となる。
It is useful if the flow coming into the network is monitored and the flow characteristics can be grasped at the same time as the flow arrives. For example, if a huge flow (abnormal flow) that squeezes the line can be quickly identified as it arrives, the line can be prevented from being congested by quickly limiting the transmission rate of the flow.
As described above, by classifying flows according to flow characteristics (for example, normal flow, abnormal flow, etc.) and performing control according to the classes, effective network management can be performed.

上述のようなフローの迅速なクラス分けを実現する方法として、予め定められた規則に基づいて、静的にクラス分けを行う手法がある。例えば、優先すべきフローに対して、送信元がそのフローを構成するパケットのヘッダ等(例えば、ToS(Type of Service)フィールド等)にクラスの情報を記しておくことにより、迅速なクラス分けが可能となる。   As a method for realizing the rapid classification of the flow as described above, there is a method of performing static classification based on a predetermined rule. For example, for a flow that should be prioritized, classifying information in a header or the like (for example, a ToS (Type of Service) field) of a packet that constitutes the flow by a transmission source enables quick classification. It becomes possible.

しかしながら、このような方法は、全ての送信元にクラスを通知する機構を備えることが必要であり、異なる管理下にある多数の自律ネットワークから構成される現在のインターネットでは、そのような仕組みが存在せず、また、そのような仕組みをネットワーク全体に導入することは実現の可能性が極めて低いという問題がある。
さらに、クラスの決定は、送信元において静的に行われるため、例えば異常トラヒックのように突発的に発生するフローに対して動的にクラス分けをすることができない、という問題があった。
However, such a method needs to have a mechanism for notifying all transmission sources of the class, and such a mechanism exists in the current Internet composed of many autonomous networks under different management. In addition, there is a problem that the introduction of such a mechanism to the entire network has a very low possibility of realization.
Furthermore, since the class is determined statically at the transmission source, there is a problem that it is not possible to dynamically classify a flow that occurs unexpectedly, such as abnormal traffic.

このように、全ての送信元にクラスを通知する機構を備えれば、送信先において動的にフローのクラス分けを行うことができるが、異なる管理下にある多数の自律ネットワークから構成される現在のインターネットでは、このような仕組みをネットワーク全体に導入することは実現不可能である。
また、クラスの決定は、送信元において静的に行われるため、異常トラヒックのように突発的に発生するフローに対して動的にクラス分けをすることができない。
In this way, if a mechanism for notifying all transmission sources of a class is provided, flow classification can be performed dynamically at the transmission destination, but it is currently composed of many autonomous networks under different management. In the Internet, it is impossible to introduce such a mechanism to the entire network.
In addition, since the class is determined statically at the transmission source, it is not possible to dynamically classify a flow that occurs unexpectedly, such as abnormal traffic.

(目的)
本発明の目的は、このような従来の課題を解決し、予め定めたクラスに対して、新たに到来したフローがどのクラスに属するかを動的に、かつ高精度に推定することができ、過去に存在しないような属性の組み合わせを持つフローに対してもクラスを推定することが可能なフロークラス推定方法およびその装置を提供することにある。
(the purpose)
The object of the present invention is to solve such a conventional problem, and to dynamically and accurately estimate which class a newly arrived flow belongs to a predetermined class, An object of the present invention is to provide a flow class estimation method and apparatus capable of estimating a class even for flows having combinations of attributes that do not exist in the past.

本発明のフロー推定方法では、ナイーブベイズ分類器という統計的手法を利用し、過去に学習したフローの属性とそのクラスとの確率的な関係を元に、新たに到来したフローの属性を元に、そのフローが属するクラスを確率的に推定する。ナイーブベイズ分類器を用いることにより、過去に存在しないような属性の組み合わせを持つフローに対しても、尤もらしいクラスを推定することができ、これによりロバストな推定が可能となる。   In the flow estimation method of the present invention, a statistical method called a naive Bayes classifier is used, and based on a stochastic relationship between a flow attribute learned in the past and its class, based on a newly arrived flow attribute. , Probabilistically estimate the class to which the flow belongs. By using a naive Bayes classifier, it is possible to estimate a likely class even for a flow having a combination of attributes that does not exist in the past, thereby enabling robust estimation.

本発明の第1のフロークラス推定方法では、フロー統計管理部は、当該リンク(あるいは複数リンク)を通過するフローの計測を実施するか、あるいは、別途設置されたフロー計測器からフロー統計を取得し、取得したフロー統計データをフロー管理テーブルに登録する。また、フロー学習部は、前記のフロー管理テーブルに登録された情報を元に、フローが持つ属性とそのフローが属するクラスとの確率的な関係を算出し、学習データに記録する。また、フロークラス推定部は、前記学習データを元に、新たに到来したフローの属性からそのフローが属するクラスをナイーブベイズ分類器を用いることにより、確率的に推定する。   In the first flow class estimation method of the present invention, the flow statistics management unit measures the flow passing through the link (or a plurality of links), or acquires flow statistics from a separately installed flow measuring instrument. Then, the acquired flow statistical data is registered in the flow management table. Further, the flow learning unit calculates a probabilistic relationship between the attributes of the flow and the class to which the flow belongs based on the information registered in the flow management table, and records it in the learning data. In addition, the flow class estimation unit probabilistically estimates a class to which the flow belongs from a newly arrived flow attribute based on the learning data by using a naive Bayes classifier.

本発明の第2のフロークラス推定方法では、フロー管理テーブルの管理は、1)対象となるリンクを通過するパケットのヘッダ部を参照・計数することで得られた情報をフロー管理テーブルに保持することにより実施するか、あるいは、2)当該リンクに対して別途設置されたフロー計測装置が出力する統計値を取得し、フロー管理テーブルに登録することによって実施する。   In the second flow class estimation method of the present invention, the flow management table is managed by 1) holding the information obtained by referring to and counting the header part of the packet passing through the target link in the flow management table. Or 2) Acquire a statistical value output by a flow measuring device separately installed for the link and register it in the flow management table.

本発明の第3のフロークラス推定方法では、フロー管理テーブルは、予め定めた計測期間において、フローを構成するパケットが最初に到着した時刻、最後に到着した時刻、累積送信パケット数、累積送信バイト数、発着インタフェース、フロー属性等から成る。
また、前記フロー属性は、例えば当該フローを構成するパケットのヘッダに記載の発着IPアドレス、発着AS番号、発着プレフィックス、発着ポート番号、プロトコル種別、TTL(Time−to−live)、TCPフラグ、TCPウィンドウサイズ、ウィンドウスケールオプションの有無、および、その他の値やそれらの値の統計値などのフローについて計測し得るデータのあらゆる組み合わせによって定めることができ、さらに、これらの統計値をハッシュ関数などの手段により集約した形によっても記録することが可能である。ハッシュ関数を用いることにより、管理するデータ数を低減することができる。
In the third flow class estimation method of the present invention, the flow management table includes a time at which a packet constituting the flow first arrives, a time at which packets finally arrive, a cumulative transmission packet number, a cumulative transmission byte in a predetermined measurement period. It consists of number, incoming / outgoing interface, flow attribute, etc.
The flow attributes include, for example, a calling IP address, a calling AS number, a calling prefix, a calling port number, a protocol type, a TTL (Time-to-live), a TCP flag, and a TCP described in the header of a packet constituting the flow. It can be defined by any combination of data that can be measured for the flow, such as window size, presence or absence of window scale options, and other values and statistics of those values. It is also possible to record in an aggregated form. By using a hash function, the number of data to be managed can be reduced.

本発明の第4のフロークラス推定方法では、フロー学習部は、予め定めた期間において、フロー管理テーブルに記載のフロー統計値を参照し、予め定めた閾値を用いるか、あるいは、統計値の平均値、標準偏差などの値を用いるか、その他任意の統計的手法によって、各フローをクラスCi(C1,C2,C3,・・・Cn)(n個のクラス)に分類する。   In the fourth flow class estimation method of the present invention, the flow learning unit refers to the flow statistical values described in the flow management table in a predetermined period, uses a predetermined threshold value, or averages the statistical values. Each flow is classified into classes Ci (C1, C2, C3,... Cn) (n classes) using values such as values and standard deviations, or any other statistical method.

本発明の第5のフロークラス推定方法では、フロー学習部は、フローが分類されるクラスCi、各フローが持つ属性A={A1,A2,A3,・・・,Am}(m個の属性)、各属性Ajの取り得る値をAj=ajkとし、
フロー管理テーブルを参照し、クラスiが生起した回数ni、およびクラスiに分類されたフローが属性ajkを有する回数nijkを計数し、
これらの値ni,nijkを用いてクラスCiが生起した条件の下で属性Ajが属性値ajkを有する確率をP(Aj=ajk|Ci)=nijk/niのように算出し、学習データに記録する。
In the fifth flow class estimation method of the present invention, the flow learning unit includes a class Ci in which flows are classified, and an attribute A = {A1, A2, A3,..., Am} (m attributes) ), A possible value of each attribute Aj is Aj = ajk,
Referring to the flow management table, count the number of times ni that class i has occurred, and the number of times nijk that the flow classified into class i has attribute ajk,
Using these values ni and nijk, the probability that the attribute Aj has the attribute value ajk under the condition where the class Ci occurred is calculated as P (Aj = ajk | Ci) = nijk / ni and recorded in the learning data To do.

本発明の第6のフロークラス推定方法では、第5のフロークラス推定方法におけるフロー学習部における確率P(Aj=ajk|Ci)の算出において、クラスCiと属性Ajがフロー管理テーブル内において同時に存在しない場合を考慮して、フロー管理テーブルに存在するフローの数n、およびその逆数f=1/n、属性jが取り得る値の数をnjとし、Laplaceの補正によって、(Aj=ajk|Ci)=(nijk+f)/(ni+f*nj)のように算出する。また、補正の方法は、前記Laplaceの補正には限らない。   In the sixth flow class estimation method of the present invention, in the calculation of the probability P (Aj = ajk | Ci) in the flow learning unit in the fifth flow class estimation method, the class Ci and the attribute Aj exist simultaneously in the flow management table. In consideration of the case where the number of flows existing in the flow management table is n and its inverse f = 1 / n, the number of values that the attribute j can take is nj, and (Aj = ajk | Ci) by Laplace correction ) = (Nijk + f) / (ni + f * nj). Further, the correction method is not limited to the Laplace correction.

本発明の第7のフロークラス推定方法では、フロークラス推定部は、リンクの計測、あるいは別途設置されたフロー計測機器からの出力に基づき、新たに到来したフロー毎にその属性Aを取得し、第5,第6のフロークラス推定方法の学習データに記録された確率P(Aj=ajk|Ci)、およびクラスCiが生起する確率P(Ci)=ni/n、を用いて、判別関数f(Ci)=P(Ci)*ΠjP(Aj=ajk|Ci)(なお、Πjは全てのjについて以降に続く項を乗算する演算を示す)を全てのクラスCiに対して算出し、その内判別関数の最大値を与えるCiを当該フローのクラスとして(ナイーブベイズ分類器)推定する。   In the seventh flow class estimation method of the present invention, the flow class estimation unit acquires the attribute A for each newly arrived flow based on link measurement or output from a separately installed flow measurement device, Using the probability P (Aj = ajk | Ci) recorded in the learning data of the fifth and sixth flow class estimation methods and the probability P (Ci) = ni / n that the class Ci occurs, the discriminant function f (Ci) = P (Ci) * ΠjP (Aj = ajk | Ci) (where Πj represents an operation of multiplying the subsequent terms for all j) for all classes Ci, Ci that gives the maximum value of the discriminant function is estimated as a class of the flow (naive Bayes classifier).

本発明の第8のフロークラス推定方法では、フロークラスの推定は、全てのフローが到来する毎に実施してもよいし、サンプリングやフィルタリングなどの手法によって、推定を実施するフローを限定することも可能である。   In the eighth flow class estimation method of the present invention, the estimation of the flow class may be performed every time all flows arrive, or the flow to be estimated is limited by a technique such as sampling or filtering. Is also possible.

本発明によれば、予め定めたクラスに対して、新たに到来したフローがどのクラスに属するかを動的に、かつ高精度に推定することができる。また、ナイーブベイズ分類器という統計的手法を利用して、過去に学習したフローの属性とそのクラスとの確率的な関係を元に、新たに到来したフローの属性を元にそのフローが属するクラスを確率的に推定することができる。その結果、過去に存在しないような属性の組み合わせを持つフローに対しても、クラスを推定できるので、ロバストな推定が可能である。 According to the present invention, it is possible to dynamically and accurately estimate which class a newly arrived flow belongs to a predetermined class. Further, by using a statistical technique called naive Bayes classifier, based on the probabilistic relation between the attributes of the flow learned in the past and their class, newly arrived flow attributes of Motoniso flow The class to which it belongs can be estimated probabilistically. As a result, since the class can be estimated even for a flow having a combination of attributes that does not exist in the past, robust estimation is possible.

以下、図面により本発明の実施例を説明する。
なお、実施例では、簡単のために、1)フロー統計をフロークラス推定装置自身が取得し、2)フローは、同一の発着IPアドレス、発着ポート番号、プロトコル種別を有するパケットの場合として定義し、3)フロークラスはフローサイズの大小によって定める2クラスである場合を例に説明するが、本発明の適用範囲はこの実施例に限定されるものではない。
Embodiments of the present invention will be described below with reference to the drawings.
In the embodiment, for the sake of simplicity, 1) the flow statistics are acquired by the flow class estimation device itself, and 2) the flow is defined as a packet having the same call origination IP address, call origination port number, and protocol type. 3) The case where the flow class is two classes determined by the size of the flow size will be described as an example, but the scope of application of the present invention is not limited to this embodiment.

図1は、本発明が適用されるIPネットワークの基本構成の一例を示す構成図である。
図1に示すように、フロークラス推定装置11は、ネットワークの主要なリンク12を構成するルータ10等のノードに併設する形態で利用される。
フロークラス推定装置11は、ルータ10上を経由するトラヒックを、以下のような方法のいずれかにより計測することができる。
1)リンク12上を光カプラやタップ等のデバイスを用いることにより、リンク12上を流れる全てのパケットをフロークラス推定装置11に向けて分岐される。
2)ルータ10におけるポートミラーリング機能などを用い、ルータ10を経由する全てのパケットをフロークラス推定装置11にコピーする。
FIG. 1 is a configuration diagram showing an example of a basic configuration of an IP network to which the present invention is applied.
As shown in FIG. 1, the flow class estimation device 11 is used in a form of being attached to a node such as a router 10 constituting a main link 12 of a network.
The flow class estimation device 11 can measure the traffic passing on the router 10 by any of the following methods.
1) By using a device such as an optical coupler or a tap on the link 12, all packets flowing on the link 12 are branched toward the flow class estimation device 11.
2) Using the port mirroring function or the like in the router 10, copy all packets passing through the router 10 to the flow class estimation device 11.

フロークラス測定装置11は、前記1)または2)のような手法により、図1におけるリンク12上に発生する全てのフローの統計を構成し、取得することができるが、その方法は、前記に挙げた方法に限定されるものではなく、例えば、フロークラス推定装置11そのものに光カプラもしくはタップの機能を組み込むことにより、当該回線に対して挿入するような形態で利用することも可能である。   The flow class measurement apparatus 11 can construct and acquire statistics of all flows generated on the link 12 in FIG. 1 by the method as described in 1) or 2). The method is not limited to the above-described method. For example, the flow class estimation device 11 itself can be used by inserting an optical coupler or a tap function into the line.

図2は、本発明の一実施例に係るフロークラス推定装置の構成図である。
フロークラス推定装置11にパケットが到着すると、まずフロー統計管理部111に入力する。フローを管理するために必要な処理を行った後、フロー管理テーブル112に必要事項を書き込む。フロー学習部113は、書き込まれたフロー管理テーブル112の内容を読み込んで、これを解析し、学習データ114に一旦書き込んだ後、フロークラス推定部115に転送して、フロークラスを推定させる。
本実施例では、フロークラス推定装置11への入力は、上記1)あるいは2)等の手段により取得したパケットのヘッダ情報であるが、他の例として、Cisco社が提供しているNetFlow等の別途リンク上に設置されたフロー計測装置が出力するデータであっても構わない。
FIG. 2 is a configuration diagram of a flow class estimation apparatus according to an embodiment of the present invention.
When a packet arrives at the flow class estimation device 11, it is first input to the flow statistics management unit 111. After performing processing necessary for managing the flow, necessary items are written in the flow management table 112. The flow learning unit 113 reads the content of the written flow management table 112, analyzes it, writes it once in the learning data 114, transfers it to the flow class estimation unit 115, and estimates the flow class.
In this embodiment, the input to the flow class estimation device 11 is the header information of the packet acquired by means such as the above 1) or 2), but as another example, NetFlow provided by Cisco, etc. It may be data output from a flow measurement device installed on a separate link.

図3は、本発明の一実施例に係るフロー管理テーブルの構成図である。
図3では、簡単のためにフロー属性として発着IPアドレス、発着ポート番号、プロトコル種別を用い、フロー統計値として累積送信バイト数のみを用いた例を示している。それ以外に、最初に到着した時刻、最後に到着した時刻も記録される。
FIG. 3 is a configuration diagram of a flow management table according to an embodiment of the present invention.
For the sake of simplicity, FIG. 3 shows an example in which an incoming / outgoing IP address, an incoming / outgoing port number, and a protocol type are used as flow attributes, and only the cumulative number of transmitted bytes is used as a flow statistical value. In addition, the first arrival time and the last arrival time are also recorded.

図4は、本発明において構成する学習データの一例を示す図である。
図4の上図のデータベースでは、クラスCiに属するフロー数、およびクラスCiかつ属性Ajが値ajkを持つフローの数を記録する。
また、図4の下図のデータベースでは、上図のデータおよびLaplaceの補正を用いてクラスCiであるフローが属性Aを持つ確率を算出している。
この例では、簡単のために、属性を2つ(A1,A2)とし、それぞれが取り得る値を図中に示したように(a11,a12,・・・a24)、4個ずつに限定した例を示している。例えば、図から、クラスC1に属するフローの総数はn1=37であり、クラスC2かつその属性A2の値が,A2=a23となったフローの数はn223=4である。
FIG. 4 is a diagram showing an example of learning data configured in the present invention.
In the upper database of FIG. 4, the number of flows belonging to the class Ci and the number of flows having the value ajk for the class Ci and the attribute Aj are recorded.
In the lower database of FIG. 4, the probability that the flow of class Ci has the attribute A is calculated using the upper data and Laplace correction.
In this example, for the sake of simplicity, the number of attributes is two (A1, A2), and each possible value is limited to four (a11, a12,... A24) as shown in the figure. An example is shown. For example, from the figure, the total number of flows belonging to class C1 is n1 = 37, and the number of flows whose class A2 and attribute A2 value is A2 = a23 is n223 = 4.

図5は、本発明の一実施例に係るフロークラス推定部がクラスを決定する際の手順を示すフローチャートである。
図2に示した通り、フロークラス推定装置11にパケットが到着すると(ステップ101)、フロー統計管理部111において、ヘッダに記載された値を読み込み、フロー毎に統計値をフロー管理テーブル112に記録し、更新する。図5では、統計値の例として、最初にパケットが到着した時刻、最後にパケットが到着した時刻、累積バイト数を示している。フロー統計管理部111は、フロー管理テーブル112に登録されていない新たなフローが到来する毎に新たに登録し、既にフロー管理テーブル112に登録されているフローが到来したならば、その統計値を更新する。
FIG. 5 is a flowchart illustrating a procedure when the flow class estimation unit according to an embodiment of the present invention determines a class.
As shown in FIG. 2, when a packet arrives at the flow class estimation device 11 (step 101), the flow statistics management unit 111 reads the value described in the header and records the statistical value in the flow management table 112 for each flow. And update. In FIG. 5, as an example of the statistical value, the time when the packet arrived first, the time when the packet arrived last, and the cumulative number of bytes are shown. The flow statistics management unit 111 newly registers each time a new flow that is not registered in the flow management table 112 arrives. If a flow that has already been registered in the flow management table 112 arrives, the flow statistics management unit 111 displays the statistical value. Update.

フロー管理テーブル112は、1)そのメモリの容量に空きがある限りエントリを増やしても良いし、2)予め定めたタイミングやルールに従って一部のフロー統計を随時消去することも可能である。例えば、1)のような場合、あるタイミングでメモリの容量が限界に達した時点で、その時のエントリされたフロー情報を全て消去する。また、2)の場合、例えば、フロー毎に、最後に到着したパケットの時刻を管理し、その時刻と現在の時刻との差が予め定めることのできるタイムアウト値=T秒以上になった時点や、その他のタイミングやルールに従って、該当するフローの統計値を消去することにより、同時に保持するフロー数を適切に管理することができる。   In the flow management table 112, 1) entries may be increased as long as the memory capacity is free, and 2) some flow statistics may be deleted at any time according to predetermined timings and rules. For example, in the case of 1), when the memory capacity reaches a limit at a certain timing, all the entered flow information at that time is deleted. In the case of 2), for example, for each flow, the time of the last arriving packet is managed, and when the difference between the time and the current time becomes a predetermined timeout value = T seconds or more, By deleting the statistical value of the corresponding flow according to other timings and rules, the number of flows simultaneously held can be appropriately managed.

フロー学習部113は、予め任意の値に定めることのできる時間的周期ないしはタイミングが到来する毎にフロー学習データを構築する。すなわち、予め定めた規則に基づいて、フロー管理テーブル112に登録された全てのフローをクラス毎に分類し、また各々のフローが持つ属性の値を用いて学習データにni、およびnijkを記録する。その例を、図4の上図に示している。
フロー学習部113は、さらに学習データに記録されたデータを元に、確率P(Ci)およびP(Aj=ajk|Ci)を算出する。
The flow learning unit 113 constructs flow learning data every time period or timing that can be set to an arbitrary value in advance. That is, based on a predetermined rule, all the flows registered in the flow management table 112 are classified for each class, and ni and nijk are recorded in the learning data using the attribute values of each flow. . An example of this is shown in the upper diagram of FIG.
The flow learning unit 113 further calculates probabilities P (Ci) and P (Aj = ajk | Ci) based on the data recorded in the learning data.

この際に、フロー学習部113は、フロー管理テーブル112に存在するフローの総数をnとし、その逆数f=1/n、属性jが取り得る値の数をnjとし、Laplaceの補正によって、P(Aj=ajk|Ci)=(nijk+f)/(ni+f*nj)のように算出する。
その例を、図4の下図に示している。
At this time, the flow learning unit 113 sets the total number of flows existing in the flow management table 112 as n, its reciprocal number f = 1 / n, the number of values that the attribute j can take as nj, and by correcting the Laplace, P (Aj = ajk | Ci) = (nijk + f) / (ni + f * nj).
An example is shown in the lower part of FIG.

フロークラス推定部115は、リンクの計測、あるいは別途設置されたフロー計測機器からの出力に基づき、新たに到来したフロー毎にその属性Aを取得し、その属性Aを調べる(ステップ102)。すなわち、学習データ114に記録された確率P(Aj=ajk|Ci)、およびクラスCiが生起する確率P(Ci)=ni/nを用いて、判別関数f(Ci)=P(Ci)*ΠjP(Aj=ajk|Ci)(Πjは全てのjについて以降に続く項を乗算する演算を示す)を全てのクラスCiに対して算出し(ステップ103)、そのうち判別関数の最大値を与えるCiを当該フローのクラスとして推定する(ステップ104)。   The flow class estimation unit 115 acquires the attribute A for each newly arrived flow based on the link measurement or the output from the separately installed flow measurement device, and examines the attribute A (step 102). That is, using the probability P (Aj = ajk | Ci) recorded in the learning data 114 and the probability P (Ci) = ni / n that the class Ci occurs, the discriminant function f (Ci) = P (Ci) * ΠjP (Aj = ajk | Ci) (Πj represents an operation of multiplying the subsequent term for all j) is calculated for all classes Ci (step 103), and Ci giving the maximum value of the discriminant function Is estimated as the class of the flow (step 104).

本実施例では、図2に示すフロークラス推定装置11のフロー統計管理部111は、フロー管理テーブル112に情報を書き込むか、またはテーブル112から読み出す読み書き制御回路を備えており、また、フロー学習部113は到来したフローの情報がフロー管理テーブル112に登録される毎に、これを読み出して、演算回路により算出することにより、学習データ114に記録する。また、フロークラス推定部115は、該フローが属するクラスを確率的に推定するために、ナイーブベイズ分類器を備えている。
そして、本発明のフロークラス推定装置11は、コンピュータの制御により処理を実施する。
In the present embodiment, the flow statistics management unit 111 of the flow class estimation device 11 shown in FIG. 2 includes a read / write control circuit that writes information to or reads information from the flow management table 112, and a flow learning unit. The information 113 is read each time the information of the incoming flow is registered in the flow management table 112, and is recorded in the learning data 114 by being calculated by the arithmetic circuit. Further, the flow class estimation unit 115 includes a naive Bayes classifier in order to probabilistically estimate the class to which the flow belongs.
And the flow class estimation apparatus 11 of this invention implements a process by control of a computer.

図5に示すフロー到来による処理の手順を、プログラム化してCD−ROMなどの記録媒体に格納しておけば、この記録媒体をルータに接続されたフロークラス推定装置のコンピュータに装着して、コンピュータにプログラムをインストールし、実行させることで、本発明によるフロークラスの推定方法を容易に実現することができる。また、ネットワークを介して上記コンピュータからユーザの希望者にダウンロードすることで、上記プログラムの汎用化が実現可能となる。   If the procedure of processing due to the arrival of the flow shown in FIG. 5 is programmed and stored in a recording medium such as a CD-ROM, the recording medium is attached to the computer of the flow class estimation apparatus connected to the router, and the computer The flow class estimation method according to the present invention can be easily realized by installing and executing the program. Further, the program can be generalized by downloading from the computer to the user who desires it via the network.

本発明が適用されるIPネットワークの基本構成の一例を示す構成図である。It is a block diagram which shows an example of the basic composition of the IP network to which this invention is applied. 本発明の一実施例に係るフロークラス推定装置の構成図である。It is a block diagram of the flow class estimation apparatus which concerns on one Example of this invention. 本発明の一実施例に係るフロー管理テーブルの構成図である。It is a block diagram of the flow management table which concerns on one Example of this invention. 本発明の一実施例に係るフロー学習部が処理した学習データの説明図である。It is explanatory drawing of the learning data which the flow learning part which concerns on one Example of this invention processed. 本発明の一実施例に係るフロークラス推定部の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the flow class estimation part which concerns on one Example of this invention.

符号の説明Explanation of symbols

10:ルータ
11:フロークラス推定装置
12:リンク
111:フロー統計管理部
112:フロー管理テーブル
113:フロー学習部
114:学習データ
115:フロークラス推定部
DESCRIPTION OF SYMBOLS 10: Router 11: Flow class estimation apparatus 12: Link 111: Flow statistics management part 112: Flow management table 113: Flow learning part 114: Learning data 115: Flow class estimation part

Claims (6)

コンピュータの制御により、通信網におけるリンクを経由するフローのクラスを確率的に推定する方法であって、
フロー統計管理部は、当該リンクを通過するフローを計測して取得した計測値を、あるいは、別途設置されたフロー計測器が取得したフロー統計値を読み出してフロー管理テーブルに書き込むことにより登録し、
フロー学習部は、前記フロー管理テーブルに登録された情報を読み出し、該情報に基づいてフローが持つ属性と該フローが属するクラスとの確率的な関係を演算回路により算出し、算出結果を学習データに記録する際、
フローが分類されるクラスCi、各フローが持つ属性A={A1,A2,A3,・・,Am}(m個の属性)、各属性Ajの取り得る値をAj=ajk(k=1,2,・・)とし、
フロー管理テーブルを参照して、該フロー管理テーブルに存在するフローの数nとクラスiが生起した回数ni、およびクラスiに分類されたフローが属性ajkを持つ回数nijkを計数し、
前記の値ni,nijkを用いて、クラスCiが生起した条件の下で属性Ajが属性値ajkを有する確率をP(Aj=ajk|Ci)=nijk/niで算出し、学習データに記録し、
フロークラス推定部は、前記学習データを元に新たに到来したフローの属性から、ナイーブベイズ分類器を用いて該分類器の分類結果を読み取ることにより、該フローが属するクラスを確率的に推定する際、
リンクの計測、あるいは別途設置されたフロー計測機器からの出力に基づき、新たに到来したフロー毎にその属性Aを取得し、
上記学習データに記録された確率P(Aj=ajk|Ci)、および、クラスCiが生起する確率P(Ci)=ni/nを用いて、判別関数f(Ci)=P(Ci)×ΠjP(Aj=ajk|Ci)(Πjは全てのjについて以降に続く項を乗算する演算を示す)を全てのクラスCiに対して算出し、
そのうち前記判別関数の最大値を与えるCiを当該フローのクラスとして、ナイーブベイズ分類器により推定する
ことを特徴とするフロークラス推定方法。
A method of probabilistically estimating a class of a flow that passes through a link in a communication network under computer control,
The flow statistics management unit registers the measurement value acquired by measuring the flow passing through the link, or by reading the flow statistics value acquired by a separately installed flow meter and writing it in the flow management table,
The flow learning unit reads information registered in the flow management table, calculates a probabilistic relationship between an attribute of the flow and a class to which the flow belongs based on the information, and calculates the calculation result as learning data When recording to
Class Ci in which flows are classified, attributes A = {A1, A2, A3,..., Am} (m attributes) of each flow, and possible values of each attribute Aj are Aj = ajk (k = 1, 2, ...)
Referring to the flow management table, count the number n of flows existing in the flow management table, the number of times ni occurs in class i, and the number of times nijk in which the flows classified into class i have attribute ajk,
Using the values ni and nijk, the probability that the attribute Aj has the attribute value ajk under the condition where the class Ci occurred is calculated as P (Aj = ajk | Ci) = nijk / ni and recorded in the learning data. ,
The flow class estimation unit probabilistically estimates a class to which the flow belongs by reading a classification result of the classifier from a newly arrived flow attribute based on the learning data using a naive Bayes classifier. When
Based on the link measurement or the output from a separately installed flow measurement device, acquire the attribute A for each newly arrived flow,
Using the probability P (Aj = ajk | Ci) recorded in the learning data and the probability P (Ci) = ni / n that the class Ci occurs, the discriminant function f (Ci) = P (Ci) × ΠjP (Aj = ajk | Ci) (Πj represents an operation for multiplying the subsequent terms for all j) for all classes Ci,
A flow class estimation method characterized in that Ci giving the maximum value of the discriminant function is estimated as a class of the flow by a naive Bayes classifier.
請求項に記載のフロークラス推定方法において、
前記フロー学習部における確率P(Aj=ajk|Ci)の算出は、クラスCiと属性Ajがフロー管理テーブル内において同時に存在しない場合を考慮して、該フロー管理テーブルに存在するフローの数n、および、その逆数f=1/n、属性jが取り得る値の数をnjとし、Laplaceの補正によって、
P(Aj=ajk|Ci)=(nijk+f)/(ni+f×nj
として算出することを特徴とするフロークラス推定方法。
The flow class estimation method according to claim 1 ,
The calculation of the probability P (Aj = ajk | Ci) in the flow learning unit takes into account the case where the class Ci and the attribute Aj do not exist in the flow management table at the same time, the number n of flows existing in the flow management table, And the reciprocal number f = 1 / n, the number of values that the attribute j can take is nj, and Laplace correction,
P (Aj = ajk | Ci) = (nijk + f) / (ni + f × nj )
Flow class estimating wherein the benzalkonium be calculated as.
請求項1もしくは請求項2のいずれかに記載のフロークラス推定方法において、
前記フロークラス推定部は、全てのフローが到来する毎に、前記フローが属するクラスの推定を行う、あるいは、サンプリングもしくはフィルタリングにより、推定を実施するフローを限定することを特徴とするフロークラス推定方法。
In the flow class estimation method according to claim 1 or 2 ,
Flow The flow class estimator, for each of all the flows arrives, an estimate of the class the flow belongs, or which is characterized in that to limit the flow of more sampling or filter-ring, to implement the estimation Class estimation method.
請求項1から請求項3のいずれかに記載のフロークラス推定方法において、
前記フロー管理テーブルに登録される情報は、予め定めた計測期間において、少なくともフローを構成するパケットが最初に到着した時刻、最後に到着した時刻、累積送信パケット数、累積送信バイト数、発着インタフェース、フロー属性から成り、
前記フロー属性は、当該フローを構成するパケットのヘッダに記載の発着IPアドレス、発着AS番号、発着プリフィックス、発着ポート番号、プロトコル種別、TTL、TCPフラグ、TCPウィンドウサイズ、ウィンドウスケールオプションの有無をむ各データの任意の組み合わせにより定め、さらにハッシュ関数により集約してな
ことを特徴とするフロークラス推定方法。
In the flow class estimation method according to any one of claims 1 to 3 ,
Information registered in the flow management table includes at least a time at which a packet constituting the flow first arrives, a time at which a packet constituting the flow arrives at the end, a cumulative number of transmitted packets, a cumulative number of transmitted bytes, an arrival / departure interface, Consists of flow attributes,
The flow attribute is, arrival and departure IP address described in the header of the packet that constitutes the person said flow, departure AS number, departure prefix, departure port number, protocol type, TTL, TCP flags, TCP window size, Mu perforated window scale option the defined by any combination of including each data flow class estimating method comprising Rukoto such with more aggregated hash function number further.
プログラムされたコンピュータ処理を実行する手段として、
請求項1から請求項4のいずれかに記載のフロークラス推定方法におけるフロー統計管理部とフロー学習部、フロークラス推定部を具備し、
前記フロー統計管理部による前記フロー管理テーブルへの情報の登録、
前記フロー学習部による前記学習データの記録、
前記フロークラス推定部による前記フローが属するクラスの推定
を行うことで、
通信網におけるリンクを経由するフローのクラスを確率的に推定することを特徴とするフロークラス推定装置。
As a means of performing programmed computer processing,
A flow statistics management unit, a flow learning unit, and a flow class estimation unit in the flow class estimation method according to any one of claims 1 to 4,
Registration of information in the flow management table by the flow statistics management unit,
Recording of the learning data by the flow learning unit;
By estimating the class to which the flow belongs by the flow class estimation unit,
A flow class estimation device characterized by probabilistically estimating a class of a flow passing through a link in a communication network.
コンピュータに、請求項1から請求項4のいずれかに記載のフロークラス推定方法における各処理を実行させるためのプログラム。   The program for making a computer perform each process in the flow class estimation method in any one of Claims 1-4.
JP2005114116A 2005-04-12 2005-04-12 Flow class estimation method, apparatus and program Expired - Fee Related JP4420850B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005114116A JP4420850B2 (en) 2005-04-12 2005-04-12 Flow class estimation method, apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005114116A JP4420850B2 (en) 2005-04-12 2005-04-12 Flow class estimation method, apparatus and program

Publications (2)

Publication Number Publication Date
JP2006295576A JP2006295576A (en) 2006-10-26
JP4420850B2 true JP4420850B2 (en) 2010-02-24

Family

ID=37415658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005114116A Expired - Fee Related JP4420850B2 (en) 2005-04-12 2005-04-12 Flow class estimation method, apparatus and program

Country Status (1)

Country Link
JP (1) JP4420850B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5199201B2 (en) * 2009-08-27 2013-05-15 日本電信電話株式会社 High speed binary classification system and method and program
JP6645957B2 (en) 2016-12-16 2020-02-14 株式会社東芝 Motion estimation method and motion estimation system

Also Published As

Publication number Publication date
JP2006295576A (en) 2006-10-26

Similar Documents

Publication Publication Date Title
EP2288086B1 (en) Network monitoring device, bus system monitoring device, method and program
US8427958B2 (en) Dynamic latency-based rerouting
JP4738148B2 (en) Method and apparatus for estimating available bandwidth on a packet network
US8229705B1 (en) Performance monitoring in computer networks
JP5673805B2 (en) Network device, communication system, abnormal traffic detection method and program
CN108667898B (en) Network element and method for providing a snapshot of buffer content in a network element
US10924374B2 (en) Telemetry event aggregation
US20150092591A1 (en) Identifying flows causing undesirable network events
JPWO2013005535A1 (en) Transmission system, transmission apparatus, packet loss rate measurement method, and packet loss rate measurement program
CN112565102B (en) Load balancing method, device, equipment and medium
US10904150B1 (en) Distributed dynamic load balancing in network systems
US20210336960A1 (en) A System and a Method for Monitoring Traffic Flows in a Communications Network
JP4420850B2 (en) Flow class estimation method, apparatus and program
US8614965B2 (en) Packet loss frequency measuring system, packet loss frequency measuring method, and program
Chan et al. An active queue management scheme based on a capture-recapture model
JP4938042B2 (en) Flow information transmitting apparatus, intermediate apparatus, flow information transmitting method and program
US11025519B2 (en) Systems, methods and computer-readable media for external non-intrusive packet delay measurement
JP5437194B2 (en) Flow communication quality estimation method, apparatus and program
CN115348273A (en) Service message processing method, device and storage medium
Torres-Jr et al. Packet reordering metrics to enable performance comparison in IP‐networks
Ho et al. Performance improvement of delay-based TCPs in asymmetric networks
JP2007221612A (en) Traffic information aggregation system and method
Cheng et al. New exploration of packet-pair probing for available bandwidth estimation and traffic characterization
Machiraju et al. A measurement-friendly network (MFN) architecture
Piratla et al. A comparative analysis of packet reordering metrics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070808

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091201

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091201

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees