JP2013187629A - アプリケーション種別分類装置及びアプリケーション種別分類方法並びにそのプログラム - Google Patents

アプリケーション種別分類装置及びアプリケーション種別分類方法並びにそのプログラム Download PDF

Info

Publication number
JP2013187629A
JP2013187629A JP2012049439A JP2012049439A JP2013187629A JP 2013187629 A JP2013187629 A JP 2013187629A JP 2012049439 A JP2012049439 A JP 2012049439A JP 2012049439 A JP2012049439 A JP 2012049439A JP 2013187629 A JP2013187629 A JP 2013187629A
Authority
JP
Japan
Prior art keywords
communication data
type
information
category
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012049439A
Other languages
English (en)
Other versions
JP5659175B2 (ja
Inventor
Haiying Jiang
海鷹 蒋
Koichi Kawahara
浩一 川原
Takehiko Watanabe
岳彦 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Comware Corp
Original Assignee
NTT Comware Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Comware Corp filed Critical NTT Comware Corp
Priority to JP2012049439A priority Critical patent/JP5659175B2/ja
Publication of JP2013187629A publication Critical patent/JP2013187629A/ja
Application granted granted Critical
Publication of JP5659175B2 publication Critical patent/JP5659175B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】通信データを発生させたアプリケーションサービスの分類を少ない計算量により判定することのできるアプリケーション種別分類装置を提供する。
【解決手段】取得した通信パケットを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報であって、所定の複数の種別を区別する1つまたは複数の特徴情報と、当該特徴情報を表す代表数値とを示す種別推定用情報を読み込んで、取得した通信パケットを発生させたアプリケーションサービスの種別を、当該種別推定用情報と、取得した通信パケットの特徴情報が表す数値とを用いて判定する。
【選択図】図1

Description

本発明は、通信データを発生させたアプリケーションサービスの種別を判定するアプリケーション種別分類装置及びアプリケーション種別分類方法並びにそのプログラムに関する。
近年、IP(Internet Protocol)ネットワークの急速な普及・高速化に伴い、通信トラフィックが急増している。一方でOpenflow等の柔軟なトラフィック制御技術の出現により、アプリケーションサービス毎に区別して通信品質を提供できるよう、通信トラフィックから得られる通信データの特徴に着目し、その通信データがどのようなアプリケーションサービスにより発生された通信データであるかを分類する技術が提案されている(特許文献1、非特許文献2等)。
特開2011−15253号公報
前田浩明、外5名、「LPCケプストラムを用いたネットワークトラヒック分類手法に関する一考察」、電子情報通信学会,信学技報, vol. 110, no. 287, CQ2010-60, pp. 67-72, 2010年11月
ここで、上述のような技術を用いた場合、通信データがどのようなアプリケーションサービスにより発生された通信データであるかの分類を行うにあたり、取得した通信データの特徴と、予め把握した多数のアプリケーションサービスにより発生される通信データのそれぞれ特徴とを比較し、取得した通信データがどのアプリケーションサービスにより発生された通信データかを判定している。しかしながら、取得した通信データの特徴と、予め把握した多数のアプリケーションサービスにより発生される通信データそれぞれ特徴とを総当りで比較すると計算量が膨大となる。また新たに追加されたアプリケーションサービスから発生された通信データを分類する場合には、その通信データを分類できない場合や、計算量が増加することが懸念される。
そこでこの発明は、取得した通信データを発生させたアプリケーションサービスの分類を少ない計算量により判定することのできるアプリケーション種別分類装置及びアプリケーション種別分類方法並びにそのプログラムを提供することを目的としている。
上記目的を達成するために、本発明は、通信データを取得する通信データ取得部と、通信データを発生させるアプリケーションサービスの種別のうち、前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報であって、前記所定の複数の種別を区別する1つまたは複数の特徴情報と当該特徴情報を表す代表数値とを示す種別推定用情報を読み込んで、前記取得した通信データを発生させたアプリケーションサービスの種別を、当該種別推定用情報に含まれる種別のアプリケーションサービスが発生させる通信データについての特徴情報と、前記取得した通信データの特徴情報との類似度に基づいて判定するアプリケーション種別分類部と、を備えることを特徴とするアプリケーション種別分類装置である。
また本発明は、上述のアプリケーション種別分類装置において、所定の複数の種別の何れであるかの推定に利用する種別推定用情報が、所定の2つの種別の何れであるかの推定に利用する種別推定用情報である場合に、前記アプリケーション種別分類部は、前記所定の2つの種別のうちの一方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第一類似度を算出し、前記所定の2つの種別のうちの他方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第二類似度を算出し、前記第一類似度と前記第二類似度を比較して、前記第一類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記一方の種別に属するアプリケーションサービスと判定し、前記第二類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記他方の種別に属するアプリケーションサービスと判定することを特徴とする。
また本発明は、上述のアプリケーション種別分類装置において、前記アプリケーション種別分類部は、前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報を、前記所定の複数の種別の組合せが異なる複数について読み込んで、それら複数の種別推定用情報に共通して含まれる特徴情報を表す前記代表数値それぞれと、前記取得した通信データの特徴情報が示す数値とを用いて、前記取得した通信データを発生させたアプリケーションサービスの種別が、前記所定の複数の種別のうちの何れであるかを判定することを特徴とする。
また本発明は、アプリケーション種別分類装置のアプリケーション種別分類方法であって、通信データ取得部が通信データを取得し、アプリケーション種別分類部が、通信データを発生させるアプリケーションサービスの種別のうち、前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報であって、前記所定の複数の種別を区別する1つまたは複数の特徴情報と当該特徴情報を表す代表数値とを示す種別推定用情報を読み込んで、前記取得した通信データを発生させたアプリケーションサービスの種別を、当該種別推定用情報に含まれる種別のアプリケーションサービスが発生させる通信データについての特徴情報と、前記取得した通信データの特徴情報との類似度に基づいて判定することを特徴とする。
また本発明は、上述のアプリケーション種別分類方法において、所定の複数の種別の何れであるかの推定に利用する種別推定用情報が、所定の2つの種別の何れであるかの推定に利用する種別推定用情報である場合に、前記アプリケーション種別分類部は、前記所定の2つの種別のうちの一方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第一類似度を算出し、前記所定の2つの種別のうちの他方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第二類似度を算出し、前記第一類似度と前記第二類似度を比較して、前記第一類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記一方の種別に属するアプリケーションサービスと判定し、前記第二類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記他方の種別に属するアプリケーションサービスと判定することを特徴とする。
また本発明は、上述のアプリケーション種別分類方法において、前記アプリケーション種別分類部は、前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報を、前記所定の複数の種別の組合せが異なる複数について読み込んで、それら複数の種別推定用情報に共通して含まれる特徴情報を表す前記代表数値それぞれと、前記取得した通信データの特徴情報が示す数値とを用いて、前記取得した通信データを発生させたアプリケーションサービスの種別が、前記所定の複数の種別のうちの何れであるかを判定することを特徴とする。
また本発明は、アプリケーション種別分類装置のコンピュータを、通信データを取得する通信データ取得手段、通信データを発生させるアプリケーションサービスの種別のうち、前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報であって、前記所定の複数の種別を区別する1つまたは複数の特徴情報と当該特徴情報を表す代表数値とを示す種別推定用情報を読み込んで、前記取得した通信データを発生させたアプリケーションサービスの種別を、当該種別推定用情報に含まれる種別のアプリケーションサービスが発生させる通信データについての特徴情報と、前記取得した通信データの特徴情報との類似度に基づいて判定するアプリケーション種別分類手段、として機能させることを特徴とするプログラムである。
また本発明は、所定の複数の種別の何れであるかの推定に利用する種別推定用情報が、所定の2つの種別の何れであるかの推定に利用する種別推定用情報である場合に、前記アプリケーション種別分類手段は、前記所定の2つの種別のうちの一方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第一類似度を算出し、前記所定の2つの種別のうちの他方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第二類似度を算出し、前記第一類似度と前記第二類似度を比較して、前記第一類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記一方の種別に属するアプリケーションサービスと判定し、前記第二類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記他方の種別に属するアプリケーションサービスと判定することを特徴とするプログラムである。
また本発明は、前記アプリケーション種別分類手段が、前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報を、前記所定の複数の種別の組合せが異なる複数について読み込んで、それら複数の種別推定用情報に共通して含まれる特徴情報を表す前記代表数値それぞれと、前記取得した通信データの特徴情報が示す数値とを用いて、前記取得した通信データを発生させたアプリケーションサービスの種別が、前記所定の複数の種別のうちの何れであるかを判定することを特徴とするプログラムである。
本発明によれば、比較的少ない処理負荷により、取得した通信パケットを発生させたアプリケーションサービスが、複数のカテゴリのうちの何れに属するかを判定することができる。
本発明の一実施形態によるアプリケーション種別分類システムの構成を示すブロック図である。 本発明の一実施形態によるカテゴリ特徴学習装置とアプリケーション種別分類装置の機能ブロック図である。 本発明の一実施形態による学習データ記憶部の記憶する学習データの例を示す図である。 本発明の一実施形態によるカテゴリの定義を説明するための図である。 本発明の一実施形態によるカテゴリ特徴学習装置の処理フローを示す図である。 本発明の一実施形態による第一特徴テンプレートデータの例を示す図である。 本発明の一実施形態による種別推定用情報Cの生成例を示す図である。 本発明の一実施形態によるアプリケーション種別分類装置の処理フローを示す図である。
以下、本発明の一実施形態によるアプリケーション種別分類装置を図面を参照して説明する。
図1は同実施形態によるアプリケーション種別分類装置を備えたアプリケーション種別分類システムの構成を示すブロック図である。
この図において、符号1は通信データ収集装置、符号2はカテゴリ特徴学習装置、符号3はアプリケーション種別分類装置、符号4は通信ネットワークである。
通信データ収集装置1は、通信ネットワーク4を流れる通信データを収集して、通信接続されたカテゴリ特徴学習装置2やアプリケーション種別分類装置3へ出力する装置である。本実施形態においては、通信ネットワーク4にはTCP/IPの通信プロトコルによる通信データである通信パケットが流れているものとする。
またカテゴリ特徴学習装置2は、通信パケットが示す特徴に基づいてどのような通信パケットがどのカテゴリに属するアプリケーションサービスのプログラムによって発生されたかを判定するための情報を学習する装置である。
またアプリケーション種別分類装置3は、現在、通信ネットワーク4を流れている通信パケットを通信データ収集装置1より新たに取得して、当該通信パケットがどのカテゴリに属するアプリケーションサービスのプログラムによって発生されたかを判定する装置である。
図2はカテゴリ特徴学習装置とアプリケーション種別分類装置の機能ブロック図である。
この図で示すように、カテゴリ特徴学習装置2は、制御部21、通信部22、学習データ生成部23、学習データ記憶部24、学習機能部25の各処理部や記憶部を備えている。
またアプリケーション種別分類装置3は、制御部31、通信部32、通信データ取得部33、特徴テンプレート記憶部34、アプリケーション種別分類部35の各処理部や記憶部を備えている。
そして、本実施形態において、アプリケーション種別分類装置3は、通信データ収集装置1より、通信ネットワーク4を流れる通信データである通信パケットを取得する。そして、アプリケーション種別分類装置3は、通信パケットを発生させたアプリケーションサービスの複数の種別のうち、取得した通信パケットを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報を読み込む。そして、アプリケーション種別分類装置3は、取得した通信パケットを発生させたアプリケーションサービスの種別を、種別推定用情報と、取得した通信パケットの特徴情報が示す数値を用いて判定する。
以下、通信データ収集装置1、カテゴリ特徴学習装置2、アプリケーション種別分類装置3の各処理の詳細について、順を追って説明する。
図3は学習データ記憶部24の記憶する学習データの例を示す図である。
この図で示すように、学習データ記憶部24は、特徴テンプレート計算用学習データと、特徴選出用学習データを記憶している。当該2つの学習データは、通信ネットワーク4を流れる通信パケットを通信データ収集装置1より受信した後に、学習データ生成部23がその通信パケットを用いて生成し、学習データ記憶部24に書き込んだ情報である。より具体的には、学習データ生成部23は、通信データ収集装置1より受信した通信パケットのうち、特定のアプリケーションサービスプログラムを実行している装置間で送受信される一連の通信パケットを取得する。そして学習データ生成部23は、その通信パケットを発生させたアプリケーションサービスについてのカテゴリ(種別)を、通信パケットの複数の特徴に基づいて判定し、そのカテゴリを示すカテゴリ番号と、その通信パケットについて学習した順番を示す学習データ番号と、その通信パケットの複数の特徴情報を対応付けた学習データを、学習データ記憶部24に記録する。
ここで、学習データは、図3に示すように、特徴テンプレート計算用学習データと、特徴選出用学習データとに分類される。特徴テンプレート計算用学習データと特徴選出用学習データの各学習データは、学習データ生成部23が異なるタイミングで同様の処理により生成した学習データであり、それぞれ、カテゴリ番号、学習番号、1つまたは複数の特徴情報を有している。なお学習データ種類は、特徴テンプレート計算用学習データまたは特徴選出用学習データの何れかを示す識別子(例えば、A;特徴テンプレート計算用学習データ、B;特徴選出用学習データ)である。
なお図3で示す学習データにおいて、特徴1はTCPまたはUDPの何れであるかを示す情報であり、TCPの場合は数値“1”、UDPの場合は数値“2”が登録されている。
また特徴2はデータサイズを示す情報であり、例えば1つのパケットのデータサイズが登録されている。
また特徴3は通信方向を示す情報であり、片方向通信とみなす場合には1、双方向通信とみなす場合には2の情報が登録されている。なお通信方向は、例えば、通信パケットを送受信する装置間の特定方向への通信が、当該装置間で双方向で発生する通信パケット全体の0%〜25%および75%〜100%の場合には片方向通信とみなされ、26%〜74%の場合には双方向通信とみなされる。
また特徴4は通信レートを示す情報であり、単位時間当たりのデータ送信量(例えば何メガビット毎秒であるかの情報)が登録されている。
学習データには、通信パケットにおけるその他の特徴を示す情報が登録されてよい。
図4は本実施形態におけるカテゴリの定義を説明するための図である。
この図で示すように、本実施形態においては、通信パケットを発生させたアプリケーションサービスはカテゴリ1からカテゴリ5までの5つのカテゴリの何れかに分類される。
まず、カテゴリ1は、Telnet等の、TCP(Transmission Control Protocol)により制御される通信を発生させ、また当該通信が制御情報やコマンド情報のための通信であり、通信を行う装置間の一方方向に送信される通信パケットが主要な割合を占め、データ量の小さい通信パケットを発生させるアプリケーションサービスが分類されるカテゴリである。
また、カテゴリ2は、ネットワークゲーム等の、TCPにより制御される通信を発生させ、また当該通信が制御情報やコマンド情報のための通信であり、通信を行う装置間での双方向の通信パケット全体のうち一方向に送信される通信が所定の割合範囲で送信されることによりほぼ双方向で通信パケットが発生し、データ量の小さい通信パケットを発生させるアプリケーションサービスが分類されるカテゴリである。
また、カテゴリ3は、ファイル転送やウェブブラウジングやコンテンツデリバリ等の、TCPにより制御される通信を発生させ、データ転送を主に行う通信パケットを発生させるアプリケーションサービスが分類されるカテゴリである。
また、カテゴリ4は、映像配信やネットラジオ等の、UDP(User Datagram Protocol)により制御される通信であって、通信を行う装置間の一方方向に送信される通信パケットが主要な割合を占める通信を発生させるアプリケーションサービスが分類されるカテゴリである。
また、カテゴリ5は、IP電話やテレビ会議等の、UDP(User Datagram Protocol)により制御される通信であって、通信を行う装置間での双方向の通信パケット全体のうち一方向に送信される通信が所定の割合範囲で送信されることによりほぼ双方向で通信パケットを発生させるアプリケーションサービスが分類されるカテゴリである。
本実施形態のアプリケーション種別分類装置3では、通信パケットを発生させたアプリケーションのカテゴリを、これら5つのカテゴリの何れかに分類する。これにより、分類の効率化を図り、処理量の軽減を図っている。
なおカテゴリ1〜カテゴリ5までの各カテゴリは、アプリケーションサービスを利用するユーザの体感品質の観点で分類されたカテゴリである。
ユーザの体感品質は、DataAmount型(主にTCPにより制御される通信)とDataRate型(主にUDPにより制御される通信)とで異なる。例えば、TCPにより制御される通信パケットを発生させるアプリケーションサービスの場合には、再送処理が行われるため、パケットロスが発生した場合、ユーザには遅延として体感されることが多い。一方UDPにより制御される通信パケットを発生させるアプリケーションサービスの場合には、パケットロスが発生した場合でも、ユーザに遅延として体感されることが比較的少ない。よって、TCPにより制御される通信パケットを発生させるアプリケーションサービスが分類されるカテゴリ(カテゴリ1,2,3)と、UDPにより制御される通信パケットを発生させるアプリケーションサービスが分類されるカテゴリ(カテゴリ4,5)を設けている。
そして、TCPにより制御される通信パケットを発生させるアプリケーションサービスの中で、コマンド送受信やシンクライアント制御等の小さいデータのやり取りを行うアプリケーションサービスであって、数百ミリ秒程度の遅延までしか許容できないアプリケーションサービスをカテゴリ1と分類している。
また、双方向通信によりサービスが行われ電話等と同等以上の品質が求められるネットワークゲーム等のアプリケーションサービスをカテゴリ2と分類している。
また、サービスの品質の観点から見ると数十秒程度の遅延までは許容できるアプリケーションサービスをカテゴリ3と分類している。
また、片方向または双方向のいずれかの通信方向の状況によってユーザのパケットロス等による遅延の影響の受け方が異なるアプリケーションサービスであって、UDPにより制御される通信パケットを発生させるアプリケーションサービスを、片方向の場合にはカテゴリ4と、双方向の場合にはカテゴリ5と分類している。
図5はカテゴリ特徴学習装置の処理フローを示す図である。
上述したように、カテゴリ特徴学習装置2の学習データ生成部23は、図3で示すような2つの学習データ(特徴テンプレート計算用学習データ,特徴選出用学習データ)を予め生成して学習データ記憶部24に記録しておく。そして何らかの契機において、カテゴリ特徴学習装置2の学習機能部25が処理を開始する(ステップS101)。当該処理の開始の契機は、例えば、指定時刻に達した場合、または開始コマンドを受信した場合などである。すると学習機能部25は、学習データ記憶部24より、2種類の学習データのうちの特徴テンプレート計算用学習データを読み込む(ステップS102)。
そして学習機能部25は、特徴テンプレート計算用学習データ中の同一のカテゴリ番号に対応付けられた複数の学習データ番号に関する各特徴の数値を抽出する。そして、学習機能部25は、特徴テンプレート計算用学習データに含まれる同一カテゴリについての特徴ごとの数値の重心を算出し、当該特徴テンプレート計算用学習データに含まれるカテゴリ番号と各特徴の重心とを対応付けた第一特徴テンプレートデータを生成する(ステップS103)。本実施形態において特徴ごとの数値の重心は、例えばそれら数値の平均である。学習機能部25は特徴テンプレート計算用学習データに含まれる全てのカテゴリについての第一特徴テンプレートデータを同様に生成する。そして、学習機能部25は、特徴テンプレート計算用学習データに含まれる全てのカテゴリについて生成した第一特徴テンプレートデータを、通信部22を介してアプリケーション種別分類装置3へ送信する(ステップS104)。すると、アプリケーション種別分類装置3の制御部31が、通信部32を介して特徴テンプレート計算用学習データに含まれる全てのカテゴリについての第一特徴テンプレートデータを取得して、特徴テンプレート記憶部34に記録する。
図6は第一特徴テンプレートデータの例を示す図である。
この図が示すように、第一特徴テンプレートデータは、カテゴリ番号と、各特徴の重心とを対応付けて記憶している。
また学習機能部25は、もう一方の学習データである特徴選出用学習データを学習データ記憶部24より読み込む(ステップS105)。そして、学習機能部25は、特徴選出用学習データ中の同一のカテゴリ番号に対応付けられた複数の学習データ番号に関する各特徴の数値を抽出する。そして、学習機能部25は、特徴選出用学習データに含まれる同一カテゴリについての特徴ごとの数値の重心を算出し、カテゴリ番号と各特徴の重心とを対応付けた第二特徴テンプレートデータを生成する。学習機能部25は特徴選出用学習データに含まれる全てのカテゴリについての第二特徴テンプレートデータを、第一特徴テンプレートデータの生成の処理と同様に生成する(ステップS106)。そして学習機能部25は、アプリケーション種別分類装置3へ、既に登録済みの第一テンプレートデータを送信するよう通信部32を介して要求し、第一テンプレートデータを受信する。そして、学習機能部25は、第一テンプレートデータと第二テンプレートデータとを比較して、通信パケットを発生させたアプリケーションサービスが、所定の2つのカテゴリの何れであるかの推定に利用する種別推定用情報A〜Dを生成する(ステップS107)。
より具体的に説明すると、学習機能部25は、一例として、通信パケットを発生させたアプリケーションサービスが、カテゴリ1とカテゴリ2の2つの種別の何れであるかの推定に利用する種別推定用情報Aを生成する。
また学習機能部25は、通信パケットを発生させたアプリケーションサービスが、カテゴリ2とカテゴリ3の2つの種別の何れであるかの推定に利用する種別推定用情報Bを生成する。
また学習機能部25は、通信パケットを発生させたアプリケーションサービスが、カテゴリ1とカテゴリ3の2つの種別の何れであるかの推定に利用する種別推定用情報Cを生成する。
また学習機能部25は、通信パケットを発生させたアプリケーションサービスが、カテゴリ4とカテゴリ5の2つの種別の何れであるかの推定に利用する種別推定用情報Dを生成する。
なお、カテゴリ1とカテゴリ4の2つの種別の何れであるかの推定に利用する種別推定用情報や、カテゴリ2とカテゴリ5の2つの種別の何れであるかの推定に利用する種別推定用情報を生成してもよいが、下記の説明において、本実施形態では、取得した通信パケットを発生させたアプリケーションサービスが、何れのカテゴリに属するものであるかの推定において、予め通信パケットがTCPにより制御される通信パケットであるか、UDPにより制御される通信パケットであるかを事前に判定する。従って、通信パケットを発生させたアプリケーションサービスのプログラムが、カテゴリ1とカテゴリ4や、カテゴリ2とカテゴリ5などの、TCPにより制御される通信パケットを発生させるアプリケーションサービスが属するカテゴリと、UDPにより制御される通信パケットを発生させるアプリケーションサービスが属するカテゴリの何れであるかを判定する必要がない。よって、通信パケットを発生させたアプリケーションサービスのプログラムが、カテゴリ1とカテゴリ4や、カテゴリ2とカテゴリ5などの、TCPにより制御される通信パケットを発生させるアプリケーションサービスが属するカテゴリと、UDPにより制御される通信パケットを発生させるアプリケーションサービスが属するカテゴリの何れであるかを判定するための種別推定用情報は生成する必要がないため、これによっても、処理の軽減を図ることができる。
図7は種別推定用情報Cの生成例を示す図である。
ここで、図7を用いて、通信パケットを発生させたアプリケーションサービスが、カテゴリ1とカテゴリ3の2つの種別の何れであるかの推定に利用する種別推定用情報Cを生成する場合の例について説明する。
この場合、学習機能部25は、第二テンプレートデータのカテゴリ1の各特徴の重心と、第一テンプレートデータのカテゴリ1の各特徴の重心とを特徴ごとにそれぞれ比較して、その差を特徴ごとに算出する。
また学習機能部25は、第二テンプレートデータのカテゴリ1の各特徴の重心と、第一テンプレートデータのカテゴリ3の各特徴の重心とを特徴ごとにそれぞれ比較して、その差を特徴ごとに算出する。
また学習機能部25は、第二テンプレートデータのカテゴリ3の各特徴の重心と、第一テンプレートデータのカテゴリ1の各特徴の重心とを特徴ごとにそれぞれ比較して、その差を特徴ごとに算出する。
また学習機能部25は、第二テンプレートデータのカテゴリ3の各特徴の重心と、第一テンプレートデータのカテゴリ3の各特徴の重心とを特徴ごとにそれぞれ比較して、その差を特徴ごとに算出する。
つまり、図7で示すように、今、第二テンプレートデータのカテゴリ1の{特徴1,特徴2}の重心が、
{10,49}
であり、第一テンプレートデータのカテゴリ1の{特徴1,特徴2}の重心が、
{12,52}
であるので、第二テンプレートデータのカテゴリ1と第一テンプレートデータのカテゴリ1の差は{特徴1,特徴2}それぞれについて{2,3}である。
また、第二テンプレートデータのカテゴリ1の{特徴1,特徴2}の重心が、
{10,49}
であり、第一テンプレートデータのカテゴリ3の{特徴1,特徴2}の重心が、
{22,51}
であるので、第二テンプレートデータのカテゴリ1と第一テンプレートデータのカテゴリ3の差は{特徴1,特徴2}それぞれについて{12,2}である。
ここで、特徴1については、第二テンプレートデータのカテゴリ1(自カテゴリ)の重心と第一テンプレートデータのカテゴリ1(自カテゴリ)の重心の差より、第二テンプレートデータのカテゴリ1(自カテゴリ)の重心と第一テンプレートデータのカテゴリ3(他カテゴリ)の重心の差が大きくなる。従って特徴1はカテゴリ1とカテゴリ3とを区別する特徴として有効である可能性が高いと判定できる。
他方、特徴2については、第二テンプレートデータのカテゴリ1(自カテゴリ)の重心と第一テンプレートデータのカテゴリ1(自カテゴリ)の重心の差と、第二テンプレートデータのカテゴリ1(自カテゴリ)の重心と第一テンプレートデータのカテゴリ3(他カテゴリ)の重心の差が、それほど変化しない。従って特徴2はカテゴリ1とカテゴリ3とを区別する特徴として有効でない可能性が高いと判定できる。
各特徴が2つのカテゴリを区別するものとして有効か有効でないかの判定するにあたり、学習機能部25は、ある特徴について、第二テンプレートデータにおけるカテゴリ1とカテゴリ3の2つのカテゴリのうちの一方のカテゴリ(自カテゴリ)の重心と第一テンプレートデータにおける一方のカテゴリ(自カテゴリ)の重心の差の倍数より、第二テンプレートデータの一方のカテゴリ(自カテゴリ)の重心と第一テンプレートデータの他方のカテゴリ(他カテゴリ)の重心の差が大きいかを判定する。
そして、学習機能部25は、第二テンプレートデータにおけるカテゴリ1とカテゴリ3の2つのカテゴリのうちの一方のカテゴリ(自カテゴリ)の重心と第一テンプレートデータにおける一方のカテゴリ(自カテゴリ)の重心の差の倍数より、第二テンプレートデータの一方のカテゴリ(自カテゴリ)の重心と第一テンプレートデータの他方のカテゴリ(他カテゴリ)の重心の差が大きい場合には、有効である可能の高い特徴の候補と決定する。
また学習機能部25は、第二テンプレートデータにおけるカテゴリ1とカテゴリ3の2つのカテゴリのうちの一方のカテゴリ(自カテゴリ)の重心と第一テンプレートデータにおける一方のカテゴリ(自カテゴリ)の重心の差の倍数より、第二テンプレートデータの一方のカテゴリ(自カテゴリ)の重心と第一テンプレートデータの他方のカテゴリ(他カテゴリ)の重心の差が大きくない場合には、有効である可能の低い特徴の候補と決定する。
図7で示すように、特徴1については、第二テンプレートデータにおけるカテゴリ1(自カテゴリ)の重心と第一テンプレートデータにおけるカテゴリ1(自カテゴリ)の重心の差“2”の倍数より、第二テンプレートデータのカテゴリ1(自カテゴリ)の重心と第一テンプレートデータのカテゴリ3(他カテゴリ)の重心の差“12”は大きいので、学習機能部25は、特徴1を、有効である可能の高い特徴の候補と決定する。
他方、特徴2については、第二テンプレートデータにおけるカテゴリ1(自カテゴリ)の重心と第一テンプレートデータにおけるカテゴリ1(自カテゴリ)の重心の差“3”の倍数より、第二テンプレートデータのカテゴリ1(自カテゴリ)の重心と第一テンプレートデータのカテゴリ3(他カテゴリ)の重心の差“2”は大きくないので、学習機能部25は、特徴2を、有効である可能の低い特徴の候補と決定する。
これにより第二テンプレートデータのカテゴリ1を用いて、カテゴリ1とカテゴリ3とを区別するために有効である可能性の高い特徴として特徴1が決定される。
また同様に、図7より、第二テンプレートデータのカテゴリ3の{特徴1,特徴2}の重心が、
{20,50}
であり、第一テンプレートデータのカテゴリ1の{特徴1,特徴2}の重心が、
{12,52}
であるので、第二テンプレートデータのカテゴリ3と第一テンプレートデータのカテゴリ1の差は{特徴1,特徴2}それぞれについて{8,2}である。
また、第二テンプレートデータのカテゴリ3の{特徴1,特徴2}の重心が、
{20,50}
であり、第一テンプレートデータのカテゴリ3の{特徴1,特徴2}の重心が、
{22,51}
であるので、第二テンプレートデータのカテゴリ3と第一テンプレートデータのカテゴリ3の差は{特徴1,特徴2}それぞれについて{2,1}である。
この場合、特徴1については、第二テンプレートデータにおけるカテゴリ3(自カテゴリ)の重心と第一テンプレートデータにおけるカテゴリ3(自カテゴリ)の重心の差“2”の倍数より、第二テンプレートデータのカテゴリ3(自カテゴリ)の重心と第一テンプレートデータのカテゴリ1(他カテゴリ)の重心の差“8”は大きいので、学習機能部25は、特徴1を、有効である可能の高い特徴の候補と決定する。
他方、特徴2については、第二テンプレートデータにおけるカテゴリ3(自カテゴリ)の重心と第一テンプレートデータにおけるカテゴリ3(自カテゴリ)の重心の差“1”の倍数より、第二テンプレートデータのカテゴリ3(自カテゴリ)の重心と第一テンプレートデータのカテゴリ1(他カテゴリ)の重心の差“2”が大きくないので、学習機能部25は、特徴2を、有効である可能の低い特徴の候補と決定する。
これにより第二テンプレートデータのカテゴリ3を用いて、カテゴリ1とカテゴリ3とを区別するために有効である可能性の高い特徴として特徴1が決定される。
そして、学習機能部25は、第二テンプレートデータのカテゴリ1を用いて、カテゴリ1とカテゴリ3とを区別するために有効である可能性の高い特徴として決定した各特徴と、第二テンプレートデータのカテゴリ3を用いて、カテゴリ1とカテゴリ3とを区別するために有効である可能性の高い特徴として決定した各特徴との何れにも含まれる特徴を、カテゴリ1とカテゴリ3とを区別できる特徴と特定する。つまり、図7の場合、学習機能部25は、特徴1を、カテゴリ1とカテゴリ3とを区別できる特徴と特定する。そして、学習機能部25は、カテゴリ1の番号,カテゴリ3の番号,特徴1の識別子(特徴番号)と、特徴1の重み値と、を少なくとも含む種別推定用情報Cを生成する。なお、重み値はユーザによって設定された値である。ここで、種別推定用情報としては、既に生成した第一テンプレートデータのカテゴリ1とカテゴリ3の重心の数値も含むものとするが、この情報については、既に、アプリケーション種別分類装置3の特徴テンプレート記憶部34に記録されているため、本実施形態においては、学習機能部25は、カテゴリ1とカテゴリ3の重心の数値を入れずに種別推定用情報を生成している。
図7の例では、通信パケットを発生させたアプリケーションサービスが、カテゴリ1とカテゴリ3の2つのカテゴリの何れであるかを区別できる特徴として、特徴1の一つのみが決定されているが、実際には、それら2つのカテゴリの何れであるかを区別できる特徴として、複数の特徴が決定されてよい。
そして、学習機能部25は同様の処理により、種別推定用情報A〜Dを生成して、それらの種別推定用情報A〜Dを、通信部22を介してアプリケーション種別分類装置3へ送信する(ステップS108)。すると、アプリケーション種別分類装置3の制御部31が、通信部32を介して種別推定用情報A〜Dを取得して、特徴テンプレート記憶部34に記録する。これにより、アプリケーション種別分類装置3が、新たに通信パケットを取得して、その通信パケットを発生させたアプリケーションサービスの分類を行うための環境が整うこととなる。
図8はアプリケーション種別分類装置の処理フローを示す図である。
次にアプリケーション種別分類装置3の処理の詳細について順を追って説明する。
カテゴリ特徴学習装置2による種別推定用情報の生成が完了した後に、何らかのアプリケーション種別分類装置3の処理開始の指示を受けると(ステップS201)、アプリケーション種別分類装置3の制御部31は、通信部32を介して、通信データ収集装置1へ通信パケットの送信を要求する。すると通信データ収集装置1は、通信ネットワーク4より通信パケットをキャプチャし、その通信パケットのデータをアプリケーション種別分類装置3へ出力する。そして、アプリケーション種別分類装置3の通信データ取得部33が、通信データ収集装置1より受信した通信パケットのデータを、通信部32を介して取得する(ステップS202)。そして、通信データ取得部33は取得した通信パケットを、アプリケーション種別分類部35へ出力する。
なお、本実施形態においては、通信データ収集装置1のキャプチャした通信パケットは、ある特定のアプリケーションサービスのプログラムによって発生された通信パケットであるとする。複数のアプリケーションサービスのプログラムによって発生された通信パケットを通信データ収集装置1がキャプチャする場合には、通信データ収集装置1が、キャプチャした通信パケットの中から雑音を取り除いて、特定のアプリケーションサービスのプログラムによって発生された通信パケットのみを抽出し、アプリケーション種別分類装置3へ送信してもよいし、その処理を、アプリケーション種別分類装置3が行うようにしてもよい。
次にアプリケーション種別分類部35は、取得した通信パケット群のデータを解析して、当該通信パケットの各特徴の値を計算する(ステップS203)。当該特徴の計算は、図3で示すような学習データの生成時の処理と同様の処理である。そしてアプリケーション種別分類部35は、取得した通信パケット群が、TCPにより制御される通信パケットであるか、UDPにより制御される通信パケットであるかを判定する(ステップS204)。
取得した通信パケットがTCPにより制御される通信パケットである場合、アプリケーション種別分類部35は、カテゴリ1とカテゴリ2の2つの種別の何れであるかの推定に利用する種別推定用情報Aと、カテゴリ2とカテゴリ3の2つの種別の何れであるかの推定に利用する種別推定用情報Bとを特徴テンプレート記憶部34より読み込む。ここで、種別推定用情報Aに含まれる1つまたは複数の特徴の情報と、種別推定用情報Bに含まれる1つまたは複数の特徴の情報とに共通する特徴を用いることにより、取得した通信パケットに基づいてアプリケーションサービスがカテゴリ2に含まれるか、それ以外のカテゴリに含まれるかを判定することができる。従って、アプリケーション種別分類部35は、種別推定用情報Aと種別推定用情報Bに含まれる共通の各特徴の重心の数値と、取得した通信パケットの特徴のうちの前記共通の特徴についての数値とを用いて、取得した通信パケットの特徴と、カテゴリ1,カテゴリ2,カテゴリ3それぞれに属するアプリケーションサービスが発生する各通信パケットの特徴との各類似度を算出する(ステップS205)。
そして、アプリケーション種別分類部35は、取得した通信パケットの特徴と、カテゴリ2に属するアプリケーションサービスが発生する通信パケットの特徴との類似度が最も高いかを判定する(ステップS206)。アプリケーション種別分類部35は、取得した通信パケットの特徴と、カテゴリ2に属するアプリケーションサービスが発生する通信パケットの特徴との類似度が最も高いと判定した場合には、取得した通信パケット群を発生させたアプリケーションサービスのカテゴリを、カテゴリ2と判定する(ステップS207)。
なお、アプリケーション種別分類部35は、以下の処理により、取得した通信パケットを発生させたアプリケーションサービスが、何れのカテゴリであるかを判定するための類似度を算出する。つまり、まず、アプリケーション種別分類部35は、区別可能なカテゴリの組合せの異なる種別推定用情報A(取得したパケットを発生させたアプリケーションサービスがカテゴリ1とカテゴリ2の何れであるかを区別する種別推定用情報)と、種別推定用情報B(取得したパケットを発生させたアプリケーションサービスがカテゴリ2とカテゴリ3の何れであるかを区別する種別推定用情報)に含まれる各カテゴリについての共通する特徴を抽出する。そして、アプリケーション種別分類部35は、それら共通する特徴についての重心(代表数値)と、取得した通信パケットの特徴が示す数値とを用いて、以下の様に、取得した通信パケットの特徴と、種別推定用情報A,Bに含まれる複数のカテゴリ1,2,3それぞれに属する各アプリケーションサービスが発生させる通信パケットの特徴との類似度である、第一類似度(取得した通信パケットの特徴とカテゴリ1に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度)、第二類似度(取得した通信パケットの特徴とカテゴリ2に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度)、第三類似度(取得した通信パケットの特徴とカテゴリ3に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度)を算出する。
より具体的には、アプリケーション種別分類部35は、各種別推定用情報において1つの特徴が含まれる場合、
Figure 2013187629
により、取得した通信パケットの特徴と、複数の種別推定用情報(種別推定用情報A,B)に含まれる複数のカテゴリ(カテゴリ1,2,3)のうちの第1のカテゴリ(カテゴリ1)に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度を算出する。またアプリケーション種別分類部35は、
Figure 2013187629
により、取得した通信パケットの特徴と、複数の種別推定用情報(種別推定用情報A,B)に含まれる複数のカテゴリ(カテゴリ1,2,3)のうちの第2のカテゴリ(カテゴリ2)に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度を算出する。またアプリケーション種別分類部35は、
Figure 2013187629
により、取得した通信パケットの特徴と、複数の種別推定用情報(種別推定用情報A,B)に含まれる複数のカテゴリ(カテゴリ1,2,3)のうちの第3のカテゴリ(カテゴリ3)に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度を算出する。式(1)、(2)、(3)において、
“Pa_F1”は取得した通信パケットの特徴の数値である。
“C1_F1”は所定の3つのカテゴリのうちの第1のカテゴリの特徴が示す重心(代表数値)である。
“C2_F1”は所定の3つのカテゴリのうちの第2のカテゴリの特徴が示す重心(代表数値)である。
“C3_F1”は所定の3つのカテゴリのうちの第3のカテゴリの特徴が示す重心(代表数値)である。
なお、重み値は、推定用情報に含まれる特徴に関連付けられた重み値である(図7参照)。
また、例えば、種別推定用情報において2つの特徴が含まれる場合、アプリケーション種別分類部35は、
Figure 2013187629
により、取得した通信パケットの特徴と、複数の種別推定用情報(種別推定用情報A,B)に含まれる複数のカテゴリ(カテゴリ1,2,3)のうちの第1のカテゴリ(カテゴリ1)に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度を算出する。またアプリケーション種別分類部35は、
Figure 2013187629
により、取得した通信パケットの特徴と、複数の種別推定用情報(種別推定用情報A,B)に含まれる複数のカテゴリ(カテゴリ1,2,3)のうちの第2のカテゴリ(カテゴリ2)に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度を算出する。またアプリケーション種別分類部35は、
Figure 2013187629
により、取得した通信パケットの特徴と、複数の種別推定用情報(種別推定用情報A,B)に含まれる複数のカテゴリ(カテゴリ1,2,3)のうちの第3のカテゴリ(カテゴリ3)に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度を算出する。式(4)、(5)、(6)において、
“Pa_F1”は取得した通信パケットの第一の特徴の数値である。
“Pa_F2”は取得した通信パケットの第二の特徴の数値である。
“C1_F1”は所定の3つのカテゴリのうちの第一のカテゴリの第一の特徴が示す重心(代表数値)である。
“C1_F2”は所定の3つのカテゴリのうちの第一のカテゴリの第二の特徴が示す重心(代表数値)である。
“C2_F1”は所定の3つのカテゴリのうちの第二のカテゴリの第一の特徴が示す重心(代表数値)である。
“C2_F2”は所定の3つのカテゴリのうちの第二のカテゴリの第二の特徴が示す重心(代表数値)である。
“C3_F1”は所定の3つのカテゴリのうちの第三のカテゴリの第一の特徴が示す重心(代表数値)である。
“C3_F2”は所定の3つのカテゴリのうちの第三のカテゴリの第二の特徴が示す重心(代表数値)である。
各重み値は、推定用情報に含まれる第一の特徴および第二の特徴それぞれに関連付けられた重み値である(図7参照)。
またアプリケーション種別分類部35は、ステップS206において、取得した通信パケットの特徴と、カテゴリ2に属するアプリケーションサービスが発生する通信パケットの特徴との類似度が最も高くない場合には、取得した通信パケット群を発生させたアプリケーションサービスのカテゴリが、カテゴリ1またはカテゴリ3の何れかであると判定する。従って、アプリケーション種別分類部35は、カテゴリ1とカテゴリ3の2つの種別の何れであるかの推定に利用する種別推定用情報Cを用いて、通信パケットを発生させたアプリケーションサービスが、カテゴリ1とカテゴリ3の2つの種別の何れであるかを判定する。つまり、アプリケーション種別分類部35は、取得した通信パケットを発生させたアプリケーションサービスが、種別推定用情報Cに含まれる所定の2つのカテゴリ(カテゴリ1またはカテゴリ3)のうちの何れのカテゴリであるかを判定するための類似度を算出する(ステップS208)。
つまり、まず、アプリケーション種別分類部35は、所定の2つのカテゴリのうちの一方のカテゴリの特徴が示す重心(代表数値)と、取得した通信パケットの特徴が示す数値の差を、種別推定用情報が示す特徴についての所定の2つのカテゴリごとの重心(代表数値)と取得した通信パケットの特徴が示す数値との各差異それぞれの逆数の加算値で除することにより、取得した通信パケットの特徴と、所定の2つのカテゴリを区別する特徴との第一類似度を算出する。
またアプリケーション種別分類部35は、所定の2つのカテゴリのうちの他方のカテゴリの特徴が示す重心(代表数値)と、取得した通信パケットの特徴が示す数値の差を、種別推定用情報が示す特徴についての所定の2つのカテゴリごとの重心(代表数値)と取得した通信パケットの特徴が示す数値との各差異それぞれの逆数の加算値で除することにより、取得した通信パケットの特徴と、所定の2つのカテゴリを区別する特徴との第二類似度を算出する。
そして、アプリケーション種別分類部35は、第一類似度と第二類似度を比較して、第一類似度が大きい場合には取得した通信パケットを発生させたアプリケーションサービスを一方のカテゴリに属するアプリケーションサービスと判定する。またアプリケーション種別分類部35は、第二類似度が大きい場合には取得した通信パケットを発生させたアプリケーションサービスを他方のカテゴリに属するアプリケーションサービスと判定する。
例えば、通信データを発生させたアプリケーションサービスが、所定の2つのカテゴリの何れであるかの推定に利用する種別推定用情報において1つの特徴が含まれる場合、アプリケーション種別分類部35は、
Figure 2013187629
により、取得した通信パケットの特徴と、種別推定用情報に含まれる所定の2つのカテゴリのうちの一方のカテゴリに属するアプリケーションサービスが発生させる通信パケットの特徴との類似度を算出する。またアプリケーション種別分類部35は、
Figure 2013187629
により、取得した通信パケットの特徴と、種別推定用情報に含まれる所定の2つのカテゴリのうちの他方のカテゴリに属するアプリケーションサービスが発生させる通信パケットの特徴との類似度を算出する。式(7)、(8)において、
“Pa_F1”は取得した通信パケットの特徴の数値である。
“C1_F1”は所定の2つのカテゴリのうちの一方のカテゴリの特徴が示す重心(代表数値)である。
“C3_F1”は所定の2つのカテゴリのうちの他方のカテゴリの特徴が示す重心(代表数値)である。
なお、重み値は、推定用情報に含まれる特徴に関連付けられた重み値である(図7参照)。
また、例えば、通信データを発生させたアプリケーションサービスが、所定の2つのカテゴリの何れであるかの推定に利用する種別推定用情報において2つの特徴が含まれる場合、アプリケーション種別分類部35は、
Figure 2013187629
により、取得した通信パケットの特徴と、種別推定用情報に含まれる所定の2つのカテゴリのうちの一方のカテゴリに属するアプリケーションサービスが発生させる通信パケットの特徴との類似度を算出する。またアプリケーション種別分類部35は、
Figure 2013187629
により、取得した通信パケットの特徴と、種別推定用情報に含まれる所定の2つのカテゴリのうちの他方のカテゴリに属するアプリケーションサービスが発生させる通信パケットの特徴との類似度を算出する。式(9),(10)において、
“Pa_F1”は取得した通信パケットの第一の特徴の数値である。
“Pa_F2”は取得した通信パケットの第二の特徴の数値である。
“C1_F1”は所定の2つのカテゴリのうちの一方のカテゴリの第一の特徴が示す重心(代表数値)である。
“C1_F2”は所定の2つのカテゴリのうちの一方のカテゴリの第二の特徴が示す重心(代表数値)である。
“C3_F1”は所定の2つのカテゴリのうちの他方のカテゴリの第一の特徴が示す重心(代表数値)である。
“C3_F2”は所定の2つのカテゴリのうちの他方のカテゴリの第二の特徴が示す重心(代表数値)である。
各重み値は、推定用情報に含まれる第一の特徴および第二の特徴それぞれに関連付けられた重み値である(図7参照)。
そしてアプリケーション種別分類部35は、取得した通信パケット特徴と、カテゴリ1に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度の方が、カテゴリ3の場合に比べて高い場合には、取得した通信パケット群を発生させたアプリケーションサービスのカテゴリを、カテゴリ2と判定する(ステップS209)。
他方、アプリケーション種別分類部35は、取得した通信パケット特徴と、カテゴリ3に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度の方が、カテゴリ1の場合に比べて高い場合には、取得した通信パケット群を発生させたアプリケーションサービスのカテゴリを、カテゴリ3と判定する(ステップS210)。
またアプリケーション種別分類部35は、ステップS204において、取得した通信パケット群が、UDPにより制御される通信パケットであると判定した場合には、取得した通信パケット群を発生させたアプリケーションサービスのカテゴリが、カテゴリ4またはカテゴリ5の何れかであると判定する。従って、アプリケーション種別分類部35は、カテゴリ4とカテゴリ5の2つの種別の何れであるかの推定に利用する種別推定用情報Dを用いて、通信パケットを発生させたアプリケーションサービスが、カテゴリ4とカテゴリ5の2つの種別の何れであるかを判定する。つまり、アプリケーション種別分類部35は、取得した通信パケットを発生させたアプリケーションサービスが、種別推定用情報Dに含まれる所定の2つのカテゴリ(カテゴリ4またはカテゴリ5)のうちの何れのカテゴリであるかを判定するための類似度を、上述の式(9)、(10)と同様に算出する(ステップS211)。
そしてアプリケーション種別分類部35は、取得した通信パケット特徴と、カテゴリ4に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度の方が、カテゴリ5の場合に比べて高い場合には、取得した通信パケット群を発生させたアプリケーションサービスのカテゴリを、カテゴリ4と判定する(ステップS212)。
他方、アプリケーション種別分類部35は、取得した通信パケット特徴と、カテゴリ5に属するアプリケーションサービスが発生させる通信パケットの特徴との類似度の方が、カテゴリ4の場合に比べて高い場合には、取得した通信パケット群を発生させたアプリケーションサービスのカテゴリを、カテゴリ5と判定する(ステップS213)。
以上、本発明の実施形態について説明したが、上述したアプリケーション種別分類装置3の処理によれば、取得した通信パケットを発生させたアプリケーションサービスが、予め定められた5つのサービスカテゴリであって、ユーザの体感品質の観点で定めた5つのカテゴリのうちの何れかに属するかを判定すればよい。これにより、取得した通信パケットを発生させたアプリケーションサービスによる帯域制御などを、ユーザの体感品質に合わせて設定する等を行うにあたり、比較的少ない処理負荷により、取得した通信パケットを発生させたアプリケーションサービスが、複数のカテゴリのうちの何れに属するかを判定することができる。
本実施形態においては、取得する通信データが通信パケットである場合の例を用いて説明したが、通信データが有線ネットワークを流れる通信パケット以外のデータ(例えば無線通信における通信データなど)であっても、同様の処理により、通信データを発生させたアプリケーションサービスのカテゴリを分類することができる。
なお、上述の通信データ収集装置1、カテゴリ特徴学習装置2、アプリケーション種別分類装置3のそれぞれは、内部にコンピュータシステムを有している。そして、上述した各処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
1・・・通信データ収集装置
2・・・カテゴリ特徴学習装置
3・・・アプリケーション種別分類装置
4・・・通信ネットワーク
21,31・・・制御部
22,32・・・通信部
23・・・学習データ生成部
24・・・学習データ記憶部
25・・・学習機能部
33・・・通信データ取得部
34・・・特徴テンプレート記憶部
35・・・アプリケーション種別分類部

Claims (9)

  1. 通信データを取得する通信データ取得部と、
    通信データを発生させるアプリケーションサービスの種別のうち、前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報であって、前記所定の複数の種別を区別する1つまたは複数の特徴情報と当該特徴情報を表す代表数値とを示す種別推定用情報を読み込んで、前記取得した通信データを発生させたアプリケーションサービスの種別を、当該種別推定用情報に含まれる種別のアプリケーションサービスが発生させる通信データについての特徴情報と、前記取得した通信データの特徴情報との類似度に基づいて判定するアプリケーション種別分類部と、
    を備えることを特徴とするアプリケーション種別分類装置。
  2. 所定の複数の種別の何れであるかの推定に利用する種別推定用情報が、所定の2つの種別の何れであるかの推定に利用する種別推定用情報である場合に、
    前記アプリケーション種別分類部は、
    前記所定の2つの種別のうちの一方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第一類似度を算出し、
    前記所定の2つの種別のうちの他方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第二類似度を算出し、
    前記第一類似度と前記第二類似度を比較して、前記第一類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記一方の種別に属するアプリケーションサービスと判定し、前記第二類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記他方の種別に属するアプリケーションサービスと判定する
    ことを特徴とする請求項1に記載のアプリケーション種別分類装置。
  3. 前記アプリケーション種別分類部は、
    前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報を、前記所定の複数の種別の組合せが異なる複数について読み込んで、それら複数の種別推定用情報に共通して含まれる特徴情報を表す前記代表数値それぞれと、前記取得した通信データの特徴情報が示す数値とを用いて、前記取得した通信データを発生させたアプリケーションサービスの種別が、前記所定の複数の種別のうちの何れであるかを判定する
    ことを特徴とする請求項1または請求項2に記載のアプリケーション種別分類装置。
  4. アプリケーション種別分類装置のアプリケーション種別分類方法であって、
    通信データ取得部が通信データを取得し、
    アプリケーション種別分類部が、通信データを発生させるアプリケーションサービスの種別のうち、前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報であって、前記所定の複数の種別を区別する1つまたは複数の特徴情報と当該特徴情報を表す代表数値とを示す種別推定用情報を読み込んで、前記取得した通信データを発生させたアプリケーションサービスの種別を、当該種別推定用情報に含まれる種別のアプリケーションサービスが発生させる通信データについての特徴情報と、前記取得した通信データの特徴情報との類似度に基づいて判定する
    ことを特徴とするアプリケーション種別分類方法。
  5. 所定の複数の種別の何れであるかの推定に利用する種別推定用情報が、所定の2つの種別の何れであるかの推定に利用する種別推定用情報である場合に、
    前記アプリケーション種別分類部は、
    前記所定の2つの種別のうちの一方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第一類似度を算出し、
    前記所定の2つの種別のうちの他方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第二類似度を算出し、
    前記第一類似度と前記第二類似度を比較して、前記第一類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記一方の種別に属するアプリケーションサービスと判定し、前記第二類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記他方の種別に属するアプリケーションサービスと判定する
    ことを特徴とする請求項4に記載のアプリケーション種別分類方法。
  6. 前記アプリケーション種別分類部は、
    前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報を、前記所定の複数の種別の組合せが異なる複数について読み込んで、それら複数の種別推定用情報に共通して含まれる特徴情報を表す前記代表数値それぞれと、前記取得した通信データの特徴情報が示す数値とを用いて、前記取得した通信データを発生させたアプリケーションサービスの種別が、前記所定の複数の種別のうちの何れであるかを判定する
    ことを特徴とする請求項4または請求項5に記載のアプリケーション種別分類方法。
  7. アプリケーション種別分類装置のコンピュータを、
    通信データを取得する通信データ取得手段、
    通信データを発生させるアプリケーションサービスの種別のうち、前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報であって、前記所定の複数の種別を区別する1つまたは複数の特徴情報と当該特徴情報を表す代表数値とを示す種別推定用情報を読み込んで、前記取得した通信データを発生させたアプリケーションサービスの種別を、当該種別推定用情報に含まれる種別のアプリケーションサービスが発生させる通信データについての特徴情報と、前記取得した通信データの特徴情報との類似度に基づいて判定するアプリケーション種別分類手段、
    として機能させることを特徴とするプログラム。
  8. 所定の複数の種別の何れであるかの推定に利用する種別推定用情報が、所定の2つの種別の何れであるかの推定に利用する種別推定用情報である場合に、
    前記アプリケーション種別分類手段は、
    前記所定の2つの種別のうちの一方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第一類似度を算出し、
    前記所定の2つの種別のうちの他方の種別の特徴情報を表す代表数値と前記取得した通信データの特徴情報が示す数値の差を、前記種別推定用情報が示す特徴情報についての前記所定の2つの種別ごとの代表数値と前記取得した通信データの特徴情報が示す数値との各差異それぞれの逆数の加算値で除することにより、前記取得した通信データの特徴情報と、前記所定の2つの種別を区別する特徴情報との第二類似度を算出し、
    前記第一類似度と前記第二類似度を比較して、前記第一類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記一方の種別に属するアプリケーションサービスと判定し、前記第二類似度が大きい場合には前記取得した通信データを発生させたアプリケーションサービスを前記他方の種別に属するアプリケーションサービスと判定する
    ことを特徴とする請求項7に記載のプログラム。
  9. 前記アプリケーション種別分類手段は、
    前記取得した通信データを発生させたアプリケーションサービスが所定の複数の種別の何れであるかの推定に利用する種別推定用情報を、前記所定の複数の種別の組合せが異なる複数について読み込んで、それら複数の種別推定用情報に共通して含まれる特徴情報を表す前記代表数値それぞれと、前記取得した通信データの特徴情報が示す数値とを用いて、前記取得した通信データを発生させたアプリケーションサービスの種別が、前記所定の複数の種別のうちの何れであるかを判定する
    ことを特徴とする請求項7または請求項8に記載のプログラム。
JP2012049439A 2012-03-06 2012-03-06 アプリケーション種別分類装置及びアプリケーション種別分類方法並びにそのプログラム Expired - Fee Related JP5659175B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012049439A JP5659175B2 (ja) 2012-03-06 2012-03-06 アプリケーション種別分類装置及びアプリケーション種別分類方法並びにそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012049439A JP5659175B2 (ja) 2012-03-06 2012-03-06 アプリケーション種別分類装置及びアプリケーション種別分類方法並びにそのプログラム

Publications (2)

Publication Number Publication Date
JP2013187629A true JP2013187629A (ja) 2013-09-19
JP5659175B2 JP5659175B2 (ja) 2015-01-28

Family

ID=49388729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012049439A Expired - Fee Related JP5659175B2 (ja) 2012-03-06 2012-03-06 アプリケーション種別分類装置及びアプリケーション種別分類方法並びにそのプログラム

Country Status (1)

Country Link
JP (1) JP5659175B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015170983A (ja) * 2014-03-06 2015-09-28 Kddi株式会社 ネットワーク品質監視装置、プログラムおよびネットワーク品質監視方法
JP2016054435A (ja) * 2014-09-04 2016-04-14 日本電信電話株式会社 操作検出装置、操作検出装置の動作方法およびコンピュータプログラム
WO2017138403A1 (ja) * 2016-02-09 2017-08-17 日本電気株式会社 制御装置、制御方法及びプログラムを記憶する記憶媒体
WO2019176997A1 (ja) * 2018-03-14 2019-09-19 日本電気株式会社 トラヒック分析装置、方法及びプログラム
WO2019187296A1 (ja) * 2018-03-29 2019-10-03 日本電気株式会社 通信トラヒック分析装置、通信トラヒック分析方法、プログラム及び記録媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012034262A (ja) * 2010-08-02 2012-02-16 Nippon Telegr & Teleph Corp <Ntt> フロー分類方法、システム、およびプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012034262A (ja) * 2010-08-02 2012-02-16 Nippon Telegr & Teleph Corp <Ntt> フロー分類方法、システム、およびプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015170983A (ja) * 2014-03-06 2015-09-28 Kddi株式会社 ネットワーク品質監視装置、プログラムおよびネットワーク品質監視方法
JP2016054435A (ja) * 2014-09-04 2016-04-14 日本電信電話株式会社 操作検出装置、操作検出装置の動作方法およびコンピュータプログラム
WO2017138403A1 (ja) * 2016-02-09 2017-08-17 日本電気株式会社 制御装置、制御方法及びプログラムを記憶する記憶媒体
WO2019176997A1 (ja) * 2018-03-14 2019-09-19 日本電気株式会社 トラヒック分析装置、方法及びプログラム
JPWO2019176997A1 (ja) * 2018-03-14 2021-02-25 日本電気株式会社 トラヒック分析装置、方法及びプログラム
US11411850B2 (en) 2018-03-14 2022-08-09 Nec Corporation Traffic analysis apparatus, method, and program
WO2019187296A1 (ja) * 2018-03-29 2019-10-03 日本電気株式会社 通信トラヒック分析装置、通信トラヒック分析方法、プログラム及び記録媒体
JPWO2019187296A1 (ja) * 2018-03-29 2021-02-12 日本電気株式会社 通信トラヒック分析装置、通信トラヒック分析方法、プログラム及び記録媒体
US11438246B2 (en) 2018-03-29 2022-09-06 Nec Corporation Communication traffic analyzing apparatus, communication traffic analyzing method, program, and recording medium

Also Published As

Publication number Publication date
JP5659175B2 (ja) 2015-01-28

Similar Documents

Publication Publication Date Title
JP5659175B2 (ja) アプリケーション種別分類装置及びアプリケーション種別分類方法並びにそのプログラム
JP6434659B2 (ja) ネットワーク容量拡大のための方法および装置
US10091675B2 (en) System and method for estimating an effective bandwidth
WO2019184640A1 (zh) 一种指标确定方法及其相关设备
CN103595576B (zh) 一种基于内容提供商标识的互联口icp流量统计系统及方法
CN110247819B (zh) 一种基于加密流识别的Wi-Fi视频采集设备检测方法及系统
WO2021159902A1 (zh) 年龄识别方法、装置、设备及计算机可读存储介质
CN109271793A (zh) 物联网云平台设备类别识别方法及系统
CN107659505B (zh) 一种sdn网络的选路方法和sdn控制器
WO2014161281A1 (zh) 联机处理数据的方法、设备及系统
TW202127834A (zh) 用於行動通訊系統之威脅偵測系統及其中心裝置與本地裝置
CN108901035A (zh) 物联网终端的识别方法和装置
CN102902674B (zh) 服务群组分类方法和系统
US20170013430A1 (en) User classification method, apparatus, and server
JPWO2015016262A1 (ja) 情報処理装置、認証システム、認証方法、及びプログラム
CN109429296B (zh) 用于终端与上网信息关联的方法、装置及存储介质
WO2018192518A1 (zh) 数据处理方法、装置及存储介质
CN109164986A (zh) 云盘数据处理方法、装置、电子设备及存储介质
JP2015528260A (ja) モバイルデバイス内で複数の候補アプリケーションのための通信接続を提供するための方法及びデバイス
JP2019028744A (ja) データ処理システム、データ処理方法およびプログラム
JP5806630B2 (ja) アプリケーション検査システム
JP5528372B2 (ja) フロー品質劣化特定装置及び方法
JP6174537B2 (ja) 操作検出装置、操作検出装置の動作方法およびコンピュータプログラム
KR101285076B1 (ko) 인간의 행동을 모방하는 가상 객체를 이용한 통신 방법 및 그 방법에 따른 통신 시스템
CN115278290B (zh) 一种基于边缘节点的虚拟现实视频缓存方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140708

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141201

R150 Certificate of patent or registration of utility model

Ref document number: 5659175

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees