JP2017022593A - 検証装置、検証方法及び検証プログラム - Google Patents
検証装置、検証方法及び検証プログラム Download PDFInfo
- Publication number
- JP2017022593A JP2017022593A JP2015139498A JP2015139498A JP2017022593A JP 2017022593 A JP2017022593 A JP 2017022593A JP 2015139498 A JP2015139498 A JP 2015139498A JP 2015139498 A JP2015139498 A JP 2015139498A JP 2017022593 A JP2017022593 A JP 2017022593A
- Authority
- JP
- Japan
- Prior art keywords
- identification result
- feature amount
- verification
- amount group
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
【解決手段】検証装置1は、トラヒックのフロー毎の複数の特徴量のうち、第1の特徴量群に基づいて、当該フローの種別を識別する識別機2から、識別結果を取得する取得部11と、識別結果が得られた同一フローにおける第2の特徴量群を選択する選択部12と、第2の特徴量群に基づいて、識別結果に対する外れ値を検出する検出部13と、を備える。
【選択図】図1
Description
このようなトラヒックの識別には、トラヒックデータから抽出される特徴に基づく機械学習が適用可能である(例えば、特許文献1参照)。
図1は、本実施形態に係る検証装置1の機能構成を示すブロック図である。
検証装置1は、トラヒックのフローデータを入力とし、第1の特徴量群を識別機2へ提供して得られた識別結果と、第2の特徴量群とに基づいて、識別結果を検証する。
検証装置1は、取得部11と、選択部12と、検出部13と、評価部14と、調整部15とを備える。
フロー毎の複数の特徴量としては、例えば、データサイズ、パケット数、パケットサイズ、時間、スループット(サイズ/時間)等が利用される。
また、識別機2は、第1の特徴量群に基づく教師データによって、例えばJ48等のアルゴリズムによって機械学習される。
第2の特徴量群の選択には、ラベルは用いられず、冗長な特徴量の選択を避けるため特徴量間の相関の平均値が低いことが求められる。このような選択手法として、例えば、主成分分析(PCA; Principal Component Analysis)が利用可能である。主成分分析によれば、複数の特徴量の線形結合を含んだ相関の低い第2の特徴量群が選択される。
この例では、第1の特徴量群であるf1及びf2を用いて、教師データによって学習された識別境界線Aによって、各フローデータがフォアグラウンド通信(FG traffic)とバックグラウンド通信(BG traffic)とに識別されている。
例えば、第1四分位値Q1、第3四分位値Q3、及びIQR=Q3−Q1に対して、下側閾値を「Q1−1.5×IQR」、上側閾値を「Q1+1.5×IQR」として、下側閾値より小さい値又は上側閾値より大きい値が外れ値と判定される。
ここで、より確度の高い外れ値を検出するために係数は適宜調整されてよく、例えば、下側閾値を「Q1−3×IQR」、上側閾値を「Q1+3×IQR」としてもよい。
このとき、調整部15は、演算の効率化のため、複数の外れ値を同質性によりクラスタ化し、クラスタ単位でマージの処理を行ってもよい。
・クラスタOjの要素xkがクラスCiに属していないこと(For all xk∈Oj, !(xk∈Ci))。
・マージしたクラスの同質性が十分に高い、すなわち、クラスタOjをクラスCiにマージすることにより同質性が向上する、又は同質性の低下率が所定未満であること。
この例では、識別機2により、フローデータがC1及びC2の2つのクラスに分類されている。
本実施形態の効果を、以下の手順により評価した。
(2−1)教師データセットDからCfsSubsetEvalにより、F1特徴量群を持つデータセットD’を選択する。
(2−2)D’から各クラス20サンプルずつ抽出し、テスト用データDtest1とする。
(2−3)残りを学習用データDtrainとする(Dtrain=D’−Dtest1)。
(2−4)Dtrainを用いてJ48等により学習を行い、識別機2を得る。
(2−5)識別機2により、Dtest1の識別を行い、識別結果C={C1,C2}を得る。
(2−6)識別結果Cに対して性能指標を算出する。
・現実の値!Xに対して判定結果X: FP(False Positive)
・現実の値Xに対して判定結果!X: TP(False Negative)
・現実の値!Xに対して判定結果!X: TP(True Negative)
P(Precision)=TP/(TP+FP)
R(Recall)=TP/(TP+FN)
F−score=2×P×R/(P+R)
(3−1)教師データセットDから、主成分分析により、F2特徴量群を持つデータ・セットD”を選択する。
(3−2)D”から20サンプルを抽出し、テスト用データDtest2とする。ここで、D’とD”とは同一のトラヒックフローについてのデータであるが、互いに異なる特徴量を持つ。
(4−1)前述した識別結果の調整方法(図3)により、調整後のクラスC’を得る。
(4−2)C’に対して性能指標の再評価を行う。
(4−3)調整前と調整後との性能指標を比較する。
上段は、F1特徴量群のみにより識別した場合の評価結果である。具体的には、種別a及び種別bのそれぞれ20サンプル(Dtest1)に対して、識別機2による識別結果(a又はb)、評価指標(P,R,F−score)及びF−scoreの調和平均が記載されている。
また、検証装置1は、第2の特徴量群として、互いの相関の平均値が低くなる特徴量を選択できるので、検証精度及び処理効率を向上できる。
このとき、検証装置1は、主成分分析を用いることにより、特徴量の線形結合を含んだ第2の特徴量群を選択できる。これにより、検証装置1は、第1の特徴量群と共通の要素を利用して検証用の第2の特徴量群を生成できる。
また、検証装置1は、マージ処理後のクラスタを更にクラスタ化することにより、調整結果の精度を向上できる。さらに、検証装置1は、分離された小さなクラスタを新たな種別の可能性があるクラスとして提示することができる。
11 取得部
12 選択部
13 検出部
14 評価部
15 調整部
Claims (10)
- トラヒックのフロー毎の複数の特徴量のうち、第1の特徴量群に基づいて、当該フローの種別を識別する識別機から、識別結果を取得する取得部と、
前記識別結果が得られた同一フローにおける第2の特徴量群を選択する選択部と、
前記第2の特徴量群に基づいて、前記識別結果に対する外れ値を検出する検出部と、を備える検証装置。 - 前記検出部は、IQR(Inter Quatile Range)に基づいて、前記外れ値を検出する請求項1に記載の検証装置。
- 前記選択部は、前記複数の特徴量のうち、互いの相関の平均値が低くなる特徴量を選択する請求項1又は請求項2に記載の検証装置。
- 前記選択部は、複数の特徴量の線形結合を含んで前記第2の特徴量群を選択する請求項1から請求項3のいずれかに記載の検証装置。
- 前記第2の特徴量群に基づいて、複数のフローの同質性を評価する評価部と、
前記同質性の変化量に基づいて、前記外れ値を前記識別結果とは異なる種別にマージして前記識別結果を調整する調整部と、を備える請求項1から請求項4のいずれかに記載の検証装置。 - 前記調整部は、前記外れ値を前記同質性によりクラスタ化し、クラスタ単位で前記マージの処理を行う請求項5に記載の検証装置。
- 前記調整部は、前記マージの処理後のクラスタを、前記同質性により更にクラスタ化し、最大のクラスタを調整結果として出力する請求項6に記載の検証装置。
- 前記調整部は、前記最大のクラスタ以外のクラスタを、新たな種別として報知する請求項7に記載の検証装置。
- コンピュータの制御部が、
トラヒックのフロー毎の複数の特徴量のうち、第1の特徴量群に基づいて、当該フローの種別を識別する識別機から、識別結果を取得する取得ステップと、
前記識別結果が得られた同一フローにおける第2の特徴量群を選択する選択ステップと、
前記第2の特徴量群に基づいて、前記識別結果に対する外れ値を検出する検出ステップと、を実行する検証方法。 - コンピュータの制御部に、
トラヒックのフロー毎の複数の特徴量のうち、第1の特徴量群に基づいて、当該フローの種別を識別する識別機から、識別結果を取得する取得ステップと、
前記識別結果が得られた同一フローにおける第2の特徴量群を選択する選択ステップと、
前記第2の特徴量群に基づいて、前記識別結果に対する外れ値を検出する検出ステップと、を実行させるための検証プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015139498A JP6541482B2 (ja) | 2015-07-13 | 2015-07-13 | 検証装置、検証方法及び検証プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015139498A JP6541482B2 (ja) | 2015-07-13 | 2015-07-13 | 検証装置、検証方法及び検証プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017022593A true JP2017022593A (ja) | 2017-01-26 |
JP6541482B2 JP6541482B2 (ja) | 2019-07-10 |
Family
ID=57888432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015139498A Active JP6541482B2 (ja) | 2015-07-13 | 2015-07-13 | 検証装置、検証方法及び検証プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6541482B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018191217A (ja) * | 2017-05-10 | 2018-11-29 | ソフトバンク株式会社 | データ監視装置、データ監視方法及びデータ監視プログラム |
CN108933706A (zh) * | 2017-05-23 | 2018-12-04 | 华为技术有限公司 | 一种监测数据流量的方法、装置及系统 |
JP2019139667A (ja) * | 2018-02-15 | 2019-08-22 | Kddi株式会社 | 通信分析方法およびシステムならびに通信端末およびそのアプリケーション |
JP2020141236A (ja) * | 2019-02-27 | 2020-09-03 | 日本電信電話株式会社 | 識別装置及び識別プログラム |
CN112947263A (zh) * | 2021-04-20 | 2021-06-11 | 南京云玑信息科技有限公司 | 一种基于数据采集与编码管理控制系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013127504A (ja) * | 2011-12-16 | 2013-06-27 | Osaka City Univ | トラヒック監視装置 |
WO2015023256A1 (en) * | 2013-08-12 | 2015-02-19 | Hewlett-Packard Development Company, L.P. | Application-aware network management |
JP2015036962A (ja) * | 2013-08-16 | 2015-02-23 | 富士ゼロックス株式会社 | 処置判定装置、処置判定システム、処置判定プログラム及び処置判定方法 |
JP2015050473A (ja) * | 2013-08-29 | 2015-03-16 | 公立大学法人大阪市立大学 | トラヒック監視装置及びプログラム、並びに、通信装置 |
-
2015
- 2015-07-13 JP JP2015139498A patent/JP6541482B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013127504A (ja) * | 2011-12-16 | 2013-06-27 | Osaka City Univ | トラヒック監視装置 |
WO2015023256A1 (en) * | 2013-08-12 | 2015-02-19 | Hewlett-Packard Development Company, L.P. | Application-aware network management |
JP2015036962A (ja) * | 2013-08-16 | 2015-02-23 | 富士ゼロックス株式会社 | 処置判定装置、処置判定システム、処置判定プログラム及び処置判定方法 |
JP2015050473A (ja) * | 2013-08-29 | 2015-03-16 | 公立大学法人大阪市立大学 | トラヒック監視装置及びプログラム、並びに、通信装置 |
Non-Patent Citations (1)
Title |
---|
北村 強 TSUTOMU KITAMURA: "フロー挙動分析技術に基づくアプリケーション識別手法 Application Classification Method based on Flow", 電子情報通信学会技術研究報告 VOL.105 NO.470 IEICE TECHNICAL REPORT, vol. 第105巻, JPN6019004017, 8 December 2005 (2005-12-08), JP, pages 13 - 16, ISSN: 0004047142 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018191217A (ja) * | 2017-05-10 | 2018-11-29 | ソフトバンク株式会社 | データ監視装置、データ監視方法及びデータ監視プログラム |
CN108933706A (zh) * | 2017-05-23 | 2018-12-04 | 华为技术有限公司 | 一种监测数据流量的方法、装置及系统 |
KR20200007912A (ko) * | 2017-05-23 | 2020-01-22 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 데이터 트래픽을 모니터링하기 위한 방법, 장치 및 시스템 |
JP2020521395A (ja) * | 2017-05-23 | 2020-07-16 | 華為技術有限公司Huawei Technologies Co.,Ltd. | データトラフィックを監視するための方法、装置、およびシステム |
CN108933706B (zh) * | 2017-05-23 | 2022-02-25 | 华为技术有限公司 | 一种监测数据流量的方法、装置及系统 |
KR102397346B1 (ko) * | 2017-05-23 | 2022-05-13 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 데이터 트래픽을 모니터링하기 위한 방법, 장치 및 시스템 |
JP2019139667A (ja) * | 2018-02-15 | 2019-08-22 | Kddi株式会社 | 通信分析方法およびシステムならびに通信端末およびそのアプリケーション |
JP2020141236A (ja) * | 2019-02-27 | 2020-09-03 | 日本電信電話株式会社 | 識別装置及び識別プログラム |
WO2020175165A1 (ja) * | 2019-02-27 | 2020-09-03 | 日本電信電話株式会社 | 識別装置及び識別プログラム |
CN112947263A (zh) * | 2021-04-20 | 2021-06-11 | 南京云玑信息科技有限公司 | 一种基于数据采集与编码管理控制系统 |
Also Published As
Publication number | Publication date |
---|---|
JP6541482B2 (ja) | 2019-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6541482B2 (ja) | 検証装置、検証方法及び検証プログラム | |
US10885618B2 (en) | Inspection apparatus, data generation apparatus, data generation method, and data generation program | |
Robinson et al. | Face recognition: too bias, or not too bias? | |
US20180173789A1 (en) | Descriptive datacenter state comparison | |
US20160180254A1 (en) | Information matching apparatus, method of matching information, and computer readable storage medium having stored information matching program | |
US11107231B2 (en) | Object detection device, object detection method, and object detection program | |
US20220156367A1 (en) | System and method for detection of anomalous controller area network (can) messages | |
US20180174072A1 (en) | Method and system for predicting future states of a datacenter | |
JP2020512631A (ja) | 段階的な機械学習を使用する自動化された意思決定 | |
US20220277174A1 (en) | Evaluation method, non-transitory computer-readable storage medium, and information processing device | |
US11398957B2 (en) | Systems and methods for predicting failure of a network device | |
CN108984613A (zh) | 一种基于迁移学习的缺陷报告跨项目分类方法 | |
US9100511B2 (en) | Image reading device and image reading system | |
CN107861873B (zh) | 基于两属性分级调整的测试用例优先级调整方法 | |
CN111932226A (zh) | 基于区块链和大数据的数据流监测方法及云计算服务平台 | |
TWI615809B (zh) | 用於評價圖像信號處理器中實施的分類器的系統和方法 | |
Feng et al. | An improved X-means and isolation forest based methodology for network traffic anomaly detection | |
US20210117858A1 (en) | Information processing device, information processing method, and storage medium | |
US10320636B2 (en) | State information completion using context graphs | |
CN110770753B (zh) | 高维数据实时分析的装置和方法 | |
US20220230028A1 (en) | Determination method, non-transitory computer-readable storage medium, and information processing device | |
CN105897503B (zh) | 基于资源信息增益的Hadoop集群瓶颈检测方法 | |
CN105354833A (zh) | 一种阴影检测的方法和装置 | |
KR102265678B1 (ko) | 이미지 파일의 바운딩 박스 작업의 난이도를 예측하는 방법 및 이를 수행하는 컴퓨터 장치 | |
CN105809180A (zh) | 图像处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190611 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6541482 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |