KR20110138092A - 네트워크 트래픽 모델링 방법 및 장치 - Google Patents

네트워크 트래픽 모델링 방법 및 장치 Download PDF

Info

Publication number
KR20110138092A
KR20110138092A KR1020100058220A KR20100058220A KR20110138092A KR 20110138092 A KR20110138092 A KR 20110138092A KR 1020100058220 A KR1020100058220 A KR 1020100058220A KR 20100058220 A KR20100058220 A KR 20100058220A KR 20110138092 A KR20110138092 A KR 20110138092A
Authority
KR
South Korea
Prior art keywords
data
traffic
major
minor
data set
Prior art date
Application number
KR1020100058220A
Other languages
English (en)
Inventor
신광식
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020100058220A priority Critical patent/KR20110138092A/ko
Priority to US13/163,383 priority patent/US20110310768A1/en
Publication of KR20110138092A publication Critical patent/KR20110138092A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/026Capturing of monitoring data using flow identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Environmental & Geological Engineering (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명은 네트워크 트래픽 모델링 방법 및 장치에 관한 것으로, 본 발명의 일면에 따른 네트워크 트래픽 모델링 방법은 네트워크로부터 전송되는 데이터의 트래픽을 수집하는 단계와, 수집된 트래픽을 데이터 크기, 패킷 크기 및 IDT(Inter-Departure Time) 중 어느 하나를 기준으로 하여 트래픽의 밀도값을 추출하고, 원시 도메인 상에서의 확률 밀도 분포를 구하는 단계와, 데이터를 임계값 이상의 밀도값을 가지는 데이터들의 집단인 메이저 데이터셋과 임계값 미만의 데이터 밀도값을 가지는 데이터들의 집단인 마이너 데이터셋으로 분리하는 단계와, 원시 도메인을 임계값 이하의 데이터 밀도값에 대응하는 구간이 제외되어 이루어진 메이저 데이터셋 도메인상으로 변환하는 단계 및 메이저 데이터셋 도메인 상의 메이저 데이터셋에 대하여, 그래프 피팅 알고리즘을 적용하여 메이저 데이터셋 분석 모델을 얻는 단계를 포함한다.

Description

네트워크 트래픽 모델링 방법 및 장치 {METHOD AND APPARATUS FOR MODELING NETWORK TRAFFIC}
본 발명은 네트워크 트래픽 모델링 방법 및 장치에 관한 것으로서, 구체적으로는, 변화가 큰 네트워크 트래픽을 적정하게 모델링하는 네트워크 트래픽 모델링 방법 및 장치에 관한 것이다.
본 발명은 문화체육관광부의 대규모 가상유저의 시나리오 기반 제어를 통한 온라인 게임 품질검증 기술 개발의 일환으로 수행한 연구로부터 도출된 것이다. [과제관리번호: 2009-S-041-01, 과제명: 대규모 가상유저의 시나리오 기반 제어를 통한 온라인 게임 품질검증 기술 개발]
종래의 네트워크 트래픽 모델링 기술은 트래픽 흐름 분석을 위해 패킷 도달 주기 또는 트래픽 양의 순간적인 변화에 따라 단순히 버스트(burst)와 아이들(idle) 상태로 트래픽을 모델링한다. 따라서, 종래의 네트워크 트래픽 모델링 기술은 패킷 크기 분포 등과 같은 다른 트래픽 특성에 대한 모델링이 어렵다.
한편, 네트워크 트래픽 모델링 기술에서는 트래픽 분포를 분석 가능한 형태로 모델링하기 위하여, 트래픽 분포를 적절하게 분리하는 것이 중요하다.
종래의 네트워크 트래픽 모델링 기술은 온라인 게임 등과 같이 변화가 심한 트래픽 분포를 모델링하기 위해 트래픽 분포의 구간을 나누어 각각의 구간에서의 랜덤 분포함수로 모델링 하는 방법을 사용한다. 하지만, 종래의 네트워크 트래픽 모델링 기술은 각 구간별로 적절한 랜덤 분포 함수로 트래픽 분포를 분리하기 때문에, 복잡한 분포를 갖는 트래픽의 경우 데이터 구간이 너무 많은 구간으로 분리되어 실제 활용이 어려운 문제가 있다. 따라서, 종래의 네트워크 트래픽 모델링 기술은 트래픽 분포를 분석이 쉬운 형태로 모델링하기 어렵다.
본 발명의 목적은 온라인 게임 등과 같은 심한 변화를 가지는 네트워크 트래픽을 적정하게 모델링하고 이를 통하여 실제의 트래픽과 유사한 패턴의 트래픽을 생성할 수 있는 네트워크 트래픽 모델링 방법 및 장치를 제공하는 것이다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
전술한 목적을 달성하기 위한 본 발명의 일면에 따른 네트워크 트래픽 모델링 방법은 네트워크로부터 전송되는 데이터의 트래픽을 수집하는 단계와, 수집된 트래픽을 데이터 크기, 패킷 크기 및 IDT(Inter-Departure Time) 중 어느 하나를 기준으로 하여 트래픽의 밀도값을 추출하고, 원시 도메인 상에서의 확률 밀도 분포를 구하는 단계와, 데이터를 임계값 이상의 밀도값을 가지는 데이터들의 집단인 메이저 데이터셋과 임계값 미만의 데이터 밀도값을 가지는 데이터들의 집단인 마이너 데이터셋으로 분리하는 단계와, 원시 도메인을 임계값 이하의 데이터 밀도값에 대응하는 구간이 제외되어 이루어진 메이저 데이터셋 도메인상으로 변환하는 단계 및 메이저 데이터셋 도메인 상의 메이저 데이터셋에 대하여, 그래프 피팅 알고리즘을 적용하여 메이저 데이터셋 분석 모델을 얻는 단계를 포함한다.
본 발명의 다른 면에 따른 네트워크 트래픽 모델링 장치는 네트워크를 통해 전송되는 데이터의 트래픽을 수집하는 수집부와, 수집된 트래픽을 데이터 크기, 패킷 크기 및 IDT 중 어느 하나를 기준으로 하여 트래픽의 밀도값을 추출하고, 원시 도메인 상에서의 확률 밀도 분포를 구하는 추출부 및 데이터를 임계값 이상의 밀도값을 가지는 데이터들의 집단인 메이저 데이터셋과 임계값 미만의 데이터 밀도값을 가지는 데이터들의 집단인 마이너 데이터셋으로 분리하고, 메이저 데이터셋을 모델링하여 수학적 분석 모델을 얻는 트래픽 모델링 모듈을 포함한다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
본 발명에 따르면, 수집된 네트워크 트래픽을 데이터의 밀도값에 따라 분리하여 트래픽의 특성을 결정하는 데이터만을 대상으로 모델링함으로써, 간단한 계산을 통하여 변화가 심한 네트워크 트래픽도 용이하게 모델링 할 수 있다.
또한, 데이터의 밀도값을 따른 분리 및 모델링을 반복하여 실제 네트워크 트래픽에 더욱 근사한 모델링을 할 수 있다.
본 발명에 따른 모델링 결과를 이용하여 실제 네트워크 트래픽의 특성을 잘 반영한 재생성 데이터를 용이하게 얻을 수 있다.
도 1은 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 방법을 나타내는 순서도이다.
도 2는 소정의 트래픽에 있어서, 패킷 크기에 대한 밀도값을 히스토그램으로 나타낸 예시도이다.
도 3은 소정의 트래픽에 있어서, 패킷 크기에 대한 밀도값을 확률밀도함수로 나타낸 예시도이다.
도 4는 소정의 트래픽에 있어서, 이동 평균값을 나타내는 예시도이다.
도 5는 원시 도메인 상의 메이저 데이터셋을 나타내는 예시도이다.
도 6은 메이저 데이터셋 도메인 상의 메이저 데이터셋을 나타내는 예시도이다.
도 7은 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 장치를 나타내는 블록도이다.
도 8은 본 발명의 실시예에 따른 네트워크 트래픽 모델링 장치의 트래픽 모델링 모듈을 나타내는 블록도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것으로서, 본 발명은 청구항의 기재에 의해 정의될 뿐이다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며, 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 이하, 첨부된 도면을 참조하여 본 발명의 일 실시예를 상세히 설명하기로 한다.
도 1을 참조하여 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 방법을 설명한다. 도 1은 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 방법을 나타내는 순서도이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 방법은 네트워크를 통해 전송되는 데이터의 트래픽을 수집한다(S110).
이 후, 데이터 크기, 패킷 크기 및 IDT(Inter-Departure Time) 중 어느 하나를 기준으로 하는 원시 도메인에서 트래픽의 밀도 분포를 구한다(S112).
즉, 원시 도메인은 데이터 크기 도메인, 패킷 크기 도메인, IDT 도메인 중의 하나가 되며, 온라인 게임, 방송 서비스, 멀티미디어 스트리밍 서비스, 유무선 통신 등 트래픽 발생 환경 및 네트워크 트래픽 모델링의 목적에 따라 선택한다.
따라서, 트래픽의 밀도는 선택된 도메인에 따라, 데이터 크기 당 트래픽량의 확률밀도, 패킷 크기 당 트래픽량의 확률밀도 및 단위 시간당 트래픽량의 확률밀도 중 어느 하나가 될 것이다.
예컨대, 도 2 및 도 3에 도시된 바와 같이, 수집된 네트워크 트래픽에 있어서, 패킷 크기를 기준으로 하는 원시 도메인상에 각 구간값(0 부터 200까지의 패킷 크기) 별로 트래픽 밀도값을 대응시킨다.
여기서, 도 2는 소정의 트래픽에 있어서, 패킷 크기에 대한 트래픽 밀도값을 히스토그램으로 나타낸 예시도이다. 한편, 도 3은 소정의 트래픽에 있어서, 패킷 크기에 대한 트래픽 밀도값을 확률밀도함수로 나타낸 예시도이다. 한편, 도 2 및 도 3에 있어서, 가로축은 패킷 크기, 세로축은 밀도값을 나타낸다.
단계(S112)에 대하여 전술한 설명에서 원시 도메인은 열거된 데이터 크기 도메인, 패킷 크기 도메인, IDT 도메인에 제한되지 않으며, 기타의 다른 도메인을 원시 도메인으로 할 수 있음은 물론이다.
이 후, 트래픽 밀도값에 따라 데이터를 분리하는 기준이 되는 이동 평균값을 산출한다(S114).
여기서, 이동 평균값은 원시 도메인상의 각 구간값에 대응하는 트래픽 밀도값의 이동 평균값(Moving Average value)이다.
도 4는 패킷 크기 도메인에서 트래픽 밀도값의 이동 평균값을 산출한 것을 나타낸 도면으로서, 가로축은 패킷 크기, 세로축은 트래픽 밀도값을 나타낸다. 여기서, 각 밀도값의 평균값을 지나는 선이 트래픽 밀도값의 이동 평균을 나타낸다.
이 후, 데이터를 이동 평균값을 임계값으로 하여, 임계값 이상의 밀도값을 가지는 데이터들의 집단인 메이저 데이터셋(Major Dataset)과, 그렇지 않은 마이너 데이터셋(Minor Dataset)으로 분리한다(S116).
한편, 메이저 데이터셋을 분리하는 기준이 되는 임계값으로서 전술한 이동평균값 이외에 소정의 상수를 이용할 수도 있고 또는 기타 다른 값을 이용할 수 있다. 그 다음, 분리된 메이저 데이터셋만을 포함하도록 도메인을 변환한다. 즉, 원시 도메인을 임계값 이하의 데이터 밀도값에 대응하는 구간이 제외되어 이루어진 메이저 데이터셋 도메인상으로 변환한다(S118).
즉, 도 5에 도시된 원시 도메인상의 트래픽 밀도 분포가 도 6에 도시된 메이저 데이터셋 도메인 상의 트래픽 밀도 분포로 변환된다. 도 5 및 도 6에 있어서, 가로축은 패킷 크기, 세로축은 밀도값을 나타낸다.
도 5에 도시된 바와 같이, 분리된 메이저 데이터셋은 이동평균값 이상의 밀도값을 가지는 부분만으로 이루어진다. 즉, 분리 후에는 마이너 데이터셋이 원시 도메인 상에서 제거되므로 원시 도메인 상에서 불연속적 분포가 많아지게 되어, 메이저 데이터셋의 모델링이 어렵다는 문제가 있다.
이러한 문제를 해결하기 위하여, 도 6에 도시된 바와 같이, 메이저 데이터셋 도메인을, 연속적인 분포를 가지도록 메이저 데이터셋 도메인 상으로 변환한다.
이 때, 원시 도메인 상의 메이저 데이터 셋이 메이저 데이터셋 도메인 상의 메이저 데이터셋으로 변환되는 관계를 나타내는 메이저 데이터셋 변환 테이블을 생성한다(S120).
이 후, 메이저 데이터셋 도메인 상의 메이저 데이터셋에 대하여, 분포 그래프에 나타나는 복수 개의 피크를 찾고 이로부터 적절한 수학적 모델을 찾는 그래프 피팅(Graph Fitting) 알고리즘을 적용하여 복수 개의 랜덤 분포 함수의 합으로 표현되는 메이저 데이터셋 분석 모델을 얻는다(S124).
여기서, 그래프 피팅은 곡선 맞춤(Curve Fitting)을 수행하여 메이저 데이터셋의 분포를 수식화할 수 있다. 한편, 메이저 데이터셋 분석 모델은 수학 모델, 확률 밀도 함수 모델, 히스토그램 모델 등 트래픽 분석의 목적에 따라 다양한 형태가 될 수 있다.
이 후, 네트워크 트래픽을 시뮬레이션하여 네트워크 또는 서버의 네트워크 부하 등을 테스트하고자 할 때, 단계(S124)에서 얻어진 분석모델을 이용하여 메이저 데이터셋 도메인 상의 데이터 분포를 구하고, 이를 다시 단계(S120)에서 구한 메이저 데이터셋 변환 테이블을 참조하여 원시 도메인상의 데이터 분포로 역변환하여 재생성 메이저 트래픽을 얻는다(S126).
이렇게 얻어진 재생성 메이저 데이터를 이용하여, 온라인 게임용 서버나 네트워크 장치에 대한 부하 테스트 등의 각종 테스트를 수행할 수 있다.
한편, 전술한 방식에 의하여 생성된 재생성 트래픽은 실제의 트래픽의 일부 데이터에 대한 모델링을 수행한 분석 모델에 의하여 구한 것이므로 실제 트래픽과 유사성이 떨어질 수 있다. 이런 경우를 해결하고자 전술한 마이너 데이터셋에 대하여도 같은 과정을 반복하고, 그 결과를 통합하여 재생성 트래픽을 구할 수 있다.
이하, 마이너 데이터셋을 모델링하여 재생성 마이너 트래픽을 얻는 순서를 설명한다.
마이너 데이터셋을 모델링하는 방법은 전술한 메이저 데이터셋을 모델링하는 방법과 유사하다.
먼저, 마이너 데이터셋의 데이터의 밀도값에 대한 이동 평균값을 산출한다(S128).
이 후, 마이너 데이터셋의 데이터를 전술한 임계값과는 상이한 새로운 임계값(이하, 설명의 편의를 위하여 마이너 임계값이라 칭함) 이상의 밀도값을 가지는 마이너-메이저 데이터셋과 마이너 임계값 미만의 데이터 밀도값을 가지는 마이너-마이너 데이터셋으로 분리한다(S130).
이 후, 도메인을 변환하는데, 원시 도메인을 마이너-메이저 데이터셋만을 포함하는 마이너 데이터셋 도메인으로 변환한다(S132).
이 때, 변환되는 관계를 나타내는 마이너 데이터셋 변환 테이블을 생성한다(S134).
이 후, 마이너 데이터셋 도메인 상의 마이너-메이저 데이터셋에 대하여 그래프 피팅을 알고리즘을 이용하여 마이너-메이저 데이터셋 분석 모델 얻는다(S138).
이와 같이 2회에 걸쳐 모델링을 수행하여 메이저 데이터셋과 마이너 데이터 셋 각각에 대한 2개의 분석 모델을 구하고, 이를 이용하여 테스트용 재생성 데이터를 구하면 실제 데이터 트래픽에 보다 유사한 재생성 데이터를 구할 수 있다.
재생성 데이터의 구하는 과정은 각 분석 모델을 이용하여 데이터 분포를 얻은 후, 이를 각 데이터셋 변환 테이블을 이용하여 원시 도메인상의 데이터로 변환함으로써 재생성 메이저 데이터셋 및 재생성 마이너 데이터셋을 구한 후(S126, S140) 두 개의 데이터셋를 통합하여 테스트용 재생성 트래픽을 얻는다 (S142).
한편, 재생성 메이저 트래픽, 재생성 마이너 트래픽 및 테스트용 재생성 트래픽의 분포는 전술한 그래프 피팅의 수행 형태에 따라 복수의 랜덤 분포 함수의 합으로 표현될 수 있다.
같은 취지로 재생성 트래픽의 실제 트래픽과의 유사성을 더욱 높이기 위하여, 전술한 방법에 따라 모델링하여 테스트 트래픽에 통합하는 과정을 반복할 수 있다. 이러한, 모델링 및 통합하는 과정을 반복할수록 테스트 트래픽의 분포는 수집된 트래픽의 분포와 점점 더 비슷하게 된다.
예컨대, 이전에 이용한 이동 평균값과 상이한(낮은) 이동 평균값을 기준으로 데이터셋을 분리하고, 이에 대해 전술한 방법에 따라 모델링을 하여, 그 결과를 테스트 트래픽에 통합할 수 있고, 이러한 통합이 반복될수록 테스트용 재생성 트래픽을 수집된 실제 트래픽에 더욱 근사하게 모델링하는 것이 가능하다.
본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 방법은 수집된 실제 트래픽 전체를 대상으로 모델링을 수행하는 것이 아니라, 임계값을 적절히 적용하여 실제 트래픽의 특성을 잘 반영하는 일부의 데이터셋만을 추출하여 모델링을 함으로써, 트래픽 분석을 쉽고 간단하게 할 수 있다. 아울러, 이 과정을 반복함으로써 실제 트래픽과의 유사성도 계속 높일 수 있다. 또한, 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 방법은 시간에 대한 데이터 분포뿐만이 아니라, 데이터 크기, 패킷 크기, IDT 등을 기준으로도 트래픽의 분석 및 모델링이 가능하다.
도 7 및 도 8을 참조하여, 본 발명의 실시예에 따른 네트워크 트래픽 모델링 장치를 설명한다. 도 7은 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 장치를 나타내는 블록도이다. 도 8은 본 발명의 실시예에 따른 네트워크 트래픽 모델링 장치의 트래픽 모델링 모듈을 나타내는 블록도이다.
도 7에 도시된 바와 같이, 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 장치(10)는 수집부(100), 추출부(200), 트래픽 모델링 모듈(300), 반복 수행 판단부(400) 및 재생성부(500)을 포함한다.
수집부(100)는 네트워크를 통해 전송되는 데이터 트래픽을 수집한다.
추출부(200)는 수집된 데이터 트래픽을 데이터 크기, 패킷 크기 및 IDT 중 어느 하나를 기준으로 하여 트래픽의 밀도값을 추출하고, 원시 도메인 상에서의 확률 밀도 분포를 구한다.
트래픽 모델링 모듈(300)은 데이터를 임계값 이상의 밀도값을 가지는 데이터들의 집단인 메이저 데이터셋과 임계값 미만의 데이터 밀도값을 가지는 데이터들의 집단인 마이너 데이터셋으로 분리하고, 메이저 데이터셋을 모델링하여 수학적 분석 모델을 얻는다. 또한, 원시 도메인 상의 메이저 데이터 셋이 메이저 데이터셋 도메인 상의 메이저 데이터셋으로 변환되는 관계를 나타내는 변환 테이블을 생성한다.
반복 수행 판단부(400)는 트래픽 모델링 모듈(300)로부터 메이저 데이터셋, 마이너 데이터셋 및 수학적 분석 모델을 제공 받고 이들 중 적어도 하나를 분석하여 모델링의 반복수행 여부를 판단하고, 반복수행이 필요하다고 판단한 경우에 추출부(200)에 마이너 데이터셋을 제공한다.
반복 수행 판단부(400)는 모델링의 반복수행 여부를 판단하기 위하여, 수집된 실제 트래픽과 재생성 트래픽을 비교하여 유사한지 여부를 판단하고, 그 결과에 따라 모델링의 반복수행 여부를 결정하는 것일 수 있다. 여기서, 유사한지 여부는 수집된 트래픽과 재생성 트래픽의 일치율 및 데이터 등의 오차를 이용하는 등 다양한 방법을 이용하여 판단할 수 있다.
또한, 반복 수행 판단부(400)는 모델링의 반복수행 여부를 판단하기 위하여, 메이저 데이터셋의 밀도값 및 메이저 데이터셋 도메인의 구간 등을 이용할 수도 있다. 예컨대, 반복 수행 판단부(400)는 메이저 데이터셋의 가장 큰 밀도값과 가장 작은 밀도값의 차이가 기설정한 임계값 이상인 경우, 반복수행을 하는 것으로 판단할 수 있다. 또한, 반복 수행 판단부(400)는 메이저 데이터셋 도메인의 구간이 기설정한 임계값 미만인 경우, 반복수행을 하는 것으로 판단할 수 있다.
또는, 반복 수행을 기본으로 하되, 분리되고 남은 데이터셋의 데이터 밀도의 총합이 미리 정한 값 이하가 되면 반복을 종료하는 것으로 구성할 수도 있다.
재생성부(500)는 트래픽 모델링 모듈 또는 반복 수행 판단부(400)로부터 수학적 분석 모델 및 변환 테이블을 제공받아 수학적 분석 모델을 이용하여 데이터 분포를 구하고 이를 변환 테이블을 이용하여 역변환하여 테스트용 재생성 트래픽을 생성한다.
또한, 재생성부(500)는 반복 수행이 된 경우에, 트래픽 모델링 모듈 또는 반복 수행 판단부(400)로부터 둘 이상(즉, 반복 수행된 회수만큼)의 분석 모델 및 각 분석 모델에 대응하는 변환테이블을 제공받아, 이들로부터 둘 이상의 재생성 트래픽을 얻고, 이를 통합하여 테스트용 재생성 데이터를 얻는다.
또는, 재생성부(500)를 반복 수행 판단부(400)로부터 모델링의 반복수행에 따른 새로운 분석 모델(예컨대, 마이너 데이터셋에 대한 분석 모델)을 제공받아, 기존에 저장된 테스트용 재생성 트래픽(예컨대, 메이저 데이터셋에 대한 분석 모델)과 통합하여 새로운 테스트용 재생성 트래픽을 얻는 식으로 구성할 수 있다.
본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 장치(10)에 의해 모델링의 반복수행을 거듭할수록 테스트 트래픽은 실제의 트래픽에 점점 더 근사해진다. 한편, 모델링의 반복수행의 횟수는 트래픽 분석의 목적에 따라 적절하게 선택하는 것이 바람직하다.
한편, 도 8에 도시된바와 같이, 트래픽 모델링 모듈(300)은 모델링을 수행하기 위하여, 분리부(310), 이동 평균 산출부(315), 도메인 변환부(320), 그래프 피팅부(330) 및 변환 테이블 생성부(345)를 포함할 수 있다.
분리부(310)는 데이터를 임계값(예컨대, 이동평균값) 이상의 밀도값을 가지는 데이터들의 집단인 메이저 데이터셋과 임계값 미만의 데이터 밀도값을 가지는 데이터들의 집단인 마이너 데이터셋으로 분리한다.
이동 평균 산출부(315)는 데이터의 밀도값에 대한 이동 평균값인 이동 평균값을 산출한다.
도메인 변환부(320)는 원시 도메인 상의 메이저 데이터셋을, 마이너 데이터셋이 제외되어 이루어진 메이저 데이터셋 도메인상으로 변환한다.
그래프 피팅부(330)는 메이저 데이터셋 도메인 상의 메이저 데이터셋에 대하여, 분포 그래프에 나타나는 복수 개의 피크를 찾고 이로부터 적절한 수학적 모델을 찾는 그래프 피팅(Graph Fitting) 알고리즘을 적용하여 복수 개의 랜덤 분포 함수의 합으로 표현되는 분석 모델을 얻는다
변환 테이블 생성부(345)는 원시 도메인 상의 메이저 데이터 셋이 메이저 데이터셋 도메인 상의 메이저 데이터셋으로 변환되는 관계를 나타내는 변환 테이블을 생성한다.
이상 살펴본 바와 같이, 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 장치(10)는 수집된 실제 트래픽 전체를 대상으로 모델링을 수행하는 것이 아니라, 임계값을 적절히 적용하여 실제 트래픽의 특성을 잘 반영하는 일부의 데이터셋만을 추출하여 모델링을 함으로써, 트래픽 분석을 쉽고 간단하게 할 수 있다. 아울러, 이 과정을 반복함으로써 실제 트래픽과의 유사성도 계속 높일 수 있다. 또한, 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 장치(10)는 시간에 대한 데이터 분포뿐만이 아니라, 데이터 크기, 패킷 크기, IDT 등을 기준으로도 트래픽의 분석 및 모델링이 가능하다.
또한, 본 발명의 일 실시예에 따른 네트워크 트래픽 모델링 장치(10)는 온라인 게임 등과 같은 심한 변화를 가지는 네트워크 트래픽을 적정하게 모델링하고 이를 통하여 실제의 트래픽과 유사한 패턴의 테스트 트래픽을 생성할 수 있다.
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (20)

  1. 네트워크로부터 전송되는 데이터의 트래픽을 수집하는 단계;
    상기 수집된 트래픽을 데이터 크기, 패킷 크기 및 IDT(Inter-Departure Time) 중 어느 하나를 기준으로 하여 트래픽의 밀도값을 추출하고, 원시 도메인 상에서의 확률 밀도 분포를 구하는 단계;
    상기 데이터를 임계값 이상의 상기 밀도값을 가지는 데이터들의 집단인 메이저 데이터셋과 상기 임계값 미만의 데이터 밀도값을 가지는 데이터들의 집단인 마이너 데이터셋으로 분리하는 단계;
    상기 원시 도메인상에서 분리된 상기 메이저 데이터셋을 상기 마이너 데이터셋 구간이 제외되어 이루어진 메이저 데이터셋 도메인상의 데이터셋으로 변환하는 단계; 및
    변환된 상기 메이저 데이터셋에 대하여, 그래프 피팅 알고리즘을 적용하여 메이저 데이터셋 분석 모델을 얻는 단계
    를 포함하는 네트워크 트래픽 모델링 방법.
  2. 제1 항에 있어서,
    상기 메이저 데이터셋 분석 모델을 이용하여 상기 메이저 데이터셋 도메인 상에서의 데이터 밀도 분포를 얻고, 이를 상기 원시 도메인상으로 역변환하여 재생성 메이저 트래픽을 얻는 단계
    를 더 포함하는 네트워크 트래픽 모델링 방법.
  3. 제2 항에 있어서,
    상기 임계값은 상기 확률 밀도 분포에 대한 이동 평균값인 것
    인 네트워크 트래픽 모델링 방법.
  4. 제1 항에 있어서,
    상기 변환하는 단계는, 상기 원시 도메인 상의 상기 메이저 데이터 셋이 상기 메이저 데이터셋 도메인 상의 데이터셋으로 변환되는 관계를 나타내는 메이저 데이터셋 변환 테이블을 생성하는 단계
    를 포함하는 것인 네트워크 트래픽 모델링 방법.
  5. 제1 항에 있어서,
    상기 마이너 데이터셋의 데이터를 상기 임계값과 상이한 새로운 임계값 이상의 밀도값을 가지는 마이너-메이저 데이터셋과 상기 새로운 임계값 미만의 상기 데이터 밀도값을 가지는 데이터들의 집단인 마이너-마이너 데이터셋으로 분리하는 단계;
    상기 원시 도메인 상의 마이너-메이저 데이터셋을, 상기 새로운 임계값 이하의 데이터 밀도값에 대응하는 구간이 제외되어 이루어진 마이너 데이터셋 도메인상의 데이터셋으로 변환하는 단계; 및
    변환된 상기 마이너 데이터셋에 대하여, 그래프 피팅 알고리즘을 적용하여 마이너-메이저 데이터셋 분석 모델을 얻는 단계
    를 더 포함하는 네트워크 트래픽 모델링 방법.
  6. 제 5 항에 있어서,
    상기 마이너-메이저 데이터셋 분석 모델을 이용하여 상기 마이너 데이터셋 도메인상에서의 데이터 밀도 분포를 얻고, 이를 상기 원시 도메인상으로 역변환하여 재생성 마이너 트래픽을 얻는 단계; 및
    상기 재생성 메이저 트래픽 및 상기 재생성 마이너 트래픽을 통합하여 테스트용 재생성 트래픽을 얻는 단계
    를 더 포함하는 네트워크 트래픽 모델링 방법.
  7. 제 5 항에 있어서,
    상기 마이너-마이너 데이터셋으로 분리하는 단계와, 마이너 데이터셋 도메인상의 데이터셋으로 변환하는 단계와, 마이너-메이저 데이터셋 분석 모델을 얻는 단계를 적어도 1회 반복 수행하는 단계
    를 더 포함하는 네트워크 트래픽 모델링 방법.
  8. 제 5 항에 있어서,
    상기 원시 도메인 상의 상기 마이너 데이터 셋이 상기 마이너 데이터셋 도메인 상의 상기 마이너 데이터셋으로 변환되는 관계를 나타내는 마이너 데이터셋 변환 테이블을 생성하는 단계
    를 더 포함하는 네트워크 트래픽 모델링 방법.
  9. 제1 항에 있어서,
    상기 트래픽의 밀도값은 선택된 상기 기준에 따라, 상기 데이터 크기 당 트래픽량의 확률밀도, 상기 패킷 크기 당 트래픽량의 확률밀도 및 단위 시간당 트래픽량의 확률밀도 중 어느 하나인 것
    인 네트워크 트래픽 모델링 방법.
  10. 네트워크를 통해 전송되는 데이터의 트래픽을 수집하는 수집부;
    상기 수집된 트래픽을 데이터 크기, 패킷 크기 및 IDT 중 어느 하나를 기준으로 하여 트래픽의 밀도값을 추출하고, 원시 도메인 상에서의 확률 밀도 분포를 구하는 추출부; 및
    상기 데이터를 임계값 이상의 상기 밀도값을 가지는 데이터들의 집단인 메이저 데이터셋과 상기 임계값 미만의 데이터 밀도값을 가지는 데이터들의 집단인 마이너 데이터셋으로 분리하고, 상기 메이저 데이터셋을 모델링하여 수학적 분석 모델을 얻는 트래픽 모델링 모듈
    을 포함하는 네트워크 트래픽 모델링 장치.
  11. 제10 항에 있어서,
    상기 메이저 데이터셋, 상기 마이너 데이터셋 및 상기 수학적 분석 모델을 제공 받고 이들 중 적어도 하나를 분석하여 상기 모델링의 반복수행 여부를 판단하고, 반복수행이 필요하다고 판단한 경우에 상기 추출부에 상기 마이너 데이터셋을 제공하는 반복 수행 판단부를 더 포함하는 네트워크 트래픽 모델링 장치.
  12. 제11 항에 있어서,
    상기 추출부는, 반복수행이 필요하다고 판단된 경우, 상기 반복 수행 판단부로부터 상기 마이너 데이터셋을 제공받고, 상기 마이너 데이터셋을 데이터 크기, 패킷 크기 및 IDT 중 어느 하나를 기준으로 하여 트래픽의 밀도값을 추출하고, 원시 도메인 상에서의 확률 밀도 분포를 더 구하는 것
    인 네트워크 트래픽 모델링 장치.
  13. 제11 항에 있어서,
    상기 트래픽 모델링 모듈 또는 상기 반복 수행 판단부로부터 상기 수학적 분석 모델 및 상기 변환 테이블을 제공받아 상기 수학적 분석 모델을 이용하여 데이터 분포를 구하고 이를 상기 변환 테이블을 이용하여 역변환하여 테스트용 재생성 트래픽을 생성하는 재생성부
    를 더 포함하는 네트워크 트래픽 모델링 장치.
  14. 제11 항에 있어서,
    상기 반복 수행 판단부는, 상기 모델링의 반복수행 여부를 판단하기 위하여, 상기 수집된 트래픽과 상기 테스트용 재생성 트래픽을 비교하여 유사도한지 여부를 판단하고, 그 결과에 따라 모델링의 반복수행 여부를 판단하는 것
    인 네트워크 트래픽 모델링 장치.
  15. 제11 항에 있어서,
    상기 반복 수행 판단부는, 상기 메이저 데이터셋의 가장 큰 밀도값과 가장 작은 밀도값의 차이가 상기 임계값과는 다른 기설정한 임계값 이상인 경우, 상기 반복수행을 하는 것으로 판단하는 것
    인 네트워크 트래픽 모델링 장치.
  16. 제11 항에 있어서,
    상기 반복 수행 판단부는, 상기 반복수행을 기본으로 하되, 분리되고 남은 상기 데이터셋의 데이터 밀도의 총합이 미리 정한 값 이하가 되면 상기 반복수행을 종료하는 것으로 판단하는 것
    인 네트워크 트래픽 모델링 장치.
  17. 제13 항에 있어서,
    상기 재생성부는, 반복 수행된 경우, 상기 트래픽 모델링 모듈 또는 상기 반복 수행 판단부로부터 상기 모델링의 반복수행에 따른 둘 이상의 수학적 분석 모델 및 각 분석 모델과 대응하는 변환 테이블을 제공받아, 각 분석 모델에 따른 둘 이상의 재생성 데이터를 생성하고 이들을 통합하여 테스트용 재생성 트래픽을 생성하는 것
    인 네트워크 트래픽 모델링 장치.
  18. 제10 항에 있어서,
    상기 트래픽 모델링 모듈은, 상기 데이터를 상기 임계값 이상의 밀도값을 가지는 데이터들의 집단인 상기 메이저 데이터셋과 상기 임계값 미만의 데이터 밀도값을 가지는 데이터들의 집단인 상기 마이너 데이터셋으로 분리하는 분리부;
    상기 원시 도메인 상의 상기 메이저 데이터셋을, 상기 마이너 데이터셋이 제외되어 이루어진 메이저 데이터셋 도메인상의 데이터셋으로 변환하는 도메인 변환부; 및
    변환된 상기 메이저 데이터셋에 대하여, 그래프 피팅 알고리즘을 적용하여 복수 개의 랜덤 분포 함수의 합으로 표현되는 수학적 분석 모델을 얻는 그래프 피팅부
    를 포함하는 것인 네트워크 트래픽 모델링 장치.
  19. 제18 항에 있어서,
    상기 분리부는, 상기 데이터의 밀도값에 대한 이동 평균값인 이동 평균값을 산출하는 이동 평균 산출부를 포함하고,
    상기 이동 평균값을 상기 임계값으로 하여, 상기 메이저 데이터셋과 상기 마이너 데이터셋으로 분리하는 것
    인 네트워크 트래픽 모델링 장치.
  20. 제18항에 있어서,
    상기 트래픽 모델링 모듈은, 상기 원시 도메인 상의 상기 메이저 데이터 셋이 상기 메이저 데이터셋 도메인 상의 상기 메이저 데이터셋으로 변환되는 관계를 나타내는 변환 테이블을 생성하는 변환 테이블 생성부
    를 더 포함하는 것인 네트워크 트래픽 모델링 장치.

KR1020100058220A 2010-06-18 2010-06-18 네트워크 트래픽 모델링 방법 및 장치 KR20110138092A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020100058220A KR20110138092A (ko) 2010-06-18 2010-06-18 네트워크 트래픽 모델링 방법 및 장치
US13/163,383 US20110310768A1 (en) 2010-06-18 2011-06-17 Method and apparatus for modeling network traffic

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100058220A KR20110138092A (ko) 2010-06-18 2010-06-18 네트워크 트래픽 모델링 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20110138092A true KR20110138092A (ko) 2011-12-26

Family

ID=45328581

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100058220A KR20110138092A (ko) 2010-06-18 2010-06-18 네트워크 트래픽 모델링 방법 및 장치

Country Status (2)

Country Link
US (1) US20110310768A1 (ko)
KR (1) KR20110138092A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102040094B1 (ko) * 2018-10-19 2019-11-05 국방과학연구소 사이버 훈련 시스템에서 인터넷 배경 트래픽 발생을 위한 데이터 구축 방법 및 그 장치

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102014110151B4 (de) * 2014-05-30 2016-12-08 Deutsche Telekom Ag Verfahren zur realitätsnahen Funktionsüberprüfung von Netzwerkkomponenten
US10455445B2 (en) 2017-06-22 2019-10-22 Rosemount Aerospace Inc. Performance optimization for avionic wireless sensor networks
US11153922B2 (en) 2019-10-15 2021-10-19 Rosemount Aerospace, Inc. Directional wireless communications onboard aircraft

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6810246B1 (en) * 2000-10-23 2004-10-26 Verizon Laboratories Inc. Method and system for analyzing digital wireless network performance
US9184929B2 (en) * 2001-11-26 2015-11-10 Arris Enterprises, Inc. Network performance monitoring
US7321555B2 (en) * 2003-04-16 2008-01-22 International Business Machines Corporation Multilevel analysis of self-similar network traffic
US8560670B2 (en) * 2008-01-31 2013-10-15 Centurylink Intellectual Property Llc System and method for characterizing communication network capacity in a geographic area
US8095342B2 (en) * 2008-04-07 2012-01-10 Ciena Corporation Systems and methods for highly efficient bit error rate modeling in quasi-linear communication networks

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102040094B1 (ko) * 2018-10-19 2019-11-05 국방과학연구소 사이버 훈련 시스템에서 인터넷 배경 트래픽 발생을 위한 데이터 구축 방법 및 그 장치

Also Published As

Publication number Publication date
US20110310768A1 (en) 2011-12-22

Similar Documents

Publication Publication Date Title
CN110896381B (zh) 一种基于深度神经网络的流量分类方法、系统及电子设备
CN103077402B (zh) 基于奇异值分解算法的变压器局部放电模式识别方法
CN106648654A (zh) 一种数据感知的Spark配置参数自动优化方法
CN104506378B (zh) 一种预测数据流量的装置及方法
CN110858973A (zh) 小区网络流量预测方法及装置
CN107229702B (zh) 基于低秩约束和多视角特征融合的微视频流行度预测方法
CN106612511B (zh) 一种基于支持向量机的无线网络吞吐量的评估方法及装置
CN110555101A (zh) 一种客服知识库更新方法、装置、设备及存储介质
JP2019511764A (ja) 質問を推薦する方法及び装置
KR20110138092A (ko) 네트워크 트래픽 모델링 방법 및 장치
WO2011113386A2 (zh) 网络流量模拟方法及装置
Wang et al. The influence of sampling unit size and spatial arrangement patterns on neighborhood-based spatial structure analyses of forest stands
CN113449682B (zh) 一种基于动态融合模型识别民航领域射频指纹的方法
WO2011116716A2 (zh) 网络流量的人工合成方法和装置
CN110809066A (zh) IPv6地址生成模型创建方法、装置及地址生成方法
CN110545284A (zh) 一种对抗性网络的域名检测方法及系统
CN113746798A (zh) 基于多维度分析的云网络共享资源异常根因定位方法
CN115795329A (zh) 一种基于大数据网格下的用电异常行为分析方法和装置
CN109542949B (zh) 一种基于形式向量的决策信息系统知识获取方法
CN111598700A (zh) 一种金融风控系统及方法
CN106611021B (zh) 一种数据处理方法和设备
CN112257332B (zh) 一种仿真模型的评估方法及装置
KR20110082915A (ko) 네트워크의 트래픽 모의 및 유사성 검증방법 및 네트워크 트래픽 분석시스템
KR20130139547A (ko) 데이터 샘플링 방법 및 장치
Purnawansyah et al. K-Means clustering implementation in network traffic activities

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application