KR100893026B1 - Ip 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그방법 - Google Patents

Ip 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그방법 Download PDF

Info

Publication number
KR100893026B1
KR100893026B1 KR1020070073216A KR20070073216A KR100893026B1 KR 100893026 B1 KR100893026 B1 KR 100893026B1 KR 1020070073216 A KR1020070073216 A KR 1020070073216A KR 20070073216 A KR20070073216 A KR 20070073216A KR 100893026 B1 KR100893026 B1 KR 100893026B1
Authority
KR
South Korea
Prior art keywords
packet
page
packets
classifying
session
Prior art date
Application number
KR1020070073216A
Other languages
English (en)
Other versions
KR20090010265A (ko
Inventor
장재성
이세정
전승식
김정철
Original Assignee
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 텔레콤주식회사 filed Critical 에스케이 텔레콤주식회사
Priority to KR1020070073216A priority Critical patent/KR100893026B1/ko
Publication of KR20090010265A publication Critical patent/KR20090010265A/ko
Application granted granted Critical
Publication of KR100893026B1 publication Critical patent/KR100893026B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • H04L43/106Active monitoring, e.g. heartbeat, ping or trace-route using time related information in packets, e.g. by adding timestamps

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명은 인터넷 회선을 통해 송수신되는 패킷의 페이지를 분류하는 패킷 분석 장치에 있어서, 인터넷 회선을 통해 송수신되는 패킷을 실시간으로 수집하는 패킷 수집부, 상기 패킷 수집부에서 수집된 패킷에 대해 헤더 정보를 이용하여 소스 IP 주소별 L4 세션 단위의 패킷으로 분리하는 패킷 분류부, 상기 패킷 분류부에서 분리된 L4 세션 단위의 패킷에 대해 패턴 매칭을 이용하여 HTTP 플래그를 인식하고, 상기 인식된 HTTP 플래그를 이용하여 오브젝트로 분류하는 오브젝트 생성부, 상기 오브젝트 생성부에서 분류된 각 오브젝트를 하나의 페이지로 하여 저장하는 저장부로 구성된 것으로서, 인터넷 사용자가 발생시키는 패킷을 수집한 후, 패킷의 응용 계층 정보를 이용하여 페이지를 구분할 수 있다.
패킷, 페이지, IP, TCP

Description

IP 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그 방법{Packet Analysis Apparatus for classifying page of IP packet and thereof method}
본 발명은 인터넷 사용자가 발생시키는 패킷을 수집한 후, 패킷의 L7(응용계층)정보를 이용하여 페이지를 구분하는 IP(Internet Protocol) 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그 방법에 관한 것이다.
이동 통신 단말기는 음성 통신 뿐만 아니라 데이터 통신이 가능해지면서, 무선 인터넷 웹 사이트에 접속하여 각종 자료를 검색하거나 컨텐츠를 다운로드 받을 수 있게 되었다.
여기서, 이동 통신 단말기를 위한 무선 인터넷 전용 웹 사이트는, 피씨용 웹 사이트에 비해서 페이지의 크기만 작을 뿐 HTTP와 동일한 응용 프로토콜을 사용하고 있다. 즉, 테이블 태그(<tr></tr>,<td></td>)를 이용하여 페이지 내의 영역을 구분하고, 그 구분된 영역 내에 각종 이미지, 아이콘 및 선택항목 등을 적절히 배치하는 것이다.
또한, 이동통신 단말기의 화면 사이즈가 커지고 해상도가 높아지면서 컨텐츠의 접속 환경도 웹 페이지의 영역을 구분하여 그 영역내에 각종 링크 이미지와 선택 항목을 배치함으로써 웹 페이지의 모든 영역을 활용할 수 있는 짜임새있는 구성으로 바뀌고 있으며, 각 통신 사업자가 제공하는 인터넷 브라우저를 이용하여 무선 인터넷 서비스를 이용할 수 있도록 되어 있다.
그러나 종래의 L7 프로토콜과 HTTP(hypertext transport protocol)를 사용하는 왑 서비스에서 각 페이지는 하나 이상의 오브젝트로 구성되어 있어 사용자가 페이지를 요청할 때에 하나 이상의 오브젝트가 발생하고, 프로토콜 분석에 의해 오브젝트를 페이지 단위로 분류할 수 없는 한계가 있다.
또한, 현재의 프로토콜에서는 페이지를 구성하는 구성요소에 대한 정보를 제공하지 않기 때문에 네트워크상에서 수집된 패킷 정보를 이용하여 오브젝트의 식별은 가능하지만 페이지의 구분은 불가능한 단점이 있다.
또한, 현재 운영 중인 망(Network)의 운영 상태와 트래픽 특성 파악, 설계 및 계획, 유해한 트래픽 차단 등의 응용 서비스 개발, 과금, QoS(Quality of Service)를 위한 모니터링을 위해서는 트래픽을 페이지 단위로 분류하는 기술이 필요하다.
본 발명의 목적은 네트워크에서 수집되는 오브젝트에 대해 수집 가능한 정보를 조합하여 페이지 단위로 재분류하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그 방법을 제공하는데 있다.
본 발명의 다른 목적은 인터넷 사용자가 발생시키는 패킷을 수집한 후, 패킷의 L7 정보를 이용하여 페이지를 구분하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그 방법을 제공하는데 있다.
본 발명의 또 다른 목적은 왑/웹 서비스의 사용자 사용 패턴의 통계 자료를 추출하여 1회 접속 페이지 횟수, 페이지 탐색시간 등의 서비스 품질 개선 및 운용에 필요한 사용자 기반 정보를 추출하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그 방법을 제공하는데 있다.
상기 목적들을 달성하기 위하여 본 발명의 일 측면에 따르면, 인터넷 회선을 통해 송수신되는 패킷의 페이지를 분류하는 패킷 분석 장치에 있어서, 인터넷 회선을 통해 송수신되는 패킷을 실시간으로 수집하는 패킷 수집부, 상기 패킷 수집부에서 수집된 패킷에 대해 헤더 정보를 이용하여 소스 IP 주소별 L4 세션 단위의 패킷으로 분리하는 패킷 분류부, 상기 패킷 분류부에서 분리된 L4 세션 단위의 패킷에 대해 패턴 매칭을 이용하여 HTTP 플래그를 인식하고, 상기 인식된 HTTP 플래그를 이용하여 오브젝트로 분류하는 오브젝트 생성부 및 상기 오브젝트 생성부에서 분류된 각 오브젝트를 하나의 페이지로 하여 저장하는 저장부를 포함하고,
상기 오브젝트 생성부에서 생성된 각 오브젝트를 시간에 따라 정렬한 후, 페이지 분류 알고리즘을 적용하여 페이지를 분류하는 페이지 분류부를 더 포함하는 것을 특징으로 하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치가 제공된다.
상기 헤더 정보는 IP헤더 정보, TCP 헤더 정보, UDP 헤더 정보 중 적어도 하나이고, 상기 오브젝트 생성부에서 분류된 오브젝트는 HTTP 세션일 수 있다.
상기 페이지 분류부는 상기 오브젝트 생성부에서 생성된 오브젝트를 분석하여 HTTP 헤더 정보를 추출하고, 상기 추출된 HTTP 헤더 정보에 페이지 분류 알고리즘을 적용하여 페이지를 분류하고, 상기 페이지 분류 알고리즘은 상기 오브젝트 생성부에서 생성된 오브젝트를 시작 시간으로 정렬하고, 상태 코드가 유실된 오브젝트는 누락시킨 후, 컨텐츠 타입이 image인 오브젝트는 상위 text 및 application의 오브젝트와 같은 페이지로 하고, 상태 코드가 3**인 오브젝트는 뒤의 오브젝트와 같은 페이지로 하고, 확장자가 wbmp, css, dmf인 오브젝트는 상위 오브젝트와 같은 페이지로 하고, i번째 페이지에 해당하는 오브젝트의 완료 시간과 (i+1)번째 페이지에 해당하는 오브젝트 시작 시간의 차가 0보다 크면 i페이지와 (i+1)페이지는 같은 페이지로 하는 것이다.
본 발명의 다른 측면에 따르면, 인터넷 회선을 통해 송수신되는 패킷에 대해 페이지를 분류하는 방법에 있어서, (a)인터넷 회선에 흐르는 패킷을 실시간으로 수집하여, 소스 IP 주소별로 패킷을 분리하고, (b)상기 분리된 패킷을 발생순서대로 정렬한 후, L4 세션 단위의 패킷으로 분리하고, (c)상기 분리된 L4 세션 단위의 패킷에 대해 패턴 매칭을 이용하여 HTTP 플래그를 인식하고, 상기 인식된 HTTP 플래그를 이용하여 오브젝트로 분류한 후, 저장하는 것을 특징으로 하는 IP 패킷의 페이지 분류 방법이 제공된다.
상기 (b)단계는 상기 분리된 각 패킷에 대해 타임 스탬프를 이용하여 순서대로 정렬하고, 상기 정렬된 패킷이 TCP인 경우, TCP 헤더의 플래그를 이용하여 TCP 세션을 생성하고, UDP인 경우 미리 정해진 타임 아웃을 이용하여 소스 포트, 목적지 포트, 소스 IP 주소가 동일한 패킷을 하나의 UDP 세션으로 생성하는 것을 포함한다.
본 발명의 또 다른 측면에 따르면, 인터넷 회선을 통해 송수신되는 패킷에 대해 페이지를 분류하는 방법에 있어서, (a)인터넷 회선에 흐르는 패킷을 실시간으로 수집하여, 소스 IP 주소별로 패킷을 분리하고, (b)상기 분리된 패킷을 발생순서대로 정렬한 후, L4 세션 단위의 패킷으로 분리하고, (c)상기 분리된 L4 세션 단위의 패킷에 대해 패턴 매칭을 이용하여 HTTP 플래그를 인식하고, 상기 인식된 HTTP 플래그를 이용하여 오브젝트로 분류하고, (d)상기 분류된 각 오브젝트에 대해 페이지 분류 알고리즘을 적용하여 각 오브젝트에 대한 페이지를 분류하여 저장하는 것을 특징으로 하는 IP 패킷의 페이지 분류 방법이 제공된다.
상기 (d)단계는 상기 분류된 각 오브젝트를 분석하여 오브젝트 시작시간/완료시간, 상태 코드, URL 확장자명, 컨텐츠 타입 중 적어도 하나를 포함하는 HTTP 헤더 정보를 추출하고, 각 오브젝트를 상기 추출된 HTTP 헤더 정보에 표시된 오브 젝트 시작 시간순으로 정렬하고, 상태 코드가 유실된 오브젝트는 누락시킨 후, 컨텐츠 타입이 image인 오브젝트는 상위 text 및 application의 오브젝트와 같은 페이지로 하고, 상태 코드가 3**인 오브젝트는 뒤의 오브젝트와 같은 페이지로 하고, 확장자가 wbmp, css, dmf인 오브젝트는 상위 오브젝트와 같은 페이지로 하고, i번째 페이지에 해당하는 오브젝트의 완료 시간과 (i+1)번째 페이지에 해당하는 오브젝트 시작 시간의 차가 0보다 크면 i페이지와 (i+1)페이지는 같은 페이지로 분류하고, 상기 분류된 페이지 정보를 저장하는 것을 포함한다.
상술한 바와 같이 본 발명에 따르면, 인터넷 사용자가 발생시키는 패킷을 수집한 후, 패킷의 L7 정보를 이용하여 페이지를 구분할 수 있는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그 방법을 제공할 수 있다.
또한, 왑/웹 서비스의 사용자 사용 패턴의 통계 자료를 추출하여 1회 접속 페이지 횟수, 페이지 탐색시간 등의 서비스 품질 개선 및 운용에 필요한 사용자 기반 정보를 추출하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그 방법을 제공할 수 있다.
또한, 컨테츠 제공자들이 서비스하는 왑/웹 컨텐츠의 페이지 크기, 평균 페이지 카운트와 같은 왑/웹 서비스에 대한 서비스 제공 현황을 파악할 수 있는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그 방법을 제공할 수 있다.
본 발명의 전술한 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.
도 1은 본 발명에 따른 IP 패킷의 페이지 분류를 위한 시스템을 나타낸 도면이다.
도 1을 참조하면, IP 패킷의 페이지 분류를 위한 시스템은 유무선 인터넷을 통해 통신 단말기(100)로부터 요청된 컨텐츠를 제공하는 컨텐츠 서버(110), 상기 컨텐츠 서버(110)로부터 전송되는 패킷을 실시간으로 수집하여 페이지를 구분하는 패킷 분석 장치(120)를 포함한다.
상기 통신 단말기(100)는 이동통신 단말기, 유선 통신 단말기 등을 말할 수 있다.
상기 패킷 분석 장치(120)는 유무선 인터넷과 컨텐츠 서버(110)사이의 회선에 흐르는 패킷을 수집하여 그 패킷에 대한 페이지를 분류하는 역할을 수행하는 것으로서, 도 2를 참조하여 상세히 설명하기로 한다.
도 2는 본 발명에 따른 패킷 분석 장치의 구성을 개략적으로 나타낸 블럭도이다.
도 2를 참조하면, 패킷 분석 장치는 패킷 수집부(200), 패킷 분류부(210), 오브젝트 생성부(220), 페이지 분류부(230), 저장부(240)를 포함한다.
상기 패킷 수집부(200)는 유무선 인터넷과 컨텐츠 서버사이의 회선에 흐르는 패킷을 실시간으로 수집하여 상기 패킷 분류부(210)에 전송한다.
상기 패킷 분류부(210)는 상기 패킷 수집부(200)에서 수집된 패킷의 IP 헤더와 L4(layer 4) 헤더 정보를 이용하여 패킷을 사용하는 사용자 및 세션을 구분하는 역할을 수행한다.
즉, 상기 패킷 수집부(200)에서 수집된 패킷은 여러 사용자가 동시에 사용하는 다양한 패킷들이 섞여있으므로, 상기 패킷 분류부(210)는 각 패킷의 소스 IP주소를 보고 같은 사용자와 같은 세션 단위로 패킷을 구분한다.
상기 패킷 분류부(210)는 상기 패킷 수집부(200)에서 수집된 패킷을 TCP/IP(Transmission Control Protocol/Internet Protocol), UDP/IP(User Datagram Protocol/Internet Protocol) 단위의 패킷으로 정리한 후, IP 헤더의 소스 IP 주소를 이용하여 같은 소스 IP 주소를 갖는 패킷으로 정리한다.
즉, IP 헤더에는 소스 IP 주소, 목적지 IP 주소 등이 포함되어 있으므로, 상기 패킷 분류부(210)는 패킷의 IP 헤더를 분석하여 소스 IP 주소가 같은 패킷으로 정리한다.
그런 다음 상기 패킷 분류부(210)는 소스 IP 주소별로 정리된 패킷에 대해 타임 스탬프를 이용하여 발생 순서대로 정렬하고, 상기 정렬된 패킷을 분석하여 L4 세션 단위의 패킷(즉, TCP 세션 단위의 패킷 또는 UDP 세션 단위의 패킷)으로 생성한다.
즉, 상기 패킷 분류부(210)는 TCP의 경우 TCP 헤더의 플래그를 이용하여 TCP 세션을 생성하고, UDP의 경우 미리 정해진 일정한 타임 아웃(time-out)에 따라 목적지 IP 주소 단위로 UDP 세션을 생성한다.
다시 말하면, 상기 패킷 분류부(210)는 TCP의 경우 TCP 헤더의 플래그를 분석하여 SYN/ACK-FIN/ACK가 존재하는 영역을 하나의 TCP 세션이라고 판단한다.
상기 오브젝트 생성부(220)는 상기 패킷 분류부(210)에서 사용자 및 세션별로 저장된 패킷에 대해 패턴 매칭 방법을 이용하여 HTTP 플래그를 인식하고, 상기 인식된 HTTP 플래그를 이용하여 오브젝트로 분류한다. 여기서, 하나의 오브젝트는 하나의 HTTP 세션일 수 있다.
즉, 상기 오브젝트 생성부(220)는 상기 패킷 분류부(210)에서 사용자 및 세션별로 저장된 패킷 즉, 상기 패킷 분류부(210)에서 생성된 TCP 세션 또는 UDP 세션 등의 L4 세션 단위의 패킷에서 페이로드(payload) 정보를 추출한 후, 패턴 매칭 방법을 이용하여 HTTP 플래그 정보를 인식하고, 이를 이용하여 하나의 HTTP 세션이라고 할 수 있는 오브젝트로 분류한다.
상기 페이지 분류부(230)는 상기 오브젝트 생성부(220)에서 생성된(분류된) 각 오브젝트를 시간 순으로 정렬한 후, 페이지 분류 알고리즘을 적용하여 페이지를 분류하는 역할을 수행한다.
즉, 상기 페이지 분류부(230)는 상기 오브젝트 생성부(220)에서 분류된 각 오브젝트를 분석하여 HTTP 헤더에서 URL 확장자, 상태 코드, 컨텐츠 타입 등의 정보를 추출한다. 그런 다음 상기 페이지 분류부(230)는 상기 추출된 정보에 페이지 분류 알고리즘을 적용하여 오브젝트를 페이지 단위로 만들고, 상기 만들어진 페이 지 정보를 상기 저장부(240)에 저장한다.
상기 저장부(240)에 저장된 각 패킷에 대한 페이지 정보는 현재 운영 중인 망(Network)의 운영 상태와 트래픽 특성 파악, 설계 및 계획, 유해한 트래픽 차단 등의 응용 서비스 개발, 과금, QoS(Quality of Service)를 위한 모니터링을 위해서 사용된다.
상기 페이지 분류 알고리즘에 대하여 살펴보면, 상기 오브젝트 생성부(220)에서 생성된 오브젝트를 시작 시간으로 정렬하고, 상태 코드가 유실된 오브젝트는 누락시킨 후, 컨텐츠 타입이 image인 오브젝트는 상위 text, application의 오브젝트와 같은 페이지, 상태 코드가 3**인 오브젝트는 뒤의 오브젝트와 같은 페이지, 확장자가 wbmp, css, dmf인 오브젝트는 상위 오브젝트와 같은 페이지, i번째 페이지에 해당하는 오브젝트의 완료 시간과 (i+1)번째 페이지에 해당하는 오브젝트 시작 시간의 차가 0보다 크면 i페이지와 (i+1)페이지는 같은 페이지로 하는 것을 말한다.
상기 페이지 분류부(230)는 상기와 같은 알고리즘을 이용하여 오브젝트를 페이지 단위로 묶고, 그 정보를 상기 저장부(240)에 저장한다.
도 3은 본 발명에 따른 패킷 분석 장치가 IP 패킷에 대해 페이지를 분류하는 방법을 나타낸 흐름도이다.
도 3을 참조하면, 패킷 분석 장치는 인터넷 회선에 흐르는 패킷을 실시간으로 수집하여(S300), 소스 IP 주소가 같은 패킷으로 분리한다(S302).
즉, 상기 패킷 분석 장치는 실시간으로 인터넷 회선에 흐르는 패킷을 수집하 고, 상기 수집된 패킷의 IP 헤더를 분석하여 소스 IP 주소별로 패킷을 묶는다. 다시 말하면, 상기 IP 헤더에는 소스 IP 주소, 목적지 IP주소, 버전, 헤더 길이, 서비스 타입 등의 정보가 등록되어 있으므로, 상기 패킷 분석 장치는 각 패킷의 IP 헤더를 보고 소스 IP 주소별로 패킷을 분리한다.
단계 302의 수행 후, 상기 패킷 분석 장치는 상기 분리된 패킷을 발생순서대로 정렬하고(S304), 상기 정렬된 패킷을 L4 세션 단위의 패킷으로 분리한다(S306).
즉, 상기 패킷 분석 장치는 각 패킷에 있는 타임 스탬프를 이용하여 각 패킷을 순서대로 정렬하고, 각 패킷을 L4 세션 즉, TCP 세션 또는 UDP 세션의 패킷으로 분리한다.
예를 들어, TCP의 경우 TCP 헤더의 플래그를 분석하여 SYN/ACK-FIN/ACK 단위로 TCP 세션을 생성한다. 즉, TCP 헤더는 플래그, 시퀀스 넘버, 소스 포트 번호, 목적지 포트 번호, 헤더 길이 등의 정보로 구성된 것으로서, 상기 패킷 분석 장치는 TCP 헤더 플래그의 SYN/ACK-FIN/ACK단위로 하나의 TCP 세션이라고 판단한다.
또한, UDP의 경우, UDP는 전송품질을 보장해주지 않는 프로토콜이기 때문에 미리 정해진 일정 타임 아웃을 이용하여 소스 포트, 목적지 포트, 소스 IP 주소가 동일한 패킷을 하나의 UDP 세션이라고 판단한다.
단계 306의 수행 후, 상기 패킷 분석 장치는 상기 분리된 각 L4 세션 단위의 패킷에 패턴 매칭 방법을 적용하여 오브젝트(즉, HTTP 세션)로 분리하고(S308), 상기 분리된 오브젝트를 하나의 페이지로 하여 저장한다(S310).
이때, 패킷의 도착 시간을 기준으로 오브젝트(HTTP 세션)의 시작 시간과 완 료 시간도 함께 저장된다.
즉, 각 L4 세션 단위의 패킷은 하나 이상의 오브젝트(HTTP 세션)로 이루어져 있으므로, 상기 패킷 분석 장치는 각 L4 세션 단위의 패킷에 대해 HTTP의 시작과 완료를 나타내는 플래그를 이용한 패턴 매칭 방법을 이용하여 각 L4세션 단위의 패킷을 오브젝트로 분리한다. 상기 분리된 오브젝트는 HTTP 세션일 수 있다.
도 4는 본 발명의 다른 실시예에 따른 패킷 분석 장치가 IP 패킷에 대해 페이지 분류 알고리즘을 적용하여 페이지를 분류하는 방법을 나타낸 흐름도이다.
도 4를 참조하면, 단계 400부터 단계 408의 도 3에 도시된 단계 300부터 단계 308과 같으므로 그 설명은 생략하기로 한다.
단계 408의 수행 후, 패킷 분석 장치는 상기 분리된 오브젝트를 분석하여 HTTP 헤더 정보를 추출한다(S410). 즉, 상기 패킷 분석 장치는 각 오브젝트별 오브젝트 시작시간/완료시간, 상태 코드, URL 확장자명, 컨텐츠 타입 등을 포함하는 HTTP 헤더 정보를 추출한다.
단계 410의 수행 후, 상기 패킷 분석 장치는 상기 추출된 HTTP 헤더 정보에 페이지 분류 알고리즘을 적용하여 각 오브젝트에 대한 페이지를 분류하고(S412), 상기 분류된 페이지 정보를 저장한다(S414).
즉, 상기 패킷 분석 장치는 각 오브젝트를 HTTP 헤더에 표시된 오브젝트 시작 시간 순으로 정렬하고, 상태 코드를 확인하여 상태코드가 유실된 오브젝트는 누락시킨다.
그런 다음 상기 패킷 분석 장치는 컨텐츠 타입이 image인 오브젝트는 상위 text, application의 오브젝트와 같은 페이지로, 상태 코드가 3**인 오브젝트는 뒤의 오브젝트와 같은 페이지, 확장자가 wbmp, css, dmf인 오브젝트는 상위 오브젝트와 같은 페이지, i번째 페이지에 해당하는 오브젝트의 완료 시간과 (i+1)번째 페이지에 해당하는 오브젝트 시작 시간의 차가 0보다 크면 i페이지와 (i+1)페이지는 같은 페이지로 한다.
상태 코드가 3**인 경우는 방향을 재설정하는 항목으로서, 패킷 요청과 응답에 대한 경로가 다를 뿐 하나의 오브젝트를 말하는 것이므로 뒤의 오브젝트와 같은 페이지로 한다.
또한, 확장자가 wbmp, css, dmf인 경우는 이미지 파일을 나타내는 것인데, 패킷 분석 장치가 상기와 같은 확장자의 경우는 이미지로 인식하지 못하기 때문에 별로도 인식하여 페이지를 설정하도록 한다.
또한, i번째 페이지에 해당하는 오브젝트의 완료 시간과 (i+1)번째 페이지에 해당하는 오브젝트 시작 시간의 차가 0보다 큰 경우는 페이지 사이의 시간이 겹치지 않도록 하기 위한 것이다.
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구 범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
이상과 같이, 본 발명에 따른 패킷 분석 장치 및 그 방법은 왑 또는 웹 서비스 사용시 서비스 품질을 개선하고, 서비스 제공 현황을 파악하고자 하는 기술에 적용할 수 있다.
도 1은 본 발명에 따른 IP 패킷의 페이지 분류를 위한 시스템을 나타낸 도면.
도 2는 본 발명에 따른 패킷 분석 장치의 구성을 개략적으로 나타낸 블럭도.
도 3은 본 발명에 따른 패킷 분석 장치가 IP 패킷에 대해 페이지를 분류하는 방법을 나타낸 흐름도.
도 4는 본 발명의 다른 실시예에 따른 패킷 분석 장치가 IP 패킷에 대해 페이지 분류 알고리즘을 적용하여 페이지를 분류하는 방법을 나타낸 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
100 : 통신 단말기 110 : 컨텐츠 서버
120 : 패킷 분석 장치 200 : 패킷 수집부
210 : 패킷 분류부 220 : 오브젝트 생성부
230 : 페이지 분류부 240 : 저장부

Claims (14)

  1. 인터넷 회선을 통해 송수신되는 패킷의 페이지를 분류하는 패킷 분석 장치에 있어서,
    인터넷 회선을 통해 송수신되는 패킷을 실시간으로 수집하는 패킷 수집부;
    상기 패킷 수집부에서 수집된 패킷에 대해 헤더 정보를 이용하여 소스 IP 주소별 L4 세션 단위의 패킷으로 분리하는 패킷 분류부;
    상기 패킷 분류부에서 분리된 L4 세션 단위의 패킷에 대해 패턴 매칭을 이용하여 HTTP 플래그를 인식하고, 상기 인식된 HTTP 플래그를 이용하여 오브젝트로 분류하는 오브젝트 생성부;및
    상기 오브젝트 생성부에서 생성된 각 오브젝트를 하나의 페이지로 하여 저장하는 저장부
    를 포함하는 것을 특징으로 하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치.
  2. 제1항에 있어서,
    상기 헤더 정보는 IP헤더 정보, TCP 헤더 정보, UDP 헤더 정보 중 적어도 하나인 것을 특징으로 하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치.
  3. 제1항에 있어서,
    상기 오브젝트 생성부에서 생성된 오브젝트는 HTTP 세션인 것을 특징으로 하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치.
  4. 제1항에 있어서,
    상기 오브젝트 생성부에서 생성된 각 오브젝트를 분석하여 HTTP 헤더 정보를 추출하고, 상기 추출된 HTTP 헤더 정보에 페이지 분류 알고리즘을 적용하여 페이지를 분류하는 페이지 분류부를 더 포함하는 것을 특징으로 하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치.
  5. 제4항에 있어서,
    상기 HTTP 헤더 정보는 오브젝트 시작시간 및 완료시간, 상태 코드, URL 확장자, 컨텐츠 타입을 포함하는 것을 특징으로 하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치.
  6. 제4항에 있어서,
    상기 페이지 분류 알고리즘은 상기 오브젝트 생성부에서 생성된 오브젝트를 시작 시간으로 정렬하고, 상태 코드가 유실된 오브젝트는 누락시킨 후, 컨텐츠 타입이 image인 오브젝트는 상위 text 및 application의 오브젝트와 같은 페이지로 하고, 상태 코드가 3**인 오브젝트는 뒤의 오브젝트와 같은 페이지로 하고, 확장자가 wbmp, css, dmf인 오브젝트는 상위 오브젝트와 같은 페이지로 하고, i번째 페이 지에 해당하는 오브젝트의 완료 시간과 (i+1)번째 페이지에 해당하는 오브젝트 시작 시간의 차가 0보다 크면 i페이지와 (i+1)페이지는 같은 페이지로 하는 것을 특징으로 하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치.
  7. 제1항에 있어서,
    상기 패킷 분류부는 상기 패킷 수집부에서 수집된 패킷을 IP 헤더의 소스 IP 주소를 이용하여 같은 소스 IP 주소를 갖는 패킷으로 정리하고, 소스 IP 주소별 패킷을 타임 스탬프를 이용하여 발생 순서대로 정렬한 후, L4 세션 단위의 패킷으로 분류하는 것을 특징으로 하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치.
  8. 제1항에 있어서,
    상기 L4 세션 단위의 패킷은 TCP 세션 단위의 패킷 또는 UDP 세션 단위의 패킷인 것을 특징으로 하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치.
  9. 제1항에 있어서,
    상기 패킷 분류부는 L4가 TCP인 경우 TCP 헤더의 플래그를 이용하여 TCP 세션을 생성하고, UDP인 경우 미리 정해진 일정한 타임 아웃(time-out)에 따라 목적지 IP 주소 단위로 UDP 세션을 생성하는 것을 특징으로 하는 IP 패킷의 페이지 분류를 위한 패킷 분석 장치.
  10. 인터넷 회선을 통해 송수신되는 패킷에 대해 페이지를 분류하는 방법에 있어서,
    (a)인터넷 회선에 흐르는 패킷을 실시간으로 수집하여, 소스 IP 주소별로 패킷을 분리하는 단계;
    (b)상기 분리된 패킷을 발생순서대로 정렬한 후, L4 세션 단위의 패킷으로 분리하는 단계;및
    (c)상기 분리된 L4 세션 단위의 패킷에 대해 패턴 매칭을 이용하여 HTTP 플래그를 인식하고, 상기 인식된 HTTP 플래그를 이용하여 오브젝트로 분류한 후, 저장하는 단계
    를 포함하는 것을 특징으로 하는 IP 패킷의 페이지 분류 방법.
  11. 제10항에 있어서,
    상기 (b)단계는,
    상기 분리된 각 패킷에 대해 타임 스탬프를 이용하여 순서대로 정렬하는 단계;
    상기 정렬된 패킷이 TCP인 경우, TCP 헤더의 플래그를 이용하여 TCP 세션을 생성하고, UDP인 경우 미리 정해진 타임 아웃을 이용하여 소스 포트, 목적지 포트, 소스 IP 주소가 동일한 패킷을 하나의 UDP 세션으로 생성하는 단계를 포함하는 것을 특징으로 하는 IP 패킷의 페이지 분류 방법.
  12. 제10항에 있어서,
    상기 (c)단계에서 분류된 오브젝트를 저장함에 있어서, 해당 패킷의 도착 시간을 기준으로 오브젝트의 시작 시간과 완료시간도 함께 저장하는 것을 특징으로 하는 IP 패킷의 페이지 분류 방법.
  13. 인터넷 회선을 통해 송수신되는 패킷에 대해 페이지를 분류하는 방법에 있어서,
    (a)인터넷 회선에 흐르는 패킷을 실시간으로 수집하여, 소스 IP 주소별로 패킷을 분리하는 단계;
    (b)상기 분리된 패킷을 발생순서대로 정렬한 후, L4 세션 단위의 패킷으로 분리하는 단계;
    (c)상기 분리된 L4 세션 단위의 패킷에 대해 패턴 매칭을 이용하여 HTTP 플래그를 인식하고, 상기 인식된 HTTP 플래그를 이용하여 오브젝트로 분류하는 단계;및
    (d)상기 분류된 각 오브젝트에 대해 페이지 분류 알고리즘을 적용하여 각 오브젝트에 대한 페이지를 분류하여 저장하는 단계
    를 포함하는 것을 특징으로 하는 IP 패킷의 페이지 분류 방법.
  14. 제13항에 있어서,
    상기 (d)단계는,
    상기 분류된 각 오브젝트를 분석하여 오브젝트 시작시간/완료시간, 상태 코드, URL 확장자명, 컨텐츠 타입 중 적어도 하나를 포함하는 HTTP 헤더 정보를 추출하는 단계;
    각 오브젝트를 상기 추출된 HTTP 헤더 정보에 표시된 오브젝트 시작 시간순으로 정렬하고, 상태 코드가 유실된 오브젝트는 누락시킨 후, 컨텐츠 타입이 image인 오브젝트는 상위 text 및 application의 오브젝트와 같은 페이지로 하고, 상태 코드가 3**인 오브젝트는 뒤의 오브젝트와 같은 페이지로 하고, 확장자가 wbmp, css, dmf인 오브젝트는 상위 오브젝트와 같은 페이지로 하고, i번째 페이지에 해당하는 오브젝트의 완료 시간과 (i+1)번째 페이지에 해당하는 오브젝트 시작 시간의 차가 0보다 크면 i페이지와 (i+1)페이지는 같은 페이지로 분류하는 단계;및
    상기 분류된 페이지 정보를 저장하는 단계를 포함하는 것을 특징으로 하는 IP 패킷의 페이지 분류 방법.
KR1020070073216A 2007-07-23 2007-07-23 Ip 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그방법 KR100893026B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070073216A KR100893026B1 (ko) 2007-07-23 2007-07-23 Ip 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070073216A KR100893026B1 (ko) 2007-07-23 2007-07-23 Ip 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그방법

Publications (2)

Publication Number Publication Date
KR20090010265A KR20090010265A (ko) 2009-01-30
KR100893026B1 true KR100893026B1 (ko) 2009-04-15

Family

ID=40489467

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070073216A KR100893026B1 (ko) 2007-07-23 2007-07-23 Ip 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그방법

Country Status (1)

Country Link
KR (1) KR100893026B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101042416B1 (ko) * 2009-04-29 2011-06-16 주식회사 케이티 무선 데이터 서비스 모니터링 장치 및 무선 데이터 서비스 모니터링 방법
KR101505845B1 (ko) 2014-02-04 2015-03-26 한국전자통신연구원 패킷 처리 장치 및 방법
KR101996044B1 (ko) * 2017-11-27 2019-07-03 (주) 시스메이트 암호화 트래픽의 네트워크 포렌식 서비스 제공을 위한 icap 프로토콜 확장 방법과 이를 지원하는 네트워크 포렌식 장치 및 웹 프락시

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020035840A (ko) * 2000-05-24 2002-05-15 소프트컴 컴퓨터스 리미티드 인터넷 통신 감시 방법
KR20030016037A (ko) * 2001-08-20 2003-02-26 엔에이치엔(주) 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치
KR20060018630A (ko) * 2004-08-25 2006-03-02 한국전자통신연구원 무선 접속 단말 장치 및 이를 이용하는 무선 접속 관리 방법
US20060098643A1 (en) 2004-11-05 2006-05-11 Howard Pfeffer System and method for providing premium transport in a DOCSIS-compliant cable network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020035840A (ko) * 2000-05-24 2002-05-15 소프트컴 컴퓨터스 리미티드 인터넷 통신 감시 방법
KR20030016037A (ko) * 2001-08-20 2003-02-26 엔에이치엔(주) 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치
KR20060018630A (ko) * 2004-08-25 2006-03-02 한국전자통신연구원 무선 접속 단말 장치 및 이를 이용하는 무선 접속 관리 방법
US20060098643A1 (en) 2004-11-05 2006-05-11 Howard Pfeffer System and method for providing premium transport in a DOCSIS-compliant cable network

Also Published As

Publication number Publication date
KR20090010265A (ko) 2009-01-30

Similar Documents

Publication Publication Date Title
CN105578488B (zh) 网络数据采集系统及方法
CN102307123B (zh) 基于传输层流量特征的nat流量识别方法
CN101827084B (zh) 网络设备的高效的应用程序识别
US7729279B2 (en) Traffic analysis on high-speed networks
CN102523241A (zh) 基于决策树高速并行处理的网络流量在线分类方法及装置
CN107426059B (zh) Dpi设备特征库自动更新方法、系统、dpi设备及云端服务器
US20080195731A1 (en) Distributed Traffic Analysis
Choi et al. Content-aware internet application traffic measurement and analysis
CN104125167A (zh) 一种流量控制方法和装置
CN102724317A (zh) 一种网络数据流量分类方法和装置
CN106789242A (zh) 一种基于手机客户端软件动态特征库的识别应用智能分析引擎
Aureli et al. Going beyond diffserv in ip traffic classification
CN114611576B (zh) 电网中终端设备的精准识别方法
KR100893026B1 (ko) Ip 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그방법
CN109450733A (zh) 一种基于机器学习的网络终端设备识别方法及系统
US10977252B2 (en) Monitoring network traffic to determine similar content
CN102648604B (zh) 借助于描述性的元数据监测网络通信量的方法
CN102984162B (zh) 可信网站的识别方法和收集系统
CN101764754B (zh) 基于dpi和dfi的业务识别系统中的样本获取方法
Shamsimukhametov et al. Are neural networks the best way for encrypted traffic classification?
KR101344398B1 (ko) 애플리케이션 인지와 트래픽 제어를 위한 라우터 장치 및 그 방법
CN108199906B (zh) 一种sdn构架中异常流量处理方法、装置和用户终端
CN107360062B (zh) Dpi设备识别结果的验证方法、系统及dpi设备
KR20210070597A (ko) 트래픽 분류 방법 및 장치
KR20050085208A (ko) 디지털 통신 데이터에 액션을 트리거링 하기 위한 방법 및컴퓨터 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120402

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130401

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170329

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180329

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190401

Year of fee payment: 11