KR20190088174A - 가중치 선택 신경망을 이용한 Wi-Fi 망의 침입 탐지 방법 및 장치 - Google Patents

가중치 선택 신경망을 이용한 Wi-Fi 망의 침입 탐지 방법 및 장치 Download PDF

Info

Publication number
KR20190088174A
KR20190088174A KR1020180006369A KR20180006369A KR20190088174A KR 20190088174 A KR20190088174 A KR 20190088174A KR 1020180006369 A KR1020180006369 A KR 1020180006369A KR 20180006369 A KR20180006369 A KR 20180006369A KR 20190088174 A KR20190088174 A KR 20190088174A
Authority
KR
South Korea
Prior art keywords
neural network
artificial neural
intrusion detection
decision tree
feature
Prior art date
Application number
KR1020180006369A
Other languages
English (en)
Other versions
KR102085415B1 (ko
Inventor
김광조
아미난토 무하마드 에르자
해리 타누위드자자
최락용
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020180006369A priority Critical patent/KR102085415B1/ko
Publication of KR20190088174A publication Critical patent/KR20190088174A/ko
Application granted granted Critical
Publication of KR102085415B1 publication Critical patent/KR102085415B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • H04W12/121Wireless intrusion detection systems [WIDS]; Wireless intrusion prevention systems [WIPS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Molecular Biology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법 및 시스템이 제시된다. 본 발명에서 제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법은 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계, 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 단계 및 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 단계를 포함한다.

Description

가중치 선택 신경망을 이용한 Wi-Fi 망의 침입 탐지 방법 및 장치{Method and Apparatus of Intrusion Detection for Wi-Fi Network Based on Weight-Selected Neural Networks}
본 발명은 가중치 선택 신경망에 대한 Wi-Fi 침입 탐지 방법 및 시스템에 관한 것이다.
무선 모바일 사용자의 무선 네트워크 트래픽은 날마다 빠른 속도로 증가하고 있다. 종래 기술에 따르면 무선 네트워크 트래픽은 2020년까지 총 인터넷 트래픽의 3 분의 2를 차지할 것으로 예상된다. IP 트래픽의 66%가 Wi-Fi 및 셀룰러 장치로부터 발생할 것으로 예상된다. Wi-Fi 네트워크(IEEE 802.11)가 고속 로컬 영역 연결을 위해 널리 배치되면서 공격(attack)의 수가 기하 급수적으로 증가하였다. 그러나 알려진 Wi-Fi 공격과 알려지지 않은 Wi-Fi 공격을 모두 탐지할 수 있는 일반적인 모델은 문헌에서 보고되지 않았다. 침입 탐지 시스템(Intrusion Detection System; IDS)은 모든 네트워크 보안 인프라에 대한 가장 일반적인 구성 요소 중 하나이다. 기계 학습 기술은 모델-프리(model-free) 특성으로 인해 IDS의 주요 탐지 알고리즘으로 널리 채택되어왔다. 최근의 기계 학습 방법을 활용하면 기존의 IDS 모델 특히, 대규모 네트워크에서의 Wi-Fi 공격 탐지에 상당한 개선이 있을 것으로 생각된다.
Wi-Fi 네트워크에서 컴퓨팅 장치가 확산되면 복잡하고 크고 고차원인 데이터가 출력되므로 공격 탐지 작업이 어려워진다. 특장점 선택 기술은 기존 기계 학습 기반 IDS의 성능을 향상시킬 수 있다고 생각한다. 이 연구의 주요 기여는 경량 기계 학습 모델에서 오는 각 특장점의 가중치를 고려한 새로운 특장점 선택 기반 방식의 도입이다. 기존의 기계 학습자인 인공신경망(Artificial Neural Network; ANN) 및 C4.5 결정 트리는 각 인스턴스를 데이터의 관련 정보로 분류할 수 있다. 이 관련 정보는 노드 또는 뉴런의 가중치로 표시된다. 트레이닝된 모델의 가중치는 해당 입력이 얼마나 중요한지를 나타낸다. 우리는 해당 가중치에 따라 가장 적합한 특장점을 선택한다. 선택된 특장점의 작은 세트는 실시간 프로세스에 필수적일 뿐만 아니라, Wi-Fi 네트워크의 대규모 특성에도 적합하다. 제안된 방법은 인공신경망을 특장점 분류에 활용하고 최소한의 특장점만 사용하여 IDS 모델을 구축함으로써 종료된다.
이러한 종래기술에 있어서, 위장 공격 탐지를 포함한 전반적인 탐지율을 향상시키는 것을 필요로 한다. 최근에는 AWID 데이터 세트를 이용하여 전반적인 탐지율을 성공적으로 향상시켰다.
사물 인터넷 시대로의 진화에 따른 IP 트래픽은 무선 근거리 망에서 발생하고 이러한 무선 망의 특성상 주입 공격, 위장 공격, 대량 트래픽 주입 공격 등이 대단히 용이하다. 따라서, 이를 방지하기 위한 침입 탐지 시스템(Intrusion Detection System, IDS)은 컴퓨터 또는 네트워크 내에 설치되어 컴퓨터 또는 네트워크에서의 보안 정책 위반, 외부의 악의적인 행동 또는 공격을 지속적으로 탐지하고자 하는 장치가 필요하다. 이에, 무선 근거리 망에서 각종 공격을 효율적이고 효과적으로 탐지하는 침입 탐지 시스템은 대단히 중요하다.
본 발명이 이루고자 하는 기술적 과제는 로 특장점보다 적은 새로 생성된 특장점을 위해 결정 트리 및 인공신경망을 이용한 가중 특장점 선택 방법을 이용하고, 인공신경망을 최종 분류에 이용함으로써 완벽한 Wi-Fi 공격 탐지를 달성하기 위한 방법 및 시스템을 제공하는데 있다.
일 측면에 있어서, 본 발명에서 제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법은 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계, 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 단계 및 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 단계를 포함한다.
상기 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계는 인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택한다.
특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용하고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초하고, 상기 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타낸다.
상기 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계는 C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택하고, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택한다.
상기 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 단계는 인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용한다.
또 다른 일 측면에 있어서, 본 발명에서 제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 시스템은 데이터 표준화 및 임계값 조정에 따른 가중치에 기반하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 특장점 선택부, 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 인공신경망 분류부 및 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 네트워크 테스트부를 포함한다.
상기 특장점 선택부는 인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택한다.
특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용하고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초하고, 상기 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타낸다.
상기 특장점 선택부는 C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택하고, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택한다.
상기 인공신경망 분류부는 인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용한다.
본 발명의 실시예들에 따르면 결정 트리 및 인공신경망을 이용한 가중 특장점 선택 방법을 이용하여 로 특장점보다 적은 특장점을 새로 생성하고, 인공신경망을 최종 분류에 이용함으로써 완벽한 Wi-Fi 공격 탐지를 달성하기 위한 방법 및 시스템을 제공하는데 있다.
도 1은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 과정을 설명하기 위한 개략도이다.
도 2는 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법의 더욱 구체적인 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 인공신경망을 이용한 특장점 선택 방법을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 결정 트리를 이용한 특장점 선택 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 시스템의 구성을 나타내는 도면이다.
IoT 장치로 인하여 일상 생활에서 광범위한 컴퓨팅이 가능하게 됨으로써 점점 더 많은 장치가 Wi-Fi 네트워크를 통해 연결된다. Wi-Fi 네트워크에 대한 공개 액세스는 공격으로 변환될 수 있는 악용 가능한 취약성을 야기한다. Wi-Fi 네트워크 공격 탐지는 여전히 어려운 작업이다. 또한, Wi-Fi 네트워크를 통해 연결된 IoT 장치의 보급은 복잡하고 대규모이며 고차원 데이터이므로 실시간 탐지가 어려워진다. 최상의 특장점을 선택하는 것은 특장점 분류의 성능을 향상시키는 데 중요한 기여 중 하나이다.
본 발명에서는 기존의 기계 학습자의 특장점 가중치 방법을 검토하고 Wi-Fi 네트워크 공격 특장점을 정확하게 선택할 수 있는지 알아본다. 이에 따라 일반적인 신경망을 사용하여 선택된 특장점의 유용성을 테스트하고 검증한다. 제안된 가중 기반 기계 학습 모델은 종래기술에 따른 다른 필터 기반 특장점 선택 모델보다 우월함을 보여준다.
본 발명의 일 실시예에 따른, 잘 알려진 Wi-Fi 네트워크 벤치 마크 데이터 세트인 AWID(Aegean Wi-Fi Intrusion Dataset)에서 제안된 모델을 평가한다. 경험적인 방식으로 데이터 세트에서 다수의 기존 기계 학습 모델을 테스트하였다. 제안된 방법은 99.97%의 탐지율, 99.74%의 정확도 및 0.41%의 오탐율로 기존 최첨단 IDS보다 성능이 우수하다. 가중치 기반 특장점 선택과 인공신경망 분류부를 결합하는 새로운 방법은 위장 공격 탐지 능력을 향상시키고, 대규모 Wi-Fi 네트워크에서 알려진 공격 유형과 알려지지 않은 다양한 공격 유형에 대해 더욱 일반화될 수 있다. 이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 과정을 설명하기 위한 개략도이다.
제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법은 지도 특장점 선택(Supervised Feature Selection)으로 인공신경망과 결정 트리를 이용하고 가중치로 학습을 수행하는 단계와 인공신경망을 이용한 신경망 분류 단계의 두 단계로 크게 나눌 수 있다.
먼저, 입력 데이터(110)를 입력 받아 154 특장점들(111)에 대한 가중치 특장점 선택(120)을 수행한다. 이후, 10-15 결합 특장점들(121)에 대하여 신경망 분류부(130)를 통한 분류를 수행한다. 분류된 특장점에 대하여 IDS 행렬을 계산하고, 분류된 특장점을 이용하여 실제 네트워크(140)로 테스트를 수행한다.
다시 말해, 제안된 제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법에는 두 가지 주요 단계가 존재한다. 특장점 선택 및 특장점 분류이다. 특장점 선택은 로 특장점 공간(raw feature space)에서 다양한 특장점을 선택하기 위해 수행된다. 새로 생성된 특장점들은 변형없이 로 특장점에서 간단히 선택된다. 특장점 선택은 로 특장점보다 적은 새로 생성된 특장점을 목표로 한다. 본 발명의 실시예에 따르면, 인공신경망과 C4.5를 사용하여 가중치 특장점 선택 방법을 이용한다. 뿐만 아니라, 인공신경망은 최종 단계에서 특장점 분류에도 사용된다. 알고리즘 1은 제안된 방법의 절차를 설명한다.
Figure pat00001
도 2는 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법을 설명하기 위한 흐름도이다.
제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법은 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계(210), 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 단계(220) 및 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 단계(230)를 포함한다.
단계(210)에서, 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택한다.
본 발명의 실시예에 따른 인공신경망을 이용하여 특장점을 선택하는 과정에서, 인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택한다. 이때, 특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용한다. 그리고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초한다. 여기서, 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타낸다.
본 발명의 실시예에 따른 결정트리를 이용하여 특장점을 선택하는 과정에서, C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택한다. 이후, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택한다.
단계(220)에서, 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류한다. 본 발명의 실시예에 따르면, 인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수(minimum global error function)가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용한다.
마지막으로 단계(230)에서, 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트한다.
도 3은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법의 더욱 구체적인 흐름도이다.
먼저, 입력 데이터에 대하여 초기화(311)를 수행하고, 초기화된 입력 데이터의 154 특장점 로 데이터세트(312)에 대하여 데이터 세트 표준화(313)를 수행한다.
입력 데이터는 일반적으로 다양한 값, 이산적, 연속적, 상징적이며 유연한 값의 범위를 가질 수 있다. 이러한 데이터의 특성으로 인해 본 발명의 실시예에 따른 특장점 분류부는 기본 패턴을 올바르게 학습할 수 없다. 따라서 정규화 단계가 필요하다.
모든 값은 실수인 동일한 유형으로 변환된다. 문자 유형이 있는 경우 하나의 단어를 하나의 숫자로 나타내어 실수로 변환할 수 있다. 다음 수식을 이용하여 0과 1 사이의 값으로 표준화 한다.
Figure pat00002
표준화 이후, 154 특장점 표준화된 데이터 세트(314)에 대해 특장점 선택을 수행하기 위한 임계값을 조정(315)한다. 특장점 선택 출력에 대한 임계값 조정하면 선택 특장점의 수가 달라질 수 있다.
본 발명의 실시예에 따른 특장점 선택 방법은, 결정 트리를 이용한 특장점선택 방법(316) 및 인공신경망을 이용한 특장점 선택 방법(317)의 두 방법이 있다. 각 특장점 선택을 출력으로 10-15 선택된 특장점1(318) 및 10-15 선택된 특장점2(319)를 출력할 수 있다.
도 4는 본 발명의 일 실시예에 따른 인공신경망을 이용한 특장점 선택 방법을 설명하기 위한 도면이다.
특장점 선택은 로 특장점 공간에서만 몇몇 특장점을 선택한다. 따라서 새로운 생성된 특장점은 변형되지 않은 로 특장점에서만 선택된다. 본 발명의 실시예에 따른 인공신경망을 이용하는 경우, 인공신경망 학습의 경험적 가중치를 기반으로 위장 공격 모델(Impersonation Attack model)을 학습하는데 중요한 몇 가지 특장점을 선택할 수 있다.
인공신경망을 이용함으로써 제안하는 모델은 특장점의 서브 세트를 선택할 수 있다. 이러한 특장점은 인공신경망 학습의 경험적 가중치를 기반으로 공격 모델을 학습하기 위해 중요하다. 도 4는 이러한 인공신경망 모델을 보여주며 여기서, b 1b 2는 각각 입력 레이어(x1, x2, x3)(410)에 대한 해당 히든 레이어(hidden layer)(H1, H2, H3)(420)의 바이어스 값을 나타낸다.
제1 히든 레이어(H1)를 특장점 선택에만 사용하고 중요한 입력 특장점을 선택하기 위해 처음 두 레이어, 다시 말해 제1 히든 레이어(H1) 및 제2 히든 레이어(H2) 사이의 가중치를 고려한다. 가중치는 제1 히든 레이어(H1) 특장점에 대한 입력 특장점의 기여도를 나타낸다. W ij 에 대해 0에 가까운 값은 다음 히든 레이어(Hi)
Figure pat00003
에 대해 해당 입력 특장점 X j 가 의미가 없음을 나타낸다. 따라서 제1 히든 레이어(H1)에서만 가중치를 고려하기 때문에 하나의 히든 레이어로 충분하다. 각 입력 특장점의 중요한 값을 하기식과 같이 정의한다.
Figure pat00004
위 식에서, h 는 제1 히든 레이어의 뉴런 수이다. 가장 중요한 특장점을 선택하기 위해 V j 값에 따라 입력 특장점을 내림차순으로 정렬한다. 알고리즘2에서 설명한 것과 같이 임계값보다 큰 V j 값을 갖는 일부 특장점을 선택한다. 이후, 히든 레이어의 바이어스 값 b 2 에 따른 출력 레이어(430)를 출력한다.
Figure pat00005
도 5는 본 발명의 일 실시예에 따른 결정 트리를 이용한 특장점 선택 방법을 설명하기 위한 도면이다.
의사 결정 트리는 분류 작업을 위해 구현된 가장 보편적인 방법 중 하나이다. 본 발명에서는 C4.5 결정 트리를 이용한다. C4.5 의사 결정 트리는 노이즈 데이터로부터 강건하며 분류 표현을 학습할 수 있다. 이러한 결정 트리에는 k-ary 트리 구조가 존재하고, 트리 내부의 각 노드는 입력 표현 데이터의 여러 속성에 대한 테스트를 표현한다. 트리에서 내려오는 모든 브랜치(branch)는 해당 노드에 있는 특장점의 가능한 값과 다른 테스트 결과를 나타낸다. 기본적으로, C4.5 의사 결정 트리는 하향식 재귀적 분할 정복 접근법(top-down recursive divide-and-conquer approach)으로 트리를 구성하기 위해 그리디(greedy) 알고리즘을 사용한다. 분류에 대한 중요한 정보를 생성하는 최상의 속성을 선택하고 해당 속성에 대한 테스트 노드를 생성하는 것은 C4.5 알고리즘의 시작이다. 이후, 상위 노드에 존재하는 테스트 속성에 따라 그들의 값을 기반으로 데이터를 분류한다. 알고리즘은 미리 정의된 임계 값을 기반으로 모든 데이터가 동일한 클래스로 그룹화되거나 추가적인 분류를 추가하는 프로세스가 분류 성능을 향상시키지 않게 되면 종료된다. 특장점 선택 프로세스는 알고리즘 3에서 설명한바와 같이 상위 3개 노드를 선택함으로써 시작된다. 이후, 동일한 노드를 제거하고 선택된 특장점 목록을 업데이트한다.
Figure pat00006
결정 트리를 이용한 10-15 선택된 특장점1(318) 및 인공신경망을 이용한 10-15 선택된 특장점2(319)를 수집한 후, 이를 인공신경망 분류부로 전달하여 특장점을 분류(320)한다.
인공신경망을 가중치 특장점 선택을 위해 사용하는 것 외에도, 인공신경망을 특장점 분류에 사용한다. 인공신경망은 가장 널리 사용되는 패턴 인식 알고리즘 중 하나이다. 인공신경망을 사용하여 학습할 때, 최소 전역 오류 함수(minimum global error function)가 실행된다. 지도 방식(supervised)과 비지도 방식(unsupervised)의 두 가지 접근 방식이 있다. 본 발명에서는 지도 인공신경망을 사용하고, 대규모 문제에 적합하도록 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)와 함께 이를 활용한다.
분류된 특장점에 대하여 IDS 행렬을 계산(330)하고, IDS 행렬은 DR, FAR, Acc, Fscore 및 시간을 포함한다.
이후, 특장점의 임계값을 비교(340)하여 Fscore가 미리 정해진 Fscore 임계 값보다 크거나 같은 경우, 분류된 특장점을 이용하여 실제 네트워크로 테스트(341)하고, 반면에 미리 정해진 F-score 임계 값보다 작은 경우, 단계(315)로 이동한다.
도 6은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 시스템의 구성을 나타내는 도면이다.
제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 시스템은 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 특장점 선택부(610), 인공신경망 분류부(620) 및 네트워크 테스트부(630)를 포함한다. 특장점 선택부(610), 인공신경망 분류부(620) 및 네트워크 테스트부(630)는 도 2의 단계들(210~230)을 수행하기 위해 구성될 수 있다.
특장점 선택부(610)는 데이터 표준화 및 임계값 조정에 따른 가중치에 기반하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택한다.
본 발명의 실시예에 따른 인공신경망을 이용하여 특장점을 선택하는 과정에서, 인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택한다. 이때, 특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용한다. 그리고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초한다. 여기서, 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타낸다.
본 발명의 실시예에 따른 결정트리를 이용하여 특장점을 선택하는 과정에서, C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택한다. 이후, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택한다.
더욱 상세하게는, 먼저 입력 데이터에 대하여 초기화를 수행하고, 초기화된 입력 데이터의 154 특장점 로데이터세트에 대하여 데이터 세트 표준화를 수행한다.
입력 데이터는 일반적으로 다양한 값, 이산적, 연속적, 상징적이며 유연한 값의 범위를 가질 수 있다. 이러한 데이터의 특성으로 인해 본 발명의 실시예에 따른 특장점 분류부는 기본 패턴을 올바르게 학습할 수 없다. 따라서 정규화 단계가 필요하다.
모든 값은 실수인 동일한 유형으로 변환된다. 문자 유형이 있는 경우 하나의 단어를 하나의 숫자로 나타내어 실수로 변환할 수 있다. 다음 수식을 이용하여 0과 1 사이의 값으로 표준화 한다.
Figure pat00007
표준화 이후, 154 특장점 표준화된 데이터 세트에 대해 특장점 선택을 수행하기 위한 임계값을 조정한다. 특장점 선택 출력에 대한 임계값 조정하면 선택 특장점의 수가 달라질 수 있다.
본 발명의 실시예에 따른 특장점 선택 방법은, 결정 트리를 이용한 특장점선택 방법 및 인공신경망을 이용한 특장점 선택 방법의 두 방법이 있다. 각 특장점 선택을 출력으로 10-15 선택된 특장점1 및 10-15 선택된 특장점2를 출력할 수 있다.
결정 트리를 이용한 10-15 선택된 특장점1 및 인공신경망을 이용한 10-15 선택된 특장점2를 수집한 후, 이를 인공신경망 분류부로 전달하여 특장점을 분류한다.
인공신경망 분류부(620)는 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류한다.
본 발명의 실시예에 따르면, 인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수(minimum global error function)가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용한다.
인공신경망을 가중치 특장점 선택을 위해 사용하는 것 외에도, 인공신경망을 특장점 분류에 사용한다. 인공신경망은 가장 널리 사용되는 패턴 인식 알고리즘 중 하나이다. 인공신경망을 사용하여 학습할 때, 최소 전역 오류 함수(minimum global error function)가 실행된다. 지도 방식(supervised)과 비지도 방식(unsupervised)의 두 가지 접근 방식이 있다. 본 발명에서는 지도 인공신경망을 사용하고, 대규모 문제에 적합하도록 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)와 함께 이를 활용한다.
이후, 특장점의 임계값을 비교하여 Fscore가 미리 정해진 Fscore 임계 값보다 크거나 같은 경우, 분류된 특장점을 이용하여 실제 네트워크로 테스트하고, 반면에 미리 정해진 Fscore 임계 값보다 작은 경우, 특장점 선택을 수행하기 위한 임계값을 조정 단계로 이동한다.
네트워크 테스트부(630)는 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트한다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (10)

  1. 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계;
    결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 단계; 및
    분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 단계
    를 포함하는 Wi-Fi 침입 탐지 방법.
  2. 제1항에 있어서,
    상기 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계는,
    인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택하는
    Wi-Fi 침입 탐지 방법.
  3. 제2항에 있어서,
    특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용하고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초하고, 상기 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타내는
    Wi-Fi 침입 탐지 방법.
  4. 제1항에 있어서,
    상기 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계는,
    C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택하고, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택하는
    Wi-Fi 침입 탐지 방법.
  5. 제1항에 있어서,
    상기 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 단계는,
    인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용하는
    Wi-Fi 침입 탐지 방법.
  6. 데이터 표준화 및 임계값 조정에 따른 가중치에 기반하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 특장점 선택부;
    결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 인공신경망 분류부; 및
    분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 네트워크 테스트부
    를 포함하는 Wi-Fi 침입 탐지 시스템.
  7. 제6항에 있어서,
    상기 특장점 선택부는,
    인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택하는
    Wi-Fi 침입 탐지 시스템.
  8. 제7항에 있어서,
    특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용하고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초하고, 상기 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타내는
    Wi-Fi 침입 탐지 시스템.
  9. 제6항에 있어서,
    상기 특장점 선택부는,
    C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택하고, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택하는
    Wi-Fi 침입 탐지 시스템.
  10. 제6항에 있어서,
    상기 인공신경망 분류부는,
    인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용하는
    Wi-Fi 침입 탐지 시스템.
KR1020180006369A 2018-01-18 2018-01-18 가중치 선택 신경망을 이용한 Wi-Fi 망의 침입 탐지 방법 및 장치 KR102085415B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180006369A KR102085415B1 (ko) 2018-01-18 2018-01-18 가중치 선택 신경망을 이용한 Wi-Fi 망의 침입 탐지 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180006369A KR102085415B1 (ko) 2018-01-18 2018-01-18 가중치 선택 신경망을 이용한 Wi-Fi 망의 침입 탐지 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20190088174A true KR20190088174A (ko) 2019-07-26
KR102085415B1 KR102085415B1 (ko) 2020-03-05

Family

ID=67469925

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180006369A KR102085415B1 (ko) 2018-01-18 2018-01-18 가중치 선택 신경망을 이용한 Wi-Fi 망의 침입 탐지 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102085415B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102184395B1 (ko) * 2020-05-06 2020-11-30 호서대학교 산학협력단 결정트리 및 심층신경망을 이용한 대량의 데이터를 분류하기 위한 장치, 이를 위한 방법 및 이 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
CN117081858A (zh) * 2023-10-16 2023-11-17 山东省计算中心(国家超级计算济南中心) 一种基于多决策树入侵行为检测方法、系统、设备及介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240040966A (ko) 2022-09-22 2024-03-29 한국과학기술원 무선네트워크에서 2-채널 컬러 매핑을 이용한 심층학습 기반 다중 유형 침입 탐지 방법 및 그 장치

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
M. Barakat 외 1명, Hard competitive growing neural network for the diagnosis of small bearing faults. 2013년 *
Min-Joo Kang 외 1명. Intrusion Detection System Using Deep Neural Network for In-Vehicle Network Security. 2016.6.7. *
Muhamad Erza Aminanto 외 3명. Wi-Fi Intrusion Detection Using Weighted-Feature Selection for Neural Networks Classifier. 2017년. *
Sannasi Ganapathy 외 5명. Intelligent feature selection and classification techniques for intrusion detection in networks: a survey. 2013년 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102184395B1 (ko) * 2020-05-06 2020-11-30 호서대학교 산학협력단 결정트리 및 심층신경망을 이용한 대량의 데이터를 분류하기 위한 장치, 이를 위한 방법 및 이 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
CN117081858A (zh) * 2023-10-16 2023-11-17 山东省计算中心(国家超级计算济南中心) 一种基于多决策树入侵行为检测方法、系统、设备及介质
CN117081858B (zh) * 2023-10-16 2024-01-19 山东省计算中心(国家超级计算济南中心) 一种基于多决策树入侵行为检测方法、系统、设备及介质

Also Published As

Publication number Publication date
KR102085415B1 (ko) 2020-03-05

Similar Documents

Publication Publication Date Title
Wang et al. Intrusion detection methods based on integrated deep learning model
Gad et al. Intrusion detection system using machine learning for vehicular ad hoc networks based on ToN-IoT dataset
Gupta et al. LIO-IDS: Handling class imbalance using LSTM and improved one-vs-one technique in intrusion detection system
Firpi et al. Swarmed feature selection
Faraoun et al. Neural networks learning improvement using the K-means clustering algorithm to detect network intrusions
CN111783442A (zh) 入侵检测方法、设备和服务器、存储介质
Possebon et al. Improved network traffic classification using ensemble learning
CN112734000A (zh) 一种入侵检测方法、系统、设备及可读存储介质
Bhuvaneswari et al. An intelligent intrusion detection system for secure wireless communication using IPSO and negative selection classifier
CN113159264B (zh) 一种入侵检测方法、系统、设备及可读存储介质
KR102085415B1 (ko) 가중치 선택 신경망을 이용한 Wi-Fi 망의 침입 탐지 방법 및 장치
KR20190076479A (ko) 무선 Wi-Fi 망에서 딥러닝을 이용한 위장 공격 특장점 분석 장치 및 방법
Sabitha et al. Network based detection of IoT attack using AIS-IDS model
Ravipati et al. A survey on different machine learning algorithms and weak classifiers based on KDD and NSL-KDD datasets
Shalaginov et al. A deep neuro-fuzzy method for multi-label malware classification and fuzzy rules extraction
Liu et al. Automatic feature extraction and selection for machine learning based intrusion detection
CN115174170B (zh) 一种基于集成学习的vpn加密流量识别方法
Moukhafi et al. Artificial neural network optimized by genetic algorithm for intrusion detection system
Zhao et al. Prototype-based malware traffic classification with novelty detection
Khilar et al. A hybrid network anomaly detection system using glowworm swarm optimization with principal component analysis
Jhansi et al. Swarm optimization and machine learning for android malware detection
Deepa et al. Detection of DDoS attack using multiple kernel level (MKL) algorithm
CN116170168A (zh) 一种基于深度支持向量数据描述的dga域名检测方法及系统
Sundaram et al. Improving Performance of Intrusion Detection Using ALO Selected Features and GRU Network
Koza et al. Two Semi-supervised Approaches to Malware Detection with Neural Networks.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right