KR102085415B1 - Method and Apparatus of Intrusion Detection for Wi-Fi Network Based on Weight-Selected Neural Networks - Google Patents

Method and Apparatus of Intrusion Detection for Wi-Fi Network Based on Weight-Selected Neural Networks Download PDF

Info

Publication number
KR102085415B1
KR102085415B1 KR1020180006369A KR20180006369A KR102085415B1 KR 102085415 B1 KR102085415 B1 KR 102085415B1 KR 1020180006369 A KR1020180006369 A KR 1020180006369A KR 20180006369 A KR20180006369 A KR 20180006369A KR 102085415 B1 KR102085415 B1 KR 102085415B1
Authority
KR
South Korea
Prior art keywords
neural network
feature
features
artificial neural
intrusion detection
Prior art date
Application number
KR1020180006369A
Other languages
Korean (ko)
Other versions
KR20190088174A (en
Inventor
김광조
아미난토 무하마드 에르자
해리 타누위드자자
최락용
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020180006369A priority Critical patent/KR102085415B1/en
Publication of KR20190088174A publication Critical patent/KR20190088174A/en
Application granted granted Critical
Publication of KR102085415B1 publication Critical patent/KR102085415B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • H04W12/121Wireless intrusion detection systems [WIDS]; Wireless intrusion prevention systems [WIPS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Molecular Biology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Image Analysis (AREA)

Abstract

신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법 및 시스템이 제시된다. 본 발명에서 제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법은 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계, 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 단계 및 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 단계를 포함한다.A method and system for detecting Wi-Fi intrusion based on weight selection for neural networks are presented. The Wi-Fi intrusion detection method based on weight selection for the neural network proposed in the present invention is based on weights according to data standardization and threshold adjustment, selecting features using a decision tree and an artificial neural network, a decision tree and an artificial neural network Classifying the selected feature using the artificial neural network classification unit, calculating an IDS matrix for the classified feature, and testing the real feature using the classified feature.

Description

가중치 선택 신경망을 이용한 Wi-Fi 망의 침입 탐지 방법 및 장치{Method and Apparatus of Intrusion Detection for Wi-Fi Network Based on Weight-Selected Neural Networks}Method and Apparatus for Intrusion Detection of Wi-Fi Networks Using Weight Selective Neural Networks {Method and Apparatus of Intrusion Detection for Wi-Fi Network Based on Weight-Selected Neural Networks}

본 발명은 가중치 선택 신경망에 대한 Wi-Fi 침입 탐지 방법 및 시스템에 관한 것이다. The present invention relates to a Wi-Fi intrusion detection method and system for a weight selection neural network.

무선 모바일 사용자의 무선 네트워크 트래픽은 날마다 빠른 속도로 증가하고 있다. 종래 기술에 따르면 무선 네트워크 트래픽은 2020년까지 총 인터넷 트래픽의 3 분의 2를 차지할 것으로 예상된다. IP 트래픽의 66%가 Wi-Fi 및 셀룰러 장치로부터 발생할 것으로 예상된다. Wi-Fi 네트워크(IEEE 802.11)가 고속 로컬 영역 연결을 위해 널리 배치되면서 공격(attack)의 수가 기하 급수적으로 증가하였다. 그러나 알려진 Wi-Fi 공격과 알려지지 않은 Wi-Fi 공격을 모두 탐지할 수 있는 일반적인 모델은 문헌에서 보고되지 않았다. 침입 탐지 시스템(Intrusion Detection System; IDS)은 모든 네트워크 보안 인프라에 대한 가장 일반적인 구성 요소 중 하나이다. 기계 학습 기술은 모델-프리(model-free) 특성으로 인해 IDS의 주요 탐지 알고리즘으로 널리 채택되어왔다. 최근의 기계 학습 방법을 활용하면 기존의 IDS 모델 특히, 대규모 네트워크에서의 Wi-Fi 공격 탐지에 상당한 개선이 있을 것으로 생각된다. Wireless network traffic for wireless mobile users is growing rapidly every day. According to the prior art, wireless network traffic is expected to account for two-thirds of total Internet traffic by 2020. 66% of IP traffic is expected to come from Wi-Fi and cellular devices. As Wi-Fi networks (IEEE 802.11) are widely deployed for high-speed local area connectivity, the number of attacks has grown exponentially. However, no general model has been reported in the literature that can detect both known and unknown Wi-Fi attacks. Intrusion Detection System (IDS) is one of the most common components of any network security infrastructure. Machine learning technology has been widely adopted as the main detection algorithm of IDS due to its model-free characteristics. The use of recent machine learning methods is expected to significantly improve the detection of Wi-Fi attacks in existing IDS models, especially in large networks.

Wi-Fi 네트워크에서 컴퓨팅 장치가 확산되면 복잡하고 크고 고차원인 데이터가 출력되므로 공격 탐지 작업이 어려워진다. 특장점 선택 기술은 기존 기계 학습 기반 IDS의 성능을 향상시킬 수 있다고 생각한다. 이 연구의 주요 기여는 경량 기계 학습 모델에서 오는 각 특장점의 가중치를 고려한 새로운 특장점 선택 기반 방식의 도입이다. 기존의 기계 학습자인 인공신경망(Artificial Neural Network; ANN) 및 C4.5 결정 트리는 각 인스턴스를 데이터의 관련 정보로 분류할 수 있다. 이 관련 정보는 노드 또는 뉴런의 가중치로 표시된다. 트레이닝된 모델의 가중치는 해당 입력이 얼마나 중요한지를 나타낸다. 우리는 해당 가중치에 따라 가장 적합한 특장점을 선택한다. 선택된 특장점의 작은 세트는 실시간 프로세스에 필수적일 뿐만 아니라, Wi-Fi 네트워크의 대규모 특성에도 적합하다. 제안된 방법은 인공신경망을 특장점 분류에 활용하고 최소한의 특장점만 사용하여 IDS 모델을 구축함으로써 종료된다.The proliferation of computing devices on Wi-Fi networks makes it difficult to detect attacks by outputting complex, high-level data. We believe that feature selection technology can improve the performance of existing machine learning based IDS. The main contribution of this study is the introduction of a new feature selection-based approach that takes into account the weight of each feature in the lightweight machine learning model. Conventional machine learners, the Artificial Neural Network (ANN) and the C4.5 decision tree, can classify each instance as relevant information in the data. This related information is represented by the weight of the node or neuron. The weight of the trained model indicates how important the input is. We choose the best features based on the weights. The small set of selected features is not only essential for real-time processes, but also suitable for the large-scale nature of Wi-Fi networks. The proposed method is completed by using the artificial neural network for classification of features and constructing an IDS model using only minimal features.

이러한 종래기술에 있어서, 위장 공격 탐지를 포함한 전반적인 탐지율을 향상시키는 것을 필요로 한다. 최근에는 AWID 데이터 세트를 이용하여 전반적인 탐지율을 성공적으로 향상시켰다. In this prior art, there is a need to improve the overall detection rate, including camouflage attack detection. Recently, AWID data sets have been used to successfully improve overall detection rates.

사물 인터넷 시대로의 진화에 따른 IP 트래픽은 무선 근거리 망에서 발생하고 이러한 무선 망의 특성상 주입 공격, 위장 공격, 대량 트래픽 주입 공격 등이 대단히 용이하다. 따라서, 이를 방지하기 위한 침입 탐지 시스템(Intrusion Detection System, IDS)은 컴퓨터 또는 네트워크 내에 설치되어 컴퓨터 또는 네트워크에서의 보안 정책 위반, 외부의 악의적인 행동 또는 공격을 지속적으로 탐지하고자 하는 장치가 필요하다. 이에, 무선 근거리 망에서 각종 공격을 효율적이고 효과적으로 탐지하는 침입 탐지 시스템은 대단히 중요하다.IP traffic according to the evolution of the Internet of Things is generated from the wireless local area network, and the characteristics of the wireless network are very easy to inject, spoof, and mass traffic. Accordingly, an intrusion detection system (IDS) for preventing this needs to be installed in a computer or a network, and a device for continuously detecting a security policy violation, external malicious behavior or attack on the computer or a network. Therefore, an intrusion detection system for detecting various attacks efficiently and effectively in a wireless local area network is very important.

본 발명이 이루고자 하는 기술적 과제는 로 특장점보다 적은 새로 생성된 특장점을 위해 결정 트리 및 인공신경망을 이용한 가중 특장점 선택 방법을 이용하고, 인공신경망을 최종 분류에 이용함으로써 완벽한 Wi-Fi 공격 탐지를 달성하기 위한 방법 및 시스템을 제공하는데 있다.The technical problem to be achieved by the present invention is to use a weighted feature selection method using a decision tree and an artificial neural network for newly created features less than the low and to achieve a complete Wi-Fi attack detection by using the artificial neural network in the final classification To provide a method and system for the.

일 측면에 있어서, 본 발명에서 제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법은 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계, 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 단계 및 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 단계를 포함한다. In one aspect, the weight selection based Wi-Fi intrusion detection method for the neural network proposed by the present invention is based on the weight according to the data standardization and threshold adjustment, selecting a feature using a decision tree and artificial neural network, Classifying the selected features using the decision tree and the neural network using an artificial neural network classification unit, calculating IDS matrices for the classified features, and testing the real features using the classified features.

상기 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계는 인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택한다. Selecting a feature based on the weight according to the data standardization and the threshold adjustment, and using the decision tree and the neural network to learn the model based on the empirical weight of the artificial neural network model, Select a subset.

특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용하고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초하고, 상기 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타낸다. Use only the first hidden layer for the neural network model for feature selection and based on the weights between the first hidden layer and the second hidden layer to select important input features, wherein the weight is based on the feature of the first hidden layer. The contribution of the input feature to

상기 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계는 C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택하고, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택한다. Based on the weights according to the data standardization and threshold adjustment, and selecting features using the decision tree and the neural network, the C4.5 decision tree is used to select the best attribute providing information important for classification, Create a test node for the attribute and select the feature by dividing the data according to the value of the test attribute in the parent node.

상기 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 단계는 인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용한다. The classifying the selected features using the decision tree and the neural network by using an artificial neural network classification unit, when learning using an artificial neural network, a minimum global error function is executed, and a supervised ANN among artificial neural network learning methods. ) And scaled conjugate gradient optimizer.

또 다른 일 측면에 있어서, 본 발명에서 제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 시스템은 데이터 표준화 및 임계값 조정에 따른 가중치에 기반하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 특장점 선택부, 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 인공신경망 분류부 및 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 네트워크 테스트부를 포함한다. In yet another aspect, the weight selection based Wi-Fi intrusion detection system for the neural network proposed by the present invention is based on the weight according to the data standardization and threshold adjustment, selecting the features using the decision tree and artificial neural network An IDS matrix is calculated for the artificial neural network classifier and the classified features using the feature selection unit, the decision tree, and the neural network using the artificial neural network classifier, and the IDS matrix is tested using the classified features. It includes a network test unit.

상기 특장점 선택부는 인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택한다. The feature selector selects a subset of features using the neural network to learn the model based on the empirical weights of the neural network model.

특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용하고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초하고, 상기 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타낸다. Use only the first hidden layer for the neural network model for feature selection and based on the weights between the first hidden layer and the second hidden layer for selecting the critical input feature, the weight being applied to the feature of the first hidden layer. The contribution of the input feature to

상기 특장점 선택부는 C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택하고, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택한다. The feature selection unit selects the best attribute providing information important for classification using the C4.5 decision tree, generates a test node for the attribute, and divides the data according to the value of the test attribute in the upper node. Select.

상기 인공신경망 분류부는 인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용한다. The neural network classifier performs a minimum global error function when learning using the neural network, and uses a supervised ANN and a scaled conjugate gradient optimizer among artificial neural network learning methods.

본 발명의 실시예들에 따르면 결정 트리 및 인공신경망을 이용한 가중 특장점 선택 방법을 이용하여 로 특장점보다 적은 특장점을 새로 생성하고, 인공신경망을 최종 분류에 이용함으로써 완벽한 Wi-Fi 공격 탐지를 달성하기 위한 방법 및 시스템을 제공하는데 있다.According to embodiments of the present invention, by using a weighted feature selection method using a decision tree and an artificial neural network, a new feature less than the raw feature is generated, and the artificial neural network is used for final classification to achieve perfect Wi-Fi attack detection. To provide a method and system.

도 1은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 과정을 설명하기 위한 개략도이다.
도 2는 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법의 더욱 구체적인 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 인공신경망을 이용한 특장점 선택 방법을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 결정 트리를 이용한 특장점 선택 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 시스템의 구성을 나타내는 도면이다.
1 is a schematic diagram illustrating a Wi-Fi intrusion detection process based on weight selection for a neural network according to an embodiment of the present invention.
2 is a flowchart illustrating a weight selection based Wi-Fi intrusion detection method for a neural network according to an embodiment of the present invention.
3 is a more detailed flowchart of a weight selection based Wi-Fi intrusion detection method for a neural network according to an embodiment of the present invention.
4 is a view for explaining a feature selection method using an artificial neural network according to an embodiment of the present invention.
5 is a view for explaining a feature selection method using a decision tree according to an embodiment of the present invention.
6 is a diagram illustrating a configuration of a weight selection based Wi-Fi intrusion detection system for a neural network according to an embodiment of the present invention.

IoT 장치로 인하여 일상 생활에서 광범위한 컴퓨팅이 가능하게 됨으로써 점점 더 많은 장치가 Wi-Fi 네트워크를 통해 연결된다. Wi-Fi 네트워크에 대한 공개 액세스는 공격으로 변환될 수 있는 악용 가능한 취약성을 야기한다. Wi-Fi 네트워크 공격 탐지는 여전히 어려운 작업이다. 또한, Wi-Fi 네트워크를 통해 연결된 IoT 장치의 보급은 복잡하고 대규모이며 고차원 데이터이므로 실시간 탐지가 어려워진다. 최상의 특장점을 선택하는 것은 특장점 분류의 성능을 향상시키는 데 중요한 기여 중 하나이다. IoT devices enable a wide range of computing in everyday life, and more and more devices are connected through Wi-Fi networks. Public access to Wi-Fi networks results in exploitable vulnerabilities that can translate into attacks. Wi-Fi network attack detection is still a difficult task. In addition, the proliferation of IoT devices connected via Wi-Fi networks is complex, massive, and high-dimensional data, making real-time detection difficult. Choosing the best features is one of the important contributions to improving the performance of the feature classification.

본 발명에서는 기존의 기계 학습자의 특장점 가중치 방법을 검토하고 Wi-Fi 네트워크 공격 특장점을 정확하게 선택할 수 있는지 알아본다. 이에 따라 일반적인 신경망을 사용하여 선택된 특장점의 유용성을 테스트하고 검증한다. 제안된 가중 기반 기계 학습 모델은 종래기술에 따른 다른 필터 기반 특장점 선택 모델보다 우월함을 보여준다. In the present invention, the feature weighting method of the existing machine learner is reviewed and the Wi-Fi network attack feature can be selected correctly. This uses general neural networks to test and verify the usefulness of selected features. The proposed weight-based machine learning model is superior to other filter-based feature selection models according to the prior art.

본 발명의 일 실시예에 따른, 잘 알려진 Wi-Fi 네트워크 벤치 마크 데이터 세트인 AWID(Aegean Wi-Fi Intrusion Dataset)에서 제안된 모델을 평가한다. 경험적인 방식으로 데이터 세트에서 다수의 기존 기계 학습 모델을 테스트하였다. 제안된 방법은 99.97%의 탐지율, 99.74%의 정확도 및 0.41%의 오탐율로 기존 최첨단 IDS보다 성능이 우수하다. 가중치 기반 특장점 선택과 인공신경망 분류부를 결합하는 새로운 방법은 위장 공격 탐지 능력을 향상시키고, 대규모 Wi-Fi 네트워크에서 알려진 공격 유형과 알려지지 않은 다양한 공격 유형에 대해 더욱 일반화될 수 있다. 이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.Evaluate the proposed model in Aegean Wi-Fi Intrusion Dataset (AWID), a well-known Wi-Fi network benchmark data set, according to one embodiment of the invention. Empirically, we tested a number of existing machine learning models on the data set. The proposed method outperforms the most advanced IDS with 99.97% detection rate, 99.74% accuracy and 0.41% false positive rate. New methods that combine weighted feature selection and neural network classification can improve camouflage attack detection capabilities and can be more generalized for known and unknown types of attacks in large Wi-Fi networks. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 과정을 설명하기 위한 개략도이다.1 is a schematic diagram illustrating a Wi-Fi intrusion detection process based on weight selection for a neural network according to an embodiment of the present invention.

제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법은 지도 특장점 선택(Supervised Feature Selection)으로 인공신경망과 결정 트리를 이용하고 가중치로 학습을 수행하는 단계와 인공신경망을 이용한 신경망 분류 단계의 두 단계로 크게 나눌 수 있다. The Wi-Fi intrusion detection method based on the weight selection for the proposed neural network is based on the supervised feature selection, which uses two methods, the neural network and the decision tree, the weighted learning, and the neural network classification using the neural network. Can be divided into

먼저, 입력 데이터(110)를 입력 받아 154 특장점들(111)에 대한 가중치 특장점 선택(120)을 수행한다. 이후, 10-15 결합 특장점들(121)에 대하여 신경망 분류부(130)를 통한 분류를 수행한다. 분류된 특장점에 대하여 IDS 행렬을 계산하고, 분류된 특장점을 이용하여 실제 네트워크(140)로 테스트를 수행한다. First, the weighted feature selection 120 for the 154 features 111 is performed by receiving the input data 110. Thereafter, the classification through the neural network classification unit 130 is performed on the 10-15 coupling features 121. The IDS matrix is calculated for the classified features, and the test is performed with the real network 140 using the classified features.

다시 말해, 제안된 제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법에는 두 가지 주요 단계가 존재한다. 특장점 선택 및 특장점 분류이다. 특장점 선택은 로 특장점 공간(raw feature space)에서 다양한 특장점을 선택하기 위해 수행된다. 새로 생성된 특장점들은 변형없이 로 특장점에서 간단히 선택된다. 특장점 선택은 로 특장점보다 적은 새로 생성된 특장점을 목표로 한다. 본 발명의 실시예에 따르면, 인공신경망과 C4.5를 사용하여 가중치 특장점 선택 방법을 이용한다. 뿐만 아니라, 인공신경망은 최종 단계에서 특장점 분류에도 사용된다. 알고리즘 1은 제안된 방법의 절차를 설명한다. In other words, there are two main steps in the weight selection based Wi-Fi intrusion detection method for the proposed neural network. Feature selection and feature classification. Feature selection is performed to select various features in the raw feature space. The newly created features are simply selected from the furnace features without modification. Feature selection targets newly created features less than furnace features. According to an embodiment of the present invention, a weighted feature selection method using an artificial neural network and C4.5 is used. In addition, artificial neural networks are used to classify features in the final stages. Algorithm 1 describes the procedure of the proposed method.

Figure 112018005980140-pat00001
Figure 112018005980140-pat00001

도 2는 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법을 설명하기 위한 흐름도이다. 2 is a flowchart illustrating a weight selection based Wi-Fi intrusion detection method for a neural network according to an embodiment of the present invention.

제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법은 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계(210), 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 단계(220) 및 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 단계(230)를 포함한다. The Wi-Fi intrusion detection method based on weight selection for the proposed neural network is based on the weight according to data standardization and threshold adjustment, selecting features using the decision tree and the neural network (210), the decision tree and the neural network Classifying the selected feature using an artificial neural network classifier (220), calculating an IDS matrix for the classified feature, and testing the actual feature using the classified feature (230).

단계(210)에서, 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택한다. In step 210, features are selected based on weights according to data normalization and threshold adjustment, using decision trees and neural networks.

본 발명의 실시예에 따른 인공신경망을 이용하여 특장점을 선택하는 과정에서, 인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택한다. 이때, 특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용한다. 그리고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초한다. 여기서, 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타낸다. In the process of selecting features using the neural network according to an embodiment of the present invention, in order to learn the model based on the empirical weight of the neural network model, a subset of the features is selected using the artificial neural network. In this case, only the first hidden layer of the artificial neural network model is used to select features. Then, based on the weight between the first hidden layer and the second hidden layer to select the important input feature. Here, the weight represents the contribution of the input feature to the feature of the first hidden layer.

본 발명의 실시예에 따른 결정트리를 이용하여 특장점을 선택하는 과정에서, C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택한다. 이후, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택한다. In the process of selecting features using the decision tree according to an embodiment of the present invention, the C4.5 decision tree is used to select the best attribute providing information important for classification. After that, the test node for the attribute is generated, and data are divided according to the value of the test attribute in the upper node to select a feature.

단계(220)에서, 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류한다. 본 발명의 실시예에 따르면, 인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수(minimum global error function)가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용한다. In step 220, the selected features using the decision tree and the neural network are classified using the neural network classification unit. According to an embodiment of the present invention, when learning using the neural network, the minimum global error function (minimum global error function) is executed, the supervised ANN and scaled complex gradient optimization of the neural network learning method ( using a scaled conjugate gradient optimizer.

마지막으로 단계(230)에서, 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트한다. Finally, in step 230, an IDS matrix is calculated for the classified features and tested with the real network using the classified features.

도 3은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 방법의 더욱 구체적인 흐름도이다. 3 is a more detailed flowchart of a weight selection based Wi-Fi intrusion detection method for a neural network according to an embodiment of the present invention.

먼저, 입력 데이터에 대하여 초기화(311)를 수행하고, 초기화된 입력 데이터의 154 특장점 로 데이터세트(312)에 대하여 데이터 세트 표준화(313)를 수행한다. First, the initialization 311 is performed on the input data, and the data set normalization 313 is performed on the data set 312 with 154 features of the initialized input data.

입력 데이터는 일반적으로 다양한 값, 이산적, 연속적, 상징적이며 유연한 값의 범위를 가질 수 있다. 이러한 데이터의 특성으로 인해 본 발명의 실시예에 따른 특장점 분류부는 기본 패턴을 올바르게 학습할 수 없다. 따라서 정규화 단계가 필요하다. Input data can generally have a range of various values, discrete, continuous, symbolic and flexible. Due to the characteristics of the data, the feature classifier according to the exemplary embodiment of the present invention cannot correctly learn the basic pattern. Therefore, a normalization step is necessary.

모든 값은 실수인 동일한 유형으로 변환된다. 문자 유형이 있는 경우 하나의 단어를 하나의 숫자로 나타내어 실수로 변환할 수 있다. 다음 수식을 이용하여 0과 1 사이의 값으로 표준화 한다. All values are converted to the same type as real. If you have a character type, you can convert a word into a single number by mistake. Normalize to a value between 0 and 1 using the following formula:

Figure 112018005980140-pat00002
Figure 112018005980140-pat00002

표준화 이후, 154 특장점 표준화된 데이터 세트(314)에 대해 특장점 선택을 수행하기 위한 임계값을 조정(315)한다. 특장점 선택 출력에 대한 임계값 조정하면 선택 특장점의 수가 달라질 수 있다.After normalization, the threshold for performing feature selection on the 154 feature normalized data set 314 is adjusted 315. Adjusting the threshold for the feature selection output can vary the number of selection features.

본 발명의 실시예에 따른 특장점 선택 방법은, 결정 트리를 이용한 특장점선택 방법(316) 및 인공신경망을 이용한 특장점 선택 방법(317)의 두 방법이 있다. 각 특장점 선택을 출력으로 10-15 선택된 특장점1(318) 및 10-15 선택된 특장점2(319)를 출력할 수 있다. The feature selection method according to the embodiment of the present invention includes two methods: a feature selection method using a decision tree 316 and a feature selection method using a neural network 317. 10-15 selected feature 1 318 and 10-15 selected feature 2 319 can be output as the output of each feature selection.

도 4는 본 발명의 일 실시예에 따른 인공신경망을 이용한 특장점 선택 방법을 설명하기 위한 도면이다. 4 is a view for explaining a feature selection method using an artificial neural network according to an embodiment of the present invention.

특장점 선택은 로 특장점 공간에서만 몇몇 특장점을 선택한다. 따라서 새로운 생성된 특장점은 변형되지 않은 로 특장점에서만 선택된다. 본 발명의 실시예에 따른 인공신경망을 이용하는 경우, 인공신경망 학습의 경험적 가중치를 기반으로 위장 공격 모델(Impersonation Attack model)을 학습하는데 중요한 몇 가지 특장점을 선택할 수 있다. Feature selection selects some features only in the furnace feature space. Therefore, the newly created feature is selected only in the unmodified furnace feature. When using the neural network according to an embodiment of the present invention, several features that are important for learning an impersonation attack model can be selected based on the empirical weight of the neural network learning.

인공신경망을 이용함으로써 제안하는 모델은 특장점의 서브 세트를 선택할 수 있다. 이러한 특장점은 인공신경망 학습의 경험적 가중치를 기반으로 공격 모델을 학습하기 위해 중요하다. 도 4는 이러한 인공신경망 모델을 보여주며 여기서, b 1b 2는 각각 입력 레이어(x1, x2, x3)(410)에 대한 해당 히든 레이어(hidden layer)(H1, H2, H3)(420)의 바이어스 값을 나타낸다.By using artificial neural networks, the proposed model can select a subset of features. These features are important for learning the attack model based on the empirical weight of neural network learning. Figure 4 shows such an artificial neural network model, where b 1 and b 2 are the corresponding hidden layers (H 1 , H 2 ,) for the input layer (x 1 , x 2 , x 3 ) 410, respectively. H 3 ) 420 represents a bias value.

제1 히든 레이어(H1)를 특장점 선택에만 사용하고 중요한 입력 특장점을 선택하기 위해 처음 두 레이어, 다시 말해 제1 히든 레이어(H1) 및 제2 히든 레이어(H2) 사이의 가중치를 고려한다. 가중치는 제1 히든 레이어(H1) 특장점에 대한 입력 특장점의 기여도를 나타낸다. W ij 에 대해 0에 가까운 값은 다음 히든 레이어(Hi)

Figure 112018005980140-pat00003
에 대해 해당 입력 특장점 X j 가 의미가 없음을 나타낸다. 따라서 제1 히든 레이어(H1)에서만 가중치를 고려하기 때문에 하나의 히든 레이어로 충분하다. 각 입력 특장점의 중요한 값을 하기식과 같이 정의한다. Use the first hidden layer H 1 only for feature selection and consider weights between the first two layers, that is, the first hidden layer H 1 and the second hidden layer H 2 , to select important input features. . The weight represents the contribution of the input feature to the first hidden layer H 1 . A value close to zero for W ij is the next hidden layer (H i ).
Figure 112018005980140-pat00003
Indicates that the corresponding input feature X j has no meaning for. Therefore, since the weight is considered only in the first hidden layer H 1 , one hidden layer is sufficient. Important values of each input feature are defined as follows.

Figure 112018005980140-pat00004
Figure 112018005980140-pat00004

위 식에서, h 는 제1 히든 레이어의 뉴런 수이다. 가장 중요한 특장점을 선택하기 위해 V j 값에 따라 입력 특장점을 내림차순으로 정렬한다. 알고리즘2에서 설명한 것과 같이 임계값보다 큰 V j 값을 갖는 일부 특장점을 선택한다. 이후, 히든 레이어의 바이어스 값 b 2 에 따른 출력 레이어(430)를 출력한다.In the above formula, h is the number of neurons of the first hidden layer. V j to select the most important features Sort input features in descending order by value. As described in Algorithm 2, we select some features with V j values greater than the threshold. Thereafter, the output layer 430 according to the bias value b 2 of the hidden layer is output.

Figure 112018005980140-pat00005
Figure 112018005980140-pat00005

도 5는 본 발명의 일 실시예에 따른 결정 트리를 이용한 특장점 선택 방법을 설명하기 위한 도면이다.5 is a view for explaining a feature selection method using a decision tree according to an embodiment of the present invention.

의사 결정 트리는 분류 작업을 위해 구현된 가장 보편적인 방법 중 하나이다. 본 발명에서는 C4.5 결정 트리를 이용한다. C4.5 의사 결정 트리는 노이즈 데이터로부터 강건하며 분류 표현을 학습할 수 있다. 이러한 결정 트리에는 k-ary 트리 구조가 존재하고, 트리 내부의 각 노드는 입력 표현 데이터의 여러 속성에 대한 테스트를 표현한다. 트리에서 내려오는 모든 브랜치(branch)는 해당 노드에 있는 특장점의 가능한 값과 다른 테스트 결과를 나타낸다. 기본적으로, C4.5 의사 결정 트리는 하향식 재귀적 분할 정복 접근법(top-down recursive divide-and-conquer approach)으로 트리를 구성하기 위해 그리디(greedy) 알고리즘을 사용한다. 분류에 대한 중요한 정보를 생성하는 최상의 속성을 선택하고 해당 속성에 대한 테스트 노드를 생성하는 것은 C4.5 알고리즘의 시작이다. 이후, 상위 노드에 존재하는 테스트 속성에 따라 그들의 값을 기반으로 데이터를 분류한다. 알고리즘은 미리 정의된 임계 값을 기반으로 모든 데이터가 동일한 클래스로 그룹화되거나 추가적인 분류를 추가하는 프로세스가 분류 성능을 향상시키지 않게 되면 종료된다. 특장점 선택 프로세스는 알고리즘 3에서 설명한바와 같이 상위 3개 노드를 선택함으로써 시작된다. 이후, 동일한 노드를 제거하고 선택된 특장점 목록을 업데이트한다.Decision trees are one of the most common methods implemented for classification. In the present invention, the C4.5 decision tree is used. C4.5 The decision tree is robust from noise data and can learn classification expressions. There is a k-ary tree structure in this decision tree, and each node in the tree represents a test for various attributes of the input representation data. Every branch down the tree represents a different test result than the possible values of the feature at that node. Basically, the C4.5 decision tree uses a greedy algorithm to construct the tree in a top-down recursive divide-and-conquer approach. It is the beginning of the C4.5 algorithm to choose the best attribute that generates important information about the classification and to create a test node for that attribute. The data is then classified based on their values according to the test attributes present in the upper node. The algorithm terminates when all data is grouped into the same class based on predefined thresholds or when the process of adding additional classifications does not improve classification performance. The feature selection process begins by selecting the top three nodes as described in Algorithm 3. Then remove the same node and update the list of selected features.

Figure 112018005980140-pat00006
Figure 112018005980140-pat00006

결정 트리를 이용한 10-15 선택된 특장점1(318) 및 인공신경망을 이용한 10-15 선택된 특장점2(319)를 수집한 후, 이를 인공신경망 분류부로 전달하여 특장점을 분류(320)한다. After collecting 10-15 selected features 1 318 using a decision tree and 10-15 selected features 2 319 using an artificial neural network, the collected features are transferred to an artificial neural network classification unit to classify the features 320.

인공신경망을 가중치 특장점 선택을 위해 사용하는 것 외에도, 인공신경망을 특장점 분류에 사용한다. 인공신경망은 가장 널리 사용되는 패턴 인식 알고리즘 중 하나이다. 인공신경망을 사용하여 학습할 때, 최소 전역 오류 함수(minimum global error function)가 실행된다. 지도 방식(supervised)과 비지도 방식(unsupervised)의 두 가지 접근 방식이 있다. 본 발명에서는 지도 인공신경망을 사용하고, 대규모 문제에 적합하도록 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)와 함께 이를 활용한다.In addition to using the neural network for weighted feature selection, the neural network is also used for feature classification. Artificial neural networks are one of the most widely used pattern recognition algorithms. When learning using the neural network, a minimum global error function is executed. There are two approaches, supervised and unsupervised. In the present invention, a map neural network is used, and it is utilized with a scaled conjugate gradient optimizer that is scaled to be suitable for large scale problems.

분류된 특장점에 대하여 IDS 행렬을 계산(330)하고, IDS 행렬은 DR, FAR, Acc, Fscore 및 시간을 포함한다. An IDS matrix is computed 330 for the classified features, where the IDS matrix includes DR, FAR, Acc, Fscore and time.

이후, 특장점의 임계값을 비교(340)하여 Fscore가 미리 정해진 Fscore 임계 값보다 크거나 같은 경우, 분류된 특장점을 이용하여 실제 네트워크로 테스트(341)하고, 반면에 미리 정해진 F-score 임계 값보다 작은 경우, 단계(315)로 이동한다. Then, if the Fscore is greater than or equal to the predetermined Fscore threshold by comparing the threshold of the features (340), the test is performed (341) with the real features using the classified features, while the threshold is greater than the predetermined F-score threshold. If small, go to step 315.

도 6은 본 발명의 일 실시예에 따른 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 시스템의 구성을 나타내는 도면이다.6 is a diagram illustrating a configuration of a weight selection based Wi-Fi intrusion detection system for a neural network according to an embodiment of the present invention.

제안하는 신경망에 대한 가중치 선택 기반 Wi-Fi 침입 탐지 시스템은 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 특장점 선택부(610), 인공신경망 분류부(620) 및 네트워크 테스트부(630)를 포함한다. 특장점 선택부(610), 인공신경망 분류부(620) 및 네트워크 테스트부(630)는 도 2의 단계들(210~230)을 수행하기 위해 구성될 수 있다.The weight selection based Wi-Fi intrusion detection system for the proposed neural network is based on weights according to data standardization and threshold adjustment, and includes a feature selection unit 610, an artificial neural network classification unit 620, and a network test unit 630. Include. The feature selection unit 610, the neural network classification unit 620, and the network test unit 630 may be configured to perform the steps 210 to 230 of FIG. 2.

특장점 선택부(610)는 데이터 표준화 및 임계값 조정에 따른 가중치에 기반하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택한다. The feature selection unit 610 selects a feature using a decision tree and an artificial neural network based on weights according to data standardization and threshold adjustment.

본 발명의 실시예에 따른 인공신경망을 이용하여 특장점을 선택하는 과정에서, 인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택한다. 이때, 특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용한다. 그리고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초한다. 여기서, 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타낸다. In the process of selecting features using the neural network according to an embodiment of the present invention, in order to learn the model based on the empirical weight of the neural network model, a subset of the features is selected using the artificial neural network. In this case, only the first hidden layer of the artificial neural network model is used to select features. Then, it is based on the weight between the first hidden layer and the second hidden layer to select important input features. Here, the weight represents the contribution of the input feature to the feature of the first hidden layer.

본 발명의 실시예에 따른 결정트리를 이용하여 특장점을 선택하는 과정에서, C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택한다. 이후, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택한다.In the process of selecting features using the decision tree according to an embodiment of the present invention, the C4.5 decision tree is used to select the best attribute providing information important for classification. After that, the test node for the attribute is generated, and data are divided according to the value of the test attribute in the upper node to select a feature.

더욱 상세하게는, 먼저 입력 데이터에 대하여 초기화를 수행하고, 초기화된 입력 데이터의 154 특장점 로데이터세트에 대하여 데이터 세트 표준화를 수행한다. More specifically, first, initialization is performed on input data, and data set normalization is performed on the 154 features of the initialized input data.

입력 데이터는 일반적으로 다양한 값, 이산적, 연속적, 상징적이며 유연한 값의 범위를 가질 수 있다. 이러한 데이터의 특성으로 인해 본 발명의 실시예에 따른 특장점 분류부는 기본 패턴을 올바르게 학습할 수 없다. 따라서 정규화 단계가 필요하다. Input data can generally have a range of various values, discrete, continuous, symbolic and flexible. Due to the characteristics of the data, the feature classifier according to the exemplary embodiment of the present invention cannot correctly learn the basic pattern. Therefore, a normalization step is necessary.

모든 값은 실수인 동일한 유형으로 변환된다. 문자 유형이 있는 경우 하나의 단어를 하나의 숫자로 나타내어 실수로 변환할 수 있다. 다음 수식을 이용하여 0과 1 사이의 값으로 표준화 한다. All values are converted to the same type as real. If you have a character type, you can convert a word into a single number by mistake. Normalize to a value between 0 and 1 using the following formula:

Figure 112018005980140-pat00007
Figure 112018005980140-pat00007

표준화 이후, 154 특장점 표준화된 데이터 세트에 대해 특장점 선택을 수행하기 위한 임계값을 조정한다. 특장점 선택 출력에 대한 임계값 조정하면 선택 특장점의 수가 달라질 수 있다.After normalization, the threshold for performing feature selection on the 154 feature standardized data sets is adjusted. Adjusting the threshold for the feature selection output can vary the number of selection features.

본 발명의 실시예에 따른 특장점 선택 방법은, 결정 트리를 이용한 특장점선택 방법 및 인공신경망을 이용한 특장점 선택 방법의 두 방법이 있다. 각 특장점 선택을 출력으로 10-15 선택된 특장점1 및 10-15 선택된 특장점2를 출력할 수 있다.The feature selection method according to the embodiment of the present invention includes two methods: a feature selection method using a decision tree and a feature selection method using an artificial neural network. The output of each feature selection can output 10-15 selected features 1 and 10-15 selected features 2.

결정 트리를 이용한 10-15 선택된 특장점1 및 인공신경망을 이용한 10-15 선택된 특장점2를 수집한 후, 이를 인공신경망 분류부로 전달하여 특장점을 분류한다.After collecting 10-15 selected features 1 using the decision tree and 10-15 selected features 2 using the neural network, the features are classified by passing them to the neural network classification unit.

인공신경망 분류부(620)는 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류한다. The artificial neural network classification unit 620 classifies the selected features using the decision tree and the artificial neural network using the artificial neural network classification unit.

본 발명의 실시예에 따르면, 인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수(minimum global error function)가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용한다.According to an embodiment of the present invention, when learning using the neural network, the minimum global error function (minimum global error function) is executed, the supervised ANN and scaled complex gradient optimization of the neural network learning method ( using a scaled conjugate gradient optimizer.

인공신경망을 가중치 특장점 선택을 위해 사용하는 것 외에도, 인공신경망을 특장점 분류에 사용한다. 인공신경망은 가장 널리 사용되는 패턴 인식 알고리즘 중 하나이다. 인공신경망을 사용하여 학습할 때, 최소 전역 오류 함수(minimum global error function)가 실행된다. 지도 방식(supervised)과 비지도 방식(unsupervised)의 두 가지 접근 방식이 있다. 본 발명에서는 지도 인공신경망을 사용하고, 대규모 문제에 적합하도록 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)와 함께 이를 활용한다.In addition to using the neural network for weighted feature selection, the neural network is also used for feature classification. Artificial neural networks are one of the most widely used pattern recognition algorithms. When learning using the neural network, a minimum global error function is executed. There are two approaches, supervised and unsupervised. In the present invention, a map neural network is used, and it is utilized with a scaled conjugate gradient optimizer that is scaled to be suitable for large scale problems.

이후, 특장점의 임계값을 비교하여 Fscore가 미리 정해진 Fscore 임계 값보다 크거나 같은 경우, 분류된 특장점을 이용하여 실제 네트워크로 테스트하고, 반면에 미리 정해진 Fscore 임계 값보다 작은 경우, 특장점 선택을 수행하기 위한 임계값을 조정 단계로 이동한다. Then, by comparing the thresholds of the features, if the Fscore is greater than or equal to the predetermined Fscore threshold, test them with the real network using the classified features, while performing the feature selection if it is less than the predetermined Fscore threshold. Move the threshold for the adjustment step.

네트워크 테스트부(630)는 분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트한다. The network test unit 630 calculates an IDS matrix with respect to the classified features, and tests the actual network using the classified features.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and / or a combination of hardware components and software components. For example, the devices and components described in the embodiments may include, for example, processors, controllers, arithmetic logic units (ALUs), digital signal processors, microcomputers, field programmable arrays (FPAs), It may be implemented using one or more general purpose or special purpose computers, such as a programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to the execution of the software. For convenience of explanation, one processing device may be described as being used, but one of ordinary skill in the art will appreciate that the processing device includes a plurality of processing elements and / or a plurality of types of processing elements. It can be seen that it may include. For example, the processing device may include a plurality of processors or one processor and one controller. In addition, other processing configurations are possible, such as parallel processors.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the above, and may configure the processing device to operate as desired, or process independently or collectively. You can command the device. Software and / or data may be any type of machine, component, physical device, virtual equipment, computer storage medium or device in order to be interpreted by or to provide instructions or data to the processing device. It can be embodied in. The software may be distributed over networked computer systems so that they may be stored or executed in a distributed manner. The software and data may be stored on one or more computer readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. The method according to the embodiment may be embodied in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium. The computer readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions recorded on the media may be those specially designed and constructed for the purposes of the embodiments, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.Although the embodiments have been described by the limited embodiments and the drawings as described above, various modifications and variations are possible to those skilled in the art from the above description. For example, the described techniques may be performed in a different order than the described method, and / or components of the described systems, structures, devices, circuits, etc. may be combined or combined in a different form than the described method, or other components. Or, even if replaced or substituted by equivalents, an appropriate result can be achieved.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다. Therefore, other implementations, other embodiments, and equivalents to the claims are within the scope of the claims that follow.

Claims (10)

특장점 선택부를 통해 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계;
결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 통해 분류하는 단계; 및
분류된 특장점에 대하여 네트워크 테스트부를 통해 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 단계
를 포함하는 Wi-Fi 침입 탐지 방법.
Selecting features using a decision tree and an artificial neural network based on weights according to data normalization and threshold adjustment through a feature selection unit;
Classifying the selected feature using an artificial neural network through an artificial neural network classification unit; And
Computing the IDS matrix for the classified features through the network test unit, and testing the actual network using the classified features.
Wi-Fi intrusion detection method comprising a.
제1항에 있어서,
상기 특장점 선택부를 통해 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계는,
인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택하는
Wi-Fi 침입 탐지 방법.
The method of claim 1,
The step of selecting a feature using the decision tree and the artificial neural network based on the weight according to data standardization and threshold adjustment through the feature selector,
In order to train the model based on the empirical weight of the neural network model, the neural network is used to select a subset of features.
Wi-Fi intrusion detection method.
제2항에 있어서,
특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용하고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초하고, 상기 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타내는
Wi-Fi 침입 탐지 방법.
The method of claim 2,
Use only the first hidden layer for the neural network model for feature selection and based on the weights between the first hidden layer and the second hidden layer for selecting the critical input feature, the weight being applied to the feature of the first hidden layer. The contribution of the input feature to
Wi-Fi intrusion detection method.
제1항에 있어서,
상기 특장점 선택부를 통해 데이터 표준화 및 임계값 조정에 따른 가중치에 기초하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 단계는,
C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택하고, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택하는
Wi-Fi 침입 탐지 방법.
The method of claim 1,
The step of selecting a feature using the decision tree and the artificial neural network based on the weight according to data standardization and threshold adjustment through the feature selector,
Using the C4.5 decision tree, you can select the best attributes that provide information that is important for your classification, create test nodes for those attributes, and select features by dividing the data according to the values for the test attributes in the parent node.
Wi-Fi intrusion detection method.
제1항에 있어서,
상기 결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 통해 분류하는 단계는,
인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용하는
Wi-Fi 침입 탐지 방법.
The method of claim 1,
The classifying the selected feature using the decision tree and the artificial neural network through an artificial neural network classification unit,
When learning using the neural network, the minimum global error function is executed and the supervised ANN and scaled conjugate gradient optimizer are used.
Wi-Fi intrusion detection method.
데이터 표준화 및 임계값 조정에 따른 가중치에 기반하고, 결정 트리 및 인공신경망을 이용하여 특장점을 선택하는 특장점 선택부;
결정 트리 및 인공신경망을 이용하여 선택된 특장점을 인공신경망 분류부를 이용하여 분류하는 인공신경망 분류부; 및
분류된 특장점에 대하여 IDS 행렬을 계산하고, 상기 분류된 특장점을 이용하여 실제 네트워크로 테스트 하는 네트워크 테스트부
를 포함하는 Wi-Fi 침입 탐지 시스템.
A feature selection unit based on weights according to data standardization and threshold adjustment and selecting features using a decision tree and an artificial neural network;
An artificial neural network classification unit for classifying the selected features using the decision tree and the neural network using an artificial neural network classification unit; And
A network test unit for calculating an IDS matrix for the classified features and testing the actual network using the classified features.
Wi-Fi intrusion detection system comprising a.
제6항에 있어서,
상기 특장점 선택부는,
인공신경망 모델의 경험적 가중치에 기초하여 모델을 학습하기 위해, 인공신경망을 이용하여 특장점의 서브 세트를 선택하는
Wi-Fi 침입 탐지 시스템.
The method of claim 6,
The feature selection section,
In order to train the model based on the empirical weight of the neural network model, the neural network is used to select a subset of features.
Wi-Fi Intrusion Detection System.
제7항에 있어서,
특장점 선택을 위해 인공신경망 모델에 관한 제1 히든 레이어만을 이용하고, 중요 입력 특장점을 선택하기 위해 제1 히든 레이어 및 제2 히든 레이어 사이의 가중치에 기초하고, 상기 가중치는 제1 히든 레이어의 특장점에 대한 입력 특장점의 기여도를 나타내는
Wi-Fi 침입 탐지 시스템.
The method of claim 7, wherein
Use only the first hidden layer for the neural network model for feature selection and based on the weights between the first hidden layer and the second hidden layer for selecting the critical input feature, the weight being applied to the feature of the first hidden layer. The contribution of the input feature to
Wi-Fi Intrusion Detection System.
제6항에 있어서,
상기 특장점 선택부는,
C4.5 결정 트리를 이용하여, 분류에 중요한 정보를 제공하는 최상의 속성을 선택하고, 해당 속성에 대한 테스트 노드 생성하여, 상위 노드에 있는 테스트 속성에 관한 값에 따라 데이터를 나누어 특장점을 선택하는
Wi-Fi 침입 탐지 시스템.
The method of claim 6,
The feature selection section,
Using the C4.5 decision tree, you can select the best attributes that provide information that is important for your classification, create test nodes for those attributes, and select features by dividing the data according to the values for the test attributes in the parent node.
Wi-Fi Intrusion Detection System.
제6항에 있어서,
상기 인공신경망 분류부는,
인공신경망을 이용하여 학습 할 때, 최소 전역 오류 함수가 실행되고, 인공신경망 학습 방법 중 지도 인공신경망(supervised ANN) 및 스케일된 복소 그라디언트 최적화(scaled conjugate gradient optimizer)를 이용하는
Wi-Fi 침입 탐지 시스템.
The method of claim 6,
The artificial neural network classification unit,
When learning using the neural network, the minimum global error function is executed and the supervised ANN and scaled conjugate gradient optimizer are used.
Wi-Fi Intrusion Detection System.
KR1020180006369A 2018-01-18 2018-01-18 Method and Apparatus of Intrusion Detection for Wi-Fi Network Based on Weight-Selected Neural Networks KR102085415B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180006369A KR102085415B1 (en) 2018-01-18 2018-01-18 Method and Apparatus of Intrusion Detection for Wi-Fi Network Based on Weight-Selected Neural Networks

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180006369A KR102085415B1 (en) 2018-01-18 2018-01-18 Method and Apparatus of Intrusion Detection for Wi-Fi Network Based on Weight-Selected Neural Networks

Publications (2)

Publication Number Publication Date
KR20190088174A KR20190088174A (en) 2019-07-26
KR102085415B1 true KR102085415B1 (en) 2020-03-05

Family

ID=67469925

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180006369A KR102085415B1 (en) 2018-01-18 2018-01-18 Method and Apparatus of Intrusion Detection for Wi-Fi Network Based on Weight-Selected Neural Networks

Country Status (1)

Country Link
KR (1) KR102085415B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240040966A (en) 2022-09-22 2024-03-29 한국과학기술원 Method and device for detecting multiple types of intrusion based on deep learning using 2-channel color mapping in wireless network

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102184395B1 (en) * 2020-05-06 2020-11-30 호서대학교 산학협력단 Apparatus for classifying massive amounts of data using decision trees and deep neural networks, method therefor, and computer recordable medium storing program to perform the method
CN117081858B (en) * 2023-10-16 2024-01-19 山东省计算中心(国家超级计算济南中心) Intrusion behavior detection method, system, equipment and medium based on multi-decision tree

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
M. Barakat 외 1명, Hard competitive growing neural network for the diagnosis of small bearing faults. 2013년
Min-Joo Kang 외 1명. Intrusion Detection System Using Deep Neural Network for In-Vehicle Network Security. 2016.6.7.
Muhamad Erza Aminanto 외 3명. Wi-Fi Intrusion Detection Using Weighted-Feature Selection for Neural Networks Classifier. 2017년.
Sannasi Ganapathy 외 5명. Intelligent feature selection and classification techniques for intrusion detection in networks: a survey. 2013년

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240040966A (en) 2022-09-22 2024-03-29 한국과학기술원 Method and device for detecting multiple types of intrusion based on deep learning using 2-channel color mapping in wireless network

Also Published As

Publication number Publication date
KR20190088174A (en) 2019-07-26

Similar Documents

Publication Publication Date Title
Elmasry et al. Evolving deep learning architectures for network intrusion detection using a double PSO metaheuristic
Chen et al. Intrusion detection using multi-objective evolutionary convolutional neural network for Internet of Things in Fog computing
Gupta et al. LIO-IDS: Handling class imbalance using LSTM and improved one-vs-one technique in intrusion detection system
Faraoun et al. Neural networks learning improvement using the K-means clustering algorithm to detect network intrusions
Al-Yaseen et al. Real-time multi-agent system for an adaptive intrusion detection system
Dias et al. Using artificial neural network in intrusion detection systems to computer networks
CN102651088B (en) Classification method for malicious code based on A_Kohonen neural network
CN111783442A (en) Intrusion detection method, device, server and storage medium
KR102085415B1 (en) Method and Apparatus of Intrusion Detection for Wi-Fi Network Based on Weight-Selected Neural Networks
CN113159264A (en) Intrusion detection method, system, equipment and readable storage medium
Sabitha et al. Network based detection of IoT attack using AIS-IDS model
Ravipati et al. A survey on different machine learning algorithms and weak classifiers based on KDD and NSL-KDD datasets
Faraoun et al. Neural networks learning improvement using the k-means clustering algorithm to detect network intrusions
Mishra et al. Hybrid deep learning algorithm for smart cities security enhancement through blockchain and internet of things
Moukhafi et al. Artificial neural network optimized by genetic algorithm for intrusion detection system
Mukhaini et al. A systematic literature review of recent lightweight detection approaches leveraging machine and deep learning mechanisms in Internet of Things networks
Santhadevi et al. Light Weight Gradient Ensemble Model for detecting network attack at the edge of the IoT network
Jhansi et al. Swarm optimization and machine learning for android malware detection
Sundaram et al. Improving Performance of Intrusion Detection Using ALO Selected Features and GRU Network
CN114338165A (en) Network intrusion detection method based on pseudo-twin stack self-encoder
Sirajul Islam et al. Machine Learning-Driven Algorithms for Network Anomaly Detection
Smmarwar et al. XAI-AMD-DL: An explainable AI approach for android malware detection system using deep learning
Rani et al. An efficient network intrusion detection system based on feature selection using evolutionary algorithm over balanced dataset
Saritha et al. Support vector machine and feature selection based optimization framework for big data security
Jurečková et al. Classification and online clustering of zero-day malware

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right