KR102628595B1 - 머신러닝 모델 최적화를 위한 유전 알고리즘 기반 대표 데이터 선정 방법 - Google Patents

머신러닝 모델 최적화를 위한 유전 알고리즘 기반 대표 데이터 선정 방법 Download PDF

Info

Publication number
KR102628595B1
KR102628595B1 KR1020210146311A KR20210146311A KR102628595B1 KR 102628595 B1 KR102628595 B1 KR 102628595B1 KR 1020210146311 A KR1020210146311 A KR 1020210146311A KR 20210146311 A KR20210146311 A KR 20210146311A KR 102628595 B1 KR102628595 B1 KR 102628595B1
Authority
KR
South Korea
Prior art keywords
state data
data
candidate
solution
selection
Prior art date
Application number
KR1020210146311A
Other languages
English (en)
Other versions
KR20230061755A (ko
Inventor
김지형
이상신
송민환
최원기
Original Assignee
한국전자기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자기술연구원 filed Critical 한국전자기술연구원
Priority to KR1020210146311A priority Critical patent/KR102628595B1/ko
Publication of KR20230061755A publication Critical patent/KR20230061755A/ko
Application granted granted Critical
Publication of KR102628595B1 publication Critical patent/KR102628595B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

머신러닝 모델 최적화를 위한 유전 알고리즘 기반 대표 데이터 선정 방법이 제공된다. 본 발명의 실시예에 따른 상태 예측 방법은, 상위 시스템을 구성하는 다수의 시스템들에서 각각 생성되는 상태 데이터들을 수집하고, 유전 알고리즘을 이용하여 수집된 상태 데이터들 중 일부를 선정하며, 머신러닝 모델을 이용하여 선정된 상태 데이터들로부터 상위 시스템의 미래 상태 데이터를 예측한다. 이에 의해, 유전 알고리즘을 이용하여 네트워크 트래픽을 예측하는 머신러닝 모델의 입력 데이터를 최적의 대표 데이터들로 선정함으로써, 머신러닝 모델의 차원 감소에도 불구하고 예측 성능은 유지될 수 있도록 한다

Description

머신러닝 모델 최적화를 위한 유전 알고리즘 기반 대표 데이터 선정 방법{Genetic algorithm-based representative data selection method for machine learning model optimization}
본 발명은 머신러닝 관련 기술에 관한 것으로, 더욱 상세하게는 머신러닝 모델의 차원 감소(dimension reduction)를 위해 수집된 데이터들 중 일부를 대표 데이터로 선정하여 활용하는 방법에 관한 것이다.
네트워크의 각종 오류와 장애 발생을 미리 예측하기 위한 방안으로, 최근 머신러닝 모델이 이용되고 있다. 구체적으로, 머신러닝 모델로 하여금 네트워크를 구성하는 통신 시스템들의 트래픽 데이터들을 분석하여 미래의 네트워크 트래픽을 예측하도록 하는 것이다.
하지만, 네트워크를 구성하는 통신 시스템들의 개수가 많고 하나의 통신 시스템에 다수의 포트들이 있기 때문에, 수집되는 트래픽 데이터들의 개수가 너무 많아, 머신러닝 모델을 학습시킴에 있어 많은 시간과 노력이 필요하다.
이를 해결하기 위한 방안은 수집된 트래픽 데이터들 중 일부만을 머신러닝 모델의 입력으로 사용하는 차원 감소인데, 어느 데이터들을 대표 데이터로 선정하여야 하는지가 문제된다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 유전 알고리즘을 이용하여 네트워크 트래픽을 예측하는 머신러닝 모델의 입력 데이터를 선정하고, 유전 알고리즘의 초기해를 최적으로 설정하는 방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 상태 예측 방법은, 상위 시스템을 구성하는 다수의 시스템들에서 각각 생성되는 상태 데이터들을 수집하는 단계; 유전 알고리즘을 이용하여, 수집된 상태 데이터들 중 일부를 선정하는 단계; 머신러닝 모델을 이용하여, 선정된 상태 데이터들로부터 상위 시스템의 미래 상태 데이터를 예측하는 단계;를 포함한다.
상위 시스템은, 네트워크이고, 다수의 시스템들은, 네트워크를 구성하는 다수의 통신 시스템들이며, 상태 데이터는, 트래픽 데이터일 수 있다.
선정 단계는, 수집된 상태 데이터들 중 일부를 지정하는 초기해를 설정하는 단계; 설정된 초기해에 대해 교차 및 변이 연산을 수행하여 후보해 집단을 생성하는 단계; 후보해 집단에 포함된 후보해들 중 일부를 선택하는 단계: 선택된 후보해들에 대해 교차 및 변이 연산을 수행하여 후보해 집단에 추가하는 단계; 선택 단계와 추가 단계를 반복하여, 최종해를 결정하는 단계;를 포함할 수 있다.
선택 단계는, 후보해 집단에 포함된 후보해들 각각에 대해 머신러닝 모델을 이용하여 트래픽 데이터를 예측하고, 예측 결과들을 기초로 후보해들 중 일부를 선택할 수 있다.
그리고, 선택 단계는, 예측된 트래픽 데이터들과 수집된 상태 데이터 전부를 이용하여 예측한 트래픽 데이터 간의 차이를 기초로 후보해들 중 일부를 선택할 수 있다.
설정 단계는, 수집된 상태 데이터들을 평균한 평균 상태 데이터를 산출하고, 산출한 평균 상태 데이터와 유사도가 높은 순서대로 일부의 상태 데이터들을 선별하는 단계; 선별 단계에서 선별된 상태 데이터들을 초기해가 지정하도록 설정하는 제1 설정 단계;를 포함할 수 있다.
선별 단계는, 상관도가 높은 상태 데이터들이 모두 선별되는 것을 배제할 수 있다.
선별 단계는, 위치가 인접한 시스템들에서 생성되는 상태 데이터들이 모두 선별되는 것을 배제할 수 있다.
선별 단계는, 직접 연결된 시스템들에서 생성되는 상태 데이터들이 모두 선별되는 것을 배제할 수 있다.
한편, 본 발명의 다른 실시예에 따른, 상태 예측 시스템은, 상위 시스템을 구성하는 다수의 시스템들에서 각각 생성되는 상태 데이터들을 수집하는 수집부; 유전 알고리즘을 이용하여, 수집된 상태 데이터들 중 일부를 선정하는 선정부; 머신러닝 모델을 이용하여, 선정된 상태 데이터들로부터 상위 시스템의 미래 상태 데이터를 예측하는 예측부;를 포함한다.
한편, 본 발명의 다른 실시예에 따른, 데이터 선정 방법은, 상위 시스템을 구성하는 다수의 시스템들에서 각각 생성되는 상태 데이터들을 수집하는 단계; 유전 알고리즘을 이용하여, 수집된 상태 데이터들 중 일부를 대표 데이터로 선정하는 단계;를 포함한다.
한편, 본 발명의 다른 실시예에 따른, 데이터 선정 시스템은, 상위 시스템을 구성하는 다수의 시스템들에서 각각 생성되는 상태 데이터들을 수집하는 수집부; 유전 알고리즘을 이용하여, 수집된 상태 데이터들 중 일부를 대표 데이터로 선정하는 선정부;를 포함한다.
이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 유전 알고리즘을 이용하여 네트워크 트래픽을 예측하는 머신러닝 모델의 입력 데이터를 최적의 대표 데이터들로 선정함으로써, 머신러닝 모델의 차원 감소에도 불구하고 예측 성능은 유지될 수 있도록 한다.
또한, 본 발명의 실시예들에 따르면, 머신러닝 모델의 입력 데이터를 선정하는데 이용되는 유전 알고리즘의 초기해를 최적으로 설정할 수 있어, 유전 알고리즘의 정확한 최종해를 유도할 수 있고, 연산 시간을 줄일 수 있게 된다.
도 1은 본 발명의 일 실시예에 따른 네트워크 트래픽 예측 시스템의 구성을 도시한 도면,
도 2는 본 발명의 다른 실시예에 따른 대표 데이터 선정 방법의 설명에 제공되는 흐름도,
도 3은, 도 2의 초기해 설정 단계의 상세 흐름도,
도 4는 초기해 설정 과정을 개념적으로 나타낸 도면,
도 5는 본 발명의 또 다른 실시예에 따른 네트워크 트래픽 예측 방법의 설명에 제공되는 흐름도,
도 6은 본 발명의 다른 실시예에 따른 네트워크 트래픽 예측 시스템의 구성을 도시한 도면이다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
본 발명의 실시예에서는 머신러닝 모델 최적화를 위한 유전 알고리즘 기반 대표 데이터 선정 방법을 제시한다. 머신러닝 모델의 차원 감소(dimension reduction)를 위한 대표 데이터 선정을 유전 알고리즘에 의하는 것이다.
나아가, 본 발명의 실시예에서는 유전 알고리즘의 초기해를 보다 적정하게 설정함으로써, 유전 알고리즘의 최종해가 정확해지도록 하고 연산 시간이 줄어들도록 한다.
도 1은 본 발명의 일 실시예에 따른 네트워크 트래픽 예측 시스템의 구성을 도시한 도면이다. 본 발명의 실시예에 따른 시스템은 머신러닝 기반으로 네트워크 트래픽을 예측한다.
본 발명의 실시예에 따른 네트워크 트래픽 예측 시스템은, 도시된 바와 같이, 데이터 수집부(110), 글로벌 예측 모델(120), 데이터 선정부(130) 및 로컬 예측 모델(140)을 포함하여 구성된다.
데이터 수집부(110)는 모니터링 대상이 되는 네트워크(미도시)를 구성하는 다수의 통신 시스템들(미도시)로부터 트래픽 데이터들을 수집한다. 여기서, 통신 시스템들에는 라우터, 허브, 스위치 등이 포함된다.
글로벌 예측 모델(120)는 데이터 수집부(110)가 n개의 통신 시스템들로부터 수집한 n개의 트래픽 데이터들 모두를 분석하여 미래의 네트워크 트래픽을 예측하도록 학습된 머신러닝 모델 또는 이 모델을 구동하기 위한 GPU(Graphics Processing Unit)들과 CPU(Central Processing Unit)를 말한다.
데이터 선정부(130)는 데이터 수집부(110)가 수집한 n개의 트래픽 데이터들 중에서 k(≪ n)개의 트래픽 데이터를 선정한다. k개의 트래픽 데이터를 선정하기 위해, 데이터 선정부(130)는 유전 알고리즘을 이용한다.
로컬 예측 모델(140)은 데이터 선정부(130)에 의해 선정된 k개의 트래픽 데이터를 분석하여 미래의 네트워크 트래픽을 예측하도록 학습된 머신러닝 모델 또는 이 모델을 구동하기 위한 GPU들과 CPU를 말한다.
도 1에서는 n개의 트래픽 데이터는 글로벌 트래픽 데이터로, k개의 트래픽 데이터는 로컬 트래픽 데이터로 표기하였다.
글로벌 예측 모델(120)의 입력 데이터는 n차원임에 반해 로컬 예측 모델(140)의 입력 데이터는 k차원이라는 점에서 양자는 차이가 있다. 글로벌 예측 모델(120)의 경우 추가 학습의 어려움으로 인해, 본 발명의 실시예에서는 로컬 예측 모델(140)을 이용하여 네트워크 트래픽을 예측하는 것을 추구하며, 데이터 선정부(130)는 차원 감소를 위한 수단으로 기능하게 된다.
이하에서는, 데이터 선정부(130)가 유전 알고리즘을 이용하여 n개의 트래픽 데이터들 중 k개의 트래픽 데이터들을 대표 데이터로 선정하는 과정에 대해, 도 2를 참조하여 상세히 설명한다. 도 2는 본 발명의 다른 실시예에 따른 대표 데이터 선정 방법의 설명에 제공되는 흐름도이다.
트래픽 데이터 선정을 위해, 데이터 선정부(130)는 먼저 데이터 수집부(110)에 의해 n개의 통신 시스템들로부터 수집한 n개의 트래픽 데이터들 중 k개를 지정하는 초기해를 설정한다(S210).
S210단계에서 설정된 초기해는 유전 알고리즘으로 최종해를 구함에 있어 매우 중요한 인자이다. 초기해가 무엇으로 설정되는지에 따라 최종해가 달라질 수도 있고, 최종해를 구하는 연산 시간이 달라지게 된다. 즉, 초기해를 적정하게 설정하여야, 최종해도 정확해지고 연산 시간도 짧아진다. 초기해를 구하는 과정에서 대해서는 상세히 후술한다.
다음, 데이터 선정부(130)는 S210단계에서 설정된 초기해에 대해 유전 알고리즘에 따라 교차 및 변이 연산을 수행하여 후보해 집단을 생성한다(S220). 후보해 집단은 다수의 후보해들의 집합을 말한다.
이후, 데이터 선정부(130)는 S220단계에서 생성된 후보해 집단을 구성하는 후보해들 각각에 대해 로컬 예측 모델(140)을 이용하여 트래픽 데이터를 예측한다(S230). S230단계에 의해 예측되는 트래픽 데이터의 개수는 후보해 개수와 동일하다.
데이터 선정부(130)는 S230단계에서 예측된 트래픽 데이터들을 글로벌 예측 모델(120)에서 예측된 트래픽 데이터와 비교하여, 후보해 집단에서 최적의 일부 후보해들을 선택한다(S240). 최적의 후보해들이란 글로벌 예측 모델(120)에서 예측된 트래픽 데이터와 차이가 작게 트래픽 데이터를 예측하도록 한 후보해들을 말한다.
다음, 데이터 선정부(130)는 S240단계에서 선택된 후보해들에 대해 유전 알고리즘에 따라 교차 및 변이 연산을 수행하여 추가한 후보해들을 후보해 집단에 포함시킨다(S250).
이후, 데이터 선정부(130)는 S230단계 내지 S250단계를 정해진 횟수 만큼 반복한다(S260). 반복이 완료되면(S260-Y), 데이터 선정부(130)는 후보해 집단에 포함된 후보해들 중 순위가 가장 높은 후보해를 최종해로 결정한다(S270).
S270단계에서 결정하는 최종해는 글로벌 예측 모델(120)에서 예측된 트래픽 데이터와 차이가 가장 작은 트래픽 데이터를 예측하도록 한 후보해를 말한다.
이하에서는, S210단계에서 초기해를 설정하는 과정에 대해 상세히 설명한다. 도 3은, 도 2의 초기해 설정 단계(S210)의 상세 흐름도이다.
유전 알고리즘의 최적의 초기해를 설정하기 위해, 데이터 선정부(130)는 먼저 데이터 수집부(110)에 의해 n개의 통신 시스템들로부터 수집한 n개의 트래픽 데이터들을 평균한 평균 트래픽 데이터를 산출한다(S211).
다음, 데이터 선정부(130)는 n개의 트래픽 데이터들 중에서 S211단계에서 산출한 평균 트래픽 데이터와 유사도가 높은 순서로 k개의 트래픽 데이터들을 선별한다(S212).
S212단계에서 선별한 k개의 트래픽 데이터들을 지정하도록 초기해를 설정할 수도 있고, S213단계 내지 S215단계를 추가적으로 더 수행한 후에 초기해를 설정할 수도 있다. 도 4에는 S211단계와 S212단계가 수행하는 과정을 개념적으로 나타내었다.
S212단계까지 수행하여 선별된 트래픽 데이터들 중에는 상호 간에 상관도가 높은 상태 데이터들이 포함될 수 있다. 이 경우 트래픽 데이터의 다양성이 심각하게 훼손될 여지가 있다.
이를 배제하기 위해, 데이터 선정부(130)는 SS12단계까지 선별된 트래픽 데이터들 중 상관도가 높은, 즉, 상관도가 기준 이상인 트래픽 데이터들 중 하나를 배제하고, 다른 트래픽 데이터를 추가한다(S213). S213단계에서 추가되는 다른 트래픽 데이터는 선별되지 않은 트래픽 데이터들 중 평균 트래픽 데이터와 유사도가 가장 높은 트래픽 데이터이다.
한편, S213단계까지 수행하여 선별된 트래픽 데이터들 중에는 위치가 인접한 통신 시스템들에서 생성된 트래픽 데이터들이 포함될 수 있다. 이 경우 네트워크 전체가 아닌 국소적인 부분에서의 트래픽 데이터들만 이용될 여지가 있다.
이를 배제하기 위해, 데이터 선정부(130)는 S213단계까지 선별된 트래픽 데이터들 중 위치가 인접한, 즉, 거리가 기준 이하인 통신 시스템들에서 생성된 트래픽 데이터들 중 하나를 배제하고, 다른 트래픽 데이터를 추가한다(S214). S214단계에서 추가되는 다른 트래픽 데이터는 선별되지 않은 트래픽 데이터들 중 평균 트래픽 데이터와 유사도가 가장 높은 트래픽 데이터이다.
다른 한편으로, S214단계까지 수행하여 선별된 트래픽 데이터들 중에는 직접 연결된 통신 시스템들에서 생성된 트래픽 데이터들이 포함될 수 있다. 이 경우에도 네트워크 전체가 아닌 국소적인 부분에서의 트래픽 데이터들만 이용될 여지가 있다.
이를 배제하기 위해, 데이터 선정부(130)는 S214단계까지 선별된 트래픽 데이터들 중 직접 연결된 통신 시스템들, 즉, 부모/자식 관계의 통신 시스템들이나 원-홉 거리 관계의 통신 시스템들에서 생성된 트래픽 데이터들 중 하나를 배제하고, 다른 트래픽 데이터를 추가한다(S215). S215단계에서 추가되는 다른 트래픽 데이터는 선별되지 않은 트래픽 데이터들 중 평균 트래픽 데이터와 유사도가 가장 높은 트래픽 데이터이다.
데이터 선정부(130)는 위 과정들을 통해 최종적으로 선별된 상태 데이터들을 지정하도록 초기해를 설정한다(S216).
도 5는 본 발명의 또 다른 실시예에 따른 네트워크 트래픽 예측 방법의 설명에 제공되는 흐름도이다.
네트워크 트래픽 예측을 위해, 데이터 수집부(110)는 네트워크를 구성하는 통신 시스템들로부터 트래픽 데이터들을 수집한다(S310).
데이터 선정부(130)는 S310단계에서 수집된 n개의 트래픽 데이터들 중에서 k개의 트래픽 데이터를 선정한다(S320).
그러면, 로컬 예측 모델(140)은 데이터 선정부(130)에 의해 선정된 k개의 트래픽 데이터를 분석하여 미래의 네트워크 트래픽을 예측한다(S330).
도 6은 본 발명의 다른 실시예에 따른 네트워크 트래픽 예측 시스템의 구성을 도시한 도면이다. 본 발명의 실시예에 따른 네트워크 트래픽 예측 시스템은, 도 1에 도시된 시스템의 글로벌 예측 모델(120)과 로컬 예측 모델(140)이 하나의 예측 모델(150)로 통합되어 있다는 점에서 차이가 있다.
예측 모델(120)은 글로벌 예측과 로컬 예측 모두를 수행한다. 글로벌 예측시 예측 모델(120)은 n개의 트래픽 데이터들 모두를 입력받아 미래의 네트워크 트래픽을 예측한다. 로컬 예측시 예측 모델(120)은 입력되지 않은 n-k개의 트래픽 데이터들은 데이터 패딩 처리하여 미래의 네트워크 트래픽을 예측한다.
지금까지, 머신러닝 모델을 이용한 네트워크 트래픽 예측 방법, 머신러닝 모델의 차원 감소를 위한 유전 알고리즘 기반의 대표 데이터 선정 방법 및 유전 알고리즘의 초기해 설정 방법에 대해 바람직한 실시예들을 들어 상세히 설명하였다.
한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
110 : 데이터 수집부
120 : 글로벌 예측 모델
130 : 데이터 선정부
140 : 로컬 예측 모델
150 : 예측 모델

Claims (12)

  1. 상위 시스템을 구성하는 다수의 시스템들에서 각각 생성되는 상태 데이터들을 수집하는 단계;
    유전 알고리즘을 이용하여, 수집된 상태 데이터들 중 일부를 선정하는 단계;
    머신러닝 모델을 이용하여, 선정된 상태 데이터들로부터 상위 시스템의 미래 상태 데이터를 예측하는 단계;를 포함하고,
    선정 단계는,
    수집된 상태 데이터들 중 일부를 지정하는 초기해를 설정하는 단계;
    설정된 초기해에 대해 교차 및 변이 연산을 수행하여 후보해 집단을 생성하는 단계;
    후보해 집단에 포함된 후보해들 중 일부를 선택하는 단계:
    선택된 후보해들에 대해 교차 및 변이 연산을 수행하여 후보해 집단에 추가하는 단계;
    선택 단계와 추가 단계를 반복하여, 최종해를 결정하는 단계;를 포함하며,
    설정 단계는,
    수집된 상태 데이터들을 평균한 평균 상태 데이터를 산출하고, 산출한 평균 상태 데이터와 유사도가 높은 순서대로 일부의 상태 데이터들을 선별하는 단계;
    선별 단계에서 선별된 상태 데이터들을 초기해가 지정하도록 설정하는 단계;를 포함하는 것을 특징으로 하는 상태 예측 방법.
  2. 청구항 1에 있어서,
    상위 시스템은,
    네트워크이고,
    다수의 시스템들은,
    네트워크를 구성하는 다수의 통신 시스템들이며,
    상태 데이터는,
    트래픽 데이터인 것을 특징으로 하는 상태 예측 방법.
  3. 삭제
  4. 청구항 1에 있어서,
    선택 단계는,
    후보해 집단에 포함된 후보해들 각각에 대해 머신러닝 모델을 이용하여 트래픽 데이터를 예측하고, 예측 결과들을 기초로 후보해들 중 일부를 선택하는 것을 특징으로 하는 상태 예측 방법.
  5. 청구항 4에 있어서,
    선택 단계는,
    예측된 트래픽 데이터들과 수집된 상태 데이터 전부를 이용하여 예측한 트래픽 데이터 간의 차이를 기초로 후보해들 중 일부를 선택하는 것을 특징으로 하는 상태 예측 방법.
  6. 삭제
  7. 청구항 1에 있어서,
    선별 단계는,
    상관도가 높은 상태 데이터들이 모두 선별되는 것을 배제하는 것을 특징으로 하는 상태 예측 방법.
  8. 청구항 1에 있어서,
    선별 단계는,
    위치가 인접한 시스템들에서 생성되는 상태 데이터들이 모두 선별되는 것을 배제하는 것을 특징으로 하는 상태 예측 방법.
  9. 청구항 1에 있어서,
    선별 단계는,
    직접 연결된 시스템들에서 생성되는 상태 데이터들이 모두 선별되는 것을 배제하는 것을 특징으로 하는 상태 예측 방법.
  10. 상위 시스템을 구성하는 다수의 시스템들에서 각각 생성되는 상태 데이터들을 수집하는 수집부;
    유전 알고리즘을 이용하여, 수집된 상태 데이터들 중 일부를 선정하는 선정부;
    머신러닝 모델을 이용하여, 선정된 상태 데이터들로부터 상위 시스템의 미래 상태 데이터를 예측하는 예측부;를 포함하고,
    선정부는,
    수집된 상태 데이터들을 평균한 평균 상태 데이터를 산출하고, 산출한 평균 상태 데이터와 유사도가 높은 순서대로 일부의 상태 데이터들을 선별하며, 선별된 상태 데이터들을 초기해가 지정하도록 설정하며,
    설정된 초기해에 대해 교차 및 변이 연산을 수행하여 후보해 집단을 생성하고,
    후보해 집단에 포함된 후보해들 중 일부를 선택하며,
    선택된 후보해들에 대해 교차 및 변이 연산을 수행하여 후보해 집단에 추가하고,
    선택과 추가를 반복하여, 최종해를 결정하는 것을 특징으로 하는 상태 예측 시스템.
  11. 상위 시스템을 구성하는 다수의 시스템들에서 각각 생성되는 상태 데이터들을 수집하는 단계;
    유전 알고리즘을 이용하여, 수집된 상태 데이터들 중 일부를 대표 데이터로 선정하는 단계;를 포함하고,
    선정 단계는,
    수집된 상태 데이터들 중 일부를 지정하는 초기해를 설정하는 단계;
    설정된 초기해에 대해 교차 및 변이 연산을 수행하여 후보해 집단을 생성하는 단계;
    후보해 집단에 포함된 후보해들 중 일부를 선택하는 단계:
    선택된 후보해들에 대해 교차 및 변이 연산을 수행하여 후보해 집단에 추가하는 단계;
    선택 단계와 추가 단계를 반복하여, 최종해를 결정하는 단계;를 포함하며,
    설정 단계는,
    수집된 상태 데이터들을 평균한 평균 상태 데이터를 산출하고, 산출한 평균 상태 데이터와 유사도가 높은 순서대로 일부의 상태 데이터들을 선별하는 단계;
    선별 단계에서 선별된 상태 데이터들을 초기해가 지정하도록 설정하는 단계;를 포함하는 것을 특징으로 하는 데이터 선정 방법.
  12. 상위 시스템을 구성하는 다수의 시스템들에서 각각 생성되는 상태 데이터들을 수집하는 수집부;
    유전 알고리즘을 이용하여, 수집된 상태 데이터들 중 일부를 대표 데이터로 선정하는 선정부;를 포함하고,
    선정부는,
    수집된 상태 데이터들을 평균한 평균 상태 데이터를 산출하고, 산출한 평균 상태 데이터와 유사도가 높은 순서대로 일부의 상태 데이터들을 선별하며, 선별된 상태 데이터들을 초기해가 지정하도록 설정하며,
    설정된 초기해에 대해 교차 및 변이 연산을 수행하여 후보해 집단을 생성하고,
    후보해 집단에 포함된 후보해들 중 일부를 선택하며,
    선택된 후보해들에 대해 교차 및 변이 연산을 수행하여 후보해 집단에 추가하고,
    선택과 추가를 반복하여, 최종해를 결정하는 것을 특징으로 하는 데이터 선정 시스템.
KR1020210146311A 2021-10-29 2021-10-29 머신러닝 모델 최적화를 위한 유전 알고리즘 기반 대표 데이터 선정 방법 KR102628595B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210146311A KR102628595B1 (ko) 2021-10-29 2021-10-29 머신러닝 모델 최적화를 위한 유전 알고리즘 기반 대표 데이터 선정 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210146311A KR102628595B1 (ko) 2021-10-29 2021-10-29 머신러닝 모델 최적화를 위한 유전 알고리즘 기반 대표 데이터 선정 방법

Publications (2)

Publication Number Publication Date
KR20230061755A KR20230061755A (ko) 2023-05-09
KR102628595B1 true KR102628595B1 (ko) 2024-01-25

Family

ID=86409508

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210146311A KR102628595B1 (ko) 2021-10-29 2021-10-29 머신러닝 모델 최적화를 위한 유전 알고리즘 기반 대표 데이터 선정 방법

Country Status (1)

Country Link
KR (1) KR102628595B1 (ko)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101863324B1 (ko) * 2015-12-31 2018-05-31 서강대학교산학협력단 클라우드 환경에서 네트워크 기능 가상화의 서비스 기능 체이닝을 위한 가상 네트워크 기능 배치 및 재구성 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
이정석 등., 유전 알고리즘을 활용한 부유식 해상풍력단지 최적위치 선정, Journal of the Korean Society of Marine Environment & Safety Research Paper Vol. 25, No. 6, 658-665pages (2019. 10. 31.)*

Also Published As

Publication number Publication date
KR20230061755A (ko) 2023-05-09

Similar Documents

Publication Publication Date Title
CN109951392B (zh) 一种基于深度学习的中大型网络智能路由选择方法
CN112270398B (zh) 一种基于基因编程的集群行为学习方法
JP2022007168A (ja) 学習プログラム、学習方法および情報処理装置
JP2019159836A (ja) 学習プログラム、学習方法および学習装置
CN116108384A (zh) 一种神经网络架构搜索方法、装置、电子设备及存储介质
KR102628595B1 (ko) 머신러닝 모델 최적화를 위한 유전 알고리즘 기반 대표 데이터 선정 방법
KR102559605B1 (ko) 함수 최적화 방법 및 장치
KR102428572B1 (ko) 유전자 알고리즘을 이용한 경량 인공지능 알고리즘의 하이퍼 파라미터 최적화 방법
US20190205763A1 (en) Information processing device, information processing method and information processing program
US20210397948A1 (en) Learning method and information processing apparatus
CN112415337A (zh) 一种基于动态集合覆盖的配电网故障诊断方法
CN111985644B (zh) 神经网络生成方法及装置、电子设备及存储介质
US20210081786A1 (en) Information processing apparatus, non-transitory computer-readable storage medium for storing program, and information processing method
JP2007213441A (ja) 多変数決定木構築システム、多変数決定木構築方法および多変数決定木を構築するためのプログラム
CN112036566A (zh) 使用遗传算法选取特征的方法和装置
Feng et al. Learning-based gaussian belief propagation for bundle adjustment in visual slam
TWI806496B (zh) 遞迴貝式網路建構系統、遞迴貝式網路建構方法、電腦可讀取記錄媒體、非暫時性電腦程式產品及無線網路控制系統
CN116502002A (zh) 页面异常检测方法及装置
CN116974830A (zh) 一种基于遗传算法的寻找最优dram检测算法的方法及系统
KR102534090B1 (ko) 샴 네트워크 기반 객체 추적 장치 및 객체 추적 방법
CN117974194A (zh) 基于自适应nsga-ii-svr的造价预测方法、装置及系统
KR101105082B1 (ko) 우선순위를 이용한 유전자 진화 방법 및 그를 이용한무선망 최적화 방법
CN118535875A (zh) 工序随机失效的退役机电产品拆解方法、装置及设备
Chaaban et al. Cost optimization and high available heterogeneous series-parallel redundant system design using genetic algorithms
JP2023138928A (ja) ニューラルネットワークを生成するための方法及び装置

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right