KR102472449B1 - Risk analysis system and method of social advanced persistent threat using AI and similarity analysis - Google Patents

Risk analysis system and method of social advanced persistent threat using AI and similarity analysis Download PDF

Info

Publication number
KR102472449B1
KR102472449B1 KR1020200159959A KR20200159959A KR102472449B1 KR 102472449 B1 KR102472449 B1 KR 102472449B1 KR 1020200159959 A KR1020200159959 A KR 1020200159959A KR 20200159959 A KR20200159959 A KR 20200159959A KR 102472449 B1 KR102472449 B1 KR 102472449B1
Authority
KR
South Korea
Prior art keywords
data
social issue
analysis
social
risk
Prior art date
Application number
KR1020200159959A
Other languages
Korean (ko)
Other versions
KR20220072399A (en
Inventor
남기효
김윤홍
정연재
Original Assignee
(주)유엠로직스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)유엠로직스 filed Critical (주)유엠로직스
Priority to KR1020200159959A priority Critical patent/KR102472449B1/en
Publication of KR20220072399A publication Critical patent/KR20220072399A/en
Application granted granted Critical
Publication of KR102472449B1 publication Critical patent/KR102472449B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템 및 그 분석 방법에 관한 것으로서, 더욱 상세하게는, 사이버 표적공격(APT, Advanced Persistent Threat) 발생시, 발생한 상기 사이버 표적공격에 대한 관련 데이터들을 수집하고, 분석 대상 사이트들의 크롤링을 수행하여 상기 사이버 표적공격 발생을 기준으로 소정기간 전부터 소정기간 후까지의 사회이슈 데이터들을 수집하여, 이들을 통합 분석하는 사회이슈 처리부(100) 및 상기 사회이슈 처리부(100)에서 통합 분석한 데이터들을 전달받아, 기설정된 AI 기법을 이용하여 학습을 수행하여, 학습 결과를 이용하여 새롭게 입력되는 신규 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 SAPT 분석부(200)를 포함하여 구성되는 것을 특징으로 하는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템에 관한 것이다.The present invention relates to a system for analyzing the risk of a cyber target attack based on social issues using AI and a correlation analysis technique, and a method for analyzing the same, and more particularly, when a cyber target attack (APT, Advanced Persistent Threat) occurs, the generated cyber target A social issue processing unit 100 that collects data related to attacks, performs crawling of analysis target sites, collects social issue data from before a predetermined period before a predetermined period after the occurrence of the cyber target attack, and analyzes them in an integrated manner. And receiving the data integrated and analyzed by the social issue processing unit 100, learning is performed using a preset AI technique, and using the learning result, social issue-based cyber target attacks on new social issue data that are newly input It relates to a risk analysis system for cyber target attacks based on social issues using AI and correlation analysis techniques, characterized in that it comprises a SAPT analysis unit 200 for analyzing risk.

Figure 112020127009498-pat00001
Figure 112020127009498-pat00001

Description

AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템 및 그 분석 방법 {Risk analysis system and method of social advanced persistent threat using AI and similarity analysis}Risk analysis system and method of social advanced persistent threat using AI and similarity analysis}

본 발명은 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템 및 그 분석 방법에 관한 것으로, 더욱 상세하게는 기존에 수집되지 않았던 신규 사회이슈 키워드에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석할 수 있는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템 및 그 분석 방법에 관한 것이다.The present invention relates to a risk analysis system for cyber target attacks based on social issues using AI and correlation analysis techniques and a method for analyzing the same, and more particularly, to a social issue based cyber target attack on new social issue keywords that have not been previously collected. It is about a risk analysis system and analysis method for cyber target attacks based on social issues using AI and correlation analysis techniques that can analyze the risk of

사회이슈를 기반으로 한 사이버 표적공격(SAPT, Social Advanced Persistent Threat)의 경우, 해당하는 사회이슈와 연관된 여러 기관들에 대해 연쇄적으로 발생하는 특징을 가지고 있다.In the case of cyber targeted attacks (SAPT, Social Advanced Persistent Threat) based on social issues, it has the characteristic of occurring in a chain against several institutions related to the corresponding social issue.

일 예로 2018년 평창올림픽이 개막하는 날 발생한 사이버 표적공격을 들 수 있다. 상세하게는, 러시아에서 약물 사용으로 인해 평창 올림픽에 출전이 금지됨으로 인해, 러시아 추정의 해킹 공격이 이루어진 사건으로, 러시아 해커조직 '팬시 베어스'에서 국제 올림픽 위원회 및 세계 도핑 기구를 해킹하였으며, 이 후에도 올림픽 조직 위원회 등 평창 올림픽 관련 홈페이지를 겨냥한 사이버 표적공격이 발생함으로써, 평창 올림픽의 입장권 예매가 지연되는 등의 문제가 발생했다. 즉, '평창 올림픽'이라는 사회적 이슈를 기반으로 사이버 표적공격이 발생하였으며, '평창 올림픽'과 연관된 여러 기관들인 국제 올림픽 위원회, 세계 도핑 기구, 올림픽 조직 위원회 등에 대해 연쇄적으로 발생하였다.One example is the cyber-targeted attack that occurred on the opening day of the 2018 Pyeongchang Olympics. In detail, Russia was banned from participating in the PyeongChang Olympics due to drug use, and as a result, a hacking attack was allegedly made in Russia. The Russian hacker organization 'Fancy Bears' hacked the International Olympic Committee and the World Doping Agency, and even after Due to cyber targeted attacks targeting PyeongChang Olympic-related websites such as the Olympic Organizing Committee, problems such as delays in ticket reservations for the PyeongChang Olympic Games occurred. In other words, cyber-targeted attacks occurred based on the social issue of 'PyeongChang Olympics', and occurred in succession to various organizations related to 'PyeongChang Olympics' such as the International Olympic Committee, World Doping Agency, and Olympic Organizing Committee.

이와 같이, 국가 간의 분쟁과 같은 특정 사회이슈 발생시, 사이버 표적공격이 주로 발생하고 있으며, 이러한 특정 분쟁이나 이슈가 있을 때 발생하는 사이버 표적공격을 '사회이슈 기반 사이버 표적공격'이라 정의하는 것이 바람직하다.As such, when a specific social issue such as a dispute between countries occurs, cyber targeted attacks mainly occur, and it is desirable to define cyber targeted attacks that occur when such specific disputes or issues occur as 'social issue-based cyber targeted attacks'. .

이러한 점을 이용하여, 종래에는 사이버 표적공격 발생시, 해당 기간 동안 언론사의 웹 페이지나 SNS의 해쉬태그 등을 크롤링하여, 해당 기간 동안의 사회이슈 키워드를 도출하고, 도출한 사회이슈 키워드와 사이버 표적공격 간의 상관관계를 분석하여, 사회이슈 기반 사이버 표적공격의 위험도가 있는 사회이슈 키워드를 산정하고 있다. 이를 통해서, 동일한 사회이슈 키워드가 도출될 경우, 해당하는 사이버 표적공격의 위험도 분석에 활용하고 있다.Using this point, conventionally, when a cyber target attack occurs, social issue keywords for the period are derived by crawling media web pages or SNS hash tags during the corresponding period, and the derived social issue keywords and cyber target attacks are used. By analyzing the correlation between social issues, social issue keywords with a risk of social issue-based cyber target attacks are calculated. Through this, when the same social issue keyword is derived, it is used to analyze the risk of the corresponding cyber target attack.

그렇지만, 기존에 발견되지 않았던 신규 사회이슈 키워드에 대해서는 기존의 사회이슈 키워드들과의 연관성이 존재하지 않기 때문에, 사회이슈 기반 사이버 표적공격의 위험도 분석이 불가능한 문제점이 있다.However, there is a problem in that it is impossible to analyze the risk of a cyber target attack based on social issues because there is no correlation with existing social issue keywords for new social issue keywords that have not been previously discovered.

이와 관련해서, 국내등록특허 제10-1781450호("사이버 공격에 대한 위험도 산출 방법 및 장치")에서는, 사이버 공격과 연관된 침해 사고 정보를 분석하여 사이버 공격의 위험도를 정량적으로 산출하는 기술을 개시하고 있다.In this regard, Korean Patent Registration No. 10-1781450 ("Method and Apparatus for Calculating Risk for Cyber Attack") discloses a technique for quantitatively calculating the risk of cyber attack by analyzing cyber attack information, have.

국내등록특허 제10-1781450호(등록일자 2017.09.19.)Domestic Patent Registration No. 10-1781450 (Registration date 2017.09.19.)

본 발명은 상기한 바와 같은 종래 기술의 문제점을 해결하기 위하여 안출된 것으로, 본 발명의 목적은 기존에 수집되지 않았던 신규 사회이슈 키워드에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하기 위하여, 기존에 분석이 완료된 사회이슈 키워드와 신규 사회이슈 키워드 간의 상관도 분석을 통해 분석 결과를 활용하여 신규 사회이슈 키워드에 대한 사회이슈 기반 사이버 표적공격의 위험도를 산정할 수 있는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템 및 그 분석 방법을 제공하는 것이다.The present invention was made to solve the problems of the prior art as described above, and an object of the present invention is to analyze the risk of a social issue-based cyber target attack on new social issue keywords that have not been previously collected. A society using AI and correlation analysis techniques that can calculate the risk of social issue-based cyber targeted attacks on new social issue keywords by utilizing the analysis results through correlation analysis between analyzed social issue keywords and new social issue keywords. It is to provide an issue-based cyber target risk analysis system and its analysis method.

본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템은, 사이버 표적공격(APT, Advanced Persistent Threat) 발생시, 발생한 상기 사이버 표적공격에 대한 관련 데이터들을 수집하고, 분석 대상 사이트들의 크롤링을 수행하여 상기 사이버 표적공격 발생을 기준으로 소정기간 전부터 소정기간 후까지의 사회이슈 데이터들을 수집하여, 이들을 통합 분석하는 사회이슈 처리부(100) 및 상기 사회이슈 처리부(100)에서 통합 분석한 데이터들을 전달받아, 기설정된 AI 기법을 이용하여 학습을 수행하여, 학습 결과를 이용하여 새롭게 입력되는 신규 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 SAPT 분석부(200)를 포함하여 구성되는 것이 바람직하다.The risk analysis system of social issue-based cyber target attacks using AI and correlation analysis techniques according to an embodiment of the present invention, when a cyber target attack (APT, Advanced Persistent Threat) occurs, related data on the generated cyber target attack The social issue processing unit 100 and the social issue processing unit ( SAPT analysis that receives the data integrated and analyzed in 100), performs learning using a preset AI technique, and analyzes the risk of social issue-based cyber target attacks on newly entered social issue data using the learning result It is preferably configured to include the unit 200.

더 나아가, 상기 사회이슈 처리부(100)는 사이버 표적공격 발생시, 발생한 상기 사이버 표적공격에 대한 관련 데이터들을 수집하고, 분석 대상 사이트들의 크롤링을 수행하여 상기 사이버 표적공격 발생을 기준으로 소정기간 전부터 소정기간 후까지의 사회이슈 데이터들을 수집하는 데이터 수집부(110) 및 상기 데이터 수집부(110)에서 수집한 상기 사이버 표적공격에 대한 관련 데이터들과 상기 사회이슈 데이터들 간의 상관도 분석을 수행하여, 각각의 상기 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 데이터 분석부(120)를 더 포함하여 구성되는 것이 바람직하다.Furthermore, when a cyber targeted attack occurs, the social issue processing unit 100 collects data related to the cyber targeted attack and performs crawling of analysis target sites for a predetermined period of time prior to a predetermined period based on the occurrence of the cyber targeted attack. A data collection unit 110 that collects social issue data until after the data collection unit 110 and analyzes the correlation between the data related to the cyber target attack collected by the data collection unit 110 and the social issue data, respectively. It is preferable to further include a data analysis unit 120 that analyzes the risk of a social issue-based cyber target attack on the social issue data of the above.

더 나아가, 상기 SAPT 분석부(200)는 상기 사회이슈 처리부(100)에서 통합 분석한 데이터들을 전달받아, AI 기법에서의 학습을 위한 학습 데이터를 생성하고, 생성한 학습 데이터를 적용하여 AI 학습을 수행하는 학습 처리부(210), 상기 사회이슈 처리부(100)에서 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터를 기반으로 입력되는 신규 사회이슈 데이터의 중복 여부를 판단하는 중복 처리부(220) 및 상기 중복 처리부(220)의 판단 결과에 따라 입력되는 데이터를 이용하여 상기 학습 처리부(210)에서의 학습 결과에 의한 학습 모델에 적용하여 분석 결과를 통해 입력되는 데이터의 사회이슈 기반 사이버 표적공격의 위험도를 산정하는 결과 분석부(230)를 더 포함하여 구성되는 것이 바람직하다.Furthermore, the SAPT analysis unit 200 receives the data integrated and analyzed by the social issue processing unit 100, generates learning data for learning in the AI technique, and applies the generated learning data to perform AI learning. A learning processing unit 210 that performs, a redundancy processing unit 220 that determines whether new social issue data is duplicated based on the social issue data included in the integrated analysis data transmitted from the social issue processing unit 100, and The data input according to the determination result of the redundancy processing unit 220 is applied to the learning model based on the learning result in the learning processing unit 210, and the risk of cyber target attack based on social issues of the data input through the analysis result It is preferable to further include a result analysis unit 230 for calculating .

더 나아가, 상기 SAPT 분석부(200)는 상기 중복 처리부(220)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 상기 사회이슈 데이터와 중복될 경우, 상기 신규 사회이슈 데이터를 그대로 상기 결과 분석부(230)로 입력하여, 데이터 분석을 수행하는 것이 바람직하다.Furthermore, if the new social issue data overlaps with the social issue data according to the determination result of the overlap processing unit 220, the SAPT analysis unit 200 transmits the new social issue data as it is to the result analysis unit ( 230) to perform data analysis.

더 나아가, 상기 SAPT 분석부(200)는 상기 중복 처리부(220)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 상기 사회이슈 데이터와 중복되지 않을 경우, 상기 신규 사회이슈 데이터와 상기 사회이슈 데이터 간의 상관도 분석을 수행하는 상관도 분석부(240)를 더 포함하여 구성되며, 상기 상관도 분석부(240)는 상기 신규 사회이슈 데이터와 상기 사회이슈 데이터 간의 상관도 분석을 수행하여, 상기 사회이슈 데이터 중 가장 높은 상관도의 사회이슈 데이터를 추출하여, 상기 추출한 사회이슈 데이터를 상기 결과 분석부(230)로 입력하여, 데이터 분석을 수행하는 것이 바람직하다.Furthermore, the SAPT analysis unit 200, according to the determination result of the overlapping processing unit 220, if the new social issue data does not overlap with the social issue data, the new social issue data and the social issue data It is configured to further include a correlation analysis unit 240 that performs a correlation analysis, wherein the correlation analysis unit 240 performs a correlation analysis between the new social issue data and the social issue data, It is preferable to perform data analysis by extracting social issue data having the highest correlation among the data and inputting the extracted social issue data to the result analysis unit 230 .

더 나아가, 상기 결과 분석부(230)는 상기 상관도 분석부(240)에 의해 데이터가 입력될 경우, 입력되는 데이터에 의한 분석 결과에 기설정된 상관계수 값을 적용하여, 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 초기 위험도를 산정하는 것이 바람직하다.Furthermore, when the data is input by the correlation analysis unit 240, the result analysis unit 230 applies a predetermined correlation coefficient value to the analysis result based on the input data to determine the new social issue data. It is desirable to calculate the initial risk of cyber targeted attacks based on social issues.

더 나아가, 상기 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템은 상기 결과 분석부(230)에 의해 사회이슈 기반 사이버 표적공격의 초기 위험도가 산정된 상기 신규 사회이슈 데이터를 상기 사회이슈 처리부(100)로 전달하여, 사회이슈 기반 사이버 표적공격의 위험도를 추가 분석하는 것이 바람직하다.Furthermore, the risk analysis system of social issue-based cyber target attacks using the AI and correlation analysis technique uses the new social issue data for which the initial risk of social issue-based cyber target attacks has been calculated by the result analysis unit 230. It is desirable to further analyze the risk of a social issue-based cyber target attack by transmitting it to the social issue processing unit 100.

본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법은, 사회이슈 처리부에서, 사이버 표적공격(APT, Advanced Persistent Threat) 발생시, 발생한 사이버 표적공격에 대한 관련 데이터들과, 분석 대상 사이트들의 크롤링을 수행하여 상기 사이버 표적공격 발생을 기준으로 소정기간 전부터 소정기간 후까지의 사회이슈 데이터들을 수집하는 데이터 수집단계(S100), 사회이슈 처리부에서, 상기 데이터 수집단계(S100)에 의해 수집한 상기 데이터들 간의 상관도 분석을 수행하여, 각각의 상기 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 데이터 분석단계(S200), SAPT 분석부에서, 상기 데이터 분석단계(S200)에 의해 분석한 데이터들을 이용하여, AI 기법에서의 학습을 위한 학습 데이터로 생성하는 학습 데이터 생성단계(S300), SAPT 분석부에서, 상기 학습 데이터 생성단계(S300)에 의한 학습 데이터를 적용하여 기저장된 AI 학습을 수행하는 학습 단계(S400), SAPT 분석부에서, 학습을 수행하고 난 후, 상기 데이터 수집단계(S100)에 의해 수집된 신규 사회이슈 데이터가 입력되는 신규 데이터 입력단계(S500), SAPT 분석부에서, 상기 학습 데이터 생성단계(S300)에 의해 학습 데이터로 이용된 상기 데이터들에 포함되어 있는 상기 사회이슈 데이터를 기반으로 상기 신규 데이터 입력단계(S500)에 의해 입력된 상기 신규 사회이슈 데이터의 중복 여부를 판단하는 중복 판단단계(S600) 및 SAPT 분석부에서, 상기 중복 판단단계(S600)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 상기 사회이슈 데이터와 중복될 경우, 상기 학습 단계(S400)에 의한 학습 모델에 상기 신규 사회이슈 데이터를 그대로 적용하여, 분석 결과를 통해 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 위험도를 산정하는 제1 위험도 분석단계(S700)를 포함하여 구성되는 것이 바람직하다.A method for analyzing the risk of a cyber target attack based on social issues using an AI and correlation analysis technique according to an embodiment of the present invention is a method for analyzing the risk of a cyber target attack based on a social issue processing unit when an Advanced Persistent Threat (APT) occurs. A data collection step (S100) of collecting social issue data from before a predetermined period to a predetermined period after a predetermined period based on the occurrence of the cyber target attack by crawling the analysis target sites and data related to the cyber target, in the social issue processing unit, the data In the data analysis step (S200) of performing correlation analysis between the data collected in the collection step (S100) and analyzing the risk of social issue-based cyber target attacks for each of the social issue data, the SAPT analysis unit , Using the data analyzed by the data analysis step (S200), the learning data generation step (S300) of generating learning data for learning in the AI technique, the learning data generation step (S300) in the SAPT analysis unit A learning step of performing pre-stored AI learning by applying the learning data by (S400), in the SAPT analysis unit, after performing the learning, the new social issue data collected by the data collection step (S100) is input New data input step (S500), in the SAPT analysis unit, the new data input step (S500) based on the social issue data included in the data used as learning data by the learning data generation step (S300) In the redundancy determination step (S600) of determining whether the new social issue data input by the overlapping or not, and in the SAPT analysis unit, according to the determination result of the redundancy determination step (S600), the new social issue data is the social issue data If it overlaps with, the first risk of calculating the risk of a cyber target attack based on the social issue of the new social issue data through the analysis result by applying the new social issue data as it is to the learning model by the learning step (S400) Including the analysis step (S700) It is preferable to be configured together.

더 나아가, 상기 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법은 SAPT 분석부에서, 상기 중복 판단단계(S600)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 상기 사회이슈 데이터와 중복되지 않을 경우, 상기 학습 데이터 생성단계(S300)에 의해 학습 데이터로 이용된 상기 데이터들에 포함되어 있는 상기 사회이슈 데이터와 상기 신규 사회이슈 데이터 간의 상관도 분석을 수행하는 상관도 분석단계(S800), SAPT 분석부에서, 상기 상관도 분석단계(S800)에 의한 분석 결과에 따라, 상기 사회이슈 데이터 중 상기 신규 사회이슈 데이터와 가장 높은 상관도의 사회이슈 데이터를 추출하여, 상기 학습 단계(S400)에 의한 학습 모델에 상기 추출한 사회이슈 데이터를 적용하여, 분석 결과를 통해 상기 추출한 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 제2 위험도 분석단계(S900) 및 SAPT 분석부에서, 상기 제2 위험도 분석단계(S900)에 의해 분석한 상기 추출한 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 위험도에 기설정된 상관계수 값을 적용하여 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 초기 위험도를 산정하는 신규 위험도 산정단계(S1000)를 더 포함하여 구성되는 것이 바람직하다.Furthermore, in the risk analysis method of social issue-based cyber target attacks using the AI and correlation analysis technique, in the SAPT analysis unit, according to the determination result of the redundancy determination step (S600), the new social issue data is the social issue A correlation analysis step of performing a correlation analysis between the social issue data and the new social issue data included in the data used as learning data by the learning data generation step (S300) if it does not overlap with the data. (S800), in the SAPT analysis unit, according to the analysis result of the correlation analysis step (S800), social issue data having the highest correlation with the new social issue data is extracted from among the social issue data, and the learning step is performed. A second risk analysis step (S900) of applying the extracted social issue data to the learning model in (S400) and analyzing the risk of a cyber target attack based on the social issue of the extracted social issue data through the analysis result (S900) and SAPT analysis unit In the second risk analysis step (S900), the social issue-based cyber target attack of the new social issue data is applied by applying a predetermined correlation coefficient value to the risk of the social issue-based cyber target attack of the extracted social issue data. It is preferable to further include a new risk calculation step (S1000) of calculating the initial risk of.

더 나아가, 상기 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법은 SAPT 분석부에서, 상기 신규 위험도 산정단계(S1000)에 의해 산정한 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 초기 위험도를 상기 데이터 분석단계(S200)로 전달하여, 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 위험도에 대한 추가 분석을 수행하는 추가 분석단계(S1100)를 더 포함하여 구성되는 것이 바람직하다.Furthermore, the risk analysis method of the social issue-based cyber target attack using the AI and correlation analysis technique is the social issue-based cyber attack of the new social issue data calculated by the new risk calculation step (S1000) in the SAPT analysis unit. An additional analysis step (S1100) of transmitting the initial risk of the target attack to the data analysis step (S200) and performing additional analysis on the risk of the social issue-based cyber target attack of the new social issue data. it is desirable

상기와 같은 구성에 의한 본 발명의 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템 및 그 분석 방법은 기존에 분석이 완료된 사회이슈 키워드와 신규 사회이슈 키워드 간의 상관도 분석을 통해 분석 결과를 활용하여 신규 사회이슈 키워드에 대한 사회이슈 기반 사이버 표적공격의 위험도를 산정할 수 있는 장점이 있다.The risk analysis system and analysis method of social issue-based cyber target attacks using the AI and correlation analysis technique of the present invention according to the configuration as described above analyze the correlation between previously analyzed social issue keywords and new social issue keywords. It has the advantage of being able to calculate the risk of a cyber target attack based on social issues for new social issue keywords by using the analysis results.

이를 통해서, 신규 사회이슈 키워드가 수집되더라도 신속하게 신규 사회이슈 키워드에 대한 사이버 표적공격의 초기 위험도를 산정하여 이에 맞는 대응 조치를 취하면서, 이에 대한 신규 사회이슈 키워드에 대한 사이버 표적공격의 위험도에 대한 세부 분석을 동시에 수행할 수 있어, 신규 사회이슈 키워드 기반 사이버 표적공격의 피해를 최소화할 수 있는 장점이 있다.Through this, even if new social issue keywords are collected, the initial risk of cyber-targeted attacks on new social issue keywords is quickly calculated and appropriate countermeasures are taken, while the risk of cyber-targeted attacks on new social issue keywords is calculated. It has the advantage of minimizing the damage of cyber target attacks based on new social issue keywords as detailed analysis can be performed at the same time.

도 1은 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템을 나타낸 구성 예시도이다.
도 2는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법을 나타낸 순서 예시도이다.
1 is an exemplary configuration diagram showing a risk analysis system for a cyber target attack based on social issues using AI and a correlation analysis technique.
2 is an exemplary sequence diagram showing a method of analyzing the risk of a cyber target attack based on social issues using AI and a correlation analysis technique.

이하 첨부한 도면들을 참조하여 본 발명의 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템 및 그 분석 방법을 상세히 설명한다. 다음에 소개되는 도면들은 당업자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 예로서 제공되는 것이다. 따라서, 본 발명은 이하 제시되는 도면들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 또한, 명세서 전반에 걸쳐서 동일한 참조번호들은 동일한 구성요소들을 나타낸다.Hereinafter, with reference to the accompanying drawings, a risk analysis system and analysis method of a cyber target attack based on social issues using the AI and correlation analysis technique of the present invention will be described in detail. The drawings introduced below are provided as examples to sufficiently convey the spirit of the present invention to those skilled in the art. Accordingly, the present invention may be embodied in other forms without being limited to the drawings presented below. Also, like reference numerals denote like elements throughout the specification.

이 때, 사용되는 기술 용어 및 과학 용어에 있어서 다른 정의가 없다면, 이 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 통상적으로 이해하고 있는 의미를 가지며, 하기의 설명 및 첨부 도면에서 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 설명은 생략한다.At this time, unless there is another definition in the technical terms and scientific terms used, they have meanings commonly understood by those of ordinary skill in the art to which this invention belongs, and the gist of the present invention in the following description and accompanying drawings Descriptions of known functions and configurations that may unnecessarily obscure are omitted.

더불어, 시스템은 필요한 기능을 수행하기 위하여 조직화되고 규칙적으로 상호 작용하는 장치, 기구 및 수단 등을 포함하는 구성 요소들의 집합을 의미한다.In addition, a system refers to a set of components including devices, mechanisms, and means that are organized and regularly interact to perform necessary functions.

종래에는 발생되었던 사이버 표적공격을 기준으로, 특정기간 동안의 사회이슈 키워드를 수집하여, 발생한 사이버 표적공격이 사회이슈 기반 사이버 표적공격인지 분석하면서, 분석 결과들을 수집하여, 이를 딥러닝 등 AI 학습 알고리즘을 이용하여 학습을 수행해 왔다. 학습 결과를 이용하여, 동일한 사회이슈 키워드가 발견될 경우, 분석 결과를 토대로 해당하는 사회이슈 기반 사이버 표적공격에 대한 대비 또는, 해당하는 사회이슈 기반 사이버 표적공격의 위험도를 분석하여, 이에 대한 대응책이 마련될 수 있도록 하고 있다. 그렇지만, 상술한 바와 같이, 기존에 발견되지 않았던 신규 사회이슈 키워드가 발견될 경우, 기존의 사회이슈 키워드들과의 연관성에 대한 분석이 이루어지지 않았기 때문에, 이를 통한 사회이슈 기반 사이버 표적공격의 위험도 분석 또는 이를 통한 사회이슈 기반 사이버 표적공격의 탐지/예측 등이 불가능했다.Based on the cyber target attacks that have occurred in the past, social issue keywords for a specific period are collected, analyzing whether the cyber target attacks that have occurred are social issue based cyber target attacks, collecting analysis results, and AI learning algorithms such as deep learning has been used for learning. Using the learning result, if the same social issue keyword is found, prepare for the corresponding social issue-based cyber target attack based on the analysis result, or analyze the risk of the corresponding social issue-based cyber target attack, and take a countermeasure. are making it possible. However, as described above, when a new social issue keyword that has not been previously discovered is found, the analysis of the relationship with the existing social issue keywords has not been performed, so the risk analysis of social issue-based cyber target attacks through this analysis Alternatively, it was impossible to detect/predict cyber target attacks based on social issues.

그렇기 때문에 본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템 및 그 분석 방법은, 신규 사회이슈 키워드가 발견될 경우, 기존의 사회이슈 키워드들과의 상관도 분석을 통해서, 상관관계가 가장 높은 사회이슈 키워드를 도출하여, 이를 활용하여 신규 사회이슈 키워드의 사회이슈 기반 사이버 표적공격의 위험도 분석을 수행하는 것이 바람직하다.Therefore, the risk analysis system and analysis method of social issue-based cyber target attacks using AI and correlation analysis techniques according to an embodiment of the present invention, when a new social issue keyword is discovered, It is desirable to derive social issue keywords with the highest correlation through correlation analysis, and to use them to analyze the risk of cyber target attacks based on social issues of new social issue keywords.

도 1은 본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템을 나타낸 구성 예시도로서, 도 1을 참조로 하여, 본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템에 대해서 상세히 설명하도록 한다.1 is an exemplary configuration diagram showing a risk analysis system of a cyber target attack based on social issues using an AI and correlation analysis technique according to an embodiment of the present invention. Referring to FIG. 1, in one embodiment of the present invention We will explain in detail the risk analysis system of social issue-based cyber target attacks using AI and correlation analysis techniques according to this study.

본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템은 도 1에 도시된 바와 같이, 사회이슈 처리부(100) 및 SAPT 분석부(200)를 포함하여 구성되는 것이 바람직하며, 각 구성들은 하나의 연산처리수단 또는 연결되어 있는 각각의 연산처리수단에 구비되어 동작을 수행하는 것이 바람직하다.A risk analysis system for cyber target attacks based on social issues using AI and correlation analysis techniques according to an embodiment of the present invention includes a social issue processing unit 100 and a SAPT analysis unit 200, as shown in FIG. Preferably, each component is provided in one calculation processing unit or each connected calculation processing unit to perform an operation.

각 구성에 대해서 자세히 알아보자면,For a detailed look at each component,

상기 사회이슈 처리부(100)는 사이버 표적공격 발생시, 발생한 상기 사이버 표적공격에 대한 관련 데이터들을 수집하고, 분석 대상 사이트들의 크롤링을 수행하여, 상기 사이버 표적공격 발생을 기준으로 소정기간 전부터 소정기간 후까지의 사회이슈 데이터들을 수집하여, 이들을 통합 분석하는 것이 바람직하다.When a cyber targeted attack occurs, the social issue processing unit 100 collects data related to the cyber targeted attack and crawls analysis target sites, from before a predetermined period to after a predetermined period based on the occurrence of the cyber targeted attack. It is desirable to collect data on social issues and conduct an integrated analysis of them.

상기 사회이슈 처리부(100)는 도 1에 도시된 바와 같이, 데이터 수집부(110) 및 데이터 분석부(120)로 이루어지는 것이 바람직하며, 상기 데이터 수집부(110)는 사이버 표적공격 발생시, 발생한 상기 사이버 표적공격에 대한 관련 데이터들을 수집하고, 분석 대상 사이트들의 크롤링을 수행하여, 상기 사이버 표적공격 발생을 기준으로 소정기간 전부터 소정기간 후까지의 사회이슈 데이터들을 수집하는 것이 바람직하다.As shown in FIG. 1, the social issue processing unit 100 preferably consists of a data collection unit 110 and a data analysis unit 120. It is preferable to collect data related to cyber targeted attacks, perform crawling of analysis target sites, and collect social issue data from before a predetermined period to after a predetermined period based on the occurrence of the cyber targeted attacks.

상세하게는, 상기 데이터 수집부(110)는 수집하는 상기 사이버 표적공격에 대한 관련 데이터들로는, 사이버 표적공격 발생시, 발생한 상기 사이버 표적공격의 유형을 파악하여, 상기 사이버 표적공격이 발생할 당시의 공격대상 기관정보, 공격의 세부적인 유형 정보 등을 분석하여 수집하는 것이 바람직하다.In detail, the data collection unit 110 collects the data related to the cyber target attack, when a cyber target attack occurs, identifies the type of the cyber target attack, and identifies the attack target at the time the cyber target attack occurs. It is desirable to analyze and collect agency information and detailed type information of attacks.

일 예를 들자면, 발생한 상기 사이버 표적공격 별, 공격대상 기관정보, 공격 유형 정보 등을 데이터베이스화하여 저장 및 관리하는 것이 바람직하다.For example, it is preferable to store and manage the database for each cyber target attack that has occurred, attack target agency information, attack type information, and the like.

또한, 상기 데이터 수집부(110)는 상기 사회이슈 데이터들을 수집하는 것이 바람직하며, 상기 사이버 표적공격이 발생한 시점을 기준으로 소정기간 전부터 소정기간 후까지의 분석 대상 사이트들의 크롤링을 수행하여, 수집한 해당 사이트의 다양한 웹 문서 데이터(웹 페이지 데이터 등)들을 분석하여, 해당 기간에 발생한 사회이슈 데이터들을 수집하여 저장 및 관리하는 것이 바람직하다. 여기서 소정기간이란, 외부 관리자(사용자 등)로부터 입력받는 것이 바람직하다.In addition, it is preferable that the data collection unit 110 collects the social issue data, and crawls the analysis target sites from before a predetermined period to after a predetermined period based on the time when the cyber target attack occurred, and collects the collected data. It is desirable to analyze various web document data (web page data, etc.) of the site, collect, store, and manage social issue data that occurred during the period. Here, the predetermined period is preferably input from an external administrator (user, etc.).

이 때, 사회이슈 데이터란, 언론사 등에서 이슈화하여 내보내고 있는 기사들을 종합하여 볼 때 사회이슈를 추측할 수 있는데, 언론사들에서 발간(발행, 생성, 업로드 등)하는 기사들을 수집하여 이에 대한 주요 키워드들을 추출하는 것은 가능하다.At this time, social issue data can be inferred from social issues when looking at the articles that are issued and published by media outlets, etc., by collecting articles published (published, created, uploaded, etc.) It is possible to extract

가령 언론기사 분석을 통해, '정부'라는 키워드가 많이 나타났다고 분석될 경우, 단순히 해당 키워드만 가지고는 앞뒤 상황을 유추하기가 어려워 이를 사회이슈로 단정할 수 없을 뿐 아니라, 이를 사회이슈로 단정지었다 할지라도 추후에 이에 대한 사회상황 해석이 거의 불가능하게 된다.For example, if it is analyzed that the keyword 'government' appears a lot through analysis of media articles, it is difficult to infer the context from the keyword alone. Also, it becomes almost impossible to analyze the social situation in the future.

그렇기 때문에, 이러한 점을 감안하여, 언론사 등에서 이슈화하여 내보내고 있는 기사들을 수집하여, 수집한 기사들을 분석하여 발견된 핵심 키워드를 중심으로, 연관된 키워드들까지 같이 추출하여 하나의 그룹으로 묶어 이를 사회이슈로 도출함으로써, 특정 기간에 발생한 사회이슈 데이터와 더 나아가, 그리고 그 사회이슈가 발생한 이유, 경과 등을 일목요연하게 정리하여 확인할 수 있다.Therefore, taking this into account, we collect articles that have been issued as issues by media outlets, etc., analyze the collected articles, and extract related keywords, focusing on the core keywords found, and group them into one group to classify them as social issues. By deriving, it is possible to clearly organize and confirm the social issue data that occurred in a specific period, and furthermore, the reason and progress of the social issue.

이에 따라, 상기 데이터 수집부(110)에서 수집한 '사회이슈 키워드'는 단순히 하나의 단어가 아니라, 특정 기간에 이슈화되고 있는 키워드들, 다시 말하자면, 연관성이 있는 키워드들의 집합을 의미할 수도 있다.Accordingly, the 'social issue keywords' collected by the data collection unit 110 may not simply mean a single word, but may mean keywords that are becoming issues in a specific period, in other words, a set of related keywords.

다시 돌아가서 설명하자면, 상기 데이터 수집부(110)는 수집한 다양한 웹 문서 데이터들을 날짜별로 그룹화하여 관리할 수 있으며, 수집된 웹 문서 데이터 내에 다음 페이지 링크, 다시 말하자면, 추가 웹 문서 데이터에 대한 링크 관련 정보가 포함되어 있을 경우, 해당 추가 웹 문서 데이터까지 수집하는 것이 바람직하다. 즉, 수집된 웹 페이지 내에서 다음 페이지 링크가 포함되어 있을 경우, 다음 페이지 링크로 들어가서 다음 웹 페이지까지 수집하는 것이 바람직하다. 이렇게 날짜별로 그룹화되어 수집된 상기 웹 문서 데이터들 중 미리 설정된 웹 문서 형태에 해당하는 웹 문서 데이터에 대해서만, 미리 설정된 항목 정보(일 예를 들자면, 포함되어 있는 날짜, 제목, 본문 등)에 대한 텍스트 데이터들을 추출하여 수집하는 것이 바람직하다.To explain again, the data collection unit 110 may group and manage various collected web document data by date, and may link to the next page within the collected web document data, that is, link to additional web document data. If information is included, it is desirable to collect the corresponding additional web document data as well. That is, when a link to the next page is included in the collected web page, it is preferable to enter the link to the next page and collect the next web page. Text for preset item information (for example, included date, title, body, etc.) only for web document data corresponding to a preset web document type among the web document data grouped and collected by date. It is desirable to extract and collect data.

이 후, 수집한 상기 텍스트 데이터들을 전달받아, 형태소 분석을 통한 키워드 데이터를 분석하는 것이 바람직하다. 이 때, 상기 웹 문서 데이터에서 추출한 날짜, 제목, 본문의 텍스트 데이터를 모두 전달받는 것이 아니라, 형태소 분석이 필요 없는 날짜를 제외한 제목, 본문의 텍스트 데이터만을 전달받는 것이 바람직하다.Thereafter, it is preferable to receive the collected text data and analyze keyword data through morpheme analysis. At this time, it is preferable to receive only the text data of the title and body excluding the date for which morphological analysis is not required, rather than all of the text data of the date, title, and body extracted from the web document data.

상기 데이터 수집부(110)는 미리 저장되어 있는 형태소 분석 모듈과 사전 데이터베이스 모듈을 이용하여, 전달받은 상기 텍스트 데이터들에 대한 형태소 분석을 통해 의미가 정의되어 있는 명사 정보들을 추출하는 것이 바람직하다. 상세하게는, 상기 웹 문서 데이터에 포함되어 있는 제목, 본문의 텍스트 데이터를 전달받아, 형태소 분석을 통해 명사/형용사/부사 등으로 구분하여 단어를 추출한 후, 상기 사전 데이터베이스 모듈을 통해서, 정의가 되어있는 단어를 추출하여, 이를 상기 명사 정보로 설정하는 것이 바람직하다.Preferably, the data collection unit 110 extracts noun information whose meaning is defined through morpheme analysis of the received text data using a pre-stored morpheme analysis module and a dictionary database module. In detail, after receiving the text data of the title and body included in the web document data, dividing them into nouns/adjectives/adverbs through morphological analysis and extracting words, they are defined through the dictionary database module. It is preferable to extract a word that is present and set it as the noun information.

이 때, 상기 사전 데이터베이스 모듈에 의해 정의가 되어 있지 않은 단어의 경우, 신규로 발생한 단어일 가능성이 높아 상기 형태소 분석 모듈에서 이를 명사로 인식하지 못하는 경우가 발생할 수 있다.At this time, in the case of a word not defined by the dictionary database module, it is likely to be a newly generated word, and the morpheme analysis module may not recognize it as a noun.

이를 해소하기 위하여, 상기 데이터 수집부(110)는 형태소 분석을 통해 단어가 추출되었으나, 상기 사전 데이터베이스 모듈을 통해서 정의가 되어 있지 않은 미정의 단어 정보를 전달받아, 이를 신규 용어 정보로 판단하는 것이 바람직하다.In order to solve this problem, it is preferable that the data collection unit 110 receives undefined word information that has not been defined through the dictionary database module even though words have been extracted through morpheme analysis, and determines this as new term information. do.

일 예를 들자면, '지소미아'가 형태소 분석기의 사전에 등록되어 있지 않은 단어일 경우, '지소미아'라는 명사 정보로 설정되지 못하고 '지', '소미아'를 명사로 판단하여 찾아낼 가능성이 있다.For example, if 'Gsomia' is a word that is not registered in the dictionary of the morpheme analyzer, it is not set as noun information 'Gsomia' and there is a possibility of determining 'Gisomia' and 'Somia' as nouns and finding them. there is

그렇기 때문에, 이를 해결하기 위하여, 분석된 단어가 뉴스기사 내용(텍스트 데이터) 상에서 공백이 없는 붙어있는 단어일 경우, 이를 신규 용어로 판단하여 상기 신규 용어 정보로 설정하는 것이 바람직하다.Therefore, in order to solve this problem, if the analyzed word is a word attached without a space on the news article content (text data), it is preferable to determine it as a new term and set it as the new term information.

뿐만 아니라, 판단한 상기 신규 용어 정보는 상기 형태소 분석 모듈과 사전 데이터베이스 모듈의 업데이트 정보로 활용함으로써, 추후 분석시 정상적인 키워드, 즉, 정상적인 명사 정보로 분석할 수 있다.In addition, by using the determined new term information as update information of the morpheme analysis module and the dictionary database module, it can be analyzed as normal keywords, that is, normal noun information, during later analysis.

이 후, 상기 데이터 수집부(110)는 전달받은 상기 텍스트 데이터 상에서 추출한 상기 명사 정보와 상기 신규 용어 정보에 대한 각각의 빈도수를 분석하여, 분석한 빈도수와 각각의 정보들을 매칭시켜 상기 키워드 데이터들로 저장 및 관리하는 것이 바람직하다. 즉, 중복되는 키워드 정보는 빈도수를 증가시켜 저장 및 관리하는 것이 바람직하다. 이를 통해서, 상기 키워드 데이터들의 발생 빈도수를 기준으로 사회이슈 키워드 정보인 사회이슈 데이터를 설정하는 것이 바람직하다.Thereafter, the data collection unit 110 analyzes each frequency of the noun information and the new term information extracted from the received text data, and matches the analyzed frequency with each information to form the keyword data. It is desirable to store and manage. That is, it is preferable to store and manage overlapping keyword information by increasing the frequency. Through this, it is preferable to set social issue data, which is social issue keyword information, based on the frequency of occurrence of the keyword data.

더불어, 특정 날짜에 발생한 뉴스기사에서 가장 많은 비중을 차지하는 키워드를 순서대로 정렬함으로써, 특정 키워드가 주요 키워드로 판단되면, 주요 키워드가 발생한 뉴스기사를 통해 연관 키워드를 추출하고, 연관 키워드 역시 빈도수대로 정렬한 후, 상기 연관 키워드의 상위 소정 개수를 주요 키워드와 함께 그룹화하여 하나의 사회이슈 데이터로 설정할 수 있다.In addition, by arranging the keywords that account for the most weight in news articles that occurred on a specific date in order, when a specific keyword is determined to be the main keyword, related keywords are extracted through news articles in which the main keyword occurred, and the related keywords are also sorted by frequency After that, the upper predetermined number of the related keywords may be grouped together with the main keyword to set as one social issue data.

상기 데이터 분석부(120)는 상기 데이버 수집부(110)를 통해서 수집한 사이버 표적공격에 대한 관련 데이터들과 상기 사회이슈 데이터들 간의 상관도 분석을 수행하여, 다시 말하자면, 사이버 표적공격 발생시, 해당하는 사이버 표적공격을 분석하여 수집한 사이버 표적공격에 대한 관련 데이터들과, 해당하는 사이버 표적공격을 기준으로 소정기간 동안 수집한 상기 사회이슈 데이터들 간의 상관도 분석을 수행하여, 각각의 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 것이 바람직하다.The data analysis unit 120 analyzes the correlation between data related to cyber target attacks collected through the data collection unit 110 and the social issue data, in other words, when a cyber target attack occurs, Correlation analysis is performed between the data related to cyber targeted attacks collected by analyzing the corresponding cyber targeted attacks and the social issue data collected for a predetermined period based on the corresponding cyber targeted attacks. It is desirable to analyze the risk of social issue-based cyber targeted attacks on data.

여기서, 사회이슈 기반 사이버 표적공격의 위험도란, 과거 발생했던 사회이슈 기반 사이버 표적공격으로 인해 발생했던 피해 정도, 피해 관련 기관 개수, 피해 기간 등을 고려하여 정량화하여 분석하는 것이 바람직하며, 이는 일 실시예에 불과하다.Here, it is desirable to quantify and analyze the risk of social issue-based cyber target attacks in consideration of the degree of damage caused by social issue-based cyber target attacks that have occurred in the past, the number of damage-related institutions, and the duration of damage. Just an example.

상기 SAPT 분석부(200)는 상기 사회이슈 처리부(100)에서 통합 분석한 데이터들을 전달받아, 미리 설정된 AI 기법을 이용하여 학습을 수행하고, 학습 결과를 이용하여 새롭게 입력되는 신규 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 것이 바람직하다.The SAPT analysis unit 200 receives the data integrated and analyzed by the social issue processing unit 100, performs learning using a preset AI technique, and uses the learning result for new social issue data that is newly input. It is desirable to analyze the risk of cyber targeted attacks based on social issues.

즉, 상기 SAPT 분석부(200)는 가장 바람직하자면, 학습이 이루어진 후, 새롭게 사이버 표적공격이 발생하고, 해당 기간 동안 수집한 신규 사회이슈 키워드를 학습 결과에 따른 학습 모델을 적용하여, 새롭게 발생한 사이버 표적공격이 신규 사회이슈 키워드에 의한 사회이슈 기반 사이버 표적공격에 해당하는지, 신규 사회이슈 키워드에 의한 사회이슈 기반 사이버 표적공격에 해당한다면 해당하는 신규 사회이슈 키워드에 의한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 것이 가장 바람직하다.That is, most preferably, the SAPT analysis unit 200 applies a learning model according to the learning result to new social issue keywords collected during the period when a new cyber target attack occurs after learning has been performed, and the newly generated cyber attack Whether the targeted attack corresponds to a social issue-based cyber targeted attack by a new social issue keyword, and if it corresponds to a social issue-based cyber targeted attack by a new social issue keyword, the risk of a social issue-based cyber targeted attack by the corresponding new social issue keyword It is most desirable to analyze

그렇지만, 상술한 바와 같이, 종래의 기술 수준을 통해서는 상기 사회이슈 처리부(100)를 통합 분석한 데이터들을 전달받아, 미리 설정된 AI 기법을 이용하여 학습을 수행한 결과에 따른 학습 모델을 이용하기 때문에, 신규 사회이슈 키워드가 기존에 수집되었던 사회이슈 키워드가 중복되지 않을 경우, 정확한 분석 값을 출력할 수 없게 된다.However, as described above, through the conventional technology level, the social issue processing unit 100 receives data integrated and analyzed, and uses a learning model based on the result of learning using a preset AI technique. , If the new social issue keywords do not overlap previously collected social issue keywords, accurate analysis values cannot be output.

그렇기 때문에, 이러한 문제점을 해소하기 위하여, 상기 SAPT 분석부(200)는 도 1에 도시된 바와 같이, 학습 처리부(210), 중복 처리부(220), 결과 분석부(230) 및 상관도 분석부(240)를 더 포함하여 구성되는 것이 바람직하다.Therefore, in order to solve this problem, the SAPT analysis unit 200, as shown in Figure 1, learning processing unit 210, redundancy processing unit 220, result analysis unit 230 and correlation analysis unit ( 240) is preferably configured to further include.

상기 학습 처리부(210)는 상기 사회이슈 처리부(100)에서 통합 분석한 데이터들을 전달받아, AI 기법에서의 학습을 위한 학습 데이터를 생성하고, 생성한 학습 데이터를 적용하여 AI 학습을 수행하는 것이 바람직하다.Preferably, the learning processing unit 210 receives the data integrated and analyzed by the social issue processing unit 100, generates learning data for learning in the AI technique, and performs AI learning by applying the generated learning data. do.

이러한 분석 데이터들을 활용하여 AI 학습을 위한 학습 데이터를 생성하고, 학습을 수행하는 기술은 종래에 널리 활용되고 있는 기술로서, 자세한 설명은 생략한다.A technique of generating learning data for AI learning using these analysis data and performing learning is a technique that has been widely used in the past, and a detailed description thereof will be omitted.

보다 근본적으로 보자면, 새롭게 상기 신규 사회이슈 데이터가 입력되면, 이를 상기 데이터 분석부(120)에서 분석하고, 상기 학습 데이터를 새롭게 생성하여 새로운 학습을 수행하는 것이 가장 바람직하겠지만, 이 경우, 많은 시간과 비용이 발생하기 때문에, 본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템은, 경우에 따라 큰 피해가 발생할 수 있기 때문에 신속한 대응이 요구되는 사이버 표적공격의 성격 상, 새로운 신규 사회이슈 데이터가 입력될 경우, 이에 대한 상세 분석을 수행하여 정확도 높은 위험도 분석 결과를 전달하기 앞서서, 우선적으로 초기 위험도를 도출하여 이를 외부(관리자, 사용자 등)로 전송하여 우선 대처가 이루어지도록 하면서 동시에 새로운 신규 사회이슈 데이터에 대한 상세 분석을 통해서 추가 대응이 이루어질 수 있도록 하는 것이 바람직하다.More fundamentally, if the new social issue data is newly input, it would be most desirable to analyze it in the data analysis unit 120 and newly generate the learning data to perform new learning. Since costs are incurred, the risk analysis system of social issue-based cyber target attacks using AI and correlation analysis techniques according to an embodiment of the present invention may cause great damage in some cases, so rapid response is required. Due to the nature of targeted attacks, when new social issue data is input, an initial risk level is first derived and transmitted to the outside (administrator, user, etc.) Therefore, it is desirable to make a priority response and at the same time make additional responses through a detailed analysis of new social issue data.

이를 위해, 상기 중복 처리부(200)는 상기 사회이슈 처리부(100)에서 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터를 기반으로 새롭게 입력되는 상기 신규 사회이슈 데이터의 중복 여부를 판단하는 것이 바람직하다.To this end, it is preferable that the redundancy processing unit 200 determines whether the new social issue data newly input is duplicated based on the social issue data included in the integrated analysis data transmitted from the social issue processing unit 100. do.

언어의 특성상, 중복된다는 것은 중복도가 수치상 100에 해당하는 것이 아니라, 본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템을 활용하고자 하는 외부 관리자(사용자 등)가 적용하고자 하는 보안 수단의 중요도에 따라 입력하는 소정 중복도 이상을 의미하는 것이 바람직하다. 즉, 그 중요도에 따라 중복도가 70 이상을 중복된다고 판단할 수도 있고, 중복도가 100에 해당 해야만 중복된다고 판단할 수도 있어, 이에 대해서는 한정하는 것이 아니다.Due to the nature of the language, overlapping does not mean that the degree of overlap corresponds to a numerical value of 100, but an external manager who wants to utilize the risk analysis system for cyber target attacks based on social issues using AI and correlation analysis techniques according to an embodiment of the present invention. It is preferable to mean more than a predetermined overlapping degree input according to the importance of the security means (user, etc.) to apply. That is, depending on the degree of importance, it may be determined that the overlapping degree is 70 or more, or it may be determined that the overlapping degree corresponds to 100, and it is not limited thereto.

상기 결과 분석부(230)는 상기 중복 처리부(220)의 판단 결과에 따라 입력되는 데이터를 이용하여, 상기 학습 처리부(210)에서의 학습 결과에 의한 학습 모델에 입력되는 데이터를 적용하여 분석 결과를 얻어, 입력되는 데이터의 사회이슈 기반 사이버 표적공격의 위험도를 산정하는 것이 바람직하다.The result analysis unit 230 uses the data input according to the determination result of the redundancy processing unit 220 and applies the data input to the learning model based on the learning result in the learning processing unit 210 to obtain an analysis result. It is desirable to obtain and calculate the risk of a cyber target attack based on social issues of the input data.

상세하게는, 상기 중복 처리부(220)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 상기 사회이슈 처리부(100)에서 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터와 중복될 경우, 상기 신규 사회이슈 데이터를 그대로 상기 결과 분석부(230)로 입력하여, 상기 학습 모델에 적용하여 분석 결과를 얻어, 사회이슈 기반 사이버 표적공격의 위험도를 산정하는 것이 바람직하다.In detail, if the new social issue data overlaps with the social issue data included in the integrated analysis data transmitted from the social issue processing unit 100 according to the determination result of the redundancy processing unit 220, the new social issue data is duplicated. It is preferable to input social issue data as it is to the result analysis unit 230, apply it to the learning model, obtain an analysis result, and calculate the risk of a cyber target attack based on social issues.

이와 반대로, 상기 중복 처리부(220)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 상기 사회이슈 처리부(100)에서 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터와 중복되지 않을 경우, 상기 상관도 분석부(240)로 상기 신규 사회이슈 데이터를 전달하는 것이 바람직하다.Conversely, if the new social issue data does not overlap with the social issue data included in the integrated analysis data transmitted from the social issue processing unit 100 according to the determination result of the redundancy processing unit 220, the correlation It is preferable to transmit the new social issue data to the province analysis unit 240 .

상기 상관도 분석부(240)는 상기 신규 사회이슈 데이터와 상기 사회이슈 처리부(100)에서 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터들 간의 상관도 분석을 수행하는 것이 바람직하다.The correlation analysis unit 240 preferably performs correlation analysis between the new social issue data and the social issue data included in the integrated analysis data transmitted from the social issue processing unit 100 .

상기 사회이슈 처리부(100)에서 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터들은, 상술한 바와 같이, 단순히 하나의 단어가 아니라, 특정 기간에 이슈화되고 있는 키워드들, 다시 말하자면, 연관성이 있는 키워드들의 집합이기 때문에, 상기 신규 사회이슈 키워드와 상기 사회이슈 데이터들(연관성이 있는 키워드들의 집합) 간의 상관도 분석을 보다 용이하게 수행할 수 있다.As described above, the social issue data included in the integrated analysis data transmitted from the social issue processing unit 100 are not simply one word, but keywords that are issues in a specific period, in other words, related Since it is a set of keywords, correlation analysis between the new social issue keyword and the social issue data (a set of related keywords) can be performed more easily.

상기 상관도 분석부(240)는 상기 신규 사회이슈 데이터와 상기 사회이슈 처리부(100)에서 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터들 간의 상관도 분석 결과를 이용하여, 기존에 수집되어 있던 사회이슈 데이터들, 다시 말하자면, 상기 사회이슈 처리부(100)에서 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터들 중 상기 신규 사회이슈 데이터와 가장 높은 상관도의 사회이슈 데이터를 추출하는 것이 바람직하다.The correlation analysis unit 240 is previously collected using the correlation analysis result between the new social issue data and the social issue data included in the integrated analysis data transmitted from the social issue processing unit 100 Among the existing social issue data, that is, the social issue data included in the integrated analysis data transmitted from the social issue processing unit 100, extracting the social issue data having the highest correlation with the new social issue data desirable.

상기 상관도 분석부(240)는 추출한 가장 높은 상관도의 사회이슈 데이터를 상기 결과 분석부(230)로 입력하여, 상기 학습 모델에 적용하여 분석 결과를 수행하는 것이 바람직하다.Preferably, the correlation analysis unit 240 inputs the extracted social issue data having the highest correlation to the result analysis unit 230 and applies the analysis result to the learning model.

즉, 상술한 바와 같이, 상기 신규 사회이슈 데이터를 상기 학습 모델에서 학습을 수행한 학습 데이터에 포함되어 있지 않은 데이터이기 때문에, 상기 신규 사회이슈 데이터를 그대로 상기 학습 모델에 적용하더라도 제대로 된 결과 값이 산출되지 않게 된다. 그렇기 때문에, 상기 신규 사회이슈 데이터와 가장 높은 상관도의 사회이슈 데이터를 추출하여, 이를 상기 학습 모델에 적용하여 이에 대한 분석 결과값을 얻어 이를 활용하여 상기 신규 사회이슈 데이터의 사이버 표적공격 위험도 분석을 수행하는 것이 바람직하다.That is, as described above, since the new social issue data is data that is not included in the learning data for which learning has been performed in the learning model, even if the new social issue data is applied to the learning model as it is, a correct result value is obtained. will not be produced. Therefore, by extracting the social issue data with the highest correlation with the new social issue data and applying it to the learning model to obtain an analysis result value and utilizing it, the cyber target attack risk analysis of the new social issue data is performed. It is desirable to do

상세하게는, 상기 결과 분석부(230)는 상기 상관도 분석부(240)에 의해 데이터가 입력될 경우, 입력되는 데이터(상기 신규 사회이슈 데이터와 가장 높은 상관도의 사회이슈 데이터)를 상기 학습 모델에 적용하여 출력된 분석 결과값에 미리 설정된 상관계수 값을 적용하여, 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 초기 위험도를 산정하는 것이 바람직하다.In detail, when data is input by the correlation analysis unit 240, the result analysis unit 230 converts the input data (social issue data having the highest correlation with the new social issue data) into the learning process. It is preferable to calculate the initial risk of a cyber target attack based on social issues of the new social issue data by applying a preset correlation coefficient value to the analysis result value output by applying the model.

이 때, 상기 상관계수 값은, 상기 신규 사회이슈 데이터와 추출한 사회이슈 데이터 간의 상관도 정도를 이용하여 설정하는 것이 바람직하며, 이에 대해서 한정하는 것은 아니다.At this time, it is preferable to set the correlation coefficient value using the degree of correlation between the new social issue data and the extracted social issue data, but is not limited thereto.

상기 결과 분석부(230)는 외부 사용자의 요청에 있을 경우, 산정한 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 초기 위험도에 대한 정보들을 제공하는 것이 바람직하다.When requested by an external user, the result analysis unit 230 preferably provides information on the initial risk of a cyber target attack based on social issues of the calculated new social issue data.

그렇지만, 이는 상기 신규 사회이슈 데이터를 정확하게 분석한 결과 값이 아니기 때문에, 상기 결과 분석부(230)는 상기 신규 사회이슈 데이터를 상기 사회이슈 처리부(100)로 전달하여, 추가 분석을 수행하는 것이 바람직하다.However, since this is not a result of accurately analyzing the new social issue data, it is preferable that the result analysis unit 230 transfers the new social issue data to the social issue processing unit 100 to perform additional analysis. do.

즉, 보다 상세하게, 상기 신규 사회이슈 데이터가 수집될 때 발생했던 사회이슈 데이터와, 상기 신규 사회이슈 데이터 간의 상관도 분석을 수행하여 상기 신규 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격 위험도를 분석하고, 이를 새롭게 반영한 학습 데이터를 통해서 상기 학습 모델의 업데이트 학습을 수행하도록 하는 것이 바람직하다.That is, in more detail, the correlation between the social issue data generated when the new social issue data was collected and the new social issue data is analyzed to analyze the social issue-based cyber target attack risk for the new social issue data. and update learning of the learning model through the newly reflected learning data.

도 2는 본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법을 나타낸 순서 예시도로서, 도 2를 참조로 하여, 본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법에 대해서 상세히 설명하도록 한다.2 is a flowchart illustrating a method for analyzing the risk of a cyber target attack based on social issues using an AI and correlation analysis technique according to an embodiment of the present invention. Referring to FIG. 2, in an embodiment of the present invention The risk analysis method of social issue-based cyber target attacks using AI and correlation analysis techniques according to this study will be explained in detail.

본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법은 도 2에 도시된 바와 같이, 데이터 수집단계(S100), 데이터 분석단계(S200), 학습 데이터 생성단계(S300), 학습 단계(S400), 신규 데이터 입력단계(S500), 중복 판단단계(S600) 및 제1 위험도 분석단계(S700)를 포함하여 구성되는 것이 바람직하다.As shown in FIG. 2, the method for analyzing the risk of a cyber target attack based on social issues using AI and correlation analysis techniques according to an embodiment of the present invention includes data collection step (S100), data analysis step (S200), learning It is preferable to include a data generation step (S300), a learning step (S400), a new data input step (S500), a duplicate determination step (S600) and a first risk analysis step (S700).

각 단계에 대해서 자세히 알아보자면,For a detailed look at each step,

상기 데이터 수집단계(S100)는 상기 사회이슈 처리부(100)에서, 사이버 표적공격 발생시, 발생한 상기 사이버 표적공격에 대한 관련 데이터들을 수집하고, 분석 대상 사이트들의 크롤링을 수행하여, 상기 사이버 표적공격 발생을 기준으로 소정기간 전부터 소정기간 후까지의 사회이슈 데이터들을 수집하는 것이 바람직하다.In the data collection step (S100), when a cyber target attack occurs, the social issue processing unit 100 collects data related to the cyber target attack, performs crawling of analysis target sites, and detects the occurrence of the cyber target attack. As a criterion, it is desirable to collect social issue data from before a predetermined period to after a predetermined period.

수집하는 상기 사이버 표적공격에 대한 관련 데이터들로는, 사이버 표적공격 발생시, 발생한 상기 사이버 표적공격의 유형을 파악하여, 상기 사이버 표적공격이 발생할 당시의 공격대상 기관정보, 공격의 세부적인 유형 정보 등을 분석하여 수집하는 것이 바람직하다.Data related to the cyber-targeted attack to be collected include identifying the type of the cyber-targeted attack that occurred when the cyber-targeted attack occurred, and analyzing information on the target organization at the time the cyber-targeted attack occurred, detailed type information of the attack, etc. It is desirable to collect

일 예를 들자면, 발생한 상기 사이버 표적공격 별, 공격대상 기관정보, 공격 유형 정보 등을 데이터베이스화하여 저장 및 관리하는 것이 바람직하다.For example, it is preferable to store and manage the database for each cyber target attack that has occurred, attack target agency information, attack type information, and the like.

또한, 상기 데이터 수집단계(S100)는 상기 사회이슈 데이터들을 수집하는 것이 바람직하며, 상기 사이버 표적공격이 발생한 시점을 기준으로 소정기간 전부터 소정기간 후까지의 분석 대상 사이트들의 크롤링을 수행하여, 수집한 해당 사이트의 다양한 웹 문서 데이터(웹 페이지 데이터 등)들을 분석하여, 해당 기간에 발생한 사회이슈 데이터들을 수집하여 저장 및 관리하는 것이 바람직하다. 여기서 소정기간이란, 외부 관리자(사용자 등)로부터 입력받는 것이 바람직하다.In addition, in the data collection step (S100), it is preferable to collect the social issue data, and crawl the analysis target sites from before a predetermined period to after a predetermined period based on the time when the cyber target attack occurred, and collect the collected data. It is desirable to analyze various web document data (web page data, etc.) of the site, collect, store, and manage social issue data that occurred during the period. Here, the predetermined period is preferably input from an external administrator (user, etc.).

이 때, 사회이슈 데이터란, 언론사 등에서 이슈화하여 내보내고 있는 기사들을 종합하여 볼 때 사회이슈를 추측할 수 있는데, 언론사들에서 발간(발행, 생성, 업로드 등)하는 기사들을 수집하여 이에 대한 주요 키워드들을 추출하는 것은 가능하다.At this time, social issue data can be inferred from social issues when looking at the articles that are issued and published by media outlets, etc., by collecting articles published (published, created, uploaded, etc.) It is possible to extract

가령 언론기사 분석을 통해, '정부'라는 키워드가 많이 나타났다고 분석될 경우, 단순히 해당 키워드만 가지고는 앞뒤 상황을 유추하기가 어려워 이를 사회이슈로 단정할 수 없을 뿐 아니라, 이를 사회이슈로 단정지었다 할지라도 추후에 이에 대한 사회상황 해석이 거의 불가능하게 된다.For example, if it is analyzed that the keyword 'government' appears a lot through analysis of media articles, it is difficult to infer the context from the keyword alone. Also, it becomes almost impossible to analyze the social situation in the future.

그렇기 때문에, 이러한 점을 감안하여, 언론사 등에서 이슈화하여 내보내고 있는 기사들을 수집하여, 수집한 기사들을 분석하여 발견된 핵심 키워드를 중심으로, 연관된 키워드들까지 같이 추출하여 하나의 그룹으로 묶어 이를 사회이슈로 도출함으로써, 특정 기간에 발생한 사회이슈 데이터와 더 나아가, 그리고 그 사회이슈가 발생한 이유, 경과 등을 일목요연하게 정리하여 확인할 수 있다.Therefore, taking this into account, we collect articles that have been issued as issues by media outlets, etc., analyze the collected articles, and extract related keywords, focusing on the core keywords found, and group them into one group to classify them as social issues. By deriving, it is possible to clearly organize and confirm the social issue data that occurred in a specific period, and furthermore, the reason and progress of the social issue.

이에 따라, 수집한 '사회이슈 키워드'는 단순히 하나의 단어가 아니라, 특정 기간에 이슈화되고 있는 키워드들, 다시 말하자면, 연관성이 있는 키워드들의 집합을 의미할 수도 있다.Accordingly, the collected 'social issue keywords' may not simply be a single word, but may mean keywords that are becoming issues in a specific period, in other words, a set of related keywords.

상세하게는, 상기 데이터 수집단계(S100)는 수집한 다양한 웹 문서 데이터들을 날짜별로 그룹화하여 관리할 수 있으며, 수집된 웹 문서 데이터 내에 다음 페이지 링크, 다시 말하자면, 추가 웹 문서 데이터에 대한 링크 관련 정보가 포함되어 있을 경우, 해당 추가 웹 문서 데이터까지 수집하는 것이 바람직하다. 즉, 수집된 웹 페이지 내에서 다음 페이지 링크가 포함되어 있을 경우, 다음 페이지 링크로 들어가서 다음 웹 페이지까지 수집하는 것이 바람직하다. 이렇게 날짜별로 그룹화되어 수집된 상기 웹 문서 데이터들 중 미리 설정된 웹 문서 형태에 해당하는 웹 문서 데이터에 대해서만, 미리 설정된 항목 정보(일 예를 들자면, 포함되어 있는 날짜, 제목, 본문 등)에 대한 텍스트 데이터들을 추출하여 수집하는 것이 바람직하다.In detail, in the data collection step (S100), various collected web document data can be grouped and managed by date, and a link to the next page within the collected web document data, that is, information related to a link to additional web document data. is included, it is desirable to collect the corresponding additional web document data as well. That is, when a link to the next page is included in the collected web page, it is preferable to enter the link to the next page and collect the next web page. Text for preset item information (for example, included date, title, body, etc.) only for web document data corresponding to a preset web document type among the web document data grouped and collected by date. It is desirable to extract and collect data.

이 후, 수집한 상기 텍스트 데이터들을 전달받아, 형태소 분석을 통한 키워드 데이터를 분석하는 것이 바람직하다. 이 때, 상기 웹 문서 데이터에서 추출한 날짜, 제목, 본문의 텍스트 데이터를 모두 전달받는 것이 아니라, 형태소 분석이 필요 없는 날짜를 제외한 제목, 본문의 텍스트 데이터만을 전달받는 것이 바람직하다.Thereafter, it is preferable to receive the collected text data and analyze keyword data through morpheme analysis. At this time, it is preferable to receive only the text data of the title and body excluding the date for which morphological analysis is not required, rather than all of the text data of the date, title, and body extracted from the web document data.

즉, 미리 저장되어 있는 형태소 분석 모듈과 사전 데이터베이스 모듈을 이용하여, 전달받은 상기 텍스트 데이터들에 대한 형태소 분석을 통해 의미가 정의되어 있는 명사 정보들을 추출하는 것이 바람직하다. 상세하게는, 상기 웹 문서 데이터에 포함되어 있는 제목, 본문의 텍스트 데이터를 전달받아, 형태소 분석을 통해 명사/형용사/부사 등으로 구분하여 단어를 추출한 후, 상기 사전 데이터베이스 모듈을 통해서, 정의가 되어있는 단어를 추출하여, 이를 상기 명사 정보로 설정하는 것이 바람직하다.That is, it is preferable to extract noun information whose meaning is defined through morpheme analysis on the received text data using a morpheme analysis module and a dictionary database module stored in advance. In detail, after receiving the text data of the title and body included in the web document data, dividing them into nouns/adjectives/adverbs through morphological analysis and extracting words, they are defined through the dictionary database module. It is preferable to extract a word that is present and set it as the noun information.

이 때, 상기 사전 데이터베이스 모듈에 의해 정의가 되어 있지 않은 단어의 경우, 신규로 발생한 단어일 가능성이 높아 상기 형태소 분석 모듈에서 이를 명사로 인식하지 못하는 경우가 발생할 수 있다.At this time, in the case of a word not defined by the dictionary database module, it is likely to be a newly generated word, and the morpheme analysis module may not recognize it as a noun.

이를 해소하기 위하여, 형태소 분석을 통해 단어가 추출되었으나, 상기 사전 데이터베이스 모듈을 통해서 정의가 되어 있지 않은 미정의 단어 정보를 전달받아, 이를 신규 용어 정보로 판단하는 것이 바람직하다.In order to solve this problem, it is preferable to receive undefined word information that has not been defined through the dictionary database module even though words have been extracted through morpheme analysis, and determined as new term information.

일 예를 들자면, '지소미아'가 형태소 분석기의 사전에 등록되어 있지 않은 단어일 경우, '지소미아'라는 명사 정보로 설정되지 못하고 '지', '소미아'를 명사로 판단하여 찾아낼 가능성이 있다.For example, if 'Gsomia' is a word that is not registered in the dictionary of the morpheme analyzer, it is not set as noun information 'Gsomia' and there is a possibility of determining 'Gisomia' and 'Somia' as nouns and finding them. there is

그렇기 때문에, 이를 해결하기 위하여, 분석된 단어가 뉴스기사 내용(텍스트 데이터) 상에서 공백이 없는 붙어있는 단어일 경우, 이를 신규 용어로 판단하여 상기 신규 용어 정보로 설정하는 것이 바람직하다.Therefore, in order to solve this problem, if the analyzed word is a word attached without a space on the news article content (text data), it is preferable to determine it as a new term and set it as the new term information.

뿐만 아니라, 판단한 상기 신규 용어 정보는 상기 형태소 분석 모듈과 사전 데이터베이스 모듈의 업데이트 정보로 활용함으로써, 추후 분석시 정상적인 키워드, 즉, 정상적인 명사 정보로 분석할 수 있다.In addition, by using the determined new term information as update information of the morpheme analysis module and the dictionary database module, it can be analyzed as normal keywords, that is, normal noun information, during later analysis.

이 후, 전달받은 상기 텍스트 데이터 상에서 추출한 상기 명사 정보와 상기 신규 용어 정보에 대한 각각의 빈도수를 분석하여, 분석한 빈도수와 각각의 정보들을 매칭시켜 상기 키워드 데이터들로 저장 및 관리하는 것이 바람직하다. 즉, 중복되는 키워드 정보는 빈도수를 증가시켜 저장 및 관리하는 것이 바람직하다. 이를 통해서, 상기 키워드 데이터들의 발생 빈도수를 기준으로 사회이슈 키워드 정보인 사회이슈 데이터를 설정하는 것이 바람직하다.Thereafter, it is preferable to analyze the frequency of the noun information and the new term information extracted from the received text data, match the analyzed frequency to each information, and store and manage the keyword data. That is, it is preferable to store and manage overlapping keyword information by increasing the frequency. Through this, it is preferable to set social issue data, which is social issue keyword information, based on the frequency of occurrence of the keyword data.

더불어, 특정 날짜에 발생한 뉴스기사에서 가장 많은 비중을 차지하는 키워드를 순서대로 정렬함으로써, 특정 키워드가 주요 키워드로 판단되면, 주요 키워드가 발생한 뉴스기사를 통해 연관 키워드를 추출하고, 연관 키워드 역시 빈도수대로 정렬한 후, 상기 연관 키워드의 상위 소정 개수를 주요 키워드와 함께 그룹화하여 하나의 사회이슈 데이터로 설정할 수 있다.In addition, by arranging the keywords that account for the most weight in news articles that occurred on a specific date in order, when a specific keyword is determined to be the main keyword, related keywords are extracted through news articles in which the main keyword occurred, and the related keywords are also sorted by frequency After that, the upper predetermined number of the related keywords may be grouped together with the main keyword to set as one social issue data.

상기 데이터 분석단계(S200)는 상기 사회이슈 처리부(100)에서, 상기 데이터 수집단계(S100)에 의해 수집한 사이버 표적공격에 대한 관련 데이터들과 상기 사회이슈 데이터들 간의 상관도 분석을 수행하여, 다시 말하자면, 사이버 표적공격 발생시, 해당하는 사이버 표적공격을 분석하여 수집한 사이버 표적공격에 대한 관련 데이터들과, 해당하는 사이버 표적공격을 기준으로 소정기간 동안 수집한 상기 사회이슈 데이터들 간의 상관도 분석을 수행하여, 각각의 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 것이 바람직하다.In the data analysis step (S200), the social issue processing unit 100 analyzes the correlation between the data related to the cyber target attack collected in the data collection step (S100) and the social issue data, In other words, when a cyber-targeted attack occurs, the correlation between data related to the cyber-targeted attack collected by analyzing the corresponding cyber-targeted attack and the social issue data collected for a predetermined period based on the corresponding cyber-targeted attack is analyzed. It is desirable to analyze the risk of social issue-based cyber target attacks on each social issue data.

여기서, 사회이슈 기반 사이버 표적공격의 위험도란, 과거 발생했던 사회이슈 기반 사이버 표적공격으로 인해 발생했던 피해 정도, 피해 관련 기관 개수, 피해 기간 등을 고려하여 정량화하여 분석하는 것이 바람직하며, 이는 일 실시예에 불과하다.Here, it is desirable to quantify and analyze the risk of social issue-based cyber target attacks in consideration of the degree of damage caused by social issue-based cyber target attacks that have occurred in the past, the number of damage-related institutions, and the duration of damage. Just an example.

상기 학습 데이터 생성단계(S300)는 상기 SAPT 분석부(200)에서, 상기 데이터 분석단계(S200)에 의해 통합 분석한 데이터들을 전달받아, AI 기법에서의 학습을 위한 학습 데이터를 생성하는 것이 바람직하다.In the learning data generation step (S300), it is preferable to receive the data integrated and analyzed by the data analysis step (S200) in the SAPT analysis unit 200 and generate learning data for learning in the AI technique. .

또한, 상기 학습 단계(S400)는 상기 SAPT 분석부(200)에서, 상기 학습 데이터 생성단계(S300)에 의해 생성한 상기 학습 데이터를 적용하여 AI 학습을 수행하는 것이 바람직하다.In addition, in the learning step (S400), it is preferable to perform AI learning by applying the learning data generated by the learning data generating step (S300) in the SAPT analysis unit 200.

이러한 분석 데이터들을 활용하여 AI 학습을 위한 학습 데이터를 생성하고, 학습을 수행하는 기술은 종래에 널리 활용되고 있는 기술로서, 자세한 설명은 생략한다.A technique of generating learning data for AI learning using these analysis data and performing learning is a technique that has been widely used in the past, and a detailed description thereof will be omitted.

상기 신규 데이터 입력단계(S500)는 상기 SAPT 분석부(200)에서, 상기 학습 단계(S400)에 의해 학습을 수행하고 난 후, 상기 데이터 수집단계(S100)에 의해 수집된 상기 신규 사회이슈 데이터가 입력되는 것이 바람직하다.In the new data input step (S500), after learning is performed by the learning step (S400) in the SAPT analysis unit 200, the new social issue data collected by the data collection step (S100) It is desirable to enter

가장 바람직하자면, 학습이 이루어진 후, 새롭게 사이버 표적공격이 발생하고, 해당 기간 동안 수집한 신규 사회이슈 키워드를 학습 결과에 따른 학습 모델을 적용하여, 새롭게 발생한 사이버 표적공격이 신규 사회이슈 키워드에 의한 사회이슈 기반 사이버 표적공격에 해당하는지, 신규 사회이슈 키워드에 의한 사회이슈 기반 사이버 표적공격에 해당한다면 해당하는 신규 사회이슈 키워드에 의한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 것이 가장 바람직하다.Most preferably, a new cyber targeted attack occurs after learning, and a learning model based on the learning result is applied to the new social issue keywords collected during the period, so that the newly generated cyber targeted attack is socialized by the new social issue keyword. If it corresponds to an issue-based cyber targeted attack or a social issue based cyber targeted attack by a new social issue keyword, it is most desirable to analyze the risk of a social issue based cyber targeted attack by the corresponding new social issue keyword.

그렇지만, 상술한 바와 같이, 종래의 기술 수준을 통해서는 통합 분석한 데이터들을 전달받아, 미리 설정된 AI 기법을 이용하여 학습을 수행한 결과에 따른 학습 모델을 이용하기 때문에, 신규 사회이슈 키워드가 기존에 수집되었던 사회이슈 키워드가 중복되지 않을 경우, 정확한 분석 값을 출력할 수 없게 된다.However, as described above, since the data that has been integrated and analyzed through the conventional technology level is received and a learning model based on the result of learning using a preset AI technique is used, new social issue keywords If the collected social issue keywords do not overlap, accurate analysis values cannot be output.

보다 근본적으로 보자면, 새롭게 상기 신규 사회이슈 데이터가 입력되면, 이를 상기 데이터 분석단계(S200)에 의해 분석하고, 상기 학습 데이터를 새롭게 생성하여 새로운 학습을 수행하는 것이 가장 바람직하겠지만, 이 경우, 많은 시간과 비용이 발생하기 때문에, 본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법은, 경우에 따라 큰 피해가 발생할 수 있기 때문에 신속한 대응이 요구되는 사이버 표적공격의 성격 상, 새로운 신규 사회이슈 데이터가 입력될 경우, 이에 대한 상세 분석을 수행하여 정확도 높은 위험도 분석 결과를 전달하기 앞서서, 우선적으로 초기 위험도를 도출하여 이를 외부(관리자, 사용자 등)로 전송하여 우선 대처가 이루어지도록 하면서 동시에 새로운 신규 사회이슈 데이터에 대한 상세 분석을 통해서 추가 대응이 이루어질 수 있도록 하는 것이 바람직하다.More fundamentally, if the new social issue data is newly input, it would be most desirable to analyze it by the data analysis step (S200) and newly generate the learning data to perform new learning, but in this case, a lot of time Because of the high cost and high cost, the risk analysis method of social issue-based cyber target attacks using AI and correlation analysis techniques according to an embodiment of the present invention requires rapid response because large damage may occur in some cases. Due to the nature of cyber targeted attacks, when new social issue data is input, a detailed analysis is conducted on it to deliver the result of highly accurate risk analysis. It is desirable to transmit the data so that priority measures can be taken, and at the same time, additional measures can be made through detailed analysis of new social issue data.

이를 위해, 상기 중복 판단단계(S600)는 상기 SAPT 분석부(200)에서, 상기 학습 데이터 생성단계(S300)에 의해 학습 데이터로 이용된 상기 데이터들에 포함되어 있는 상기 사회이슈 데이터들을 기반으로 상기 신규 데이터 입력단계(S500)에 의해 입력된 상기 신규 사회이슈 데이터의 중복 여부를 판단하는 것이 바람직하다.To this end, the redundancy determination step (S600) is based on the social issue data included in the data used as learning data by the learning data generation step (S300) in the SAPT analysis unit 200. It is preferable to determine whether the new social issue data input by the new data input step (S500) is duplicated.

즉, 상기 중복 판단단계(S600)는 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터를 기반으로 새롭게 입력되는 상기 신규 사회이슈 데이터의 중복 여부를 판단하는 것이 바람직하다.That is, it is preferable that the redundancy determination step (S600) determines whether newly input new social issue data is duplicated based on the social issue data included in the received integrated analysis data.

언어의 특성상, 중복된다는 것은 중복도가 수치상 100에 해당하는 것이 아니라, 본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법은 활용하고자 하는 외부 관리자(사용자 등)가 적용하고자 하는 보안 수단의 중요도에 따라 입력하는 소정 중복도 이상을 의미하는 것이 바람직하다. 즉, 그 중요도에 따라 중복도가 70 이상을 중복된다고 판단할 수도 있고, 중복도가 100에 해당 해야만 중복된다고 판단할 수도 있어, 이에 대해서는 한정하는 것이 아니다.Due to the nature of the language, overlapping does not mean that the degree of overlap corresponds to a numerical value of 100, but the method for analyzing the risk of a cyber target attack based on social issues using AI and correlation analysis techniques according to an embodiment of the present invention is an external manager who wants to utilize It is preferable to mean more than a predetermined overlapping degree input according to the importance of the security means (user, etc.) to apply. That is, depending on the degree of importance, it may be determined that the overlapping degree is 70 or more, or it may be determined that the overlapping degree corresponds to 100, and it is not limited thereto.

상기 제1 위험도 분석단계(S700)는 상기 SAPT 분석부(200)에서, 상기 중복 판단단계(S600)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터와 중복될 경우, 상기 신규 사회이슈 데이터를 그대로 상기 학습 단계(S400)에 의한 학습 모델에 적용하여, 분석 결과를 얻어, 상기 신규 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 산정하는 것이 바람직하다.The first risk analysis step (S700) is the social issue included in the integrated analysis data received from the new social issue data according to the determination result of the redundancy determination step (S600) in the SAPT analysis unit 200. If it overlaps with the data, the new social issue data is applied as it is to the learning model by the learning step (S400), and the analysis result is obtained to calculate the risk of the social issue-based cyber target attack on the new social issue data it is desirable

본 발명의 일 실시예에 따른 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법은 상기 중복 판단단계(S600)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터와 중복되지 않을 경우에는, 도 2에 도시된 바와 같이, 상관도 분석단계(S800), 제2 위험도 분석단계(S900) 및 신규 위험도 산정단계(S1000)를 더 포함하여 구성되는 것이 바람직하다.In the method for analyzing the risk of a cyber target attack based on social issues using AI and correlation analysis techniques according to an embodiment of the present invention, according to the determination result of the redundancy determination step (S600), the integrated analysis of the new social issue data is delivered. If it does not overlap with the social issue data included in the data, as shown in FIG. 2, a correlation analysis step (S800), a second risk analysis step (S900), and a new risk calculation step (S1000) are further performed. It is preferable to be configured to include.

상기 상관도 분석단계(S800)는 상기 중복 판단단계(S600)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터와 중복되지 않을 경우, 상기 신규 사회이슈 데이터와 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터들 간의 상관도 분석을 수행하는 것이 바람직하다.In the correlation analysis step (S800), according to the determination result of the overlapping determination step (S600), if the new social issue data does not overlap with the social issue data included in the received integrated analysis data, the new social issue data is not overlapped. It is preferable to perform correlation analysis between the issue data and the social issue data included in the delivered integrated analysis data.

전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터들은, 상술한 바와 같이, 단순히 하나의 단어가 아니라, 특정 기간에 이슈화되고 있는 키워드들, 다시 말하자면, 연관성이 있는 키워드들의 집합이기 때문에, 상기 신규 사회이슈 키워드와 상기 사회이슈 데이터들(연관성이 있는 키워드들의 집합) 간의 상관도 분석을 보다 용이하게 수행할 수 있다.As described above, the social issue data included in the delivered integrated analysis data is not simply a single word, but keywords that are being issued in a specific period, in other words, a set of related keywords, so that the new Correlation analysis between social issue keywords and the social issue data (set of related keywords) can be performed more easily.

상기 제2 위험도 분석단계(S900)는 상기 SAPT 분석부(200)에서, 상기 상관도 분석단계(S800)에 의한 분석 결과에 따라, 기존에 수집되어 있던 사회이슈 데이터들, 다시 말하자면, 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터들 중 상기 신규 사회이슈 데이터와 가장 높은 상관도의 사회이슈 데이터를 추출하는 것이 바람직하다.In the second risk analysis step (S900), in the SAPT analysis unit 200, according to the analysis result of the correlation analysis step (S800), the social issue data previously collected, in other words, the received integration It is preferable to extract the social issue data having the highest correlation with the new social issue data from among the social issue data included in the analysis data.

또한, 추출한 가장 높은 상관도의 사회이슈 데이터를 상기 학습 모델에 적용하여 분석 결과를 수행하는 것이 바람직하다.In addition, it is preferable to perform analysis results by applying the extracted social issue data having the highest degree of correlation to the learning model.

즉, 상술한 바와 같이, 상기 신규 사회이슈 데이터를 상기 학습 모델에서 학습을 수행한 학습 데이터에 포함되어 있지 않은 데이터이기 때문에, 상기 신규 사회이슈 데이터를 그대로 상기 학습 모델에 적용하더라도 제대로 된 결과 값이 산출되지 않게 된다. 그렇기 때문에, 상기 신규 사회이슈 데이터와 가장 높은 상관도의 사회이슈 데이터를 추출하여, 이를 상기 학습 모델에 적용하여 이에 대한 분석 결과값을 얻어 이를 활용하여 상기 신규 사회이슈 데이터의 사이버 표적공격 위험도 분석을 수행하는 것이 바람직하다.That is, as described above, since the new social issue data is data that is not included in the learning data for which learning has been performed in the learning model, even if the new social issue data is applied to the learning model as it is, a correct result value is obtained. will not be produced. Therefore, by extracting the social issue data with the highest correlation with the new social issue data and applying it to the learning model to obtain an analysis result value and utilizing it, the cyber target attack risk analysis of the new social issue data is performed. It is desirable to do

상기 신규 위험도 산정단계(S1000)는 상기 제2 위험도 분석단계(S900)에 의해 분석한 결과 값은 상기 신규 사회이슈 데이터가 아닌 추출한 가장 높은 상관도의 사회이슈 데이터에 대한 분석 결과 값이기 때문에, 상기 신규 사회이슈 데이터에 대한 결과 값으로, 입력되는 데이터(상기 신규 사회이슈 데이터와 가장 높은 상관도의 사회이슈 데이터)를 상기 학습 모델에 적용하여 출력된 분석 결과값에 미리 설정된 상관계수 값을 적용하여, 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 초기 위험도를 산정하는 것이 바람직하다.In the new risk calculation step (S1000), since the result value analyzed by the second risk analysis step (S900) is the analysis result value for the extracted social issue data with the highest degree of correlation, not the new social issue data, As the result value for new social issue data, input data (social issue data with the highest correlation with the new social issue data) is applied to the learning model, and a preset correlation coefficient value is applied to the output analysis result value. , it is desirable to calculate the initial risk of a cyber target attack based on the social issue of the new social issue data.

이 때, 상기 상관계수 값은, 상기 신규 사회이슈 데이터와 추출한 사회이슈 데이터 간의 상관도 정도를 이용하여 설정하는 것이 바람직하며, 이에 대해서 한정하는 것은 아니다.At this time, it is preferable to set the correlation coefficient value using the degree of correlation between the new social issue data and the extracted social issue data, but is not limited thereto.

상기 신규 위험도 산정단계(S1000)에 의한 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 초기 위험도는 외부 사용자의 요청에 있을 경우, 제공하는 것이 바람직하다.The initial risk of the social issue-based cyber target attack of the new social issue data in the new risk calculation step (S1000) is preferably provided upon request from an external user.

그렇지만, 이는 상기 신규 사회이슈 데이터를 정확하게 분석한 결과 값이 아니기 때문에, 추가 분석을 수행하는 것이 바람직하다.However, since this is not a result of accurately analyzing the new social issue data, it is desirable to perform additional analysis.

즉, 도 2에 도시된 바와 같이, 상기 신규 위험도 산정단계(S1000)를 수행하고 난 후, 추가 분석단계(S1100)를 수행하는 것이 바람직하다.That is, as shown in FIG. 2, it is preferable to perform an additional analysis step (S1100) after performing the new risk calculation step (S1000).

상기 추가 분석단계(S1100)는 상기 SAPT 분석부(200)에서, 상기 신규 위험도 산정단계(S1000)에 의해 산정한 상기 신규 사회이슈 데이터에 대한 추가 분석을 수행하는 것이 바람직하다.In the additional analysis step (S1100), it is preferable that the SAPT analysis unit 200 performs additional analysis on the new social issue data calculated by the new risk calculation step (S1000).

즉, 보다 상세하게, 상기 신규 사회이슈 데이터가 수집될 때 발생했던 사회이슈 데이터와, 상기 신규 사회이슈 데이터 간의 상관도 분석을 수행하여 상기 신규 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격 위험도를 분석하고, 이를 새롭게 반영한 학습 데이터를 통해서 상기 학습 모델의 업데이트 학습을 수행하도록 하는 것이 바람직하다.That is, in more detail, the correlation between the social issue data generated when the new social issue data was collected and the new social issue data is analyzed to analyze the social issue-based cyber target attack risk for the new social issue data. and update learning of the learning model through the newly reflected learning data.

이상과 같이 본 발명에서는 구체적인 구성 소자 등과 같은 특정 사항들과 한정된 실시예 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것 일 뿐, 본 발명은 상기의 일 실시예에 한정되는 것이 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, the present invention has been described with specific details such as specific components and limited embodiment drawings, but this is only provided to help a more general understanding of the present invention, and the present invention is not limited to the above embodiment. No, and those skilled in the art to which the present invention pertains can make various modifications and variations from these descriptions.

따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허 청구 범위뿐 아니라 이 특허 청구 범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the described embodiments, and not only the scope of the claims described later, but also all modifications equivalent or equivalent to the scope of the claims belong to the scope of the scope of the present invention. .

100 : 사회이슈 처리부
110 : 데이터 수집부 120 : 데이터 분석부
200 : SAPT 분석부
210 : 학습 처리부 220 : 중복 처리부
230 : 결과 분석부 240 : 상관도 분석부
100: Social Issues Handling Department
110: data collection unit 120: data analysis unit
200: SAPT analysis unit
210: learning processing unit 220: redundancy processing unit
230: result analysis unit 240: correlation analysis unit

Claims (10)

사이버 표적공격(APT, Advanced Persistent Threat) 발생시, 발생한 상기 사이버 표적공격에 대한 관련 데이터들을 수집하고, 분석 대상 사이트들의 크롤링을 수행하여 상기 사이버 표적공격 발생을 기준으로 소정기간 전부터 소정기간 후까지의 사회이슈 데이터들을 수집하여, 이들을 통합 분석하는 사회이슈 처리부(100); 및
상기 사회이슈 처리부(100)에서 통합 분석한 데이터들을 전달받아, 기설정된 AI 기법을 이용하여 학습을 수행하여, 학습 결과를 이용하여 새롭게 입력되는 신규 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 SAPT 분석부(200);
를 포함하며,
상기 SAPT 분석부(200)는
상기 사회이슈 처리부(100)에서 통합 분석한 데이터들을 전달받아, AI 기법에서의 학습을 위한 학습 데이터를 생성하고, 생성한 학습 데이터를 적용하여 AI 학습을 수행하는 학습 처리부(210);
상기 사회이슈 처리부(100)에서 전달받은 통합 분석 데이터에 포함되어 있는 상기 사회이슈 데이터를 기반으로 입력되는 신규 사회이슈 데이터의 중복 여부를 판단하는 중복 처리부(220);
상기 중복 처리부(220)의 판단 결과에 따라 입력되는 데이터를 이용하여 상기 학습 처리부(210)에서의 학습 결과에 의한 학습 모델에 적용하여 분석 결과를 통해 입력되는 데이터의 사회이슈 기반 사이버 표적공격의 위험도를 산정하는 결과 분석부(230); 및
상기 중복 처리부(220)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 상기 사회이슈 데이터와 중복되지 않을 경우, 상기 신규 사회이슈 데이터와 상기 사회이슈 데이터 간의 상관도 분석을 수행하는 상관도 분석부(240);
를 더 포함하며,
상기 상관도 분석부(240)는
상기 신규 사회이슈 데이터와 상기 사회이슈 데이터 간의 상관도 분석을 수행하여, 상기 사회이슈 데이터 중 가장 높은 상관도의 사회이슈 데이터를 추출하여, 상기 추출한 사회이슈 데이터를 상기 결과 분석부(230)로 입력하여, 데이터 분석을 수행하는 것을 특징으로 하는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템.
When a cyber targeted attack (APT, Advanced Persistent Threat) occurs, data related to the cyber targeted attack that has occurred is collected, and analysis target sites are crawled to perform a society from before a predetermined period to a predetermined period after the occurrence of the cyber targeted attack. A social issue processing unit 100 that collects issue data and analyzes them in an integrated manner; and
Receive the data integrated and analyzed by the social issue processing unit 100, perform learning using a preset AI technique, and use the learning result to measure the risk of social issue-based cyber target attacks on new social issue data that is newly input. SAPT analysis unit 200 for analyzing;
Including,
The SAPT analysis unit 200
A learning processing unit 210 that receives the data integrated and analyzed by the social issue processing unit 100, generates learning data for learning in AI techniques, and performs AI learning by applying the generated learning data;
a redundancy processing unit 220 that determines whether new social issue data is duplicated based on the social issue data included in the integrated analysis data transmitted from the social issue processing unit 100;
The data input according to the determination result of the redundancy processing unit 220 is applied to the learning model based on the learning result in the learning processing unit 210, and the risk of cyber target attack based on social issues of the data input through the analysis result Result analysis unit 230 that calculates; and
Correlation analysis unit for performing correlation analysis between the new social issue data and the social issue data when the new social issue data does not overlap with the social issue data according to the determination result of the redundancy processing unit 220 ( 240);
Including more,
The correlation analysis unit 240
Correlation analysis between the new social issue data and the social issue data is performed, social issue data having the highest correlation among the social issue data is extracted, and the extracted social issue data is input to the result analysis unit 230. A risk analysis system for cyber target attacks based on social issues using AI and correlation analysis techniques, characterized by performing data analysis.
제 1항에 있어서,
상기 사회이슈 처리부(100)는
사이버 표적공격 발생시, 발생한 상기 사이버 표적공격에 대한 관련 데이터들을 수집하고, 분석 대상 사이트들의 크롤링을 수행하여 상기 사이버 표적공격 발생을 기준으로 소정기간 전부터 소정기간 후까지의 사회이슈 데이터들을 수집하는 데이터 수집부(110); 및
상기 데이터 수집부(110)에서 수집한 상기 사이버 표적공격에 대한 관련 데이터들과 상기 사회이슈 데이터들 간의 상관도 분석을 수행하여, 각각의 상기 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 데이터 분석부(120);
를 더 포함하여 구성되는 것을 특징으로 하는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템.
According to claim 1,
The social issue processing unit 100
When a cyber-targeted attack occurs, data collection related to the cyber-targeted attack is collected, and data collection is performed to collect social issue data from before a predetermined period before a predetermined period after the occurrence of the cyber-targeted attack by crawling analysis target sites. section 110; and
By performing a correlation analysis between the data related to the cyber target attack collected by the data collection unit 110 and the social issue data, the risk of the social issue based cyber target attack for each of the social issue data is determined. Data analysis unit 120 to analyze;
A risk analysis system for social issue-based cyber target attacks using AI and correlation analysis techniques, characterized in that it is configured to further include.
삭제delete 제 2항에 있어서,
상기 SAPT 분석부(200)는
상기 중복 처리부(220)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 상기 사회이슈 데이터와 중복될 경우, 상기 신규 사회이슈 데이터를 그대로 상기 결과 분석부(230)로 입력하여, 데이터 분석을 수행하는 것을 특징으로 하는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템.
According to claim 2,
The SAPT analysis unit 200
According to the determination result of the duplicate processing unit 220, if the new social issue data overlaps with the social issue data, the new social issue data is input as it is to the result analysis unit 230 to perform data analysis A risk analysis system for cyber target attacks based on social issues using AI and correlation analysis techniques, characterized in that.
삭제delete 제 2항에 있어서,
상기 결과 분석부(230)는
상기 상관도 분석부(240)에 의해 데이터가 입력될 경우, 입력되는 데이터에 의한 분석 결과에 기설정된 상관계수 값을 적용하여, 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 초기 위험도를 산정하는 것을 특징으로 하는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템.
According to claim 2,
The result analysis unit 230
When data is input by the correlation analysis unit 240, the initial risk of a cyber target attack based on social issues of the new social issue data is calculated by applying a predetermined correlation coefficient value to the analysis result based on the input data. A risk analysis system for cyber target attacks based on social issues using AI and correlation analysis techniques.
제 6항에 있어서,
상기 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템은
상기 결과 분석부(230)에 의해 사회이슈 기반 사이버 표적공격의 초기 위험도가 산정된 상기 신규 사회이슈 데이터를 상기 사회이슈 처리부(100)로 전달하여, 사회이슈 기반 사이버 표적공격의 위험도를 추가 분석하는 것을 특징으로 하는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 시스템.
According to claim 6,
The risk analysis system of social issue-based cyber target attacks using the AI and correlation analysis technique
The new social issue data, in which the initial risk of social issue-based cyber target attack is calculated by the result analysis unit 230, is transmitted to the social issue processing unit 100 to further analyze the risk of social issue-based cyber target attack A risk analysis system for cyber target attacks based on social issues using AI and correlation analysis techniques, characterized in that.
사회이슈 처리부에서, 사이버 표적공격(APT, Advanced Persistent Threat) 발생시, 발생한 사이버 표적공격에 대한 관련 데이터들과, 분석 대상 사이트들의 크롤링을 수행하여 상기 사이버 표적공격 발생을 기준으로 소정기간 전부터 소정기간 후까지의 사회이슈 데이터들을 수집하는 데이터 수집단계(S100);
사회이슈 처리부에서, 상기 데이터 수집단계(S100)에 의해 수집한 상기 데이터들 간의 상관도 분석을 수행하여, 각각의 상기 사회이슈 데이터에 대한 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 데이터 분석단계(S200);
SAPT 분석부에서, 상기 데이터 분석단계(S200)에 의해 분석한 데이터들을 이용하여, AI 기법에서의 학습을 위한 학습 데이터로 생성하는 학습 데이터 생성단계(S300);
SAPT 분석부에서, 상기 학습 데이터 생성단계(S300)에 의한 학습 데이터를 적용하여 기저장된 AI 학습을 수행하는 학습 단계(S400);
SAPT 분석부에서, 학습을 수행하고 난 후, 상기 데이터 수집단계(S100)에 의해 수집된 신규 사회이슈 데이터가 입력되는 신규 데이터 입력단계(S500);
SAPT 분석부에서, 상기 학습 데이터 생성단계(S300)에 의해 학습 데이터로 이용된 상기 데이터들에 포함되어 있는 상기 사회이슈 데이터를 기반으로 상기 신규 데이터 입력단계(S500)에 의해 입력된 상기 신규 사회이슈 데이터의 중복 여부를 판단하는 중복 판단단계(S600);
SAPT 분석부에서, 상기 중복 판단단계(S600)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 상기 사회이슈 데이터와 중복되지 않을 경우, 상기 학습 데이터 생성단계(S300)에 의해 학습 데이터로 이용된 상기 데이터들에 포함되어 있는 상기 사회이슈 데이터와 상기 신규 사회이슈 데이터 간의 상관도 분석을 수행하는 상관도 분석단계(S800); 및
SAPT 분석부에서, 상기 상관도 분석단계(S800)에 의한 분석 결과에 따라, 상기 사회이슈 데이터 중 상기 신규 사회이슈 데이터와 가장 높은 상관도의 사회이슈 데이터를 추출하여, 상기 학습 단계(S400)에 의한 학습 모델에 상기 추출한 사회이슈 데이터를 적용하여, 분석 결과를 통해 상기 추출한 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 위험도를 분석하는 제2 위험도 분석단계(S900);
를 포함하여 구성되는 것을 특징으로 하는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법.
In the social issue processing unit, when a cyber targeted attack (APT, Advanced Persistent Threat) occurs, it crawls data related to the cyber target attack and analysis target sites, and from before a predetermined period to after a predetermined period based on the occurrence of the cyber target attack. Data collection step of collecting social issue data up to (S100);
In the social issue processing unit, a data analysis step of analyzing the risk of a social issue-based cyber target attack for each of the social issue data by analyzing the correlation between the data collected by the data collection step (S100) ( S200);
In the SAPT analysis unit, using the data analyzed by the data analysis step (S200), a learning data generation step (S300) of generating learning data for learning in the AI technique;
In the SAPT analysis unit, a learning step (S400) of performing pre-stored AI learning by applying the learning data by the learning data generation step (S300);
In the SAPT analysis unit, after performing the learning, a new data input step (S500) of inputting the new social issue data collected by the data collection step (S100);
In the SAPT analysis unit, the new social issue input by the new data input step (S500) based on the social issue data included in the data used as learning data by the learning data generating step (S300) Duplicate determination step of determining whether data is duplicated (S600);
In the SAPT analysis unit, according to the determination result of the overlapping determination step (S600), if the new social issue data does not overlap with the social issue data, the learning data generation step (S300) uses the new social issue data as learning data. A correlation analysis step (S800) of performing correlation analysis between the social issue data included in the data and the new social issue data; and
In the SAPT analysis unit, according to the analysis result by the correlation analysis step (S800), social issue data having the highest degree of correlation with the new social issue data is extracted from the social issue data, and the learning step (S400) is carried out. A second risk analysis step (S900) of applying the extracted social issue data to the learning model by analyzing the risk of a cyber target attack based on the social issue of the extracted social issue data through the analysis result;
Risk analysis method of social issue-based cyber target attack using AI and correlation analysis technique, characterized in that it comprises a.
제 8항에 있어서,
상기 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법은
상기 중복 판단단계(S600)를 수행하고 난 후, SAPT 분석부에서, 상기 중복 판단단계(S600)의 판단 결과에 따라, 상기 신규 사회이슈 데이터가 상기 사회이슈 데이터와 중복될 경우, 상기 학습 단계(S400)에 의한 학습 모델에 상기 신규 사회이슈 데이터를 그대로 적용하여, 분석 결과를 통해 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 위험도를 산정하는 제1 위험도 분석단계(S700);
를 더 포함하며,
상기 제2 위험도 분석 단계(S900)를 수행하고 난 후, SAPT 분석부에서, 상기 제2 위험도 분석단계(S900)에 의해 분석한 상기 추출한 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 위험도에 기설정된 상관계수 값을 적용하여 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 초기 위험도를 산정하는 신규 위험도 산정단계(S1000);
를 더 포함하는 것을 특징으로 하는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법.
According to claim 8,
The risk analysis method of cyber target attacks based on social issues using AI and correlation analysis techniques
After performing the redundancy determination step (S600), in the SAPT analysis unit, if the new social issue data overlaps with the social issue data according to the determination result of the overlap determination step (S600), the learning step ( A first risk analysis step (S700) of applying the new social issue data as it is to the learning model by S400 and calculating the risk of a cyber target attack based on the social issue of the new social issue data through the analysis result;
Including more,
After performing the second risk analysis step (S900), in the SAPT analysis unit, the risk of the social issue-based cyber target attack of the extracted social issue data analyzed by the second risk analysis step (S900) is preset. A new risk calculation step (S1000) of calculating an initial risk of a cyber target attack based on the social issue of the new social issue data by applying a correlation coefficient value;
A risk analysis method of social issue-based cyber target attacks using AI and correlation analysis techniques, characterized in that it further comprises.
제 9항에 있어서,
상기 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법은
SAPT 분석부에서, 상기 신규 위험도 산정단계(S1000)에 의해 산정한 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 초기 위험도를 상기 데이터 분석단계(S200)로 전달하여, 상기 신규 사회이슈 데이터의 사회이슈 기반 사이버 표적공격의 위험도에 대한 추가 분석을 수행하는 추가 분석단계(S1100);
를 더 포함하여 구성되는 것을 특징으로 하는 AI와 상관도 분석 기법을 이용한 사회이슈 기반 사이버 표적공격의 위험도 분석 방법.

According to claim 9,
The risk analysis method of cyber target attacks based on social issues using AI and correlation analysis techniques
In the SAPT analysis unit, the initial risk of the social issue-based cyber target attack of the new social issue data calculated by the new risk calculation step (S1000) is transmitted to the data analysis step (S200), and the new social issue data An additional analysis step (S1100) of performing additional analysis on the risk of cyber target attacks based on social issues;
Risk analysis method of social issue-based cyber target attack using AI and correlation analysis technique, characterized in that it is configured to further include.

KR1020200159959A 2020-11-25 2020-11-25 Risk analysis system and method of social advanced persistent threat using AI and similarity analysis KR102472449B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200159959A KR102472449B1 (en) 2020-11-25 2020-11-25 Risk analysis system and method of social advanced persistent threat using AI and similarity analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200159959A KR102472449B1 (en) 2020-11-25 2020-11-25 Risk analysis system and method of social advanced persistent threat using AI and similarity analysis

Publications (2)

Publication Number Publication Date
KR20220072399A KR20220072399A (en) 2022-06-02
KR102472449B1 true KR102472449B1 (en) 2022-12-01

Family

ID=81985493

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200159959A KR102472449B1 (en) 2020-11-25 2020-11-25 Risk analysis system and method of social advanced persistent threat using AI and similarity analysis

Country Status (1)

Country Link
KR (1) KR102472449B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102120214B1 (en) * 2019-11-15 2020-06-08 (주)유엠로직스 Cyber targeted attack detect system and method using ensemble learning
KR102120232B1 (en) 2019-11-04 2020-06-16 (주)유엠로직스 Cyber targeted attack detect system and method using kalman-filter algorithm

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160095856A (en) * 2015-02-04 2016-08-12 한국전자통신연구원 System and method for detecting intrusion intelligently based on automatic detection of new attack type and update of attack type
KR101781450B1 (en) 2017-01-03 2017-09-25 한국인터넷진흥원 Method and Apparatus for Calculating Risk of Cyber Attack
KR102075715B1 (en) * 2018-05-29 2020-02-10 국방과학연구소 Apparatus for classifying attack groups and method therefor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102120232B1 (en) 2019-11-04 2020-06-16 (주)유엠로직스 Cyber targeted attack detect system and method using kalman-filter algorithm
KR102120214B1 (en) * 2019-11-15 2020-06-08 (주)유엠로직스 Cyber targeted attack detect system and method using ensemble learning

Also Published As

Publication number Publication date
KR20220072399A (en) 2022-06-02

Similar Documents

Publication Publication Date Title
US11956272B2 (en) Identifying legitimate websites to remove false positives from domain discovery analysis
US9015802B1 (en) Personally identifiable information detection
US9092988B2 (en) Multi-dimensional feature merging for open domain question answering
Ramesh et al. An efficacious method for detecting phishing webpages through target domain identification
CN110537180B (en) System and method for tagging elements in internet content within a direct browser
Kiruthiga et al. Phishing websites detection using machine learning
US11062035B2 (en) Secure document management using blockchain
US8639683B2 (en) Method for data analysis and digital forensics and system using the same
Brynielsson et al. Analysis of weak signals for detecting lone wolf terrorists
KR101584123B1 (en) System and method of search validation
Bose et al. A novel approach for detection and ranking of trendy and emerging cyber threat events in twitter streams
US20140280014A1 (en) Apparatus and method for automatic assignment of industry classification codes
CN106779278A (en) The evaluation system of assets information and its treating method and apparatus of information
CN108829656B (en) Data processing method and data processing device for network information
KR102060766B1 (en) System for monitoring crime site in dark web
Aydin et al. Using attribute-based feature selection approaches and machine learning algorithms for detecting fraudulent website URLs
US11797617B2 (en) Method and apparatus for collecting information regarding dark web
Frank et al. Spreading the Message Digitally: A Look into Extremist Organizations’ Use of the Internet
KR20200089893A (en) The health information storage and searching system using Big-data text mining and Block-chain technology
Samonte Polarity analysis of editorial articles towards fake news detection
JP5720536B2 (en) Information processing method and apparatus for searching for concealed data
KR102472449B1 (en) Risk analysis system and method of social advanced persistent threat using AI and similarity analysis
CN112685389B (en) Data management method, data management device, electronic device, and storage medium
Layton et al. Determining provenance in phishing websites using automated conceptual analysis
CN113821608A (en) Service search method, service search device, computer equipment and storage medium

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right