KR102499775B1 - System and method for quantitatively measuring the number of disaster news - Google Patents

System and method for quantitatively measuring the number of disaster news Download PDF

Info

Publication number
KR102499775B1
KR102499775B1 KR1020220087460A KR20220087460A KR102499775B1 KR 102499775 B1 KR102499775 B1 KR 102499775B1 KR 1020220087460 A KR1020220087460 A KR 1020220087460A KR 20220087460 A KR20220087460 A KR 20220087460A KR 102499775 B1 KR102499775 B1 KR 102499775B1
Authority
KR
South Korea
Prior art keywords
disaster
information
keyword
news
unit
Prior art date
Application number
KR1020220087460A
Other languages
Korean (ko)
Inventor
김도우
신은혜
정재학
Original Assignee
대한민국
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국 filed Critical 대한민국
Priority to KR1020220087460A priority Critical patent/KR102499775B1/en
Application granted granted Critical
Publication of KR102499775B1 publication Critical patent/KR102499775B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

The present invention relates to a system and method for quantitatively measuring the number of disaster news cases. The system for quantitatively measuring the number of disaster news cases, according to the present invention, comprises: an information input unit; a disaster news collection unit; a disaster type determination unit; a disaster news ratio calculation unit; a keyword storage management unit; an information storage unit; an information provision unit; and a control unit. Therefore, it is possible to accurately determine whether relevant news information is a natural disaster type or a social disaster type.

Description

재난뉴스 건수의 정량적 측정 시스템 및 방법{SYSTEM AND METHOD FOR QUANTITATIVELY MEASURING THE NUMBER OF DISASTER NEWS}System and method for quantitative measurement of the number of disaster news cases {SYSTEM AND METHOD FOR QUANTITATIVELY MEASURING THE NUMBER OF DISASTER NEWS}

본 발명은 재난뉴스 건수의 정량적 측정 시스템 및 방법에 관한 것으로서, 보다 상세하게는 일정 기간동안 수집한 뉴스 정보를 기설정된 기계학습 기반의 자연재난/사회재난 판별 모델을 이용하여 해당 뉴스 정보의 재난 세부유형 정보를 정확하게 판단함으로써 다양한 재난유형별 재난뉴스의 건수를 정량적으로 측정할 수 있는 기술에 관한 것이다. The present invention relates to a system and method for quantitatively measuring the number of disaster news cases, and more particularly, by using a preset machine learning-based natural disaster/social disaster discrimination model for news information collected for a certain period of time, disaster details of the corresponding news information It is about a technology that can quantitatively measure the number of disaster news by various disaster types by accurately determining the type information.

각종 국가 재난관리 정책 수립에 있어 우리사회가 재난에 대해 얼마나 관심을 가지고 있는지를 파악하는 것은 매우 중요한 일이다. In establishing various national disaster management policies, it is very important to understand how much our society is interested in disasters.

그간 재난에 대한 사회적 관심의 정도는 주로 일부 사람들에게 직접 설문조사를 실시하는 방법으로 측정되어져 왔다. 일 예로 통계청의 사회조사, 행정안전부의 국민안전의식조사가 그 대표적인 사례이다. So far, the degree of social interest in disasters has been mainly measured by conducting surveys on some people. For example, the Social Survey by the National Statistical Office and the National Safety Awareness Survey by the Ministry of Public Administration and Security are typical examples.

하지만 설문조사 방법은 대게 수년에서 수십년의 장기간 동안 설문 대상 집단을 동일하게 유지할 수 없으므로 자료의 균질성에 한계가 있다. However, survey methods have limitations in the homogeneity of data because they cannot maintain the same population for a long period of time, usually several years to decades.

또한 설문조사에 필요한 비용적 측면 때문에 설문조사를 일부 집단에 한정하여 수행할 수밖에 없기 때문에 설문조사 결과의 대표성에도 한계가 존재한다. In addition, there is a limit to the representativeness of the survey results because the survey has no choice but to be limited to a certain group due to the aspect of cost required for the survey.

뿐만 아니라 재난에 얼마나 관심을 갖고 있는지에 대한 설문은 설문을 수행하는 시기에 민감하게 반응할 수 있다. 예를 들어 설문조사가 대형재난이 발생한 직후에 수행된다면 재난에 대한 관심이 과도하게 높다고 조사될 수 있다. In addition, the survey on how interested in disasters can be sensitive to the timing of the survey. For example, if a survey is conducted right after a major disaster occurs, it may be investigated that interest in the disaster is excessively high.

한편, 뉴스는 언론사에서 매일 끊임없이 생산되는 정보로서 장기간 동안 연속성이 확보되는 자료이며, 주로 국민이 관심을 가지는 주제에 대해 정보를 생산하므로 사회적 관심에 대한 대표성을 확보할 수 있다.On the other hand, news is information that is constantly produced every day in the media, and continuity is secured for a long period of time. Since news is mainly produced on topics of interest to the public, it is possible to secure representation of social interest.

따라서 일정 기간동안 수집한 뉴스 데이터를 기반으로 해당 뉴스가 자연재난 혹은 사회재난과 관련된 뉴스인지를 판별할 수 있으면 재난 관련 뉴스량을 측정함으로써 재난에 대한 사회적 관심도를 확인할 수 있게 된다.Therefore, if it is possible to determine whether the corresponding news is news related to a natural disaster or a social disaster based on news data collected over a certain period of time, the degree of social interest in the disaster can be confirmed by measuring the amount of news related to the disaster.

이와 비슷한 취지의 예로 한국등록특허공보 제2111609호에 수많은 뉴스의 텍스트 정보 중 술어를 트리거로 하여 해당 술어에 따른 사건 속성정보를 추출함으로써 보다 신속하고 정확한 재난 속성정보를 파악할 수 있는 재난속성정보 추출 시스템이 공지되어 있다.As an example of a similar purpose, Korea Patent Publication No. 2111609 uses a predicate as a trigger among text information of numerous news to extract event attribute information according to the predicate, so that more rapid and accurate disaster attribute information can be identified. Disaster attribute information extraction system this is known.

그러나 이와 같은 기술은 해당 재난 사고의 속성정보를 추출함에 있어서 단순히 술어 검색을 통한 재난 분류를 수행하고 있기 때문에 기설정된 키워드 목록에 제한된다는 단점이 있다.However, this technology has a disadvantage in that it is limited to a preset keyword list because it simply performs disaster classification through predicate search when extracting attribute information of a corresponding disaster accident.

또한, 자연재난과 사회재난을 판별함에 있어서 종래의 기술과 같이 단순히 키워드 검색을 사용할 경우, 자연재난의 관련 뉴스는 검색 명칭이 자연재난 현상자체를 표현하기 때문에 비교적 간단하게 판별할 수 있으나, 사회재난의 관련 뉴스는 명칭만으로는 재난 현상이 표현되지 않는 경우가 대부분이기 때문에 사회재난을 판별하기에는 어려움이 있다.In addition, in discriminating between natural disasters and social disasters, when simply using a keyword search as in the prior art, news related to natural disasters can be identified relatively simply because the search name expresses the natural disaster phenomenon itself, but social disasters It is difficult to identify social disasters because most of the news related to <<<

뿐만 아니라 재난현상을 표현하는 키워드의 개수는 제한되어 있지만(붕괴 재난의 경우, “붕괴” “무너졌다” 등), 재난의 피해 대상을 표현하는 키워드는 거의 무제한적으로 다양한 단어들이 올 수 있기 때문에, 사회재난의 경우 미리 설정한 제한된 키워드 규칙으로는 관련 뉴스를 포괄적으로 찾아내기에 한계가 있다.In addition, although the number of keywords expressing disaster phenomena is limited (in the case of a collapse disaster, “collapse”, “collapsed”, etc.), the number of keywords expressing the target of disaster damage is almost unlimited, so various words can come. However, in the case of social disasters, there is a limit to finding related news comprehensively with the limited keyword rules set in advance.

이러한 어려움 때문에 학술적으로도 뉴스자료에서 자연재난에 대한 정보를 종합적으로 분류한 연구들은 있지만(Nugent et al., 2017; Domala et al., 2020 등), 사회재난을 종합적으로 다룬 연구는 발견되지 않고 있는 실정이다.Because of these difficulties, there are academic studies that comprehensively classify information on natural disasters from news sources (Nugent et al., 2017; Domala et al., 2020, etc.), but no studies that comprehensively deal with social disasters have been found. There is a situation.

한국등록특허 제10-2111609호Korean Patent Registration No. 10-2111609

본 발명은 상술한 문제점을 해결하기 위하여 안출된 것으로 일정 기간동안 수집한 뉴스 정보를 기설정된 기계학습 기반의 재난유형 판별 모델을 이용하여 해당 뉴스 정보의 재난 세부유형 정보를 정확하게 판단함으로써 자연재난 및 사회재난의 다양한 재난유형들에 대한 사회적 관심을 재난관련 뉴스건수로 대변하여 정확하게 확인할 수 있고자 한다. The present invention has been made to solve the above problems, and by using a predetermined machine learning-based disaster type discrimination model for news information collected for a certain period of time, accurately determining the detailed disaster type information of the corresponding news information, natural disasters and social disasters We want to be able to accurately confirm the social interest in various disaster types of disasters by representing the number of disaster-related news cases.

또한, 사회재난 뉴스정보에 대한 기계학습 기반의 재난유형 판별 모델을 구축함에 있어서, 사회재난 세부유형별 재난현상 관련 키워드 목록뿐만 아니라 사회재난 세부유형별 피해대상/원인물질에 대한 키워드 목록을 함께 구축하여 기계학습을 통해 재난유형 판별 모델을 생성함으로써 사회재난 유형의 판별 정확도를 더욱 높일 수 있도록 하고자 한다.In addition, in constructing a machine learning-based disaster type discrimination model for social disaster news information, a list of keywords related to disaster phenomena by detailed types of social disasters as well as a list of keywords for damage targets/causative substances by detailed types of social disasters are built together By creating a disaster type discrimination model through learning, it is intended to further increase the accuracy of social disaster type discrimination.

특히, 키워드 검색에 대한 한계성을 극복하기 위하여 워드투벡터 기술을 통해 단어 사전을 설정함으로써 기설정된 사회재난 세부유형별 피해대상/원인물질 키워드와 유사한 의미를 가지는 새로운 키워드들을 추가적으로 발굴하며, 사회재난 세부유형별로 분류된 뉴스들을 딥러닝과 같은 기계학습 방법으로 컴퓨터에게 학습시켜 의미기반의 분류 모델을 구축하고자 한다.In particular, in order to overcome the limitations of keyword search, a word dictionary is set up through word-to-vector technology to additionally discover new keywords that have similar meanings to the keywords of victims/causative substances for each detailed type of social disaster. We are trying to build a semantic-based classification model by learning the news classified by a computer with a machine learning method such as deep learning.

본 발명의 일측면에 따르면, 재난뉴스 건수의 정량적 측정 시스템은 사용자의 재난관련 입력정보를 입력받는 정보 입력부, 온라인 상의 언론사 데이터베이스에 접속하여 일정기간 동안의 재난관련 뉴스정보를 수집하는 재난뉴스 수집부, 수집된 재난관련 뉴스정보를 기설정된 기계학습 기반의 자연재난 판별 모델 및 사회재난 판별 모델을 통해 각 재난관련 뉴스정보의 재난 세부유형정보를 판별하는 재난유형 판별부, 재난 세부유형별 재난관련 뉴스정보들을 기설정된 산출 프로그램을 통해 각 재난 세부유형별 재난뉴스의 비율을 산출하는 재난뉴스 비율 산출부, 재난 세부유형별 키워드 관련 정보를 저장하며, 기설정된 키워드 생성 프로그램을 통해 새로운 키워드를 생성 및 저장하는 키워드 저장관리부, 사용자의 재난관련 입력정보, 재난뉴스 수집부의 재난관련 뉴스정보, 재난유형 판별부의 재난 세부유형별 재난관련 뉴스정보, 재난뉴스 비율 산출부의 재난 세부유형별 재난뉴스 비율 정보를 포함하여 각종 재난관련정보를 저장하는 정보 저장부, 사용자의 입력정보에 따른 각종 재난관련 정보를 제공하는 정보 제공부 및 상기 정보 입력부, 재난뉴스 수집부, 재난유형 판별부, 재난뉴스 비율 산출부, 키워드 저장관리부, 정보 저장부 및 정보 제공부와 각각 연결되어 입출력 신호를 제어하는 제어부를 포함하여 구성되는 것을 특징으로 한다.According to one aspect of the present invention, the quantitative measurement system for the number of disaster news cases includes an information input unit that receives user's disaster-related input information, and a disaster news collection unit that accesses an online media database to collect disaster-related news information for a certain period of time. , Disaster type determination unit that determines the detailed disaster type information of each disaster-related news information through a preset machine learning-based natural disaster discrimination model and social disaster discrimination model based on the collected disaster-related news information, and disaster-related news information by detailed disaster type A disaster news ratio calculation unit that calculates the ratio of disaster news for each disaster detail type through a preset calculation program to store keywords related to each disaster type, and keyword storage that generates and stores new keywords through a preset keyword generation program Various disaster-related information, including disaster-related input information from the management unit, disaster-related news information from the disaster news collection unit, disaster-related news information by detailed disaster type from the disaster type determination unit, and disaster news rate information by disaster news rate calculation unit from the disaster news rate calculation unit. Information storage unit to store, information provision unit and information input unit that provides various disaster-related information according to user input information, disaster news collection unit, disaster type determination unit, disaster news rate calculation unit, keyword storage management unit, information storage unit And it is characterized in that it is configured to include a control unit that is connected to the information providing unit and controls input and output signals.

본 발명의 다른 측면에 따르면, 재난뉴스 건수의 정량적 측정 방법은 정보 입력부를 통해 사용자의 재난뉴스 수집 설정정보를 입력받는 단계, 재난뉴스 수집부를 통해 온라인 상의 언론사 데이터베이스에 접속하여 재난뉴스 수집 설정정보에 따라 일정기간 동안의 재난관련 뉴스정보를 수집하는 단계, 재난유형 판별부를 통해 키워드 저장관리부에 설정된 키워드 정보에 기초하여, 수집된 재난관련 뉴스정보를 기설정된 기계학습 기반의 자연재난 판별 모델 및 사회재난 판별 모델을 통해 각 재난관련 뉴스정보의 재난 세부유형정보를 판별하는 단계, 재난뉴스 비율 산출부를 통해 재난 세부유형별 재난관련 뉴스정보들을 기설정된 산출 프로그램을 통해 각 재난 세부유형별 재난뉴스 비율을 산출하는 단계 및 정보 제공부를 통해 각 재난 세부유형별 재난뉴스 비율 정보를 사용자에게 제공하는 단계를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, a method for quantitatively measuring the number of disaster news cases comprises the steps of receiving user's disaster news collection setting information through an information input unit, accessing an online media database through the disaster news collection unit, and generating disaster news collection setting information. Based on the keyword information set in the keyword storage and management unit through the disaster type determination unit, the collected disaster-related news information is collected through a preset machine learning-based natural disaster discrimination model and social disaster The step of discriminating the detailed disaster type information of each disaster-related news information through a discrimination model, the step of calculating the disaster news rate for each detailed disaster type through a preset calculation program for the disaster-related news information for each detailed disaster type through the disaster news rate calculation unit and providing disaster news rate information for each detailed disaster type to a user through an information providing unit.

본 발명에 따른 재난뉴스 건수의 정량적 측정 방법 및 시스템은 장기간 동안 수집된 재난 뉴스 정보들을 기설정된 자연재난 및 사회재난에 대한 각각의 기계학습 기반의 재난유형 판별 모델을 이용하여 해당 뉴스정보가 자연재난 유형인지 또는 사회재난 유형인지를 정확하게 판별할 수 있는 효과가 있다.The method and system for quantitatively measuring the number of disaster news cases according to the present invention uses the disaster news information collected for a long period of time to predict whether the news information is a natural disaster by using a machine learning-based disaster type discrimination model for each preset natural disaster and social disaster. It has the effect of accurately discriminating whether it is a type of disaster or a social disaster.

또한, 사회재난 뉴스정보를 판별하는 경우 뉴스 제목 내에 기설정된 사회재난 세부유형별 재난현상 관련 키워드가 포함되어 있는 동시에 기설정된 해당 세부유형의 피해대상/원인물질 키워드가 포함되어 있는 경우 해당되는 사회재난 관련 뉴스로 분류함으로써 재난뉴스의 세부유형 정보를 더욱 정확하게 판단할 수 있는 장점이 있다.In addition, when determining social disaster news information, if keywords related to disaster phenomena for each detailed type of social disaster are included in the news title, and at the same time, the subject of damage/causative substance of the preset specific type is included, the relevant social disaster-related keywords are included. By classifying it as news, it has the advantage of being able to more accurately determine the detailed type of disaster news.

또한, 기설정된 세부유형별 재난현상 관련 키워드와 워드투벡터 기술로 설정된 단어 사전간 유사도를 계산하여 유사도가 높은 단어를 새로운 키워드 단어로 선정하여 재난 세부유형의 피해대상/원인물질 키워드 정보를 지속적으로 업데이트해줌으로써 재난유형의 판별력을 높일 수 있는 효과가 있다.In addition, by calculating the similarity between keywords related to disaster phenomena for each preset detailed type and the word dictionary set by word-to-vector technology, words with high similarity are selected as new keyword words to continuously update the keyword information on the subject of disaster / causative substance of the detailed type of disaster. This has the effect of increasing the ability to discriminate the type of disaster.

도 1은 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정시스템의 구성을 보여주는 시스템도.
도 2는 본 발명의 일실시예에 따른 키워드 저장관리부의 구성을 보여주는 도면.
도 3은 본 발명의 일실시예에 따른 키워드 저장관리부의 피해대상/원인물질 키워드부의 구성을 보여주는 도면.
도 4는 본 발명의 일실시예에 따른 자연재난 키워드부를 활용한 자연재난 세부유형 판별 방법을 설명하기 위한 도면.
도 5는 본 발명의 일실시예에 따른 사회재난 키워드부의 재난현상 키워드부를 활용한 사회재난 세부유형 판별 방법을 설명하기 위한 도면.
도 6은 본 발명의 일실시예에 따른 사회재난 키워드부의 피해대상/원인물질 키워드부를 활용한 사회재난 세부유형 판별 방법을 설명하기 위한 도면.
도 7은 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정 방법을 보여주는 순서도.
도 8은 본 발명의 일실시예에 따른 재난관련 뉴스정보의 재난 세부유형 정보를 판별하는 방법을 보여주는 순서도.
도 9는 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정 방법을 이용한 측정 결과정보 제공의 일 예를 보여주는 도면.
도 10은 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정 방법을 이용한 측정 결과정보 제공의 다른 예를 보여주는 도면.
도 11은 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정 방법을 이용한 측정 결과정보 활용의 일 예를 보여주는 도면.
1 is a system diagram showing the configuration of a system for quantitatively measuring the number of disaster news cases according to an embodiment of the present invention.
2 is a diagram showing the configuration of a keyword storage management unit according to an embodiment of the present invention.
Figure 3 is a view showing the configuration of the damage target / causative substance keyword unit of the keyword storage management unit according to an embodiment of the present invention.
4 is a view for explaining a natural disaster detailed type determination method using a natural disaster keyword unit according to an embodiment of the present invention;
5 is a view for explaining a social disaster detailed type discrimination method using a disaster phenomenon keyword part of a social disaster keyword part according to an embodiment of the present invention.
6 is a diagram for explaining a method for determining detailed types of social disasters using a damage target/causative substance keyword part of a social disaster keyword part according to an embodiment of the present invention.
7 is a flowchart showing a method for quantitatively measuring the number of disaster news cases according to an embodiment of the present invention.
8 is a flowchart illustrating a method of determining disaster detailed type information of disaster-related news information according to an embodiment of the present invention.
9 is a diagram showing an example of providing measurement result information using a method for quantitatively measuring the number of disaster news cases according to an embodiment of the present invention.
10 is a diagram showing another example of providing measurement result information using a method for quantitatively measuring the number of disaster news cases according to an embodiment of the present invention.
11 is a diagram showing an example of utilizing measurement result information using a method for quantitatively measuring the number of disaster news cases according to an embodiment of the present invention.

본 발명은 다양한 변환을 가할 수 있고 여러가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.Since the present invention can apply various transformations and have various embodiments, specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, it should be understood that this is not intended to limit the present invention to specific embodiments, and includes all transformations, equivalents, and substitutes included in the spirit and scope of the present invention. In describing the present invention, if it is determined that a detailed description of related known technologies may obscure the gist of the present invention, the detailed description will be omitted.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성 요소로부터 구별하는 목적으로만 사용된다. Terms such as first and second may be used to describe various components, but the components should not be limited by the terms. These terms are only used for the purpose of distinguishing one component from another.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. 이하, 본 발명의 실시예를 첨부한 도면들을 참조하여 상세히 설명하기로 한다.Terms used in this application are only used to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly dictates otherwise. In this application, the terms "include" or "have" are intended to designate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, but one or more other features It should be understood that the presence or addition of numbers, steps, operations, components, parts, or combinations thereof is not precluded. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정시스템의 구성을 보여주는 시스템도이며, 도 2는 본 발명의 일실시예에 따른 키워드 저장관리부의 구성을 보여주는 도면이며, 도 3은 본 발명의 일실시예에 따른 키워드 저장관리부의 피해대상/원인물질 키워드부의 구성을 보여주는 도면이며, 도 4는 본 발명의 일실시예에 따른 자연재난 키워드부를 활용한 자연재난 세부유형 판별 방법을 설명하기 위한 도면이며, 도 5는 본 발명의 일실시예에 따른 사회재난 키워드부의 재난현상 키워드부를 활용한 사회재난 세부유형 판별 방법을 설명하기 위한 도면이며, 도 6은 본 발명의 일실시예에 따른 사회재난 키워드부의 피해대상/원인물질 키워드부를 활용한 사회재난 세부유형 판별 방법을 설명하기 위한 도면이며, 도 7은 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정 방법을 보여주는 순서도이며, 도 8은 본 발명의 일실시예에 따른 재난관련 뉴스정보의 재난 세부유형 정보를 판별하는 방법을 보여주는 순서도이며, 도 9는 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정 방법을 이용한 측정 결과정보 제공의 일 예를 보여주는 도면이며, 도 10은 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정 방법을 이용한 측정 결과정보 제공의 다른 예를 보여주는 도면이며, 도 11은 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정 방법을 이용한 측정 결과정보 활용의 일 예를 보여주는 도면이다. 1 is a system diagram showing the configuration of a quantitative measurement system for the number of disaster news cases according to an embodiment of the present invention, FIG. 2 is a diagram showing the configuration of a keyword storage management unit according to an embodiment of the present invention, and FIG. It is a diagram showing the configuration of the damage target/causative substance keyword unit of the keyword storage management unit according to an embodiment of the present invention, and FIG. 4 explains a natural disaster detailed type discrimination method using the natural disaster keyword unit according to an embodiment of the present invention. FIG. 5 is a diagram for explaining a method of determining detailed types of social disasters using a disaster phenomenon keyword part of a social disaster keyword part according to an embodiment of the present invention, and FIG. 6 is a diagram according to an embodiment of the present invention. It is a diagram for explaining a method for determining the detailed types of social disasters using the damage target/causative substance keywords of the social disaster keyword unit, and FIG. 7 is a flowchart showing a quantitative measurement method of the number of disaster news cases according to an embodiment of the present invention. 8 is a flowchart showing a method for determining detailed disaster type information of disaster-related news information according to an embodiment of the present invention, and FIG. 9 is a measurement result using a quantitative measurement method for the number of disaster news cases according to an embodiment of the present invention. 10 is a diagram showing an example of providing information, and FIG. 10 is a diagram showing another example of providing measurement result information using a method for quantitatively measuring the number of disaster news cases according to an embodiment of the present invention, and FIG. 11 is a diagram showing one embodiment of the present invention. It is a diagram showing an example of utilizing measurement result information using a quantitative measurement method of the number of disaster news cases according to the example.

도 1 내지 도 3을 참조하면, 본 발명의 일실시예에 따른 재난뉴스 건수의 정량적 측정시스템(10)은 정보 입력부(100), 재난뉴스 수집부(200), 재난유형 판별부(300), 재난뉴스 비율 산출부(400), 키워드 저장관리부(500), 정보 저장부(600), 정보 제공부(700) 및 제어부(800)를 포함하여 구성된다.1 to 3, the quantitative measurement system 10 for the number of disaster news cases according to an embodiment of the present invention includes an information input unit 100, a disaster news collection unit 200, a disaster type determination unit 300, It is configured to include a disaster news rate calculation unit 400, a keyword storage management unit 500, an information storage unit 600, an information providing unit 700, and a control unit 800.

정보 입력부(100)는 키워드, 마우스 등의 입력 버튼을 구비한 키입력 장치로 구성될 수 있으며, 사용자로부터 시스템 기기의 작동 정보, 재난뉴스 수집 설정정보, 키워드 설정정보 등 각종 재난관련 입력정보를 입력받는다.The information input unit 100 may be composed of a key input device having input buttons such as keywords and a mouse, and inputs various disaster-related input information such as operation information of system devices, disaster news collection setting information, and keyword setting information from the user. receive

재난뉴스 수집부(200)는 웹 크롤링 모듈로 구성될 수 있으며, 온라인 상의 언론사 데이터베이스에 접속하여 일정기간 동안의 재난관련 뉴스정보를 수집한다.The disaster news collection unit 200 may be composed of a web crawling module, and collects disaster-related news information for a certain period of time by accessing an online media database.

이때, 일정 기간은 몇년 또는 수십년의 장기간으로 설정될 수 있으며, 사용자의 설정에 따라 다양하게 변경 가능함은 물론이다. At this time, the predetermined period may be set to a long period of several years or tens of years, and it is of course possible to change variously according to the user's setting.

재난유형 판별부(300)는 수집된 재난관련 뉴스정보를 기설정된 기계학습 기반의 재난유형 판별 모델을 통해 각 재난관련 뉴스정보의 세부재난유형 정보를 판별한다.The disaster type determination unit 300 determines detailed disaster type information of each disaster-related news information through a predetermined machine learning-based disaster type determination model for the collected disaster-related news information.

이러한 재난유형 판별부(300)는 자연재난 뉴스 판별부(310) 및 사회재난 뉴스 판별부(320)로 이루어질 수 있다.The disaster type determining unit 300 may include a natural disaster news determining unit 310 and a social disaster news determining unit 320 .

자연재난 뉴스 판별부(310)는 수집된 재난관련 뉴스정보를 기설정된 기계학습 기반의 자연재난 판별 모델을 통해 해당 뉴스정보의 자연재난 세부유형정보를 판별한다.The natural disaster news determination unit 310 determines the detailed type of natural disaster of the corresponding news information through a predetermined machine learning-based natural disaster determination model of the collected disaster-related news information.

자연재난 판별 모델은 재난관련 뉴스정보의 내용에서 키워드 저장관리부(500)에 기설정된 자연재난 세부유형별 재난현상 키워드 정보를 검색하여 일치하는 키워드가 있는 경우, 재난관련 뉴스정보의 세부유형정보를 해당 키워드가 속하는 자연재난 세부유형 정보로 판별한다.The natural disaster discrimination model searches disaster phenomenon keyword information for each detailed type of natural disaster preset in the keyword storage management unit 500 in the contents of disaster-related news information, and if there is a matching keyword, the detailed type information of disaster-related news information is converted to the corresponding keyword. It is determined by the detailed type of natural disaster to which it belongs.

사회재난 뉴스 판별부(320)는 수집된 재난관련 뉴스정보를 기설정된 기계학습 기반의 사회재난 판별 모델을 통해 해당 뉴스정보의 사회재난 세부유형정보를 판별한다.The social disaster news determination unit 320 determines the detailed social disaster type information of the corresponding news information through a preset machine learning-based social disaster determination model of the collected disaster-related news information.

사회재난 판별 모델은 재난관련 뉴스정보의 내용에서 키워드 저장관리부(500)에 기설정된 사회재난 세부유형별 재난현상 키워드 정보를 검색하여 일치하는 키워드가 존재하는 동시에, 키워드 저장관리부(500)에 기설정된 사회재난 세부유형별 피해대상/원인물질 키워드 정보를 검색하여 일치하는 키워드가 존재하는 경우, 해당 재난관련 뉴스정보의 세부유형정보를 해당 키워드가 속하는 자연재난 세부유형정보로 판별한다.The social disaster discrimination model searches disaster phenomenon keyword information for each detailed social disaster type preset in the keyword storage management unit 500 in the contents of disaster-related news information, and at the same time, a matching keyword exists, and at the same time, the social disaster Damage target/causative substance keyword information for each detailed disaster type is searched, and if a matching keyword exists, the detailed type information of the corresponding disaster-related news information is determined as the natural disaster detailed type information to which the keyword belongs.

이때, 상술한 바와 같은 자연재난 뉴스 판별부(310) 및 사회재난 뉴스 판별부(320)의 키워드 정보에 따른 재난 세부유형 판별 방법에 대한 구체적인 설명은 하기의 키워드 저장관리부(500)의 설명에서 함께 자세하게 설명하기로 한다. At this time, a detailed description of the disaster detailed type determination method according to the keyword information of the natural disaster news determination unit 310 and the social disaster news determination unit 320 as described above is included in the description of the keyword storage management unit 500 below. Let me explain in detail.

재난뉴스 비율 산출부(400)는 재난 세부유형별 재난관련 뉴스정보들을 기설정된 산출 프로그램을 통해 각 재난 세부유형별 재난뉴스 비율을 산출할 수 있다.The disaster news rate calculation unit 400 may calculate a disaster news rate for each disaster detail type through a preset calculation program for disaster-related news information for each disaster detail type.

본 발명에서는 재난뉴스의 비율을 산출함에 있어서, n일이라는 기간동안 재난에 대한 재난뉴스의 비유을 아래의 [수학식 1]과 같이 정의하였다.In the present invention, in calculating the ratio of disaster news, the analogy of disaster news to disaster for a period of n days is defined as in [Equation 1] below.

[수학식 1][Equation 1]

Figure 112022073975717-pat00001
Figure 112022073975717-pat00001

재난관련 뉴스 건수 = 자연재난 관련 뉴스 건수 + 사회재난 관련 뉴스 건수Number of news related to disasters = Number of news related to natural disasters + Number of news related to social disasters

즉, 재난뉴스의 비율은 특정 기간동안 우리사회에서 생산되는 뉴스량 대비 재난 관련 뉴스량의 백분율로 표현된다. That is, the ratio of disaster news is expressed as a percentage of the amount of news related to disasters compared to the amount of news produced in our society during a specific period.

여기서 재난관련 뉴스란 「재난 및 안전관리 기본법」 상 명시되어 있는 자연재난과 사회재난을 지칭한다. Here, disaster-related news refers to natural disasters and social disasters specified in the 「Framework Act on Disaster and Safety Management」.

자연재난의 세부재난유형은 태풍, 홍수, 강풍, 풍랑, 해일, 대설, 한파, 낙뢰, 가뭄, 폭염, 지진, 황사, 조수, 화산으로 구성되며, 사회재난의 세부재난유형은 화재, 폭발, 붕괴, 교통사고, 화생방사고, 환경오염, 국가기반마비, 미세먼지, 감염병, 가축전염병으로 구성된다. The detailed disaster types of natural disasters are composed of typhoon, flood, strong wind, wind wave, tidal wave, heavy snow, cold wave, lightning strike, drought, heat wave, earthquake, yellow dust, tidal wave, and volcano. Detailed disaster type of social disaster is fire, explosion, and collapse. , traffic accidents, chemical, biological and radiological accidents, environmental pollution, national infrastructure paralysis, fine dust, infectious diseases, and livestock epidemics.

따라서 해당 뉴스가 자연재난 혹은 사회재난과 관련된 뉴스인지를 판별할 수 있으면 재난 관련 뉴스량을 측정할 수 있게 된다.Therefore, if it is possible to determine whether the corresponding news is news related to natural disasters or social disasters, it is possible to measure the amount of news related to disasters.

키워드 저장관리부(500)는 재난 세부유형별 키워드 관련 정보를 저장하며, 기설정된 키워드 생성 프로그램을 통해 새로운 키워드를 생성 및 저장하는 역할을 수행한다.The keyword storage management unit 500 stores keyword-related information for each detailed disaster type, and plays a role of generating and storing new keywords through a preset keyword generation program.

키워드 저장관리부(500)는 자연재난 키워드부(510), 사회재난 키워드부(520) 및 키워드 설정부(530)로 구성될 수 있다.The keyword storage management unit 500 may include a natural disaster keyword unit 510, a social disaster keyword unit 520, and a keyword setting unit 530.

자연재난 키워드부(510)는 자연재난 세부유형별로 키워드 정보가 설정되어 저장되며, 아래의 [표 1]에서와 같이 나타낼 수 있다.In the natural disaster keyword unit 510, keyword information is set and stored for each detailed type of natural disaster, and may be represented as shown in [Table 1] below.

Figure 112022073975717-pat00002
Figure 112022073975717-pat00002

[표 1] 자연재난 세부유형별 재난현상 관련 키워드 구성[Table 1] Composition of keywords related to disaster phenomena by detailed types of natural disasters

즉, 자연재난 키워드부(510)는 자연재난 세부유형별로 재난현상 관련 키워드 정보가 설정되어 저장되며, 자연재난 세부유형 정보는 태풍, 홍수, 강풍, 풍랑, 해일, 대설, 한파, 낙뢰, 가뭄, 폭염, 지진, 황사, 조류 및 화산을 포함하여 구성될 수 있다.That is, the natural disaster keyword unit 510 sets and stores keyword information related to disaster phenomena for each detailed type of natural disaster. It can consist of heat waves, earthquakes, yellow dust, tidal currents, and volcanoes.

여기서, 각 세부유형별 키워드 정보는 태풍은 태풍, 홍수는 홍수, 폭우, 호우, 수몰, 침수, 범람, 강풍은 강풍, 강한 바람, 토네이도, 풍랑은 풍랑, 높은 파도, 해일은 해일, 쓰나미, 대설은 대설, 폭설, 적설, 많은 눈, 한파는 한파, 강추위, 맹추위, 낙뢰는 낙뢰, 가뭄은 가뭄, 한발, 폭염은 폭염, 무더위, 불볕더위, 찜통더위, 가마솥더위, 지진은 지진, 여진, 황사는 황사, 조류는 녹조, 적조, 화산은 화산, 백두산 등의 키워드로 이루어질 수 있다.Here, the keyword information for each detailed type is typhoon for typhoon, flood for flood, heavy rain, heavy rain, submersion, inundation, overflow, strong wind for strong wind, strong wind, tornado, storm for storm, high waves, tsunami for tidal wave, tsunami, and heavy snow. Heavy snow, heavy snow, snowfall, a lot of snow, cold snap is cold snap, strong cold, fierce cold, lightning is lightning, drought is drought, drought, heat wave is heat wave, sweltering heat, scorching heat, steamer heat, cauldron heat, earthquake is earthquake, aftershock, yellow dust can be composed of keywords such as yellow sand, algae, green tide, red tide, volcano, volcano, and Mt. Baekdu.

한편, 이와 같이 자연재난 키워드부(510)에 설정된 키워드 정보들은 사용자의 키워드 설정에 따라 다양하게 추가, 삭제 및 변경이 가능함은 물론이다.Meanwhile, the keyword information set in the natural disaster keyword unit 510 can be variously added, deleted, and changed according to the user's keyword setting.

사회재난 키워드부(520)는 재난현상 키워드부(521)와 피해대상/원인물질 키워드부(522)로 구성될 수 있다.The social disaster keyword unit 520 may include a disaster phenomenon keyword unit 521 and a damage target/causative substance keyword unit 522.

재난현상 키워드부(521)는 사회재난 세부유형별로 키워드 정보가 설정되어 저장되며 아래의 [표 2]에서와 같이 나타낼 수 있다.In the disaster phenomenon keyword unit 521, keyword information is set and stored for each detailed type of social disaster, and can be represented as shown in [Table 2] below.

Figure 112022073975717-pat00003
Figure 112022073975717-pat00003

[표 2] 사회재난 세부유형별 재난현상 관련 키워드 구성[Table 2] Composition of keywords related to disaster phenomena by detailed types of social disasters

즉, 재난현상 키워드부(521)는 사회재난 세부유형별로 재난현상 관련 키워드 정보가 설정되어 저장되며, 사회재난 세부유형 정보는 화재, 폭발, 붕괴, 교통사고, 화생방사고, 환경오염, 국가기반마비, 미세먼지, 감염병, 가축전염병을 포함하여 구성될 수 있다.That is, in the disaster phenomenon keyword unit 521, keyword information related to disaster phenomena is set and stored for each detailed type of social disaster. , fine dust, infectious diseases, and livestock infectious diseases.

여기서, 각 세부유형별 키워드 정보는 화재 폭발은 화재, 폭발, 붕괴는 붕괴, 무너져, 교통사고는 사망, 숨져, 부상, 실종, 화생방 사고는 유출, 누출, 확산, 오염, 환경오염사고는 유출, 누출, 확산, 오염, 국가핵심기반마비는 마비, 두절, 장애, 대란, 감염병은 사망, 숨져, 검출, 발병, 확진, 가축전염병은 검출, 발병, 확산, 폐사, 미세먼지는 미세먼지 등의 키워드로 이루어질 수 있다.Here, the keyword information for each detailed type is fire, explosion, collapse for fire, explosion, collapse, collapse, traffic accident for death, death, injury, missing, NBC accident for leak, leak, spread, contamination, and environmental pollution accident for leak, leak. , proliferation, contamination, and paralysis of the national core infrastructure are paralysis, disruption, disability, chaos, and infectious diseases are death, death, detection, outbreak, confirmation, and livestock epidemics are detected, outbreak, spread, death, and fine dust are keywords such as fine dust. It can be done.

한편, 이와 같이 재난현상 키워드부(521에 설정된 키워드 정보들은 사용자의 키워드 설정에 따라 다양하게 추가, 삭제 및 변경이 가능함은 물론이다.Meanwhile, the keyword information set in the disaster phenomenon keyword unit 521 can be added, deleted, and changed in various ways according to the user's keyword setting.

피해대상/원인물질 키워드부(522)는 사회재난 세부유형별로 피해대상/원인물질 키워드 정보가 설정되어 저장된다.In the damage target/causative substance keyword unit 522, damage target/causative substance keyword information is set and stored for each detailed type of social disaster.

이러한 피해대상/원인물질 키워드부(522)는 키워드 목록부(522a), 단어 사전부(522b) 및 키워드 업데이트부(522c)로 이루어질 수 있다.The damage target/causative substance keyword unit 522 may include a keyword list unit 522a, a word dictionary unit 522b, and a keyword update unit 522c.

키워드 목록부(522a)는 수집된 재난관련 뉴스정보를 기반으로 사회재난 세부유형별 피해대상/원인물질 키워드 목록이 기설정되어 저장될 수 있으며, 아래의 [표 3]에서와 같이 나타낼 수 있다.The keyword list unit 522a may preset and store a list of keywords for damage targets/causative substances for each detailed social disaster type based on the collected disaster-related news information, and may be represented as shown in [Table 3] below.

Figure 112022073975717-pat00004
Figure 112022073975717-pat00004

[표 3] 사회재난 세부유형별 피해대상/원인물질 관련 키워드 구성[Table 3] Composition of keywords related to victims/causative substances by detailed types of social disasters

즉, 피해대상/원인물질 키워드부(522)는 사회재난 세부유형별로 피해대상이나 원인물질과 관련된 키워드 정보가 설정되어 저장되며, 사회재난 세부유형 정보는 화재, 폭발, 붕괴, 교통사고, 화생방사고, 환경오염, 국가기반마비, 미세먼지, 감염병, 가축전염병을 포함하여 구성될 수 있다.That is, in the damage target/causative substance keyword unit 522, keyword information related to damage targets or causative substances for each detailed type of social disaster is set and stored. , environmental pollution, national infrastructure paralysis, fine dust, infectious diseases, and livestock epidemics.

여기서, 각 세부유형별 키워드 정보는 붕괴는 건물 및 시설 관련 단어 목록, 교통사고는 자동차, 비행기, 선박 등 이동수단 관련 단어 목록, 화생방 사고는 방사능, 원자력 및 화학 물질 관련 단어 목록, 환경오염사고는 해양, 토양, 수질 오염 물질 관련 단어 목록, 국가핵심기반 마비는 전력, 가스, 통신, 금융, 교통, 항만, 식수 관련 단어 목록, 감염병은 감염병 관련 단어 목록, 가축 전염병은 가축 전염병 관련 단어 목록 등으로 이루어질 수 있다.Here, the keyword information for each detailed type is a list of words related to buildings and facilities for collapse, a list of words related to transportation means such as cars, airplanes, and ships for traffic accidents, a list of words related to radioactivity, nuclear power, and chemical substances for chemical, biological and radiological accidents, and a list of words related to environmental pollution accidents. , soil and water pollutant-related word list, national core infrastructure paralysis is a word list related to electricity, gas, communication, finance, transportation, ports, and drinking water, infectious disease is a word list related to infectious diseases, and livestock epidemic is a word list related to livestock epidemics. can

한편, 이와 같이 피해대상/원인물질 키워드부(522)에 설정된 키워드 정보들은 사용자의 키워드 설정에 따라 다양하게 추가, 삭제 및 변경이 가능함은 물론이다.Meanwhile, the keyword information set in the damage target/causative substance keyword unit 522 can be added, deleted, and changed in various ways according to the user's keyword setting.

단어 사전부(522b)는 수집된 재난관련 뉴스정보를 기반으로 형태소 분석 및 워드투벡터를 통해 단어 사전을 생성할 수 있다.The word dictionary unit 522b may generate a word dictionary through morpheme analysis and word-to-vector based on the collected disaster-related news information.

키워드 업데이트부(522c)는 키워드 목록부(522a) 및 단어 사전부(522b)의 단어들 간의 유사도를 산출하여 유사도가 높은 단어를 새로운 키워드로 설정하여 상기 키워드 목록부(522a)에 업데이트할 수 있다.The keyword update unit 522c calculates similarity between words in the keyword list unit 522a and the word dictionary unit 522b, sets a word having a high similarity as a new keyword, and updates the keyword list unit 522a. .

이때, 키워드 업데이트부(522c)는 아래의 [수학식 2]를 통해 키워드 목록부 및 단어 사전부의 단어들 간의 유사도를 산출할 수 있다.At this time, the keyword update unit 522c may calculate the similarity between the words of the keyword list unit and the word dictionary unit through [Equation 2] below.

[수학식 2][Equation 2]

Figure 112022073975717-pat00005
Figure 112022073975717-pat00005

여기서 유사도 값은 -1에서 1까지의 값을 가지며, -1은 서로 완전히 반대되는 경우, 0은 서로 독립적인 경우, 1은 서로 완전히 같은 경우를 의미한다.Here, the similarity value has a value ranging from -1 to 1, where -1 means completely opposite to each other, 0 means to be independent of each other, and 1 means to be completely equal to each other.

키워드 설정부(530)는 사용자의 입력 정보에 따라 자연재난 키워드부(510) 및 사회재난 키워드부(520)의 키워드 관련 정보를 다양하게 설정 및 변경할 수 있도록 한다.The keyword setting unit 530 enables the keyword-related information of the natural disaster keyword unit 510 and the social disaster keyword unit 520 to be set and changed in various ways according to user input information.

이와 같이 본 발명에 따른 키워드 저장관리부(500)는 자연재난 키워드부(510) 및 사회재난 키워드부(520)를 별도로 구성하여 수집된 재난관련 뉴스정보에 대한 재난 세부유형을 더욱 정확하게 판별할 수 있도록 데이터를 구축한 것을 특징으로 한다.As such, the keyword storage management unit 500 according to the present invention separately configures the natural disaster keyword unit 510 and the social disaster keyword unit 520 to more accurately determine the detailed disaster type for the collected disaster-related news information. It is characterized by data construction.

한편, 자연재난 관련 뉴스의 경우 이러한 자연재난 키워드부(510)의 재난현상 관련 키워드 정보를 통해 비교적 간단하게 판별할 수 있다.On the other hand, in the case of news related to natural disasters, it can be determined relatively simply through keyword information related to disaster phenomena in the natural disaster keyword unit 510.

이는 재난 세부유형의 명칭(태풍, 홍수 등)이 자연재난 현상자체를 표현하기 때문에, 해당 명칭이 뉴스 내용 중에 나타나는지를 기준으로 판별할 수 있다. Since the name of the detailed disaster type (typhoon, flood, etc.) expresses the natural disaster phenomenon itself, it can be determined based on whether the corresponding name appears in the news content.

예를 들어 “지진”이라는 키워드가 뉴스 제목에 포함되어 있다면 해당 뉴스는 지진 관련 뉴스라 판별할 수 있다.For example, if the keyword “earthquake” is included in a news title, the corresponding news can be identified as an earthquake-related news.

그러나 이 방법에도 한계가 존재하는데, 바로 같은 키워드가 다른 의미 혹은 은유적으로 쓰일 경우이다. 예를 들면, “정보의 홍수”, “축구 경기 골 가뭄”, “감동의 쓰나미” 등이 있다. However, there is a limit to this method as well, when the same keyword is used in different meanings or metaphorically. Examples include “Information Flood,” “Soccer Goal Drought,” and “Tsunami of Inspiration.”

따라서 도 4에서와 같이 본 발명에서는 자연재난 관련 뉴스의 재난 세부유형을 더 정확히 판별하기 위해서 키워드를 기반으로 많은 뉴스를 분류한 뒤 이를 딥러닝과 같은 기계학습 기법을 활용하여 컴퓨터에게 분류된 뉴스들을 의미기반으로 학습시켜 제한된 키워드 규칙을 넘어 뉴스 내용의 의미를 기반으로 분류할 수 있다.Therefore, as shown in FIG. 4, in the present invention, after classifying many news based on keywords in order to more accurately determine the disaster details of news related to natural disasters, the classified news is sent to a computer by using machine learning techniques such as deep learning. By learning based on semantics, it is possible to classify based on the meaning of news content beyond the limited keyword rules.

반면, 사회재난 관련 뉴스정보의 경우, 재난 세부유형 명칭만으로는 재난 현상이 표현되지 않는 경우가 대부분이다. On the other hand, in the case of news information related to social disasters, in most cases, the disaster phenomenon is not expressed only by the name of the detailed disaster type.

예를 들어 “붕괴” 재난의 경우, “상가 붕괴”, “백화점 붕괴” 등으로 표현되며, “원소 붕괴”와 같이 “붕괴”라는 키워드가 들어가도 그 대상이 시설물 등이 아닌 경우 사회재난 관련 뉴스정보에 해당되지 않는다. For example, in the case of a “collapse” disaster, it is expressed as “shopping mall collapse”, “department store collapse”, etc. Even if the keyword “collapse” is entered, such as “element collapse”, if the target is not a facility, news information related to social disasters does not apply to

즉, 사회재난 관련 뉴스정보는 재난현상을 나타내는 키워드와 재난의 피해 대상 혹은 원인 물질 지칭하는 키워드를 조합해야 찾을 수 있다. That is, news information related to social disasters can be found only when a keyword representing a disaster phenomenon is combined with a keyword indicating a target or causative agent of a disaster.

이는 재난현상을 표현하는 키워드의 개수는 제한되어 있으나(붕괴 재난의 경우, “붕괴” “무너졌다” 등), 재난의 피해 대상을 표현하는 키워드로는 거의 무제한적으로 다양한 단어들이 올 수 있기 때문이다.This is because the number of keywords expressing disaster phenomena is limited (in the case of a collapse disaster, “collapse”, “collapsed”, etc.), but a variety of words can be used as keywords expressing the target of disaster damage. am.

예를 들면, "붕괴" 재난의 경우, 붕괴 대상 키워드가 “백화점”, “대교”, “상가”, “아파트”, “고시원”, “학교” 등 매우 다양한 단어가 될 수 있다.For example, in the case of a "collapse" disaster, the keywords for collapse can be a wide variety of words, such as "department store", "daegyo", "shopping mall", "apartment", "gosiwon", and "school".

다시 말해서, 사회재난의 경우 미리 설정한 제한된 키워드 규칙으로는 관련 뉴스를 포괄적으로 찾아내기에 한계가 있다.In other words, in the case of social disasters, there is a limit to finding related news comprehensively with the limited keyword rules set in advance.

이에 도 5 및 도 6에서와 같이 본 발명에서는 사회재난 키워드부(520)를 재난현상 키워드부(521)와 피해대상/원인물질 키워드부(522)로 구성하여, 상기 재난유형 판별부(300)에서 사회재난 뉴스 판별부(320)를 통해 해당 뉴스의 사회재난 세부유형을 판별할 때, 뉴스 제목 내용에 재난현상 키워드부(521)에 저장된 키워드 및 피해대상/원인물질 키워드부(522)에 저장된 키워드에 각각 일치하는 키워드가 모두 존재하는 경우에만 해당 사회재난 유형의 뉴스정보로 판별할 수 있도록 구성하였다.Accordingly, as shown in FIGS. 5 and 6, in the present invention, the social disaster keyword unit 520 is composed of a disaster phenomenon keyword unit 521 and a damage target/causative material keyword unit 522, and the disaster type determination unit 300 When determining the detailed type of social disaster of the news through the social disaster news determination unit 320, the keywords stored in the disaster phenomenon keyword unit 521 and the damage target / causative substance keyword unit 522 in the contents of the news title It is structured so that it can be determined as news information of the corresponding social disaster type only when all keywords that match each keyword exist.

한편, 경험적으로 작성된 세부유형별 피해대상/원인물질 관련 키워드 목록은 제한성을 전혀 배제할 수 없는 점을 보완하기 위해 워드투벡터 기술을 이용하여 단어 사전을 작성하였다. On the other hand, a word dictionary was prepared using word-to-vector technology to compensate for the fact that the list of keywords related to the subject of damage/causative substance by detailed type prepared empirically cannot be excluded at all.

워드투벡터란 수많은 말뭉치 자료를 컴퓨터에게 학습시켜 특정 단어(문자)를 단어의 어미를 기반으로 벡터화(숫자화)시키는 것이다. Word-to-vector is to vectorize (number) specific words (characters) based on the endings of words by learning numerous corpus data to the computer.

이렇게 단어가 그 의미를 기반으로 수치화되면 서로 다른 두 단어 사이의 의미적 유사도를 측정할 수 있으며, 따라서 유사한 의미의 키워드를 추가적으로 발굴하는데 활용할 수 있다. If words are quantified based on their meanings, it is possible to measure the semantic similarity between two different words, and thus, it can be used to additionally discover keywords with similar meanings.

한편, 본 발명에서는 수년간 축적된 뉴스 전체를 활용하여 약 40만여개 단어들에 대한 벡터값을 산출함으로써 벡터화된 단어 사전을 만들었으며, 이 사전을 활용하여 경험적으로 작성한 사회재난 세부유형별 피해대상/원인물질 키워드와 유사한 의미를 가지는 새로운 키워드들을 추가적으로 발굴하였다.On the other hand, in the present invention, a vectorized word dictionary was created by calculating vector values for about 400,000 words by utilizing all the news accumulated over several years, and using this dictionary, damage targets/causative substances for each detailed type of social disasters were empirically created. New keywords with similar meanings to the keywords were additionally discovered.

그럼에도 불구하고 현시점에서 작성된 키워드 목록에서 고려되지 못한 새로운 키워드(예를 들어 새로운 신종 감염병 등)은 언제든지 출현할 수 있으므로, 자연재난 세부유형 판별 방법과 같이 사회재난 세부유형별로 분류된 뉴스들을 딥러닝과 같은 기계학습 방법으로 컴퓨터에게 학습시켜 제한된 키워드 규칙을 넘어 뉴스 내용의 의미를 기반으로 분류할 수 있다.Nevertheless, since new keywords (for example, new infectious diseases, etc.) that were not considered in the keyword list prepared at the present time may appear at any time, news classified by sub-type of social disaster, such as the method of identifying detailed types of natural disasters, can be analyzed with deep learning. With the same machine learning method, it is possible to classify based on the meaning of news content beyond the limited keyword rules by learning it on a computer.

정보 저장부(600)는 정보 입력부(100)를 통한 사용자의 재난관련 입력정보, 재난뉴스 수집부(200)의 재난관련 뉴스정보, 재난유형 판별부(300)의 재난 세부유형별 재난관련 뉴스정보, 재난뉴스 비율 산출부(400)의 재난 세부유형별 재난뉴스 비율 정보를 포함하여 각종 재난관련정보를 저장할 수 있다.The information storage unit 600 includes disaster-related input information from the user through the information input unit 100, disaster-related news information from the disaster news collection unit 200, disaster-related news information by detailed disaster type from the disaster type determination unit 300, Various kinds of disaster-related information including disaster news rate information for each detailed disaster type of the disaster news rate calculation unit 400 may be stored.

정보 제공부(700)는 사용자의 입력정보에 따른 각종 재난관련 정보를 제공할 수 있다.The information provider 700 may provide various types of disaster-related information according to user input information.

즉, 정보 제공부(700)는 사용자의 입력정보에 따른 재난 세부유형별 재난뉴스 비율 정보를 디스플레이 화면을 통해 사용자에게 제공할 수 있으며, 사용자의 입력정보에 따라 키워드 저장관리부(500) 및 정보 저장부(600)에 저장된 각종 재난관련 정보들을 제공할 수 있음은 물론이다.That is, the information providing unit 700 may provide the user with disaster news ratio information for each detailed disaster type according to the user's input information through the display screen, and the keyword storage management unit 500 and the information storage unit according to the user's input information Of course, various disaster-related information stored in 600 can be provided.

또한, 정보 제공부(700)는 시각화 프로그램을 구비할 수 있으며, 재난 세부유형별 재난뉴스 비율 정보를 이용한 다양한 그래프 및 이미지 정보를 제공할 수도 있다.In addition, the information providing unit 700 may have a visualization program and may provide various graphs and image information using disaster news rate information for each detailed disaster type.

제어부(800)는 정보 입력부(100), 재난뉴스 수집부(200), 재난유형 판별부(300), 재난뉴스 비율 산출부(400), 키워드 저장관리부(500), 정보 저장부(600) 및 정보 제공부(700)와 각각 연결되어 각각의 입출력 신호를 제어하는 역할을 수행한다.The control unit 800 includes an information input unit 100, a disaster news collection unit 200, a disaster type determination unit 300, a disaster news ratio calculation unit 400, a keyword storage management unit 500, an information storage unit 600, and It is connected to the information providing unit 700 and serves to control each input/output signal.

이때, 제어부(800)는 정보 입력부(100)를 통해 사용자로부터 재난뉴스 수집기간 정보가 입력되면, 재난뉴스 수집부(200)를 통해 재난뉴스 수집기간 동안의 재난관련 뉴스정보를 수집하며, 재난유형 판별부(300)를 통해 키워드 저장관리부(500)의 키워드 정보를 추출하여 수집된 재난관련 뉴스정보의 재난 세부유형정보를 판별하며, 재난뉴스 비율 산출부(400)를 통해 각 재난 세부유형별 재난뉴스 비율을 산출하여 정보 저장부(600)에 저장시키고 정보 제공부(700)를 통해 사용자에게 제공할 수 있다.At this time, when disaster news collection period information is input from the user through the information input unit 100, the control unit 800 collects disaster-related news information during the disaster news collection period through the disaster news collection unit 200, and disaster type The keyword information of the keyword storage management unit 500 is extracted through the determination unit 300 to determine the detailed disaster type information of the collected disaster-related news information, and the disaster news ratio calculation unit 400 determines the disaster news for each detailed disaster type. The ratio may be calculated and stored in the information storage unit 600 and provided to the user through the information providing unit 700 .

상술한 바와 같이, 본 발명에 따른 재난뉴스 건수의 정량적 측정시스템(10)은 일정 기간 동안 수집된 재난 뉴스 정보들을 기설정된 자연재난 및 사회재난에 대한 각각의 기계학습 기반의 재난유형 판별 모델을 이용하여 해당 뉴스정보가 자연재난 유형인지 또는 사회재난 유형인지를 정확하게 판별할 수 있는 특징이 있다.As described above, the quantitative measurement system 10 of the number of disaster news cases according to the present invention uses the disaster news information collected for a certain period of time using a machine learning-based disaster type discrimination model for each preset natural disaster and social disaster. Therefore, it is possible to accurately determine whether the corresponding news information is a natural disaster type or a social disaster type.

이하에서는 본 발명에 따른 재난뉴스 건수의 정량적 측정하는 방법에 대해 설명하기로 한다.Hereinafter, a method for quantitatively measuring the number of disaster news cases according to the present invention will be described.

도 7 및 도 8을 참조하면, 본 발명에 따른 재난뉴스 건수의 정량적 측정방법은 먼저 정보 입력부를 통해 사용자의 재난뉴스 수집 설정정보를 입력(S110)받는다.Referring to FIGS. 7 and 8 , the method for quantitatively measuring the number of disaster news cases according to the present invention first receives user's disaster news collection setting information through an information input unit (S110).

이때, 재난뉴스 수집 설정정보는 수년 내지 수십년의 장기간 수집기간으로 설정될 수 있으며, 이러한 수집 기간은 사용자의 설정에 따라 다양하게 변경 가능하다.At this time, the disaster news collection setting information may be set to a long-term collection period of several years to tens of years, and this collection period may be variously changed according to the user's setting.

이후, 재난뉴스 수집부를 통해 온라인 상의 언론사 데이터베이스에 접속하여 사용자의 재난뉴스 수집 설정정보에 따라 일정기간 동안의 재난관련 뉴스정보를 수집(S120)한다.Thereafter, through the disaster news collection unit, access is made to an online media database, and disaster-related news information for a certain period of time is collected according to the user's disaster news collection setting information (S120).

이후, 재난유형 판별부를 통해 키워드 저장관리부에 설정된 키워드 정보에 기초하여, 수집된 재난관련 뉴스정보를 기설정된 기계학습 기반의 자연재난 판별 모델 및 사회재난 판별 모델을 통해 각 재난관련 뉴스정보의 재난 세부유형정보를 판별(S130)한다.Afterwards, based on the keyword information set in the keyword storage management unit through the disaster type determination unit, the collected disaster-related news information is analyzed in disaster details of each disaster-related news information through a preset machine learning-based natural disaster discrimination model and social disaster discrimination model. The type information is determined (S130).

여기서, 자연재난 판별 모델은 재난관련 뉴스정보의 내용에서 키워드 저장관리부에 기설정된 자연재난 세부유형별 재난현상 키워드 정보를 검색하여 일치하는 키워드가 존재하는지를 확인(S131)한다.Here, the natural disaster discrimination model searches disaster phenomenon keyword information for each detailed type of natural disaster preset in the keyword storage management unit in the content of disaster-related news information, and checks whether a matching keyword exists (S131).

이때, 일치하는 키워드가 존재하는 경우, 재난관련 뉴스정보의 세부유형정보를 해당 키워드가 속하는 자연재난 세부유형 정보로 판별(S132)하고, 일치하는 키워드가 존재하지 않으면 일반 뉴스로 판별(S136)한다.At this time, if there is a matching keyword, the detailed type information of the disaster-related news information is determined as the natural disaster detailed type information to which the corresponding keyword belongs (S132), and if there is no matching keyword, it is determined as general news (S136). .

또한, 사회재난 판별 모델 역시 재난관련 뉴스정보의 내용에서 키워드 저장관리부에 기설정된 사회재난 세부유형별 재난현상 키워드 정보를 검색하여 일치하는 키워드가 존재하는지를 확인(S133)한다.In addition, the social disaster discrimination model also searches disaster phenomenon keyword information for each social disaster detailed type preset in the keyword storage management unit in the contents of disaster-related news information, and checks whether a matching keyword exists (S133).

이때, 일치하는 키워드가 존재하지 않으면 일반 뉴스로 판별(S136)하며, 일치하는 키워드가 존재하면 재난관련 뉴스정보의 내용에서 키워드 저장관리부에 기설정된 사회재난 세부유형별 피해대상/원인물질 키워드 정보를 검색하여 일치하는 키워드가 존재하는지를 확인(S134)한다.At this time, if there is no matching keyword, it is determined as general news (S136), and if there is a matching keyword, search for damage target/causative substance keyword information for each detailed type of social disaster set in the keyword storage management unit from the content of disaster-related news information. to check whether a matching keyword exists (S134).

여기서 일치하는 키워드가 존재하는 경우 재난관련 뉴스정보의 세부유형정보를 해당 키워드가 속하는 사회재난 세부유형정보로 판별(S135)하고, 일치하는 키워드가 존재하지 않는 경우 재난관련 뉴스정보를 일반 뉴스로 판별(S136)한다.Here, if there is a matching keyword, the detailed type information of the disaster-related news information is determined as the social disaster detailed type information to which the keyword belongs (S135), and if there is no matching keyword, the disaster-related news information is determined as general news. (S136).

한편, 재난유형 판별부는 키워드 저장관리부에 저장된 자연재난 키워드부 및 사회재난 키워드부의 키워드 정보를 기반으로 재난 세부유형정보를 판별하는바, 이때 키워드 저장관리부의 자연재난 키워드부 및 사회재난 키워드부에 대한 구성은 앞에서 설명한 본 발명에 따른 재난뉴스 건수의 정량적 측정시스템의 키워드 저장관리부와 그 구성이 동일하다.On the other hand, the disaster type determination unit determines disaster detailed type information based on the keyword information of the natural disaster keyword unit and the social disaster keyword unit stored in the keyword storage management unit. The configuration is the same as the keyword storage management unit of the quantitative measurement system for the number of disaster news cases according to the present invention described above.

따라서 본 실시예에서는 키워드 저장관리부의 자연재난 키워드부 및 사회재난 키워드부의 구성에 대한 상세한 설명을 생략하기로 한다.Therefore, in this embodiment, a detailed description of the configuration of the natural disaster keyword unit and the social disaster keyword unit of the keyword storage management unit will be omitted.

이렇게 재난유형 판별부를 통해 각 재난관련 뉴스정보의 재난 세부유형정보가 판별되면, 판별된 자연재난 뉴스정보, 사회재난 뉴스정보 및 일반 뉴스 정보는 정보 저장부에 저장(S137)된다.In this way, when the detailed disaster type information of each disaster-related news information is determined through the disaster type determination unit, the determined natural disaster news information, social disaster news information, and general news information are stored in the information storage unit (S137).

이후, 재난뉴스 비율 산출부를 통해 재난 세부유형별 재난관련 뉴스정보들을 기설정된 산출 프로그램을 통해 각 재난 세부유형별 재난뉴스의 비율을 산출(S140)할 수 있다.Thereafter, through the disaster news ratio calculation unit, the disaster news information for each detailed disaster type may be calculated through a predetermined calculation program to calculate the disaster news ratio for each detailed disaster type (S140).

여기서 산출 프로그램 역시 앞에서의 도 1 및 수학식 1을 통해 설명한 본 발명에 따른 재난뉴스 비율 산출부의 산출 프로그램과 동일하므로 이에 대한 구체적인 설명은 생략하기로 한다.Here, the calculation program is also the same as the calculation program of the disaster news rate calculation unit according to the present invention described above with reference to FIG. 1 and Equation 1, so a detailed description thereof will be omitted.

이후, 이러한 과정을 통해 각 재난 세부유형별 재난뉴스 비율이 산출되면, 정보 제공부를 통해 각 재난 세부유형별 재난뉴스 비율 정보를 사용자에게 제공(S150)할 수 있다.Then, when the disaster news rate for each detailed disaster type is calculated through this process, the disaster news rate information for each detailed disaster type can be provided to the user through the information providing unit (S150).

이때, 정보 제공부는 시각화 프로그램을 통해 재난 세부유형별 재난뉴스 비율 정보를 다양한 그래프 및 이미지를 통해 시각화하여 제공할 수 있다.At this time, the information providing unit may visualize and provide disaster news ratio information for each detailed disaster type through various graphs and images through a visualization program.

이를 통해 사용자에게 재난 세부유형별 재난뉴스 비율 정보를 한 눈에 쉽게 파악할 수 있도록 제공할 수 있다.Through this, it is possible to provide users with disaster news ratio information for each detailed disaster type so that they can easily grasp at a glance.

일 예로 도 9를 참조하면, 본 실시예에서는 2011년 3월 1일부터 2022년 2월 28일까지(n=4018일) 30종 언론사(국민일보, 내일신문, 서울신문, 세계일보, 한국일보, 한겨레, KBS, MBC, SBS, YTN, 서울경제, 한국경제, 머니투데이, 전자신문, 환경일보, 인천일보, 대전일보, 매일신문, 부산일보, 광주일보, 울산매일, 경기일보, 강원일보, 충북일보, 충청투데이, 전북도민일보, 전남일보, 경북일보, 경남도민일보, 한라일보)에서 생산된 뉴스 총 18,921,603건을 사용하여 재난뉴스 비율을 산출하였다. 해당 기간의 재난뉴스 비율은 2.9%로 산출되었다. 즉 과거 약 10여년 간 우리가 접하는 뉴스 100건 중 약 3건은 재난에 대한 뉴스라는 것을 알 수 있다. As an example, referring to FIG. 9, in this embodiment, from March 1, 2011 to February 28, 2022 (n = 4018 days) 30 media outlets (Kookmin Daily, Naeil Shinmun, Seoul Newspaper, Segye Daily, Hankook Daily) , The Hankyoreh, KBS, MBC, SBS, YTN, Seoul Economic Daily, Korea Economic Daily, Money Today, Electronic Newspaper, Environment Daily, Incheon Daily, Daejeon Daily, Maeil Newspaper, Busan Daily, Gwangju Daily, Ulsan Daily, Gyeonggi Daily, Gangwon Daily, The ratio of disaster news was calculated using a total of 18,921,603 news produced in Chungbuk Ilbo, Chungcheong Today, Jeonbuk Domin Ilbo, Jeonnam Ilbo, Gyeongbuk Ilbo, Gyeongnam Domin Ilbo, and Halla Ilbo). The disaster news rate for the period was calculated as 2.9%. In other words, it can be seen that about 3 out of 100 news stories we have encountered over the past 10 years are news about disasters.

또 다른 예로 도 10을 참조하면, 재난뉴스 비율을 연도별로 산출해본 결과, 2011년~2013년 동안에 재난뉴스 비율은 약 1.6% 수준이였지만, 2014년 세월호 참사가 발생하면서 지수가 2.3%까지 급증하였고, 그 이후 2016년과 2018년 폭염, 2016년 경지지진, 2017년 포항지진, 2019년 미세먼지 등 재난이 계속 이어지면서 재난뉴스 비율은 점진적으로 약 3%까지 증가하였으며, 이후 2020년 코로나19 재난 사태로 인해 최근 2022년까지 재난뉴스 비율은 4~6%까지 급증하였음을 쉽게 확인할 수 있다.As another example, referring to Figure 10, as a result of calculating the disaster news rate by year, the disaster news rate was about 1.6% between 2011 and 2013, but as the Sewol ferry disaster occurred in 2014, the index soared to 2.3% Since then, as disasters such as heatwaves in 2016 and 2018, earthquakes in 2016, earthquakes in Pohang in 2017, and fine dust in 2019 continued, the rate of disaster news gradually increased to about 3%. It is easy to see that the disaster news rate has recently surged to 4-6% by 2022 due to the situation.

한편, 본 발명에 따른 재난 세부유형별 재난뉴스 비율 정보를 활용하여 새로운 정보를 도출하여 사용자에게 제공할 수도 있다.Meanwhile, new information may be derived and provided to the user by utilizing the disaster news rate information for each detailed disaster type according to the present invention.

도 11을 참조하면, 본 발명에서는 재난뉴스 비율을 그간 연도별 정부의 재난관련 예산과 비교하였다. 2018년부터 2021년 연평균 정부 총 예산은 약 492조원이며, 이 중 재난과 직접적으로 관련 있는 예산은 약 14조로 2.8%를 차지한다. Referring to FIG. 11, in the present invention, the disaster news rate was compared with the government's disaster-related budget for each year. The total annual average government budget from 2018 to 2021 is about 492 trillion won, of which the budget directly related to disasters is about 14 trillion won, accounting for 2.8%.

이는 앞서 2011년~2022년 뉴스 빅데이터로 산출한 재난뉴스 비율 2.9%와 상당히 유사한 규모이다. 즉 우리나라는 재난에 대한 재난뉴스 비율의 정도와 유사한 수준의 예산을 투입하고 있음을 수치적으로 확인할 수 있다. This is quite similar to the disaster news rate of 2.9% calculated with news big data from 2011 to 2022. In other words, it can be confirmed numerically that Korea is investing a budget similar to the ratio of disaster news to disasters.

재난뉴스 비율을 세부 재난유형별로 산출하여 해당 유형에 대한 정부 예산과 비교하면 좀 더 구체적인 정보를 얻을 수 있다. More specific information can be obtained by calculating the disaster news rate for each specific disaster type and comparing it with the government budget for that type.

세부 재난유형별 정부예산 비율을 x축에, 세부 재난유형별로 산출된 재난뉴스 비율을 y축에 표현한 산점도를 제시해본 결과, 대부분의 세부 재난유형들의 산점도가 재난뉴스 비율과 예산의 정비례선(회석 점선)과 가까이 있음이 확인된다. As a result of presenting a scatter plot in which the government budget ratio by detailed disaster type is expressed on the x-axis and the disaster news ratio calculated by detailed disaster type is expressed on the y-axis, the scatter plot of most detailed disaster types shows a direct proportional line between disaster news ratio and budget (dotted line ) is confirmed to be close to

하지만, 대설 한파, 폭염, 화재 폭발, 감염병 재난의 경우 사회적 관심을 대변하는 재난뉴스 비율에 비해 정부 예산 투입이 적음을 확인할 수 있다. However, it can be confirmed that the government budget is less than the ratio of disaster news that represents social interest in the case of severe snow, cold wave, heat wave, fire explosion, and infectious disease disaster.

이처럼 본 발명에서와 같이 재난 세부유형별 재난뉴스 비율을 산출함으로써 재난에 대한 사회적 관심을 알 수 있으며 각종 국가 재난관리 정책 수립에 있어 우리사회가 재난에 대해 얼마나 관심을 가지고 있는지를 파악하는 것은 매우 중요한 일임은 분명하다.In this way, as in the present invention, by calculating the disaster news rate for each detailed disaster type, social interest in disasters can be known, and it is very important to understand how much our society is interested in disasters in establishing various national disaster management policies. is clear.

재난에 대한 재난뉴스 비율을 산출함에 있어서, 재난관련 뉴스정보를 대상으로 재난 세부유형을 명확하게 판별해내는 것이 재난뉴스 비율의 정확성을 높일 수 있는 길일 것이다.In calculating the ratio of disaster news to disasters, clearly discriminating the detailed types of disasters from disaster-related news information will be the way to increase the accuracy of the ratio of disaster news.

본 발명에 따른 재난뉴스 건수의 정량적 측정 시스템 및 방법은 장기간 동안 수집된 재난 뉴스 정보들을 기설정된 자연재난 및 사회재난에 대한 각각의 기계학습 기반의 재난유형 판별 모델을 이용하여 해당 뉴스정보가 자연재난 유형인지 또는 사회재난 유형인지를 정확하게 판별할 수 있는 장점이 있다.The system and method for quantitatively measuring the number of disaster news cases according to the present invention use the disaster news information collected for a long period of time to predict whether the news information is a natural disaster by using a machine learning-based disaster type discrimination model for each preset natural disaster and social disaster. It has the advantage of being able to accurately determine whether it is a disaster type or a social disaster type.

또한, 사회재난 뉴스정보를 판별하는 경우 뉴스 제목 내에 기설정된 사회재난 세부유형별 재난현상 관련 키워드가 포함되어 있는 동시에 기설정된 해당 세부유형의 피해대상/원인물질 키워드가 포함되어 있는 경우 해당되는 사회재난 관련 뉴스로 분류함으로써 재난뉴스의 세부유형 정보를 더욱 정확하게 판단할 수 있는 효과가 있다.In addition, when determining social disaster news information, if keywords related to disaster phenomena for each detailed type of social disaster are included in the news title, and at the same time, the subject of damage/causative substance of the preset specific type is included, the relevant social disaster-related keywords are included. By classifying it as news, there is an effect of more accurately determining the detailed type information of disaster news.

더불어, 기설정된 세부유형별 재난현상 관련 키워드와 워드투벡터 기술로 설정된 단어 사전간 유사도를 계산하여 유사도가 높은 단어를 새로운 키워드 단어로 선정하여 재난 세부유형의 피해대상/원인물질 키워드 정보를 지속적으로 업데이트해줌으로써 재난유형의 판별력을 높일 수 있는 효과도 있다.In addition, by calculating the similarity between keywords related to disaster phenomena for each preset detailed type and the word dictionary set by word-to-vector technology, words with high similarity are selected as new keyword words to continuously update the keyword information on the subject of disaster / causative substance of the detailed type of disaster. It also has the effect of increasing the ability to discriminate the type of disaster by doing so.

상기한 본 발명의 바람직한 실시예는 예시의 목적을 위해 개시된 것이고, 본 발명에 대해 통상의 지식을 가진 당업자라면 본 발명의 사상과 범위 안에서 다양한 수정, 변경, 부가가 가능할 것이며, 이러한 수정, 변경 및 부가는 하기의 특허청구범위에 속하는 것으로 보아야 할 것이다.Preferred embodiments of the present invention described above have been disclosed for illustrative purposes, and those skilled in the art with ordinary knowledge of the present invention will be able to make various modifications, changes, and additions within the spirit and scope of the present invention, and these modifications, changes, and The additions should be viewed as falling within the scope of the following claims.

10 : 재난뉴스 건수의 정량적 측정 시스템
100 : 정보 입력부
200 : 재난뉴스 수집부
300 : 재난유형 판별부
310 : 자연재난 뉴스 판별부
320 : 사회재난 뉴스 판별부
400 : 재난뉴스 비율 산출부
500 : 키워드 저장관리부
510 : 자연재난 키워드부
520 : 사회재난 키워드부
521 : 재난현상 키워드부
522 : 피해대상/원인물질 키워드부
522a : 키워드 목록부
522b : 단어 사전부
522c : 키워드 업데이트부
530 : 키워드 설정부
600 : 정보 저장부
700 : 정보 제공부
800 : 제어부
10: Quantitative measurement system for the number of disaster news cases
100: information input unit
200: Disaster News Collection Department
300: Disaster Type Determination Unit
310: Natural Disaster News Discrimination Department
320: Social Disaster News Discrimination Department
400: Disaster News Ratio Calculation Unit
500: Keyword storage management unit
510: natural disaster keyword department
520: social disaster keyword department
521: disaster phenomenon keyword section
522: damage target / causative substance keyword section
522a: keyword list unit
522b: word dictionary unit
522c: keyword update unit
530: keyword setting unit
600: information storage unit
700: information provision unit
800: control unit

Claims (23)

사용자의 재난관련 입력정보를 입력받는 정보 입력부;
온라인 상의 언론사 데이터베이스에 접속하여 일정기간 동안의 재난관련 뉴스정보를 수집하는 재난뉴스 수집부;
수집된 재난관련 뉴스정보를 기설정된 기계학습 기반의 자연재난 판별 모델 및 사회재난 판별 모델을 통해 각 재난관련 뉴스정보의 재난 세부유형정보를 판별하는 재난유형 판별부;
재난 세부유형별 재난관련 뉴스정보들을 기설정된 산출 프로그램을 통해 각 재난 세부유형별 재난뉴스의 비율을 산출하는 재난뉴스 비율 산출부;
재난 세부유형별 키워드 관련 정보를 저장하며, 기설정된 키워드 생성 프로그램을 통해 새로운 키워드를 생성 및 저장하는 키워드 저장관리부;
사용자의 재난관련 입력정보, 재난뉴스 수집부의 재난관련 뉴스정보, 재난유형 판별부의 재난 세부유형별 재난관련 뉴스정보, 재난뉴스 비율 산출부의 재난 세부유형별 재난뉴스 비율 정보를 포함하여 각종 재난관련정보를 저장하는 정보 저장부;
사용자의 입력정보에 따른 각종 재난관련 정보를 제공하는 정보 제공부; 및
상기 정보 입력부, 재난뉴스 수집부, 재난유형 판별부, 재난뉴스 비율 산출부, 키워드 저장관리부, 정보 저장부 및 정보 제공부와 각각 연결되어 입출력 신호를 제어하는 제어부;를 포함하며,
상기 재난유형 판별부는,
수집된 재난관련 뉴스정보를 기설정된 기계학습 기반의 자연재난 판별 모델을 통해 해당 뉴스정보의 자연재난 세부유형정보를 판별하는 자연재난 뉴스 판별부; 및
수집된 재난관련 뉴스정보를 기설정된 기계학습 기반의 사회재난 판별 모델을 통해 해당 뉴스정보의 사회재난 세부유형정보를 판별하는 사회재난 뉴스 판별부;를 포함하며,
상기 키워드 저장관리부는,
자연재난 세부유형별 키워드 정보가 설정되어 저장되는 자연재난 키워드부;
사회재난 세부유형별 키워드 정보가 설정되어 저장되는 사회재난 키워드부; 및
사용자의 입력 정보에 따라 자연재난 키워드부 및 사회재난 키워드부의 키워드 관련 정보를 설정하는 키워드 설정부;를 포함하며,
상기 사회재난 키워드부는,
사회재난 세부유형별로 재난현상 관련 키워드 정보가 설정되어 저장되는 재난현상 키워드부; 및
사회재난 세부유형별로 피해대상/원인물질 키워드 정보가 설정되어 저장되는 피해대상/원인물질 키워드부;를 포함하며,
상기 사회재난 판별 모델은 재난관련 뉴스정보의 내용에서 키워드 저장관리부에 기설정된 사회재난 세부유형별 재난현상 키워드 정보를 검색하여 일치하는 키워드가 존재하는 동시에, 키워드 저장관리부에 기설정된 사회재난 세부유형별 피해대상/원인물질 키워드 정보를 검색하여 일치하는 키워드가 존재하는 경우, 해당 재난관련 뉴스정보의 세부유형정보를 해당 키워드가 속하는 자연재난 세부유형정보로 판별하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 시스템.
an information input unit that receives user's disaster-related input information;
A disaster news collection unit that accesses an online media database and collects disaster-related news information for a certain period of time;
a disaster type determination unit for determining detailed disaster type information of each disaster-related news information through a preset machine learning-based natural disaster determination model and a social disaster determination model for the collected disaster-related news information;
a disaster news ratio calculating unit that calculates a ratio of disaster news for each detailed disaster type through a predetermined calculation program for disaster-related news information for each detailed disaster type;
A keyword storage management unit that stores keyword-related information for each detailed disaster type and generates and stores new keywords through a preset keyword generation program;
Stores various disaster-related information, including disaster-related input information from users, disaster-related news information from the disaster news collection unit, disaster-related news information by detailed disaster type from the disaster type determination unit, and disaster news rate information from the disaster news rate calculation unit for each detailed disaster type information storage unit;
an information providing unit that provides various types of disaster-related information according to user input information; and
A control unit connected to the information input unit, disaster news collection unit, disaster type determination unit, disaster news rate calculation unit, keyword storage management unit, information storage unit, and information providing unit to control input and output signals,
The disaster type determination unit,
a natural disaster news discriminating unit that discriminates natural disaster detailed type information of the collected disaster-related news information through a predetermined machine learning-based natural disaster discriminating model; and
A social disaster news discrimination unit that determines the detailed social disaster type information of the news information through a preset machine learning-based social disaster discrimination model for the collected disaster-related news information;
The keyword storage management unit,
a natural disaster keyword unit in which keyword information for each type of natural disaster is set and stored;
a social disaster keyword unit in which keyword information for each type of social disaster is set and stored; and
A keyword setting unit for setting keyword-related information of a natural disaster keyword unit and a social disaster keyword unit according to user input information; includes;
The social disaster keyword section,
a disaster phenomenon keyword unit in which keyword information related to disaster phenomena is set and stored for each type of social disaster; and
A damage target/causative substance keyword unit in which keyword information for each type of social disaster is set and stored;
The social disaster discrimination model searches disaster phenomenon keyword information for each detailed social disaster type preset in the keyword storage and management unit in the contents of disaster-related news information, and at the same time, a matching keyword exists, and at the same time, the target of damage for each social disaster detailed type preset in the keyword storage management unit / A quantitative measurement system for the number of disaster news cases, characterized by determining the detailed type information of the disaster-related news information as the detailed type information of natural disasters to which the keyword belongs, if a matching keyword exists after searching for the keyword information of the causative substance.
삭제delete 제 1항에 있어서,
상기 자연재난 판별 모델은 재난관련 뉴스정보의 내용에서 키워드 저장관리부에 기설정된 자연재난 세부유형별 재난현상 키워드 정보를 검색하여 일치하는 키워드가 있는 경우, 재난관련 뉴스정보의 세부유형정보를 해당 키워드가 속하는 자연재난 세부유형정보로 판별하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 시스템.
According to claim 1,
The natural disaster discrimination model searches disaster phenomenon keyword information for each detailed type of natural disaster preset in the keyword storage management unit in the content of disaster-related news information, and if there is a matching keyword, the detailed type information of disaster-related news information to which the keyword belongs A quantitative measurement system for the number of disaster news cases, characterized in that it is determined by the detailed type information of natural disasters.
삭제delete 제 1항에 있어서,
상기 재난뉴스 비율 산출부는 아래의 [수학식 1]을 통해 재난 세부유형별 재난뉴스의 비율을 산출하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 시스템.
[수학식 1]
Figure 112022073975717-pat00006

여기서,
재난관련 뉴스 건수 = 자연재난 관련 뉴스 건수 + 사회재난 관련 뉴스 건수
According to claim 1,
The disaster news ratio calculation unit calculates the ratio of disaster news for each detailed disaster type through [Equation 1] below.
[Equation 1]
Figure 112022073975717-pat00006

here,
Number of news related to disasters = Number of news related to natural disasters + Number of news related to social disasters
삭제delete 제 1항에 있어서,
상기 자연재난 키워드부는,
자연재난 세부유형별로 재난현상 관련 키워드 정보가 설정되어 저장되며, 상기 자연재난 세부유형 정보는 태풍, 홍수, 강풍, 풍랑, 해일, 대설, 한파, 낙뢰, 가뭄, 폭염, 지진, 황사, 조류 및 화산을 포함하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 시스템.
According to claim 1,
The natural disaster keyword unit,
Keyword information related to disaster phenomena is set and stored for each detailed type of natural disaster, and the detailed type information of natural disasters includes typhoon, flood, strong wind, storm, tsunami, heavy snow, cold wave, lightning, drought, heat wave, earthquake, yellow sand, tide, and volcano A quantitative measurement system for the number of disaster news cases comprising a.
삭제delete 제 1항에 있어서,
상기 사회재난 세부유형 정보는 화재, 폭발, 붕괴, 교통사고, 화생방사고, 환경오염, 국가기반마비, 미세먼지, 감염병, 가축전염병을 포함하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 시스템.
According to claim 1,
The social disaster detailed type information is a quantitative measurement system for the number of disaster news cases, characterized in that it includes fire, explosion, collapse, traffic accident, chemical, biological and radiological accident, environmental pollution, national infrastructure paralysis, fine dust, infectious disease, and livestock epidemic.
제 1항에 있어서,
상기 피해대상/원인물질 키워드부는,
수집된 재난관련 뉴스정보를 기반으로 사회재난 세부유형별 피해대상/원인물질 키워드 목록이 기설정되어 저장된 키워드 목록부;
수집된 재난관련 뉴스정보를 기반으로 형태소 분석 및 워드투벡터를 통해 단어 사전을 생성하는 단어 사전부; 및
상기 키워드 목록부 및 단어 사전부의 단어들 간의 유사도를 산출하여 유사도가 높은 단어를 새로운 키워드로 설정하여 상기 키워드 목록부에 업데이트하는 키워드 업데이트부;
를 포함하여 구성되는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 시스템.
According to claim 1,
The damage target / causative substance keyword section,
Based on the collected disaster-related news information, a keyword list unit in which a list of keywords subject to damage / causative substances for each detailed type of social disaster is preset and stored;
a word dictionary unit generating a word dictionary through morphological analysis and word-to-vector based on the collected disaster-related news information; and
a keyword update unit for calculating a similarity between words of the keyword list unit and the word dictionary unit, setting a word having a high similarity as a new keyword, and updating the keyword list unit;
A quantitative measurement system for the number of disaster news cases, characterized in that configured to include.
제 10항에 있어서,
상기 키워드 업데이트부는 아래의 [수학식 2]를 통해 상기 키워드 목록부 및 단어 사전부의 단어들 간의 유사도를 산출하며, 유사도 값은 -1에서 1까지의 값을 가지며, -1은 서로 완전히 반대되는 경우, 0은 서로 독립적인 경우, 1은 서로 완전히 같은 경우를 의미하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 시스템.
[수학식 2]
Figure 112022073975717-pat00007
According to claim 10,
The keyword update unit calculates the degree of similarity between the words of the keyword list unit and the word dictionary unit through [Equation 2] below, and the similarity value has a value from -1 to 1, where -1 is completely opposite to each other. , 0 is independent of each other, 1 is a quantitative measurement system for the number of disaster news cases, characterized in that it means that they are completely equal to each other.
[Equation 2]
Figure 112022073975717-pat00007
정보 입력부, 재난뉴스 수집부, 재난유형 판별부, 재난뉴스 비율 산출부, 키워드 저장관리부 및 정보 제공부를 포함하여 구성된 재난뉴스 건수의 정량적 측정 시스템을 이용한 재난뉴스 건수의 정량적 측정 방법에 있어서,
정보 입력부를 통해 사용자의 재난뉴스 수집 설정정보를 입력받는 단계;
재난뉴스 수집부를 통해 온라인 상의 언론사 데이터베이스에 접속하여 재난뉴스 수집 설정정보에 따라 일정기간 동안의 재난관련 뉴스정보를 수집하는 단계;
재난유형 판별부를 통해 키워드 저장관리부에 설정된 키워드 정보에 기초하여, 수집된 재난관련 뉴스정보를 기설정된 기계학습 기반의 자연재난 판별 모델 및 사회재난 판별 모델을 통해 각 재난관련 뉴스정보의 재난 세부유형정보를 판별하는 단계;
재난뉴스 비율 산출부를 통해 재난 세부유형별 재난관련 뉴스정보들을 기설정된 산출 프로그램을 통해 각 재난 세부유형별 재난뉴스의 비율을 산출하는 단계; 및
정보 제공부를 통해 각 재난 세부유형별 재난뉴스 비율 정보를 사용자에게 제공하는 단계;를 포함하되,
상기 키워드 저장관리부는,
자연재난 세부유형별 키워드 정보가 설정되어 저장되는 자연재난 키워드부; 및
사회재난 세부유형별 키워드 정보가 설정되어 저장되는 사회재난 키워드부; 및
사용자의 입력 정보에 따라 자연재난 키워드부 및 사회재난 키워드부의 키워드 관련 정보를 설정하는 키워드 설정부;를 포함하여
상기 사회재난 키워드부는,
사회재난 세부유형별로 재난현상 관련 키워드 정보가 설정되어 저장되는 재난현상 키워드부; 및
사회재난 세부유형별로 피해대상/원인물질 키워드 정보가 설정되어 저장되는 피해대상/원인물질 키워드부;를 포함하여 구성되며,
상기 재난 세부유형정보를 판별하는 단계에서는,
상기 사회재난 판별 모델을 통해 재난관련 뉴스정보의 내용에서 키워드 저장관리부에 기설정된 사회재난 세부유형별 재난현상 키워드 정보를 검색하여 일치하는 키워드가 존재하는 동시에, 키워드 저장관리부에 기설정된 사회재난 세부유형별 피해대상/원인물질 키워드 정보를 검색하여 일치하는 키워드가 존재하는 경우, 해당 재난관련 뉴스정보의 세부유형정보를 해당 키워드가 속하는 사회재난 세부유형정보로 판별하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 방법.
In the quantitative measurement method of the number of disaster news cases using a quantitative measurement system of the number of disaster news cases composed of an information input unit, a disaster news collection unit, a disaster type determination unit, a disaster news rate calculation unit, a keyword storage management unit and an information provision unit,
Receiving user's disaster news collection setting information through an information input unit;
Collecting disaster-related news information for a certain period of time according to disaster news collection setting information by accessing an online media database through a disaster news collection unit;
Based on the keyword information set in the keyword storage and management unit through the disaster type determination unit, the collected disaster-related news information is converted to the detailed disaster type information of each disaster-related news information through a preset machine learning-based natural disaster discrimination model and social disaster discrimination model. Determining;
Calculating the ratio of disaster news for each detailed disaster type through a preset calculation program for disaster-related news information for each detailed disaster type through a disaster news rate calculation unit; and
Providing disaster news rate information for each detailed disaster type to a user through an information providing unit; including,
The keyword storage management unit,
a natural disaster keyword unit in which keyword information for each type of natural disaster is set and stored; and
a social disaster keyword unit in which keyword information for each type of social disaster is set and stored; and
A keyword setting unit for setting keyword-related information of the natural disaster keyword unit and the social disaster keyword unit according to user input information; including
The social disaster keyword section,
a disaster phenomenon keyword unit in which keyword information related to disaster phenomena is set and stored for each type of social disaster; and
A damage target/causative substance keyword unit in which keyword information for each type of social disaster is set and stored;
In the step of determining the disaster detailed type information,
Through the social disaster discrimination model, by searching disaster phenomenon keyword information for each detailed social disaster type preset in the keyword storage and management unit in the content of disaster-related news information, a matching keyword exists, and at the same time, damage for each detailed social disaster type preset in the keyword storage and management unit A quantitative measurement method for the number of disaster news cases, characterized in that by searching target/causative substance keyword information and determining the detailed type information of the disaster-related news information as the detailed type information of social disasters to which the keyword belongs, if a matching keyword exists. .
제 12항에 있어서,
상기 재난 세부유형정보를 판별하는 단계에서는,
상기 자연재난 판별 모델을 통해 재난관련 뉴스정보의 내용에서 키워드 저장관리부에 기설정된 자연재난 세부유형별 재난현상 키워드 정보를 검색하여 일치하는 키워드가 있는 경우, 재난관련 뉴스정보의 세부유형정보를 해당 키워드가 속하는 자연재난 세부유형 정보로 판별하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 방법.
According to claim 12,
In the step of determining the disaster detailed type information,
Through the natural disaster discrimination model, disaster phenomenon keyword information for each detailed type of natural disaster preset in the keyword storage management unit is searched in the content of disaster-related news information, and if there is a matching keyword, detailed type information of disaster-related news information is converted to the corresponding keyword. A method for quantitatively measuring the number of disaster news cases, characterized in that it is determined by the detailed type information of natural disasters to which it belongs.
삭제delete 제 13항에 있어서,
상기 재난관련 뉴스정보의 내용에서 키워드 저장관리부에 기설정된 재난현상 키워드 정보를 검색하여 일치하는 키워드가 존재하지 않으면 일반 뉴스로 판별하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 방법.
According to claim 13,
A method for quantitatively measuring the number of disaster news cases, characterized in that in the content of the disaster-related news information, searching for disaster phenomenon keyword information preset in the keyword storage management unit and determining it as general news if a matching keyword does not exist.
제 12항에 있어서,
상기 재난뉴스 비율 산출부는 아래의 [수학식 1]을 통해 재난 세부유형별 재난뉴스의 비율을 산출하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 방법.
[수학식 1]
Figure 112022073975717-pat00008

여기서,
재난관련 뉴스 건수 = 자연재난 관련 뉴스 건수 + 사회재난 관련 뉴스 건수
According to claim 12,
The disaster news ratio calculation unit calculates the ratio of disaster news for each detailed disaster type through [Equation 1] below.
[Equation 1]
Figure 112022073975717-pat00008

here,
Number of news related to disasters = Number of news related to natural disasters + Number of news related to social disasters
제 12항에 있어서,
제어부를 통해 사용자의 재난관련 입력정보, 재난뉴스 수집부의 재난관련 뉴스정보, 재난유형 판별부의 재난 세부유형별 재난관련 뉴스정보, 재난뉴스 비율 산출부의 재난 세부유형별 재난뉴스 비율 정보를 포함하여 각종 재난관련정보를 정보 저장부에 저장하는 단계가 포함되는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 방법.
According to claim 12,
Various disaster-related information, including disaster-related input information from users through the control unit, disaster-related news information from the disaster news collection unit, disaster-related news information by detailed disaster type from the disaster type determination unit, and disaster news ratio information by disaster detailed type from the disaster news ratio calculation unit A method for quantitatively measuring the number of disaster news cases, characterized in that the step of storing in the information storage unit is included.
삭제delete 제 12항에 있어서,
상기 자연재난 키워드부는,
자연재난 세부유형별로 재난현상 관련 키워드 정보가 설정되어 저장되며, 상기 자연재난 세부유형 정보는 태풍, 홍수, 강풍, 풍랑, 해일, 대설, 한파, 낙뢰, 가뭄, 폭염, 지진, 황사, 조류 및 화산을 포함하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 방법.
According to claim 12,
The natural disaster keyword unit,
Keyword information related to disaster phenomena is set and stored for each detailed type of natural disaster, and the detailed type information of natural disasters includes typhoon, flood, strong wind, storm, tsunami, heavy snow, cold wave, lightning, drought, heat wave, earthquake, yellow sand, tide, and volcano A quantitative measurement method for the number of disaster news cases comprising a.
삭제delete 제 12항에 있어서,
상기 사회재난 세부유형 정보는 화재, 폭발, 붕괴, 교통사고, 화생방사고, 환경오염, 국가기반마비, 미세먼지, 감염병, 가축전염병을 포함하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 방법.
According to claim 12,
The detailed social disaster information includes fire, explosion, collapse, traffic accident, chemical, biological and radiological accident, environmental pollution, national paralysis, fine dust, infectious disease, and livestock epidemic. Method for quantitatively measuring the number of disaster news cases.
제 12항에 있어서,
상기 피해대상/원인물질 키워드부는,
수집된 재난관련 뉴스정보를 기반으로 사회재난 세부유형별 피해대상/원인물질 키워드 목록이 기설정되어 저장된 키워드 목록부;
수집된 재난관련 뉴스정보를 기반으로 형태소 분석 및 워드투벡터를 통해 단어 사전을 생성하는 단어 사전부; 및
상기 키워드 목록부 및 단어 사전부의 단어들 간의 유사도를 산출하여 유사도가 높은 단어를 새로운 키워드로 설정하여 상기 키워드 목록부에 업데이트하는 키워드 업데이트부;
를 포함하여 구성되는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 방법.
According to claim 12,
The damage target / causative substance keyword section,
Based on the collected disaster-related news information, a keyword list unit in which a list of keywords subject to damage / causative substances for each detailed type of social disaster is preset and stored;
a word dictionary unit generating a word dictionary through morphological analysis and word-to-vector based on the collected disaster-related news information; and
a keyword update unit for calculating a similarity between words of the keyword list unit and the word dictionary unit, setting a word having a high similarity as a new keyword, and updating the keyword list unit;
A method for quantitatively measuring the number of disaster news cases, characterized in that it is configured to include.
제 22항에 있어서,
상기 키워드 업데이트부는 아래의 [수학식 2]를 통해 상기 키워드 목록부 및 단어 사전부의 단어들 간의 유사도를 산출하며, 유사도 값은 -1에서 1까지의 값을 가지며, -1은 서로 완전히 반대되는 경우, 0은 서로 독립적인 경우, 1은 서로 완전히 같은 경우를 의미하는 것을 특징으로 하는 재난뉴스 건수의 정량적 측정 방법.
[수학식 2]
Figure 112022073975717-pat00009


23. The method of claim 22,
The keyword update unit calculates the degree of similarity between the words of the keyword list unit and the word dictionary unit through [Equation 2] below, and the similarity value has a value from -1 to 1, where -1 is completely opposite to each other. , 0 is independent of each other, 1 is a quantitative measurement method of the number of disaster news, characterized in that it means the case that is completely equal to each other.
[Equation 2]
Figure 112022073975717-pat00009


KR1020220087460A 2022-07-15 2022-07-15 System and method for quantitatively measuring the number of disaster news KR102499775B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220087460A KR102499775B1 (en) 2022-07-15 2022-07-15 System and method for quantitatively measuring the number of disaster news

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220087460A KR102499775B1 (en) 2022-07-15 2022-07-15 System and method for quantitatively measuring the number of disaster news

Publications (1)

Publication Number Publication Date
KR102499775B1 true KR102499775B1 (en) 2023-02-16

Family

ID=85326009

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220087460A KR102499775B1 (en) 2022-07-15 2022-07-15 System and method for quantitatively measuring the number of disaster news

Country Status (1)

Country Link
KR (1) KR102499775B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120063442A (en) * 2010-12-07 2012-06-15 에스케이 텔레콤주식회사 Method for extracting semantic distance of mathematical sentence and classifying mathematical sentence by semantic distance, apparatus and computer-readable recording medium with program therefor
KR20170079648A (en) * 2015-12-30 2017-07-10 대한민국(국민안전처 국립재난안전연구원장) Analysis system for predicting future risks
KR102111609B1 (en) 2018-04-26 2020-05-15 대한민국 System And Method For Extracting Attribute Data of Disaster
KR102396771B1 (en) * 2021-12-15 2022-05-16 대한민국 A method for extracting disaster cause automatically

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120063442A (en) * 2010-12-07 2012-06-15 에스케이 텔레콤주식회사 Method for extracting semantic distance of mathematical sentence and classifying mathematical sentence by semantic distance, apparatus and computer-readable recording medium with program therefor
KR20170079648A (en) * 2015-12-30 2017-07-10 대한민국(국민안전처 국립재난안전연구원장) Analysis system for predicting future risks
KR102111609B1 (en) 2018-04-26 2020-05-15 대한민국 System And Method For Extracting Attribute Data of Disaster
KR102396771B1 (en) * 2021-12-15 2022-05-16 대한민국 A method for extracting disaster cause automatically

Similar Documents

Publication Publication Date Title
Spinde et al. Automated identification of bias inducing words in news articles using linguistic and context-oriented features
Hu Geo‐text data and data‐driven geospatial semantics
Hu et al. A natural language processing and geospatial clustering framework for harvesting local place names from geotagged housing advertisements
Acheson et al. A quantitative analysis of global gazetteers: Patterns of coverage for common feature types
Zhang et al. A topic model based framework for identifying the distribution of demand for relief supplies using social media data
CN105760439B (en) A kind of personage&#39;s cooccurrence relation map construction method based on specific behavior co-occurrence network
Feng et al. Extraction and analysis of natural disaster-related VGI from social media: review, opportunities and challenges
Deng et al. Identify urban building functions with multisource data: A case study in Guangzhou, China
Contreras et al. Accuracy of a pre-trained sentiment analysis (SA) classification model on tweets related to emergency response and early recovery assessment: the case of 2019 Albanian earthquake
Kitamoto et al. Toponym-based geotagging for observing precipitation from social and scientific data streams
Toker et al. Safety and security research in tourism: A bibliometric mapping
Gopal et al. Machine learning based classification of online news data for disaster management
Khaleq et al. Twitter analytics for disaster relevance and disaster phase discovery
Rachunok et al. Is the data suitable? the comparison of keyword versus location filters in crisis informatics using twitter data
KR20150059208A (en) Device for analyzing the time-space correlation of the event in the social web media and method thereof
Dutta et al. PNRank: Unsupervised ranking of person name entities from noisy OCR text
Barakhnin et al. Methods to identify the destructive information
Putra et al. Flood monitoring with information extraction approach from social media data
Mackaness et al. Assessing the Veracity of Methods for Extracting Place Semantics from F lickr Tags
KR102499775B1 (en) System and method for quantitatively measuring the number of disaster news
Chow et al. The Development of a Web‐Based Demographic Data Extraction Tool for Population Monitoring
Yzaguirre et al. Detecting environmental disasters in digital news archives
CN107885833B (en) Method and system for rapidly detecting earth surface coverage change based on Web news text
Liu et al. Evaluation of three-dimensional shape signatures for automated assessment of post-earthquake building damage
Nourbakhsh et al. " Breaking" Disasters: Predicting and Characterizing the Global News Value of Natural and Man-made Disasters

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant