KR20160133198A - 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법 - Google Patents

키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법 Download PDF

Info

Publication number
KR20160133198A
KR20160133198A KR1020150065925A KR20150065925A KR20160133198A KR 20160133198 A KR20160133198 A KR 20160133198A KR 1020150065925 A KR1020150065925 A KR 1020150065925A KR 20150065925 A KR20150065925 A KR 20150065925A KR 20160133198 A KR20160133198 A KR 20160133198A
Authority
KR
South Korea
Prior art keywords
disaster
relevance
message
keyword
messages
Prior art date
Application number
KR1020150065925A
Other languages
English (en)
Other versions
KR101685334B1 (ko
Inventor
최선화
배병걸
이보람
권아롱
심규승
Original Assignee
대한민국(국민안전처 국립재난안전연구원장)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국(국민안전처 국립재난안전연구원장) filed Critical 대한민국(국민안전처 국립재난안전연구원장)
Priority to KR1020150065925A priority Critical patent/KR101685334B1/ko
Publication of KR20160133198A publication Critical patent/KR20160133198A/ko
Application granted granted Critical
Publication of KR101685334B1 publication Critical patent/KR101685334B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06F17/2755
    • G06F17/30964
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법에 대한 것으로, 상기한 본 발명의 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술은 키워드 레벨에서 각 키워드가 특정 재난 유형에 대해 얼마나 관련있는지 평가하고, 다음으로 메시지 레벨에서 각 메시지에 포함된 키워드들의 관련도를 합산하여 메시지의 관련도 값을 구한 후, 마지막으로 특정 재난 유형에 대하여 한시간 동안에 발생한 관련 재난 메시지의 관련도 값을 합산하여 과거 데이터를 기준으로 만들어진 임계값과 비교하여 높을 경우에 재난 이슈별 재난을 탐지하는 것임을 특징으로 한다.
상기와 같이 구성되는 본 발명의 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법은 종래 통상적인 시간당 메시지 수에 기반한 확률 모형을 사용한 재난 이슈 탐지의 문제점을 해결하고자 메시지의 내용에 따른 관련도 평가 기술을 도입하여 메시지 수가 아닌 정량화된 관련도에 기반한 확률 모형을 구축하여 효과적으로 재난 이슈별 재난 전조를 탐지할 수 있게 하는 유용한 발명이다.

Description

키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법{Disaster detection technique based on the key word relevance and the method for managing the disaster using the same}
본 발명은 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법에 대한 것으로, 보다 자세하게는 종래 통상적인 시간당 메시지 수에 기반한 확률 모형을 사용한 재난 이슈 탐지의 문제점을 해결하기 위한 것으로, 상기한 종래 방법의 문제점을 보완하기 위하여 메시지의 내용에 따른 관련도 평가 기술을 도입하여 메시지 수가 아닌 정량화된 관련도에 기반한 확률 모형을 구축하여 효과적으로 재난 이슈별 재난 발생을 탐지할 수 있는 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법에 대한 것이다.
재난 또는 재해는 주로 이상 자연현상 또는 인위적 사고가 원인이 되어 발생하여 사회적·경제적으로 큰 피해를 주는 것으로, 최근 이상 기후 현상이 지구촌 곳곳에서 발생하고 있는데, 이러한 이상 자연 현상에 의한 재난 원인으로는 폭풍·호우·대설·홍수·해일·지진 등이 있으며, 그 밖의 인위적인 재난 원인으로는 화재·폭발·방사성 물질의 방출, 자동차사고, 선박의 침몰, 항공기의 조난 등이 있다. 이와 같은 재난은 사회적·경제적 피해가 크다는 점에서, 최근에는 이러한 재난을 미리 예측하여 예방하고자 하는 노력을 하고 있는데, 예를 들어 국가 기관에서는 재난의 전조를 수집하여 예방 조치를 수행하려 노력하고 있다. 그러나, 이러한 재난의 전조를 일일이 사람이 수집하기 용이하지 않고, 특히나, 정보통신기술의 발전과 모바일 단말의 보급 확대, 인터넷 서비스 확산 등으로 인하여 데이터가 폭증하고 있으며, 현재 폭발적으로 늘어나고 있는 인터넷 인구에 비례하여 인터넷망에는 10억 개가 넘는 사이트(site)들이 운영되고 있어 수많은 빅데이터가 존재하고 있고, 이로부터 다양한 데이터를 수집하고 이를 분석/관리하는 과정을 통해 많은 가치를 창출하고자 하는 기대가 증가하고 있는 실정이나, 이러한 수많은 빅데이터 속에서 재난 전조 정보와 관련된 정보를 선별적으로 검색하여 이를 이용하는 것에 대해서는 용이하지 않은 실정이다.
따라서, 이러한 문제점을 해결하기 위한 것으로 제안된 것으로는, 예를 들어 대한민국 공개특허공보 제2013-0010789호에서는 "재난 전조 정보를 제공하는 방법에 있어서, 인터넷 상의 뉴스 기사를 검색하는 단계; 상기 검색된 뉴스 기사 중 전조(前兆) 재난 정보를 갖는 뉴스 기사를 추출하는 단계; 상기 추출된 뉴스 기사를 기설정된 분류 정보에 따라 복수의 그룹 중 적어도 하나의 그룹으로 분류하는 단계; 상기 추출된 뉴스 기사 각각에 대해서, 분류된 그룹의 정보 및 재난 전조 정보에 따라 우선순위를 부여하는 단계; 및 상기 부여된 우선순위에 따라 상기 추출된 뉴스 기사를 표시하는 단계;를 포함하는 것을 특징으로 하는 재난 전조 정보를 제공하는 방법"을 개시하고 있으며, 한편 이렇게 제공된 재난정보 서비스의 운영방법으로는 대한민국 공개특허공보 제2013-0043422호에서, "(a) 모바일기기의 애플리케이션이 서버에 모든 유형의 재난위치정보를 요청하는 단계; (b) 상기 서버가 상기 모바일기기의 맵 상에 재난 유형별로 재난위치정보를 별개의 아이콘으로 표시하는 단계; (c) 상기 모바일기기의 콤보박스에서 상기 애플리케이션이 전체(All), 침수, 해일, 산사태, 풍해, 대설, 화재를 포함한 재난유형 중 어느 하나의 재난위치정보를 상기 서버에 요청하는 단계; (d) 상기 서버가 상기 모바일기기의 맵 상에 상기 (c)단계에서 요청된 재난유형의 재난위치정보를 해당 아이콘으로 표시하는 단계; 및 (e) 상기 모바일기기의 애플리케이션에 지명키워드가 입력되면 해당되는 지명으로 맵 포커스가 이동하고, 이동한 맵 상에 재난위치정보가 해당 아이콘으로 표시되는 단계를 포함하는 것을 특징으로 하는 모바일기기를 이용한 지도기반의 실시간 재난정보서비스 운용방법"을 개시하고 있다.
그러나, 상기한 종래의 기술은 단지 뉴스기사 검색을 통해 재난 전조 정보를 제공하는 것과 이를 운영하는 방법에 지나지 않으며, 유무선 통신상에 나타난 빅데이터를 이용한 재난 이슈별 탐지 기술에 대해서는 알려진 바 없다. 또한, 종래 통상적인 시간당 메시지 수에 기반한 확률 모형을 사용한 재난 이슈 탐지가 제시되었는데, 이는 메시지의 내용과는 상관없이 단순히 메시지의 개수만을 고려한 방식으로서 동일한 재난을 알리는 메시지일지라도 내용에 따라 재난의 중요성 또는 파급성이 다른 것을 반영하지 못하는 문제점이 존재하였다.
특허문헌 1: 대한민국 공개특허공보 제2013-0010789호 특허문헌 2: 대한민국 공개특허공보 제2013-0043422호
따라서, 본 발명은 상기한 종래 기술에 있어서의 문제점을 감안하여 된 것으로, 본 발명의 주요 목적은 종래 통상적인 시간당 메시지 수에 기반한 확률 모형을 사용한 재난 이슈 탐지의 문제점을 해결하기 위한 것으로, 상기한 종래 방법의 문제점을 보완하기 위하여 메시지의 내용에 따른 관련도 평가 기술을 도입하여 메시지 수가 아닌 정량화된 관련도에 기반한 확률 모형을 구축하여 효과적으로 재난 이슈별 재난 전조를 탐지할 수 있는 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법을 제공하기 위한 것이다.
본 발명은 또한 상기한 명확한 목적 이외에 본 명세서의 전반적인 기술로부터 이 분야의 통상인에 의해 용이하게 도출될 수 있는 다른 목적을 달성함을 그 목적으로 할 수 있다.
본 발명의 상기 목적은 재난 이슈 탐지시 사용한 확률 모델 검증 필요성, 재난 유형의 특성을 고려한 재난 유형별 차별화된 임계값의 적용 필요성, 단순 빈도를 사용한 이슈 탐지 기술이 아닌 키워드, 메시지, 재난 유형의 정량화 기법 필요성 및 재난 발생 이슈를 조기에 탐지할 수 있는 기술 개발 필요성 등으로부터 유래될 수 있다.
상기 목적을 달성하기 위한 본 발명의 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술은;
키워드 레벨에서 각 키워드가 특정 재난 유형에 대해 얼마나 관련있는지 평가하고, 다음으로 메시지 레벨에서 각 메시지가 가지고 있는 키워드들의 관련도를 합산하여 메시지의 관련도를 평가한 후, 마지막으로 정해진 1시간 동안 발생한 특정 재난 유형에 대한 전체 메시지들의 관련도를 합산하여 미리 과거 데이터를 기반으로 만들어진 임계값과 비교하여 높을 경우에, 재난 이슈별 재난을 탐지하는 것임을 특징으로 한다.
본 발명의 다른 구성에 따르면, 상기 탐지 기술은 키워드 관련도 평가를 하기 위해 재난과 관련된 메시지를 수집하여 형태소 분석을 통해서 키워드 단위로 분할하였으며, 키워드에 대해서 관련도를 계산한 값을 합하여 만들어진 메시지 관련도 값을 사용하여 행함을 특징으로 한다.
본 발명의 또 다른 구성에 따르면, 상기 키워드 관련도 평가에서 키워드별 재난과의 관련성을 수치화하기 위해서는 카이제곱 방식과 조건부 확률 방식을 실험하였으며, 2가지 방식에서 좋은 결과를 가져왔던 조건부 확률 방식을 사용함을 특징으로 한다.
본 발명의 또 다른 구성에 따르면, 상기 키워드 관련도 평가에서 메시지에 대한 재난과의 관련성 수치를 정규화하기 위해서는 메시지의 키워드 관련도 합산, 메시지의 키워드 관련도 합산/메시지 길이, 메시지의 키워드 관련도 합산/log(메시지 길이)의 3가지 방식을 평가하기 위한 실험을 하였으며, 좋은 결과가 나왔던 메시지의 키워드 관련도 합산/메시지 길이 방식을 사용함을 특징으로 한다.
본 발명의 또 다른 구성에 따르면, 상기 재난 이슈 탐지를 하기 위해 과거에 수집했었던 자료를 기반으로 재난 유형별 최적 임계값을 와이블 분포를 활용하여 설정하고, 최적의 재난 이슈 탐지 성능을 확인하기 위해, 과거부터 50시간 전까지 값을 기반으로 만들어진 롱텀 임계값(long term threshold), 50시간 전부터 1시간 전까지의 데이터를 기반으로 만들어진 숏텀 임계값(short term threshold) 2가지 임계값보다 1시간 동안 수집된 재난관련 메시지의 관련도 합산값이 높을 경우에 재난 이슈로 탐지하는 것을 특징으로 한다.
상기와 같이 구성되는 본 발명의 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법은 종래 통상적인 시간당 메시지 수에 기반한 확률 모형을 사용한 재난 이슈 탐지의 문제점을 해결하고자 메시지의 내용에 따른 관련도 평가 기술을 도입하여 메시지 수가 아닌 정량화된 관련도에 기반한 확률 모형을 구축하여 효과적으로 재난 이슈별 재난 전조를 탐지할 수 있게 하는 유용한 발명이다.
도 1은 본 발명의 바람직한 실시형태에 따른 재난에 대한 시간당 관련도 확률 모델링 결과로서, 도 1a는 붕괴사고의 시간당 관련도 확률 모델링 결과이고, 도 1b는 지진의 시간당 관련도 확률 모델링 결과이고, 도 1c는 철도사고의 시간당 관련도 확률 모델링 결과이고,
도 2는 본 발명의 바람직한 실시형태에 따른 재난에 대한 일간 최대 시간당 관련도 확률 모델링 결과로서, 도 2a는 붕괴사고의 일간 최대 시간당 관련도 확률 모델링 결과이고, 도 2b는 지진의 일간 최대 시간당 관련도 확률 모델링 결과이고, 도 2c는 철도사고의 일간 최대 시간당 관련도 확률 모델링 결과이다.
이하, 본 발명의 바람직한 실시형태를 첨부된 도면들을 참조하여 보다 상세히 설명하기로 한다. 하지만, 본 발명의 범주가 여기에 한정되는 것이 아님은 물론이다.
본 명세서에서, 본 실시형태는 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것으로서, 본 발명의 범주는 단지 청구항에 의해 정의될 뿐이다. 따라서, 몇몇 실시형태들에서, 잘 알려진 구성 요소, 잘 알려진 동작 및 잘 알려진 기술들은 본 발명이 모호하게 해석되는 것을 피하기 위하여 구체적으로 설명되지 않는다.
본 명세서에서 사용된 용어들은 실시형태를 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 결코 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않은 한 복수형도 포함한다. 또한, '포함(또는, 구비)한다'로 언급된 구성 요소 및 동작은 하나 이상의 다른 구성요소 및 동작의 존재 또는 추가를 배제하지 않는다.
본 발명에 따른 재난이슈 탐지기술은 (전조 이슈) 확률모델 검증 및 고도화, 재난유형별 차별화된 임계값 적용; (재난발생 이슈) 어휘패턴 구축 및 확장, 재난 발생이슈 탐지 및 알림기능; (위험도) 재난 이슈별 위험도 평가 기술 개발; 재난 감성단계 확장; 재난 진행과정에 따른 감성 변화 모니터링 기술 개발로 구성되어 질 수 있다.
본 발명의 바람직한 실시형태에 따르면, 본 발명의 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술은 트위터, 페이스북, 인스타그램과 같은 소셜미디어에서 생성하는 재난 키워드가 포함된 메세지에 대해서 실시간으로 수집한 후, 재난관련 메시지를 키워드 레벨로 분할하고; 각 키워드가 특정 재난 유형에 대해 얼마나 관련있는지 효과적인 방법을 사용하여 평가하며; 하나의 메시지가 가지고 있는 키워드의 관련도 합산으로 메시지의 관련도 수치를 계산하며; 마지막으로 최근 1시간 동안 수집된 재난관련 메시지들에 대하여 각 메시지들의 관련도 수치를 합산한 값이 미리 결정된 임계값을 넘는 경우에 재난 이슈로 판별하는 방식으로; 실시간으로 소셜미디어 메시지를 분석하여 재난 이슈를 탐지하는 것이다.
본 발명의 다른 바람직한 실시형태에 따르면, 상기 탐지 기술은 재난관련 메시지를 키워드 레벨로 분석하기 위해 소셜미디어 사이트에서 생성되는 메시지를 스트리밍(Streaming) API와 레스트(Rest) API를 활용하여 수집하며; 형태소 분석을 사용하여 키워드 레벨로 분할할 수 있다.
먼저, 본 발명에 따른 재난 이슈별 관련도 평가 기술은 동일한 재난을 알리는 메시지 일지라도, 메시지의 내용에 따라 재난의 중요성 또는 파급성이 다를 수 있다는 점에 착안하여 된 것이다. 관련도 평가 기술은 모든 키워드에 대해 재난과의 관련성인 재난 관련도를 정량화하고 메시지의 길이에 따라 나누어주는 과정을 통해 정규화함으로써 개별 메시지에 대한 관련도를 계산하고 최종적으로는 1시간 동안 발생한 각 재난별 메시지들에 대한 관련도를 정량화한다.
키워드 관련도 평가에 있어서, 모든 키워드는 각 재난에 대해 관련성이 다르다. 예를 들어, "탈선"이라는 키워드는 "호우" 재난보다 "철도사고" 재난에 더 관련성이 있다고 볼 수 있을 것이다. 그러므로 모든 키워드들은 각 재난에 대한 관련도를 다르게 할 필요가 있다. 이러한 관련도는 각 키워드가 각 재난에 대해 얼마나 관련성이 높은지 수치화하기 위한 가중치이다. 키워드별 재난과의 관련성을 수치화하기 위해 2가지 방식으로 실험하였으며, 재난이라고 분류된 재난 메시지 집합과 재난과 관련이 없는 일반 메시지 집합을 데이터로 사용한다.
상기 2가지 방식에서 먼저 카이제곱 방식을 들 수 있는데, 이는 가장 널리 사용되는 통계 검정 중 하나이다. 사람 수나 사물의 수 같이 측정된 데이터를 사용하며, 주로 변수와 특정 현상 사이의 연관성을 보고 싶을 때 사용된다. 키워드별로 2×2 분할표(contingency table)에 기반하여, 해당 재난에 대한 키워드별 관련도를 계산한다. 2×2 분할표와 관련도 계산 수식은 다음 표 1 및 수식 1과 같다.
해당 재난 트윗 일반 트윗
해당 키워드 포함 a c
해당 키워드 미포함 b d
Figure pat00001
(1)
상기 식 (1)에서 Rel _ Weight ( keyword )는 해당 키워드의 관련도를 의미하며, a는 해당 키워드가 출현한 해당 재난 메시지 수이며, b는 해당 키워드가 출현하지 않은 재난 메시지 수이며, c는 해당 키워드가 출현한 일반 메시지 수이며, d는 해당 키워드가 출현하지 않은 일반 메시지 수이다.
다음으로, 조건부 확률 방식으로, 키워드 관련도는 해당 키워드가 얼마나 해당 재난과 관련성이 있는지를 의미한다. 해당 키워드 출현 대비 재난 메시지 확률이 높다면 관련성이 높다고 할 수 있다. 즉, 해당 키워드가 포함된 전체 메시지 수와 해당 키워드가 포함된 재난 메시지 수의 차이가 크지 않을수록 높은 값을 갖는다. 그러므로 해당 재난 메시지 대비 해당 키워드가 포함된 해당 재난 메시지 확률을 반영한다. 조건부 확률 방식의 관련도 계산 수식은 다음과 같다.
Figure pat00002
Figure pat00003
(2)
상기 식에서 Rel _ Weight ( keyword )는 해당 키워드의 관련도를 의미하며, Num keyword (disaster)는 해당 키워드가 출현한 해당 재난 메시지 수이며, Num keyword (total)은 해당 키워드가 출현한 전체 메시지 수이며, Num ( disaster )는 해당 재난의 메시지 수이다.
본 발명에 따르면 일반 메시지 대비 재난 메시지에서의 출현 확률에 기반한 관련도 학습 방식에 의한 키워드 관련도 상위 10개 예는 다름 표 2와 같이 나타날 수 있다.
Figure pat00004
상기 표 2의 철도사고에서 빈도수 기반의 높은 순위에 위치한 '사고'라는 키워드는 여러 가지 사건과 사고에서 발생하는 키워드로 철도사고 재난에서 다수 발생하나 관련성이 높다고 할 수 없다. 또한 표 2의 호우에서 빈도수 기반 높은 순위인 '피해', '집중', '주의보'도 다수 발생하기는 하였으나 호우 재난에 관련이 높다고 할 수 없으며, 표 2의 황사에서도 '오늘', '중국', '조심하다', '날씨', '오다'라는 키워드들이 다수 발생하였으나 황사 재난에 관련이 높다고 할 수 없다. 키워드 관련도 상위 10개 결과는 재난과 관련이 있는 키워드라고 볼 수 있지만 해당 재난과 긴밀한 키워드라고는 볼 수가 없다.
그에 반하여, 표 2의 철도사고에 대한 카이제곱과 조건부 확률을 기반으로 추출된 '지하철사고'를 비롯한 다양한 키워드들은 실제 철도사고와 연관성이 높으며, 호우와 황사에 대한 키워드들도 관련성이 높은 것을 알 수 있다. 그러므로 각 재난 유형별 관련성 측면에서, 단순 빈도수 결과보다 키워드 관련도 가중치 학습 결과가 더 나은 결과라는 것을 알 수 있다.
표 2의 철도사고 재난에서 카이제곱 방식과 조건부 확률 방식 모두 비슷한 결과를 보였지만, 카이제곱 방식에서 '해양사고' 키워드는 잘못 추출된 키워드로 볼 수 있다. 그러나, 표 2의 호우 재난과 황사 재난에서는 카이제곱 방식과 조건부 확률 방식 모두 거의 같은 결과를 보였다.
상기 표 2의 철도사고, 호우, 황사 재난에 대한 키워드와 조건부 확률 방식에 의해 학습된 키워드 관련도를 다음 표 3에 나타냈다.
Figure pat00005
본 발명의 다른 바람직한 실시형태에 따르면, 본 발명의 재난별 이슈 탐지 기술은 메시지 관련도 평가를 하여 수행할 수 있다. 이는 키워드 관련도 학습 결과를 이용하여, 개별 메시지의 관련도를 정량화하는 것이다. 개별 메시지의 관련도를 정량화함으로써 가장 관련도가 높은 메시지를 추출할 수 있으며, 시간당 재난 관련도를 정량화할 수 있다.
동일한 재난에 대한 정보 전달 목적의 메시지라도, 재난과 관련성이 높은 메시지가 있을 수 있고 관련성이 낮은 메시지가 있을 수 있다. 메시지에 대한 관련도 평가는 일반적인 정보 전달 목적 메시지보다 현재 재난 상황 전달 목적 메시지(eyewitness message)가 더 재난과 관련성이 높게 정량화한다. 길이가 짧은 메시지는 주로 현재 재난 상황 전달 목적의 메시지며, 이러한 특성은 신속하게 재난 상황을 알리고자 정보를 상세히 전달하기 보다는 간략하게 전달하려고 하기 때문이다. 그러므로, 메시지에 대한 관련도 평가는 메시지의 길이에 따라 관련도를 다르게 할 필요가 있다. 이에 대한 실험 평가를 위해 메시지 내 키워드 관련도 합산, 메시지 내 키워드 관련도 합산/메시지 길이, 메시지 내 키워드 관련도 합산/log(메시지 길이) 3가지 방식으로 메시지 관련도 평가를 실험하였다.
먼저, 메시지 내 키워드 관련도 합산은 메시지 내 출현한 모든 키워드의 관련도를 합산한 방식이다. 즉, 키워드가 많을수록 메시지 관련도가 높을 가능성이 크다.
다음으로, 메시지 내 키워드 관련도 합산/메시지 길이 방식은 메시지 내 키워드 관련도 합산 방식에 메시지 길이를 고려한 방식이다. 즉, 키워드당 평균 관련도이다. 현재 재난 상황을 알리는 메시지들은 길이가 짧다는 특성을 반영할 수 있다.
그리고, 마지막으로, 메시지 내 키워드 관련도 합산/log(메시지 길이) 방식은 상기 메시지 내 키워드 관련도 합산/메시지 길이 방식이 메시지 길이의 영향력이 크다는 문제점이 있어 이러한 문제점을 보완한 방식이다. 현재 재난 상황을 자세히 기술하기 위해 메시지 길이가 길 수도 있다는 특성을 반영하였다.
상기와 같이 구성되는 본 발명에 따른 키워드 관련도 평가 방식과 메시지 관련도 평가 방식에 대해 정확률(precision) 비교 평가를 수행하였다. 모든 재난 유형이 아닌, '철도사고', '추락사고', '호우', '방사능사고' 재난에 대한 메시지 관련도 평가 실험을 하였다. 재난 유형별 키워드 관련도 학습 데이터 기간은 2013년 1월 1일 ~ 2014년 6월 16일이다. 실험 데이터 기간은 학습 데이터 기간의 바로 이후 기간인 2014년 6월 17일이며, 각 재난별로 30개 메시지를 샘플로 추출하여 실험하였다. 다음 표 4는 정확률 실험 결과이다.
카이제곱 조건부 확률
메시지 내 키워드 관련도 합산 103/120
(0.8583)
100/120
(0.8333)
메시지 내 키워드 관련도 합산
/ 메시지 길이
103/120
(0.8583)
106/120
(0.8833)
메시지 내 키워드 관련도 합산
/ log(메시지 길이)
102/120
(0.5800)
102/120
(0.5800)
상기 표 4의 2가지 키워드 관련도 평가 방식에서, 성능에 큰 차이를 보이진 않았다. 하지만, 3가지 메시지 관련도 평가 방식에서, (메시지 내 키워드 관련도 합산/메시지 길이) 방식이 우수한 성능을 보였다. 결론적으로 조건부 확률 방식과 (메시지 내 키워드 관련도 합산/메시지 길이) 방식이 가장 우수한 성능을 보였다.
각 재난 유형별 시간당 관련도는 해당 시간대에 해당 재난 유형에 대해 발생한 메시지들의 관련도의 총합에 의해 나타난다. 즉, 종래의 접근방식에서는 최근 한시간 동안 특정 재난 유형에 대한 메시지가 몇 건 발생했는지에 따라 재난 이슈인지 아닌지를 판별했다면, 새롭게 제안한 방식에서는 각 메시지들의 관련도를 합산한 값을 사용하여 그 값의 높고 낮음에 따라 재난 이슈인지를 판별할 수 있다. 같은 빈도수일지라도, 메시지 관련도가 다르기 때문에 관련도의 차이가 있다. 재난 유형별 관련도 평가는 재난 유형별 확률 모형 모델링을 위한 전처리 작업이다. 따라서, 종래 메시지 수 기반 방식에 비해 관련도 기반 방식이 얼마나 의미 있는지 다음의 확률 기반 재난 이슈 탐지 성능 차이를 통해 평가하도록 하겠다.
특정 시각에 재난 관련도가 높다는 것은 현재 이슈가 되고 있다는 것과 같다. 즉, 재난 관련도가 높아진 특정 시각을 탐지한다면 재난 이슈를 탐지할 수 있다. 확률 기반 전조 이슈 탐지 기술은 재난별로 시간당 재난 관련도를 확률 모형으로 모델링하여, 최종적으로는 특정 시각의 누적 분포 함수 값이 임계값(threshold) 이상일 경우에 재난 이슈를 탐지하는 것이다.
이슈가 되고 있는 특정 시각을 탐지하려면, 특정 시각 이전의 과거 이슈 추이를 분석해야 한다. 즉, 과거에 실제 재난이 발생했던 재난 관련도와 현재 시각의 재난 관련도가 비슷할 경우에 재난 이슈 탐지를 할 수 있다. 확률 모형 모델링은 재난별 과거 관련도를 적합한 확률 분포 모형으로 모델링하여, 현재 시각의 관련도와 과거 관련도를 비교할 수 있게 하는데, 재난 유형별 관련도 분포 그래프는 다르게 나타나므로 재난 유형별 확률 모델링을 다르게 할 필요가 있게 된다.
확률 모델링에 사용된 확률 분포는 정규 분포(normal distribution), 감마 분포(gamma distribution), 와이블 분포(weibull distribution)이다. 시간당 관련도 확률 모델링은 확률 분포의 데이터로 시간당 관련도를 사용한다. 도 1은 본 발명의 바람직한 실시형태에 따른 재난에 대한 시간당 관련도 확률 모델링 결과로서, 도 1a는 붕괴사고의 시간당 관련도 확률 모델링 결과이고, 도 1b는 지진의 시간당 관련도 확률 모델링 결과이고, 도 1c는 철도사고의 시간당 관련도 확률 모델링 결과이다.
도 1a에서 normal(μ = 0.006138, σ 2 = 0.000372)의 μ는 정규 분포의 평균을 의미하며, σ 2 는 분산을 의미한다. gamma(k = 0.006058, θ = 0.134430)의 k는 감마 분포의 모양(shape) 매개변수를 의미하며, θ는 크기(scale) 매개변수를 의미한다. exponweib(k = 0.285263, α = 0.893655, λ = 0.013321)의 k, α는 와이블 분포의 모양 매개변수를 의미하며, λ는 크기 매개변수를 의미한다.
확률 모델링 결과에서, 정규 분포, 감마 분포, 와이블 분포 모두 적합하다고 보기에는 어려웠다. 이러한 문제는 0값의 확률 밀도 함수 값이 높기 때문이다. 즉, 해당 재난 상황을 알리는 메시지가 1시간에 하나도 없었을 경우가 많았기 때문이다. 이러한 문제점을 해결하기 위해, 시간당 관련도가 아닌 일간 최대 시간당 관련도(daily peak) 데이터를 사용한다.
일간 최대 시간당 관련도는, 하루 동안(=24시간)의 시간당 관련도에서 가장 큰 관련도 값을 의미한다. 즉, 24개의 시간당 관련도에서 가장 큰 관련도를 의미한다. 일간 최대 시간당 관련도를 사용함으로써, 관련도 0 값이 많은 문제점을 해결할 수 있다.
도 2는 본 발명의 바람직한 실시형태에 따른 재난에 대한 일간 최대 시간당 관련도 확률 모델링 결과로서, 도 2a는 붕괴사고의 일간 최대 시간당 관련도 확률 모델링 결과이고, 도 2b는 지진의 일간 최대 시간당 관련도 확률 모델링 결과이고, 도 2c는 철도사고의 일간 최대 시간당 관련도 확률 모델링 결과이다.
도 2a에서 와이블 분포가 가장 적합한 확률 분포인 것을 알 수 있다. 도 2b의 확률 밀도 함수에서 감마 분포와 와이블 분포 둘 다 적합해 보이지만, 확률 누적 함수를 보면 와이블 분포가 더 적합한 확률 분포인 것을 알 수 있다. 도 2c에서도 감마 분포와 와이블 분포 둘 다 적합해 보이지만, 와이블 분포가 더 적합한 확률 분포인 것을 알 수 있다. 또한, 공통적으로 시간당 관련도에 비해 일간 최대 시간당 관련도가 확률 모델링에 상대적으로 적합한 데이터 유형인 것을 알 수 있다.
이러한 결과는 와이블 분포의 매개변수에 따라, 정규 분포 또는 지수 분포와 같은 확률 분포를 따르기 때문이다. 결론적으로, 일간 최대 시간당 관련도를 데이터로 사용하며, 와이블 분포를 확률 모형으로 사용한다.
상기와 같이 본 발명에 따른 재난 유형별 확률 모델링을 통해, 현재 시각의 관련도와 과거 관련도를 비교할 수 있다. 즉, 현재 시각 바로 이전까지의 확률 모델링으로 학습된 확률 분포에서 현재 시각 관련도의 누적 확률 함수 값이 얼마인지 알 수 있다. 현재 시각 관련도의 누적 확률 값이 특정 임계값 이상일 경우, 재난 이슈로 탐지한다. 결론적으로, 재난 이슈 탐지를 하기 위해 재난 유형별 최적 임계값을 설정해야 한다. 누적확률의 임계값을 어떻게 설정할 때 최적의 재난 이슈 탐지 성능을 보이는지 확인하기 위해, 롱텀 임계값(long term threshold), 숏텀 임계값(short term threshold) 2가지 임계값에 따른 재난 이슈 탐지 실험을 수행하였다. 현재 시각 재난 관련도의 누적 확률 값이 2가지 임계값보다 모두 이상일 경우에 재난 이슈로 탐지한다.
롱텀 임계값(long term threshold; LTT)는 2012년 1월 1일 ~ 탐지 시각 1일 전까지의 일간 최대 시간당 관련도에 기반한 와이블 분포에서의 누적확률 임계값을 의미한다. 10, 60, 65, 70, 75, 80, 85, 90, 95로 설정하여 실험하였다. 롱텀 임계값이 95일 경우, 와이블 분포에서의 누적 확률 함수 값이 95 이상일 경우에 재난 이슈로 탐지한다.
숏텀 임계값(short term threshold; STT)는 탐지 시각 50시간 전 ~ 탐지 시각 1시간 전까지의 시간당 관련도에 대한 백분위수(percentile) 임계값을 의미한다. 트위터 사용자들은 임의의 재난이 발생했을 경우, 재난 발생 후에도 재난에 대한 메시지를 작성하는 경향이 있다. 롱텀 임계값만 사용할 경우, 재난 발생 후에도 재난 이슈로 탐지하는 문제점이 존재한다. 그러므로 숏텀 임계값을 통해 최근의 재난 이슈도를 반영한다. 0, 90, 95로 설정하여 실험하였다. 숏텀 임계값이 0일 경우, 롱텀 임계값만 사용하는 것과 동일하다.
모든 재난 유형에 대해 확률 분포를 다르게 하지 않고, 와이블 분포로 동일하게 확률 모델링을 하였다. 확률 모형 기반 재난 이슈 탐지 실험의 목적은 누적 확률의 임계값을 어떻게 설정할 때 최적의 재난 이슈 탐지 성능을 보이는지 확인하기 위해서이다. 특정 시각의 재난 유형별 관련도가 확률 모형의 누적 확률상 지정된 임계값을 넘어설 경우 재난 이슈로 판별한다. 임계값 종류로는 롱텀 임계값, 숏텀 임계값 2가지가 있다.
평가 방법은 재현율(recall), 정확률, F1 measure, F2 measure를 사용하였다. F1 measure와 F2 measure 수식은 다음과 같다.
Figure pat00006
Figure pat00007
F1은 재현율과 정확률의 가중치를 균등하게 했을 때의 성능이며, F2는 정확률에 비해 재현율에 2배의 가중치를 부여했을 때의 성능이다. 재난 발생 이슈 탐지는 정확률보다 재현율이 상대적으로 중요하기에 F2의 성능도 의미가 있을 것이다.
상기 도면에 나타난 '붕괴사고', '지진', '철도사고' 재난에 대한 메시지 데이터를 실험 데이터로 사용하여 각 롱텀 임계값과 숏텀 임계값에서 재현율(recall), 정확률, F1, F2를 각각 구하였다.
그 결과, 롱텀 임계값이 75, 숏텀 임계값이 95일 때 F1이 가장 우수한 성능을 보였으며, 롱텀 임계값이 70, 숏텀 임계값이 95일 때 F2이 가장 우수한 성능을 보였다. 하지만 재난마다 F1과 F2가 가장 우수한 성능을 보였을 때의 임계값은 차이를 보였다. 그러므로 재난마다 임계값을 다르게 설정하여 재난 발생 이슈 탐지를 해야 한다.
다음 표 5는 기존 빈도수 기반 재난 이슈 탐지 방식 대비 관련도 기반 재난 이슈 탐지 방식에 대한 비교 평가이다.
붕괴사고 지진 철도사고
빈도수 관련도* 빈도수 관련도** 빈도수 관련도***
재현율 0.2439 0.2927 0.2969 0.4844 0.2708 0.5938
정확률 0.0585 0.1558 0.2676 0.5849 0.0956 0.3986
F1 0.0943 0.2034
(+115.92%)
0.2815 0.5299
(+88.24%)
0.1413 0.4770
(+237.58%)
F2 0.1493 0.2489
(+66.71%)
0.2905 0.5016
(+72.67%)
0.1982 0.5408
(+172.86%)
상기 표 5에서 관련도*는 일간 최대 시간당 관련도 데이터를 와이블 분포로 모델링한 후, 롱텀 임계값 85, 숏텀 임계값 95를 의미한다. 관련도**는 롱텀 임계값 65, 숏텀 임계값 95를 의미하며, 관련도***는 롱텀 임계값 75, 숏텀 임계값 95를 의미한다. 기존 빈도수 기반 모델에 비해 관련도 기반 모델이 모든 재난 유형에서 우수한 성능을 보인 것을 알 수 있다.
이상에서 설명한 바와 같이, 본 발명의 기술적 사상은 바람직한 실시형태에서 구체적으로 기술되었으나, 상기한 실시형태는 그 설명을 위한 것이며, 그 제한을 위한 것이 아님을 주의하여야 한다. 본 발명의 기술사상 범위 내에서 다양한 변형 및 수정이 가능함은 당업자에게 명백한 것이며, 따라서 이러한 변형 및 수정이 첨부된 특허청구범위에 속함은 당연한 것이다.

Claims (7)

  1. 소셜미디어에서 생성하는 재난 키워드가 포함된 메세지에 대해서 실시간으로 수집한 후, 재난관련 메시지를 키워드 레벨로 분할하고; 각 키워드가 특정 재난 유형에 대해 얼마나 관련있는지 효과적인 방법을 사용하여 평가하며; 하나의 메시지가 가지고 있는 키워드의 관련도 합산으로 메시지의 관련도 수치를 계산하며; 마지막으로 최근 정해진 시간 동안 수집된 재난관련 메시지들에 대하여 각 메시지들의 관련도 수치를 합산한 값이 미리 결정된 임계값을 넘는 경우에 재난 이슈로 판별하는 방식으로; 실시간으로 소셜미디어 메시지를 분석하여 재난 이슈를 탐지하는 것을 특징으로 하는 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술.
  2. 제1항에 있어서, 상기 탐지 기술은 재난관련 메시지를 키워드 레벨로 분석하기 위해 소셜미디어 사이트에서 생성되는 메시지를 스트리밍(Streaming) API와 레스트(Rest) API를 활용하여 수집하며; 형태소 분석을 사용하여 키워드 레벨로 분할하는 것을 특징으로 하는 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술.
  3. 제1항에 있어서, 상기 탐지 기술은 키워드와 재난 발생의 관련성을 수치화하기 위해서는 가장 효율적인 조건부 확률 방식 사용하는 것이 특징적인 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술.
  4. 제3항에 있어서, 키워드 기반 메시지 관련도 평가에서 메시지와 재난과의 관련도 수치를 정규화하기 위해서는 키워드 관련도 합산/메시지 길이 방식을 사용함을 특징으로 하는 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술.
  5. 제 제1항에 있어서, 상기 탐지 기술은 다양한 재난유형에 대해서 적용하기 위해 기존에 수집한 자료를 토대로 만들어진 재난별 관련도 합산 임계값을 사용하는 것을 특징으로 하는 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술.
  6. 제5항에 있어서, 재난 이슈 탐지를 하기 위해 재난 유형별 최적 임계값를 설정하기 위해서 와이블 분포를 사용하여 계산하였으며; 임계값은 메시지들의 발생기간에 따른 롱텀 임계값(long term threshold), 숏텀 임계값(short term threshold) 2가지 임계값으로; 계산된 관련도 수치가 롱텀 임계값과 숏텀 임계값보다 높을 경우에 재난 이슈로 탐지하는 것을 특징으로 하는 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술.
  7. 제6항에 있어서, 롱텀 임계값(long term threshold)는 과거부터 1시간 전까지 값을 기반으로 만들어진 임계값이며; 숏텀 임계값(short term threshold)는 50시간 전부터 1시간 전까지의 데이터를 기반으로 만들어진 임계값으로 구성된 것이 특징적인 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술.
KR1020150065925A 2015-05-12 2015-05-12 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법 KR101685334B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150065925A KR101685334B1 (ko) 2015-05-12 2015-05-12 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150065925A KR101685334B1 (ko) 2015-05-12 2015-05-12 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법

Publications (2)

Publication Number Publication Date
KR20160133198A true KR20160133198A (ko) 2016-11-22
KR101685334B1 KR101685334B1 (ko) 2016-12-12

Family

ID=57540354

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150065925A KR101685334B1 (ko) 2015-05-12 2015-05-12 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법

Country Status (1)

Country Link
KR (1) KR101685334B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102025588B1 (ko) * 2019-06-19 2019-09-26 엄경률 사물 인터넷 기반 지능형 재난 대응 출입통제 방법
KR20220102202A (ko) * 2021-01-12 2022-07-20 대한민국(행정안전부 국립재난안전연구원장) 실시간 재난안전 뉴스 모니터링 시스템
KR102560907B1 (ko) * 2022-10-24 2023-07-31 주식회사 모비젠 개선된 학습모델을 통해 재난발생여부를 판단하는 방법 및 그 장치

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102350534B1 (ko) 2020-04-09 2022-01-13 가톨릭대학교 산학협력단 인공지능에 의한 빅데이터의 주요 키워드 분석기술을 활용한 재난예측 시스템 및 방법
KR102387665B1 (ko) 2021-01-20 2022-04-15 연세대학교 산학협력단 재난 가중치를 이용하여 소셜미디어의 재난 메시지 정보를 분석하는 재난정보 선별시스템 및 선별방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130010789A (ko) 2011-07-19 2013-01-29 메타라이츠(주) 재난 전조 정보를 제공하는 방법 및 그 장치
KR20130043422A (ko) 2011-10-20 2013-04-30 부경대학교 산학협력단 모바일기기를 이용한 지도기반의 실시간 재난정보서비스 운용방법
KR20130125113A (ko) * 2012-05-08 2013-11-18 한밭대학교 산학협력단 생애주기비용 분석을 이용한 도로포장 관리시스템 및 그 관리방법 및 그 기록매체
KR101491628B1 (ko) * 2013-07-30 2015-02-12 성균관대학교산학협력단 블로그에서 대중의 감성 변화에 영향을 미치는 키워드 추출 방법, 장치 및 시스템
KR20150046793A (ko) * 2013-10-21 2015-05-04 대한민국(국민안전처 국립재난안전연구원장) 소셜미디어를 이용한 재난 감지 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130010789A (ko) 2011-07-19 2013-01-29 메타라이츠(주) 재난 전조 정보를 제공하는 방법 및 그 장치
KR20130043422A (ko) 2011-10-20 2013-04-30 부경대학교 산학협력단 모바일기기를 이용한 지도기반의 실시간 재난정보서비스 운용방법
KR20130125113A (ko) * 2012-05-08 2013-11-18 한밭대학교 산학협력단 생애주기비용 분석을 이용한 도로포장 관리시스템 및 그 관리방법 및 그 기록매체
KR101491628B1 (ko) * 2013-07-30 2015-02-12 성균관대학교산학협력단 블로그에서 대중의 감성 변화에 영향을 미치는 키워드 추출 방법, 장치 및 시스템
KR20150046793A (ko) * 2013-10-21 2015-05-04 대한민국(국민안전처 국립재난안전연구원장) 소셜미디어를 이용한 재난 감지 시스템

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102025588B1 (ko) * 2019-06-19 2019-09-26 엄경률 사물 인터넷 기반 지능형 재난 대응 출입통제 방법
KR20220102202A (ko) * 2021-01-12 2022-07-20 대한민국(행정안전부 국립재난안전연구원장) 실시간 재난안전 뉴스 모니터링 시스템
KR102560907B1 (ko) * 2022-10-24 2023-07-31 주식회사 모비젠 개선된 학습모델을 통해 재난발생여부를 판단하는 방법 및 그 장치

Also Published As

Publication number Publication date
KR101685334B1 (ko) 2016-12-12

Similar Documents

Publication Publication Date Title
KR101685334B1 (ko) 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법
Robinson et al. A sensitive twitter earthquake detector
US10909647B2 (en) Damage data propagation in predictor of structural damage
Olteanu et al. What to expect when the unexpected happens: Social media communications across crises
Peduzzi et al. Global trends in tropical cyclone risk
Thom et al. Spatiotemporal anomaly detection through visual analysis of geolocated twitter messages
Avvenuti et al. Pulling information from social media in the aftermath of unpredictable disasters
US10740684B1 (en) Method and system to predict the extent of structural damage
US11004001B1 (en) Analysis of structural-damage predictions caused by an earthquake to identify areas with high damage levels
KR101890497B1 (ko) 교통 위험도 분석방법 및 이를 포함하는 저장매체
Kwon et al. Risk analysis and visualization for detecting signs of flood disaster in Twitter
Robinson et al. An evidence based earthquake detector using Twitter
Yabe et al. CityFlowFragility: Measuring the fragility of people flow in cities to disasters using GPS data collected from smartphones
Du et al. Data mining of social media for urban resilience study: A case of rainstorm in Xi'an
Kelly et al. Mining multimodal information on social media for increased situational awareness
KR20160104223A (ko) 빅데이터 기반의 범죄 패턴 분석을 이용한 범죄 예측 방법 및 범죄 예측 시스템
CN117893382B (zh) 基于多元特征融合的地质灾害风险评价方法及系统
Liu et al. Predicting subway incident delays using text analysis based accelerated failure time model
CN114238330A (zh) 一种数据处理方法、装置、电子设备和存储介质
Wu et al. Mining typhoon victim information based on multi-source data fusion using social media data in China: a case study of the 2019 Super Typhoon Lekima
Kabbani et al. What do riders say and where? The detection and analysis of eyewitness transit tweets
Zheng et al. Earthquake impact analysis based on text mining and social media analytics
Kurkcu et al. Crowdsourcing incident information for disaster response using twitter
Power et al. A Case Study for Monitoring Fires with Twitter.
Nourbakhsh et al. " Breaking" Disasters: Predicting and Characterizing the Global News Value of Natural and Man-made Disasters

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant