KR102282830B1 - 전염병의 전염 네트워크 분석 방법 및 장치 - Google Patents

전염병의 전염 네트워크 분석 방법 및 장치 Download PDF

Info

Publication number
KR102282830B1
KR102282830B1 KR1020200154301A KR20200154301A KR102282830B1 KR 102282830 B1 KR102282830 B1 KR 102282830B1 KR 1020200154301 A KR1020200154301 A KR 1020200154301A KR 20200154301 A KR20200154301 A KR 20200154301A KR 102282830 B1 KR102282830 B1 KR 102282830B1
Authority
KR
South Korea
Prior art keywords
infection
data
network
source
node
Prior art date
Application number
KR1020200154301A
Other languages
English (en)
Inventor
김기훈
Original Assignee
주식회사 사이람
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 사이람 filed Critical 주식회사 사이람
Priority to KR1020200154301A priority Critical patent/KR102282830B1/ko
Application granted granted Critical
Publication of KR102282830B1 publication Critical patent/KR102282830B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명에 따르면, 감염자들의 감염 정보가 포함된 복수의 원본 데이터들을 수집하여 기 설정된 정제 옵션에 따라 필터링하여 획득한 정제 데이터에서 감염자들의 감염원을 분류하여 분류 데이터를 획득하여, 노드 테이블 및 링크 테이블을 포함하는 네트워크 테이블을 구축하여 접촉자 추적 데이터를 기반으로 전염병의 전염 네트워크를 재구성하는 전염병의 전염 네트워크 분석 방법 및 장치가 개시된다.

Description

전염병의 전염 네트워크 분석 방법 및 장치 {EPIDEMIC NETWORK ANALYSIS METHOD AND DEVICE}
본 발명은 전염병의 네트워크 분석을 위한 전염 네트워크 분석 방법 및 장치에 관한 것이다.
전염병의 네트워크 분석을 위해 데이터에서 정보를 추출하고 이를 사용하여 추세 및 행동 패턴 등을 예측하는 통계 및 데이터마이닝 영역의 기술이 이용되고 있다.
현재의 역학조사 체계에서는 확진자의 발생 경위와 동선을 제공하고 있으나, 감염원 정보 분류체계 등 접촉 추적 데이터의 코딩이 전염 네트워크 데이터의 구성을 고려하고 있지 않으며, 현재 네트워크 분석을 위한 데이터는 지자체 별로 형식이 다르기 때문에 원본 데이터에서 통계 및 데이터마이닝을 수행하기에는 어려움이 있다.
이에 따라, 확진자의 접촉자 추적 실제 데이터를 기반으로 전염병의 전염 네트워크를 재구성하여 감염 관계를 분석하는 기술이 필요하다.
한국등록특허 제10-2140096호 (등록일 : 2020.07.27.)
본 발명의 일 실시예에 따른 해결하고자 하는 과제는, 지자체에서 공개하고 있는 확진자 정보 중 접촉자 추적(contact tracing) 데이터를 기반으로 전염병의 전염 네트워크를 재구성하는 것을 포함한다.
본 명세서에 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 수 있다.
상기 과제를 해결하기 위해, 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 네트워크 분석 방법은, 감염자들의 감염 정보가 포함된 복수의 원본 데이터들을 수집하여 감염 정보 테이블을 생성하는 단계, 상기 감염 정보 테이블에서 상기 감염 정보 중 일부를 기 설정된 정제 옵션에 따라 필터링하여 정제 데이터를 획득하는 단계, 획득한 상기 정제 데이터에서 상기 감염자들의 감염원을 분류하여 분류 데이터를 획득하고, 상기 감염 정보 테이블에 상기 정제 데이터와 상기 분류 데이터를 추가하여 정제 테이블을 생성하는 단계 및 상기 정제 테이블을 이용하여 노드 테이블 및 링크 테이블을 포함하는 네트워크 테이블을 구축하는 단계를 포함하여 수행된다.
또한, 상기 네트워크 테이블을 이용하여 제1 감염자의 감염원과 제2 감염자의 감염원을 분석하여 상기 제1 감염자와 제2 감염자 간의 전염 관계를 분석하는 단계를 더 포함한다.
여기서, 상기 복수의 원본 데이터들은, 지역별로 마련되는 데이터이다.
여기서, 상기 감염 정보 테이블을 생성하는 단계는, 적어도 하나의 감염 정보 항목에 따라 상기 감염 정보들을 구분하여 감염 정보 테이블을 생성한다.
여기서, 상기 감염 정보 항목은, 발생 경위와 감염자 번호를 포함하고, 연번, 지역명, 확진일, 감염자 거주지, 격리 병원 및 감염자 동선 중 적어도 하나를 더 포함한다.
여기서, 상기 감염 정보 중 일부를 기 설정된 정제 옵션에 따라 필터링하여 정제 데이터를 획득하는 단계는, 상기 감염 정보 항목 중 발생 경위로 구분된 데이터 집합들을 상기 정제 옵션에 따라 필터링하여 정제 데이터를 획득한다.
여기서, 상기 정제 옵션은, 제1 정제 옵션 내지 제3 정제 옵션을 포함하며, 상기 제1 정제 옵션은, 패턴과 숫자 키워드를 조합하여 생성한 옵션이고, 상기 제2 정제 옵션은, 국가명 키워드를 포함하여 생성한 옵션이며, 상기 제3 정제 옵션은, 집단명 또는 정의된 텍스트를 포함하여 생성한 옵션이다.
여기서, 상기 감염원은, 제1 감염원 내지 제3 감염원을 포함하며, 상기 정제 데이터에서 상기 감염자들의 감염원을 분류하여 분류 데이터를 획득하는 것은, 상기 정제 데이터가 패턴과 숫자 키워드의 조합을 포함하는 경우 제1 감염원으로 분류하고, 국가명 키워드를 포함하는 경우 제2 감염원으로 분류하며, 집단명 또는 정의된 텍스트를 포함하는 경우 제3 감염원으로 분류하여 분류 데이터를 획득한다.
여기서, 상기 네트워크 테이블을 구축하는 단계는, 상기 정제 테이블에 노드에 관한 항목을 추가하고, 상기 노드에 관한 항목에 상기 정제 데이터와 상기 분류 데이터를 각 행(row) 데이터로 입력하여 노드 테이블을 생성하는 단계를 포함한다.
여기서, 상기 네트워크 테이블을 구축하는 단계는, 소스 항목과 타겟 항목을 포함하는 항목들을 생성하고, 상기 소스 항목에 상기 정제 데이터와 상기 분류 데이터를 각 행(row) 데이터로 입력하고, 상기 타겟 항목에 상기 감염 정보 항목 중 감염자 번호로 구분된 데이터 집합들을 각 행(row) 데이터로 입력하여 링크 테이블을 생성하는 단계를 포함한다.
여기서, 상기 제1 감염자와 제2 감염자 간의 전염 관계를 분석하는 단계는, 상기 네트워크 테이블에서 개인 노드와 범주 노드를 구별하여 선택하고, 상기 개인 노드와 개인 노드를 연결한 링크, 상기 개인 노드와 범주 노드를 연결한 링크를 생성하여 네트워크를 구성한다.
본 발명의 또 다른 실시예에 따른 전염 네트워크 분석 장치는, 메모리 및 적어도 하나의 프로세서를 포함하며, 상기 프로세서는, 감염자들의 감염 정보가 포함된 복수의 원본 데이터들을 수집하여 감염 정보 테이블을 생성하고, 상기 감염 정보 테이블에서 상기 감염 정보 중 일부를 기 설정된 정제 옵션에 따라 필터링하여 정제 데이터를 획득하며, 획득한 상기 정제 데이터에서 상기 감염자들의 감염원을 분류하여 분류 데이터를 획득하고, 상기 감염 정보 테이블에 상기 정제 데이터와 상기 분류 데이터를 추가하여 정제 테이블을 생성하고, 상기 정제 테이블을 이용하여 노드 테이블 및 링크 테이블을 포함하는 네트워크 테이블을 구축한다.
이상에서 설명한 바와 같이 본 발명의 실시예들에 의하면, 감염자들의 감염 정보가 포함된 복수의 원본 데이터들을 수집하여 기 설정된 정제 옵션에 따라 필터링하여 획득한 정제 데이터에서 감염자들의 감염원을 분류하여 분류 데이터를 획득하여, 노드 테이블 및 링크 테이블을 포함하는 네트워크 테이블을 구축하여 접촉자 추적 데이터를 기반으로 전염병의 전염 네트워크를 재구성할 수 있다.
여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급된다.
도 1은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치를 나타낸 블록도이다.
도 2는 본 발명의 일 실시예에 따른 전염 네트워크 분석 방법을 나타낸 흐름도이다.
도 3 내지 도 5는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치가 수집하는 원본 데이터들을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 감염 정보 테이블을 설명하기 위한 도면이다.
도 7 내지 도 11은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 정제 옵션을 설명하기 위한 도면이다.
도 12 및 도 13은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 감염원 분류를 설명하기 위한 도면이다.
도 14는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 정제 테이블을 설명하기 위한 도면이다.
도 15는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 분류 데이터를 예로 들어 나타낸 도면이다.
도 16 및 도 17은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 네트워크 테이블 구축을 설명하기 위한 도면이다.
도 18은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 네트워크 테이블을 설명하기 위한 도면이다.
도 19 내지 도 22는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 데이터 전처리 과정을 설명하기 위한 도면이다.
도 23 내지 도 28은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 과정을 설명하기 위한 도면이다.
도 29 내지 도 37은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 결과를 설명하기 위한 도면이다.
이하, 본 발명에 관련된 전염병의 전염 네트워크 분석 방법 및 장치에 대하여 도면을 참조하여 보다 상세하게 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 설명하는 실시예에 한정되는 것이 아니다. 그리고, 본 발명을 명확하게 설명하기 위하여 설명과 관계없는 부분은 생략되며, 도면의 동일한 참조부호는 동일한 부재임을 나타낸다.
이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
본 발명의 일 실시예는 전염병의 전염 네트워크 분석 방법 및 장치에 관한 것이다.
도 1은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치를 나타낸 블록도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치(10)는 프로세서(11) 및 메모리(12)를 포함한다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 장치(10)는 지역별로 마련되는 코로나 웹데이터를 수집한 후 소셜 네트워크 분석을 위한 데이터로 가공 및 변환하여 노드 테이블과 링크 테이블을 생성하고, 이를 이용하여 전염 관계를 분석하는 장치이다.
여기서, 코로나 웹데이터는 서울, 경기, 인천 등을 포함하는 지역별 데이터이며, 각 지자체의 홈페이지에 개시되는 데이터를 의미한다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 장치(10)는 확진자 접촉 데이터 전처리 과정과 NetMiner 분석과정을 수행하며, 확진자 접촉 데이터 전처리 과정은 수집, 정제, 분류, 모델링, 유형별 데이터셋 분리, 사전 지수 계산 및 Import 과정을 포함하고, NetMiner 분석과정은 하위 네트워크 분리, 지수 계산, 추출, 시각화 및 탐색과정을 포함한다.
프로세서(11)는, 감염자들의 감염 정보가 포함된 복수의 원본 데이터들을 수집하여 감염 정보 테이블을 생성하고, 감염 정보 테이블에서 감염 정보 중 일부를 기 설정된 정제 옵션에 따라 필터링하여 정제 데이터를 획득하며, 획득한 정제 데이터에서 감염자들의 감염원을 분류하여 분류 데이터를 획득하고, 감염 정보 테이블에 정제 데이터와 분류 데이터를 추가하여 정제 테이블을 생성하고, 정제 테이블을 이용하여 노드 테이블 및 링크 테이블을 포함하는 네트워크 테이블을 구축한다.
메모리(12)는, 프로세서(11) 또는 다른 구성 요소들로부터 수신되거나 다른 구성 요소들에 의해 생성된 명령 또는 데이터를 저장할 수 있다. 또한, 메모리(12)는 그래프 모델링을 수행하여 생성되거나 갱신된 그래프 모델을 저장한다. 메모리(12)는 커널, 미들웨어, 어플리케이션 프로그래밍 인터페이스(API, application programming interface), 실행파일 등의 프로그래밍 모듈을 포함할 수 있다. 상술한 각각의 프로그래밍 모듈들은 소프트웨어, 펌웨어, 하드웨어 또는 이들 중 적어도 둘 이상의 조합으로 구성될 수 있다.
도 2는 본 발명의 일 실시예에 따른 전염 네트워크 분석 방법을 나타낸 흐름도이다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 방법은 원본 데이터 수집, 감염경로 정제, 감염원 분류 및 네트워크 테이블 생성 단계를 포함한다.
구체적으로, 도 2를 참조하면, 본 발명의 일 실시예에 따른 전염 네트워크 분석 방법은 전염 네트워크 분석 장치가 단계 S100에서 감염자들의 감염 정보가 포함된 복수의 원본 데이터들을 수집하여 감염 정보 테이블을 생성한다.
여기서, 복수의 원본 데이터들은, 지역별로 마련되는 데이터로서 하기 도 3 내지 도 5에서 상세히 설명한다.
감염 정보 테이블을 생성하는 단계(S100)는, 적어도 하나의 감염 정보 항목에 따라 감염 정보들을 구분하여 감염 정보 테이블을 생성한다.
여기서, 감염 정보 항목은, 발생 경위와 감염자 번호를 포함하고, 연번, 지역명, 확진일, 감염자 거주지, 격리 병원 및 감염자 동선 중 적어도 하나를 더 포함한다.
단계 S200에서 감염 정보 테이블 에서 감염 정보 중 일부를 기 설정된 정제 옵션에 따라 필터링하여 정제 데이터를 획득한다.
구체적으로, 감염 정보 항목 중 발생 경위로 구분된 데이터 집합들을 정제 옵션에 따라 필터링하여 정제 데이터를 획득한다.
여기서, 정제 옵션은, 제1 정제 옵션 내지 제3 정제 옵션을 포함하며, 제1 정제 옵션은, 패턴과 숫자 키워드를 조합하여 생성한 옵션이고, 제2 정제 옵션은, 국가명 키워드를 포함하여 생성한 옵션이며, 제3 정제 옵션은, 집단명 또는 정의된 텍스트를 포함하여 생성한 옵션이다.
단계 S300에서 획득한 정제 데이터에서 감염자들의 감염원을 분류하여 분류 데이터를 획득하고, 감염 정보 테이블에 정제 데이터와 분류 데이터를 추가하여 정제 테이블을 생성한다.
여기서, 감염원은, 제1 감염원 내지 제3 감염원을 포함하며, 정제 데이터에서 감염자들의 감염원을 분류하여 분류 데이터를 획득하는 것은, 정제 데이터가 패턴과 숫자 키워드의 조합을 포함하는 경우 제1 감염원으로 분류하고, 국가명 키워드를 포함하는 경우 제2 감염원으로 분류하며, 집단명 또는 정의된 텍스트를 포함하는 경우 제3 감염원으로 분류하여 분류 데이터를 획득한다.
단계 S400에서 정제 테이블을 이용하여 노드 테이블 및 링크 테이블을 포함하는 네트워크 테이블을 구축한다.
구체적으로, 정제 테이블에 노드에 관한 항목을 추가하고, 노드에 관한 항목에 정제 데이터와 분류 데이터를 각 행(row) 데이터로 입력하여 노드 테이블을 생성한다.
또한, 소스 항목과 타겟 항목을 포함하는 항목들을 생성하고, 소스 항목에 정제 데이터와 분류 데이터를 각 행(row) 데이터로 입력하고, 타겟 항목에 감염 정보 항목 중 감염자 번호로 구분된 데이터 집합들을 각 행(row) 데이터로 입력하여 링크 테이블을 생성한다.
단계 S400 이후에, 네트워크 테이블을 이용하여 제1 감염자의 감염원과 제2 감염자의 감염원을 분석하여 제1 감염자와 제2 감염자 간의 전염 관계를 분석한다.
도 3 내지 도 5는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치가 수집하는 원본 데이터들을 설명하기 위한 도면이다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 방법은 전염 네트워크 분석 장치가 감염자들의 감염 정보가 포함된 복수의 원본 데이터들을 수집하여 감염 정보 테이블을 생성한다. 여기서, 복수의 원본 데이터들은, 지역별로 마련되는 데이터이다.
정제 대상이 되는 원본 데이터들은 서울, 경기, 인천 지자체별 코로나 웹페이지 데이터이며, 각 지자체별로 데이터 입력 방식와 데이터 컬럼들이 다소 상이하므로 감염 정보 항목에 따라 감염 정보들을 구분하여 감염 정보 테이블을 생성할 필요가 있다.
여기서, 감염 정보 항목은, 발생 경위와 감염자 번호를 포함하고, 연번, 지역명, 확진일, 감염자 거주지, 격리 병원 및 감염자 동선 중 적어도 하나를 더 포함한다.
본 발명의 일 실시예에서는 원본 데이터들을 서울, 경기, 인천 지역의 데이터로 예로 들어 도시하였으나, 데이터의 종류는 이에 한정되는 것은 아니며, 다른 지역의 데이터를 이용하는 것도 가능하다.
구체적으로, 도 3은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치가 수집하는 서울 원본 데이터를 예로 들어 도시한 것이다.
도 3에서, 각 행은 확진자를 의미하고 "연번(서울 환자번호)", "환자번호", "감염경로", "확진일", "거주지", "퇴원현황" 등 6개 컬럼이 있으며 확진자 동선은 각 확진자의 하위 행으로 표기된다.
전염 네트워크 분석 장치는 해당 테이블의 연번, 확자번호, 감염경로, 확진일, 거주지(31) 및 확진자 동선(32)을 수집한다.
도 4는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치가 수집하는 경기 원본 데이터를 예로 들어 도시한 것이다.
도 4에서, 각 행은 확진자를 의미하고 "연번(경기 환자번호)", "전국번호", "지역(선별)", "발생경위", "관련성", "격리병원" 등 7개 컬럼이 있다.
전염 네트워크 분석 장치는 해당 테이블의 연번, "전국번호", "지역(선별)", "발생경위", "관련성" 등(41)을 수집한다.
도 5는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치가 수집하는 인천 원본 데이터를 예로 들어 도시한 것이다.
도 5에서, 각 행은 확진자 정보를 의미하며 연번(인천 환자번호), 전국번호, 거주지, 확진일자, 발생경위(51)로 나눌 수 있으며, 확진자 동선은 각 확진자의 하위 행으로 표기된다.
도 6은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 감염 정보 테이블을 설명하기 위한 도면이다.
감염 정보 테이블은, 상기 도 3 내지 도 5의 원본 데이터들을 통합하여 생성한 것으로, 도 6의 원본 테이블을 지칭한다.
감염 정보 테이블을 생성하는 단계(S100)는, 적어도 하나의 감염 정보 항목에 따라 감염 정보들을 구분하여 감염 정보 테이블을 생성한다.
여기서, 감염 정보 항목은, 발생 경위와 감염자 번호를 포함하고, 연번, 지역명, 확진일, 감염자 거주지, 격리 병원 및 감염자 동선 중 적어도 하나를 더 포함한다.
예를 들면, 연번(201), 환자번호(202), 지자체(203), 확진일(204), 거주지(205), 격리병원(206), 발생경위(207), 확진자 동선(208)을 포함할 수 있다.
도 7 내지 도 11은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 정제 옵션을 설명하기 위한 도면이다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 장치는 감염 정보 테이블에서 감염 정보 중 일부를 기 설정된 정제 옵션에 따라 필터링하여 정제 데이터를 획득한다.
구체적으로, 감염 정보 항목 중 발생 경위(관련성)로 구분된 데이터 집합들을 정제 옵션에 따라 필터링하여 정제 데이터를 획득하고, 감염경로 정제 컬럼에 저장한다.
여기서, 정제 옵션은, 제1 정제 옵션 내지 제3 정제 옵션을 포함하며, 제1 정제 옵션은, 패턴과 숫자 키워드를 조합하여 생성한 옵션이고, 제2 정제 옵션은, 국가명 키워드를 포함하여 생성한 옵션이며, 제3 정제 옵션은, 집단명 또는 정의된 텍스트를 포함하여 생성한 옵션이다.
제1 정제 옵션을 통해 개인(숫자패턴)을, 제2 정제 옵션을 통해 해외(해외 및 나라명 키워드)를, 제3 정제 옵션을 통해 집단, 불명, 미식별 개인(집단명 및 특정 패턴의 키워드)를 정제할 수 있다.
구체적으로, 도 7은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 제1 정제 옵션을 예로 들어 도시한 것이다.
제1 정제 옵션은, 패턴과 숫자 키워드를 조합하여 생성한 옵션으로, 각 지자체의 개인과 숫자 패턴을 정제할 수 있다.
예를 들어, "발생경위(관련성)"컬럼의 날짜를 제외한 대부분의 숫자들은 전국번호 및 지자체 번호를 뜻하며 지자체별로 표기 방식이 상이하기 때문에 각각 다른 규칙을 적용하고 있으므로, 지역번호는 전국번호로 변환하여 정제하며, 지자체별로 적용한 규칙 및 예시는 도 7에 나타난 바와 같다.
도 8은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 제2 정제 옵션을 예로 들어 도시한 것이다.
제2 정제 옵션은, 국가명 키워드를 포함하여 생성한 옵션으로, 각 지자체의 해외(해외 및 나라명 키워드)를 정제할 수 있다.
예를 들어, 도 8을 참조하면, 해외는 "발생경위(관련성)"에서 "해외"와 "나라명"을 기준으로 정제하며, 같은 나라를 뜻하지만 텍스트가 통일되지 않는 나라명을 우선적으로 통일한다.
구체적으로, 도 9의 (a)를 참조하면, 감염원 분류(개인)의 경우 발생경위에서 "[숫자]번"이 있는 행은 "개인"감염원으로 분류하고, 도 9의 (b)를 참조하면, 감염원 분류(해외)의 경우 발생경위에서 "해외", "나라명", "국외 도시명" 키워드가 있는 행은 "해외" 감염원으로 분류한다.
도 10은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 제2 정제 옵션에 따른 해외에 대한 감염경로 정제 규칙을 나타낸 것이다.
도 10을 참조하면, 해외 접촉 추정(나라명) 경우, "해외 접촉 추정(나라명)"으로 원본대로 사용한다.
텍스트 내에 "나라명"이 있는 경우, 나라명을 추출하여 "해외 접촉 추정(나라명)"으로 정제한다.
"해외" 혹은 "입국" 키워드만 있고 "나라명"이 없는 경우, "해외 접촉 추정"으로 정제한다.
도 11은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 제3 정제 옵션을 예로 들어 도시한 것이다.
제3 정제 옵션은, 집단명 또는 정의된 텍스트를 포함하여 생성한 옵션으로, 집단, 불명, 미식별 개인(집단명 및 특정 패턴의 키워드)를 정제할 수 있다.
예를 들어, 도 11을 참조하면, 개인(숫자패턴), 해외(해외 및 나라명 키워드) 정제 후, 나머지 데이터에 대해 집단명이나 특정 패턴의 키워드를 이용해 정제하며, 특정 패턴 키워드를 포함하고 있는 행을 찾아 포괄적으로 집단명 혹은 정의된 텍스트로 변환한다.
도 12 및 도 13은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 감염원 분류를 설명하기 위한 도면이다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 장치는 정제 데이터에서 감염자들의 감염원을 분류하여 분류 데이터를 획득하고, 감염 정보 테이블에 정제 데이터와 분류 데이터를 추가하여 정제 테이블을 생성한다.
감염자들의 감염원을 분류하는 것은, "감염경로 정제"항목의 특성을 토대로 각각 환자들의 감염원을 대, 중, 소로 분류할 수 있다.
구체적으로, 감염원은, 제1 감염원 내지 제3 감염원을 포함하며, 정제 데이터에서 감염자들의 감염원을 분류하여 분류 데이터를 획득하는 것은, 정제 데이터가 패턴과 숫자 키워드의 조합을 포함하는 경우 제1 감염원으로 분류하고, 국가명 키워드를 포함하는 경우 제2 감염원으로 분류하며, 집단명 또는 정의된 텍스트를 포함하는 경우 제3 감염원으로 분류하여 분류 데이터를 획득한다.
예를 들어, 대분류의 경우에 감염경로 정제가 "개인_#숫자"인 경우, 개인으로 분류하고, 감염경로 정제가 "해외 접촉 추정"인 경우, 해외로 분류하며, 감염경로 정제가 "집단명"인 경우, 집단으로 분류한다.
또한, 감염경로 정제가 "개인, 해외, 집단"으로 특정할 수 없는 경우, 불명으로 분류하며, 감염경로 정제가 "~확진자의 접촉자" 이거나 "가족" 일 경우, 미식별 개인으로 분류한다.
중분류의 경우에 개인으로 분류된 경우 일괄적으로 "식별"로 표기하며, 해외로 분류된 경우 "나라명"이 있을 경우, 해당 나라가 속하는 6대주 표기하고 "나라명"이 없을 경우, 공란으로 표기한다. 집단으로 분류된 경우 집단의 성격에 따라 "군부대", "금융", "기타", "대구 관련", "모임", "문화/예술", "물류센터", "미분류", "방문/다단계 판매", "병원", "상가/쇼핑몰", "요식업", "요양시설", "운동시설", "유흥", "종교", "주거단지", "직장", "집회", "콜센터", "학교/유치원", "학원"중 적어도 하나를 포함하여 표기할 수 있다.
불명으로 분류된 경우 불명의 성격에 따라 "감염원 정보 없음", "미식별단서정보", "유증상 확진자", "재확진자"중 적어도 하나를 포함하여 표기할 수 있다.
미식별 개인으로 분류된 경우 일괄적으로 "미식별확진자접촉"으로 표기할 수 있다.
소분류의 경우에 개인으로 분류된 경우, 일괄적으로 "전국번호"로 표기하고, 해외로 분류된 경우, "나라명"이 있을 경우, 해당 나라가 속하는 6대주 표기하고 "나라명"이 없을 경우, 공란으로 표기한다. 집단으로 분류된 경우 해당 집단과 관련된 환자 수가 10명 이상이고 집단명이 고유할 경우, 해당 "집단명"으로 표기하고, 이외는 "기타"로 표기하며, 도 12에 나타난 바와 같다.
구체적으로, 도 13의 (a)를 참조하면, 감염원 분류가 집단인 경우 발생경위에서 "해당 집단명(조직 및 시설)" 행은 "집단" 감염원으로 분류하고, 도 13의 (b)를 참조하면, 감염원 분류가 불명인 경우 발생경위에서 감염원이 불분명한 행은 "불명" 감염원으로 분류한다.
도 14는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 정제 테이블을 설명하기 위한 도면이다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 장치는 정제 데이터에서 감염자들의 감염원을 분류하여 분류 데이터를 획득하고, 감염 정보 테이블에 정제 데이터와 분류 데이터를 추가하여 정제 테이블을 생성한다.
감염원 소분류 이후, 완성된 "정제 테이블"은 도 14에 나타난 바와 같이 환자번호(301), 지자체(302), 확진일(303), 확진자 동선(304) 항목을 포함하는 감염 정보 테이블에서 "감염경로 정제"(305), "감염원 대분류"(306), "감염원 중분류"(307), "감염원 소분류"(308) 항목이 추가된 테이블이다.
도 15는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 분류 데이터를 예로 들어 나타낸 도면이다.
도 16 및 도 17은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 네트워크 테이블 구축을 설명하기 위한 도면이다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 장치는 정제 테이블을 이용하여 노드 테이블 및 링크 테이블을 포함하는 네트워크 테이블을 구축한다.
도 16은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 노드 테이블을 예로 들어 도시한 것이다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 장치는, 정제 테이블에 노드에 관한 항목을 추가하고, 노드에 관한 항목에 정제 데이터와 분류 데이터를 각 행(row) 데이터로 입력하여 노드 테이블을 생성한다.
구체적으로, 노드 테이블은 노드들의 속성 정보를 가지고 있는 테이블이며, 노드 테이블은 "노드명"(401), "지자체"(402), "확진일"(403), "확진자 동선"(404), "감염경로 정제"(405), "감염원 대분류"(406), "감염원 중분류"(407), "감염원 소분류"(408) 컬럼으로 구성된다.
"노드명"은 기존의 환자번호와 해외, 집단, 불명, 미식별 개인의 "대분류_중분류_소분류"으로 변환하여 입력한다.
구체적으로, “노드명”은 기존 환자번호를 이용하여 입력하고 기존 환자번호에 없는 개인 감염원은 정제 테이블의 “감염경로 정제”컬럼을 이용하여 입력하며, 카테고리 감염원(해외, 집단, 불명, 미식별 개인)을 “대분류_중분류_소분류” 변환하여 입력하게 된다.
해당 "노드명"에 대한 "지자체"외 6개 컬럼은 정제 테이블의 환자번호에 대응하여 입력, 존재하지 않는 컬럼은 공란으로 둔다.
예를 들어, 도 16에 나타난 바와 같이 노드명(401)에 정제 테이블의 환자번호(310)를 이용한 데이터(410)를 입력하고, 감염경로 정제의 개인(315)을 이용한 데이터(415)를 입력하며, 감염원 대분류, 중분류, 소분류(316)를 이용한 데이터(416)를 입력한다. 감염원 대분류, 중분류, 소분류(316)는 노드 테이블에 그대로 입력(417)한다.
도 17은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 링크 테이블을 예로 들어 도시한 것이다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 장치는, 소스 항목과 타겟 항목을 포함하는 항목들을 생성하고, 소스 항목에 정제 데이터와 분류 데이터를 각 행(row) 데이터로 입력하고, 타겟 항목에 감염 정보 항목 중 감염자 번호로 구분된 데이터 집합들을 각 행(row) 데이터로 입력하여 링크 테이블을 생성한다.
구체적으로, 링크 테이블은 노드들간의 연결정보를 가지고 있는 테이블이며, 링크 테이블은 "Source"(501), "Target"(502), "Weight"(503), "확진일"(504) 컬럼으로 구성된다.
"Source" 컬럼은 정제 테이블의 감염원 대분류가 "개인"일 경우, 정제 테이블의 감염경로 정제의 데이터가 입력되며 "해외", "집단", "불명", "미식별 개인"일 경우, 개인의 "대분류_중분류_소분류" 로 변환하여 입력된다.
"Target" 컬럼은 정제 테이블의 "환자번호"가 "개인_숫자"로 변환하여 입력된다.
예를 들어, 도 17에 나타난 바와 같이 정제 테이블의 환자번호 데이터들(320)을 이용하여 "Target" 컬럼의 데이터(520)를 입력하고, 감염경로 정제의 데이터(325)를 이용하여 "Source" 컬럼의 데이터(525)를 입력하며, 감염원 대분류, 중분류, 소분류 데이터(326)를 이용하여 "Source" 컬럼의 데이터(526)를 입력한다. "확진일" 컬럼(527)은 정제 테이블의 "확진일" 컬럼(327)을 그대로 입력한다.
도 18은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 네트워크 테이블을 설명하기 위한 도면이다.
도 18을 참조하면, 네트워크 테이블(600)은 노드 테이블(601) 및 링크 테이블(602)을 포함한다.
노드 테이블(601)은 항목(611)에 노드명, 지자체, 확진일, 확진자 동선, 감염경로 정제, 감염원 대분류, 감염원 중분류, 감염원 소분류를 포함한다.
링크 테이블(602)은 항목(612)에 Source, Target, Weight, 확진일을 포함한다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 장치는, 네트워크 테이블을 이용하여 제1 감염자의 감염원과 제2 감염자의 감염원을 분석하여 제1 감염자와 제2 감염자 간의 전염 관계를 분석한다.
구체적으로, 그래프 데이터(Graph data)를 생성하고 그래프 분석(Graph Analytics)(기존의 SNA 분석기법 등)을 적용하여, 그 결과를 머신 러닝(Machine Learning)에서 그래프 속성(graph feature)으로 활용하여 그래프 표현 학습 모델을 생성하여 전염 관계를 분석할 수 있다.
예를 들어, 링크 테이블의 소스 항목과 타켓 항목을 이용하여 소스 노드와 타겟 노드를 지정한다. 여기서, 소스 노드란 그래프를 모델링을 수행하고자 하는 제1 개체를 의미하며, 타겟 노드란 소스 노드와 상호 관련이 있을 것으로 생각되는 제2 개체를 의미한다. 소스 항목과 타겟 항목의 데이터의 집합에 포함된 데이터들 간의 조합에 따라 그래프를 모델링하고, 소스 노드와 타겟 노드를 연결하는 링크를 생성한다.
이후, 가중치 항목과 확진일 항목의 데이터들을 이용하여 소스 노드와 타겟 노드에 대해 속성값을 부여하고, 연결 가중치를 결정한다.
본 발명의 일 실시예에 따른 전염 네트워크 분석 장치는, 네트 워크 구성 시 노드를 개인 노드와 범주 노드로 종류를 구별한다.
여기서, 범주 노드는 예를 들면, 해외, 국내 집단 감염, 감염 불명으로 개인이 아닌 데이터들을 지칭한다.
이에 따라, 개인 노드-개인 노드, 범주 노드-개인 노드를 연결하는 링크가 생성된다.
범주 노드와 개인 노드를 구별하고, 개인-개인 링크, 범주-개인 링크를 나눌 수 있음에 따라, 노드나 링크 쿼리를 통해 필요한 링크만 이용하여 네트워크를 구성할 수 있다.
도 19 내지 도 22는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 데이터 전처리 과정을 설명하기 위한 도면이다.
도 19 및 도 20은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 데이터 전처리 과정에서 유형 별 데이터 셋 분리과정을 나타낸 것이다.
도 19를 참조하면, 유형 별 데이터 셋 분리과정은 먼저 전체 데이터에 셋의 OutDegree, OutReach, 차수(Adoption Time)를 추가 컬럼으로 지정하고, 각 노드별 OutDegree, OutReach, 차수(Adoption Time)를 계산한다.
여기서, OutDgree는 해당 노드가 직접 전파한 환자수, OutReach는 해당 노드가 직, 간접적으로 전파한 환자수, 차수는 최초 감염원으로부터의 연결 단계를 의미한다.
도 20을 참조하면, 이후, 유형별 데이터를 분류하며, 대분류를 통해 해외, 집단, 불명, 미식별 개인 유형별 데이터셋 분리하고, 시기별 분류를 통해 정부 방역 정책 및 특정 이벤트에 따라 데이터 셋을 분리한다.
도 21 및 도 22은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 데이터 전처리 과정에서 사전 지수 계산 및 Import 결과를 나타낸 것이다.
도 21을 참조하면, NetMiner 분석을 위해 유형 및 시기별로 전체 데이터 셋과 유형별 데이터셋을 Import한다. 이때, Python으로 자동으로 Import된다. 여기서, 유형별(해외, 집단, 불명, 미식별 개인별)로 파일이 생성이 되며 시기별로 WorkFile이 나누어진다.
도 22은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 데이터 전처리 과정에 따른 Import 결과를 나타낸 것이다.
도 23 내지 도 28은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 과정을 설명하기 위한 도면이다.
도 23은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 과정에서 하위 네트워크 분리과정을 나타낸 것이다.
하위 네트워크 분리과정은 Import된 전체 네트워크 데이터에서 ‘쿼리(Query)’ 기능을 활용하여 감염 유형(대분류) 별 하위 네트워크를 분리한다.
쿼리 기능으로 전체 확진자 중 ‘집단'감염원에서 시작된 1차, n차 감염자를 필터링하여 ‘집단’ 전염 네트워크를 분리한다.
도 24는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 과정에서 지수 계산 과정을 나타낸 것이다.
지수 계산 과정은 각 노드(환자) 별 네트워크 지수(직접 전염자 수, 직간접 전염자수, 감염 차수)를 측정한다.
구체적으로, [Analyze] - [Neighbor]-[Degree] 분석으로 각 노드(환자) 별 out-degree 즉, 직접 전염자 수를 측정하고, 이 값을 노드(환자)의 속성으로 추가한다.
이후, [Plug-ins]-[count reachable node] 플러그인을 활용하여 각 노드(환자) 별 직간접 전염자 수를 측정하고 노드 속성으로 추가한다.
이후, [Analyze]-[Diffusion]-[Linear Threshold]-[Process] 분석으로 집단(해외) 소분류를 기준으로 각 노드(환자)별 감염 차수를 계산하고 노드 속성으로 추가한다. 예를 들어, Adoption time = 0 → 기준 노드, Adoption time = 1 → 1차 감염자, Adoption time ≥ 2 → n차 감염자로 추가할 수 있다.
도 25는 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 과정에서 추출 과정을 나타낸 것이다.
추출 과정은 집단(해외) 소분류 별로 상세 네트워크를 분리하기 위해서, 집단(해외)을 기준으로 한 Adoption time(감염 차수)으로 집단(해외) 별 확진자 네트워크를 분리한다.
집단(해외) 별로 관련된 확진자는 Adoption Time 값이 1 이상이며, 관련이 없는 확진자는 값이 -1이므로 0 이상의 값으로 필터링 하여 집단(해외) 소분류 카테고리 노드와 관련된 확진자를 추출하여 집단(해외) 별 네트워크를 추출한다.
도 26은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 과정에서 시각화 과정을 나타낸 것이다.
시각화 과정은 각 집단(해외) 소분류 별 네트워크 시각화(Map)을 그린다.
예를 들어, 유/무전염자(1차 유전염자: 적색, 1차 무전염자: 회색), 감염 차수(n차 이상: 청색)에 따라 노드의 색을 다르게 표현한다.
여기서, 유전염자는 감염 차수(Adoption time)가 1이고, 직접전염자 수(Out-degree)가 1이상인 노드(환자), 무전염자는 감염 차수(Adoption time)가 1이고, 직접전염자 수(Out-degree)가 0인 노드(환자), n차 감염자는 감염 차수(Adoption time)이 2 이상인 노드(환자)이다.
도 27은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 과정에서 스크립트 활용 과정을 나타낸 것이다.
도 27을 참조하면, 코로나 분석 지수 계산 중 각 집단(해외) 소분류 카테고리 노드를 기준으로 'Adoption time(감염 차수)'을 구할 수 있다.
'Adoption time(감염 차수)'를 기준으로 집단(해외) 소분류 별 상세 네트워크 생성하고, 집단(해외) 소분류 별 상세 네트워크의 시각화 Map을 그린다.
이에 따라, 앞서 구한 결과 값이자 노드의 속성인 out-degree(직접감염자), Adoption time(감염 차수)을 이용하여 각 노드 별로 1차, n차/무전염자, 유전염자 구분이 가능하다.
도 28은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 과정에서 탐색 과정을 나타낸 것이다.
도 28을 참조하면, 먼저 시각화 결과에서 노드를 선택한 후 우클릭하여 [Node Property] 기능으로 노드의 속성(원본 데이터에서 수집한 속성 및 계산된 지수 속성) 및 네트워크 속성을 확인한다.
이후, 시각화 결과에서 '쿼리' 기능을 활용하여 특정 노드를 선택하여 노드, 링크 스타일을 변경한다.
이후, 시각화 결과에서 '노드'를 선택하여 선택된 노드의 이웃 노드 등을 선택할 수 있다.
도 29 내지 도 37은 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 결과를 설명하기 위한 도면이다.
도 29 및 도 30에 나타난 바와 같이, 본 발명의 일 실시예에 따른 전염 네트워크 분석 장치의 전염 관계 분석 결과에 따르면 코로나19 전염 네트워크의 전체 모습이 시각화되어 한 눈에 볼 수 있게 된다.
도 31을 참조하면, 최초 감염원(해외, 집단, 불명, 타시도)으로부터 이어진 환자들의 감염차수를 판별할 수 있다.
도 32는 감염 유형과 감염 차수 별 분포 및 소요일 수를 나타낸 것이다.
도 33을 참조하면, 최종적으로 1차부터 n차까지의 전염 관계 분석 결과를 확인할 수 있으며, 불명, 집단, 타지역, 해외로 구분할 수 있다.
상기 도 29에 나타난 바와 같이 코로나19의 전염 네트워크의 특성을 살펴보면 먼저 이 네트워크가 여러 개의 클러스터로 조각나 있음을 확인할 수 있다.
그리고 도 34에 나타난 바와 같이, 각 클러스터는 다시 '해외 유입'/'집단 감염'/'감염원 불명' 등 3가지의 감염원으로부터 감염된 '1차 감염자'와 다시 이들로부터 직간접적으로 감염된 'n차 감염자'들로 구성되어 있다. 따라서 이 두 가지 요인의 조합에 의해 전체 확진자를 6개 부문으로 구분할 수 있다.
참고로, 이 중에서 'n차 감염 네트워크' 부분은 기존의 '감염원 불명'이라는 의미에서의 '깜깜이 감염'과 구별되는 또다른 '깜깜이' 영역('전파 체인 깜깜이')의 새로운 발견이라고 할 수 있다.
부문별 시기별 감염자 수의 결정 요인을 분해해 보기 위해 총 감염자(T) = 1차 감염자(P) x (1 + 'n차 감염률'(Rn)) 등식('TPR 등식')을 6개 영역에 대해 적용하여 분석해보면 최초의 감염원이 '해외 유입'/'집단 감염'/'감염원 불명' 중 어느 것이냐에 따라 그 이후 전염이 확산되는 양상이 판이하게 다르다는 것을 확인할 수 있다. 그 차이를 잘 드러내 주는 지수는 'n차 감염률'이다. 특정 감염원으로 100명의 1차 감염자가 발생했을 때 사회적 네트워크가 몇 명의 n차 감염자를 추가로 생성시키는가를 나타내는 지수이다.
도 35는 감염 확진자 수의 변동 그래프를 나타낸 것이다.
수도권 1차 확산은 해외 유입 감염으로부터 발생한 n차 감염에서 방역 정책(내외국인 입국자 전원 2주 자가격리의무화)으로 통제됨을 확인할 수 있다.
수도권 2차 확산은 사회적 거리두기 1단계(생활 속 거리두기) 전환에서 방역 정책 완화에 따른 집단 감염 발발로 지역사회 n차 감염 증가됨을 확인할 수 있다.
수도권 3차 확산은 대규모 집단 감염에서 n차 감염과 감염원 불명의 후속 발생(집단 감염 → 개인 간 감염 → 새로운 집단 감염)됨을 확인할 수 있다.
도 36은 감염 확진자 수의 유형별 인원수와 비율을 나타낸 것이다.
도 37은 감염 확진자 수의 유형별 분석 결과를 나타낸 것이다.
본 발명의 또 다른 실시예에 따르면, 전염 네트워크 분석 방법에 따른 각각의 단계를 수행하는 명령어를 포함하는 프로그램이 기록된 컴퓨터 판독 가능 기록매체를 제공한다.
이러한 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(Floptical disk)와 같은 자기-광매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상의 설명은 본 발명의 일 실시예에 불과할 뿐, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명의 본질적 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현할 수 있을 것이다. 따라서 본 발명의 범위는 전술한 실시예에 한정되지 않고 특허 청구 범위에 기재된 내용과 동등한 범위 내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.
10: 전염 네트워크 분석 장치
11: 프로세서
12: 메모리

Claims (13)

  1. 전염 네트워크 분석 장치의 전염 네트워크 분석 방법에 있어서,
    감염자들의 감염 정보가 포함된 복수의 원본 데이터들을 수집하여 감염 정보 테이블을 생성하는 단계;
    상기 감염 정보 테이블에서 상기 감염 정보 중 일부를 기 설정된 정제 옵션에 따라 필터링하여 정제 데이터를 획득하는 단계;
    획득한 상기 정제 데이터에서 상기 감염자들의 감염원을 분류하여 분류 데이터를 획득하고, 상기 감염 정보 테이블에 상기 정제 데이터와 상기 분류 데이터를 추가하여 정제 테이블을 생성하는 단계;
    상기 정제 테이블을 이용하여 노드 테이블 및 링크 테이블을 포함하는 네트워크 테이블을 구축하는 단계; 및
    상기 네트워크 테이블을 이용하여 생성된 네트워크 데이터에서, 제1 감염자의 감염원과 제2 감염자의 감염원을 분석하여 상기 제1 감염자와 제2 감염자 간의 전염 관계를 분석하는 단계;를 포함하고,
    상기 네트워크 데이터는, 상기 네트워크 테이블에서 개인 노드들과 해외, 국내 집단 감염, 감염 불명 중 적어도 하나를 포함하는 범주 노드들을 구별하여 선택하여, 상기 개인 노드들 중 제1 개인 노드와 제2 개인 노드를 연결한 제1 링크, 상기 개인 노드들 중 어느 하나와 상기 범주 노드들 중 어느 하나를 연결한 제2 링크를 포함하여 구성되고,
    상기 제1 감염자와 제2 감염자 간의 전염 관계를 분석하는 단계는,
    상기 제1 링크와 상기 제2 링크 각각 네트워크 지수를 측정하여, 직접 감염 또는 감염 차수에 대한 결과를 속성값으로 부여함에 따라 생성된 네트워크 속성에 기초하여, 상기 제1 감염자의 감염원에 대응되는 노드와 상기 제2 감염자의 감염원에 대응되는 노드 사이의 네트워크 속성에 따라 전염 관계 분석 결과를 확인하는 전염 네트워크 분석 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 복수의 원본 데이터들은, 지역별로 마련되는 데이터인 전염 네트워크 분석 방법.
  4. 제1항에 있어서,
    상기 감염 정보 테이블을 생성하는 단계는, 적어도 하나의 감염 정보 항목에 따라 상기 감염 정보들을 구분하여 감염 정보 테이블을 생성하는 전염 네트워크 분석 방법.
  5. 제4항에 있어서,
    상기 감염 정보 항목은, 발생 경위와 감염자 번호를 포함하고, 연번, 지역명, 확진일, 감염자 거주지, 격리 병원 및 감염자 동선 중 적어도 하나를 더 포함하는 전염 네트워크 분석 방법.
  6. 제4항에 있어서,
    상기 감염 정보 중 일부를 기 설정된 정제 옵션에 따라 필터링하여 정제 데이터를 획득하는 단계는,
    상기 감염 정보 항목 중 발생 경위로 구분된 데이터 집합들을 상기 정제 옵션에 따라 필터링하여 정제 데이터를 획득하는 전염 네트워크 분석 방법.
  7. 제6항에 있어서,
    상기 정제 옵션은, 제1 정제 옵션 내지 제3 정제 옵션을 포함하며,
    상기 제1 정제 옵션은, 패턴과 숫자 키워드를 조합하여 생성한 옵션이고, 상기 제2 정제 옵션은, 국가명 키워드를 포함하여 생성한 옵션이며, 상기 제3 정제 옵션은, 집단명 또는 정의된 텍스트를 포함하여 생성한 옵션인 전염 네트워크 분석 방법.
  8. 제6항에 있어서,
    상기 감염원은, 제1 감염원 내지 제3 감염원을 포함하며,
    상기 정제 데이터에서 상기 감염자들의 감염원을 분류하여 분류 데이터를 획득하는 것은, 상기 정제 데이터가 패턴과 숫자 키워드의 조합을 포함하는 경우 제1 감염원으로 분류하고, 국가명 키워드를 포함하는 경우 제2 감염원으로 분류하며, 집단명 또는 정의된 텍스트를 포함하는 경우 제3 감염원으로 분류하여 분류 데이터를 획득하는 것인 전염 네트워크 분석 방법.
  9. 제6항에 있어서,
    상기 네트워크 테이블을 구축하는 단계는, 상기 정제 테이블에 노드에 관한 항목을 추가하고, 상기 노드에 관한 항목에 상기 정제 데이터와 상기 분류 데이터를 각 행(row) 데이터로 입력하여 노드 테이블을 생성하는 단계를 포함하는 전염 네트워크 분석 방법.
  10. 제6항에 있어서,
    상기 네트워크 테이블을 구축하는 단계는, 소스 항목과 타겟 항목을 포함하는 항목들을 생성하고, 상기 소스 항목에 상기 정제 데이터와 상기 분류 데이터를 각 행(row) 데이터로 입력하고, 상기 타겟 항목에 상기 감염 정보 항목 중 감염자 번호로 구분된 데이터 집합들을 각 행(row) 데이터로 입력하여 링크 테이블을 생성하는 단계;를 포함하는 전염 네트워크 분석 방법.
  11. 삭제
  12. 전염 네트워크 분석 장치에 있어서,
    메모리; 및
    적어도 하나의 프로세서;를 포함하며,
    상기 프로세서는, 감염자들의 감염 정보가 포함된 복수의 원본 데이터들을 수집하여 감염 정보 테이블을 생성하고, 상기 감염 정보 테이블에서 상기 감염 정보 중 일부를 기 설정된 정제 옵션에 따라 필터링하여 정제 데이터를 획득하며, 획득한 상기 정제 데이터에서 상기 감염자들의 감염원을 분류하여 분류 데이터를 획득하고, 상기 감염 정보 테이블에 상기 정제 데이터와 상기 분류 데이터를 추가하여 정제 테이블을 생성하고, 상기 정제 테이블을 이용하여 노드 테이블 및 링크 테이블을 포함하는 네트워크 테이블을 구축하고, 상기 네트워크 테이블을 이용하여 제1 감염자의 감염원과 제2 감염자의 감염원을 분석하여 상기 제1 감염자와 제2 감염자 간의 전염 관계를 분석하며,
    네트워크 데이터는, 상기 네트워크 테이블에서 개인 노드들과 해외, 국내 집단 감염, 감염 불명 중 적어도 하나를 포함하는 범주 노드들을 구별하여 선택하여, 상기 개인 노드들 중 제1 개인 노드와 제2 개인 노드를 연결한 제1 링크, 상기 개인 노드들 중 어느 하나와 상기 범주 노드들 중 어느 하나를 연결한 제2 링크를 포함하여 구성되고,
    상기 프로세서는, 상기 제1 링크와 상기 제2 링크 각각 네트워크 지수를 측정하여, 직접 감염 또는 감염 차수에 대한 결과를 속성값으로 부여함에 따라 생성된 네트워크 속성에 기초하여, 상기 제1 감염자의 감염원에 대응되는 노드와 상기 제2 감염자의 감염원에 대응되는 노드 사이의 네트워크 속성에 따라 전염 관계 분석 결과를 확인하는 전염 네트워크 분석 장치.
  13. 제1항, 제3항 내지 제10항 중 어느 한 항에 기재된 방법에 따른 각각의 단계를 수행하는 명령어를 포함하는 프로그램이 기록된 컴퓨터 판독 가능 기록매체.
KR1020200154301A 2020-11-18 2020-11-18 전염병의 전염 네트워크 분석 방법 및 장치 KR102282830B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200154301A KR102282830B1 (ko) 2020-11-18 2020-11-18 전염병의 전염 네트워크 분석 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200154301A KR102282830B1 (ko) 2020-11-18 2020-11-18 전염병의 전염 네트워크 분석 방법 및 장치

Publications (1)

Publication Number Publication Date
KR102282830B1 true KR102282830B1 (ko) 2021-07-29

Family

ID=77127573

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200154301A KR102282830B1 (ko) 2020-11-18 2020-11-18 전염병의 전염 네트워크 분석 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102282830B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113539514A (zh) * 2021-08-31 2021-10-22 重庆工商大学 一种多维度精细粒度疫情数据自动采集方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140034994A (ko) * 2012-09-11 2014-03-21 고려대학교 산학협력단 소셜 네트워크 서비스 데이터에 기반한 질병 확산 상황 예측 장치 및 방법
KR20180019832A (ko) * 2016-08-17 2018-02-27 (주)이지팜 사회 연결망 그래프 기반 농축산물 질병 정보 시각화 장치 및 방법
KR20190039758A (ko) * 2016-10-25 2019-04-15 가부시끼가이샤 히다치 세이사꾸쇼 데이터 분석 지원 장치 및 데이터 분석 지원 시스템
KR102140096B1 (ko) 2019-09-20 2020-07-31 한국과학기술정보연구원 전염병확산예측장치 및 그 동작 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140034994A (ko) * 2012-09-11 2014-03-21 고려대학교 산학협력단 소셜 네트워크 서비스 데이터에 기반한 질병 확산 상황 예측 장치 및 방법
KR20180019832A (ko) * 2016-08-17 2018-02-27 (주)이지팜 사회 연결망 그래프 기반 농축산물 질병 정보 시각화 장치 및 방법
KR20190039758A (ko) * 2016-10-25 2019-04-15 가부시끼가이샤 히다치 세이사꾸쇼 데이터 분석 지원 장치 및 데이터 분석 지원 시스템
KR102140096B1 (ko) 2019-09-20 2020-07-31 한국과학기술정보연구원 전염병확산예측장치 및 그 동작 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113539514A (zh) * 2021-08-31 2021-10-22 重庆工商大学 一种多维度精细粒度疫情数据自动采集方法及系统

Similar Documents

Publication Publication Date Title
JP5904559B2 (ja) シナリオ生成装置、及びそのためのコンピュータプログラム
CN107251024A (zh) 用于诊断执行问题的数据库查询执行跟踪和数据生成
CN112599253B (zh) 根据密接图谱确定疫情传播路径方法、装置、设备和介质
JP7103496B2 (ja) 関連スコア算出システム、方法およびプログラム
JP2015121896A (ja) フレーズペア収集装置、及びそのためのコンピュータプログラム
JP2016031733A (ja) 推論容易性算出プログラム、装置、及び方法
KR102282830B1 (ko) 전염병의 전염 네트워크 분석 방법 및 장치
JP2015121895A (ja) 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム
Ronzhyn et al. Literature review of ethical concerns in the use of disruptive technologies in government 3.0
JP6419667B2 (ja) テストdbデータ生成方法及び装置
Lukas et al. The potential to infer the historical pattern of cultural macroevolution
Mirel et al. A methodological assessment of privacy preserving record linkage using survey and administrative data
Hsiang et al. COVID-19 testing capabilities at urgent care centers in states with greatest disease burden
Mogtaba et al. Association rule hiding for privacy preserving data mining
Chala Data mining technology enabled anti retroviral therapy (ART) for HIV positive patients in gondar university hospital, Ethiopia
Shanbehzadeh et al. Developing a Minimum Dataset for a Mobile-based Contact Tracing System for the COVID-19 Pandemic
Berkani Decision support based on optimized data mining techniques: Application to mobile telecommunication companies
Li et al. Identify treatment effect patterns for personalised decisions
Aburas et al. Child maltreatment forecast using Bigdata intelligent approaches
Fedeli et al. Privacy preserving survival prediction
Wright et al. Workplace hazards and health among informally employed domestic workers in 14 cities, United States, 2011–2012: Using four approaches to characterize workers’ patterns of exposures
Sleeman et al. Temporal discovery workbench: a case study with icu patient datasets
Guiyab Development of prediction models for the dengue survivability prediction: An integration of data mining and decision support system
Carrasco-Escobar et al. Effect of out-of-village working activities on recent malaria exposure in the Peruvian Amazon using parametric g-formula
Balcells et al. SARS-CoV-2 epidemiological model based on socio-economic variables in Switzerland

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant