KR20210036756A - 미세먼지 농도 추정 시스템, 방법 및 컴퓨터 프로그램 - Google Patents

미세먼지 농도 추정 시스템, 방법 및 컴퓨터 프로그램 Download PDF

Info

Publication number
KR20210036756A
KR20210036756A KR1020190119190A KR20190119190A KR20210036756A KR 20210036756 A KR20210036756 A KR 20210036756A KR 1020190119190 A KR1020190119190 A KR 1020190119190A KR 20190119190 A KR20190119190 A KR 20190119190A KR 20210036756 A KR20210036756 A KR 20210036756A
Authority
KR
South Korea
Prior art keywords
fine dust
data
real
concentration
time
Prior art date
Application number
KR1020190119190A
Other languages
English (en)
Other versions
KR102317207B1 (ko
Inventor
임정호
박서희
김상민
윤종민
김상균
Original Assignee
울산과학기술원
대한민국 (관리부서 : 환경부 국립환경과학원장)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울산과학기술원, 대한민국 (관리부서 : 환경부 국립환경과학원장) filed Critical 울산과학기술원
Priority to KR1020190119190A priority Critical patent/KR102317207B1/ko
Publication of KR20210036756A publication Critical patent/KR20210036756A/ko
Application granted granted Critical
Publication of KR102317207B1 publication Critical patent/KR102317207B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/02Devices for withdrawing samples
    • G01N1/22Devices for withdrawing samples in the gaseous state
    • G01N1/2273Atmospheric sampling
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/02Investigating particle size or size distribution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W2201/00Weather detection, monitoring or forecasting for establishing the amount of global warming

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Strategic Management (AREA)
  • Biochemistry (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Economics (AREA)
  • Analytical Chemistry (AREA)
  • General Business, Economics & Management (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Dispersion Chemistry (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 일 실시예에 따르면, 실시간 미세먼지 데이터를 획득하는 실시간 데이터 획득부; 상기 수집된 실시간 미세먼지 데이터를 오버샘플링 또는 서브샘플링하고, 고농도 및 저농도 샘플의 비율을 조정하여 샘플링 데이터를 생성하는 샘플링부; 상기 샘플링 데이터에 기초하여 미세먼지 추정 모델을 설계하는 모델 설계부; 상기 설계된 모델을 현장 관측소 기반 데이터를 이용하여 검증하는 검증부; 를 포함하는 실시간 미세먼지 농도 추정 시스템이 제공된다.

Description

미세먼지 농도 추정 시스템, 방법 및 컴퓨터 프로그램{METHOD, SYSTEM AND COMPUTER PROGRAM FOR ESTIMATING FINE DUST CONCENTRATION}
본 발명은 전천에서의 지상 미세먼지 농도 추정 시스템, 방법 및 컴퓨터에 관한 것으로, 보다 상세하게는 실시간 학습 기반 지상 미세먼지 농도 추정 및 전천에서의 미세먼지 농도 추정 모델을 제공할 수 있는 미세먼지 농도 추정 시스템, 방법 및 컴퓨터 프로그램에 관한 것이다.
먼지란 대기 중에 떠다니거나 흩날려 내려오는 입자상 물질을 말하는데, 석탄, 석유 등의 화석연료를 태울 때나 공장, 자동차 등의 배출가스에서 많이 발생한다.
먼지는 입자의 크기에 따라 50μm 이하인 총먼지(TSP, Total Suspended Particles)와 입자크기가 매우 작은 미세먼지(PM, Particulate Matter)로 구분한다. 미세먼지는 다시 지름이 10μm보다 작은 미세먼지(PM10)와 지름이 2.5μm보다 작은 미세먼지(PM2.5)로 나뉜다. PM10이 사람의 머리카락 지름(50~70μm)보다 약 1/5~1/7 정도로 작은 크기라면, PM2.5는 머리카락의 약 1/20~1/30에 불과할 정도로 매우 작다.
이처럼 미세먼지는 눈에 보이지 않을 만큼 매우 작기 때문에 대기 중에 머물러 있다 호흡기를 거쳐 폐 등에 침투하거나 혈관을 따라 체내로 이동하여 들어감으로써 건강에 나쁜 영향을 미칠 수도 있다. 따라서 미세먼지 농도를 측정하기 위한 방법들이 연구되고 있다.
본 발명은 실시간으로 미세먼지 데이터를 획득 및 샘플링하여 지상 미세먼지 농도를 추정하는 것을 일 목적으로 한다.
또한, 본 발명은 전천에서의 지상 미세먼지 농도를 추정하는 것을 다른 목적으로 한다.
본 발명의 일 실시예에 따르면, 실시간 미세먼지 데이터를 획득하는 실시간 데이터 획득부; 상기 획득된 실시간 미세먼지 데이터를 오버샘플링 또는 서브샘플링하고, 고농도 및 저농도 샘플의 비율을 조정하여 최적의 훈련 데이터를 생성하는 샘플링부; 상기 샘플링된 훈련 데이터에 기초하여 미세먼지 추정 모델을 설계하는 모델 설계부; 상기 설계된 모델을 현장 관측소 기반 데이터를 이용하여 검증하는 검증부; 를 포함하는 실시간 미세먼지 농도 추정 시스템이 제공된다.
본 발명에 있어서, 상기 실시간 미세먼지 데이터는 위성 데이터, 수치 모델 데이터 또는 보조변수 데이터일 수 있다.
본 발명에 있어서, 상기 위성 데이터는 표준화 차이 식생 지수, 에어로졸 광학 깊이, 단일 산란 알비도, 옹스트롱 지수, 강수량, 태양 방사선, 도시지역 비율 등과 같이 에어로졸 관련 변수 및 에어로졸의 변화에 영향을 끼칠 수 있는 변수들 중 하나 이상의 항목을 포함할 수 있다.
본 발명에 있어서, 상기 수치 모델 데이터는 온도, 이슬점 온도, 상대습도, 최대 풍속, 행성 경계층 높이, 지면 위 가시 높이 등 기상학 변수들 중 하나 이상의 항목을 포함할 수 있다.
본 발명에 있어서, 상기 샘플링부는, 상기 실시간 미세먼지 데이터의 농도분포와 누적되는 시간 등에 기초하여, 샘플이 기설정된 값보다 부족한 구간에 대해 오버 샘플링을 수행하고, 샘플이 기설정된 값보다 많은 구간에 대하여 서브 샘플링을 수행할 수 있다.
본 발명에 있어서, 상기 고농도 기준치는 기준은 PM10 의 경우 150㎍/m3, PM2.5의 경우 80㎍/m3일 수 있다.
본 발명에 있어서, 상기 미세먼지 추정 모델은 랜덤 포레스트(random forest) 기법을 이용하여 설계될 수 있다.
또한, 본 발명의 일 실시예에 따르면, 메모리; 및 프로세서; 를 포함하는 실시간 미세먼지 농도 추정 시스템에 있어서, 상기 프로세서는, 실시간 미세먼지 데이터를 획득하는 실시간 데이터 획득부; 상기 획득된 실시간 미세먼지 데이터를 오버샘플링 또는 서브샘플링하고, 고농도 및 저농도 샘플의 비율을 조정하여 샘플링 데이터를 생성하는 샘플링부; 상기 샘플링 데이터에 기초하여 미세먼지 추정 모델을 설계하는 모델 설계부; 상기 설계된 모델을 현장 관측소 기반 데이터를 이용하여 검증하는 검증부; 를 포함하는 실시간 미세먼지 농도 추정 시스템이 제공된다.
또한, 본 발명의 일 실시예에 따르면, 실시간 미세먼지 데이터를 획득하는 실시간 데이터 획득 단계; 상기 획득된 실시간 미세먼지 데이터를 오버샘플링 또는 서브샘플링하고, 고농도 및 저농도 샘플의 비율을 조정하여 샘플링 데이터를 생성하는 샘플링 단계; 상기 샘플링 데이터에 기초하여 미세먼지 추정 모델을 설계하는 모델 설계 단계; 상기 설계된 모델을 현장 관측소 기반 데이터를 이용하여 검증하는 검증 단계; 를 포함하는 실시간 미세먼지 농도 추정 방법이 제공된다.
본 발명에 있어서, 상기 실시간 미세먼지 데이터는 위성 데이터, 수치 모델 데이터 또는 보조변수 데이터일 수 있다.
본 발명에 있어서, 상기 위성 데이터는 표준화 차이 식생 지수, 에어로졸 광학 깊이, 단일 산란 알비도, 옹스트롱 지수, 강수량, 태양 방사선, 도시지역 비율 등과 같이 에어로졸 관련 변수 및 에어로졸의 변화에 영향을 끼칠 수 있는 변수들 중 하나 이상의 항목을 포함할 수 있다.
본 발명에 있어서, 상기 수치 모델 데이터는 온도, 이슬점 온도, 상대습도, 최대 풍속, 행성 경계층 높이, 지면 위 가시 높이 등 기상학 변수들 중 하나 이상의 항목을 포함할 수 있다.
본 발명에 있어서, 상기 샘플링 단계는, 상기 실시간 미세먼지 데이터의 농도분포에 기초하여, 샘플이 기설정된 값보다 부족한 구간에 대해 오버 샘플링을 수행하고, 샘플이 기설정된 값보다 많은 구간에 대하여 서브 샘플링을 수행할 수 있다.
본 발명에 있어서, 상기 고농도 기준치는 기준은 PM10 의 경우 150㎍/m3, PM2.5의 경우 80㎍/m3인, 실시간 미세먼지 농도 추정 방법.
본 발명에 있어서, 상기 미세먼지 추정 모델은 랜덤 포레스트(random forest) 기법을 이용하여 설계될 수 있다.
추가적으로, 본 발명에 따른 방법을 실행하기 위한 컴퓨터 판독가능기록매체에 기록된 컴퓨터 프로그램이 제공된다.
본 발명에 의하면, 실시간으로 미세먼지 데이터를 획득 및 샘플링하여 정확도가 향상된 지상 미세먼지 농도 추정 모델을 제공할 수 있다.
또한, 본 발명에 의하면, 구름 여부에 관계없이 지상 미세먼지 농도 추정이 가능한 전천에서의 지상 미세먼지 농도 추정 모델을 제공할 수 있다.
도 1 은 본 발명의 일 실시예에 따른 미세먼지 농도 추정 시스템의 구성을 나타낸 도면이다.
도 2 는 본 발명의 일 실시예에 따르면 서버의 내부 구성을 설명하기 위한 블록도이다.
도 3 은 본 발명의 일 실시예에 따른 미세먼지 농도 추정 시스템의 프로세서의 내부 구성을 나타낸 것이다.
도 4 는 본 발명의 일 실시예에 따른 실시간 미세먼지 농도 추정 방법을 나타낸 순서도이다.
도 5 는 기존의 오프라인 학습 기반 미세먼지 추정 모델의 결과를 예시한 것이다.
도 6 은 본 발명의 일 실시예에 따른 교차검증 결과를 나타낸 것이다.
도 7 은 본 발명의 일 실시예에 따른 전천에서의 미세먼지 농도 추정 방법을 나타낸 순서도이다.
도 8 은 본 발명의 일 실시예에 따른 제1 알고리즘 수행 결과를 나타낸 것이다.
도 9 는 본 발명의 일 실시예에 따른 지상 미세먼지 농도 추정 결과를 나타낸 그래프이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이러한 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 본 명세서에 기재되어 있는 특정 형상, 구조 및 특성은 본 발명의 정신과 범위를 벗어나지 않으면서 일 실시예로부터 다른 실시예로 변경되어 구현될 수 있다. 또한, 각각의 실시예 내의 개별 구성요소의 위치 또는 배치도 본 발명의 정신과 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 행하여지는 것이 아니며, 본 발명의 범위는 특허청구범위의 청구항들이 청구하는 범위 및 그와 균등한 모든 범위를 포괄하는 것으로 받아들여져야 한다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 구성요소를 나타낸다.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 여러 실시예에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1 은 본 발명의 일 실시예에 따른 동영상 수평 조정 시스템의 구성을 나타낸 도면이다.
도 1 을 참조하면, 본 발명의 일 실시예에 따른 동영상 수평 조정 시스템을 개시하고 있다. 본 발명의 동영상 수평 조정 시스템은 관리자 단말(100), 서버(200) 및 사용자 단말(300)을 포함한다.
먼저, 본 발명의 일 실시예에 따른 관리자 단말(100) 및 사용자 단말(300)은 각각 관리자 및 사용자가 사용하는 단말일 수 있다. 단말은 PC(personal computer), 노트북 컴퓨터(laptop computer), 스마트폰(smart phone), 태블릿(tablet), 웨어러블 컴퓨터(wearable computer) 등을 포함하여, 서비스 서버(200)와 관련된 웹/모바일 사이트의 접속 또는 서비스 전용 어플리케이션의 설치 및 실행이 가능한 모든 단말 장치를 의미할 수 있다. 예를 들어, 시청자 단말(300)은 스마트폰이거나 혹은 HMD(Head Mounted Display)일 수 있다. 이때, 단말은 웹/모바일 사이트 또는 전용 어플리케이션의 제어 하에 서비스 화면 구성, 데이터 입력, 데이터 송수신, 데이터 저장 등 서비스 전반의 동작을 수행할 수 있다.
보다 상세히, 본 발명의 관리자 단말(100)은 서버(200)에 데이터 또는 명령을 전달할 수 있다. 특히, 관리자 단말(100)은 후술할 위성 데이터, 수치 모델 데이터 등 미세먼지 농도 추정에 필요한 데이터들을 서버(200)에 전송할 수 있다. 더불어, 관리자 단말(100)은 서버(200)의 각 구성들이 본 발명의 목적에 맞게 동작할 수 있도록 명령을 전달할 수 있다. 또한, 본 발명의 사용자 단말(300)은 서버(200)에 지상 미세먼지 농도 추정 결과를 요청하고, 본 발명에 따른 지상 미세먼지 농도 추정 결과를 획득할 수 있다.
본 발명의 일 실시예에 따른 서버(200)는 지상 미세먼지 농도 추정을 수행한다. 보다 상세히, 서버(200)는 실시간으로 미세먼지 데이터를 획득 및 샘플링하여 지상 미세먼지 농도를 추정하거나, 전천에서의 지상 미세먼지 농도를 추정할 수 있다. 서버(200)는 관리자 단말(100) 및 사용자 단말(300)과 네트워크를 통해 통신하여 명령, 코드, 파일, 컨텐츠, 서비스 등을 제공하는 컴퓨터 장치 또는 복수의 컴퓨터 장치들로 구현될 수 있다. 서버(200)의 구체적인 동작에 대해서는 이하에서 살펴보기로 한다.
도 2 는 본 발명의 일 실시예에 따르면 서버의 내부 구성을 설명하기 위한 블록도이다.
본 실시예에 따른 서버(200)는 프로세서(210), 버스(220), 네트워크 인터페이스(230) 및 메모리(240)를 포함할 수 있다. 메모리(240)는 운영체제(241) 및 서비스 제공 루틴(242)을 포함할 수 있다. 다른 실시예들에서 서버(200)는 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다.
메모리(240)는 컴퓨터에서 판독 가능한 기록 매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 비소멸성 대용량 기록장치(permanent mass storage device)를 포함할 수 있다. 또한, 메모리(240)에는 운영체제(241)와 서비스 제공 루틴(242)을 위한 프로그램 코드가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 드라이브 메커니즘(drive mechanism, 미도시)을 이용하여 메모리(240)와는 별도의 컴퓨터에서 판독 가능한 기록 매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록 매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록 매체(미도시)를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록 매체가 아닌 네트워크 인터페이스(230)를 통해 메모리(240)에 로딩될 수도 있다.
버스(220)는 서버(200)의 구성요소들간의 통신 및 데이터 전송을 가능하게 할 수 있다. 버스(220)는 고속 시리얼 버스(high-speed serial bus), 병렬 버스(parallel bus), SAN(Storage Area Network) 및/또는 다른 적절한 통신 기술을 이용하여 구성될 수 있다.
네트워크 인터페이스(230)는 서버(200)를 컴퓨터 네트워크에 연결하기 위한 컴퓨터 하드웨어 구성요소일 수 있다. 네트워크 인터페이스(230)는 서버(200)를 무선 또는 유선 커넥션을 통해 컴퓨터 네트워크에 연결시킬 수 있다.
프로세서(210)는 기본적인 산술, 로직 및 서버(200)의 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(240) 또는 네트워크 인터페이스(230)에 의해, 그리고 버스(220)를 통해 프로세서(210)로 제공될 수 있다. 프로세서(210)는 프로그램 코드를 실행하도록 구성될 수 있다. 이러한 프로그램 코드는 메모리(240)와 같은 기록 장치에 저장될 수 있다.
도 3 은 본 발명의 일 실시예에 따른 동영상 수평 조정 시스템의 프로세서의 내부 구성을 나타낸 것이다.
도 3 을 참조하면, 본 발명의 일 실시예에 따른 프로세서(210)는 실시간 미세먼지 추정부(310) 및 전천 미세먼지 추정부(320)를 포함할 수 있다. 또한, 실시간 미세먼지 추정부(310)는 실시간 데이터 획득부(311), 샘플링부(312), 모델 설계부(313) 및 검증부(314)를 포함할 수 있다. 또한, 전천 미세먼지 추정부(320)는 데이터 획득부(321), AOD 추정부(322), 미세먼지 농도 추정부(323) 및 검증부(324)를 포함할 수 있다. 실시예에 따라 프로세서(210)의 구성요소들은 선택적으로 프로세서(210)에 포함되거나 제외될 수도 있다. 또한, 실시예에 따라 프로세서(210)의 구성요소들은 프로세서(210)의 기능의 표현을 위해 분리 또는 병합될 수도 있다.
여기서, 프로세서(210)의 구성요소들은 서버(200)에 저장된 프로그램 코드가 제공하는 명령에 따라 프로세서(210)에 의해 수행되는 프로세서(210)의 서로 다른 기능들(different functions)의 표현들일 수 있다. 이러한 프로세서(210) 및 프로세서(210)의 구성요소들은 도 4 및 도 7 의 미세먼지 농도 추정 방법이 포함하는 단계들을 수행하도록 서버(200)를 제어할 수 있다.
한편, 미세먼지는 눈에 보이지 않을 정도로 입자가 작은 먼지이다. 아황산가스, 질소 산화물, 납, 오존, 일산화 탄소 등을 포함하는 대기오염 물질로 자동차, 공장 등에서 발생하여 대기 중 장기간 떠다니는 입경 10μm 이하의 미세한 먼지이며, PM10이라고도 한다. 입자가 2.5μm 이하인 경우는 PM 2.5라고 쓰며 '초미세먼지' 또는 '극미세먼지' 라고도 부른다. 학술적으로는 에어로졸(aerosol)이라고 지칭되기도 한다.
본 발명의 프로세서(210)는 실시간 학습에 기반한 지상 미세먼지 농도 추정 방법 및 시스템을 수행 및 구현할 수 있다. 기존의 미세먼지 농도 측정은 오프라인 학습 기반으로 수행되었고, 예측 정확도가 낮다는 한계가 있었다. 그러나, 본 발명의 실시간 학습 기반 미세먼지 농도 추정 방법은 실시간으로 데이터를 학습시키는 방법을 사용하여, 기존 미세먼지 측정 모델과 비교하였을 때 정확도가 향상된 모델을 제공할 수 있다.
또한, 본 발명의 프로세서(210)는 전천에서의 지상 미세먼지 농도 추정 방법 및 시스템 수행 및 구현할 수 있다. 지상에서의 미세먼지 농도를 추정할 때, 위성 기반 자료를 사용하는 것이 일반적이나 이 경우 가장 큰 단점은 구름이 존재할 때 구름에 가린 위성 기반 산출물의 정보를 제공하지 않아 구름 밑의 지상 미세먼지 농도를 추정할 수 없다는 문제점이 있었다. 본원 발명은 이와 같은 문제점을 해결하기 위해, 미세먼지 측정에 있어 가장 중요한 변수인 위성 기반 AOD(Aerosol Optical Depth)를 구름이 존재할 때로 모의하여 전천에서도 지상 미세먼지 농도를 추정할 수 있는 알고리즘을 제공할 수 있다. 본 발명의 미세먼지 추정 모델은 구름이 존재할 때도 미세먼지 측정을 정확하게 할 수 있으므로, 맑은 날에 대해서만 고려하여 미세먼지 측정 모델을 구축한 경우와 유사한 정확도를 낼 수 있다.
도 4 는 본 발명의 일 실시예에 따른 실시간 미세먼지 농도 추정 방법을 나타낸 순서도이다.
이하에서는, 먼저 도 3 및 도 4 를 함께 참조하여 본 발명의 실시간 미세먼지 농도 추정 방법을 설명하기로 한다.
도 5 는 기존의 오프라인 학습 기반 미세먼지 추정 모델의 결과를 예시한 것이다.도 5 의 그래프는 미세먼지의 (a) 는 PM10 모델 검증 농도(Estimated PM10 Concentrate), (b) 는 PM10 예측 검증 농도(Predicted PM10 Concentrate), (c)는 PM2.5 모델 검증 농도(Estimated PM2.5 Concentrate), (d)는 PM2.5 예측 검증 농도(Predicted PM10 Concentrate)를 나타낸 것이다. 보다 상세하게, 그래프들의 가로축은 PM10 또는 PM2.5 의 관측값(Observed PM Concentration)이고, 그래프들의 세로 축은 PM10 또는 PM2.5 의 모델 검증(estimated) 혹은 예측 검증(predicted) 결과값이다.
도 5 의 실시예에 따르면, 데이터로부터 모델링을 실시할 때, 수집된 데이터의 날짜 중 20% 를 예측 검증을 위해 따로 남겨두고, 나머지 80% 에 대하여 다시 8:2로 나눈 후 8 을 모델 구축을 위해 사용하고, 2 를 모델 검증을 위해 사용할 수 있다. 예측 검증은 모델에 포함되지 않은 날짜에 의해 수행되기 때문에, 도 5 에 도시된 바와 같이 예측 검증은 고농도에 대해 모의를 제대로 수행하지 못할 수 있다.
또한, 도 5 에서 볼 수 있는 바와 같이, 2년간 누적된 자료를 사용한 기존의 오프라인 학습기반의 지상 미세먼지 추정 알고리즘은 모델검증 결과에 비해 예측검증 결과가 상대적으로 낮은 정확도, 즉 과소모의한 결과를 도출한다는 것에 문제점이 있었다.
또한, 미세먼지 농도는 대기상태 등의 과거의 정보보다 실시간으로 변화하는 정보에 따라 농도의 차이가 크게 나타난다는 특징이 존재한다. 따라서, 본 발명에서는 실시간 학습을 통해 기존의 오프라인 학습기반의 지상 미세먼지 추정 알고리즘의 한계를 극복할 수 있다.
먼저, 본 발명의 일 실시예에 따른 실시간 데이터 획득부(311)는 에서 실시간 데이터를 획득한다(S41). 이때, 실시간 데이터는 위성 데이터, 모델 데이터 및 현장관측 데이터를 포함할 수 있다. 보다 상세히, 실시간 데이터 획득부(311)는 GOCI(Geostationary Ocean Color Imager) 데이터 가용시간인 9시에서 16시 사이의 실시간 데이터를 모두 수집할 수 있다.
본 발명의 일 실시예에 있어서, 위성 데이터는 하기의 [표 1] 과 같은 위성 기반 자료인 위성 데이터를 포함할 수 있다. 본 발명은 하기의 [표 1]에서 GPM의 3IMERGHH 강수량자료를 통해 하루 전 누적 강수량을 구해 사용하였다.
Data Satellite Spatial Resolution Temporal Resolution
MYD13A2 표준화 차이 식생 지수
(Normalized Difference Vegetation Index, NDVI)
MODIS 1 km 16 days
AOD 에어로졸 광학 깊이(Aerosol Optical Depth) GOCI 6 km 8/day
FMF 정교 모드 분수(Fine Mode Fraction) GOCI 6 km 8/day
SSA 단일 산란 알비도(Single Scattering Albedo) GOCI 6 km 8/day
AE 옹스트롱 지수(Angstrom Exponent) GOCI 6 km 8/day
3IMERGHH 침적(Precipitation) GPM 10 km Every 30min
DEM 디지털 고도 모델(Digital Elevation Model) SRTM 90 m
RSDN 태양 방사선(Solar Radiation base on the BESS algorithm) MODIS 5 km Daily
LC_urban 도시 지역 비율(Urban area ratio from landcover) MODIS 500 m
또한, 본 발명의 일 실시예에서, 모델 데이터는 하기의 [표 2] 와 같은 수치모델자료의 데이터를 포함할 수 있다. 이때 수치모델자료는 지역예보시스템(Regional Data Assimilation Prediction System, RDAPS)로부터 획득한 것일 수 있다. 하기의 [표2]에서, 공간 해상도(spatial resolution)는 12km 이고, 시간 해상도(temporal resolution)는 일당 4회(4/day)이며, 제공되지 않는 시간에는 보간(interpolation) 후 사용하였다. 더불어, 누적 바람 속도(StackMaxWS)는 최대 풍속을 각각 1, 3, 5, 7일에 대하여 누적 평균하여 산출한 값이다.
Data
Tem 온도(Temperature)
Dew 이슬점 온도(Dew-point temperature)
RH 상대 습도(Relative Humidity)
MaxWS 최대 풍속(Maximum wind speed (3 Hour Maximum))
StackMaxWS (1,3,5,7) 누적 최대 풍속(Accumulated maximum wind speed)
PBLH 행성 경계층 높이(Planetary Boundary Layer Height)
Visibility 지면 위 가시 높이(Visibility height above ground)
P_srf 압력 표면(Pressure surface)
더불어, 본 발명의 일 실시예에서, 실시간 데이터는 하기의 [표 3] 과 같은 기타 보조 자료를 포함할 수 있다.
Data
DOY 날짜(Day of Year)
PopDens 인구 밀도(Population density)
RoadDens 도로 밀도(Road density)
다음으로, 샘플링부(312)는 수집된 실시간 미세먼지 데이터를 오버샘플링 또는 서브샘플링하고, 고농도 및 저농도 샘플의 비율을 조정하여 샘플링 데이터를 생성한다(S42). 즉, 샘플링부(312)는 수집된 실시간 데이터의 오버샘플링 또는 서브샘플링을 수행하여 샘플 데이터를 생성한다. 또한, 샘플링부(312)는 저농도 및 고농도 샘플 조정을 통해 저농도 및 고농도의 비율을 임의적으로 지적하여 데이터 샘플 내 농도간 균형을 조정할 수 있다.
본 발명의 일 실시예에 따르면, PM10 에 대하여 남한은 저농도 기준이 60 이하, 고농도 기준이 150 이상일 수 있고, 동아시아의 경우 저농도 기준이 100이하, 고농도 기준이 400이상일 수 있다. 더불어, PM2.5 에 대하여 남한은 저농도 기준이 30 이하, 고농도 기준이 80 이상일 수 있고, 동아시아의 경우 저농도 기준이 60이하, 고농도 기준이 240이상일 수 있다.
또한, 샘플링부(312)는 수집된 데이터를 사용하여 각각의 시간에 해당하는 샘플을 타겟(PM10 또는 PM2.5)의 농도분포에 따라 오버샘플링(샘플이 부족한 구간에 대하여 수행) 및 서브샘플링(샘플이 많은 구간에 대하여 수행)을 수행한 뒤, 오버샘플링/서브샘플링 후에도 데이터셋의 분포(타겟샘플의 농도 분포)가 불균형 할 경우 후술하는 제1 내지 제3 샘플 조정을 실시한다. 즉, 샘플링부(312)는 다른 구간에 비해 비교적 샘플 개수가 부족한 구간에 대하여 오버 샘플링을 수행하고, 다른 구간에 비해 비교적 샘플 개수가 많은 구간에 대하여 서브 샘플링을 수행할 수 있다.
즉, 본원 발명에 따르면 실시간 데이터를 누적하되, 실시간 데이터의 최근 30일간 누적자료를 사용한 실시간 학습을 통해 지상 미세먼지 농도 추정 알고리즘의 고도화를 수행할 수 있다. 이때, 샘플링부(312)는 누적된 샘플 중 고농도 및 저농도 샘플을 누적함으로써, 상술한 오버 샘플링/서브 샘플링 이외에 저농도 및 고농도 샘플 조정을 농해 저농도 및 고농도의 비율을 임의적으로 지정함으로써 샘플 내 농도간 균형을 맞출 수 있다.본 발명의 일 실시예에 의하면, 샘플링부(312)는 PM10 및 PM2.5 샘플 농도 데이터들에 대하여 제1 내지 제3 샘플 조정을 실시할 수 있다.
먼저, 본 발명의 샘플링부(312)는 저농도 샘플 및 고농도 샘플의 비율이 전체 샘플 대비 30% 이하이고, 전체 샘플의 개수가 기준값보다 많은 경우 제1 샘플 조정을 실시한다. 보다 구체적으로, 제1 샘플 조정은 가장 오래된 샘플(가장 먼저 누적된 샘플, 예를 들어 가장 먼저 누적된 1일의 시간 단위 샘플)에 대하여 고농도 미만의 오버샘플링된 샘플을 제거한다. 이때, 본 발명의 일 실시예에 따르면 고농도 샘플의 기준은 PM10 의 경우 150㎍/m3(남한) 및 400㎍/m3(동 아시아), PM2.5의 경우 80㎍/m3(남한) 및 240㎍/m3(동아시아)일 수 있다. 즉, 제1 샘플 조정에서는 150㎍/m3 미만(남한) 및 400㎍/m3 미만(동 아시아), PM2.5의 경우 80㎍/m3 미만(남한) 및 240㎍/m3 미만(동아시아)의 오버샘플링된 샘플을 제거한다.
또한, 제2 샘플 조정은 저농도나 고농도의 비율이 30% 이상일 때, 고농도의 경우 가장 오래된 샘플 중 오버샘플링된 샘플 전부를 제거하고, 저농도의 경우 가장 오래된 샘플 중 저농도인 샘플을 제거하는 것일 수 있다.
또한, 제3 샘플 조정은 제1 샘플조정 및 제2 샘플 조정 후에도 저농도 샘플 및 고농도 샘플의 비율이 전체 샘플에서 30% 이상일 때, 누적 기간 중 가장 오래된 고농도 샘플을 조정하고, 바로 직전의 샘플 중 저농도인 샘플을 제거한다.
더불어, 제3 샘플 조정은 상기 제1 샘플 조정 및 제2 샘플 조정 후에도 저농도 샘플 및 고농도 샘플의 비율이 30% 이하일 때, 누적기간이 경과되어 버려지는 샘플들 중 저농도, 고농도 샘플을 계속 누적하여 전체 샘플의 비율을 조정하는 것일 수 있다.
다음으로, 모델 설계부(313)는 샘플링 데이터에 기초하여 미세먼지 농도 추정 모델을 설계한다(S43). 즉, 모델 설계부(313)는 상술한 바와 같이 실시간 데이터 획득부(311) 및 샘플링부(312) 에 의해 구축된 실시간 훈련자료를 이용하여 미세먼지 농도 추정 모델을 설계한다. 이때, 미세먼지 추정 모델은 기계학습 및 인공지능을 이용하여 설계될 수 있으며, 보다 구체적으로는 랜덤 예측(random forest) 기법을 사용하여 모델을 개발할 수 있다.
다음으로, 검증부(314)는 설계된 모델을 현장 관측소 기반 데이터를 이용하여 검증할 수 있다(S44). 보다 상세히, 본 발명의 검증부(324)는 모델 검증을 지상 현장 관측소 단말로부터 획득한 현장 관측 데이터에 기반하여 하나 남기기(leave-one-out) 교차검증을 통해 수행할 수 있다.
보다 상세히, 본 발명은 실시간 학습 기반으로 모델을 구축하기 때문에 일반적인 오프라인 학습 기반의 모델검증 방법과 같은 방법으로 정확도를 나타내기에는 어려움이 있다. 따라서 본 발명의 검증 방법으로서 관측소 기준의 하나 남기기(leave-one-out) 교차 검증법(cross validation)을 사용할 수 있다. 보다 상세히, 본 발명은 교차 검증 시 오류를 줄이기 위하여, 일정 거리 내 (남한의 경우 직경 100 km 이내, 동아시아의 경우 직경 300 km 이내)에 일정 개수 (남한의 경우, PM10: 30개, PM2.5: 20개, 동아시아의 경우, PM10: 40개, PM2.5: 30개) 이상의 관측소에 대한 샘플이 존재할 경우에 하나 남기기 교차 검증법을 사용할 수 있다.
즉, 본 발명의 일 실시예에 따르면, 실시간 학습기반 알고리즘의 경우 미세먼지 추정 모델의 검증을 위해 샘플을 별도로 분리하지 않고 모두 훈련자료로 사용하기 때문에 기존 모델과 같은 방법으로 검증을 수행하기에는 어려움이 존재한다. 따라서, 본 발명에서는 모델 설계 후 검증을 위해, 매시간 실시간으로 모델을 구축 시 수행하는 실시간 학습기반의 모델 검증 결과(모델의 훈련 정확도)와 함께 현장 관측소 기반의 하나 남기기 교차 검증을 수행할 수 있다. 또한, 본 발명은 교차 검증 수행 시, 일정 범위 내 일정 개수 이상의 관측소가 있는 경우에만 교차검증을 수행할 수 있다.
본 발명의 일 실시예에 따라 하나 남기기 교차 검증 시, 일정 거리 이내에 있는 관측소가 일정 개수 이상일 때만 검증을 수행할 수 있다. 예를 들어, 한국 100km 이내 관측소가 20개 내지 30개 이상인 경우에만, 혹은 동아시아는 300km 이내 관측소가 30개 내지 40개 이상인 경우에만 교차 검증을 수행할 수 있다. 더불어, 교차 검증의 수행 시간에 따라 기설정된 주기, 예를 들어 하루 또는 일주일 동안의 결과를 누적하여 정확도를 표출할 수 있다.
도 6 은 본 발명의 일 실시예에 따른 교차검증 결과를 나타낸 것이다.
도 6 의 그래프에서, 가로축은 PM10 또는 PM2.5 의 관측 농도이고, 세로축은 PM10 또는 PM2.5 의 추정 농도이다. 도 6 의 그래프들은 남한 지역에 대한 예측 결과로서 100km 이내의 샘플을 이용한 것이며, 2015년 내지 2016년에 대해 15일 간격으로 하나 남기기 교차 검증을 수행한 모델을 이용하였다. 도 6 은 (a), (b) 는 모두 모델 검증 결과로서, 모델 구축 시의 샘플을 포함해서 모델 검증을 한 것이고 정확도가 높을 수 밖에 없다. 또한, 도 6 은 (c), (d) 는 관측소 기반의 leave-one-out 교차 검증을 한 모델 검증 결과이다.
도 6 의 (c) 내지 (d) 를 참고하면, 본 발명의 미세먼지 추정 모델은 오프라인 학습 기반의 에측검증 결과에 비해 상대적으로 높은 정확도, 즉, 낮은 평균근 오차(RMSE, Root Mean Square Error)를 나타냄을 알 수 있다.
다음으로, 전천에서의 미세먼지 농도 추정 방법에 대해 설명하기로 한다. 도 7 은 본 발명의 일 실시예에 따른 전천에서의 미세먼지 농도 추정 방법을 나타낸 순서도이다. 이하에서는, 도 3 및 도 7 을 함께 참조하여 전천에서의 미세먼지 농도 추정 방법을 설명한다.
앞서 상술한 바와 같이, 본 발명은 지상 미세먼지 농도 추정 시 위성 기반 데이터를 사용할 수 있다. 그러나, 위성 기반 데이터의 경우 가장 큰 단점이 구름이 존재할 때는 정보를 얻기 어렵다는 것이다. 이에, 본 발명에서는 미세먼지 추정 시 가장 중요한 변수인 위성 기반 AOD 를 구름이 존재할 때 모의하여 전천에서도 지상 미세먼지 농도를 추정할 수 있는 알고리즘을 제공한다. 본 발명의 전천에서의 미세먼지 추정 알고리즘은 맑은 날에 대해서만 고려하여 모델을 구축하였을 때와 유사한 정확도를 가질 수 있다.
보다 상세히, 위성 기반 데이터를 이용하여 지상 미세먼지 농도 추정 시, 현장 관측소 기반의 농도 추정에 비하여 넓은 지역에 대한 정보를 제공할 수 있다는 장점이 존재한다. 그러나, 위성 기반 데이터에 기반한 미세먼지 농도 추정은 구름이 존재할 때 정보를 얻을 수 없다는 것과, 모델 기반의 자료는 불확실성이 높다는 한계점이 존재한다. 이에, 본 발명에서는 기계학습을 이용하여 구름이 존재하는 경우 위성 기반 AOD 추정을 통해 전천에서의 지상 미세먼지 농도를 추정하는 알고리즘을 제공할 수 있다.
관련하여, 본 발명의 전천에서의 미세먼지 농도 추정 방법은 크게 2가지 단계를 가질 수 있다. 첫 번째로, 수치모델기반 기상변수 및 대기화학수송모델 기반의 AOD를 사용하여 전천에서의 AOD를 추정 (이 때, 추정 타겟은 2가지로 두개의 버전을 생성한다). 두 번째로, 첫 번째 단계에서 산출된 전천에서의 AOD 값을 사용하여 다른 위성변수 및 수치모델기반 기상변수, 기타변수 (예를 들어, 도로밀도, 인구밀도, DOY 등)등과 함께 공간적으로 연속적인, 전천에서의 지상 미세먼지 농도를 추정한다. 따라서, 본 발명에 따르면 최종적으로 전천에서 공간적으로 연속적인 (구름 유무와 상관없이) 지상 미세먼지 농도를 산출할 수 있다.
즉, 본 발명의 전천 미세먼지 추정부(320)는 전천에서의 AOD 를 추정한 후, 추정된 AOD 를 바탕으로 미세먼지 농도를 추정하는 것을 특징으로 한다. 즉, 본 발명의 전천 미세먼지 추정부(320)는 AOD 추정하는 제1 알고리즘 및 추정된 AOD 기반 전천에서의 미세먼지 농도를 추정하는 제2 알고리즘을 수행할 수 있다.
보다 상세히, 본 발명에서는 지상 미세먼지 농도 추정 시 사용되는 입력 변수 중 수치 표고 모형(DEM: Digital Elevation Model) 및 지역예보시스템(Regional Data Assimilation and Prediction System, RDAPS) 수치 모델기반 기상학변수와 대기화학수송모델인 GEOS(Goddard Earth Observing System)-Chem 기반 변수(AOD 포함)를 입력변수로 하여 2가지 버전의 AOD 를 타겟으로 한 전천에서의 AOD 추정 알고리즘인 제1 알고리즘을 제공한다. 더불어, 본 발명에서는 추정된 전천에서의 AOD를 입력변수로 사용하여, 상술한 지상 미세먼지 농도 추정 모델의 입력변수(GOCI aerosol product 제외)와 함께 구름 유무와 상관없이 공간적으로 연속적인 미세먼지 농도 추정 알고리즘인 제2 알고리즘을 제공할 수 있다. 더불어, 상술한 제1 알고리즘 및 제2 알고리즘은 전천 미세먼지 추정부(320)의 AOD 추정부(322) 및 미세먼지 농도 추정부(323)에서 각각 수행될 수 있다.
이를 위해, 먼저 데이터 획득부(321)는 수치모델 기반 기상학변수 및 대기화학수송모델 기반 변수를 획득한다(S71). 이때, 수치모델 기반 기상학변수는 지역예보시스템(RDAPS)이고, 대기화학수송모델은 GEOS-Chem일 수 있다.
다음으로, AOD 추정부(322)는 지역예보시스템 수치모델 기반 기상학변수 및 대기화학수송모델 기반 변수를 입력 변수로 하여 전천에서의 제1 버전 AOD 및 제2 버전 AOD 를 추정한다(S72). 즉, AOD 추정부(322)는 전천에서의 AOD 를 추정하는 제1 알고리즘을 제공한다. 이때, 제1 알고리즘은 수치모델 기반 기상학변수 및 대기화학수송모델 기반 에어로졸 변수를 입력 변수로 하여 AOD 를 추정할 수 있다. 더불어, 제1 알고리즘은 제1 버전 AOD 및 제2 버전 AOD 를 타겟으로 하는 2가지 버전의 AOD 추정 알고리즘을 제공할 수 있다. 본 발명의 일 실시예에서, 제1 버전 AOD 는 GOCI(Geostationary Ocean Color Imager) AOD 이고, 제2 버전 AOD 는 AERONET(AErosol RObotic NETwork) AOD 일 수 잇다.
보다 상세히, 본 발명의 구체적인 실시예에 따르면 제1 알고리즘은 동아시아를 대상으로 2016년의 모든 13KST 에 대해 수치모델 자료(예를 들어, 지역 예보 시스템(RDAPS)의 수치 모델 자료)와 대기화학수송모델(예를 들어, GEOS-Chem) 자료를 입력 변수로 이용하였다. 또한, 가로 세로 6km 의 공간해상도로 기계학습 기법 중 하나인 랜덤 포레스트(random forest)를 이용한 전천에서의 AOD 추정 모델을 제공할 수 있다.
하기의 [표 4] 는 제1 알고리즘의 입력 변수를 예시한 것이다. 또한, 기상학적 변수는 [표 2] 의 수치모델자료와 동일한 입력 변수를 사용할 수 있다.
데이터 공간
해상도
시간
해상도
AOD 대기화학수송모델의 AOD
(Aerosol Optical Depth derived from GEOS-Chem model)
25 km Hourly
T2m 2m 온도(2 meter temperature_) 12 km 4/day
D2m 2m 이슬점 온도(2 meter dew-point temperature _ 12 km 4/day
RH 상대 습도(Relative Humidity) 12 km 4/day
Max_WS 10m 최대 풍속(10 meter Maximum wind speed) (3 Hour Maximum) 12 km 4/day
PBLH 행성 경계층 높이(Planetary Boundary Layer Height_ 12 km 4/day
Visibility 지면 위 가시 높이(Visibility height above ground) 12 km 4/day
P_srf 압력 표면Pressure surface ) 12 km 4/day
또한, AOD 추정부(322)는 제 1 버전 AOD 알고리즘을 구축하기 위하여 샘플을 해양과 육지로 구분한 후 GOCI AOD 값의 범위에 따라 구간을 나누어 무작위로 모델 데이터 셋(set) 80%, 검증 데이터 셋 20% 로 구분하여 이용할 수 있다. 제2 버전 AOD 알고리즘을 구축하기 위하여 샘플을 AERONET AOD 농도에 따라 임의로 구간을 나누어 각 구간별로 모델 데이터 셋 70%, 검증 데이터 셋 20 %, 전체 검증용 데이터 셋 10 % 로 구분하여 이용할 수 있다.
더불어, 개발된 제1 버전 AOD 및 제2 버전 AOD 의 알고리즘은 구축된 뒤 지상 미세먼지 농도 추정 시 비교 검증될 수 있다.
도 8 은 본 발명의 일 실시예에 따른 제1 알고리즘 수행 결과를 나타낸 것이다.
도 8 의 (a) 관측된 GOCI AOD 를 나타낸 것이고, (b), (c), (d) 는 추정된 AOD 를 나타낸 것이다. (a)와 달리 (c) 의 경우 전천에서의 AOD 농도를 추정하고 있음을 알 수 있다.
다음으로, 미세먼지 농도 추정부(323)는 추정된 제1 버전 AOD 및 제2 버전 AOD 각각과, 위성기반 에어로졸 관련 변수, 수치모델기반 기상학변수 및 보조변수에 기초하여 공간적으로 연속적인 지상 미세먼지 농도 측정 모델 수립 한다(S73). 즉, 미세먼지 농도 추정부(323)는 추정된 AOD 에 기초하여 공간적으로 연속적인 지상 미세먼지 추정 알고리즘인 제2 알고리즘을 제공한다. 보다 상세히, 미세먼지 농도 추정부(323)는 상술한 제1 알고리즘에서 추정된 제1 버전 AOD (GOCI AOD 타겟) 및 제2 버전 AOD (AERONET AOD 타겟)를 각각 입력변수로 사용하여 지상 미세먼지 농도를 추정할 수 있다.
또한, 미세먼지 농도 추정부(323)는 위성 기반자료(GOCI aerosol product 제외), 수치모델기반 기상학변수 및 기타 보조자료(DOY, 인구밀도, 도로밀도 등)을 제1 알고리즘의 추정 AOD 와 함께 사용하여 미세먼지 농도 추정 모델을 구축할 수 있다. 관련하여, 위성 기반 자료는 상술한 [표 1] 에 예시된 데이터를 사용할 수 있고 (이 중 GOCI aerosol product 제외), 수치모델기반 기상학변수는 [표 2]에 예시된 데이터를 사용할 수 있으며, 기타 보조 자료는 [표 3] 에 예시된 자료를 이용할 수 있다.
본 발명의 일 실시예에서, 미세먼지 농도 추정부(323)는 가로세로 6km 공간해상도에 맞춰 랜덤 포레스트 기법으로 전천에서의 미세먼지 농도 추정 모델을 구축할 수 있다. 본 발명의 구체적인 실시예에서, 미세먼지 농도 추정부(323)는 2016년 모든 13KST에 대하여 날짜를 기준으로 계절별로 무작위로 나누어 샘플의 80%는 모델 개발(모델 구축 및 모델 검증)에 사용하고, 나머지 20% 는 모델 예측 검증에 사용할 수 있다. 더불어, 제1 버전 AOD (GOCI AOD 타겟) 및 제2 버전 AOD (AERONET AOD 타겟)를 사용하여 구축한 두 버전의 지상 미세먼지 농도 추정 알고리즘의 결과는 비교검증을 통해 나타낼 수 있다.
다음으로, 검증부(324)는 지상 미세먼지 농도 추정 알고리즘을 검증할 수 있다. 보다 상세히, 검증부(324)는 제1 버전 AOD 및 제2 버전 AOD 에 기초하여 수립된 지상 미세먼지 농도 추정 모델 각각에 대하여, 관측소 기반 데이터를 이용하여 검증할 수 있다(S74). 또한, 검증부(324)는 관측소 기반 미세먼지 데이터와 제1 버전 및 제2 버전 AOD 추정 결과를 각각 비교 및 검증하여, 하나의 버전의 AOD 를 선정할 수 있다. 본 발명의 일 실시예에 따르면, 지상 관측소 기반 데이터와의 비교 검증을 통해 선정된 AOD 는 제1 버전 AOD (GOCI AOD 타겟) 일 수 있다.
도 9 는 본 발명의 일 실시예에 따른 검증 프로세스를 나타낸 것이다.
도 9 를 참조하면, 추정된 지상 미세먼지 농도를 검증하여 AOD 를 검증할 수 있다. 먼저 제1 버전 AOD 를 사용하여 추정된 지상 미세먼지 농도와 제2 버전 AOD 를 사용하여 추정된 지상 미세먼지 농도 각각을, 관측소 기반 PM10 과 PM2.5 농도와 비교 및 검증할 수 있다. 비교 및 검증을 통해, 하나의 버전의 지상 미세먼지 농도 추정 알고리즘을 선정할 수 있다.
다음으로, 도 8 을 참조하면, 선정된 버전의 AOD 를 이용하여 지상 미세먼지 농도를 추정할 수 있다.
이상 설명된 본 발명에 따른 실시예는 다양한 컴퓨터 구성요소를 통하여 실행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위하여 하나 이상의 소프트웨어 모듈로 변경될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항과 한정된 실시예 및 도면에 의하여 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위하여 제공된 것일 뿐, 본 발명이 상기 실시예에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정과 변경을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims (16)

  1. 실시간 미세먼지 데이터를 획득하는 실시간 데이터 획득부;
    상기 획득된 실시간 미세먼지 데이터를 오버샘플링 또는 서브샘플링하고, 고농도 및 저농도 샘플의 비율을 조정하여 최적의 훈련 데이터를 생성하는 샘플링부;
    상기 샘플링된 훈련 데이터에 기초하여 미세먼지 추정 모델을 설계하는 모델 설계부;
    상기 설계된 모델을 현장 관측소 기반 데이터를 이용하여 검증하는 검증부;
    를 포함하는 실시간 미세먼지 농도 추정 시스템.
  2. 제 1 항에 있어서,
    상기 실시간 미세먼지 데이터는 위성 데이터, 수치 모델 데이터 또는 보조변수 데이터인, 실시간 미세먼지 농도 추정 시스템.
  3. 제 2 항에 있어서,
    상기 위성 데이터는 표준화 차이 식생 지수, 에어로졸 광학 깊이, 단일 산란 알비도, 옹스트롱 지수, 강수량, 태양 방사선, 도시지역 비율 등과 같이 에어로졸 관련 변수 및 에어로졸의 변화에 영향을 끼칠 수 있는 변수들 중 하나 이상의 항목을 포함하는, 실시간 미세먼지 농도 추정 시스템.
  4. 제 2 항에 있어서,
    상기 수치 모델 데이터는 온도, 이슬점 온도, 상대습도, 최대 풍속, 행성 경계층 높이, 지면 위 가시 높이 등 기상학 변수들 중 하나 이상의 항목을 포함하는, 실시간 미세먼지 농도 추정 시스템.
  5. 제 1 항에 있어서,
    상기 샘플링부는,
    상기 실시간 미세먼지 데이터의 농도분포와 누적되는 시간 등에 기초하여, 샘플이 기설정된 값보다 부족한 구간에 대해 오버 샘플링을 수행하고, 샘플이 기설정된 값보다 많은 구간에 대하여 서브 샘플링을 수행하는, 실시간 미세먼지 농도 추정 시스템.
  6. 제 5 항에 있어서,
    상기 고농도 기준치는 기준은 PM10 의 경우 150㎍/m3, PM2.5의 경우 80㎍/m3인, 실시간 미세먼지 농도 추정 시스템.
  7. 제 1 항에 있어서,
    상기 미세먼지 추정 모델은 랜덤 포레스트(random forest) 기법을 이용하여 설계되는, 실시간 미세먼지 농도 추정 시스템.
  8. 메모리; 및
    프로세서; 를 포함하는 실시간 미세먼지 농도 추정 시스템에 있어서,
    상기 프로세서는,
    실시간 미세먼지 데이터를 획득하는 실시간 데이터 획득부;
    상기 획득된 실시간 미세먼지 데이터를 오버샘플링 또는 서브샘플링하고, 고농도 및 저농도 샘플의 비율을 조정하여 샘플링 데이터를 생성하는 샘플링부;
    상기 샘플링 데이터에 기초하여 미세먼지 추정 모델을 설계하는 모델 설계부;
    상기 설계된 모델을 현장 관측소 기반 데이터를 이용하여 검증하는 검증부;
    를 포함하는 실시간 미세먼지 농도 추정 시스템.
  9. 실시간 미세먼지 데이터를 획득하는 실시간 데이터 획득 단계;
    상기 획득된 실시간 미세먼지 데이터를 오버샘플링 또는 서브샘플링하고, 고농도 및 저농도 샘플의 비율을 조정하여 샘플링 데이터를 생성하는 샘플링 단계;
    상기 샘플링 데이터에 기초하여 미세먼지 추정 모델을 설계하는 모델 설계 단계;
    상기 설계된 모델을 현장 관측소 기반 데이터를 이용하여 검증하는 검증 단계;
    를 포함하는 실시간 미세먼지 농도 추정 방법.
  10. 제 9 항에 있어서,
    상기 실시간 미세먼지 데이터는 위성 데이터, 수치 모델 데이터 또는 보조변수 데이터인, 실시간 미세먼지 농도 추정 방법.
  11. 제 10 항에 있어서,
    상기 위성 데이터는 표준화 차이 식생 지수, 에어로졸 광학 깊이, 단일 산란 알비도, 옹스트롱 지수, 강수량, 태양 방사선, 도시지역 비율 등과 같이 에어로졸 관련 변수 및 에어로졸의 변화에 영향을 끼칠 수 있는 변수들 중 하나 이상의 항목을 포함하는, 실시간 미세먼지 농도 추정 방법.
  12. 제 10 항에 있어서,
    상기 수치 모델 데이터는 온도, 이슬점 온도, 상대습도, 최대 풍속, 행성 경계층 높이, 지면 위 가시 높이 등 기상학 변수들 중 하나 이상의 항목을 포함하는, 실시간 미세먼지 농도 추정 방법.
  13. 제 9 항에 있어서,
    상기 샘플링 단계는,
    상기 실시간 미세먼지 데이터의 농도분포에 기초하여, 샘플이 기설정된 값보다 부족한 구간에 대해 오버 샘플링을 수행하고, 샘플이 기설정된 값보다 많은 구간에 대하여 서브 샘플링을 수행하는, 실시간 미세먼지 농도 추정 방법.
  14. 제 13 항에 있어서,
    상기 고농도 기준치는 기준은 PM10 의 경우 150㎍/m3, PM2.5의 경우 80㎍/m3인, 실시간 미세먼지 농도 추정 방법.
  15. 제 9 항에 있어서,
    상기 미세먼지 추정 모델은 랜덤 포레스트(random forest) 기법을 이용하여 설계되는, 실시간 미세먼지 농도 추정 방법.
  16. 제9항 내지 제15항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 판독가능기록매체에 기록된 컴퓨터 프로그램.
KR1020190119190A 2019-09-26 2019-09-26 미세먼지 농도 추정 시스템, 방법 및 컴퓨터 프로그램 KR102317207B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190119190A KR102317207B1 (ko) 2019-09-26 2019-09-26 미세먼지 농도 추정 시스템, 방법 및 컴퓨터 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190119190A KR102317207B1 (ko) 2019-09-26 2019-09-26 미세먼지 농도 추정 시스템, 방법 및 컴퓨터 프로그램

Publications (2)

Publication Number Publication Date
KR20210036756A true KR20210036756A (ko) 2021-04-05
KR102317207B1 KR102317207B1 (ko) 2021-10-25

Family

ID=75462197

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190119190A KR102317207B1 (ko) 2019-09-26 2019-09-26 미세먼지 농도 추정 시스템, 방법 및 컴퓨터 프로그램

Country Status (1)

Country Link
KR (1) KR102317207B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819312A (zh) * 2022-04-15 2022-07-29 武汉大学 一种pm1浓度的估算方法及系统
KR102500371B1 (ko) * 2022-11-03 2023-02-16 대한민국(관리부서: 환경부 국립환경과학원장) 환경위성을 통한 에어로졸의 이동량 표출 시스템과 그 방법
KR102700813B1 (ko) 2024-02-16 2024-09-05 대한민국 운고계의 원시자료와 기계학습을 활용한 초미세먼지와 미세먼지의 추정 방법
CN118645182A (zh) * 2024-08-15 2024-09-13 安徽建筑大学 一种区域pm2.5浓度预测方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102636210B1 (ko) * 2023-06-15 2024-02-14 대한민국 대기질 예보 지원을 위한 추천 모델을 제시하는 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150056676A (ko) * 2013-11-14 2015-05-27 광주과학기술원 국가 간 입자상 대기 오염물질의 수송 여부 판단방법
KR20170025709A (ko) * 2015-08-31 2017-03-08 대한민국(기상청장) 황사와 연무 통합 예측 및 검증 방법 및 시스템
KR20190057013A (ko) * 2017-11-17 2019-05-27 한국외국어대학교 연구산학협력단 상세기상 예측정보 실시간 운영 시스템과 이를 이용하는 폭염 및 열대야 영향 예보 활용 방법
KR101988317B1 (ko) * 2018-08-06 2019-06-12 주식회사 디에이피 인공지능에 기반하여 비산먼지를 측정하고 예측하는 장치 및 그 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150056676A (ko) * 2013-11-14 2015-05-27 광주과학기술원 국가 간 입자상 대기 오염물질의 수송 여부 판단방법
KR20170025709A (ko) * 2015-08-31 2017-03-08 대한민국(기상청장) 황사와 연무 통합 예측 및 검증 방법 및 시스템
KR20190057013A (ko) * 2017-11-17 2019-05-27 한국외국어대학교 연구산학협력단 상세기상 예측정보 실시간 운영 시스템과 이를 이용하는 폭염 및 열대야 영향 예보 활용 방법
KR101988317B1 (ko) * 2018-08-06 2019-06-12 주식회사 디에이피 인공지능에 기반하여 비산먼지를 측정하고 예측하는 장치 및 그 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819312A (zh) * 2022-04-15 2022-07-29 武汉大学 一种pm1浓度的估算方法及系统
KR102500371B1 (ko) * 2022-11-03 2023-02-16 대한민국(관리부서: 환경부 국립환경과학원장) 환경위성을 통한 에어로졸의 이동량 표출 시스템과 그 방법
KR102700813B1 (ko) 2024-02-16 2024-09-05 대한민국 운고계의 원시자료와 기계학습을 활용한 초미세먼지와 미세먼지의 추정 방법
CN118645182A (zh) * 2024-08-15 2024-09-13 安徽建筑大学 一种区域pm2.5浓度预测方法及装置

Also Published As

Publication number Publication date
KR102317207B1 (ko) 2021-10-25

Similar Documents

Publication Publication Date Title
KR102317207B1 (ko) 미세먼지 농도 추정 시스템, 방법 및 컴퓨터 프로그램
US20210247369A1 (en) Localization analytics algorithms and methods
Zhang et al. The validation of the GEWEX SRB surface shortwave flux data products using BSRN measurements: A systematic quality control, production and application approach
CN110567510A (zh) 大气污染监测方法、系统、计算机设备和存储介质
Biass et al. TephraProb: a Matlab package for probabilistic hazard assessments of tephra fallout
Ding et al. Intercomparison of NO x emission inventories over East Asia
CN109782373A (zh) 一种基于改进的Naive Bayesian-CNN多目标分类算法的沙尘暴预测方法
Anisimov et al. Quantifying local-scale dust emission from the Arabian Red Sea coastal plain
KR102317206B1 (ko) 미세먼지 농도 추정 시스템, 방법 및 컴퓨터 프로그램
Miller et al. Constraining sector-specific CO 2 and CH 4 emissions in the US
Seigneur et al. On the effect of spatial resolution on atmospheric mercury modeling
Handschuh et al. On the added value of satellite AOD for the investigation of ground-level PM2. 5 variability
Singh et al. Deep-BCSI: A deep learning-based framework for bias correction and spatial imputation of PM2. 5 concentrations in South Korea
Nkomeje Comparative performance of multi-source reference data to assess the accuracy of classified remotely sensed imagery: Example of Landsat 8 OLI Across Kigali City-Rwanda 2015
Kleinert et al. Representing chemical history in ozone time-series predictions–a model experiment study building on the MLAir (v1. 5) deep learning framework
Cai et al. Automated Building Height Estimation Using Ice, Cloud, and Land Elevation Satellite 2 Light Detection and Ranging Data and Building Footprints
Camara Environmental systems: A multidimensional approach
Bear-Crozier et al. Development of python-FALL3D: a modified procedure for modelling volcanic ash dispersal in the Asia-Pacific region
Lee et al. The impacts of uncertainties in emissions on aerosol data assimilation and short-term PM 2.5 predictions in CMAQ v5. 2.1 over East Asia
Hoff et al. Applications of the three-dimensional air quality system to western US air quality: IDEA, Smog Blog, Smog Stories, AirQuest, and the Remote Sensing Information Gateway
Curci On the impact of time-resolved boundary conditions on the simulation of surface ozone and PM10
Wu et al. A simplified non-linear chemistry transport model for analyzing NO 2 column observations: STILT–NO x
Neteler Modis time series remote sensing for epidemiological modelling
Yu Cloud Detection and PM2. 5 Estimation Using Machine Learning
Orlando Modeling Spatiotemporal Patterns of PM 2.5 at the Sub-Neighborhood Scale Using Low-Cost Sensor Networks

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant