KR20230123574A - Transfer learning driven sequential forecasting and ventilation control of PM2.5 associated health risk levels in underground public facilities - Google Patents

Transfer learning driven sequential forecasting and ventilation control of PM2.5 associated health risk levels in underground public facilities Download PDF

Info

Publication number
KR20230123574A
KR20230123574A KR1020220020392A KR20220020392A KR20230123574A KR 20230123574 A KR20230123574 A KR 20230123574A KR 1020220020392 A KR1020220020392 A KR 1020220020392A KR 20220020392 A KR20220020392 A KR 20220020392A KR 20230123574 A KR20230123574 A KR 20230123574A
Authority
KR
South Korea
Prior art keywords
prediction
transfer learning
fine dust
resnet
data
Prior art date
Application number
KR1020220020392A
Other languages
Korean (ko)
Inventor
유창규
타리크 샤젭
남기전
Original Assignee
경희대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경희대학교 산학협력단 filed Critical 경희대학교 산학협력단
Priority to KR1020220020392A priority Critical patent/KR20230123574A/en
Publication of KR20230123574A publication Critical patent/KR20230123574A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N2015/0096Investigating consistence of powders, dustability, dustiness

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 인공지능 전이학습을 이용한 미세먼지 예측시스템과 예측방법 및, 이를 통한 환기제어시스템 및 방법에 관한 것으로, 보다 상세하게는 전이학습 기반의 예측모델을 구축하는 예측모델생성부; 및 상기 예측모델 생성부를 통해 구축된 예측모델을 기반으로 특정시간 후의 미세먼지농도를 예측하는 미세먼지 예측부;를 포함하고, 예측모델인 전이학습 기반의 ResNet 예측모델을 이용하여, 다른 공간의 데이터를 활용해 예측 대상이 되는 공간의 학습데이터가 부족한 경우에도 예측 시스템을 학습시켜 예측 대상 공간에서의 특정시간 후의 PM2.5 농도를 예측하는 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템에 관한 것이다. The present invention relates to a fine dust prediction system and prediction method using artificial intelligence transfer learning, and a ventilation control system and method therethrough, and more particularly, a prediction model generator for building a prediction model based on transfer learning; And a fine dust prediction unit for predicting the concentration of fine dust after a specific time based on the prediction model built through the prediction model generation unit; including, using the transfer learning-based ResNet prediction model as a prediction model, data in another space About a fine dust prediction system using artificial intelligence transfer learning, characterized by predicting the PM 2.5 concentration after a specific time in the prediction target space by learning the prediction system even when the learning data of the prediction target space is insufficient by using will be.

Description

인공지능 전이학습을 이용한 미세먼지 예측, 환기제어시스템 및 방법{Transfer learning driven sequential forecasting and ventilation control of PM2.5 associated health risk levels in underground public facilities}Fine dust prediction and ventilation control system and method using artificial intelligence transfer learning {Transfer learning driven sequential forecasting and ventilation control of PM2.5 associated health risk levels in underground public facilities}

본 발명은 인공지능 전이학습을 이용한 미세먼지 예측시스템과 예측방법 및, 이를 통한 환기제어시스템 및 방법에 관한 것이다. The present invention relates to a fine dust prediction system and prediction method using artificial intelligence transfer learning, and a ventilation control system and method through the same.

미세먼지(PM)는 관련 건강 영향으로 인해 최근 몇 년 동안 지속적인 주제였으며 그 영향을 줄이는 것은 전 세계적인 문제이다. 이에 유엔(UN)은 지속가능발전목표(Sustainable Development Goals) 의제의 일환으로 미세먼지로 인한 사망자와 질병을 줄이기 위한 실질적인 조치를 강조했다. 그 중에서도 공기역학적 직경이 2.5μm(PM2.5) 및 10μm(PM10)보다 작은 PM은 흡입시 폐 및 심혈관 질환을 유발할 수 있어 특히 주목받고 있다. PM에 대한 노출은 사람들이 시간의 80% 이상을 보내는 실내 미세 환경과 밀접한 관련이 있다. 따라서 이러한 실내 환경에서 PM이 건강에 미치는 영향을 분석, 모니터링 및 완화하는 것이 중요하다.Fine particulate matter (PM) has been a constant topic in recent years due to its associated health impacts, and reducing its impacts is a global challenge. In response, the United Nations (UN) has emphasized practical measures to reduce deaths and diseases caused by fine dust as part of the Sustainable Development Goals agenda. Among them, PMs with aerodynamic diameters smaller than 2.5 μm (PM 2.5 ) and 10 μm (PM 10 ) have attracted particular attention because they can cause lung and cardiovascular diseases when inhaled. Exposure to PM is closely related to the indoor microenvironment in which people spend more than 80% of their time. Therefore, it is important to analyze, monitor and mitigate the health effects of PM in these indoor environments.

PM의 독성은 폐 내부를 관통하고 세포 구조와 직접 상호작용하여 폐 염증을 유발한다. 크기에 따라 PM2.5는 폐 깊숙이 독성 입자를 축적하고, 폐포 벽을 부식시키며, 폐 기능을 손상시킬 수 있다는 것이 확인되었다. 게다가 장기간 PM2.5 노출은 심혈관 질환 사망률 및 이환율 증가와 관련이 있다. 이러한 맥락에서 미국 암 학회(American Cancer Society)는 PM2.5 농도가 10μg/m3 증가할 때마다 성인의 전체 사망률, 심폐 질환 사망률 및 폐암의 확률이 각각 4%, 6% 및 8% 증가한다고 결론지었다.The toxicity of PM penetrates the inside of the lungs and directly interacts with cellular structures, causing lung inflammation. Depending on its size, it has been established that PM 2.5 can accumulate toxic particles deep in the lungs, erode alveolar walls and impair lung function. Moreover, long-term exposure to PM 2.5 is associated with increased cardiovascular mortality and morbidity. In this context, the American Cancer Society concluded that for every 10 μg/m 3 increase in PM 2.5 concentration, there was a 4%, 6%, and 8% increase in total adult mortality, cardiovascular mortality, and lung cancer, respectively. .

최근 몇 년 동안 전 세계 대도시에서는 높은 교통 체증과 차량 배기 가스 오염을 완화하기 위해 지하철 시스템이 빠르게 개발되었다. 수백만 명의 사람들이 편리성 때문에 지하철 시스템을 주요 통근 수단으로 이용하고 있다. 이러한 이점에도 불구하고 이러한 지하 지하철 시스템의 승객 건강에 대한 실내 미세 환경의 영향은 정부와 학계에서 상당한 관심을 불러일으켰다. 현대 지하철 시스템은 제한되는 자연 환기 조건과 PM의 배출원 특성과 함께 비교적 폐쇄적이면서도 복잡한 특성을 가지고 있다. 또한 미세 입자상 물질은 탄소질량, 탄소 원소, 금속 입자, 열차 바퀴 궤도 마모, 실외 오염 물질 침투, 열차 운행빈도 및 승객 밀도에 의해 영향을 받는 많은 구성 요소의 복합체를 나타낸다.In recent years, metro systems have been rapidly developed in large cities around the world to alleviate high traffic congestion and vehicle exhaust pollution. Millions of people use the metro system as their primary commute because of its convenience. Despite these benefits, the effect of the indoor microenvironment on passenger health in these underground metro systems has generated considerable interest from government and academia. Modern subway systems have relatively closed and complex characteristics with limited natural ventilation conditions and emission source characteristics of PM. Particulate matter also represents a complex of many components that are influenced by carbon mass, carbon element, metal particles, train wheel track wear, outdoor contaminant penetration, train frequency and passenger density.

환경부(MOE)는 지하철역을 실내 유해시설로 분류했다. 이에 환경부는 실내노출법 시행, 대기질측정소 추가, 이상상황 감시를 위한 실내센서 설치 등 대기질 모니터링을 위한 대책을 마련했다. 직관적인 정보를 제공하기 위해 오염물질 농도 수준을 "양호"에서 "매우 나쁨"까지 여러 등급으로 구분한다. 각 등급은 다양한 대상 그룹에 대한 관련 건강 위험을 나타낸다. 또한 미국 환경보호청(EPA)은 실내 공기질(IAQ) 수준과 관련된 공중 보건 위험 수준을 결정하기 위해 종합 실내 공기질 지수(CIAI)를 제안했다.The Ministry of Environment (MOE) classified subway stations as indoor hazardous facilities. Accordingly, the Ministry of Environment prepared measures for air quality monitoring, such as implementing the Indoor Exposure Act, adding air quality monitoring stations, and installing indoor sensors to monitor abnormal situations. Contaminant concentration levels are graded from "good" to "very bad" to provide intuitive information. Each rating represents an associated health risk for different target groups. Additionally, the US Environmental Protection Agency (EPA) has proposed the Comprehensive Indoor Air Quality Index (CIAI) to determine the level of public health risk associated with indoor air quality (IAQ) levels.

지속 가능한 IAQ 수준을 보장하기 위해 대기 오염 정보 예측은 효과적인 대응을 위한 조기 경보 시스템을 개발하는 데 필수적이다. 예를 들어, 이 정보는 현재 PM 수준을 분산시키는 데 시간이 필요하기 때문에 지하철 환기 제어 시스템을 조절하기 위해 사전 인버터 주파수를 얻는 데 도움이 된다. 이전 연구에서는 통계 및 수학적 모델을 포함하여 PM의 분석, 예측 및 제어를 위해 수많은 기술이 사용되었다. 그러나 IAQ 시스템에서 PM과 다른 측정 가능한 변수의 복잡하고 비선형적인 관계를 고려할 때 기존 회귀 방법은 동적 PM 분포를 포착할 수 없으며 예측 성능이 좋지 않다. 대조적으로, 비선형 활성화 함수를 통합하는 인공 신경망(ANN)은 이러한 동적 동작을 더 잘 포착할 수 있다. To ensure sustainable IAQ levels, forecasting air pollution information is essential to developing early warning systems for effective response. For example, this information helps to obtain pre-inverter frequencies to regulate subway ventilation control systems as time is needed to dissipate current PM levels. In previous studies, numerous techniques have been used for the analysis, prediction and control of PM, including statistical and mathematical models. However, considering the complex and non-linear relationship between PM and other measurable variables in the IAQ system, existing regression methods cannot capture the dynamic PM distribution and have poor predictive performance. In contrast, artificial neural networks (ANNs) incorporating nonlinear activation functions are better able to capture these dynamic behaviors.

LSTM(Long Short-Term Memory) 및 GRU(Gated recurrent unit) 네트워크와 같은 순환 신경망(RNN)은 PM 예측에 널리 적용되었다. 그럼에도 불구하고 심층 네트워크에서 기울기 소실에 의한 성능 저하 문제가 발생하기 때문에 데이터에서 고유한 기능을 학습하기 위해 심층 RNN을 훈련하는 것은 어렵다. 그러나 최근 CNN(Convolutional Neural Networks), 특히 ResNets(Residual Neural Networks)의 발전으로 매핑 인식을 통한 심층 모델 교육이 가능해졌다. RNN은 대부분 시계열 데이터의 주기성을 캡처하기 위해 구현되지만 ResNet는 PM2.5와 같은 시계열 예측 애플리케이션에 대해 우수한 성능을 보여준다. Recurrent neural networks (RNNs), such as long short-term memory (LSTM) and gated recurrent unit (GRU) networks, have been widely applied for PM prediction. Nonetheless, it is difficult to train deep RNNs to learn unique features from data because of the performance degradation problem caused by vanishing gradients in deep networks. However, recent advances in Convolutional Neural Networks (CNNs), especially Residual Neural Networks (ResNets), have enabled deep model training through mapping recognition. RNNs are mostly implemented to capture the periodicity of time series data, but ResNet shows excellent performance for time series forecasting applications such as PM 2.5 .

실제로, 시계열 데이터는 기상 조건 및 계절성에 따라 변경되어 기존 데이터와 새로운 데이터 간에 변동성이 발생하여 특정 조건에서만 적용 가능한 예측 접근 방식이 된다. 그 외 수도권 지하철의 경우 정기 모니터링, 까다로운 모니터링 환경 또는 고가의 측정 장비로 인해 가용한 데이터가 상대적으로 적다. 이는 데이터가 충분하지 않을 때 미래 대기질 정보를 예측하는 데 새로운 한계를 제시하며 이 문제를 극복해야할 필요가 있다. In practice, time series data change depending on weather conditions and seasonality, resulting in variability between old and new data, making it a forecasting approach that is only applicable under certain conditions. In the case of other subways in the metropolitan area, relatively few data are available due to regular monitoring, difficult monitoring environments, or expensive measuring equipment. This presents new limitations in predicting future air quality information when data are insufficient, and this problem needs to be overcome.

앞서 언급한 지하철 PM 예측의 문제는 전이학습으로 알려진 기계 학습의 한 분야와 밀접하게 관련되어 있다. 이 프레임워크는 한 영역에서 다른 관련 영역으로 작업에 대한 지식을 사용하고 이전할 수 있도록 한다. 이전에는 건물의 예측 문제를 해결하기 위해 전이 학습이 적용되었다. 예를 들어, 건물의 에너지 예측을 위한 전이 학습 프레임워크를 사용했다. 그들은 다양한 수준의 데이터 가용성으로 실험을 수행했으며 전이 학습 기반 방법론이 예측 오류를 최대 78%까지 줄일 수 있다고 결론지었다. Grubinger et al. (2017)은 주거용 건물의 온도 예측을 위해 일반화된 온라인 전이 학습을 사용했다. 그들은 여러 유사한 소스에서 학습하면 예측 성능과 대상 도메인의 일반화 능력을 향상시킬 수 있다고 결론지었다. 또한 일반 RNN은 훈련 단계에서 데이터 부족 문제에 취약하다. 따라서 사전 훈련된 전이 학습 기반 변형과 비교하여 PM 분포의 시간적 순서를 식별하는데 더 낮은 적합성을 보여준다.The aforementioned problem of subway PM prediction is closely related to a branch of machine learning known as transfer learning. This framework enables the use and transfer of knowledge about work from one domain to other related domains. Previously, transfer learning was applied to solve the prediction problem of buildings. For example, we used a transfer learning framework for energy prediction of buildings. They conducted experiments with different levels of data availability and concluded that a transfer learning-based methodology could reduce prediction errors by up to 78%. Grubinger et al. (2017) used generalized online transfer learning for temperature prediction of residential buildings. They concluded that learning from multiple similar sources can improve the predictive performance and generalization ability of the target domain. Also, regular RNNs are vulnerable to the lack of data problem in the training phase. Therefore, it shows a lower suitability for discriminating the temporal order of the PM distribution compared to the pre-trained transfer learning-based transformation.

기존의 인공지능 기반 예측 시스템은 축척된 센서 데이터에 상당히 의존하고 있으며, 새로운 모니터링 환경 구축 및 센서가 설치될 경우 성능 저하가 발생할 수 있는 단점이 있다. Existing artificial intelligence-based prediction systems rely heavily on accumulated sensor data, and have the disadvantage that performance degradation may occur when a new monitoring environment is built and sensors are installed.

대한민국 등록특허 10-2196091Korean Registered Patent No. 10-2196091 대한민국 공개특허 10-2021-0108826Republic of Korea Patent Publication 10-2021-0108826 대한민국 공개특허 10-2021-0086786Republic of Korea Patent Publication 10-2021-0086786 대한민국 공개특허 10-2019-010693Republic of Korea Patent Publication 10-2019-010693

따라서 본 발명은 상기와 같은 종래의 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 실시예에 따르면, 인공지능 기술 중 전이학습(transfer learning, TL) 기반의 residual neural network (ResNet)을 기반으로 한 지하역사의 PM2.5 예측 시스템을 제공하는데 그 목적이 있다. Therefore, the present invention has been devised to solve the above conventional problems, and according to an embodiment of the present invention, transfer learning (transfer learning, TL) based residual neural network (ResNet) based on artificial intelligence technology Its purpose is to provide a PM 2.5 prediction system for underground stations.

본 발명의 실시예에 따르면, 전이학습 기반의 ResNet을 이용하여 1시간 이후의 PM2.5 농도를 예측하고, 또한 지하역사의 측정 PM2.5 데이터가 각각 20%, 40%, 60%, 80% 가용할 때의 시나리오에 대해 TL-ResNet을 이용한 예측 성능 평가를 통해 기존 예측 시스템 대비 성능이 개선됨을 확인하였다. According to an embodiment of the present invention, the PM 2.5 concentration after 1 hour is predicted using transfer learning-based ResNet, and the measured PM 2.5 data of the underground station are available at 20%, 40%, 60%, and 80%, respectively. It was confirmed that the performance was improved compared to the existing prediction system through the evaluation of the prediction performance using TL-ResNet for the scenario of the time.

그리고 본 발명의 실시예에 따르면, 국내 지하역사에 데이터를 이용해 검증하여, 예측 성능을 40%이상 개선시킬 수 있으며, 환기 시스템에 적용할 경우 예측된 데이터를 활용하여 실내 PM2.5 농도를 29% 개선시킬 수 있는, 인공지능 전이학습을 이용한 미세먼지 예측, 환기제어시스템 및 방법을 제공하는데 그 목적이 있다. And according to the embodiment of the present invention, it is possible to improve the prediction performance by more than 40% by verifying using data in domestic underground stations, and when applied to the ventilation system, the indoor PM 2.5 concentration is improved by 29% using the predicted data. The purpose is to provide a fine dust prediction, ventilation control system and method using artificial intelligence transfer learning that can be performed.

또한 본 발명의 실시예에 따르면, 국내 및 국외 지하역사 환기 공정 시스템에 적용하여 실내 공기질 예측 및 개선을 할 수 있으며, 다양한 환기 제어 분야에 적용될 것을 기대할 수 있고, 사업화로는 국내외 지하역사, 환경 시스템 기업 등에서 실내 환경 개선 등에 이용될 수 있는, 인공지능 전이학습을 이용한 미세먼지 예측, 환기제어시스템 및 방법을 제공하는데 그 목적이 있다. In addition, according to the embodiment of the present invention, it is possible to predict and improve indoor air quality by applying it to domestic and foreign underground station ventilation process systems, and it can be expected to be applied to various ventilation control fields. For commercialization, domestic and foreign underground stations and environmental systems The purpose is to provide a fine dust prediction, ventilation control system and method using artificial intelligence transfer learning, which can be used for indoor environment improvement in companies, etc.

한편, 본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.On the other hand, the technical problems to be achieved in the present invention are not limited to the above-mentioned technical problems, and other technical problems that are not mentioned will become clear to those skilled in the art from the description below. You will be able to understand.

본 발명의 목적은 미세먼지 예측시스템에 있어서, 전이학습 기반의 예측모델을 구축하는 예측모델생성부; 및 상기 예측모델 생성부를 통해 구축된 예측모델을 기반으로 특정시간 후의 미세먼지농도를 예측하는 미세먼지 예측부;를 포함하는 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템으로서 달성될 수 있다. An object of the present invention is a fine dust prediction system, comprising: a prediction model generator for building a prediction model based on transfer learning; And a fine dust prediction unit for predicting the concentration of fine dust after a specific time based on the prediction model built through the prediction model generation unit; can be achieved as a fine dust prediction system using artificial intelligence transfer learning, characterized in that it includes .

그리고 상기 예측모델은 전이학습 기반의 ResNet 예측모델인 것을 특징으로 할 수 있다. And the prediction model may be characterized in that it is a ResNet prediction model based on transfer learning.

또한 상기 특정시간은 40분 ~ 100분이고, 미세먼지데이터는 PM2.5데이터인 것을 특징으로 할 수 있다. In addition, the specific time may be 40 to 100 minutes, and the fine dust data may be PM 2.5 data.

그리고 상기 ResNet 예측모델은 예측하고자 하는 해당공간이 아닌 공간 내에서의 소스데이터를 적용하는 것을 특징으로 할 수 있다. And, the ResNet prediction model may be characterized by applying source data within a space other than the corresponding space to be predicted.

또한 상기 ResNet 예측모델을 이용하여, 다른 공간의 소스데이터를 활용해 예측 대상이 되는 대상공간의 학습데이터가 부족한 경우에도 예측 시스템을 학습시켜 예측 대상 공간에서의 특정시간 후의 PM2.5 농도를 예측하는 것을 특징으로 할 수 있다. In addition, using the ResNet prediction model, it is possible to predict the PM 2.5 concentration after a specific time in the prediction target space by learning the prediction system even when the learning data of the target space to be predicted is insufficient by using the source data of other spaces. can be characterized.

그리고 ResNet 구조는 컨볼루션 블록과, 아이덴티티 블록과, 완전 연결레이어와, 출력레이어를 포함하는 것을 특징으로 할 수 있다. Further, the ResNet structure may include a convolution block, an identity block, a fully connected layer, and an output layer.

또한 상기 ResNet 예측모델은 소스데이터에 대한 사전훈련을 통해 도출되며, 대상 공간에서 사용가능한 데이터에 대해 미세조정되는 것을 특징으로 할 수 있다. In addition, the ResNet prediction model may be derived through pre-training on source data, and may be characterized in that it is fine-tuned for data available in the target space.

그리고 상기 ResNet 예측모델은 소스데이터의 초기 레이어를 고정하여 충분한 데이터에서 PM 분포를 기억하고, 미세조정 중 손실을 최소화하여 대상공간에 적용하는 것을 특징으로 할 수 있다. In addition, the ResNet prediction model may be characterized in that the initial layer of the source data is fixed, the PM distribution is stored in sufficient data, and the loss during fine-tuning is minimized and applied to the target space.

또한 상기 ResNet 예측모델은 소스데이터를 사전 학습시킨 후, 사전 학습된 모델의 특징 추출기 매개변수를 고정하고, 고정 레이어는 예측모델이 다른 작업을 수행하도록 할당되었을 때, 레이어의 가중치가 변경되지 않은 상태로 유지하고 나머지 분류기 계층은 대상공간의 대상데이터에 대해 미세 조정되는 것을 특징으로 할 수 있다. In addition, the ResNet prediction model fixes the feature extractor parameters of the pre-trained model after pre-training the source data, and the fixed layer is in a state in which the weight of the layer is not changed when the predictive model is assigned to perform another task. , and the remaining classifier layers are fine-tuned for the target data in the target space.

그리고 상기 고정 레이어는 35 ~ 45%인 것을 특징으로 할 수 있다. And the fixed layer may be characterized in that 35 ~ 45%.

본 발명의 실시예에 따르면, 인공지능 기술 중 전이학습(transfer learning, TL) 기반의 residual neural network (ResNet)을 기반으로 한 지하역사의 PM2.5 예측 시스템을 제공할 수 있다. According to an embodiment of the present invention, it is possible to provide a PM 2.5 prediction system of an underground station based on a residual neural network (ResNet) based on transfer learning (TL) among artificial intelligence technologies.

본 발명의 실시예에 따르면, 전이학습 기반의 ResNet을 이용하여 1시간 이후의 PM2.5 농도를 예측하고, 또한 지하역사의 측정 PM2.5 데이터가 각각 20%, 40%, 60%, 80% 가용할 때의 시나리오에 대해 TL-ResNet을 이용한 예측 성능 평가를 통해 기존 예측 시스템 대비 성능이 개선됨을 확인하였다. According to an embodiment of the present invention, the PM 2.5 concentration after 1 hour is predicted using transfer learning-based ResNet, and the measured PM 2.5 data of the underground station are available at 20%, 40%, 60%, and 80%, respectively. It was confirmed that the performance was improved compared to the existing prediction system through the evaluation of the prediction performance using TL-ResNet for the scenario of the time.

그리고 본 발명의 실시예에 따른 인공지능 전이학습을 이용한 미세먼지 예측, 환기제어시스템 및 방법에 따르면, 국내 지하역사에 데이터를 이용해 검증하여, 예측 성능을 40%이상 개선시킬 수 있으며, 환기 시스템에 적용할 경우 예측된 데이터를 활용하여 실내 PM2.5 농도를 29% 개선시킬 수 있는 효과를 갖는다.In addition, according to the fine dust prediction and ventilation control system and method using artificial intelligence transfer learning according to an embodiment of the present invention, the prediction performance can be improved by more than 40% by verifying using data in domestic underground stations, and the ventilation system When applied, it has the effect of improving the indoor PM 2.5 concentration by 29% using the predicted data.

또한 본 발명의 실시예에 따른 인공지능 전이학습을 이용한 미세먼지 예측, 환기제어시스템 및 방법에 따르면, 국내 및 국외 지하역사 환기 공정 시스템에 적용하여 실내 공기질 예측 및 개선을 할 수 있으며, 다양한 환기 제어 분야에 적용될 것을 기대할 수 있고, 사업화로는 국내외 지하역사, 환경 시스템 기업 등에서 실내 환경 개선 등에 이용될 수 있는 장점을 갖는다. In addition, according to the fine dust prediction and ventilation control system and method using artificial intelligence transfer learning according to an embodiment of the present invention, indoor air quality can be predicted and improved by applying to domestic and foreign underground station ventilation process systems, and various ventilation controls It can be expected to be applied to the field, and for commercialization, it has the advantage of being used for indoor environment improvement at domestic and foreign underground stations and environmental system companies.

한편, 본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.On the other hand, the effects obtainable in the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the description below. You will be able to.

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 발명의 상세한 설명과 함께 본 발명의 기술적 사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석 되어서는 아니 된다.
도 1은 본 발명의 실시예에 따른 인공지능 전이학습을 이용한 미세먼지 예측시스템의 블록도,
도 2는 전이학습 기본원리의 모식도
도 3은 Deep ResNet(deep residual network)의 빌딩 블록 메칭,
도 4a는 E4 지하철 역에서 측정된 대기질 데이터의 변화,
도 4b는 SMS의 2호선에서 대상 지하철역의 위치.
도 5a는 C-지하철 역, 도 5b는 E3-지하철 역, 도 5c는 E4-지하철 역 및 도 5d는 D-지하철 역의 실외/실내 PM10 및 PM2.5 측정 분포 그래프,
도 6은 기능 선택을 위한 측정 변수와 플랫폼 PM2.5의 통계적 상관 관계 분석,
도 7은 ResNet의 프레임워크: (a) 활성화 기능이 있는 컨볼루션 및 ID 블록, (b) ResNet의 전체 구조,
도 8은 본 발명의 실시예에 따른 전이 학습 프레임워크에 대한 트레이닝 프로세스의 그래픽 표현,
도 9는 본 발명의 실시예에 따른 지하철 승강장에서 PM2.5 CIAI의 시퀀스 예측을 위해 수행된 방법론의 개략도,
도 10은 본 발명의 실시예에 따른 플랫폼 PM2.5 CIAI 레벨의 순차 예측 및 제어를 위해 제안된 전이 학습 기반 프레임워크의 도식적 표현,
도 11은 본 발명의 실시예에 따른 E3-지하철에서 무빙 윈도우에 의한 플랫폼 PM2.5 CIAI의 시퀀스 예측: (a) MLR, (b) S-LSTM2, (c) S-GRU2, (d) S-LSTM10, (e) S-GRU10 및 (f) ResNet,
도 12는 본 발명의 실시예에 따른 플랫폼 PM2.5 CIAI에 대한 독립형 ResNet(왼쪽) 및 TL-ResNet(오른쪽)의 다중 시퀀스 예측 성능: (a) E4 지하철, (b) C 지하철, (c) D 지하철 역,
도 13은 서로 다른 데이터 가용성 시나리오를 사용하여 E4, C 및 D-subway에서 독립 실행형 ResNet 및 TL-ResNet의 RMSE 점수 및 성능 향상 그래프,
도 14는 40% 가용 IAQ 데이터에 대한 지하철 플랫폼의 환기 반응 및 CIAI 수준 해석: (a) 예측 데이터, (b) 독립형 ResNet의 성능, (c) TL-ResNet의 성능.
The following drawings attached to this specification illustrate preferred embodiments of the present invention, and together with the detailed description of the invention serve to further understand the technical idea of the present invention, the present invention is limited only to those described in the drawings. and should not be interpreted.
1 is a block diagram of a fine dust prediction system using artificial intelligence transfer learning according to an embodiment of the present invention;
Figure 2 is a schematic diagram of the basic principle of transfer learning
3 is a building block matching of Deep ResNet (deep residual network);
4a shows changes in air quality data measured at E4 subway station;
Figure 4b is the location of the target subway station on line 2 of the SMS.
Figure 5a is a C-subway station, Figure 5b is an E3-subway station, Figure 5c is an E4-subway station, and Figure 5d is an outdoor/indoor PM10 and PM2.5 measurement distribution graph of a D-subway station,
Figure 6 is a statistical correlation analysis of measurement variables and platform PM2.5 for function selection,
Figure 7 is a framework of ResNet: (a) convolution and ID block with activation function, (b) the overall structure of ResNet,
8 is a graphical representation of a training process for a transfer learning framework in accordance with an embodiment of the present invention;
9 is a schematic diagram of a methodology performed for sequence prediction of PM2.5 CIAI at a subway platform according to an embodiment of the present invention;
10 is a schematic representation of a transfer learning-based framework proposed for sequential prediction and control of the platform PM2.5 CIAI level according to an embodiment of the present invention;
11 is a sequence prediction of platform PM2.5 CIAI by moving window in E3-subway according to an embodiment of the present invention: (a) MLR, (b) S-LSTM2, (c) S-GRU2, (d) S -LSTM10, (e) S-GRU10 and (f) ResNet;
12 shows multi-sequence prediction performance of standalone ResNet (left) and TL-ResNet (right) for platform PM2.5 CIAI according to an embodiment of the present invention: (a) E4 subway, (b) C subway, (c) D subway station,
13 is a graph of RMSE scores and performance improvement of standalone ResNet and TL-ResNet on E4, C and D-subway using different data availability scenarios;
Figure 14 shows ventilation response and CIAI level analysis of subway platform for 40% available IAQ data: (a) predicted data, (b) performance of standalone ResNet, (c) performance of TL-ResNet.

이상의 본 발명의 목적들, 다른 목적들, 특징들 및 이점들은 첨부된 도면과 관련된 이하의 바람직한 실시예들을 통해서 쉽게 이해될 것이다. 그러나 본 발명은 여기서 설명되는 실시예들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 오히려, 여기서 소개되는 실시예들은 개시된 내용이 철저하고 완전해질 수 있도록 그리고 통상의 기술자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 제공되는 것이다.The above objects, other objects, features and advantages of the present invention will be easily understood through the following preferred embodiments in conjunction with the accompanying drawings. However, the present invention is not limited to the embodiments described herein and may be embodied in other forms. Rather, the embodiments introduced herein are provided so that the disclosed content will be thorough and complete and the spirit of the present invention will be sufficiently conveyed to those skilled in the art.

본 명세서에서, 어떤 구성요소가 다른 구성요소 상에 있다고 언급되는 경우에 그것은 다른 구성요소 상에 직접 형성될 수 있거나 또는 그들 사이에 제 3의 구성요소가 개재될 수도 있다는 것을 의미한다. 또한 도면들에 있어서, 구성요소들의 두께는 기술적 내용의 효과적인 설명을 위해 과장된 것이다.In this specification, when an element is referred to as being on another element, it means that it may be directly formed on the other element or a third element may be interposed therebetween. Also, in the drawings, the thickness of components is exaggerated for effective description of technical content.

본 명세서에서 기술하는 실시예들은 본 발명의 이상적인 예시도인 단면도 및/또는 평면도들을 참고하여 설명될 것이다. 도면들에 있어서, 막 및 영역들의 두께는 기술적 내용의 효과적인 설명을 위해 과장된 것이다. 따라서 제조 기술 및/또는 허용 오차 등에 의해 예시도의 형태가 변형될 수 있다. 따라서 본 발명의 실시예들은 도시된 특정 형태로 제한되는 것이 아니라 제조 공정에 따라 생성되는 형태의 변화도 포함하는 것이다. 예를 들면, 직각으로 도시된 영역은 라운드지거나 소정 곡률을 가지는 형태일 수 있다. 따라서 도면에서 예시된 영역들은 속성을 가지며, 도면에서 예시된 영역들의 모양은 소자의 영역의 특정 형태를 예시하기 위한 것이며 발명의 범주를 제한하기 위한 것이 아니다. 본 명세서의 다양한 실시예들에서 제1, 제2 등의 용어가 다양한 구성요소들을 기술하기 위해서 사용되었지만, 이들 구성요소들이 이 같은 용어들에 의해서 한정되어서는 안 된다. 이들 용어들은 단지 어느 구성요소를 다른 구성요소와 구별시키기 위해서 사용되었을 뿐이다. 여기에 설명되고 예시되는 실시예들은 그것의 상보적인 실시예들도 포함한다.Embodiments described in this specification will be described with reference to cross-sectional views and/or plan views, which are ideal exemplary views of the present invention. In the drawings, the thicknesses of films and regions are exaggerated for effective explanation of technical content. Accordingly, the shape of the illustrated drawings may be modified due to manufacturing techniques and/or tolerances. Therefore, embodiments of the present invention are not limited to the specific shape shown, but also include changes in the shape generated according to the manufacturing process. For example, a region shown at right angles may be rounded or have a predetermined curvature. Accordingly, the regions illustrated in the drawings have attributes, and the shapes of the regions illustrated in the drawings are intended to illustrate a specific shape of a region of a device and are not intended to limit the scope of the invention. Although terms such as first and second are used to describe various elements in various embodiments of the present specification, these elements should not be limited by these terms. These terms are only used to distinguish one component from another. Embodiments described and illustrated herein also include complementary embodiments thereof.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 '포함한다(comprises)' 및/또는 '포함하는(comprising)'은 언급된 구성요소는 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다.Terminology used herein is for describing the embodiments and is not intended to limit the present invention. In this specification, singular forms also include plural forms unless specifically stated otherwise in a phrase. The terms 'comprises' and/or 'comprising' used in the specification do not exclude the presence or addition of one or more other elements.

아래의 특정 실시예들을 기술하는데 있어서, 여러 가지의 특정적인 내용들은 발명을 더 구체적으로 설명하고 이해를 돕기 위해 작성되었다. 하지만 본 발명을 이해할 수 있을 정도로 이 분야의 지식을 갖고 있는 독자는 이러한 여러 가지의 특정적인 내용들이 없어도 사용될 수 있다는 것을 인지할 수 있다. 어떤 경우에는, 발명을 기술하는 데 있어서 흔히 알려졌으면서 발명과 크게 관련 없는 부분들은 본 발명을 설명하는데 있어 별 이유 없이 혼돈이 오는 것을 막기 위해 기술하지 않음을 미리 언급해 둔다.In describing the specific embodiments below, several specific contents are prepared to more specifically describe the invention and aid understanding. However, readers who have knowledge in this field to the extent that they can understand the present invention can recognize that it can be used without these various specific details. In some cases, it is mentioned in advance that parts that are commonly known in describing the invention and are not greatly related to the invention are not described in order to prevent confusion for no particular reason in explaining the present invention.

이하에서는 본 발명의 실시예에 따른 인공지능 전이학습을 이용한 미세먼지 예측, 환기제어시스템 및 방법에 대해 설명하도록 한다. 도 1은 본 발명의 실시예에 따른 인공지능 전이학습을 이용한 미세먼지 예측시스템의 블록도를 도시한 것이다. Hereinafter, a fine dust prediction, ventilation control system and method using artificial intelligence transfer learning according to an embodiment of the present invention will be described. 1 shows a block diagram of a fine dust prediction system using artificial intelligence transfer learning according to an embodiment of the present invention.

먼저, 본 발명의 실시예에서 적용되는 인공지능 전이학습에 대해 설명하도록 한다. 도 2는 전이학습 기본원리의 모식도를 도시한 것이다. 전이학습은 이전에 학습된 지식을 활용하여 새롭지만 관련된 작업을 해결할 수 있는 프레임워크에 해당한다. 도 2에 도시된 바와 같이, 전이 학습은 관련 영역의 데이터에서 지식을 획득하여 현재 영역의 다양한 데이터 패턴으로 구성된 예측 모델링을 용이하게 한다. 이는 상당한 양의 데이터를 획득하는 데 시간이 많이 걸리거나 비용이 많이 들거나 사용할 수 없는 많은 실제 상황에서 프레임워크의 중요성을 완화한다.First, artificial intelligence transfer learning applied in an embodiment of the present invention will be described. Figure 2 shows a schematic diagram of the basic principle of transfer learning. Transfer learning is a framework that can solve new but related tasks by leveraging previously learned knowledge. As shown in Fig. 2, transfer learning facilitates predictive modeling composed of various data patterns in a current domain by acquiring knowledge from data in a relevant domain. This mitigates the importance of frameworks in many real-world situations where obtaining significant amounts of data is time consuming, expensive or unavailable.

프레임워크는 공식적으로 소스와 대상이라는 두 가지 기본 개념으로 나뉜다. 도메인 D는 D = {X, P(X)}로 주어진 두 가지 구성 요소로 구성된다. 여기서 X = {x1,., xn}은 n차원의 피쳐 공간이고, (P(X))는 X의 한계 확률 분포이다. 유사하게, 특정 도메인이 주어지면 T는 T={Y, P(Y=X)}로 정의된다. 여기서 Y는 대상 레이블이고 P(Y=X)는 주어진 X에 대한 Y의 조건부 확률이다. 위의 관계에서 소스 도메인 Ds 및 학습 태스크 TS가 주어지고 대상 도메인 DT 및 학습 태스크 TT가 있는 전이 학습은 DS DT 또는 TS TT인 경우 Ds 및 Ts의 학습으로 사전지식을 사용하여 대상 조건부 확률분포를 학습하는 것을 목표로 한다. Frameworks are formally divided into two basic concepts: sources and targets. Domain D consists of two components given by D = {X, P(X)}. where X = {x1,., xn} is the n-dimensional feature space, and (P(X)) is the marginal probability distribution of X. Similarly, given a particular domain, T is defined as T={Y, P(Y=X)}. where Y is the target label and P(Y=X) is the conditional probability of Y given X. In the above relation, given a source domain D s and learning task T S , transfer learning with a target domain D T and learning task T T is learning of D s and T s if D S D T or T S T T It aims to learn the target conditional probability distribution using prior knowledge.

전이 학습을 활용하는 방법 중 최근 머신 러닝의 성공은 네트워크 기반 전이 학습이라는 새로운 범주를 제안했다. 이 방법은 소스 도메인에서 학습된 부분 네트워크를 재사용하여 대상 도메인에서 학습을 용이하게 하여 복잡한 딥 러닝 모델을 개발할 때 가장 큰 문제(즉, 불충분한 학습 데이터)를 해결한다.Among the methods of utilizing transfer learning, the recent success of machine learning has suggested a new category called network-based transfer learning. This method solves the biggest problem (i.e., insufficient training data) when developing complex deep learning models by reusing partial networks trained in the source domain to facilitate learning in the target domain.

첫 번째 전략은 가중치 초기화에만 사전 훈련된 모델을 사용한다. 이러한 시나리오에서 특징 추출기와 분류기 계층이 모두 훈련되고 대상 도메인에서 네트워크를 미세 조정하여 최종 조정이 이루어진다. 두 번째 경우에는 사전 훈련된 모델의 특징 추출 계층이 완전히 고정되고 분류기 계층이 훈련된다. 이것은 이전에 학습한 작업을 기억하면서 도메인 적응에서 모델을 돕는다. 또한 네트워크의 최종 가중치는 대상 도메인에서 미세 조정된다. 두 번째 방식에서는 네트워크 크기가 크게 줄어들기 때문에 훨씬 적은 계산 시간이 필요하다.The first strategy uses a pretrained model only for weight initialization. In these scenarios, both the feature extractor and classifier layers are trained, and final adjustments are made by fine-tuning the network in the target domain. In the second case, the feature extraction layer of the pre-trained model is completely fixed and the classifier layer is trained. This helps the model in domain adaptation while remembering previously learned tasks. Also, the final weights of the network are fine-tuned in the target domain. In the second approach, much less computational time is required because the network size is greatly reduced.

심층 신경망 사용의 동기는 네트워크 깊이를 증가시켜 높은 수준의 추상화를 학습하는 것이다. 직관과 달리 학습 오류는 심층 신경망이 수렴함에 따라 감소하는 대신 증가하기 시작하며 이러한 문제를 네트워크 열화 문제라고 한다. Deep ResNet은 잔차(residual) 함수 F(x)를 활용하여 원하는 매핑 H(x)을 학습하는 것을 목표로 하는 잔차 블록이라고 하는 일련의 기본 블록으로 공식화된다. 따라서 잔차 블록은 H(x)의 매핑을 학습하는 대신 다른 학습 목표를 가지며 네트워크는 잔차 함수 F(x)에 의해 제공되는 대체 잔차 매핑을 학습한다. 이것은 이하의 수학식 1,2에 표시된 목적 함수의 재공식화로 이어진다. The motivation for using deep neural networks is to learn higher levels of abstraction by increasing the network depth. Contrary to intuition, the learning error starts to increase instead of decrease as the deep neural network converges, and this problem is called the network degradation problem. Deep ResNet is formulated as a series of basic blocks called residual blocks, which aim to learn the desired mapping H(x) by utilizing the residual function F(x). So instead of learning the mapping of H(x), the residual block has a different learning target and the network learns an alternative residual mapping given by the residual function F(x). This leads to the reformulation of the objective function shown in equations 1 and 2 below.

[수학식 1][Equation 1]

[수학식 2][Equation 2]

도 3은 Deep ResNet(deep residual network)의 빌딩 블록 매칭을 나타낸 것이다. 도 3에 도시된 바와 같이, 스킵 연결은 잔차 학습을 용이하게 하기 위해 다른 변환 F(x)을 스킵하기 위해 기본 블록에서 구현된다. 확률적 기울기 하강 업데이트 계산을 위해 기울기 흐름이 정의된 계산 그래프에서 스킵 연결을 사용하면 기울기가 맨 아래 레이어로 직접 역전파될 수 있다. 따라서 스킵 연결은 ResNet의 기울기 흐름 경로가 네트워크의 깊이보다 훨씬 짧음을 보장한다. 이를 통해 네트워크에서 기본 블록을 쌓으면 더 깊은 네트워크에서 일반 컨볼루션 중에 손실될 수 있는 그라디언트 소실 문제 없이 모델링 용량을 늘릴 수 있다.Figure 3 shows the building block matching of Deep ResNet (deep residual network). As shown in Fig. 3, skip concatenation is implemented in the basic block to skip other transforms F(x) to facilitate residual learning. For stochastic gradient-descent update calculations, using skip connections in a computation graph where gradient flows are defined allows gradients to be directly back-propagated to the bottom layer. Therefore, the skip connection guarantees that the gradient flow path of ResNet is much shorter than the depth of the network. This allows stacking the basic blocks in the network to increase modeling capacity without the vanishing gradient problem that can be lost during normal convolution in deeper networks.

잔차 블록의 구조는 일련의 컨볼루션 레이어와 배치 정규화 레이어, 활성화 함수로 구성된다. 컨볼루션 레이어는 필터 세트와 전체 입력에 대해 컨볼루션 연산을 수행하는 컨볼루션 커널 코어로 정의된다. 이전 계층의 특징 맵은 커널 함수에 의해 컨볼루션되고 출력은 비선형 활성화 함수에 의해 생성된다. ut로 표시된 레이어 t에서 잔차 블록의 기능 맵을 고려하면 ut-1에서 ut로의 변환은 다음의 수학식 3과 같이 주어진다. The structure of the residual block consists of a series of convolutional layers, batch normalization layers, and activation functions. A convolution layer is defined by a set of filters and a convolution kernel core that performs convolution operations on the entire input. The feature map of the previous layer is convolved by the kernel function and the output is generated by the nonlinear activation function. Considering the functional map of the residual block in layer t denoted by u t , the transformation from u t-1 to u t is given by Equation 3 below.

[수학식 3][Equation 3]

여기서 f는 스킵 연결 가중치이고 w는 컨볼루션 커널이다. where f is the skip connection weight and w is the convolution kernel.

이하에서는 본 발명의 실시예에 대해 설명하도록 한다. 건강한 IAQ 수준 유지에 대한 MOE의 강조를 고려할 때, 원격 모니터링 시스템(TMS)은 대기 질 수준을 추적하기 위해 SMS에 설치되었다. TMS는 PM10, PM2.5, CO2, 온도 및 습도를 포함한 여러 대기 오염 물질과 도량형 변수를 10분 간격으로 측정한다. 지하철 승강장 및 옥외 미세먼지 농도는 연속베타선흡착법 기반 기기로 측정하였으며, 측정기기의 사양은 표 1과 같다. 또한 열차 운행은 오전 5시부터 오전 12시까지 지하철역에서 시작되며 러시아워에는 3분, 그 외 시간에는 5~6분 간격으로 운행된다.Hereinafter, embodiments of the present invention will be described. Given the MOE's emphasis on maintaining healthy IAQ levels, a remote monitoring system (TMS) was installed in SMS to track air quality levels. The TMS measures several air pollutants and metrological variables at 10-minute intervals, including PM 10 , PM 2.5 , CO 2 , temperature and humidity. The concentration of fine dust at the subway platform and outdoors was measured with a device based on the continuous beta line adsorption method, and the specifications of the measuring device are shown in Table 1. In addition, train service starts from the subway station from 5:00 am to 12:00 am, and runs every 3 minutes during rush hour and every 5 to 6 minutes at other times.

[표 1] 대기질 측정기 사양[Table 1] Air quality meter specifications

본 발명의 실시예에서는 2018년 5월 1일부터 13일까지 SMS 2호선 4개 지하철역(C, E3, E4, D)의 승강장과 옥외 위치를 측정하였다. 도 4a는 E4-지하철역에서 시계열로 표현된 각 측정변수의 변화를 보여준다. 도 4b는 SMS의 2호선에서 대상 지하철역의 위치를 보여준다. 또한, 지하철 사양 및 기본 측정통계는 <표 2>와 같다.In the embodiment of the present invention, the platforms and outdoor locations of four subway stations (C, E3, E4, and D) of SMS Line 2 were measured from May 1 to 13, 2018. Figure 4a shows the change of each measured variable expressed as a time series at the E4-subway station. Figure 4b shows the location of the target subway station on line 2 of the SMS. In addition, subway specifications and basic measurement statistics are shown in <Table 2>.

[표 2] - 대상 지하철역의 PM2.5 및 PM10 사양 및 기본 통계[Table 2] - PM2.5 and PM10 specifications and basic statistics of target subway stations

도 5a는 C-지하철 역, 도 5b는 E3-지하철 역, 도 5c는 E4-지하철 역 및 도 5d는 D-지하철 역의 실외/실내 PM10 및 PM2.5 측정 분포 그래프를 나타낸 것이다. FIG. 5A is C-subway station, FIG. 5B is E3-subway station, FIG. 5C is E4-subway station, and FIG. 5D is outdoor/indoor PM 10 and PM 2.5 measurement distribution graphs of D-subway stations.

즉 도 5는 각 관측소에서 측정기간 동안 실외(좌)와 플랫폼(우)의 PM10과 PM2.5 농도의 변화를 보여준다. 이러한 관측소의 근접성과 동일한 측정 기간으로 인해 모든 관측소에서 유사한 실외 PM 분포 경향이 관찰되었다. 한편, PM의 주간 거동은 승강장에서 볼 수 있으며, 승객이 몰리는 오전과 저녁 러시아워에 최대 농도를 보이며 승강장에서 열차 빈도가 증가한다. 플랫폼 PM 농도는 실외 요인의 영향을 받으며 실외 여건이 좋지 않을 때 높아진다. PM의 유사한 변형에도 불구하고 모양, 구조 및 승객 흐름과 같은 각 지하철역의 고유한 특성은 각 역에서 약간 다른 IAQ 역학을 초래한다. 플랫폼 PM2.5에 대한 여러 변수의 영향을 고려하여 IAQ 데이터 간의 통계적 상관 관계를 결정하기 위해 예비 분석을 수행해야 한다. 또한 주변 관측소의 PM 분포를 분석하여 공간적 상관관계를 분석한다.That is, FIG. 5 shows changes in PM 10 and PM 2.5 concentrations of outdoor (left) and platform (right) during the measurement period at each observation station. Due to the proximity of these stations and the same measurement period, similar outdoor PM distribution trends were observed for all stations. On the other hand, the daytime behavior of PM can be seen at the platform, and the train frequency increases at the platform with the highest concentration in the morning and evening rush hours when passengers are crowded. Platform PM concentration is influenced by outdoor factors and becomes higher when outdoor conditions are poor. Despite the similar variations of PM, the unique characteristics of each subway station, such as shape, structure and passenger flow, result in slightly different IAQ dynamics at each station. Preliminary analyzes should be performed to determine statistical correlations between the IAQ data, considering the influence of multiple variables on platform PM 2.5 . In addition, the spatial correlation is analyzed by analyzing the PM distribution of neighboring stations.

먼저, 특징 선택 과정은 사용 가능한 변수와 플랫폼 PM2.5 농도 간의 Pearson 상관 계수(PCC)를 계산하여 영향을 주는 변수를 결정하고 중복 변수를 제외하여 수행된다. 도 6은 기능 선택을 위한 측정 변수와 플랫폼 PM2.5의 통계적 상관 관계 분석을 보여준다. 지하철 승강장에서 PM2.5의 변화는 여러 실내 및 실외 변수에 의해 영향을 받는다. 따라서 단일 변수로 정의되지 않는 복잡한 역학을 형성한다. PCC 값은 플랫폼 PM2.5가 OPM10 및 OPM2.5 농도와 상대적으로 높은 양의 상관관계가 있음을 보여주며, 이는 플랫폼으로의 실외 오염물질이 침투되었기 때문이다. PM2.5와 PM10 농도 사이의 매우 높은 상관관계는 이들이 동일한 출처에서 생성되었음을 시사한다. 플랫폼 CO2 수준은 높은 열차 빈도와 아침 및 저녁 러시아워 동안의 승객 밀도에 의해 영향을 받는다.First, the feature selection process is performed by calculating the Pearson correlation coefficient (PCC) between the available variables and the platform PM 2.5 concentration to determine the influencing variables and excluding redundant variables. Figure 6 shows the statistical correlation analysis of measurement variables for function selection and platform PM2.5. Changes in PM2.5 at subway platforms are influenced by several indoor and outdoor variables. Thus, it forms a complex dynamic that is not defined by a single variable. The PCC values show that the platform PM 2.5 has a relatively high positive correlation with the OPM 10 and OPM 2.5 concentrations, due to outdoor contaminant penetration into the platform. The very high correlation between PM 2.5 and PM 10 concentrations suggests that they originate from the same source. Platform CO 2 levels are influenced by high train frequency and passenger density during morning and evening rush hours.

열차 주파수는 차례로 레일-휠-브레이크 마모로 인해 발생하는 PM2.5 입자와 지하철 승강장에서 입자의 재현탁으로 이어진다. 이 플랫폼 CO2 수준 정보는 러시아워를 반영하고 PM2.5 시계열 데이터의 고유 패턴 정보를 제공할 수 있다. 온도와 습도는 플랫폼 PM2.5 농도에 큰 영향을 미치지 않는 것으로 나타났으며 이는 기존 연구와 유사하다. 또한 예측 프레임워크에 대한 중복 입력을 줄이기 위해 0.5보다 큰 PCC 점수(즉, 중간에서 높은 상관 관계)를 갖는 영향 변수를 선택했다. 따라서 실외 PCC 분석을 기반으로 플랫폼 PM10과 플랫폼 CO2가 있는 PM2.5가 미래 플랫폼 PM2.5 농도를 예측하기 위해 선택되었다.Train frequency, in turn, leads to PM2.5 particles caused by rail-wheel-brake wear and resuspension of particles on subway platforms. This platform CO 2 level information can reflect rush hour and provide unique pattern information for PM 2.5 time series data. Temperature and humidity did not appear to have a significant effect on the platform PM 2.5 concentration, which is similar to previous studies. We also selected influence variables with PCC scores greater than 0.5 (i.e., moderate to high correlation) to reduce redundant input to the prediction framework. Therefore, based on outdoor PCC analysis, platform PM 10 and platform PM 2.5 with CO 2 were selected to predict future platform PM 2.5 concentrations.

또한 4개 관측소의 실외 및 실내 미세먼지 농도 사이의 공간적 상관관계 분석을 수행하였다. 특히 주변 관측소에서 OPM 농도의 상관관계는 0.61~0.95로 나타났다. 이는 이들 지하철역의 OPM이 유사한 소스에서 발생함을 시사한다. 또한, 다른 스테이션의 플랫폼 PM10 및 PM2.5에 대한 스테이션의 OPM10 및 OPM2.5 종속성은 각각 0.38~0.68 및 0.38~0.69 범위에 있었다. 주변 관측소와의 OPM의 PCC는 거리가 증가함에도 불구하고 여전히 높은 측점 C와 E4 간의 상관관계를 제외하고는 거리가 증가함에 따라 감소하였다. PM 농도 사이의 이러한 강력한 공간 상관 관계는 단일 모델이 PM2.5 농도를 예측하는 데 허용 가능한 성능을 제공할 수 있음을 시사한다. 그러나 각 위치의 개별 역학은 모델의 일반화 성능에 영향을 줄 수 있다.In addition, a spatial correlation analysis was performed between the outdoor and indoor fine dust concentrations of the four observation stations. In particular, the correlation between OPM concentrations at nearby stations was 0.61 to 0.95. This suggests that the OPMs of these subway stations originate from similar sources. In addition, the OPM 10 and OPM 2.5 dependencies of stations on platforms PM 10 and PM 2.5 of other stations ranged from 0.38 to 0.68 and 0.38 to 0.69, respectively. OPM's PCC with neighboring stations decreased with increasing distance, except for the correlation between points C and E4, which was still high despite increasing distance. These strong spatial correlations between PM concentrations suggest that a single model can provide acceptable performance in predicting PM 2.5 concentrations. However, the individual dynamics of each location can affect the generalization performance of the model.

이하에서는 플랫폼 CIAI(PM2.5)에 대한 예측 프레임워크에 대해 설명하도록 한다. 지하철역에서 환기 시스템은 외부로부터 신선한 공기를 유입시켜 IAQ를 조절하며 현재 PM 수준을 분산시키기 위해 환기 시스템에 필요한 시간이 있다. 또한 환기 제어에서는 일반적으로 1시간의 작동 기간이 실행된다. 본 발명의 실시예에서 측정은 10분 단위로 이루어지기 때문에 시간별 분해능에서 여러 PM2.5 농도의 조기 탐지를 추적하는 시퀀스 예측 접근 방식은 지점 간 예측보다 실행 가능하다. 따라서 시계열예측모형의 타당성과 적용성을 높이기 위해 무빙 윈도우 개념을 활용하였다. 예를 들어, 다음 06(1시간) 플랫폼 PM2.5 값은 이웃 데이터의 시간 패턴을 식별하기 위해 선택된 변수의 과거 2시간 관찰을 보고 예측할 수 있다. 무빙 윈도우의 크기는 되돌아볼 과거 측정값과 예측할 미래 관찰값에 의해 정의된다. 또한, 본 발명의 실시예에서는 Keras 딥러닝 패키지를 이용하여 신경망 모델을 개발하였으며, 세부적인 알고리즘은 다음과 같다.Hereinafter, the prediction framework for the platform CIAI (PM2.5) will be described. In a subway station, the ventilation system draws in fresh air from the outside to regulate the IAQ, and there is time required for the ventilation system to disperse the current PM level. Also in ventilation control, an operating period of 1 hour is typically implemented. A sequence prediction approach that tracks early detection of several PM 2.5 concentrations at hourly resolution is more viable than point-to-point prediction, because in our example, measurements are made in 10-minute increments. Therefore, the moving window concept was used to increase the validity and applicability of the time series prediction model. For example, the next 06 (1 hour) Platform PM 2.5 value can be predicted by looking at the past 2 hour observations of the variable selected to identify the temporal pattern of the neighborhood data. The size of the moving window is defined by past measurements to look back on and future observations to predict. In addition, in the embodiment of the present invention, a neural network model was developed using the Keras deep learning package, and the detailed algorithm is as follows.

도 7은 ResNet의 프레임워크: (a) 활성화 기능이 있는 컨볼루션 및 ID 블록, (b) ResNet의 전체 구조를 도시한 것이다. IAQ 시계열 데이터로부터 특징을 효과적으로 학습하기 위해 제안된 ResNet 구조는 도 7에 제시된 ResNet-50 구조의 수정된 버전이다. 입력 레이어는 2차원 매트릭스 형태이며, 크기는 5개의 입력 변수와 무빙 윈도우에 의해 주어진 12개의 과거 관측값에 의해 정의된다. 여기서 각 기본 컨볼루션 블록은 3개의 컨볼루션 레이어 스택, 일괄 정규화, 활성화 함수 및 바로 가기 연결로 구성된다. 과적합을 피하기 위해 정규화 방법으로 드롭아웃 레이어도 컨볼루션 블록에 추가되었다.Figure 7 shows the framework of ResNet: (a) convolution and ID block with activation function, (b) the overall structure of ResNet. The ResNet structure proposed to effectively learn features from IAQ time series data is a modified version of the ResNet-50 structure presented in FIG. The input layer is in the form of a two-dimensional matrix, and its size is defined by 5 input variables and 12 past observations given by a moving window. Here, each basic convolution block consists of a stack of three convolutional layers, batch normalization, an activation function, and a shortcut connection. A dropout layer was also added to the convolution block as a regularization method to avoid overfitting.

도 7(a)는 ResNet 구조의 컨볼루션(convolutional) 및 아이덴티티(identity) 블록을 보여준다. 3쌍의 convolutional, identity 블록이 주 네트워크 구조에 쌓여 있으며 ResNet 모델의 전체 아키텍처는 도 7(b)에 나와 있다. "dying ReLU" 문제로 인한 제로 그래디언트를 고려하여 다양한 활성화 함수(즉, ReLU, SeLU 및 ELU)가 네트워크의 훈련 프로세스를 향상시키기 위해 컨볼루션 블록의 다른 레이어에 사용되었다. 아이덴티티 및 컨볼루션 블록 다음에는 64개의 뉴런이 있는 완전 연결 레이어와 지하철 플랫폼에서 PM2.5 CIAI의 미래 시퀀스를 나타내는 6개의 뉴런이 있는 출력 레이어가 이어진다. 이러한 방식으로 24레이어의 심층 ResNet 구조가 개발되었다. 하이퍼 매개 변수는 다음과 같다. 7(a) shows convolutional and identity blocks of a ResNet structure. Three pairs of convolutional, identity blocks are stacked in the main network structure, and the overall architecture of the ResNet model is shown in Fig. 7(b). Considering the zero gradient due to the “dying ReLU” problem, various activation functions (i.e. ReLU, SeLU and ELU) were used in different layers of the convolution block to improve the training process of the network. The identity and convolution blocks are followed by a fully connected layer with 64 neurons and an output layer with 6 neurons representing the future sequence of PM 2.5 CIAI on the metro platform. In this way, a 24-layer deep ResNet structure was developed. The hyperparameters are:

- Loss function: mean squared error (mse) -Loss function: mean squared error (mse)

- Optimizer: Adam- Optimizer: Adam

- Batch Size: 18 (3 h) - Batch Size: 18 (3 h)

- Epochs: 100 - Epochs: 100

- Learning rate: dynamic (rate reducing factor 0.01 and patience of 10 epochs) - Learning rate: dynamic (rate reducing factor 0.01 and patience of 10 epochs)

- Dropout rate: 0.2 (convolution block) - Dropout rate: 0.2 (convolution block)

이하에서는 본 발명의 실시예에 따른 메모리 게이트 순환 신경망에 대해 설명하도록 한다. 본 발명의 실시예에서는 RNN으로 표현되는 반복 단위의 변형(예: LSTM 및 GRU)이 적용되었다. 비교를 위해 스택형 RNN(S-RNN) 구조, 특히 스택형 LSTM(S-LSTM) 및 스택형 GRU(S-GRU) 구조를 구현했다. S-RNN에서는 여러 개의 hidden recurrent layer가 서로 겹쳐진다. 한 순환 레이어의 출력이 다음 레이어의 입력이 된다. 여기서는 두 가지 유형의 S-RNN 구조를 구성했는데, 하나는 2개의 recurrent layer(S-RNN-2)를 적층한 것이고, 다른 하나는 10개의 recurrent layer(S-RNN-10)를 적층하여 더 깊은 네트워크를 개발하는 것이다. 모든 RNN의 입력 레이어는 ResNet 구조와 동일했고 나머지 아키텍처는 1) 은닉 표현을 저장하기 위한 64개의 뉴런이 있는 2/10개의 은닉 레이어와 2) 예측 순서를 나타내는 6개의 뉴런이 있는 출력 레이어로 정의되었다. 나머지 하이퍼파라미터는 다음과 같이 주어진다. Hereinafter, a memory gate recurrent neural network according to an embodiment of the present invention will be described. In the embodiment of the present invention, modifications of repeating units represented by RNNs (eg, LSTM and GRU) are applied. For comparison, we implemented a stacked RNN (S-RNN) structure, specifically a stacked LSTM (S-LSTM) and a stacked GRU (S-GRU) structure. In S-RNN, several hidden recurrent layers overlap each other. The output of one recurrent layer becomes the input of the next layer. Here, we constructed two types of S-RNN structures, one by stacking two recurrent layers (S-RNN-2), and the other by stacking 10 recurrent layers (S-RNN-10) for deeper to develop a network. The input layers of all RNNs were identical to the ResNet structure, and the rest of the architecture was defined as 1) 2/10 hidden layers with 64 neurons to store the hidden representations and 2) output layers with 6 neurons representing the prediction order. . The rest of the hyperparameters are given as:

- Loss function: mse -Loss function: mse

- Optimizer: Adam - Optimizer: Adam

- Batch Size: 18 (3 h) - Batch Size: 18 (3 h)

- Epochs: 100 - Epochs: 100

- Learning rate: dynamic (rate reducing factor 0.01 and patience of 10 epochs) - Learning rate: dynamic (rate reducing factor 0.01 and patience of 10 epochs)

- Dropout rate: 0.2 - Dropout rate: 0.2

전이 학습을 위한 설정 및 구현에 대해 설명하면, 본 발명의 실시예에서는 지하철 IAQ 데이터 부족 문제를 해결하기 위해 전이 학습을 활용하는 데 중점을 둔다. 이전 학습 프레임워크는 지하철역이 다른 지하철 환경(즉, 대상 도메인)으로 이전할 수 있는 신뢰할 수 있고 수용 가능한 예측 모델을 개발하기에 충분한 모니터링 데이터(즉, 소스 도메인)가 있다는 가정 하에 작동한다. 본 발명의 주요 목표는 고도의 모니터링 시스템이나 새로 개발된 지하철역이 부족하여 훈련 데이터가 부족한 경우 예측 및 환기 제어 성능을 향상시키는 것이다.Describing the setting and implementation for transfer learning, the embodiment of the present invention focuses on utilizing transfer learning to solve the subway IAQ data shortage problem. The transfer learning framework works under the assumption that there is sufficient monitoring data (ie source domain) to develop a reliable and acceptable predictive model for a subway station to transfer to another subway environment (ie target domain). The main goal of the present invention is to improve prediction and ventilation control performance when training data is lacking due to lack of advanced monitoring systems or newly developed subway stations.

도 8은 본 발명의 실시예에 따른 전이 학습 프레임워크에 대한 트레이닝 프로세스의 그래픽 표현이다. 전이 학습 하부 구조는 도 8과 같은 네트워크 기반 훈련 방법론을 채택하여 개발되었다. 전이 모델의 미세 조정을 설명하기 위해 소스 데이터 세트(Xs, Ys)에서 작업을 수행하기 위한 특징 추출기 및 대상 데이터세트(XT, YT)에서 분류기의 네트워크 매개 변수를 각각 θS1 및 θS2로 간주하고 θT1 및 θT2는 작업에 대한 매개 변수로 간주했다. 8 is a graphical representation of a training process for a transfer learning framework in accordance with an embodiment of the present invention. The transfer learning infrastructure was developed by adopting the network-based training methodology as shown in FIG. To account for the fine-tuning of the transition model, we set the network parameters of the feature extractor to perform operations on the source dataset (X s , Y s ) and the classifier on the target dataset (X T , Y T ) to θ S1 and θ respectively. S2 and θ T1 and θ T2 as parameters for the task.

먼저 충분한 데이터가 있는 지하철역에서 독립형 모델을 사전 학습시킨 후 사전 학습된 모델의 특징 추출기 매개변수를 동결했다. 고정된 레이어는 모델이 다른 작업을 수행하도록 할당되었을 때 레이어의 가중치가 변경되지 않은 상태로 유지되었음을 나타낸다. 나머지 분류기 계층은 새로운 지하철역의 데이터에 대해 미세 조정되었다. 이러한 관점에서 모델은 초기 레이어를 동결하여 충분한 데이터에서 PM 분포를 기억하고 미세 조정 중 손실을 최소화하여 다음 지하철역의 역학에 적용한다. 또한, 미세 조정을 통해 얻은 최적의 매개변수 θ는 수학식 4로 표현된다. First, a standalone model was pretrained at a subway station with sufficient data, and then the feature extractor parameters of the pretrained model were frozen. A frozen layer indicates that the layer's weights remained unchanged when the model was assigned to perform another task. The rest of the classifier layer was fine-tuned for data from the new subway station. From this point of view, the model memorizes the PM distribution from enough data by freezing the initial layer and applies it to the dynamics of the next subway station with minimal loss during refinement. In addition, the optimal parameter θ obtained through fine tuning is expressed by Equation 4.

[수학식 4][Equation 4]

종합실내공기질지수(CIAI)는 일반 대중이 IAQ 상태 및 관련 건강 위험을 이해하는 도구로 설계되었다. CIAI는 여러 실내 공기 오염물질의 건강 위험도를 양호, 보통, 민감한 그룹에 대한 건강에 해로움, 건강에 해로움, 매우 건강에 해로움 및 위험한 조건의 값으로 6단계 우려로 분류한다.The Comprehensive Indoor Air Quality Index (CIAI) is designed as a tool for the general public to understand IAQ status and associated health risks. The CIAI categorizes the health risks of several indoor air pollutants into six levels of concern, with values of unhealthy, unhealthy, very unhealthy, and dangerous conditions for good, moderate, and sensitive groups.

각 실내 대기오염물질에 대한 CIAI는 주어진 식 5로 계산할 수 있다. The CIAI for each indoor air pollutant can be calculated by the given Equation 5.

[수학식 5][Equation 5]

여기서 BP와 I는 각각의 건강 우려 수준에 대한 농도 및 지수 중단점이다. LO 및 HI는 각 지수의 상한 및 하한을 나타낸다. 또한 Cp는 특정 오염 물질의 농도를 식별한다.where BP and I are the concentration and exponential breakpoints for each level of health concern. LO and HI represent the upper and lower bounds of each index. C p also identifies the concentration of a particular contaminant.

예측 방법론의 효율성은 4가지 성과 지표를 사용하여 평가되었다. 여기에는 평균 제곱근 오차(RMSE), 절대 평균 오차(MAE), 평균 절대 백분율 오차(MAPE) 및 결정 계수(R2)가 포함된다. 이러한 측정항목은 다음의 수학식 6 내지 9와 같이 제공된다.The effectiveness of the forecasting methodology was evaluated using four performance indicators. These include root mean square error (RMSE), mean absolute error (MAE), mean absolute percentage error (MAPE) and coefficient of determination (R 2 ). These measurement items are provided as in Equations 6 to 9 below.

[수학식 6][Equation 6]

[수학식 7][Equation 7]

[수학식 8][Equation 8]

[수학식 9][Equation 9]

여기서 n은 테스트 관찰 횟수, yi는 PM2.5의 관찰된 CIAI, yi*는 예측된 CIAI 값dl다. 오류 메트릭 값이 낮고 R2 값이 높을수록 정확도와 예측 성능이 더 높음을 나타낸다.where n is the number of test observations, y i is the observed CIAI of PM 2.5 , and yi* is the predicted CIAI value dl. Lower error metric values and higher R 2 values indicate higher accuracy and better prediction performance.

이하에서는 본 발명의 실시예에서 제안된 예측 방법론에 대해 설명하도록 한다. 도 9는 본 발명의 실시예에 따른 지하철 승강장에서 PM2.5 CIAI의 시퀀스 예측을 위해 수행된 방법론의 개략도를 도시한 것이다. 본 발명의 실시예에 따른 예측 프레임 워크는 세가지 주요 단계로 나누어 진다. Hereinafter, a prediction methodology proposed in an embodiment of the present invention will be described. 9 shows a schematic diagram of a methodology performed for sequence prediction of PM 2.5 CIAI at a subway platform according to an embodiment of the present invention. The prediction framework according to an embodiment of the present invention is divided into three main steps.

먼저 PM2.5의 미래 정보를 관련 건강 위험 측면에서 직접 정량화하기 위해 앞서 언급한 예비 데이터 분석에서 선정된 입력 변수를 CIAI로 변환하였다. CIAI의 정량화는 또한 IAQ 역학에서 변수의 기여도에 대한 이해를 제공한다. 그런 다음 무빙윈도우 개념을 사용하여 CIAI에서 추적한 일련의 PM2.5 농도를 예측하여 실현 가능한 예측 접근 방식을 보장했다. 무빙 윈도우는 이웃 데이터의 복잡한 패턴을 식별하기 위해 12개의 과거 관찰(2시간)을 선택하여 구성했으며 6개의 데이터 포인트(1시간)를 예측했다.First, in order to directly quantify the future information of PM 2.5 in terms of related health risks, the input variables selected in the preliminary data analysis mentioned above were converted into CIAI. Quantification of CIAI also provides an understanding of the contribution of variables in IAQ dynamics. The moving window concept was then used to predict a series of PM 2.5 concentrations tracked by CIAI, ensuring a feasible forecasting approach. A moving window was constructed by selecting 12 past observations (2 h) to identify complex patterns in the neighborhood data and predicted 6 data points (1 h).

두 번째 단계에서는 데이터 세트를 훈련(80%) 세트와 테스트(20%) 세트로 나눈다. 4개의 다른 지하철역에서 RNN과 CNN 알고리즘으로 다중 시퀀스 예측을 수행하여 가장 적합한 구조를 선택했다. RNN 및 CNN 구조에는 각각 S-LSTM-2, S0LSTM-10, S-GRU-2, S-GRU-10 및 ResNet-24의 구현이 포함된다. 또한 기계 학습 모델과의 비교를 위해 다중 선형 회귀(MLR) 모델도 포함되어 있다. 각 스테이션의 구조 성능은 앞서 언급한 메트릭을 사용하여 비교되었다. In the second step, the data set is divided into a training (80%) set and a test (20%) set. Multiple sequence prediction was performed with RNN and CNN algorithms at four different subway stations to select the most suitable structure. RNN and CNN architectures include implementations of S-LSTM-2, S0LSTM-10, S-GRU-2, S-GRU-10 and ResNet-24, respectively. A multiple linear regression (MLR) model is also included for comparison with machine learning models. The structural performance of each station was compared using the aforementioned metrics.

셋째, 적절한 프레임워크가 선택되면 전이 학습 하위 구조가 부족한 데이터 문제를 해결하기 위해 예측 알고리즘과 결합된다. 제안된 전이 학습 기반 방법론의 성능을 철저히 조사하기 위해 테스트 세트는 동일하게 유지하면서 데이터의 20%, 40%, 60% 및 80%가 훈련에 사용할 수 있다고 가정하여 4가지 경우를 시뮬레이션한다. 전이 학습 모델은 기지국의 데이터(소스 도메인)에 대한 사전 훈련을 통해 개발되었으며, 새로운 스테이션(대상 도메인)에서 사용 가능한 데이터에 대해 미세 조정되었다.Third, when an appropriate framework is selected, transfer learning substructures are combined with predictive algorithms to solve the problem of insufficient data. To thoroughly examine the performance of the proposed transfer learning-based methodology, we simulate four cases by assuming that 20%, 40%, 60% and 80% of the data are available for training, while keeping the test set the same. The transfer learning model was developed through pre-training on data from the base station (source domain) and fine-tuned on the data available at the new station (target domain).

마지막으로 모델의 일반화 능력을 고려하였다. 이 절차 뒤에 있는 직관은 과거 학습 경험을 잃지 않고 다양한 IAQ 작업 환경에서 PM2.5 분포를 학습하는 것이다. 따라서 더 넓은 범위에서 IAQ 역학의 복잡성을 학습한다. 독립형 모델에 대해 전송된 네트워크의 일반화 성능을 확인했다.Finally, the generalization ability of the model was considered. The intuition behind this procedure is to learn the PM2.5 distribution in various IAQ work environments without losing past learning experience. Thus, it learns the complexity of IAQ dynamics in a wider range. We checked the generalization performance of the transmitted network for stand-alone models.

지하철 환기 제어 시스템은 지하철 승강장에서 통근자의 건강 위험 노출과 지하철역의 에너지 수요를 줄이는 데 중요한 역할을 한다. 미래 공기질 데이터의 신뢰성은 환기 시스템의 성능에 상당한 영향을 미친다. 잘못된 정보는 더 높은 인버터 주파수(60Hz)에 의한 과도한 에너지 수요 또는 통근자에게 낮은 인버터 주파수(20Hz)에서 위험한 IAQ 환경으로 이어질 수 있다. 따라서 미래 대기질 정보를 활용한 환기제어시스템 평가의 목적은 전이 학습 기반 프레임워크와 비교하여 환기 성능에 대한 IAQ 데이터가 불충분한 독립형 모델의 제어 의미를 평가하는 것이다. Subway ventilation control systems play an important role in reducing the health risk exposure of commuters on subway platforms and the energy demand of subway stations. The reliability of future air quality data has a significant impact on the performance of ventilation systems. Misinformation can lead to excessive energy demand by higher inverter frequencies (60 Hz) or hazardous IAQ environments at lower inverter frequencies (20 Hz) to commuters. Therefore, the purpose of the ventilation control system evaluation using future air quality information is to evaluate the control meaning of a stand-alone model with insufficient IAQ data on ventilation performance compared to a transfer learning-based framework.

독립형 모델과 이전 모델의 예측 데이터에 따른 환기 제어 응답을 비교했다. 여기에서는 두 가지 시나리오가 고려되었다. (1) 새 스테이션에서 40%의 가용 IAQ 데이터 (2) 80%의 사용 가능한 데이터. 이와 관련하여 SMS의 2호선에 대한 IAQ 시스템은 이러한 시나리오에서 환기 시스템의 거동을 평가하기 위해 인정되어야 한다. Loy-Benitez et al.은 환기 요구량과 수학식 10의 전달 함수(Gp)에 의해 주어진 PM10 농도 간의 관계를 변환하는 SMS의 2호선에 대한 지하철 IAQ 프로세스에 대한 수학적 모델을 제안했다.Ventilation control responses according to the predicted data of the stand-alone model and the previous model were compared. Two scenarios are considered here. (1) 40% IAQ data available on the new station; (2) 80% available data. In this regard, the IAQ system for Line 2 of the SMS should be accepted to evaluate the behavior of the ventilation system in this scenario. Loy-Benitez et al. proposed a mathematical model for the metro IAQ process for SMS's Line 2 that transforms the relationship between ventilation demand and PM10 concentration given by the transfer function (Gp) in Equation 10.

[수학식 10][Equation 10]

서울 지하철 2호선의 PM2.5/PM10 질량비를 0.80으로 계산한 경우, PM2.5 농도와 환기 에너지 수요를 연관시키는 전달 함수는 수학식 11과 같이, 예측 오차 최소화(PEM) 방법으로 표현될 수 있다. If the PM 2.5 /PM 10 mass ratio of Seoul Subway Line 2 is calculated as 0.80, the transfer function relating PM 2.5 concentration and ventilation energy demand can be expressed by the prediction error minimization (PEM) method as shown in Equation 11. there is.

[수학식 11][Equation 11]

도 10은 본 발명의 실시예에 따른 플랫폼 PM2.5 CIAI 레벨의 순차 예측 및 환기 제어를 위해 제안된 전이 학습 기반 프레임워크의 도식적 표현이다. 환기시스템의 반응은 CIAI에서 부여한 통근자의 건강위험도와 제어시스템의 환기에너지 수요를 기반으로 전달함수(GPM2.5)에 따라 평가하였다. 또한, 환기 에너지 소비량은 이하 수학식 12의 3차 다항식을 사용하여 추정된다.10 is a schematic representation of a transfer learning-based framework proposed for sequential prediction and ventilation control of the platform PM 2.5 CIAI level according to an embodiment of the present invention. The response of the ventilation system was evaluated according to the transfer function (GPM 2.5 ) based on the health risk of commuters assigned by CIAI and the ventilation energy demand of the control system. In addition, the ventilation energy consumption is estimated using the 3rd order polynomial of Equation 12 below.

[수학식 12][Equation 12]

직접 훈련(direct training)에 대한 성능 예측에 대해 설명하도록 한다. 지하철 승강장 무빙윈도우가 제공하는 PM2.5 시퀀스 예측은 SMS의 4개 지하철역의 역학을 고려하여 CIAI 수준의 조기 감지를 위해 수행되었다. 실험의 첫 번째 단계에서는 6개의 독립 실행형 네트워크 아키텍처의 성능을 비교했다. 이러한 네트워크에는 MLR, LSTM, GRU 및 CNN 기반 ResNet 구조 구현이 포함된다. LSTM 및 GRU 네트워크에는 S-LSTM-2, S-LSTM-10, S-GRU-2 및 S-GRU-10과 같은 얕은 변형과 심층 변형이 포함된다. 또한 예측 모델은 앞서 언급한 세부 매개변수에 따라 각 관측소에 대해 학습되었다. 직접 훈련(전이 학습 없음)의 경우 데이터의 80%가 모델 훈련에 사용되었고 20%는 평가를 위한 테스트 세트로 사용되었다.Let us explain the performance prediction for direct training. The PM 2.5 sequence prediction provided by the subway platform moving window was performed for early detection at the CIAI level by considering the dynamics of four subway stations in SMS. In the first phase of the experiment, the performance of six standalone network architectures was compared. These networks include implementations of ResNet structures based on MLR, LSTM, GRU and CNN. LSTM and GRU networks include shallow and deep variants such as S-LSTM-2, S-LSTM-10, S-GRU-2 and S-GRU-10. In addition, a predictive model was trained for each station according to the aforementioned detailed parameters. For direct training (no transfer learning), 80% of the data was used for model training and 20% was used as a test set for evaluation.

[표 3]- 직접 훈련에서 RNN 및 ResNet 구조의 성능을 예측하는 플랫폼 PM2.5 CIAI 시퀀스Table 3 - Platform PM2.5 CIAI sequences predicting the performance of RNN and ResNet structures in direct training

표 3은 각 스테이션에 대한 신경망의 메트릭 점수를 나타낸다. 성능 결과를 기반으로 유의미한 관찰이 가능하다. 결과는 MLR의 성능이 RNN 네트워크에 비해 상대적으로 낮았으며 기존 회귀 모델은 PM2.5 농도의 동적 시간 패턴을 식별할 수 없음을 알 수 있다. GRU 및 LSTM 구조의 동일한 변형에 의해 생성된 RMSE 값은 매우 유사했다. 그러나 네트워크의 깊이가 증가함에 따라 S-LSTM-10 및 S-GRU-10 네트워크의 성능은 얕은 변형에 비해 감소했다. S-LSTM-10 및 S-GRU-10의 RMSE 값은 각각 평균 16.19% 및 8.34% 감소했다. 또한, R2는 S-LSTM-10에 의한 설명된 변이의 포착이 얕은 변이에 비해 평균 50.02% 크게 감소했음을 나타낸다. 이것은 더 깊은 신경망을 훈련할 때 소실 그라디언트 문제(vanishing gradient problem)를 보여준다.Table 3 shows the metric scores of the neural network for each station. Based on the performance results, meaningful observations can be made. The results show that the performance of the MLR was relatively low compared to the RNN network, and the existing regression model could not identify the dynamic temporal pattern of PM 2.5 concentration. The RMSE values generated by the same transformation of the GRU and LSTM structures were very similar. However, as the depth of the network increased, the performance of the S-LSTM-10 and S-GRU-10 networks decreased compared to the shallow variant. The RMSE values of S-LSTM-10 and S-GRU-10 decreased by an average of 16.19% and 8.34%, respectively. In addition, R 2 indicates that the capture of the described variances by S-LSTM-10 was greatly reduced by an average of 50.02% compared to the shallow variances. This demonstrates the vanishing gradient problem when training deeper neural networks.

이에 반해 24-layer deep ResNet에서의 skip 연결은 소실 그라디언트 문제 없이 신경망 학습이 가능하며 가장 낮은 평가 점수를 보였다. RMSE 메트릭을 기반으로 제안된 ResNet 구조는 S-LSTM-2 및 S-GRU-2를 각각 평균 10.61% 및 8.91% 능가했다. 또한 R2는 27.90% 및 42.84% 향상되었습니다. 명백히 모델의 예측 성능은 역마다 다르며 E-3 지하철이 가장 낮은 RMSE(11.8826)를 나타내고 E-4 지하철이 가장 높은 R2 값(0.78)을 나타낸다. 평가 결과의 차이는 승객의 흐름, 형태(섬형 또는 면형) 및 지하철 승강장의 깊이와 같은 여러 요인에 따라 달라지는 고유한 PM 분포에 의해 영향을 받았다.On the other hand, skip connection in 24-layer deep ResNet enables neural network learning without the problem of vanishing gradients and showed the lowest evaluation score. Based on RMSE metrics, the proposed ResNet structure outperforms S-LSTM-2 and S-GRU-2 by averages of 10.61% and 8.91%, respectively. Also, R 2 improved by 27.90% and 42.84%. Clearly, the predictive performance of the model varies from station to station, with the E-3 subway showing the lowest RMSE (11.8826) and the E-4 subway showing the highest R 2 value (0.78). The difference in the evaluation results was influenced by the unique PM distribution, which varied according to several factors such as passenger flow, shape (island or plane) and depth of the subway platform.

도 11은 본 발명의 실시예에 따른 E3-지하철에서 무빙 윈도우에 의한 플랫폼 PM2.5 CIAI의 시퀀스 예측: (a) MLR, (b) S-LSTM2, (c) S-GRU2, (d) S-LSTM10, (e) S-GRU10 및 (f) ResNet으로, 음영 영역은 95% 신뢰구간을 나타낸 것이다. 여기에서 모든 네트워크 아키텍처가 무빙윈도우에 의해 주어진 PM2 분포의 시간적 변화를 포착하는 것을 목표로 한다는 것을 관찰할 수 있다. 또한 95% 신뢰 구간은 PM2.5의 비선형 시퀀스가 허용 가능한 성능으로 예측되었음을 보여준다. 그러나 LSTM과 GRU 네트워크는 ResNet 구조에 비해 약간 높은 표준편차를 보였다. 이는 PM2.5 농도의 작은 변화에도 변동하는 반응으로 해석된다. 이 결과는 또한 설명된 분산의 잘못된 캡처를 강조하는 낮은 R2로 표시된다11 is a sequence prediction of platform PM 2.5 CIAI by moving window in E3-subway according to an embodiment of the present invention: (a) MLR, (b) S-LSTM2, (c) S-GRU2, (d) S- For LSTM10, (e) S-GRU10 and (f) ResNet, the shaded area represents the 95% confidence interval. It can be observed here that all network architectures aim to capture the temporal variation of the PM2 distribution given by a moving window. Also, the 95% confidence interval shows that the nonlinear sequence of PM 2.5 is predicted with acceptable performance. However, LSTM and GRU networks showed slightly higher standard deviations compared to the ResNet structure. This is interpreted as a fluctuating response to small changes in PM 2.5 concentration. This result is also indicated by a low R 2 highlighting the false capture of the explained variance.

반면 ResNet에서 예측한 값은 큰 변동을 보이지 않았으며 95% 신뢰한계는 관측된 농도에 매우 근접하였다. 게다가, RNN 모델에 의한 변동은 오탐(false positive)을 생성하여 관찰된 CIAI 값과 비교할 때 예측 값을 과대 평가하거나 과소 평가했다. 이로 인해 한 CIAI 영역에서 다른 영역으로 이동하여 더 높은 예측 오류가 발생했다. 이러한 변동은 또한 낮은 공기 공급으로 인해 더 높은 환기 에너지 수요 또는 통근자의 건강 위험을 증가시킬 수 있다. On the other hand, the values predicted by ResNet did not show large fluctuations, and the 95% confidence limits were very close to the observed concentrations. Moreover, the variance by the RNN model generated false positives, overestimating or underestimating the predicted values when compared to the observed CIAI values. This resulted in higher prediction errors moving from one CIAI domain to another. These fluctuations may also result in higher ventilation energy demands or increased health risks for commuters due to lower air supply.

또한 VOC, 탄소질 복합물, 지각 물질 및 중금속과 같은 여러 다른 화합물도 플랫폼 PM2.5에 영향을 미칠 수 있다는 점에 유의해야 한다. 그러나 기여하는 복합체의 일부는 PM2.5 측정에 의해 자체적으로 포착된다. 따라서 영향을 미치는 IAQ 변수와 과거 PM2.5 측정값을 입력으로 고려할 때 신경망 모델은 시계열 형식으로 플랫폼 PM2.5 농도를 제어하는 고유한 물리 화학적 원리를 배우는 것을 목표로 한다. 그럼에도 불구하고 metric Score를 사용한 초기 실험과 PM2.5 CIAI 영역의 시간적 경향은 ResNet 구조가 MLR, LSTM 및 GRU 네트워크에 비해 상대적으로 성능이 우수한 것으로 나타났다. 따라서 추가 실험을 위한 전이 학습 프레임워크를 개발하기 위해 선택되었다.It should also be noted that several other compounds such as VOCs, carbonaceous compounds, crustal materials and heavy metals can also affect platform PM 2.5 . However, some of the contributing complexes are self-captured by PM 2.5 measurements. Therefore, considering the influencing IAQ variables and historical PM 2.5 measurements as inputs, the neural network model aims to learn the unique physicochemical principles controlling platform PM 2.5 concentrations in a time-series format. Nevertheless, initial experiments using metric scores and temporal trends in the PM 2.5 CIAI domain showed that the ResNet structure performed relatively well compared to MLR, LSTM and GRU networks. Therefore, it was chosen to develop a transfer learning framework for further experiments.

이하에서는 전이 학습에 대한 예측 성능 결과에 대해 설명하도록 한다. 전이 학습 프레임워크는 적절한 예측 모델을 선택한 후 개발되었다. 전이 학습의 효과를 입증하기 위해 훈련에 사용할 수 있는 제한된 데이터를 고려했으며 실험 단계는 두 부분으로 나누어 진다. 첫째, ResNet 구조는 직접 훈련하에서 사전 훈련되었고, 둘째, 베이스라인 모델은 새로운 스테이션의 불충분한 데이터를 기반으로 미세 조정되었다. E3 지하철역은 다른 지하철역들 사이에 위치하여 다른 지하철역들과 상대적으로 높은 PCC 점수를 보여 베이스라인 모델을 개발하기 위해 선정되었다. 또한 공간적으로 연결된 지하철역은 소스와 대상 도메인 간의 유사성을 강조했다. 전이 학습 실험을 위해 준비된 훈련 샘플은 표 4에 나와 있다.Hereinafter, prediction performance results for transfer learning will be described. A transfer learning framework was developed after selecting an appropriate predictive model. To demonstrate the effectiveness of transfer learning, we considered the limited data available for training and the experimental phase is divided into two parts. First, the ResNet structure was pre-trained under direct training, and second, the baseline model was fine-tuned based on the insufficient data of the new station. E3 subway station was selected to develop the baseline model because it was located between other subway stations and showed a relatively high PCC score compared to other subway stations. In addition, the spatially connected metro stations emphasized similarities between the source and target domains. The training samples prepared for the transfer learning experiments are shown in Table 4.

[표 4]-전이 학습 실험을 위해 준비된 데이터 샘플[Table 4] - Data sample prepared for transfer learning experiment

다른 스테이션에서 모델을 미세 조정하기 전에 베이스라인 모델의 고정 레이어 수가 결정되었다. 이에 대한 직관은 많은 수의 레이어를 훈련에 사용할 수 있고 새 스테이션에 과적합될 때 모델이 소스 데이터의 충분한 지식을 기억하지 못할 수 있다는 것이다. 반면에 동결된 레이어의 수가 너무 많으면 모델이 대상 스테이션에 적응할 만큼 충분한 매개변수를 업데이트하지 못하고 성능이 떨어질 수 있다. 제한된 IAQ 데이터의 영향을 설명하기 위해 테스트 세트는 비교를 위해 동일하게 유지하면서 새 스테이션의 교육을 위한 데이터 가용성을 먼저 40%로 설정했다.The number of fixed layers of the baseline model was determined before fine-tuning the model at other stations. The intuition for this is that a large number of layers can be used for training and when a new station is overfitted, the model may not remember enough knowledge of the source data. On the other hand, if the number of frozen layers is too large, the model may not be able to update enough parameters to adapt to the target station and performance may suffer. To account for the impact of the limited IAQ data, we first set the data availability for training of the new station to 40%, while keeping the test set the same for comparison.

동결된 레이어의 영향을 입증하기 위해 E-3 지하철역에서 사전 훈련된 베이스라인 ResNet의 레이어를 20%에서 70%로 동결한 다음 모델을 E4 지하철 역으로 전송했다. 표 5는 다양한 동결 레이어 수에 대한 성능 메트릭으로 평가된 전이 학습 기반 ResNet(TL-ResNet)의 예측 결과를 반영한다. 분석 결과 TL-ResNet의 예측 성능은 먼저 고정 레이어 수를 늘리면서 향상되기 시작하며 40% 고정 레이어에서 가장 높은 성능을 보인다. 고정 레이어를 더 늘리면 네트워크가 기지국 쪽으로 더 기울어지고 성능이 떨어진다. 이 분석을 기반으로 최적의 동결 레이어 수는 40%로 밝혀졌으며 이 숫자는 다른 스테이션에 대한 전이 학습 기반 모델을 추가로 개발하기 위해 선택되었다. 최적의 동결 레이어 수를 찾은 후 독립형 ResNet에 대한 TL-ResNet의 예측 기능을 측정했습니다. 베이스라인 ResNet은 먼저 E3-subway 역의 데이터로 훈련되었고 부족한 데이터를 고려하여 다른 지하철역에서 다시 훈련되었습니다. 표 6은 테스트 세트에 의해 평가된 각 스테이션에서의 독립형 ResNet 및 TL-ResNet의 성능을 보여준다. 독립형 ResNet은 제한된 데이터에서 큰 예측 오류가 있는 것으로 보인다. 대조적으로, 전이 학습 프레임워크는 시퀀스 예측을 증폭하고 독립형 아키텍처에 비해 상당한 개선을 제공했다. 40% 훈련 데이터의 가용성을 고려할 때 E4-지하철, C-지하철 및 D-지하철의 RMSE 성능은 각각 33.97%, 28.84% 및 22.80% 크게 증가하여 평균 28.54% 증가했다. 또한 C-지하철의 R2는 0.1222에서 0.5085로 크게 개선되었으며 다른 두 역은 평균 58.14% 증가했다.To demonstrate the effect of frozen layers, the layers of the baseline ResNet pretrained at E-3 station were frozen from 20% to 70% and then the model was transferred to station E4. Table 5 reflects the prediction results of transfer learning-based ResNet (TL-ResNet) evaluated with performance metrics for different numbers of freezing layers. As a result of the analysis, the prediction performance of TL-ResNet starts to improve as the number of fixed layers is increased first, and shows the highest performance at 40% fixed layers. Increasing the number of fixed layers tilts the network more towards the base station and reduces performance. Based on this analysis, the optimal number of freezing layers was found to be 40%, and this number was chosen to further develop transfer learning-based models for different stations. After finding the optimal number of frozen layers, we measured the predictive capabilities of TL-ResNet over stand-alone ResNets. The baseline ResNet was first trained with data from E3-subway station and retrained from other subway stations to account for the lack of data. Table 6 shows the performance of standalone ResNet and TL-ResNet at each station evaluated by the test set. Standalone ResNets appear to have large prediction errors on limited data. In contrast, transfer learning frameworks amplified sequence prediction and provided significant improvements over standalone architectures. Considering the availability of 40% training data, the RMSE performance of E4-Metro, C-Metro, and D-Metro increased significantly by 33.97%, 28.84%, and 22.80%, respectively, for an average increase of 28.54%. Also, R 2 of C-subway improved significantly from 0.1222 to 0.5085, with the other two stations showing an average increase of 58.14%.

[표 5]-TL-ResNet의 시퀀스 예측 성능에 대한 고정 레이어의 영향[Table 5] - Effect of fixed layer on sequence prediction performance of TL-ResNet

[표 6]-독립형 ResNet 및 TL-ResNet을 사용한 다중 시퀀스 예측(전송된 지하철역에 대한 40% 사용 가능한 데이터 포함)[Table 6] - Multi-sequence prediction using standalone ResNet and TL-ResNet (with 40% usable data for transmitted subway stations)

각 지하철역에서 확인된 CIAI 시간적 경향을 비교하여 도 12에 나타내었다. 95% 신뢰 구간은 독립형 ResNet이 특히 중간 정도의 악화된 IAQ 조건에 대해 제한된 데이터 시나리오에서 지하철 IAQ 시스템의 고유한 변화를 포착할 수 없음을 나타낸다. 대조적으로, TL-ResNet은 사용 가능한 모니터링 데이터가 부족한 경우에도 지하철 IAQ의 역동성을 포착한다. 또한 플랫폼 PM2.5 CIAI 영역을 허용 가능한 성능으로 예측하여 상당한 개선을 보여준다.CIAI temporal trends identified at each subway station are compared and shown in FIG. 12 . The 95% confidence interval indicates that the standalone ResNet cannot capture the unique changes of the subway IAQ system in limited data scenarios, especially for moderately aggravated IAQ conditions. In contrast, TL-ResNet captures the dynamics of subway IAQ even when available monitoring data is scarce. It also shows a significant improvement by predicting the platform PM 2.5 CIAI domain with acceptable performance.

도 13은 서로 다른 데이터 가용성 시나리오를 사용하여 E4, C 및 D-subway에서 독립 실행형 ResNet 및 TL-ResNet의 RMSE 점수 및 성능 향상 그래프를 도시한 것이다. 도 13은 독립형 ResNet과 TL-ResNet에 의한 RMSE 점수를 사용 가능한 훈련 데이터에서 서로 다른 컷오프 포인트로 표시하고 있다. 특히, 모든 지하철역에 대해 전이학습 기반 알고리즘을 적용한 후 RMSE 값이 감소하였다. 성능 향상은 가용 데이터 20%에서 가장 크게 나타났으며 평균 37.58% 향상되었다. 그 결과, 전이 학습의 가치는 가용한 훈련 데이터가 증가함에 따라 점차 감소하는 것으로 나타났으며, 데이터 가용성 80%에서 평균 11.30%의 성능 증가가 관찰되었다. 더 많은 훈련 데이터가 포함됨에 따라 독립형 모델이 IAQ 역학을 식별하기 시작했기 때문에 이 결과가 예상된다.Figure 13 shows RMSE scores and performance improvement graphs of standalone ResNet and TL-ResNet on E4, C and D-subway using different data availability scenarios. Figure 13 shows the RMSE scores by standalone ResNet and TL-ResNet with different cutoff points in the available training data. In particular, the RMSE value decreased after applying the transfer learning-based algorithm to all subway stations. The performance improvement was greatest at 20% of the available data, with an average improvement of 37.58%. As a result, the value of transfer learning gradually decreased as the available training data increased, and an average performance increase of 11.30% was observed at 80% data availability. This result is expected because as more training data is included, the standalone model begins to identify IAQ dynamics.

마지막으로 TL-ResNet 구조의 일반화 및 적응성을 개선하기 위해 일련의 단계로 전이 학습을 적용했다. 베이스라인 모델은 먼저 E-3 지하철에서 훈련된 후 E-4 및 C-지하철 역의 IAQ 데이터를 통해 전송되었다. 일반화된 모델을 개발하기 위해 다양한 IAQ 환경에서 학습하는 것을 목표로 하기 때문에 모든 스테이션에서 완전한 훈련 데이터를 사용할 수 있다고 고려했다. 기지국과 비교하여 독립형 ResNet의 예측 성능은 약간 다른 IAQ 역학을 구성하기 때문에 인근 스테이션에서 감소했다. 반면 2단계 학습 후 TL-ResNet의 RMSE 성능은 E4 및 C-subway에서 각각 11.08% 및 14.58% 증가했다. 그러나 기지국에서의 성능은 특정 영역에서 보다 일반화된 영역으로 이동함에 따라 4.86% 소폭 감소하였다. 또한 4번째 역(학습이 수행되지 않은 D-지하철)에서는 R2가 0.66에서 0.75로 향상되었다.Finally, transfer learning was applied in a series of steps to improve the generalization and adaptability of the TL-ResNet structure. The baseline model was first trained on the E-3 subway and then transferred over the IAQ data of the E-4 and C-metro stations. To develop a generalized model, we considered complete training data available from all stations, as we aim to learn from different IAQ environments. Compared to base stations, the prediction performance of standalone ResNets decreased at nearby stations because they constitute slightly different IAQ dynamics. On the other hand, after two-step learning, the RMSE performance of TL-ResNet increased by 11.08% and 14.58% in E4 and C-subway, respectively. However, the performance at the base station decreased slightly by 4.86% as it moved from a specific area to a more general area. Also, at the 4th station (D-subway where learning was not performed), R 2 improved from 0.66 to 0.75.

결과는 IAQ 환경의 혼합에서 학습이 이전에 학습된 동적 IAQ 정보를 기억하면서 TL-ResNet이 PM2.5의 시간적 변화를 효과적으로 식별하는 데 도움이 되는 전이 학습의 효율성을 보여준다. 따라서 TL-ResNet은 상충되는 대기 질 관계와 부족한 모니터링 데이터를 통합하는 신뢰할 수 있는 지하철 대기 질 예측 프레임워크를 나타낸다. 또한 일반화된 네트워크 아키텍처는 특정 IAQ 조건에 국한되지 않고 다양한 IAQ 환경을 식별하여 지하철 통근자의 건강 위험 영역을 정량화할 수 있다.The results show the effectiveness of transfer learning in helping TL-ResNet effectively identify temporal changes in PM 2.5 while learning in a mixture of IAQ environments remembers previously learned dynamic IAQ information. Thus, TL-ResNet represents a reliable subway air quality prediction framework that integrates conflicting air quality relationships and scarce monitoring data. In addition, the generalized network architecture is not limited to specific IAQ conditions, but can identify various IAQ environments to quantify the health risk areas of subway commuters.

앞서 언급한 실험은 독립 실행형 및 TL-ResNet 프레임워크의 성능 예측에 중점을 두었다. 이하에서는 미래 PM2.5 농도를 제어하기 위해 환기 시스템에 대한 예측된 IAQ 정보의 의미를 설명하도록 한다. 또한 환기 제어 시스템에 대한 IAQ 환경을 잘못 해석한 결과도 평가되었다.The aforementioned experiments focused on predicting the performance of standalone and TL-ResNet frameworks. Hereinafter, the meaning of the predicted IAQ information for the ventilation system to control the future PM 2.5 concentration will be explained. In addition, the consequences of misinterpreting the IAQ environment for the ventilation control system were evaluated.

이를 위해 테스트 세트(288개 샘플)의 마지막 2일 동안 E4 지하철 역에서 실험을 수행하였다. 독립 실행형 및 TL-ResNet에 의한 시퀀스 예측 결과는 40% 및 80% 데이터 가용성 시나리오에서 활용되었다. 각 시나리오에 대한 제어 시스템은 플랫폼의 CIAI 수준과 에너지 수요 측면에서 비교되었다. 도 14(a)는 시나리오 1에 대한 E4 지하철 플랫폼에서의 실험 데이터를 보여준다. 검은색 선은 지하철 플랫폼에서 PM2.5의 실제 측정값을 나타내고 점선은 독립형 ResNet 및 TL-ResNet에 의한 시퀀스 예측을 나타낸다. To this end, experiments were conducted at the E4 subway station during the last two days of the test set (288 samples). The sequence prediction results by standalone and TL-ResNet were utilized in 40% and 80% data availability scenarios. The control systems for each scenario were compared in terms of the platform's CIAI level and energy demand. 14(a) shows the experimental data on the E4 subway platform for scenario 1. The black line represents the actual measured value of PM 2.5 on the subway platform and the dotted line represents the sequence prediction by standalone ResNet and TL-ResNet.

도 14(b)는 40% 가용 IAQ 데이터에 대한 독립형 ResNet에 의한 지하철 승강장 내 환기시스템의 반응과 CIAI 수준을 보여준다. 빨간색 점선은 인버터 주파수의 상한선을 나타내고 노란색 점선은 양호한 IAQ 수준에서 중간 수준까지의 중단점을 나타낸다. Figure 14(b) shows the response of the ventilation system in the subway platform and CIAI level by standalone ResNet for 40% available IAQ data. The red dotted line represents the upper limit of the inverter frequency and the yellow dotted line represents the breakpoint at a good to moderate IAQ level.

두 가지 지표를 기반으로 한 환기 제어 성능은 표 7에 나와 있다. 여기에서 독립형 ResNet에 의한 IAQ 환경의 과소평가로 인해 환기 시스템이 이 잘못된 정보를 좋은 IAQ 수준으로 해석할 수 있었다. 또한, IAQ 환경에 대한 지속적인 잘못된 정보로 인해 높은 풍량이 요구됨에 따라 악화되는 IAQ 조건에 대응하기 위해 인버터 주파수가 증가하지 않았다. 환기 시스템이 올바른 IAQ 조건을 식별하지 못하여 IAQ 수준이 저하되었으며 282개 지점이 중간 CIAI 수준 중단점을 초과했다. 이 시간 간격에서 플랫폼 PM2.5 농도는 중간 수준의 우려와 함께 평균 20.81 μg/m3이었고, 더 낮은 공기 공급으로 인해 1428.62 kWh/day의 에너지 소비가 발생했다.Ventilation control performance based on the two indicators is shown in Table 7. Here, the underestimation of the IAQ environment by the standalone ResNet allowed the ventilation system to interpret this erroneous information as a good IAQ level. In addition, the inverter frequency did not increase to cope with the deteriorating IAQ condition as high air volume was required due to persistent misinformation about the IAQ environment. The ventilator system failed to identify the correct IAQ condition, resulting in lower IAQ levels, with 282 points exceeding the median CIAI level breakpoint. Platform PM 2.5 concentrations in this time interval averaged 20.81 μg/m 3 with a moderate level of concern, and the lower air supply resulted in energy consumption of 1428.62 kWh/day.

[표 7]-40% 및 80% 사용 가능한 IAQ 데이터에 대한 환기 제어 시스템 성능Table 7 - Ventilation control system performance for 40% and 80% available IAQ data

이에 반해 TL-ResNet에서 생성된 예측 데이터는 실제 지하철 승강장에서 측정한 값과 거의 흡사했다. 따라서 환기 시스템이 악화되는 IAQ 조건을 식별할 수 있다. 이에 대응하기 위해 도 14(c)와 같이 인버터 주파수를 증가시켰다. 그 결과 지하철 승강장에서 더 많은 공기 공급이 이루어졌으며 승강장 PM2.5는 평균 농도 14.73 μg/m3로 양호한 IAQ 수준으로 유지되었다. 이 경우 288개의 관측치 중 129개의 점이 중간 CIAI 중단점을 넘었다. 이에 따라 승강장 내 PM2.5 평균값은 단독 시스템 대비 29.21% 개선됐다. 여기서 환기 시스템이 악화되는 IAQ 조건에서 높은 공기 전달로 에너지 소비와 건강한 조건에서 낮은 인버터 주파수의 균형을 맞추려고 시도했음을 알 수 있다. 이 기간 동안 높은 인버터 주파수는 에너지 수요를 1917.83kWh/day로 증가시켰다. 또한 지하철 승강장에서의 높은 공기 전달은 통근자와 지하철 작업자를 26.5시간 동안 중간 PM2.5 수준에 노출시킬 가능성이 있다. In contrast, the predicted data generated by TL-ResNet closely matched the values measured at actual subway platforms. Thus, the ventilation system can identify IAQ conditions that are deteriorating. To cope with this, the inverter frequency was increased as shown in FIG. 14(c). As a result, more air supply was achieved at the subway platform, and the platform PM 2.5 was maintained at a good IAQ level with an average concentration of 14.73 μg/m 3 . In this case, 129 of the 288 observations crossed the median CIAI breakpoint. As a result, the average value of PM 2.5 in the platform improved by 29.21% compared to the single system. It can be seen here that the ventilation system attempted to balance energy consumption with high air delivery in deteriorating IAQ conditions and low inverter frequency in healthy conditions. During this period, high inverter frequency increased energy demand to 1917.83 kWh/day. Additionally, high air transfer on subway platforms has the potential to expose commuters and subway workers to moderate PM 2.5 levels for 26.5 hours.

TL-ResNet에 의한 에너지 소비는 두 시나리오 모두에서 독립형 시스템보다 높다는 점에 유의해야 한다. 그 이유는 본 발명의 실시예에 적용된 실험 기간이 지난 2일 동안 높은 PM2.5 농도를 보였기 때문이다. 따라서 제어 시스템이 실제 IAQ 데이터에 가까운 관찰을 따랐을 때 환기 시스템에 의해 높은 에너지 수요 응답이 생성되고 반대의 경우 더 낮은 에너지 수요가 생성되었을 것이다. 일반적으로 실외 먼지 폭풍, 높은 통근 흐름, 센서 고장 등 여러 통제 불가능한 요인에 의해 영향을 받는 실내 건물 공간에서 공기질 수준과 환기 에너지 수요는 상충되는 관계가 있는 것으로 알려져 있다. 따라서 이들 사이의 균형이 종종 요구된다. 그럼에도 불구하고 적대적인 건물 환경에서 센서의 신뢰성, 작동 및 설치를 고려할 때 IAQ에 대한 모니터링이 불충분할 수 있다. 따라서 전이 학습 기반 방법이 지속 가능한 솔루션을 제공할 수 있으며 IAQ 모니터링 및 제어에서 불충분한 데이터 문제를 해결하기 위해 표준 방법에 비해 상당한 개선을 제공할 수 있음을 알 수 있다. It should be noted that the energy consumption by TL-ResNet is higher than that of a stand-alone system in both scenarios. The reason is that the experimental period applied to the embodiment of the present invention showed a high PM2.5 concentration during the last two days. Therefore, a high energy demand response would have been produced by the ventilation system when the control system followed observations close to the actual IAQ data, and vice versa would have produced a lower energy demand. It is known that there is a conflicting relationship between air quality level and ventilation energy demand in indoor building spaces, which are generally affected by many uncontrollable factors such as outdoor dust storms, high commuter flow, and sensor failures. A balance between them is therefore often required. Nonetheless, monitoring for IAQ may be insufficient given the sensor's reliability, operation and installation in a hostile building environment. Therefore, it can be seen that transfer learning-based methods can provide a sustainable solution and provide significant improvements over standard methods to solve the problem of insufficient data in IAQ monitoring and control.

앞서 언급한 바와 같이, 본 발명의 실시예에서는 지하철 플랫폼에서 PM2.5 관련 건강 위험 수준의 순차적 예측을 위한 전이 학습 기반 심층 ResNet 프레임워크를 제안했다. 본 발명의 실시예에서는, 데이터가 불충분한 상황에서 신뢰할 수 있는 예측을 제공하기 위해 ResNet 아키텍처와 전이 학습 프레임워크를 통합하였다. PM2.5 CIAI 수준 및 에너지 소비 측면에서 환기 제어 시스템에 대해 신뢰할 수 있고 잘못된 IAQ 정보의 영향을 입증하기 위해 실험을 수행했다. 본 발명의 실시예에 따른 분석 및 실험을 기반으로 한 나머지 결과는 다음과 같다.As mentioned above, in the embodiment of the present invention, we proposed a transfer learning-based deep ResNet framework for sequential prediction of PM 2.5 -related health risk levels in subway platforms. In an embodiment of the present invention, the ResNet architecture and transfer learning framework are integrated to provide reliable predictions in situations where data is insufficient. Experiments were conducted to demonstrate the influence of reliable and incorrect IAQ information on ventilation control systems in terms of PM 2.5 CIAI level and energy consumption. The remaining results based on the analysis and experiments according to the embodiments of the present invention are as follows.

- 얕은 RNN 네트워크와 비교하여 더 깊은 변종(variants)은 열악한 시퀀스 예측 성능을 보여 심층 신경망에서 그라디언트 소멸 문제를 강조했다.- Compared to shallow RNN networks, deeper variants showed poor sequence prediction performance, highlighting the gradient vanishing problem in deep neural networks.

- 전이 학습 프레임워크는 대기질 예측을 위한 수용 가능한 예측 모델을 개발할 때 데이터 가용성 문제를 해결하기 위한 지속 가능한 솔루션을 제공할 수 있다.- Transfer learning frameworks can provide a sustainable solution to address data availability issues when developing acceptable predictive models for air quality forecasting.

- TL-ResNet은 데이터가 부족한 시나리오에서 IAQ 예측을 효과적으로 개선하고 환기 시스템을 조절하여 지하철 플랫폼에서 지속 가능한 CIAI 수준을 달성할 수 있다.- TL-ResNet can effectively improve IAQ predictions and regulate ventilation systems in scenarios with insufficient data to achieve sustainable CIAI levels in subway platforms.

또한, 상기와 같이 설명된 장치 및 방법은 상기 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.In addition, the device and method described above are not limited to the configuration and method of the above-described embodiments, but all or part of each embodiment is selectively combined so that various modifications can be made. may be configured.

Claims (11)

미세먼지 예측시스템에 있어서,
전이학습 기반의 예측모델을 구축하는 예측모델생성부; 및
상기 예측모델 생성부를 통해 구축된 예측모델을 기반으로 특정시간 후의 미세먼지농도를 예측하는 미세먼지 예측부;를 포함하는 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템.
In the fine dust prediction system,
a predictive model generator for constructing a predictive model based on transfer learning; and
A fine dust prediction system using artificial intelligence transfer learning, comprising: a fine dust prediction unit for predicting the concentration of fine dust after a specific time based on the prediction model built through the prediction model generation unit.
제 1항에 있어서,
상기 예측모델은 전이학습 기반의 ResNet 예측모델인 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템.
According to claim 1,
The prediction model is a fine dust prediction system using artificial intelligence transfer learning, characterized in that the transfer learning-based ResNet prediction model.
제 2항에 있어서,
상기 특정시간은 40분 ~ 100분이고, 미세먼지데이터는 PM2.5데이터인 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템.
According to claim 2,
The specific time is 40 minutes to 100 minutes, and the fine dust data is PM 2.5 data, characterized in that the fine dust prediction system using artificial intelligence transfer learning.
제 3항에 있어서,
상기 ResNet 예측모델은 예측하고자 하는 해당공간이 아닌 공간 내에서의 소스데이터를 적용하는 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템.
According to claim 3,
The ResNet prediction model is a fine dust prediction system using artificial intelligence transfer learning, characterized in that for applying source data in a space other than the space to be predicted.
제 4항에 있어서,
상기 ResNet 예측모델을 이용하여, 다른 공간의 소스데이터를 활용해 예측 대상이 되는 대상공간의 학습데이터가 부족한 경우에도 예측 시스템을 학습시켜 예측 대상 공간에서의 특정시간 후의 PM2.5 농도를 예측하는 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템.
According to claim 4,
Using the ResNet prediction model, the prediction system is trained to predict the PM 2.5 concentration after a specific time in the prediction target space even when the learning data of the target space to be predicted is insufficient by using the source data of other spaces. A fine dust prediction system using artificial intelligence transfer learning.
제 5항에 있어서,
ResNet 구조는 컨볼루션 블록과, 아이덴티티 블록과, 완전 연결레이어와, 출력레이어를 포함하는 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템.
According to claim 5,
The ResNet structure is a fine dust prediction system using artificial intelligence transfer learning, characterized in that it includes a convolution block, an identity block, a fully connected layer, and an output layer.
제 6항에 있어서,
상기 ResNet 예측모델은 소스데이터에 대한 사전훈련을 통해 도출되며, 대상 공간에서 사용가능한 데이터에 대해 미세조정되는 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템.
According to claim 6,
The ResNet prediction model is derived through pre-training on source data, and fine dust prediction system using artificial intelligence transfer learning, characterized in that it is fine-tuned for data available in the target space.
제 7항에 있어서,
상기 ResNet 예측모델은 소스데이터의 초기 레이어를 고정하여 충분한 데이터에서 PM 분포를 기억하고, 미세조정 중 손실을 최소화하여 대상공간에 적용하는 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템.
According to claim 7,
The ResNet prediction model is a fine dust prediction system using artificial intelligence transfer learning, characterized in that the initial layer of the source data is fixed, the PM distribution is stored in sufficient data, and the loss during fine-tuning is minimized and applied to the target space.
제 8항에 있어서,
상기 ResNet 예측모델은 소스데이터를 사전 학습시킨 후, 사전 학습된 모델의 특징 추출기 매개변수를 고정하고, 고정 레이어는 예측모델이 다른 작업을 수행하도록 할당되었을 때, 레이어의 가중치가 변경되지 않은 상태로 유지하고 나머지 분류기 계층은 대상공간의 대상데이터에 대해 미세 조정되는 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템.
According to claim 8,
The ResNet prediction model fixes the feature extractor parameters of the pre-trained model after pre-training the source data, and the fixed layer keeps the weight of the layer unchanged when the predictive model is assigned to perform another task. A fine dust prediction system using artificial intelligence transfer learning, characterized in that the remaining classifier layers are fine-tuned for the target data of the target space.
제 9항에 있어서,
상기 고정 레이어는 35 ~ 45%인 것을 특징으로 하는 인공지능 전이학습을 이용한 미세먼지 예측시스템.
According to claim 9,
The fixed layer is a fine dust prediction system using artificial intelligence transfer learning, characterized in that 35 to 45%.
컴퓨터에 의해 판독가능하며, 제 1항 내지 제10항 중 어느 한 항에 따른 인공지능 전이학습을 이용한 미세먼지 예측시스템이 실행되도록 하는 프로그램.
A program that is readable by a computer and causes the fine dust prediction system to be executed using artificial intelligence transfer learning according to any one of claims 1 to 10.
KR1020220020392A 2022-02-16 2022-02-16 Transfer learning driven sequential forecasting and ventilation control of PM2.5 associated health risk levels in underground public facilities KR20230123574A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220020392A KR20230123574A (en) 2022-02-16 2022-02-16 Transfer learning driven sequential forecasting and ventilation control of PM2.5 associated health risk levels in underground public facilities

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220020392A KR20230123574A (en) 2022-02-16 2022-02-16 Transfer learning driven sequential forecasting and ventilation control of PM2.5 associated health risk levels in underground public facilities

Publications (1)

Publication Number Publication Date
KR20230123574A true KR20230123574A (en) 2023-08-24

Family

ID=87841389

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220020392A KR20230123574A (en) 2022-02-16 2022-02-16 Transfer learning driven sequential forecasting and ventilation control of PM2.5 associated health risk levels in underground public facilities

Country Status (1)

Country Link
KR (1) KR20230123574A (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190010693A (en) 2017-03-24 2019-01-30 엘티소재주식회사 Heterocyclic compound and organic light emitting device comprising the same
KR102196091B1 (en) 2020-04-27 2020-12-29 주식회사 세스코 Air quality analysis system
KR20210086786A (en) 2019-12-30 2021-07-09 전북대학교산학협력단 System and method for predicting fine dust and odor
KR20210108826A (en) 2020-02-26 2021-09-03 조선대학교산학협력단 Fine dust concentration prediction method, computer program and system and air purifier

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190010693A (en) 2017-03-24 2019-01-30 엘티소재주식회사 Heterocyclic compound and organic light emitting device comprising the same
KR20210086786A (en) 2019-12-30 2021-07-09 전북대학교산학협력단 System and method for predicting fine dust and odor
KR20210108826A (en) 2020-02-26 2021-09-03 조선대학교산학협력단 Fine dust concentration prediction method, computer program and system and air purifier
KR102196091B1 (en) 2020-04-27 2020-12-29 주식회사 세스코 Air quality analysis system

Similar Documents

Publication Publication Date Title
CN109492830B (en) Mobile pollution source emission concentration prediction method based on time-space deep learning
Wang et al. Machine learning for risk and resilience assessment in structural engineering: Progress and future trends
Tariq et al. Transfer learning driven sequential forecasting and ventilation control of PM2. 5 associated health risk levels in underground public facilities
Loy-Benitez et al. Soft sensor validation for monitoring and resilient control of sequential subway indoor air quality through memory-gated recurrent neural networks-based autoencoders
CN105761488B (en) Real-time extreme learning machine Short-time Traffic Flow Forecasting Methods based on fusion
Loy-Benitez et al. Sustainable subway indoor air quality monitoring and fault-tolerant ventilation control using a sparse autoencoder-driven sensor self-validation
CN114266200B (en) Nitrogen dioxide concentration prediction method and system
CN115951014A (en) CNN-LSTM-BP multi-mode air pollutant prediction method combining meteorological features
Zheng et al. Hybrid model for predicting anomalous large passenger flow in urban metros
Oprea et al. A comparative study of computational intelligence techniques applied to PM2. 5 air pollution forecasting
Mihaita et al. Traffic congestion anomaly detection and prediction using deep learning
Al_Janabi et al. Pragmatic method based on intelligent big data analytics to prediction air pollution
Zhou et al. Condition-based maintenance of dynamic systems using online failure prognosis and belief rule base
Adee et al. Systematic modeling approach for environmental perception limitations in automated driving
Nguyen et al. Measurement of fuzzy membership functions in construction risk assessment
Ren et al. A short-term wind speed prediction method based on interval type 2 fuzzy model considering the selection of important input variables
Aram et al. Machine learning-based prediction of air quality index and air quality grade: a comparative analysis
McMillan et al. Flow forecasting for leakage burst prediction in water distribution systems using long short-term memory neural networks and Kalman filtering
Zhang et al. A spatial correlation prediction model of urban PM2. 5 concentration based on deconvolution and LSTM
Grandhi et al. An estimation framework to quantify railway disruption parameters
Tariq et al. Deep-AI soft sensor for sustainable health risk monitoring and control of fine particulate matter at sensor devoid underground spaces: a zero-shot transfer learning approach
KR20230123574A (en) Transfer learning driven sequential forecasting and ventilation control of PM2.5 associated health risk levels in underground public facilities
CN116398823A (en) Gas pipeline detection early warning system and method based on algorithm
Mu et al. An improved effective approach for urban air quality forecast
Adeyemo et al. Surrogate-based digital twin for predictive fault modelling and testing of cyber physical systems