KR102504412B1 - 머신러닝 기반 미세먼지 센서 오차 보정 장치 및 방법 - Google Patents

머신러닝 기반 미세먼지 센서 오차 보정 장치 및 방법 Download PDF

Info

Publication number
KR102504412B1
KR102504412B1 KR1020220138421A KR20220138421A KR102504412B1 KR 102504412 B1 KR102504412 B1 KR 102504412B1 KR 1020220138421 A KR1020220138421 A KR 1020220138421A KR 20220138421 A KR20220138421 A KR 20220138421A KR 102504412 B1 KR102504412 B1 KR 102504412B1
Authority
KR
South Korea
Prior art keywords
data
fine dust
dust sensor
error correction
autoencoder
Prior art date
Application number
KR1020220138421A
Other languages
English (en)
Inventor
박진수
김성렬
Original Assignee
순천향대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 순천향대학교 산학협력단 filed Critical 순천향대학교 산학협력단
Application granted granted Critical
Publication of KR102504412B1 publication Critical patent/KR102504412B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/02Investigating particle size or size distribution
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/1012Calibrating particle analysers; References therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N2015/0096Investigating consistence of powders, dustability, dustiness

Landscapes

  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Dispersion Chemistry (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Indication And Recording Devices For Special Purposes And Tariff Metering Devices (AREA)

Abstract

미세먼지 센서 오차 보정 장치 및 이의 동작 방법이 개시된다. 일 실시예에 따른 미세먼지 센서 오차 보정 장치는 메모리, 송수신기 및 메모리 및 송수신기와 연결된 적어도 하나의 프로세서;를 포함하고, 제1 미세먼지 데이터를 오토인코더에 입력하고, 상기 제1 미세먼지 데이터와 제2 미세먼지 데이터를 매핑(mapping)하고, 상기 제2 미세먼지 데이터를 산출하기 위한 딥러닝 네트워크의 웨이트 값들을 산출하고, 캘리브레이션된 미세먼지 데이터를 출력하도록 구성될 수 있다.

Description

머신러닝 기반 미세먼지 센서 오차 보정 장치 및 방법{APPARATUS AND METHOD FOR FINE DUST SENSOR CALIBRATION BASED ON MACHINE LEARNING}
본 명세서는 머신러닝 기반 미세먼지 센서의 오차를 줄이기 위해 보정을 하는 장치 및 방법에 관한 것이다.
저가의 PM(particulate matter) 센서는 저렴한 가격때문에 성능이 우수하지 않음에도 많이 사용되고 있다. 이에, 저가의 광학기반의 미세먼지 센서를 교정하는 연구가 진행되고 있다.
종래의 기술은 딥러닝 기술인 LSTM(Long Short-Term Memory)과 DNN(Deep Neural Network)을 같이 사용하여 인풋은 기존의 저렴한 PM센서에서의 입력들로 구성하고 비교대상이 되는 아웃풋은 고가의 Gravimetric 미세먼지 센서의 값들을 사용하여 LSTM 및 DNN을 학습시킨다.
이를 이용하면 신경망은 Gravimetric PM센서들의 값들을 생성하도록 학습이 이루어지게 되어, 학습이 종료된 후 새로운 저가 PM센서의 입력에 대해서도 튜닝된 PM값들을 생성하게 된다.
그러나, 두가지 이질적인 딥러닝 기술을 이용하는 경우 딥러닝 구조 자체가 복잡하여 구현이 어려울 수 있다.
또한, 종래 기술은 싱글 인풋 싱글 아웃풋 구조를 채택하고 있어 여러가지 다른 환경 요소를 고려한 튜닝을 고려하기 어려운 구조이며, 실행시간이 매우 길어질 가능성이 있는 문제점이 있다.
본 명세서의 목적은 저가의 PM(Particulate Matter) 센서를 캘리브레이션(calibration)함으로서 성능 저하로 기인되는 요인을 상쇄하고, 고가의 미세먼지 센서에 필적하는 센서 데이터를 생성하는 미세먼지 센서 오차 보정 장치 및 방법을 제공하는 것이다.
본 명세서의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 명세서의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 명세서의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 명세서의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
본 개시의 일 실시예에 따른 미세먼지 센서 오차 보정 장치는, 메모리, 송수신기 및 메모리 및 송수신기와 연결된 적어도 하나의 프로세서를 포함하고, 제1 미세먼지 데이터를 오토인코더에 입력하고, 상기 제1 미세먼지 데이터와 제2 미세먼지 데이터를 매핑(mapping)하고, 상기 제2 미세먼지 데이터를 산출하기 위한 딥러닝 네트워크의 웨이트 값들을 산출하고, 캘리브레이션된 미세먼지 데이터를 출력하도록 구성될 수 있다.
본 개시의 일 실시 예에 따른 미세먼지 센서 오차 보정 장치는, 메모리, 송수신기 및 메모리 및 송수신기와 연결된 적어도 하나의 프로세서를 포함하고, 레퍼런스 데이터에 타겟 데이터를 리스케일링하고, 리스케일링된 상기 타겟 데이터를 정규화하고, 정규화된 데이터를 오토인코더에 입력하고, 상기 정규화된 데이터에 대하여 MSE(Mean Square Error)를 이용하여 상기 오토인코더의 확인 작업(validation)을 수행하고, 상기 MSE 값이 임의의 값 미만인 경우, 상기 정규화된 데이터를 역정규화하도록 구성될 수 있다.
본 개시의 일 실시예에 따른 미세먼지 센서 오차 보정 장치 및 방법은 오토인코더(Autoencoder) 하나만을 이용하여 튜닝을 하는 구조를 가지고 있어 인공 신경망의 구조를 단순화할 수 있다.
본 개시의 일 실시예에 따른 미세먼지 센서 오차 보정 장치 및 방법은 다양한 입력을 고려한 구조를 포함하여 다양한 튜닝을 할 수 있다.
도 1은 본 개시의 일 실시 예에 따른 미세먼지 센서 오차 보정 장치를 나타내는 블록도이다.
도 2는 도 1에 도시된 오토인코더의 일 예를 나타낸다.
도 3은 본 개시의 일 실시 예에 따른 미세먼지 센서 오차 보정 방법을 나타내는 순서도이다
도 4는 본 개시의 일 실시 예에 따른 오토인코더를 이용한 데이터 캘리브레이션 방법을 나타내는 순서도이다.
도 5는 본 개시의 일 실시 예에 따른 도시지역 에서의 미세먼지 센서 오차 보정 결과를 나타내는 그래프이다.
도 6은 본 개시의 일 실시 예에 따른 산업지역 에서의 미세먼지 센서 오차 보정 결과를 나타내는 그래프이다.
도 7은 본 개시의 일 실시 예에 따른 농촌지역 에서의 미세먼지 센서 오차 보정 결과를 나타내는 그래프이다.
도 8은 본 개시의 일 실시 예에 따른 미세먼지 센서 오차 보정 방법을 나타내는 순서도이다
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
본 명세서에서의 프로세서(processor)는 본 명세서에서 설명되는 각 명칭에 따른 기능과 동작을 수행할 수 있는 하드웨어를 의미할 수도 있고, 특정 기능과 동작을 수행할 수 있는 컴퓨터 프로그램 코드를 의미할 수도 있고, 또는 특정 기능과 동작을 수행시킬 수 있는 컴퓨터 프로그램 코드가 탑재된 전자적 기록 매체를 의미할 수 있다.
다시 말해, 프로세서란 본 발명의 기술적 사상을 수행하기 위한 하드웨어 및/또는 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적 및/또는 구조적 결합을 의미할 수 있다.
이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 특허출원의 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
도 1은 본 개시의 일 실시 예에 따른 미세먼지 센서 오차 보정 장치를 나타내는 블록도이다.
도 1을 참조하면, 미세먼지 센서 오차 보정 장치(100)는 미세먼지 센서로부터 센싱된 미세 먼지 측정치의 오차를 보정할 수 있는 전자 장치로 정의될 수 있다. 예시적으로, 미세먼지 센서 오차 보정 장치(100)는 비교적 저가인 미세먼지 센서(또는, PM(Particulate Matter)센서)의 비교적 실제 값과 오차가 큰 미세먼지 센싱 값을, 캘리브레이션(calibration)(또는, 튜닝(tunning))할 수 있다.
뉴럴 네트워크(또는 인공 신경망, 딥 러닝)는 기계학습과 인지과학에서 생물학의 신경을 모방한 통계학적 학습 알고리즘을 포함할 수 있다. 일 실시 예에 따라, 뉴럴 네트워크는 미세먼지 오차 보정 알고리즘을 포함할 수 있다. 뉴럴 네트워크는 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜, 문제 해결 능력을 가지는 모델 전반을 의미할 수 있다. 본 개시의 실시예들에서, 오토 인코더(Auto-encoder)(108)는 뉴럴 네트워크의 한 종류로써 표현될 수 있으며, 오토 인코더(108)에 대한 상세한 내용은 도 2에서 후술한다.
뉴럴 네트워크의 뉴런은 가중치 또는 바이어스의 조합을 포함할 수 있다. 뉴럴 네트워크는 하나 이상의 뉴런 또는 노드로 구성된 하나 이상의 레이어(layer)를 포함할 수 있다. 뉴럴 네트워크는 뉴런의 가중치를 학습을 통해 변화시킴으로써 임의의 입력으로부터 예측하고자 하는 결과를 추론할 수 있다.
뉴럴 네트워크는 심층 뉴럴 네트워크 (Deep Neural Network)를 포함할 수 있다. 뉴럴 네트워크는 CNN(Convolutional Neural Network), RNN(Recurrent Neural Network), 퍼셉트론(perceptron), 다층 퍼셉트론(multilayer perceptron), FF(Feed Forward), RBF(Radial Basis Network), DFF(Deep Feed Forward), LSTM(Long Short Term Memory), GRU(Gated Recurrent Unit), AE(Auto Encoder), VAE(Variational Auto Encoder), DAE(Denoising Auto Encoder), SAE(Sparse Auto Encoder), MC(Markov Chain), HN(Hopfield Network), BM(Boltzmann Machine), RBM(Restricted Boltzmann Machine), DBN(Depp Belief Network), DCN(Deep Convolutional Network), DN(Deconvolutional Network), DCIGN(Deep Convolutional Inverse Graphics Network), GAN(Generative Adversarial Network), LSM(Liquid State Machine), ELM(Extreme Learning Machine), ESN(Echo State Network), DRN(Deep Residual Network), DNC(Differentiable Neural Computer), NTM(Neural Turning Machine), CN(Capsule Network), KN(Kohonen Network) 및 AN(Attention Network)를 포함할 수 있으나 이에 한정되는 것이 아닌 임의의 뉴럴 네트워크를 포함할 수 있음은 통상의 기술자가 이해할 것이다.
미세먼지 센서 오차 보정 장치(100)는 마더보드(motherboard)와 같은 인쇄 회로 기판(printed circuit board(PCB)), 집적 회로(integrated circuit(IC)), 또는 SoC(system on chip)로 구현될 수 있다. 예를 들어, 미세먼지 센서 오차 보정 장치(100)는 애플리케이션 프로세서(application processor)로 구현될 수 있다.
또한, 미세먼지 센서 오차 보정 장치(100)는 PC(personal computer), 데이터 서버, 또는 휴대용 장치 내에 구현될 수 있다.
휴대용 장치는 랩탑(laptop) 컴퓨터, 이동 전화기, 스마트 폰(smart phone), 태블릿(tablet) PC, 모바일 인터넷 디바이스(mobile internet device(MID)), PDA(personal digital assistant), EDA(enterprise digital assistant), 디지털 스틸 카메라(digital still camera), 디지털 비디오 카메라(digital video camera), PMP(portable multimedia player), PND(personal navigation device 또는 portable navigation device), 휴대용 게임 콘솔(handheld game console), e-북(e-book), 또는 스마트 디바이스(smart device)로 구현될 수 있다. 스마트 디바이스는 스마트 와치(smart watch), 스마트 밴드(smart band), 또는 스마트 링(smart ring)으로 구현될 수 있다.
미세먼지 센서 오차 보정 장치(100)는 송수신기(102), 메모리(104) 및/또는 프로세서(106)를 포함할 수 있다.
송수신기(102)는 입력 데이터(DATA_in)를 외부 장치(예를 들어, 서버 또는 다른 전자 장치)로부터 수신할 수 있다. 예시적으로, 입력 데이터(DATA_in)는 상대적으로 저가인 PM(Particulate matter) 센서의 센싱 데이터일 수 있다. 송수신기(102)는 메모리(104) 또는 프로세서(106)로 입력 데이터(DATA_in)를 전달할 수 있다. 송수신기(102)는 프로세서(106)로부터 전달되고 오차가 보정된 출력 데이터(DATA_out)를 외부 장치(예를 들어, 서버 또는 다른 전자 장치)로 송신할 수 있다. 예시적으로, 출력 데이터(DATA_out)는 비교적 고가인 PM(Particulate matter) 센서의 센싱 데이터를 이용하여 튜닝된 데이터 또는 캘리브레이션된 미세먼지 데이터일 수 있다. 송수신기(102)는 송신 인터페이스 또는 수신 인터페이스를 포함할 수 있다.
프로세서(106)는 미세먼지 오차 보정 알고리즘에 따라 오토 인코더(Auto-encoder)(108)를 학습할 수 있다. 프로세서(106)는 범용 프로세서(예를 들어, CPU)일 수 있으나, 인공지능 학습을 위한 AI 전용 프로세서(예를 들어, GPU)일 수 있다. 프로세서(106)는 뉴럴 네트워크 모델(미도시)을 포함할 수 있으며, 뉴럴 네트워크 모델은 오토 인코더(180)를 포함할 수 있다.
프로세서(106)는 메모리(104)에 저장된 딥 러닝 모델을 처리할 수 있다. 프로세서(106)는 메모리(104)에 저장된 컴퓨터로 읽을 수 있는 코드(예를 들어, 소프트웨어) 및 프로세서(106)에 의해 유발된 인스트럭션(instruction)들을 실행할 수 있다.
"프로세서(106)"는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 데이터 처리 장치일 수 있다. 예를 들어, 목적하는 동작들은 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다.
예를 들어, 하드웨어로 구현된 데이터 처리 장치는 마이크로프로세서(microprocessor), 중앙 처리 장치(central processing unit), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array)를 포함할 수 있다.
메모리(104)는 프로세서(106)에 의해 실행가능한 인스트럭션들(또는 프로그램)을 저장할 수 있다. 예를 들어, 인스트럭션들은 프로세서의 동작 및/또는 프로세서의 각 구성의 동작을 실행하기 위한 인스트럭션들을 포함할 수 있다.
메모리(104)는 휘발성 메모리 장치 또는 불휘발성 메모리 장치로 구현될 수 있다.
휘발성 메모리 장치는 DRAM(dynamic random access memory), SRAM(static random access memory), T-RAM(thyristor RAM), Z-RAM(zero capacitor RAM), 또는 TTRAM(Twin Transistor RAM)으로 구현될 수 있다.
불휘발성 메모리 장치는 EEPROM(Electrically Erasable Programmable Read-Only Memory), 플래시(flash) 메모리, MRAM(Magnetic RAM), 스핀전달토크 MRAM(Spin-Transfer Torque(STT)-MRAM), Conductive Bridging RAM(CBRAM), FeRAM(Ferroelectric RAM), PRAM(Phase change RAM), 저항 메모리(Resistive RAM(RRAM)), 나노 튜브 RRAM(Nanotube RRAM), 폴리머 RAM(Polymer RAM(PoRAM)), 나노 부유 게이트 메모리(Nano Floating Gate Memory(NFGM)), 홀로그래픽 메모리(holographic memory), 분자 전자 메모리 소자(Molecular Electronic Memory Device), 또는 절연 저항 변화 메모리(Insulator Resistance Change Memory)로 구현될 수 있다.
도 2는 도 1에 도시된 오토인코더의 일 예를 나타낸다. 이하에서, 도 2는 도 1을 참조하여 설명된다.
오토인코더(Autoencoder)(200)는 Generative model의 한 종류로서 입력데이터와 매우 유사한 데이터를 생성할 수 있다. 오토 인코더(200)는 딥 러닝(Deep learning)에서의 비지도(unsupervised) 학습 기법으로, 매니폴드 러닝(manifold learning)을 위한 구조로 정의될 수 있다. 오토 인코더(200)는 데이터의 심층 특징들을 유지하면서 고차원의 매니폴드를 저차원의 매니폴드로 압축할 수 있다. 매니폴드란 모든 데이터를 최대한 오차없이 아우를 수 있는 부분 공간(subspace)로 정의될 수 있다.
오토인코더(200)는 입력층(Input Layer)의 길이보다 짧은 길이의 은닉층의 길이를 가지고, 이를 통하여 입력데이터의 특징을 잘 포함하고 있는 특징(h)을 추출할 수 있다.
도 1 및 도 2를 참조하면, 프로세서(106, 도 1)(또는, 오토인코더(200))는 입력 데이터(DATA_in)를 오토 인코더(Auto-encoder)(200)에 입력시킴으로써 데이터의 특징(또는, 심층 특징)(h)을 산출할 수 있다. 심층 특징(h)이란 데이터에 직접적으로 보이지는 않지만 특정한 데이터 분포를 만드는 데 역할을 하는 변수로 정의될 수 있다. 오토 인코더(200)는 입력을 심층 특징과 같은 내부 표현으로 압축하는 인코더(encoder)를 포함할 수 있다. 심층 특징(h)은 코드(code) 또는 잠재 변수(latent variable)로 지칭될 수 있다. 실시 예에 따라, 오토 인코더(200)는 인코더의 출력을 다시 원본과 동일 또는 유사하게 복원하여 출력하는 디코더(decoder)를 포함할 수 있다. 오토 인코더(200)는 인코딩 및 디코딩을 통해 데이터의 중요한 정보들만 압축적으로 학습할 수 있으며, 고가의 미세먼지 센서를 이용하여 센싱된 미세먼지 데이터와 유사한 형태의 데이터를 출력할 수 있다.
또한, 이와 같은 모델은 은닉층의 정보를 통해 입력층의 데이터를 역으로 표현할 수 있으므로 데이터 차원축소의 효과도 기대할 수 있다.
이러한 오토인코더(200)의 특징을 활용하여 노이즈가 있는 데이터의 노이즈 제거, 레이블링된 데이터가 부족할 경우 이를 보완하는 여러가지 경우에 활용이 가능하다. 본 개시의 일 실시 예에 따른 미세먼지 센서 오차 보정 장치(100, 도 1)는 이와 같은 오토인코더(200)의 특징을 이용하여 미세먼지 센서의 켈리브레이션 용도로 활용할 수 있다.
손실함수(L)는 딥러닝 학습에서 현재의 상태를 표현하는 데 사용되는 지표이며, 딥러닝 알고리즘의 출력 값(즉, 예측 값)과 사용자가 원하는 타겟 출력 값(즉, 실제 값)의 차이(loss)를 수치화해주는 함수로 정의될 수 있다. 뉴럴 네트워크는 손실함수의 결과 값인 손실값이 최소가 되도록 만드는 가중치(weight) 매개변수를 찾는 방향으로 학습될 수 있다. 예시적으로, 손실함수(L)는 평균 제곱 오차(mean square error: MSE), 평균 제곱근 오차(root mean square error: RMSE) 또는 교차 엔트로피 오차(cross entropy error: CEE)가 사용될 수 있다. 일 예로, 손실 함수(L)는 입력(x)과 출력(x')의 놈(norm)의 제곱으로 정의될 수 있다.
본 개시의 일 실시 예에 따르면, 오토인코더(200)의 입력으로 저가의 미세먼지 센서로부터 제공되는 미세먼지 데이터를 입력하고, 출력으로는 고가의 미세먼지 센서의 미세먼지 데이터를 매핑할 수 있다. 오토인코더(200)는 뉴럴 네트워크의 웨이트 값들을 산출할 수 있다.
오토인코더(200)에는 저가의 미세먼지 센서(또는, 사설 센서, 자가 구축 센서 )로부터 제공되는 데이터
Figure 112022112686754-pat00001
가 입력될 수 있다. 저가의 미세먼지 센서(또는, 사설 센서, 자가 구축 센서 )로부터 제공되는 데이터는 본 명세서에서 '제1 미세먼지 데이터'로 지칭될 수 있다. 제1 미세먼지 데이터는 미리 알려진 고가의 미세먼지 센서(또는, 국가 측정망 센서)로부터 제공되는 데이터
Figure 112022112686754-pat00002
와 매핑될 수 있다. 고가의 미세먼지 센서(또는, 국가 측정망 센서)로부터 제공되는 데이터는 본 명세서에서 '제2 미세먼지 데이터'로 지칭될 수 있다. 오토인코더(200)는
Figure 112022112686754-pat00003
을 산출하기 위한 네트워크의 웨이트 값들을 산출할 수 있다. 오토인코더(200)는
Figure 112022112686754-pat00004
형태의 데이터 입력에 대해
Figure 112022112686754-pat00005
형태의 데이터를 산출함으로써, 캘리브레이션된 미세먼지 데이터를 산출할 수 있다.
또한, 본 개시의 일 실시예에 따른 미세먼지 센서의 오차 보정 방법은 저가의 미세먼지 센서에서 제공되는 제1 미세먼지 센서 데이터(
Figure 112022112686754-pat00006
)를 오토인코더에 입력하는 단계, 오토 인코더의 출력으로 제2 미세먼지 센서 데이터(
Figure 112022112686754-pat00007
)를 매핑하는 단계, 상기 제2 미세먼지 센서 데이터를 산출하기 위해 네트워크의 웨이트 값을 산출하는 단계 및 상기 웨이트 값을 이용하여 상기 제1 미세먼지 데이터 형태로부터 상기 제2 미세먼지 센서 데이터 형태를 산출하여 켈리브레이션된 미세먼지 데이터를 산출하는 단계를 포함할 수 있다.
본 개시의 일 실시예에 따른 미세먼지 센서 오차 보정 장치 및 방법은 오토인코더(Autoencoder) 하나만을 이용하여 튜닝을 하는 구조를 가지고 있어 인공 신경망의 구조를 단순화할 수 있다. 또한, 본 개시의 일 실시예에 따른 미세먼지 센서 오차 보정 장치 및 방법은 다양한 입력을 고려한 구조를 포함하여 다양한 튜닝을 할 수 있다.
도 3은 본 개시의 일 실시 예에 따른 데이터 리스케일링의 결과를 나타내는 그래프이다.
본 개시의 일 실시 예에 따른 미세먼지 센서 오차 측정 방법 및 장치에 따르면, 국가 측정망 센서(즉, 고가의 미세먼지 센서)에서 측정된 센서 값과 사설 센서이자 자가 구축 센서(즉, 저가의 미세먼지 센서)로부터 측정된 센서 값 사이의 갭(gap)이 보정될 수 있다. 국가 측정망 센서(즉, 고가의 미세먼지 센서)에서 측정된 센서 값은 '국가 측정 데이터'로 지칭될 수 있고, 사설 센서이자 자가 구축 센서(즉, 저가의 미세먼지 센서)로부터 측정된 센서 값은 '사설 측정 데이터'로 지칭될 수 있다.
본 개시의 일 실시 예에 따른 미세먼지 센서 오차 측정 방법은, 데이터 리스케일링(rescaling) 및 오토인코더를 이용한 딥 러닝 기술이 순차적으로 적용될 수 있다.
예시적으로, 데이터 리스케일링은 레퍼런스 데이터인 국가 측정망에 의해 측정된 국가 측정 데이터에 사설 센서 데이터를 리스케일링하는 것으로 정의될 수 있다. 다시 말해, 데이터 리스케일링은 국가 측정 데이터에 사설 측정 데이터의 스케일을 조정하는 과정을 말한다.
리스케일링에 사용될 수 있는 수학식은 다음의 수학식 1과 같이 나타낼 수 있다.
Figure 112022112686754-pat00008
수학식 1을 참조하면, 국가 측정망에 의해 측정된 데이터는
Figure 112023009806181-pat00029
(i=1,…,N), 사설 센서에 의해 측정된 데이터는
Figure 112023009806181-pat00030
(i=1,…,N)를 의미한다.
Figure 112023009806181-pat00011
,
Figure 112023009806181-pat00012
는 각각 레퍼런스 데이터인 국가 측정 데이터의 최대값, 국가 측정 데이터의 최소값을 의미한다.
Figure 112023009806181-pat00031
,
Figure 112023009806181-pat00032
는 각각 사설 측정 데이터의 최대값, 사설 측정 데이터의 최소값을 의미한다.
도 3을 참조하면, 파란 색의 그래프(Seoul_D_PM2.5)는 시간에 따른 미세먼지 양을 측정한 국가 측정 데이터를 나타내는 그래프이고, 빨간 색의 그래프(pm2_5_T_kg01)는 시간에 따른 미세먼지 양을 측정한 사설 센서 데이터를 나타내는 그래프이고, 초록 색의 그래프(pm2_5_T_kg01_norm)는 사설 센서 데이터가 리스케일링된 데이터를 나타내는 그래프이다. 리스케일링 된 데이터가 리스케일링되지 않은 데이터에 비해 국가 측정 데이터와의 오차가 작은 것을 확인할 수 있다.
도 4는 본 개시의 일 실시 예에 따른 오토인코더를 이용한 데이터 캘리브레이션 방법을 나타내는 순서도이다.
본 개시의 일 실시 예에 따른 미세먼지 센서 오차 측정 방법 및 장치에 따르면, 리스케일링 된 데이터는 오토인코더의 확인 작업이 수행될 수 있다. 확인 작업이란, 원래의 데이터(
Figure 112022112686754-pat00015
)를 리스케일링한 데이터(
Figure 112022112686754-pat00016
)를 Autoencoder의 입력으로 사용했을 경우에도, 여전히 원래의 데이터와 거의 유사한 데이터(
Figure 112022112686754-pat00017
)가 출력이 됨을 확인하는 과정으로 정의될 수 있다.
본 개시의 일 실시 예에 따른 미세먼지 센서 오차 측정 장치는, 레퍼런스데이터에 타겟 데이터를 리스케일링 할 수 있다(S401). 국가 측정 데이터(또는, 레퍼런스 데이터)에 사설 측정 데이터(또는 타겟 데이터)의 스케일을 조정할 수 있다
미세먼지 센서 오차 측정 장치는 리스케일링 된 타겟 데이터를 정규화할 수 있다(S402). 오토인코더를 사용하기 위해, 오토인코더의 입력 데이터는 정규화될 수 있다. 리스케일링 된 데이터를 정규화한 데이터는 '정규화된 데이터'로 지칭될 수 있고, 오토인코더에는 정규화된 데이터가 입력될 수 있다.
미세먼지 센서 오차 측정 장치는 오토인코더의 출력을 원래의 데이터(
Figure 112023009806181-pat00018
)와 비교하여 출력이 원래의 데이터(
Figure 112023009806181-pat00019
)와 유사하게 생성되는지 확인할 수 있다(Autoencoder validation)(S403). 즉, 미세먼지 센서 오차 측정 장치는 정규화된 데이터에 대하여 상기 오토인코더의 확인 작업을 수행할 수 있다.
원래의 데이터(
Figure 112022112686754-pat00020
)와 유사하게 생성되었는지에 대한 판단의 기준은 MSE(Mean squared error) 혹은 RMSE(Root mean squared error)일 수 있다(S404). MSE 또는 RMSE가 임의의 ε>0에 대하여 ε와 같은 값이거나 ε보다 큰 값인 경우, S401 내지 S403가 반복적으로 수행될 수 있다.
MSE 또는 RMSE가 임의의 ε>0에 대하여 ε보다 작은 값인 경우, 정규화된 데이터를 역정규화할 수 있다(S405). 역 정규화된 타겟 데이터는 켈리브레이션된 최종 데이터로 사용될 수 있다.
도 5는 본 개시의 일 실시 예에 따른 도시지역 에서의 미세먼지 센서 오차 보정 결과를 나타내는 그래프이다. 도 6은 본 개시의 일 실시 예에 따른 산업지역 에서의 미세먼지 센서 오차 보정 결과를 나타내는 그래프이다. 도 7은 본 개시의 일 실시 예에 따른 농촌지역 에서의 미세먼지 센서 오차 보정 결과를 나타내는 그래프이다.
도 5 내지 도 7에서, 도시지역, 산업지역, 농촌지역 총 세 가지 지역에 각각 설치된 사설 센서이자 자가 구축 센서망으로부터의 사설 측정 데이터가, 각각의 국가 측정망 센서로부터의 국가 측정 데이터와 비교하였을 때 어느정도 보정이 이루어졌는지를 나타낼 수 있는 결과 그래프가 도시된다. 도 5 내지 도 7에 도시된 그래프를 도출하기 위한 실험에서 사용된 성능 평가 지표는 MSE이다.
제1의 실험으로, 도시지역에서 5가지 종류(Seoul_D_PM2.5, Seoul_G_PM2.5, Seoul_Gu_PM2.5, Seoul_J_PM2.5, Seoul_SD_PM2.5)의 국가 측정망 센서 각각의 국가 측정 데이터에 대하여 11가지 종류(pm2_5_T_kg01, pm2_5_T_kg02, pm2_5_T_kg03, pm2_5_T_kg04, pm2_5_T_kg05, pm2_5_T_kg06, pm2_5_T_kg07, pm2_5_T_kg08, pm2_5_T_kg0910, pm2_5_T_kg1114, pm2_5_T_kg12)의 사설 센서 데이터의 보정을 진행하였다.
표 1은 도시지역에서의 국가 측정 데이터와 함께, 보정 전후 사설 센서 데이터 값을 비교하여 나타낸 표이다.
국가측정망 사설센서망 MSE- MSE+
1 Seoul_D_PM2.5 pm2_5_T_kg01 302.9 162.6
pm2_5_T_kg02 318.3 108.0
pm2_5_T_kg03 336.5 174.5
pm2_5_T_kg04 226.2 139.0
pm2_5_T_kg05 268.7 51.2
pm2_5_T_kg06 750.8 62.5
pm2_5_T_kg07 118.8 100.2
pm2_5_T_kg08 608.9 74.1
pm2_5_T_kg0910 715.5 472.8
pm2_5_T_kg1114 1335.6 233.3
pm2_5_T_kg12 2195.7 476.0
2 Seoul_G_PM2.5 pm2_5_T_kg01 460.6 139.1
pm2_5_T_kg02 154.4 85.4
pm2_5_T_kg03 477.9 136.7
pm2_5_T_kg04 341.0 106.4
pm2_5_T_kg05 524.5 67.0
pm2_5_T_kg06 1147.8 71.0
pm2_5_T_kg07 137.5 57.2
pm2_5_T_kg08 939.3 68.6
pm2_5_T_kg0910 516.6 325.1
pm2_5_T_kg1114 1693.7 170.1
pm2_5_T_kg12 2397.6 333.1
3 Seoul_Gu_PM2.5 pm2_5_T_kg01 356.0 174.4
pm2_5_T_kg02 276.1 113.1
pm2_5_T_kg03 409.9 203.8
pm2_5_T_kg04 295.0 154.9
pm2_5_T_kg05 394.8 66.4
pm2_5_T_kg06 900.7 61.0
pm2_5_T_kg07 148.8 119.7
pm2_5_T_kg08 730.8 66.5
pm2_5_T_kg0910 711.4 563.8
pm2_5_T_kg1114 1591.3 280.4
pm2_5_T_kg12 2428.8 557.8
4 Seoul_J_PM2.5 pm2_5_T_kg01 487.9 114.4
pm2_5_T_kg02 106.5 60.5
pm2_5_T_kg03 483.1 100.3
pm2_5_T_kg04 384.0 93.9
pm2_5_T_kg05 565.9 41.3
pm2_5_T_kg06 1228.2 47.9
pm2_5_T_kg07 162.4 49.5
pm2_5_T_kg08 1026.3 53.8
pm2_5_T_kg0910 464.0 284.9
pm2_5_T_kg1114 1793.2 144.9
pm2_5_T_kg12 2481.9 299.4
5 Seoul_SD_PM2.5 pm2_5_T_kg01 346.6 162.1
pm2_5_T_kg02 259.1 99.4
pm2_5_T_kg03 359.2 159.5
pm2_5_T_kg04 245.9 125.5
pm2_5_T_kg05 334.3 53.2
pm2_5_T_kg06 860.7 64.3
pm2_5_T_kg07 98.4 74.4
pm2_5_T_kg08 683.8 62.5
pm2_5_T_kg0910 647.7 439.8
pm2_5_T_kg1114 1423.3 208.8
pm2_5_T_kg12 2261.6 445.1
표 1을 참조하면, 'MSE-'는 오차 보정 전 사설 측정 데이터 및 국가 측정 데이터 간의 MSE 값이고, 'MSE+'는 오차 보정 후 사설 측정 데이터 및 국가 측정 데이터 간의 MSE 값을 의미한다. MSE- 보다 MSE+ 값이 훨씬 더 작은 값임을 확인할 수 있다.
도 5를 참조하면, 파란 색의 그래프(Seoul_D_PM2.5)는 시간에 따른 미세먼지 양을 측정한 국가 측정 데이터를 나타내는 그래프이고, 주황 색의 그래프(pm2_5_T_kg01)는 시간에 따른 미세먼지 양을 측정한 보정 전 사설 센서 데이터를 나타내는 그래프이고, 회색의 그래프(pm2_5_T_kg01_cal_Seoul_D_PM2.5)는 보정 후 사설 센서 데이터를 나타내는 그래프이다. 도 5에서 도시된 바와 같이, 주황 색 그래프가 파란 색 그래프에 비해 심한 변동을 가지고, 회색 그래프에 따르면 보정 후에는 주황 색 그래프에 비해 훨씬 안정된 데이터 값을 가지는 것을 확인할 수 있다.
5가지 종류(Seoul_D_PM2.5, Seoul_G_PM2.5, Seoul_Gu_PM2.5, Seoul_J_PM2.5, Seoul_SD_PM2.5)의 국가 측정망 센서 중 나머지 4개의 국가 측정망 센서에 대한 결과 그래프는 생략한다.
제2의 실험으로, 산업지역에서 7가지 종류(A_Bon_PM2.5, A_Bug_PM2.5, A_Dab_PM2.5, A_Go_PM2.5, A_Ho_PM2.5, A_Wg_PM2.5, A_Ws_PM2.5)의 국가 측정망 센서 각각의 국가 측정 데이터에 대하여 12가지 종류(pm2_5_I_ka01, pm2_5_I_ka03, pm2_5_I_ka06, pm2_5_I_ka07, pm2_5_I_ka09, pm2_5_I_ka12, pm2_5_I_ka1617, pm2_5_I_ka19, pm2_5_I_ka21, pm2_5_I_ka24, pm2_5_I_ka27, pm2_5_I_ka28)의 사설 센서 데이터의 보정을 진행하였다.
표 2는 산업지역에서의 국가 측정 데이터와 함께, 보정 전후 사설 센서 데이터 값을 비교하여 나타낸 표이다.
국가측정망 사설센서망 MSE- MSE+
1 A_Bon_PM2.5 pm2_5_I_ka01 653.2 610.9
pm2_5_I_ka03 1223.7 128.8
pm2_5_I_ka06 1348.3 73.2
pm2_5_I_ka07 805.7 83.5
pm2_5_I_ka09 1492.8 81.6
pm2_5_I_ka12 775.4 108.5
pm2_5_I_ka1617 1469.2 93.4
pm2_5_I_ka19 1787.4 129.7
pm2_5_I_ka21 8366.4 657.2
pm2_5_I_ka24 1077.5 108.5
pm2_5_I_ka27 1327.4 84.0
pm2_5_I_ka28 1287.7 74.9
2 A_Bug_PM2.5 pm2_5_I_ka01 455.1 356.3
pm2_5_I_ka03 1949.3 66.6
pm2_5_I_ka06 2170.8 38.1
pm2_5_I_ka07 1441.3 45.6
pm2_5_I_ka09 2352.5 43.6
pm2_5_I_ka12 1376.2 60.7
pm2_5_I_ka1617 2297.8 45.0
pm2_5_I_ka19 2653.6 64.2
pm2_5_I_ka21 9649.0 380.4
pm2_5_I_ka24 1772.7 54.7
pm2_5_I_ka27 2138.5 45.5
pm2_5_I_ka28 2094.7 39.8
3 A_Dab_PM2.5 pm2_5_I_ka01 529.1 426.5
pm2_5_I_ka03 2021.5 111.1
pm2_5_I_ka06 2216.7 67.2
pm2_5_I_ka07 1486.7 77.2
pm2_5_I_ka09 2405.1 77.3
pm2_5_I_ka12 1420.7 94.5
pm2_5_I_ka1617 2362.8 83.7
pm2_5_I_ka19 2752.1 112.5
pm2_5_I_ka21 9608.8 412.6
pm2_5_I_ka24 1844.4 96.6
pm2_5_I_ka27 2204.7 85.8
pm2_5_I_ka28 2134.3 68.5
4 A_Go_PM2.5 pm2_5_I_ka01 700.4 662.8
pm2_5_I_ka03 1415.2 119.1
pm2_5_I_ka06 1581.4 72.6
pm2_5_I_ka07 974.2 78.0
pm2_5_I_ka09 1721.4 75.8
pm2_5_I_ka12 923.7 99.6
pm2_5_I_ka1617 1694.1 86.4
pm2_5_I_ka19 2031.7 110.4
pm2_5_I_ka21 8832.8 653.6
pm2_5_I_ka24 1262.3 94.0
pm2_5_I_ka27 1537.8 76.1
pm2_5_I_ka28 1498.3 69.3
5 A_Ho_PM2.5 pm2_5_I_ka01 515.6 422.1
pm2_5_I_ka03 1875.2 93.0
pm2_5_I_ka06 2072.6 55.5
pm2_5_I_ka07 1360.1 60.7
pm2_5_I_ka09 2250.5 62.0
pm2_5_I_ka12 1293.0 74.2
pm2_5_I_ka1617 2212.6 70.0
pm2_5_I_ka19 2567.4 92.0
pm2_5_I_ka21 9317.5 395.7
pm2_5_I_ka24 1701.7 79.6
pm2_5_I_ka27 2039.0 62.4
pm2_5_I_ka28 1994.2 55.7
6 A_Wg_PM2.5 pm2_5_I_ka01 685.7 623.7
pm2_5_I_ka03 1122.6 91.5
pm2_5_I_ka06 1279.6 58.7
pm2_5_I_ka07 748.9 67.3
pm2_5_I_ka09 1423.5 67.1
pm2_5_I_ka12 716.8 88.4
pm2_5_I_ka1617 1373.2 63.9
pm2_5_I_ka19 1669.8 94.5
pm2_5_I_ka21 8301.9 653.2
pm2_5_I_ka24 994.5 81.4
pm2_5_I_ka27 1247.9 61.7
pm2_5_I_ka28 1213.7 55.1
7 A_Ws_PM2.5 pm2_5_I_ka01 587.6 476.7
pm2_5_I_ka03 1460.4 113.2
pm2_5_I_ka06 1614.7 77.4
pm2_5_I_ka07 1008.8 80.9
pm2_5_I_ka09 1750.9 70.0
pm2_5_I_ka12 958.2 89.3
pm2_5_I_ka1617 1732.5 85.3
pm2_5_I_ka19 1974.5 89.6
pm2_5_I_ka21 8795.4 501.8
pm2_5_I_ka24 1276.1 92.7
pm2_5_I_ka27 1584.4 77.9
pm2_5_I_ka28 1565.0 79.6
표 2를 참조하면, 표 1에서와 마찬가지로, MSE- 보다 MSE+ 값이 훨씬 더 작은 값임을 확인할 수 있다.
도 6을 참조하면, 파란 색의 그래프(A_Bon_PM2.5)는 시간에 따른 미세먼지 양을 측정한 국가 측정 데이터를 나타내는 그래프이고, 주황 색의 그래프(pm2_5_I_ka01)는 시간에 따른 미세먼지 양을 측정한 보정 전 사설 센서 데이터를 나타내는 그래프이고, 회색의 그래프(pm2_5_I_ka01_cal_A_Bon_PM2.5)는 보정 후 사설 센서 데이터를 나타내는 그래프이다. 도 6에서 도시된 바와 같이, 주황 색 그래프가 파란 색 그래프에 비해 심한 변동을 가지고, 회색 그래프에 따르면 보정 후에는 주황 색 그래프에 비해 훨씬 안정된 데이터 값을 가지는 것을 확인할 수 있다.
7가지 종류(A_Bon_PM2.5, A_Bug_PM2.5, A_Dab_PM2.5, A_Go_PM2.5, A_Ho_PM2.5, A_Wg_PM2.5, A_Ws_PM2.5)의 국가 측정망 센서 중 나머지 6개의 국가 측정망 센서에 대한 결과그래프는 생략한다.
제3의 실험으로, 농촌지역에서 6가지 종류(BR_Dc_PM2.5, BR_Jg_PM2.5, BY_By_PM2.5, DJ_Dj_PM2.5, DJ_Ss_PM2.5, TA_Ew_PM2.5)의 국가 측정망 센서 각각의 국가 측정 데이터에 대하여 11가지 종류(pm2_5_C_br06, pm2_5_C_br1314, pm2_5_C_brc, pm2_5_C_dj01, pm2_5_C_dj02, pm2_5_C_dj04, pm2_5_C_dj14, pm2_5_C_dj16, pm2_5_C_dj20, pm2_5_C_dj2122, pm2_5_C_ta01)의 사설 센서 데이터의 보정을 진행하였다.
표 3은 농촌지역에서의 국가 측정 데이터와 함께, 보정 전후 사설 센서 데이터 값을 비교하여 나타낸 표이다.
국가측정망 사설센서망 MSE- MSE+
1 BR_Dc_PM2.5 pm2_5_C_br06 1108.2 89.1
pm2_5_C_br1314 691.0 74.7
pm2_5_C_brc 784.9 72.2
pm2_5_C_dj01 1532.0 118.7
pm2_5_C_dj02 748.9 128.6
pm2_5_C_dj04 1942.6 145.1
pm2_5_C_dj14 2370.1 148.4
pm2_5_C_dj16 2599.3 156.7
pm2_5_C_dj20 3116.1 157.0
pm2_5_C_dj2122 4383.9 303.5
pm2_5_C_ta01 1136.3 191.7
2 BR_Jg_PM2.5 pm2_5_C_br06 1609.5 147.5
pm2_5_C_br1314 1047.8 115.3
pm2_5_C_brc 1153.1 107.7
pm2_5_C_dj01 2073.2 166.5
pm2_5_C_dj02 1054.9 140.8
pm2_5_C_dj04 2506.5 175.5
pm2_5_C_dj14 3023.3 189.4
pm2_5_C_dj16 3241.8 184.2
pm2_5_C_dj20 3814.3 183.2
pm2_5_C_dj2122 5073.0 290.9
pm2_5_C_ta01 1366.4 142.2
3 BY_By_PM2.5 pm2_5_C_br06 2208.5 122.0
pm2_5_C_br1314 1659.3 125.7
pm2_5_C_brc 1756.2 113.3
pm2_5_C_dj01 2628.0 105.7
pm2_5_C_dj02 1472.1 98.0
pm2_5_C_dj04 3118.1 114.5
pm2_5_C_dj14 3639.1 111.8
pm2_5_C_dj16 3860.1 105.9
pm2_5_C_dj20 4485.6 104.8
pm2_5_C_dj2122 5752.3 156.8
pm2_5_C_ta01 1853.4 103.4
4 DJ_Dj_PM2.5 pm2_5_C_br06 1019.0 171.5
pm2_5_C_br1314 653.1 161.8
pm2_5_C_brc 673.4 124.1
pm2_5_C_dj01 1240.3 122.0
pm2_5_C_dj02 521.1 107.9
pm2_5_C_dj04 1598.0 144.0
pm2_5_C_dj14 1998.9 153.7
pm2_5_C_dj16 2194.1 156.2
pm2_5_C_dj20 2637.6 144.2
pm2_5_C_dj2122 4043.1 380.9
pm2_5_C_ta01 959.7 231.2
5 DJ_Ss_PM2.5
pm2_5_C_br06 1256.8 367.3
pm2_5_C_br1314 865.3 328.3
pm2_5_C_brc 881.5 296.3
pm2_5_C_dj01 1518.2 332.4
pm2_5_C_dj02 692.7 266.7
pm2_5_C_dj04 1909.8 374.6
pm2_5_C_dj14 2300.0 374.7
pm2_5_C_dj16 2450.4 366.4
pm2_5_C_dj20 2901.9 360.7
pm2_5_C_dj2122 4277.0 537.5
pm2_5_C_ta01 1132.4 387.6
6 TA_Ew_PM2.5 pm2_5_C_br06 1284.9 86.4
pm2_5_C_br1314 807.7 64.0
pm2_5_C_brc 914.3 62.8
pm2_5_C_dj01 1752.3 120.7
pm2_5_C_dj02 860.4 112.7
pm2_5_C_dj04 2109.9 116.2
pm2_5_C_dj14 2578.9 126.4
pm2_5_C_dj16 2816.7 133.0
pm2_5_C_dj20 3347.6 130.1
pm2_5_C_dj2122 4691.4 278.3
pm2_5_C_ta01 1144.1 116.2
표 3을 참조하면, 표 1 또는 표 2에서와 마찬가지로, MSE- 보다 MSE+ 값이 훨씬 더 작은 값임을 확인할 수 있다.
도 7을 참조하면, 파란 색의 그래프(BR_Dc_PM2.5)는 시간에 따른 미세먼지 양을 측정한 국가 측정 데이터를 나타내는 그래프이고, 주황 색의 그래프(pm2_5_C_br06)는 시간에 따른 미세먼지 양을 측정한 보정 전 사설 센서 데이터를 나타내는 그래프이고, 회색의 그래프(pm2_5_C_br06_cal_ BR_Dc_PM2.5)는 보정 후 사설 센서 데이터를 나타내는 그래프이다. 도 7에서 도시된 바와 같이, 주황 색 그래프가 파란 색 그래프에 비해 심한 변동을 가지고, 회색 그래프에 따르면 보정 후에는 주황 색 그래프에 비해 훨씬 안정된 데이터 값을 가지는 것을 확인할 수 있다.
6가지 종류(BR_Dc_PM2.5, BR_Jg_PM2.5, BY_By_PM2.5, DJ_Dj_PM2.5, DJ_Ss_PM2.5, TA_Ew_PM2.5)의 국가 측정망 센서 중 나머지 5개의 국가 측정망 센서에 대한 결과 그래프는 생략한다.
도 8은 본 개시의 일 실시 예에 따른 미세먼지 센서 오차 보정 방법을 나타내는 순서도이다.
본 개시의 일 실시 예에 따른 미세먼지 센서 오차 장치는 제1 미세먼지 데이터를 외부로부터 수신할 수 있다(S801). 미세먼지 센서 오차 장치는 수신된 제1 미세먼지 데이터를 오토인코더에 입력할 수 있다(S802). 미세먼지 센서 오차 장치는 제1 미세먼지 데이터와 제2 미세먼지 데이터를 매핑할 수 있다(S803). 미세먼지 센서 오차 장치는 제2 미세먼지 데이터를 산출하기 위한 딥러닝 네트워크의 웨이트 값들을 산출할 수 있다(S804). 미세먼지 센서 오차 장치는 산출된 웨이트 값을 이용하여 상기 제1 미세먼지 데이터 형태로부터 상기 제2 미세먼지 센서 데이터 형태를 산출하여, 켈리브레이션된 미세먼지 데이터를 출력할 수 있다(S805).
일 실시예에 따른 이상치를 탐지하는 전자 장치는 하드웨어인 컴퓨터(또는, 컴퓨팅 장치)와 결합되어 상술한 S1201 내지 S1208를 수행하기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램을 포함할 수 있다.
메모리에 로드된 프로그램들의 명령들(instructions)을 실행하는 적어도 하나의 프로세서를 포함하는 컴퓨팅 장치로 구현될 수 있으며, 상술한 S1201 내지 S1208를 실행하도록 기술된 명령들을 포함하는 프로그램이 메모리에 로드될 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명에 대해서 예시한 도면을 참조로 하여 설명하였으나, 본 명세서에 개시된 실시 예와 도면에 의해 본 발명이 한정되는 것은 아니며, 본 발명의 기술사상의 범위 내에서 통상의 기술자에 의해 다양한 변형이 이루어질 수 있음은 자명하다. 아울러 앞서 본 발명의 실시 예를 설명하면서 본 발명의 구성에 따른 작용 효과를 명시적으로 기재하여 설명하지 않았을지라도, 해당 구성에 의해 예측 가능한 효과 또한 인정되어야 함은 당연하다.

Claims (15)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 미세먼지 센서 오차 보정 장치로서,
    메모리;
    송수신기; 및
    메모리 및 송수신기와 연결된 적어도 하나의 프로세서;를 포함하고,
    상기 프로세서는,
    레퍼런스 데이터에 타겟 데이터를 리스케일링하고, 리스케일링된 상기 타겟 데이터를 정규화하고, 정규화된 데이터를 오토인코더에 입력하고, 상기 정규화된 데이터에 대하여 MSE(mean square error)를 이용하여 상기 오토인코더의 확인 작업(validation)을 수행하고, 상기 MSE 값이 임의의 값 미만인 경우, 상기 정규화된 데이터를 역정규화하도록 구성되는,
    미세먼지 센서 오차 보정 장치.
  7. 청구항 6에 있어서,
    상기 타겟 데이터는 사설 미세먼지 측정 센서 또는 자가 구축 센서로부터 제공되는 미세먼지 측정 데이터이고,
    상기 레퍼런스 데이터는 국가 측정망 센서로부터 제공되는 미세먼지 측정 데이터인,
    미세먼지 센서 오차 보정 장치.
  8. 청구항 7에 있어서,
    상기 장치는, 하기의 수학식 1을 이용하여 상기 레퍼런스 데이터에 상기 타겟 데이터를 리스케일링하도록 추가로 구성되고,
    [수학식 1]
    Figure 112023009806181-pat00033

    상기 레퍼런스 데이터는
    Figure 112023009806181-pat00034
    (i=1,…,N), 상기 타겟 데이터는
    Figure 112023009806181-pat00035
    (i=1,…,N),
    Figure 112023009806181-pat00036
    ,
    Figure 112023009806181-pat00037
    는 각각 상기 레퍼런스 데이터의 최대값 및 최소값,
    Figure 112023009806181-pat00038
    ,
    Figure 112023009806181-pat00039
    는 각각 상기 타겟 데이터의 최대값 및 최소값인,
    미세먼지 센서 오차 보정 장치.
  9. 청구항 8에 있어서,
    상기 프로세서는,
    상기 MSE 값이 임의의 값 이상인 경우, 상기 레퍼런스 데이터에 상기 타겟 데이터를 리스케일링하는 과정부터 상기 정규화된 데이터에 대하여 MSE를 이용하여 상기 오토인코더의 확인 작업을 수행하는 과정을 반복 수행하도록 추가로 구성되는,
    미세먼지 센서 오차 보정 장치.
  10. 청구항 8에 있어서,
    상기 프로세서는,
    상기 정규화된 데이터에 대하여 RMSE(root mean square error)를 이용하여 상기 오토인코더의 확인 작업(validation)을 수행하도록 추가로 구성되는,
    미세먼지 센서 오차 보정 장치.
  11. 청구항 10에 있어서,
    상기 RMSE 값이 임의의 값 이상인 경우, 상기 레퍼런스 데이터에 상기 타겟 데이터를 리스케일링하는 과정부터 상기 정규화된 데이터에 대하여 MSE를 이용하여 상기 오토인코더의 확인 작업을 수행하는 과정을 반복 수행하도록 추가로 구성되는,
    미세먼지 센서 오차 보정 장치.
  12. 청구항 6에 있어서,
    상기 프로세서는,
    역정규화된 데이터를 출력하도록 추가로 구성되고,
    상기 역정규화된 데이터는 캘리브레이션된 최종 데이터인,
    미세먼지 센서 오차 보정 장치.
  13. 레퍼런스 데이터에 타겟 데이터를 리스케일링하는 단계;
    리스케일링된 상기 타겟 데이터를 정규화하는 단계;
    정규화된 데이터를 오토인코더에 입력하는 단계;
    상기 정규화된 데이터에 대하여 MSE(mean square error) 또는 RMSE(root mean square error)를 이용하여 오토인코더의 확인 작업(validation)을 수행하는 단계;
    상기 MSE 값 또는 상기 RMSE(root mean square error) 값이 임의의 값 미만인 경우, 상기 정규화된 데이터를 역정규화는 단계; 및
    상기 역정규화된 데이터를 캘리브레이션된 데이터로 출력하는 단계;를 포함하는,
    미세먼지 센서 오차 보정 장치의 동작 방법.
  14. 청구항 13에 있어서,
    하기의 수학식 1을 이용하여 상기 레퍼런스 데이터에 상기 타겟 데이터를 리스케일링하는 단계;를 더 포함하고,
    [수학식 1]
    Figure 112023009806181-pat00040

    상기 레퍼런스 데이터는
    Figure 112023009806181-pat00041
    (i=1,…,N), 상기 타겟 데이터는
    Figure 112023009806181-pat00042
    (i=1,…,N),
    Figure 112023009806181-pat00043
    ,
    Figure 112023009806181-pat00044
    는 각각 상기 레퍼런스 데이터의 최대값 및 최소값,
    Figure 112023009806181-pat00045
    ,
    Figure 112023009806181-pat00046
    는 각각 상기 타겟 데이터의 최대값 및 최소값인,
    미세먼지 센서 오차 보정 장치의 동작 방법.
  15. 청구항 14에 있어서,
    상기 MSE 값 또는 상기 RMSE 값이 임의의 값 이상인 경우, 상기 레퍼런스 데이터에 상기 타겟 데이터를 리스케일링하는 단계 내지 상기 정규화된 데이터에 대하여 MSE 또는 RMSE를 이용하여 오토인코더의 확인 작업(validation)을 수행하는 단계를 반복 수행하는 단계;를 더 포함하는,
    미세먼지 센서 오차 보정 장치의 동작 방법.


KR1020220138421A 2022-08-05 2022-10-25 머신러닝 기반 미세먼지 센서 오차 보정 장치 및 방법 KR102504412B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020220098074 2022-08-05
KR20220098074 2022-08-05

Publications (1)

Publication Number Publication Date
KR102504412B1 true KR102504412B1 (ko) 2023-03-02

Family

ID=85509033

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220138421A KR102504412B1 (ko) 2022-08-05 2022-10-25 머신러닝 기반 미세먼지 센서 오차 보정 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102504412B1 (ko)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190091730A (ko) * 2018-01-29 2019-08-07 성균관대학교산학협력단 미세먼지의 농도 예측 방법 및 장치
KR102023279B1 (ko) * 2018-03-27 2019-09-19 재단법인 다차원 스마트 아이티 융합시스템 연구단 미세먼지센서의 데이터 보정 방법 및 그 장치
KR20200057987A (ko) * 2018-11-19 2020-05-27 로지포커스 주식회사 미세먼지 모니터링 시스템, 및 환경정보 관리서버와 환경정보 관리서버 제어방법
KR102134545B1 (ko) * 2019-12-30 2020-07-15 주식회사 에어콕 미세먼지 및 초미세먼지 측정 정확도 향상을 위한 센서 자동보정 방법
KR102199066B1 (ko) * 2019-10-30 2021-01-06 (주)지피지기소프트 미세먼지 측정기를 통해 산출된 미세먼지 측정 데이터의 오류를 기계학습을 기반으로 보정할 수 있는 미세먼지 측정 데이터 보정 장치
KR20210023454A (ko) * 2019-08-23 2021-03-04 재단법인 다차원 스마트 아이티 융합시스템 연구단 미세먼지 센서 측정 및 보정 시스템, 및 그 방법
KR20210062513A (ko) * 2019-11-21 2021-05-31 순천향대학교 산학협력단 센서기반 미세먼지 정보 처리 고도화를 위한, 보간 및 이상데이터 탐지 및 수정 시스템
KR102325137B1 (ko) * 2021-01-11 2021-11-11 부산대학교 산학협력단 미세먼지 예측 정확도 향상을 위한 하이브리드 딥러닝 모델 생성 장치 및 방법
KR102357871B1 (ko) * 2020-11-27 2022-02-07 경희대학교 산학협력단 인공지능을 이용하여 손실 데이터를 보정함에 따라 환기 장치를 제어하는 환기 제어 장치 및 방법

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190091730A (ko) * 2018-01-29 2019-08-07 성균관대학교산학협력단 미세먼지의 농도 예측 방법 및 장치
KR102023279B1 (ko) * 2018-03-27 2019-09-19 재단법인 다차원 스마트 아이티 융합시스템 연구단 미세먼지센서의 데이터 보정 방법 및 그 장치
KR20200057987A (ko) * 2018-11-19 2020-05-27 로지포커스 주식회사 미세먼지 모니터링 시스템, 및 환경정보 관리서버와 환경정보 관리서버 제어방법
KR20210023454A (ko) * 2019-08-23 2021-03-04 재단법인 다차원 스마트 아이티 융합시스템 연구단 미세먼지 센서 측정 및 보정 시스템, 및 그 방법
KR102199066B1 (ko) * 2019-10-30 2021-01-06 (주)지피지기소프트 미세먼지 측정기를 통해 산출된 미세먼지 측정 데이터의 오류를 기계학습을 기반으로 보정할 수 있는 미세먼지 측정 데이터 보정 장치
KR20210062513A (ko) * 2019-11-21 2021-05-31 순천향대학교 산학협력단 센서기반 미세먼지 정보 처리 고도화를 위한, 보간 및 이상데이터 탐지 및 수정 시스템
KR102134545B1 (ko) * 2019-12-30 2020-07-15 주식회사 에어콕 미세먼지 및 초미세먼지 측정 정확도 향상을 위한 센서 자동보정 방법
KR102357871B1 (ko) * 2020-11-27 2022-02-07 경희대학교 산학협력단 인공지능을 이용하여 손실 데이터를 보정함에 따라 환기 장치를 제어하는 환기 제어 장치 및 방법
KR102325137B1 (ko) * 2021-01-11 2021-11-11 부산대학교 산학협력단 미세먼지 예측 정확도 향상을 위한 하이브리드 딥러닝 모델 생성 장치 및 방법

Similar Documents

Publication Publication Date Title
CN112041928A (zh) 忆阻器交叉杆阵列中模型/权重编程的加速
KR102506987B1 (ko) 슬라이딩 윈도우를 활용한 뉴럴 네트워크 기반의 이상 탐지 장치 및 방법
US20230133337A1 (en) Quantization calibration method, computing device and computer readable storage medium
KR20240025578A (ko) 뉴럴 네트워크를 이용한 초분광 이미지 분류 방법 및 장치
KR102504412B1 (ko) 머신러닝 기반 미세먼지 센서 오차 보정 장치 및 방법
US20220284262A1 (en) Neural network operation apparatus and quantization method
US20230058341A1 (en) Neural network training method and apparatus using trend
US20220284299A1 (en) Method and apparatus with neural network operation using sparsification
US11868912B2 (en) Multi-device based inference method and apparatus
KR20220125112A (ko) 양자화를 이용한 뉴럴 네트워크 연산 방법 및 장치
KR20220056633A (ko) 기계 독해 방법 및 장치
KR102506988B1 (ko) 이종 손실 함수를 이용하여 학습된 뉴럴 네트워크를 이용한 이상 검출 장치
KR102668317B1 (ko) 레이더 신호 처리를 이용한 객체 인식 시스템
KR20230055119A (ko) 뉴럴 네트워크 연산 방법 및 장치
US20230153571A1 (en) Quantization method of neural network and apparatus for performing the same
KR20230163183A (ko) 뉴럴 네트워크를 이용한 이상치 탐지 방법 및 장치
KR20230159953A (ko) 뉴럴 네트워크를 이용한 이상 검출 장치 및 방법
US20230143371A1 (en) Apparatus and method with neural network operation
KR102614909B1 (ko) 희소화를 이용한 뉴럴 네트워크 연산 방법 및 장치
US20220237436A1 (en) Neural network training method and apparatus
US20240211738A1 (en) Apparatus and method with encrypted data neural network operation
KR102626850B1 (ko) 뉴럴 네트워크 기반 에너지 하베스팅 방법 및 시스템
US20240028452A1 (en) Fault-mitigating method and data processing circuit
US20240211737A1 (en) Apparatus and method with encrypted data neural network operation
US20240020197A1 (en) Techniques for error detection in analog compute-in-memory