KR102502952B1 - 통계 분석 기반 데이터 측정 방법 및 장치 - Google Patents

통계 분석 기반 데이터 측정 방법 및 장치 Download PDF

Info

Publication number
KR102502952B1
KR102502952B1 KR1020160096057A KR20160096057A KR102502952B1 KR 102502952 B1 KR102502952 B1 KR 102502952B1 KR 1020160096057 A KR1020160096057 A KR 1020160096057A KR 20160096057 A KR20160096057 A KR 20160096057A KR 102502952 B1 KR102502952 B1 KR 102502952B1
Authority
KR
South Korea
Prior art keywords
sensing data
value
data
analysis
interval
Prior art date
Application number
KR1020160096057A
Other languages
English (en)
Other versions
KR20180013010A (ko
Inventor
주민식
강지훈
유효선
Original Assignee
삼성에스디에스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성에스디에스 주식회사 filed Critical 삼성에스디에스 주식회사
Priority to KR1020160096057A priority Critical patent/KR102502952B1/ko
Publication of KR20180013010A publication Critical patent/KR20180013010A/ko
Application granted granted Critical
Publication of KR102502952B1 publication Critical patent/KR102502952B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Indication And Recording Devices For Special Purposes And Tariff Metering Devices (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)

Abstract

본 발명의 일 태양에 따른 통계적 분석 기법에 기반한 데이터 측정 방법은, 데이터 측정 장치가, 주 센서로부터 주 센싱 데이터를 제공 받는 단계와 상기 데이터 측정 장치가, 상기 주 센서에 영향을 미치는 외부 요인을 측정한 보조 센서로부터 보조 센싱 데이터를 제공 받는 단계와 상기 데이터 측정 장치가, 상기 주 센싱 데이터와 상기 보조 센싱 데이터를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계와 상기 데이터 측정 장치가, 상기 보조 센싱 데이터의 확률 분포를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 구하는 단계 및 상기 데이터 측정 장치가, 상기 예측값과 상기 신뢰 구간을 이용하여, 상기 외부 요인으로 인한 영향이 제거된 상기 주 센싱 데이터의 실제값(Noise Cancelling Value)을 구하는 단계를 포함할 수 있다.

Description

통계 분석 기반 데이터 측정 방법 및 장치 {Method and apparatus for sensing data based on stats analysis}
본 발명은 통계적 분석 기법에 기반한 데이터 측정 방법 및 그 장치에 관한 것이다. 보다 자세하게는 데이터 측정에 영향을 미치는 요소들을 분석하고, 측정된 데이터의 신뢰 구간을 구하고, 이를 이용하여 이상을 감지하는 방법 및 그 방법을 수행하는 장치에 관한 것이다.
온도, 습도, 빛, 소리 등 데이터를 측정하기 위한 IoT 기기(Internet of Things)는 실시간으로 데이터를 측정할수록 그리고 정확도가 높을수록, 즉 고성능 센서일수록 높은 가격에 판매된다. 그에 비해 실시간성이 떨어지거나 정확도가 낮은 일반 센서는 상대적으로 저가의 가격에 판매되며, 측정하고자 하는 대상의 환경 외란(noise)에 민감하다.
다시 말해, 일반 센서는 측정하고자 하는 대상에 영향을 미칠 수 있는 노이즈에 민감하게 반응하기 때문에 미세 측정 범위에서는 신뢰도가 매우 낮은 단점이 있다. 이런 경우, 일반 센서는 오차 범위 이상의 큰 변화가 출력되어야 신뢰할 수 있는 측정값으로 사용할 수 있다.
일반 센서는 영점 대비 실제 측정값이 임계치를 지나면 감지하는 방식을 이용한다. 이를 임계치 방식(Threshold Method)이라 한다. 예를 들면 영점 출력값이 100인 경우, 영점 출력값이 100을 넘는 101이 출력되어야 측정 대상에 반응한다. 다만 일반 센서는 측정 대상, 예를 들면 색상, 냄새, 거리 외에도 기압, 진동, 전압, 온도, 습도 등의 환경 외란에 매우 민감하게 반응하는 단점이 있다.
그렇기 때문에 일반 센서는 미세 측정 범위(micro-scale)의 80% 이상이 노이즈인 경우가 많다. 예를 들어 정상일 때의 기준에 대비하여 측정된 변화량이 0.1 이라면, 정말로 측정 대상이 변화하여 측정값이 바뀐 것인지, 아니면 환경 외란에 의해 측정값이 변화한 것인지 정확히 알기가 어렵다.
따라서 저가격의 일반 센서일수록 영점대비(100) 출력값의 비율을 높여서 110, 120, 150과 같이 임계치를 크게 잡고 측정 대상을 감지한다. 이처럼 일반 센서는 외부 환경 외란에 민감한 낮은 가격의 센서를 이용하기 때문에 신뢰도를 확보하기 위해서 높은 임계치를 사용한다.
이에 비해 고성능의 센서는 낮은 측정값의 변화도 환경 외란으로 인한 것인지 아니면 측정 대상의 변화로 인한 것인지 비교적 정확히 구분이 가능하지만, 대신 높은 비용의 센서를 필요로 하거나, 장비가 대형이라는 단점이 있다. 또한 고성능의 센서는 짧은 부품 교체 주기, 비자동화로 인한 사용성의 한계가 있다.
이에 저가형의 일반 센서를 이용하여 데이터를 측정하면서도, 그 성능을 강화하여 미세 측정 범위에서도 정확도를 높일 수 있는 측정 방법이 요구된다.
본 발명이 해결하고자 하는 기술적 과제는 통계적 분석 기법에 기반한 데이터 측정 방법 및 장치를 제공하는 것이다. 특히 복합 센서와 순차적 상태 추정 모델(Multi-variate Sequential State Estimation; MSSE)을 제안하고, 실시간으로 환경 외란을 정량적으로 추정하여 이를 제거하고, 미세 측정 범위에서도 일반 센서의 신뢰도를 보장하는 방법 및 그 방법을 수행하는 장치를 제공하는 것이다.
특히 순차적 상태 추정 모델은 대상 센서와 보조 센서들 사이의 영향도를 다중 회귀 분석을 통해서 연산하고, 보조 센서의 측정값으로부터 대상 센서의 측정값의 신뢰 구간을 구하여 노이즈를 제거하고, 이를 통해 실제 미세 측정 범위에서 높은 정확도로 대상 데이터를 측정할 수 있다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 해결하기 위한 본 발명의 일 태양에 따른 통계적 분석 기법에 기반한 데이터 측정 방법은, 데이터 측정 장치가, 주 센서로부터 주 센싱 데이터를 제공 받는 단계와 상기 데이터 측정 장치가, 상기 주 센서에 영향을 미치는 외부 요인을 측정한 보조 센서로부터 보조 센싱 데이터를 제공 받는 단계와 상기 데이터 측정 장치가, 상기 주 센싱 데이터와 상기 보조 센싱 데이터를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계와 상기 데이터 측정 장치가, 상기 보조 센싱 데이터의 확률 분포를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 구하는 단계 및 상기 데이터 측정 장치가, 상기 예측값과 상기 신뢰 구간을 이용하여, 상기 외부 요인으로 인한 영향이 제거된 상기 주 센싱 데이터의 실제값(Noise Cancelling Value)을 구하는 단계를 포함할 수 있다.
일 실시예에서, 상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계는, 상기 주 센싱 데이터와 상기 보조 센싱 데이터를 이용하여, 회귀 분석(Regression Analysis)을 수행하고, 상기 회귀 분석의 결과를 이용하여 상기 예측값을 구하는 단계를 포함할 수 있다.
다른 실시예에서, 상기 회귀 분석의 결과를 이용하여 상기 예측값을 구하는 단계는, 상기 주 센싱 데이터와 상기 보조 센싱 데이터의 동일한 시계열 구간(i-n 부터 i 까지, n개)을 분석 구간으로 선정하는 단계와 상기 보조 센싱 데이터의 변동으로 인한 영향도를 분석하기 위해 상기 주 센싱 데이터의 회귀 모델을 생성하는 단계 및 상기 회귀 모델을 이용하여 상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계를 포함할 수 있다.
또 다른 실시예에서, 상기 회귀 모델을 이용하여 상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계는, 상기 분석 구간 다음의 시계열 구간(i+1)의 보조 센싱 데이터의 측정값을 상기 회귀 모델에 대입하는 단계와 상기 대입의 결과로 얻은 주 센싱 데이터의 예측값과 상기 분석 구간 다음의 시계열 구간(i+1)의 주 센싱 데이터의 측정값을 비교하는 단계 및 상기 측정값에서 상기 예측값을 뺀 값으로 구한 SSE(오차 제곱합)가 기 설정된 임계치 τ보다 큰 경우, 1차 이상으로 판단하는 단계를 포함할 수 있다.
또 다른 실시예에서, 상기 회귀 모델을 이용하여 상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계는, 상기 분석 구간 다음의 시계열 구간(i-n+1 부터 i+1 까지, n개)을 분석 구간으로 재선정하는 단계 및 상기 재선정된 분석 구간(i-n+1 부터 i+1 까지)에 대해 상기 회귀 모델과 상기 예측값을 갱신하는 단계를 포함할 수 있다.
또 다른 실시예에서, 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 구하는 단계는, 상기 보조 센싱 데이터의 확률 분포를 이용하여, 불확실성 분석(Uncertainty Analysis)를 수행하고, 상기 불확실성 분석의 결과를 이용하여 상기 신뢰 구간을 구하는 단계를 포함할 수 있다.
또 다른 실시예에서, 상기 불확실성 분석의 결과를 이용하여 상기 신뢰 구간을 구하는 단계는, 상기 보조 센싱 데이터의 특정 시계열 구간(i-n 부터 i 까지, n개)을 분석 구간을 선정하는 단계와 상기 분석 구간동안 측정된 상기 보조 센싱 데이터의 평균과 분산을 연산하는 단계 와 상기 평균과 분산을 가우시안 함수(Gaussian PDF; Gaussian Probability Density Function)에 대입하여, 상기 보조 센싱 데이터의 정규 분포 함수를 구하는 단계와 상기 보조 센싱 데이터의 정규 분포 함수에서 가상의 보조 센싱 데이터를 샘플링(sampling) 하는 단계 및 상기 가상의 보조 센싱 데이터를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 연산하는 단계를 포함할 수 있다.
또 다른 실시예에서, 상기 가상의 보조 센싱 데이터를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 연산하는 단계는, 상기 가상의 보조 센싱 데이터의 이상치(outlier)를 제거하는 단계와 상기 주 센싱 데이터의 회귀 모델에 상기 가상의 보조 센싱 데이터를 대입하는 단계와 상기 대입의 결과로 얻은 가상의 주 센싱 데이터의 예측값의 분포에서 최대값과 최소값 사이의 범위를 상기 신뢰 구간으로 결정하는 단계 및 주 센싱 데이터의 측정값이 상기 신뢰 구간을 벗어나는 경우, 2차 이상으로 판단하는 단계를 포함할 수 있다.
또 다른 실시예에서, 상기 가상의 보조 센싱 데이터를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 연산하는 단계는, 상기 분석 구간 다음의 시계열 구간(i-n+1 부터 i+1 까지, n개)을 분석 구간을 재선정하는 단계 및 상기 재선정된 분석 구간(i-n+1 부터 i+1 까지)에 대해 상기 평균과 분산, 상기 정규 분포 함수 및 상기 신뢰 구간을 갱신하는 단계를 포함할 수 있다.
또 다른 실시예에서, 상기 주 센싱 데이터의 측정값의 누적합(CUSUM)을 구하는 단계와 상기 주 센싱 데이터의 측정값이 연속 증가하거나 연속 하강하는 경우, 3차 이상으로 판단하는 단계 및 3차 이상으로 판단된 경우에 한하여 상기 주 센싱 데이터의 실제값(Noise Cancelling Value)을 연산하는 단계를 더 포함할 수 있다.
또 다른 실시예에서, 상기 주 센싱 데이터의 측정값의 누적합을 구하는 단계는, 상기 주 센싱 데이터의 상향 누적합과 하향 누적합을 연산하는 단계를 포함하고, 상기 주 센싱 데이터의 측정값이 연속 증가하거나 연속 하강하는 경우에 3차 이상으로 판단하는 단계는, 상기 상향 누적합이 결정 구간 H보다 크거나, 상기 하향 누적합이 결정 구간 -H보다 작은 경우, 3차 이상으로 판단하는 단계를 포함할 수 있다.
또 다른 실시예에서. 상기 주 센싱 데이터의 실제값(Noise Cancelling Value)을 연산하는 단계는, 상기 주 센싱 데이터의 측정값에서 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간의 최대값을 뺀 값을 상기 실제값으로 연산하는 단계를 포함할 수 있다.
상기와 같은 본 발명에 따르면, 복수의 저비용의 센서를 이용하여, 고비용의 고성능 센서와 유사한 정확도를 확보할 수 있다. 즉 적은 비용으로도 높은 정확도로 데이터를 측정할 수 있다.
또한 낮은 비용으로 높은 정확도의 IoT 센서를 제공함으로써, IoT 센서를 이용하여 이상을 감지하는 산업 현장이나 재해 현장에서, 안정성을 평가하기 위한 중요한 정보를 제공할 수 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해 될 수 있을 것이다.
도 1은 종래의 IoT 센서를 설명하기 위한 예시도이다.
도 2는 종래의 IoT 센서가 사용하는 임계치 방법을 설명하기 위한 예시도이다.
도 3은 본 발명의 일 실시예에 따른 순차적 상태 추정 방법을 설명하기 위한 예시도이다.
도 4 내지 도 5는 본 발명의 일 실시예에 따른 측정 방법에서 주 센싱 데이터가 정상 상태일 때의 측정값(yo)과 정상 상태일 때의 측정값의 범위(region of yo)를 설명하기 위한 예시도이다.
도 6은 본 발명의 일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 방법에서 사용되는 다중 회귀 분석을 설명하기 위한 예시도이다.
도 7은 본 발명의 일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 방법에서 사용되는 불확실성 분석을 설명하기 위한 예시도이다.
도 8은 본 발명의 일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 방법에서 사용되는 누적합 분석을 설명하기 위한 예시도이다.
도 9는 본 발명의 일 실시예에 따른 데이터 측정 방법의 성능을 테스트한 결과를 그래프로 나타낸 것이다.
도 10 및 도 11a 내지 도 11c는 본 발명의 일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 방법의 순서도이다.
도 12는 본 발명의일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 장치의 하드웨어 구성도이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
명세서에서 사용되는 "포함한다 (comprises)" 및/또는 "포함하는 (comprising)"은 언급된 구성 요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
이하, 본 발명에 대하여 첨부된 도면에 따라 보다 상세히 설명한다.
도 1은 종래의 IoT 센서를 설명하기 위한 예시도이다.
도 1을 참고하면, 종래의 IoT 센서 중의 하나인 가스 검출기(110)의 외형을 볼 수 있다. 상단의 검침기를 측정하고자 하는 대상에 가져가면 하단의 LCD 화면에 측정된 값을 표시한다. 그리고 도 1에서 가스 검출기(110)의 아래에는 해당 제품에 관한 상세 정보(Specifications)을 확인할 수 있다. 다만, 도 1에 예시된 제품의 상세 정보는 실제 상용 제품의 상세 정보이기는 하나, 발명의 이해를 돕기 위한 일종의 예시일 뿐이다.
상세 정보를 구체적으로 확인해보면, 총 4종류의 제품이 나열되어 있다. 특히 사용하는 센서의 종류에 따라서 제품의 가격이나 성능이 달라지게 된다. 우선 4개의 제품 모두 휘발성 유기 화합물(VOC; Volatile Organic Compounds)을 측정하기 위한 기기이다.
그 중에서 위의 2개는 센서의 종류가 GSS이고, 아래의 2개는 센서의 종류가 PID이다. GSS는 Gas Sensitive Semiconductor의 약자로 저가형 센서의 일종이며, PID는 Photo Ionization Detector의 약자로 고성능 센서의 일종이다. 상세 정보에서도 볼 수 있듯이, 동일한 범위 0-25ppm의 휘발성 유기 화합물을 측정하기 위한 가스 검출기도 사용하는 센서에 따라서 미세 측정 범위(Resolution)나 정확도(Accuracy)가 다른 것을 볼 수 있다.
저가형의 GSS 센서를 이용한 첫번째 기기의 경우 0-25ppm의 범위를 측정할 수 있으며 최대 0.1ppm 단위로 측정이 가능하다. 또한 정확도는 <±0.5ppm+10% 의 정확도를 가진다. 또한 측정을 시작한 후, 결과값을 얻기까지 60s의 시간을 필요로 한다. 그리고 저가형 GSS 센서를 이용한 가스 검출기(110)는 0~40℃의 온도(Temperature)와 10~90%의 습도(Ratio of Humidity)에서 작동이 가능하다.
반면에 고가형의 PID 센서를 이용한 세번째 기기의 경우 동일하게 0-25 ppm의 범위를 측정할 수 있으며 최대 0.01ppm 단위로 측정이 가능하다. 또한 정확도는 <±0.05ppm+10% 의 정확도를 가진다. 또한 측정을 시작한 후, 결과값을 얻기까지 30s의 시간을 필요로 한다. 그리고 고가형 GSS 센서를 이용한 가스 검출기(110)는 0~40℃의 온도(Temperature)와 0~95%의 습도(Ratio of Humidity)에서 작동이 가능하다.
저가형 센서를 이용한 첫번째 기기와 고가형 센서를 이용한 세번째 기기를 비교하면 동일한 범위인 0-25ppm을 측정하면서도 고가형 기기의 측정 가능한 미세 측정 범위(Resolution)나, 정확도(Accuracy), 사용가능한 온도와 습도의 환경이 더 우수한 것을 볼 수 있다. 이는 저가형 센서 GSS를 이용한 두번째 기기와 고가형 센서 PID를 이용한 네번째 기기를 비교해보아도 마찬가지이다.
도 1에서 볼 수 있는 것처럼, 전반적으로 고가형 센서인 PID를 사용할수록 저가형 센서인 GSS에 비해, 측정 시간도 짧고, 측정 가능한 단위도 더 미세하며, 정확도 또한 더 높다. 또한 사용 가능한 온도와 습도의 환경도 더 유연한다.
공기 중에 노출된 특정 성분의 휘발성 유기 화합물을 측정하는 과정에서 저가형 GSS 센서는 온도와 습도의 영향을 많이 받기 때문에, 고가형 PID 센서에 비해 측정 가능한 미세 단위(Resolution)도 떨어지며, 정확도(Accuracy) 또한 떨어지게 된다. 대신 고가형 PID 센서에 비해 저가형 GSS 센서는 수배에서 수십배까지 가격이 저렴하다.
만약 저가형 GSS 센서를 사용하면서도, 고가형 PID 센서를 이용한 가스 검출기(110)처럼 측정 가능한 미세 측정 범위(Resolution)도 우수하며, 정확도(Accuracy) 또한 우수한 측정 방법이 있다면, 1) 비용 대비 효율 측면에서, 2) 정확도 측면에서, 3) 안전성 측면에서 바람직할 것이다.
그러기 위해서는 우선, 저가형 GSS 센서가 휘발성 유기 화합물을 측정하는 과정에서 영향을 미치는 요소들을 배제할 필요가 있다. 가스 검출기(110)에서는 온도와 습도가 환경 외란에 해당한다. 이는 IoT 센서마다 차이가 있을 수 있다.
빛의 세기를 측정하기 위한 조도계, 소리를 측정하기 위한 소음계 등 측정하고자 하는 대상에 따라 센서에 영향을 미치는 외부 요인이 다를 수 있다. 이는 센서를 제조하여 판매하는 회사에서 사전에 정보를 제공하므로 외부 요인은 이미 알고 있는 것으로 가정한다. 이하 이해의 편의를 돕기 위해 가스 검출기(110)를 위주로 설명을 계속해 나가기로 한다.
도 2는 종래의 IoT 센서가 사용하는 임계치 방법을 설명하기 위한 예시도이다.
도 2를 참고하면 종래의 IoT 센서는 세 단계에 걸쳐서 누출된 가스를 검출한다. 가스 검출기(110)가 공기 중 대상 가스의 양을 측정하고(Detect), 측정값을 수신한 제어부(120)에서 누출된 가스의 양이 이상인지 여부를 판단하고(Determine), 이상인 경우에 알람부(130)에서 알람을 발생시켜 사용자에게 정보를 제공한다(Alarm).
도 2의 예시에서는 가스 검출기(110), 제어부(120), 알람부(130)가 별도의 기기인 것처럼 도시되어 있지만, 이는 하나의 장비로 구현이 될 수도 있다. 예를 들면 위험한 화합물을 다루는 공장에서 휘발성 가스의 유출을 탐지하는 기기를 설치하고, 가스가 누출된 위급 상황이 발생하면 근로자를 대피시킬 수 있다.
이 과정에서 종래에는 임계치 방법(Threshold Method)에 의해 이상 여부를 감지한다. 즉 가스 검출기(110)의 센서가 측정한 값을 ys로 하고, 정상 상태일 때의 기준값을 yo로 두어, 그 비율과 1의 차이를 임계값 yth로 정해서 사용한다. 임계값 yth가 사전에 설정된 값 이상이면 가스가 유출된 것으로 보고 이상으로 판단할 수 있다.
Figure 112016073499126-pat00001
여기서 수학식 1에서도 볼 수 있듯이, 임계값 yth가 매우 작은 경우에는 0으로 근사할 수 있으므로, 식을 간단히 정리하면 ys가 yo보다 큰 경우에 이상으로 판단할 수 있다. 즉 측정된 값 ys가 정상상태일 때의 값 yo보다 큰 경우에 이상으로 판단하는 것이다. 다만, 문제는 제조 업체에서 센서의 성능에 따라 정상상태의 yo 값을 다르게 설정한다는 점이다.
도 2의 하단에는 00시부터 12시까지 시간에 따른 VOC의 측정값의 변화를 그래프로 표시한 것을 볼 수 있다. 정상상태의 값을 yo1으로 300 ppb로 설정하면, 09시와 10시 사이인 t3에만 알람이 발생할 것이다. 만약 정상상태의 값을 yo2으로 250ppb로 설정하면 09시와 10시 사이인 t3 시점뿐만 아니라, 00시와 01시 사이인 t1과 08시와 09시 사이인 t2에서도 알람이 발생할 수 있다.
도 2에서 볼 수 있듯이 yo의 값을 300ppb로 설정하면, t3일 때 364ppb만 감지가 가능하다. 반면에 yo의 값을 250ppb로 설정하면, t1일 때 253ppb와 t2일 때 289ppb도 감지가 가능하다. 즉 성능이 좋은 센서일수록, 정확도가 높은 센서일수록 미세한 감지가 가능하다. 하지만 대부분의 일반 센서는 정확도가 낮고 미세한 측정 범위에서는 오차가 크기 때문에 임계치를 높게 설정하여 이상을 감지한다.
임계값 yth는 각 센서의 제조 업체에서 제공하는 값이며, 저가형 센서일수록 온도와 습도에 민감하게 반응하기 때문에, 이러한 오차까지 감안하여 임계값을 비교적 크게 설정한다. 대신 미세한 변화는 감지가 어려운 단점이 있으며, 또한 도 2의 하단에서 볼 수 있듯이 온도나 습도의 변화와 무관하게 고정된 값 yo를 기준으로, 측정값 ys가 yo를 초과하였는지 여부만으로 이상 여부를 판단하는 단점이 있다.
본 발명에서는 이러한 단점을 극복하기 위하여, 1) 미세한 변화도 감지할 수 있는 방법 및 2) 고정된 값이 아닌 상황에 따라 시시각각 변하는 값을 기준으로 이상 여부를 판단할 수 있는 측정 방법을 제안한다.
도 3은 본 발명의 일 실시예에 따른 순차적 상태 추정 방법을 설명하기 위한 예시도이다.
본 발명의 순차적 상태 추정 방법은 도 3에서 볼 수 있듯이 시시각각 이상 여부를 판단할 수 있는 범위를 새로 계산하여 이를 기준으로 가스가 누출되었는지 여부를 판단한다. 이를 위해서는 온도와 습도로 인해 가스를 측정하는데 발생할 수 있는 영향을 사전에 분석하여야 한다.
도 3을 참고하면, 도 2와는 다르게 가스 검출기(110) 외에 추가로 2개의 일반 센서를 더 사용하는 것을 볼 수 있다. 그것은 온도 센서(113)와 습도 센서(115)로 본 발명의 순차적 상태 추정 방법은 온도와 습도를 실시간으로 측정하여 그로 인한 영향을 가스 측정에 반영하는 방법이다.
이를 위해서 제어부(120)에서는 가스 검출기(110)의 측정값과 온도 센서(113)의 측정값 및 습도 센서(115)의 측정값을 모두 수신하여, 가스와 온도 및 습도 사이의 관계를 분석한다. 최근 가스 누출이 없다는 전제 아래, 즉 정상 상태라는 전제 아래 가스 검출기(110)의 측정값과 온도 및 습도의 측정값을 동일한 구간을 선정하여 다중 회귀 분석(Multivariate Regression Analysis)을 수행한다.
예를 들어 매초마다 가스와 온도 및 습도의 값을 측정하여 시계열 데이터를 생성한다고 할 때, 현재 시점으로부터 10초 이내의 즉 10개의 측정값을 이용하여 회귀 분석을 수행하는 것이다. y1~y10이 최근 측정된 10개의 가스 데이터이고, α1~α10이 최근 측정된 10개의 온도 데이터, β1~β10이 최근 측정된 10개의 습도 데이터라 가정하면, 그 다음에는 y2~y11와 α2~α11 및 β2~β11을 이용하여, 정상 상태일 때 가스 검출기(110)의 측정값과 온도 및 습도의 관계를 매초마다 분석한다.
이러한 과정을 거쳐서 정상 상태일 때를 기준으로 온도와 습도의 변화에 따른 가스 검출기(110)의 측정값을 예상할 수 있다. 도 3의 예에서는 진한색으로 표시된 yo의 곡선이 그 예측값이다. 실제 가스 검출기(110)에서 측정된 값 ys가 yo와 유사하다면 가스 누출로 인한 변화가 아니라 온도와 습도의 변화로 인한 ys값의 변화라고 판단할 수 있다.
가스 검출기(110)의 시계열 데이터와 가스 검출에 영향을 미치는 온도와 습도를 측정한 기기(113, 115)의 시계열 데이터를 이용하여, 가스와 온도 및 습도 사이의 관계를 분석하고, 정상 상태에서의 가스 검출기(110)의 측정값을 예상하는 단계에 대해서는 추후 도 6에서 보다 자세히 설명하도록 한다.
여기서 추가로 이용하는 보조 센서인 온도 센서(113)와 습도 센서(115) 역시 저가형의 센서이므로, 온도 센서(113)와 습도 센서(115)의 오차를 고려할 필요가 있다. 저가형 센서를 이용한 가스 검출기(110)가 온도와 습도의 영향으로 측정값이 변할 수 있는 것처럼, 마찬가지로 온도 센서(113)와 습도 센서(115) 역시도 실제 온도나 습도의 변화가 없음에도 외부 요인으로 인해 측정값이 오차를 가질 수 있다.
이를 반영하기 위해 불확실성 분석(Uncertainty Analysis)을 수행한다. 불확실성 분석은 온도 센서(113)와 습도 센서(115)가 측정한 값의 확률 분포를 이용하여 실제 정상 상태일 때의 가스 검출기(110)의 측정값을 확률 함수로 구하는 과정을 말한다. 확률 함수로 구해진 가스 검출기(110)의 측정값은 도 3의 예시처럼 yo를 기준으로 위로 일정 범위, 아래로 일정 범위를 가지는 정상 상태 영역(region of yo)으로 표시될 수 있다. 이를 다른 말로 신뢰 구간이라고도 한다.
즉 온도 센서(113)와 습도 센서(115)의 오차를 고려한 정상 상태 값의 범위를 예측하고, 이를 벗어나는 경우 이상으로 판단하는 것이다. 이를 위해서 온도 센서(113)와 습도 센서(115)의 측정값과 실제의 온도 및 습도가 정규 분포를 가진다고 가정하고, 온도와 습도의 확률 함수를 구한다. 즉, 앞서 이용한 10개의 시계열 데이터를 이용하여 온도 및 습도의 평균과 분산을 구하고, 평균과 분산으로부터 정규 분포 함수를 역으로 추정한다.
온도와 습도의 정규 분포 함수를 구한 후에는, 정규 분포 함수를 이용하여 온도와 습도의 데이터를 무작위로 샘플링 한다. 샘플링한 데이터를 앞서 구한 온도 및 습도와 가스 측정값 사이의 관계 함수에 대입하면, 가스 측정값의 예상 범위를 얻을 수 있다. 즉 도 3에 표시된 yo의 범위는 해당 범위의 모든 값이 동일한 가중치를 가지는 것이 아니라, yo의 실선에 가까울수록 예측값에 가까운 분포 함수를 가진다. 이에 대해서는 도 5에서 보다 자세히 살펴보도록 한다.
온도 센서(113)와 습도 센서(115)가 측정한 온도와 습도의 값을 이용하여 온도와 습도의 확률 분포 함수를 구하고, 온도와 습도의 확률 분포 함수로부터 온도와 습도 데이터를 샘플링 하여 정상 상태일 때의 가스 검출기(110)의 측정값의 예상 범위를 구하는 단계에 대해서는 추후 도 7에서 보다 자세히 설명하도록 한다.
다중 회귀 분석과 불확실성 분석을 통해서 가스가 누출되었는지 여부의 판단이 가능하지만, 정확도를 더욱 높이기 위하여 누적합 분석(CUSUM; Cumulative Summation)을 통해 최종적으로 가스가 누출되었는지 여부를 판단한다. 누적합 분석은 측정된 데이터가 연속적으로 증가하는 경우나 반대로 연속적으로 감소하는 경우를 감지하기 위한 통계적 기법이다. 누적합 분석을 이용하여 최종적으로 이상 여부를 판단하는 단계에 대해서는 추후 도 8에서 보다 자세히 설명하도록 한다.
도 3의 하단에 표시된 예시를 살펴보면 본 발명은 온도와 습도로 인한 정상 상태일 때의 가스 측정값을 예상하여 yo로 표시하고, 온도 센서(113)와 습도 센서(115)의 오차까지 감안하여 정상 상태일 때의 가스 측정값의 범위를 yo를 포함한 빗금 영역으로 표시한 것을 볼 수 있다.
이상 여부를 판단하는 기준이 실시간으로 변하므로 저가형 센서를 이용하였음에도 불구하고, 00시부터 01시 사이의 t1 시점의 253ppb의 측정값을 이상으로 판단하고, 마찬가지로 08시부터 09시 사이의 t2 시점의 289ppb의 측정값을 이상으로 판단하고, 마지막으로 09시부터 10시 사이의 t3 시점의 364ppb의 측정값을 이상으로 판단할 수 있다. 즉 미세 측정 범위까지도 측정이 가능하다.
또한 본 발명은 다중 회귀 분석을 통해 1차적으로 이상 여부를 판단하고, 1차 이상으로 판단된 경우에 한하여 불확실성 분석을 통해 2차적으로 이상 여부를 판단한다. 마지막으로 2차 이상으로 판단된 경우에 한하여 최종적으로 누적합 분석을 통해 3차적으로 이상 여부를 판단한다. 세가지 통계적 기법을 이용하여 최종 이상 여부를 판단하므로 저가형 센서를 이용함에도 신뢰도를 높일 수 있다.
정리하면, 도 3에서 볼 수 있는 것처럼 본 발명의 일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 방법은 실시간으로 이상 여부를 판단하는 기준이 변하기 때문에 미세한 범위도 측정이 가능하며, 3가지 통계적 기법을 이용하여 최종적으로 이상 여부를 판단하기 때문에 높은 신뢰도를 확보할 수 있다.
도 4 내지 도 5는 본 발명의 일 실시예에 따른 측정 방법에서 주 센싱 데이터가 정상 상태일 때의 측정값(yo)과 정상 상태일 때의 측정값의 범위(region of yo)를 설명하기 위한 예시도이다.
도 4는 도 2에서 09시와 10시 사이인 t3 시점을 확대한 도면이다. 앞서 설명한 것처럼 yo는 정상 상태일 때를 기준으로 한, 측정하고자 하는 대상의 농도이다. 즉 가스 검출기(110)로 측정하고자 하는 대상을 x가스라고 가정하면, x가스의 농도를 의미한다.
그리고 정상 상태일 때의 x가스의 농도 yo를 기준으로 +방향으로 빗금 친 영역과 -방향으로 빗금 친 영역은 보조 센서의 오차를 감안한 정상 상태 영역이다. 즉, 보조 센서인 온도 센서(113)와 습도 센서(115)의 오차를 감안하더라도, 가스 검출기(110)의 측정값이 정상 상태 영역에 포함되는 경우에는 정상으로 판단할 수 있는 것이다.
+방향으로 빗금 친 영역의 경계를 yτ +라 하고, -방향으로 빗금 친 영역의 경계를 yτ -라 하면, yo - yτ - <= y <= yo + yτ + 의 범위는 정상 상태로 볼 수 있는 가스 검출기(110)의 측정값의 범위이다. 가스 검출기(110)가 측정한 x가스의 농도를 ys로 표시하면 다음의 수학식을 얻을 수 있다.
Figure 112016073499126-pat00002
즉 가스 검출기의 측정값 ys는 실제 누출된 x가스의 농도 yx와 정상 상태 일 때의 측정값 yo 및 보조 센서의 오차로 인한 +오차 yτ +를 합한 값이다. 물론 측정값의 정상 상태는 yo - yτ - <= y <= yo + yτ + 의 범위에 해당하므로, yx = ys - (yo + yτ+) 대신 yx = ys - (yo - yτ-)를 사용할 수도 있으나, 이상 여부 판단의 신뢰도를 높이기 위해서 +경계선인 yτ +를 기준으로 누출된 가스의 양 yx를 계산하기로 한다.
수학식 2를 확률 분포 함수로 다시 표시하면, 측정값 ys는 누출된 가스 x와 정상 상태일 때의 값 o, 외부 환경 요인 {α, β, ν}가 모두 반영된 값으로 Ys(x, o, {α,β,ν})로 표시할 수 있고, 이는 누출된 가스 x의 확률 분포 함수 P(x)와 정상 상태일 때의 확률 분포 함수 P(o) 및 외부 환경 요인으로 인한 변화를 모두 더한 값으로 표시할 수 있다.
Figure 112016073499126-pat00003
여기서 정상 상태일 때의 확률 분포 함수 P(o)와 외부 환경 요인으로 인한 변화를 모두 더한 측정값을 정상 상태 영역으로 YO로 정의하면 다음의 수식을 얻을 수 있다.
Figure 112016073499126-pat00004
이는 yx = ys - (yo + yτ +)에 대응되는 수식으로, 가스 검출기(110)의 측정값에서 정상 상태로 예측된 값의 차이를 구하여, 실제 누출된 가스의 양을 계산할 수 있음을 보여준다.
1차로 다중 회귀 분석, 2차로 불확실성 분석, 3차로 누적합 분석을 통해서 최종적으로 이상으로 판단된 경우에는 위 수학식 4을 이용하여 최종적으로 누출된 가스의 양을 계산하여 사용자에게 알려줄 수 있다. 이에 대해서는 추후 도 8에서 보다 자세히 설명하기로 한다.
여기서 정상 상태 영역 yo - yτ - <= y <= yo + yτ + 의 범위는 모두가 동일한 가중치를 갖는 것은 아니다. 확률 분포상 yo에 가까울수록 실제 측정값이 정상 상태일 확률이 높다. 이를 도 5에서 살펴보면, 온도 센서(113)와 습도 센서(115)의 측정값으로부터 예상한 정상 상태의 값(yo)를 기준으로 정상 상태 영역에 걸쳐서 확률 분포를 가지게 된다.
도 5를 참고하면 정상 상태 영역에 대응되는 확률 분포 함수가 도시된 것을 볼 수 있다. 정상 상태의 값 yo에 가까울수록 확률이 높고, 정상 상태 영역(region of yo)의 경계선에 가까울수록 확률이 상대적으로 낮다. 이때 정상 상태 영역의 경계선은 확률 분포 함수에서 신뢰도를 기준으로 확정하게 된다. 즉 확률 분포 함수에서 이상치(outlier)를 제외하고 정상 상태 영역의 경계를 정할 수 있다.
이상치(outlier)는 온도와 습도 데이터를 샘플링해서 정상 상태 영역을 만들 때 적용할 수 있다. 신뢰도에 따라 1σ, 3σ, 5σ의 값을 샘플링 데이터의 이상치로 지정하고, 샘플링 데이터를 필터링하여 가스 검출기(110)의 측정값의 정상 상태 영역을 구할 수 있다. 신뢰도에 따른 샘플링 데이터의 이상치(outlier) 제거는 도 7에서 보다 자세히 설명하기로 한다.
도 6은 본 발명의 일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 방법에서 사용되는 다중 회귀 분석을 설명하기 위한 예시도이다.
도 6을 참고하면, 다중 회귀 분석을 수행하는 단계는 우선 주 센서와 보조 센서로부터 측정된 시계열 데이터를 수신한다. 보조 센서는 주 센서의 측정에 영향을 미치는 외부 환경 요인을 측정하기 위한 센서이다. 가스 검출기(110)의 경우에는 온도와 습도의 영향을 받으므로 저가형의 GSS 센서를 이용한 가스 검출기(110), 보조 센서로 온도 센서(113)와 습도 센서(115)를 결합하여, 현재 시점으로부터 일정 구간 이내의 시계열 데이터를 수신한다.
도 6의 예에서는 i-n 시점부터 i 시점까지, 주 센서의 시계열 데이터 Y와 보조 센서의 시계열 데이터 α, β를 수신한 것을 볼 수 있다. 실제 구현을 할 때에는 매초 단위로 데이터를 수집하고, 10초 이내의 데이터를 이용하여 가스와 온도 및 습도 사이의 관계를 분석하였으나, 이에 한정되는 것은 아니다. 더 많은 데이터를 수집하여 분석할수록 정확도는 높아지나, 실시간성은 떨어지므로, 측정하고자 하는 대상의 특성에 따라 다중 회귀 분석에 사용할 시계열 데이터의 구간을 결정할 수 있다.
주 센서와 보조 센서의 시계열 데이터를 수신한 후에는 다중 회귀 분석을 통해 가스와 온도 및 습도 사이의 관계를 구할 수 있다. 이 때 구한 예측 모델은 온도와 습도의 변동으로 인한 정상 상태일 때의 가스 검출값의 변동을 파악하기 위한 것이다. 도 6의 예시에서는 2차 이상의 회귀 모델 관계식을 생성하여, 정상 상태일 때의 가스 측정값의 예측 모델로 사용한다.
Figure 112016073499126-pat00005
주 센서의 측정값 및 보조 센서의 측정값을 입력하여 예측 모델의 계수 A0 내지 A5를 구하는 과정은 회귀 분석과 관련된 내용에서 참고할 수 있으므로 자세한 설명은 생략하기로 한다. 도 6의 예에서는 10초의 구간에 해당하는 시계열 데이터를 이용하여 수학식 5의 예측 모델의 계수를 결정할 수 있다.
이 때, 가스 측정값의 예측 모델은 지속적으로 갱신될 수 있다. 즉 현재 i 시점에서는 i-n 시점부터 i 시점까지의 n개의 시계열 데이터를 이용한 후에는, i+1 시점에는 i-n+1 시점부터 i+1 시점까지의 n개의 시계열 데이터를 이용하여 예측 모델을 지속적으로 갱신해 나갈 수 있다.
이렇게 가스 측정값의 예측 모델을 지속적으로 갱신해 나가는 한편, 현재 측정된 온도와 습도 데이터로부터 현재 가스 측정값을 예측한다. 이는 정상 상태일 때의 예측값으로, 가스 누출이 없다면 온도와 습도의 변동으로 인해, 가스의 측정값이 얼마만큼 변동될 수 있는지를 수치화한 것이다.
여기서 다중 회귀 분석의 예측 모델 아래의 SST = SSR + SSE의 수식은 다원 분산 분석(Analysis of Variance)로 잔차(Residual) 해석을 수행하는 과정을 수식으로 표시한 것이다. SSE는 총 제곱합이고, SSR은 회귀 제곱합, SSE는 오차 제곱합을 의미한다.
예를 들어 도 6의 가운데 그래프에서 측정값 y의 평균을
Figure 112016073499126-pat00006
(y bar)로 표시할 때, y의 평균과 관계식의 교점인 지점에서 x 값이 변화할 때, 즉 독립 변수가 xi로 변동되는 경우 y의 변화량은 yi의 예측값
Figure 112016073499126-pat00007
에서 y의 평균을 뺀 값으로 (
Figure 112016073499126-pat00008
)로 정의할 수 있다. 이는 독립 변수 x와 종속 변수 y의 관계식에서 x가 얼만큼 변하면 이로 인해 y의 값은 얼만큼 변할 것이라는 변동의 예측이다.
하지만 실제로 측정된 yi의 값이
Figure 112016073499126-pat00009
보다 더 큰 값인 경우, 그 차이인 (yi-
Figure 112016073499126-pat00010
)는 x의 변동으로도 설명되지 않는 y 값의 변동이다. 이 때, 총 제곱합(SST)은 (yi-
Figure 112016073499126-pat00011
)를 이용하여 구한 값이며, 회귀 제곱합(SSR)은 (
Figure 112016073499126-pat00012
)를 이용하여 구한 값이고, 마지막으로 오차 제곱합(SSE)은 (yi-
Figure 112016073499126-pat00013
)를 이용하여 구한 값이다.
이들 사이의 관계를 통해서, 총 제곱합 SST는 회귀 제곱합 SSR과 오차 제곱합 SSE의 합이라는 것을 알 수 있다. 즉 실제로 측정된 값은 예측한 변동량 + 예측할 수 없는 오차의 변동량이다. 다시 말해 SST는 주된 센서의 총 변동이며, SSR은 예측된 변동이며, SSE는 오차로 인한 변동이다.
이 때 ω = SSE - τ 로 정의할 때, ω가 0보다 큰 경우 1차 이상상태로 판단한다. 즉 식을 다시 정리하면 SSE > τ 인 경우에 1차 이상으로 판단한다. 다시 말해, 예측하지 못한 변동, 즉 오차로 인한 변동 SSE의 값이 기 설정된 값인 τ보다 큰 경우에 1차 이상으로 판단한다.
τ을 작게 설정하면 주된 센서인 가스 검출기(110)의 측정값이 다중 회귀 분석을 통해 구한 예측값과 조금만 차이가 나도 1차 이상으로 판정될 것이다. 반대로 τ을 크게 설정하면 측정값이 예측값과 다소 차이가 나더라도 1차 이상으로 판정되지 않을 것이다. 여기서 τ를 설정하기에 따라 1차 이상으로 판단되는 정도가 달라지게 된다.
도 6의 식 우측에는 τ에 따른 민감도를 도시하였다. 이는 일종의 예시이며 발명을 제한하는 것은 아니나, 실험에 의하면 τ의 값을 0.09보다 작게 설정하면 오차로 인한 초미세 변동이 발생하면 1차 이상으로 판단되었다. 만약 τ의 값을 0.09 이상 0.15 미만으로 설정하면 중간 미세변화에도 1차 이상으로 판단하고, τ의 값을 0.15 이상 0.2 미만으로 설정하면 미세변화에만 1차 이상으로 판단하는 것을 볼 수 있다.
τ의 값을 설정하는 것에 따라 측정 가능한 미세 측정 범위가 달라지므로 측정하고자 하는 대상 데이터의 특성, 측정 데이터를 활용하고자 하는 목적에 따라 τ의 값을 선택하여 설정할 수 있다. 민감한 변화도 감지하기 원한다면 τ의 값을 작게 설정하면 충분하다.
본 발명은 1차 이상인 측정 데이터에 한하여 2차 이상, 3차 이상 여부를 판단하므로 τ의 값을 실험에 의해 얻은 0.09 보다 작은 값으로 설정하여 초미세 변화에도 1차 이상으로 판단하도록 설정한다. 그리고, 1차 이상으로 판단된 데이터에 대해 추가적으로 불확실성 분석과 누적합 분석을 수행하는 과정에 대해 설명을 계속해 나가기로 한다.
도 7은 본 발명의 일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 방법에서 사용되는 불확실성 분석을 설명하기 위한 예시도이다.
도 6에서 설명한 다중 회귀 분석을 통해서 정상 상태일 때의 측정값을 예상하는 과정에 대해서 살펴보았다. 앞서 설명한 것처럼 정상 상태일 때의 측정값을 예상하기 위해서는 주 센서에 영향을 미치는 온도와 습도를 보조 센서로 별도로 구하고, 외부 요인에 의한 영향도를 반영하여 측정값을 예상하였다. 이 값이 도 3에서 굵은 선으로 표시된 yo에 해당한다.
다만, 보조 센서인 온도 센서(113) 및 습도 센서(115) 역시 저가형 센서를 사용하여 데이터를 수집하므로, 이들 센서의 불확실성을 고려할 필요가 있다. 여기서 우리는 한가지 가정이 필요하다. 그것은 실제 온도와 온도 센서(113)를 이용하여 측정한 값은 정규 분포를 따르고, 실제 습도와 습도 센서(115)를 이용하여 측정한 값도 정규 분포를 따른다는 가정이다.
즉, 도 7에 포함된 그래프에서 볼 수 있듯이 실제의 온도가 μ라고 하면 이를 온도 센서(113)로 측정하면 측정값의 68.26%는 μ-σ 와 μ+σ의 범위 안에 포함되고, 측정값의 95.46%는 μ-2σ 와 μ+2σ의 범위 안에 포함되고, 측정값의 99.72%는 μ-3σ 와 μ+3σ의 범위 안에 포함된다. 여기서 μ는 실제의 온도 내지 측정값의 평균이고, σ는 측정값의 분산이다.
정규 분포(Normal Distribution; Gaussian Distribution)의 특징은 측정값의 평균과 분산을 알면 역으로 정규 분포 함수를 구할 수 있다는 점이다. 정규 분포의 확률 밀도 함수를 유도하는 자세한 과정은 정규 분포와 관련된 내용에서 참고할 수 있으므로 설명을 생략하기로 한다. 간단하게 결과만 확인하면 측정값의 평균과 분산을 통해 다음의 수학식의 정규 분포의 확률 밀도 함수를 얻을 수 있다.
Figure 112016073499126-pat00014
앞서 정상 상태일 때의 가스의 측정값과 온도 및 습도 사이의 관계를 구하기 위하여 10개의 시계열 데이터를 사용한 것을 보았다. 이때 사용한 10개의 시계열 데이터로부터 온도의 평균(μα) 및 분산(σα)을 구하고, 마찬가지로 습도의 평균(μβ) 및 분산(σβ)을 구할 수 있다.
온도 및 습도의 평균과 분산을 이용하여 온도의 확률 밀도 함수 P(α)와 습도의 확률 밀도 함수 P(β)를 연산한다. 온도와 습도의 확률 밀도 함수 P(α)와 P(β)가 온도 센서(113)과 습도 센서(115)의 불확실성을 반영한 함수이다. 즉 실제 온도가 μα라고 했을 때, 이를 온도 센서(113)로 측정하면 P(α)의 확률로 값이 측정되며, 실제 습도가 μβ라고 했을 때, 이를 온도 센서(113)로 측정하면 P(β)의 확률로 값이 측정된다.
앞서 온도와 습도의 시계열 데이터로부터 다중 회귀 분석을 통해, 정상 상태일 때의 측정값을 예상한 값 yo를 구할 수 있었으므로, 마찬가지로 다중 회귀 분석을 통해 얻은 관계식에 온도와 습도의 확률 밀도 함수를 대입하면 예측값 yo의 범위를 구할 수 있다. 즉, 정상 상태 일 때의 yo의 확률 밀도 함수를 구할 수 있다. 우리는 이를 정상 상태 영역(region of yo)라고 부르기로 한다.
다만, 확률 밀도 함수는 수학식 6에서도 볼 수 있듯이, 측정값이 커질수록 측정값의 확률이 지수 함수적으로(exponentially) 감소할 뿐 확률 자체가 0인 것은 아니므로 이상치(outlier)의 구간을 제외할 필요가 있다. 이상치의 구간은 보통 68%는 1σ, 95%는 2σ, 99.7%는 3σ의 값을 이용한다. 이는 측정하고자 하는 대상의 특성 및 측정값을 사용하고자 하는 목적에 따라 다르게 설정할 수 있다.
이하 이해의 편의를 돕기 위해 이상치의 구간을 5%로 설정하고, 이를 제거하여 정상 상태 영역을 구하는 과정을 설명하도록 한다. 우선 온도의 확률 밀도 함수 P(α)와 습도의 확률 밀도 함수 P(β)를 이용하기 위해, 몬테카를로 시뮬레이션(Monte-Carlo Simulation)에 의해 m개의 예측 데이터
Figure 112016073499126-pat00015
Figure 112016073499126-pat00016
를 샘플링 한다.
이 때 5%의 이상치 구간을 삭제한 후, 도 6의 다중 회귀 분석을 통해서 구한 수학식 5로 표현되는 관계식에 샘플링한 데이터를 입력하여 측정값의 예측값을 구한다. 그러면 샘플링한 m개의 데이터만큼 예측값을 얻을 수 있고 이는 일정한 분포를 이루게 된다. 그것이 앞서 도 5에서 살펴본 정상 상태 영역의 확률 분포이다. 이 과정을 수식으로 나타내면 다음과 같다.
Figure 112016073499126-pat00017
이 때,
Figure 112016073499126-pat00018
의 최대값이 보조 센서의 오차를 고려한 정상 상태 영역의 상한 경계선이며,
Figure 112016073499126-pat00019
의 최소값이 보조 센서의 오차를 고려한 정상 상태 영역의 하한 경계선이다. 이를 수식으로 나타내면 다음과 같다.
Figure 112016073499126-pat00020
다만, 앞서 도 6에서 설명한 것처럼 1차 이상을 판단하기 위해 임의로 설정한 값 τ를 이용하였다. 대부분의 경우 이 τ값이 보조 센서의 오차를 반영한 정상 상태 영역의 경계값인
Figure 112016073499126-pat00021
Figure 112016073499126-pat00022
보다는 작을 것이지만, τ값을 설정하기에 따라 더 클 수도 있으므로 이를 비교하여 최종적으로 정상 상태 영역의 경계선을 정할 필요가 있다. 도 6에서 사용한 τ값을
Figure 112016073499126-pat00023
Figure 112016073499126-pat00024
로 좀 더 세분화해서 표현하면 다음의 식을 얻을 수 있다.
Figure 112016073499126-pat00025
이렇게 구한 τ+와 τ-가 정상 상태일 때의 가스 측정값의 범위이므로 이를 벗어나는 경우에는 2차 이상으로 판단할 수 있다. 수식으로 표현하면 !(τ- < yi < τ+)인 경우에는 2차 이상으로 판단할 수 있다. 즉, 측정값 ys와 정상 상태일 때의 예측값 yo를 비교하여 1차 이상 여부를 판단하고, 1차 이상인 측정값에 대해 정상 상태 영역을 비교하여 2차 이상 여부를 판단한다.
다시 말해 측정값이 정상 상태일 때의 예측값을 벗어나고(1차 이상), 보조 센서의 오차를 고려하여 정상 상태라고 볼 수 있는 범위 마저 벗어나면(2차 이상) 측정값을 이상으로 판단하는 것이다. 지금까지 살펴본 다중 회귀 분석과 불확실성 분석의 통계적 기법을 통해 이상 여부를 판단해도 충분하나, 본 발명에서는 정확도를 더욱 높이기 위하여 누적합 분석을 이용한 이상 판단을 더 제안한다.
도 8은 본 발명의 일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 방법에서 사용되는 누적합 분석을 설명하기 위한 예시도이다.
누적합이란 측정된 값의 경향(shift)이 연속 증가이거나 연속 하강인 경우 이를 신속하게 감지하는 통계적 방법이다. 다중 회귀 분석을 통한 1차 이상 판단과, 불확실성 분석을 통한 2차 이상 판단에도 불구하고 가스 검출기(110) 센서의 오류로 인해 특정 시점의 측정값만 비정상적으로 크거나 작게 나오면 이상으로 판단될 수 있으므로 이를 배제하기 위한 것이다.
즉, 실제로 가스가 누출되어 가스 검출기(110)의 센서가 실제 측정 물질인 가스에 반응하였다면, 측정값이 연속 증가할 것이므로 이를 감지하여 특정 시점만 측정값이 튀는 경우를 제외하고 정말로 가스가 누출된 경우만 이상으로 판단하기 위해 누적합 분석을 적용하는 것이다.
누적합 분석은 과거 측정값의 변화를 계속 누적하여 누적의 효과를 이용하는 방법이다. 이를 통해 연속 증가 또는 연속 감지와 같은 측정값의 경향을 빠르게 감지할 수 있다. 이를 위해서 누적합은 표본값(=평균)에서 측정값이 얼마나 차이가 나는지를 계산하고, 그 차이를 계속해서 누적해 간다. 이를 수식으로 표현하면 다음과 같다.
Figure 112016073499126-pat00026
xj는 j번째 측정값이며
Figure 112016073499126-pat00027
는 j번째까지의 누적 평균, μ0는 초기 평균(또는 목표값)을 의미한다. 누적합(CUSUM)은 측정값의 변화를 탐지하는 것이 목적이지만, 평균이 변하기만 하면 그 변화를 탐지해 내자는 것은 아니다. 측정 오차 등과 같은 미세한 변화는 때로는 중요하지 않을 수 있기 때문에 어느 정도의 변화를 탐지하기를 원하는지에 대한 기준이 필요하다.
즉 누적합 분석에서는 탐지하고자 하는 변화의 크기를 지정하는 참고값(reference value, K)을 설정한다. 일반적으로 탐지하고자 하는 변화의 크기는 표준편차 단위로 나타내며 이를 수식으로 표현하면 다음과 같다.
Figure 112016073499126-pat00028
이 참고값 K를 고려하여 +로 발생하는 편차는
Figure 112016073499126-pat00029
로 관리하고, -로 발생하는 편차는
Figure 112016073499126-pat00030
로 관리한다. 전자를 상향 누적합(upper CUSUM), 후자를 하향 누적합(lower CUSUM)이라 한다. 이를 수식으로 표현하면 다음과 같다.
Figure 112016073499126-pat00031
상향 누적합 또는 하향 누적합이 일정 기준을 벗어나면, 다시 말해 측정값이 지속적으로 증가하거나 지속적으로 감소하면 이를 감지하여 3차 이상으로 판단한다. 즉 최종적으로 이상으로 판단하고 가스가 누출되었다고 판단한다. 가스 누출의 경우 측정값이 +방향으로 증가하는 경향을 보일 것이므로 상향 누적합이 중요하다.
여기서 상향 누적합이나 하향 누적합을 비교할 기준이 필요한데 이를 결정 구간(decision interval, H)라 하며, 필요에 따라 1σ, 3σ, 5σ 등의 값을 사용할 수 있다. 상향 누적합이 H보다 크거나(
Figure 112016073499126-pat00032
H), 하향 누적합이 -H보다 작은 경우(
Figure 112016073499126-pat00033
<-H), 측정값이 지속적으로 증가하거나 지속적으로 감소한다고 볼 수 있으므로 3차 이상으로 판단한다.
3차 이상으로 판단한 후에는 실제 센서의 측정값을 계산할 수 있다. 즉, 측정값에서 정상 상태일 때의 값을 빼서, 누출된 가스의 양만 측정하여 제공할 수 있는 것이다. 앞서 도 4에서 구한 yx = ys - (yo + yτ +) 수식을 사용하여, 누출될 가스의 양만 측정하여 사용자에게 제공할 수 있다. 이를 통해 저가형의 센서를 이용하면서도, 미세한 범위까지 측정이 가능하다.
실제 누출된 가스의 양(yx)은 측정값(ys)에서 정상 상태 영역의 상한 경계선(yo + yτ +)을 뺀 값이다. 정상 상태 영역의 상한 경계선을
Figure 112016073499126-pat00034
라고 하면, 실제 누출된 가스의 양은
Figure 112016073499126-pat00035
로 표시할 수 있다. 이를 통해 실제 누출된 가스의 양을 계산할 수 있다.
여기서 GSS(Gas Sensitive Semiconductor)와 같은 가스를 검출하는데 사용되는 저가형 센서는 가스의 농도에 따라 반도체 소자의 저항값이 변하는 원리를 이용하여 가스의 농도를 측정하므로, 지금까지 살펴본 가스의 측정값은 실제로는 반도체 소자의 저항값의 변화로 관찰된다.
도 8의 예에서는 측정된 소자의 저항값은 200.5Ω이고, 정상 상태일 때의 소자의 저항값은 199.4Ω으로 누출된 가스로 인해 변한 저항값은 1.1Ω에 해당한다. 각 센서를 제조하는 제조 업체에서는 이렇게 측정된 저항값을 가스의 농도로 변환할 수 있는 변환 테이블(trans table)을 제공한다. 이 변환 테이블에서 1.1Ω에 해당하는 가스의 농도를 읽으면, 바로 이 값이 누출된 가스의 농도에 해당한다.
도 8의 하단의 그래프는 MiCS-2614 제품의 실험식으로, 1.1Ω에 해당하는 가스의 농도는 120ppb임을 알 수 있다. 물론 경우에 따라서는 실험식이 측정된 저항값 - 정상 상태일 때의 저항값이 아닌, 측정된 저항값 / 정상 상태일 때의 저항값으로 구하는 경우도 있다. 즉 빼기 연산이 아닌 나누기 연산이 필요한 경우도 있으나 이 때에는 센서 제조 업체가 제공하는 실험식에 따라서 실제 누출된 가스의 양을 구하면 충분하다.
지금까지 도 5 내지 도 7을 통해서 본 발명의 일 실시예에서 따른 통계적 분석 기법에 기반한 데이터 측정 방법을 살펴보았다. 1) 다중 회귀 분석을 통한 1차 이상 판단, 2) 불확실성 분석을 통한 2차 이상 판단, 3) 누적합 분석을 통한 3차 이상 판단 및 4) 최종적으로 이상으로 판단된 경우에 한하여 누출된 가스의 양을 측정하는 방법까지 살펴보았다.
도 9는 본 발명의 일 실시예에 따른 데이터 측정 방법의 성능을 테스트한 결과를 그래프로 나타낸 것이다.
본 발명의 일 실시예에 따른 데이터 측정 방법의 성능을 테스트해보기 위해서 수백만원에 판매되는 광 이온화 측정기(PID)와 총 5만원 상당의 복합센서를 이용하여 실험을 해보았다. 본 발명의 측정 방법에 따른 복합 센서는 반도체 저항 센서(GSS)가 1.5만원, 온도 및 습도 센서가 1.2만원*2으로 구성할 수 있다.
실험 조건은 실내에서 에탄올(ethanol)을 3m 앞에 두고 자연 확산을 통해서 퍼지게 한 후 이를 각각 광 이온화 측정기(PID)와 본 발명의 복합 센서를 이용하여 동시에 측정하도록 하였다. 복합 센서는 매초 마다 에탄올, 온도 및 습도를 측정하도록 하였고, 10초 구간의 데이터를 이용하여 다중 회귀 분석 및 불확실성 분석을 수행하였다. 다중 회귀 분석에서는 τ의 값으로 0.09를 사용하였고, 불확실성분석에서는 5%의 이상치(outlier)를 제거하여 샘플링 하였으며, 누적합 분석에서는 결정 구간으로 3σ를 적용하였다.
광 이온화 측정기(PID)는 제조 업체에서 8ppb를 임계치로 제공하는데 도 9에서 볼 수 있듯이, 53초에 8ppb가 측정되어 임계치를 초과하지 않아 가스가 누출된 것으로 판단하지는 않았다. 광 이온화 측정기(PID)는 262초가 지나서야 10ppb를 측정하여 가스가 검출된 것으로 판단하였다.
이에 비에 본 발명의 복합 센서는 48초에 결정 구간 3σ(민감)를 기준으로 1차적으로 이상을 판단하였으며, 121초에는 결정 구간 6σ(강건)를 기준으로 2차적으로 이상을 판단하였다. 본 발명의 복합 센서가 저가의 센서임에도 불구하고 광 이온화 측정기(PID)보다 최소 동급 내지 최대 5.5배(48초/262초) 빠른 탐지 성능을 보인 것을 확인할 수 있다.
도 9의 실험예에서 볼 수 있는 것처럼 누적합 분석의 결정 구간 H의 값은 σ를 이용하여 다양하게 설정할 수 있다. 도 9의 실험예에서 1차적으로 이상을 판단한 때는 3σ를 기준으로 한 값이며, 2차적으로 이상을 판단한 때는 6σ를 기준으로 한 값이다. 결정 구간 H의 값을 작게 설정할수록 누적합 분석에 의해 3차 이상으로 판단하는 경우가 많아지므로 민감하게 반응하게 된다.
이처럼 본 발명의 일 실시예에 따른 데이터 측정 방법은 저가형 센서만을 이용하여 빠르고 정확하게 미세한 값도 측정이 가능하다. 이를 위해서 측정하고자 하는 대상을 주 센서로 측정하고, 이에 영향을 미칠 수 있는 외부 요인들을 보조 센서로 측정하여 1) 다중 회귀 분석, 2) 불확실성 분석, 3) 누적합 분석을 통해 최종적으로 이상을 감지하고 미세 측정 범위의 변화까지도 감지가 가능하다.
이와 같은 데이터 측정 방법은 대부분의 범용 센서에 적용이 가능하며, 원격으로 데이터만 수신하여 분석하는 서버/클라이언트 구조로도 구현이 가능하다. 또한 데이터를 전송하지 않고서, 임베디드 컴퓨팅(embedded computing)이 가능한 아두이노(Arduino)나 라즈베리 파이(Raspberry Pi), 아틱(Artik, 삼성전자의 IoT 플랫폼)과 같은 마이크로 컨트롤러를 이용하여 구현할 수 있다.
도 10 및 도 11a 내지 도 11c는 본 발명의 일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 방법의 순서도이다.
도 10을 참고하면 본 발명의 데이터 측정 방법은 총 3단계에 걸쳐서 통계적 분석 기법을 적용한다. 첫번째는 도 6에서 살펴본 다중 회귀 분석으로 이를 통해서 1차 이상을 판단한다(S1000).
다중 회귀 분석에서는 측정하고자 하는 대상은 주 센서로, 주 센서의 측정 과정에 영향을 미치는 외부 환경 요인은 보조 센서를 이용하여 측정하고, 일정 구간의 시계열 데이터를 분석하여, 정상 상태일 때를 기준으로 측정값을 예측하는 과정을 수행한다.
예측값과 측정값이 차이가 나는 경우에는 1차 이상으로 판단하고, 1차 이상인 경우에 한하여 2번째 통계적 분석 기법인 불확실성 분석을 수행한다(S2000).
불확실성 분석은 보조 센서의 오차를 감안한 것으로, 다중 회귀 분석이 정상 상태일 때의 값을 예측하는 과정이라면, 불확실성 분석은 정상 상태일 때의 값의 범위, 즉 정상 상태 영역(=신뢰 구간)을 예측하는 과정이다.
이를 위해서 다중 회귀 분석에서 사용한 시계열 데이터를 이용하여 보조 센서가 측정한 값들의 평균과 분산을 구하고 그로부터 보조 센서가 측정한 값의 확률 밀도 함수를 구한다.
보조 센서가 측정한 값의 확률 밀도 함수를 이용하여 데이터를 샘플링 하고, 이를 다중 회귀 분석에서 구한 관계식에 대입하면 측정하고자 하는 대상의 정상 상태일 때를 기준으로 한 분포를 얻을 수 있다. 여기서 이상치(outlier)를 제거하면 정상 상태 영역을 얻을 수 있다. 만약 실제로 측정한 값이 정상 상태 영역을 벗어나는 경우에는 2차 이상으로 판단한다.
2차 이상으로 판단된 경우에 한하여 3번째 통계적 분석 기법인 누적합 분석을 수행한다(S3000). 누적합 분석은 측정된 데이터가 지속적으로 증가하는지 또는 지속적으로 감소하는지 확인하는 통계적 기법이다. 누적합 분석을 통해 최종적으로 이상 여부를 판단하고, 이상인 경우 정상 상태일 때의 값을 제외한 실제 측정값을 연산하여 제공한다.
각각의 단계를 도 11a 내지 도 11c에서 보다 자세히 살펴보면, 도 11a는 첫번째 통계적 분석 기법인 다중 회귀 분석의 순서도이고, 도 11b는 두번째 통계적 기법인 불확실성 분석의 순서도이며, 도 11c는 세번째 통계적 기법인 누적합 분석의 순서도이다.
도 11a를 참고하면, 우선 주 센싱 데이터와 보조 센싱 데이터를 각각 주 센서와 보조 센서로부터 수신한다(S1100). 주 센싱 데이터와 보조 센싱 데이터를 동일한 시계열 구간에 대해서 취합하여 그 사이의 상관 관계를 다중 회귀 분석을 통해서 연산한다(S1200).
그 후 특정 시점의 주 센싱 데이터의 예측값과 실제 측정값이 임계치 이상으로 차이가 나는 경우(S1300) 1차 이상으로 판단한다(S1400). 만약 임계치 이상으로 차이가 나지 않는 경우에는 정상 상태로 보고, 상기 특정 시점 이후의 측정 데이터에 대해 모니터링을 지속한다.
도 11b를 참고하면, 보조 센싱 데이터의 평균과 분산을 통해 보조 센싱 데이터의 확률 분포 함수를 연산한다(S2100). 확률 분포 함수에서 보조 센싱 데이터를 임의로(random) 샘플링하고(S2200), 이를 다중 회귀 분석에서 구한 관계식에 대입하여 주 센싱 데이터의 분포를 파악한다.
주 센싱 데이터의 분포를 통해 주 센싱 데이터의 신뢰 구간을 연산하고(S2300), 실제로 측정된 값이 신뢰 구간을 벗어난 경우에는(S2400), 2차 이상으로 판단한다(S2500). 만약 신뢰 구간을 벗어나지 않은 경우에는 보조 센서의 오차로 인한 것으로 보고 정상 상태로 판단한다.
도 11c를 참고하면, 주 센싱 데이터의 누적합을 연산한다(S3100). 이 때 +편차를 반영한 상향 누적합과 -편차를 반영한 하향 누적합을 별도로 연산하고(S3200), 결정 구간 H와 이를 비교하여 결정 구간을 벗어나는지 확인한다(S3300).
만약 결정 구간을 벗어나는 경우에는 3차 이상으로 판단하고(S3400), 아니라면 일시적인 오류로 측정값이 튄 것이라 보고 무시한다. 만약 3차 이상으로 판단되면, 측정값에서 정상 상태일 때의 값을 제거하여 실제로 측정하고자 하는 주 센싱 데이터의 값을 연산하여 제공할 수 있다.
도 11a 내지 도 11c의 각 단계들은 도 6 내지 도 8에서 살펴본 각 단계에 대응된다. 이 중에서 경우에 따라서는 누적합 분석은 생략한 채 다중 회귀 분석과 불확실성 분석만으로 이상 여부를 판단할 수 있다. 즉 3가지 통계적 분석 기법 중에서 누적합 분석은 반드시 필수적인 단계는 아니며, 측정의 정확도를 높이기 위한 선택적인 단계이다.
도 12는 본 발명의일 실시예에 따른 통계적 분석 기법에 기반한 데이터 측정 장치의 하드웨어 구성도이다.
도 12를 참고하면 통계적 분석 기법에 기반한 데이터 측정 장치(10)는 하나 이상의 프로세서(510), 메모리(520), 스토리지(560) 및 인터페이스(570)을 포함할 수 있다. 프로세서(510), 메모리(520), 스토리지(560) 및 인터페이스(570)는 시스템 버스(550)를 통하여 데이터를 송수신한다.
프로세서(510)는 메모리(520)에 로드 된 컴퓨터 프로그램을 실행하고, 메모리(520)는 상기 컴퓨터 프로그램을 스토리지(560)에서 로드(load) 한다. 상기 컴퓨터 프로그램은, 회귀 분석 오퍼레이션(521), 불확정성 분석 오퍼레이션(523) 및 누적합 분석 오퍼레이션(535)을 포함할 수 있다.
회귀 분석 오퍼레이션(521)은 인터페이스(570)를 통해 주 센서(110)와 보조 센서(113, 115)로부터 센싱 데이터를 수신하여 각각 스토리지(560)의 주 센싱 데이터(561)과 보조 센싱 데이터(563)으로 저장한다. 저장된 센싱 데이터(561, 563)를 일정한 시계열 구간으로 추출하여 다중 회귀 분석을 통해 상관 관계를 분석할 수 있다.
다중 회귀 분석을 통해 보조 센싱 데이터(563)로 인한 주 센싱 데이터(561)의 변화를 예측하고 이를 예측 모델로 하여, 스토리지(560)의 상관 관계(565)로 저장할 수 있다. 이 때의 예측 모델은 주 센싱 대상의 변화가 없음에도 불구하고 보조 센싱 대상의 변화로 인해 주 센싱 데이터(561)가 변화하는 정도를 나타낸 것이다. 즉, 주 센싱 대상의 정상 상태일 때를 기준으로 한 보조 센싱 대상 사이의 관계를 의미한다.
불확정성 분석 오퍼레이션(523)는 보조 센서(113, 115)의 오류를 감안하여 주 센싱 대상의 예측 모델을 확장하기 위한 것으로, 회귀 분석 오퍼레이션(521)에서 사용한 보조 센싱 데이터(563)의 시계열 구간에 대해 평균과 분산을 구한 후, 이를 이용하여 보조 센싱 대상의 확률 밀도 함수를 연산한다.
그 후 보조 센싱 대상의 확률 밀도 함수를 통해 임의의 보조 센싱 데이터를 샘플링하고, 이를 상관 관계(565)에 대입하여 주 센싱 데이터(561)의 분포를 예측한다. 이 값은 주 센싱 대상의 예측 모델을 확장하여, 보조 센서의 오차를 감안한 주 센싱 대상의 정상 상태 영역을 구하는 과정이다.
이 때의 주 센싱 대상의 정상 상태 영역은 시스템 버스(550)를 통해 스토리지(560)의 신뢰 구간(567)으로 저장된다. 이 때 회귀 분석 오퍼레이션(521)과 불확정성 분석 오퍼레이션(523)은 매 측정 주기마다 상관 관계(565)와 신뢰 구간(567)을 갱신해 나갈 수 있다.
누적합 분석 오퍼레이션(525)는 주 센싱 대상의 측정값의 경향을 파악하기 위한 것으로 측정된 값에 대해 상향 누적합과 하향 누적합을 연산한 후, 결정 구간과 비교하여 실제로 이상이 발생하였는지 여부를 최종적으로 판단한다. 또한 최종적으로 이상으로 판단된 경우 실제 측정값에서 정상 상태일 때의 값을 제거하여 실제 변동값을 연산한다.
도 12의 각 구성 요소는 소프트웨어(Software) 또는, FPGA(Field Programmable Gate Array)나 ASIC(Application-Specific Integrated Circuit)과 같은 하드웨어(Hardware)를 의미할 수 있다. 그렇지만, 상기 구성 요소들은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, 어드레싱(Addressing)할 수 있는 저장 매체에 있도록 구성될 수도 있고, 하나 또는 그 이상의 프로세서들을 실행시키도록 구성될 수도 있다. 상기 구성 요소들 안에서 제공되는 기능은 더 세분화된 구성 요소에 의하여 구현될 수 있으며, 복수의 구성 요소들을 합하여 특정한 기능을 수행하는 하나의 구성 요소로 구현될 수도 있다.
이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.

Claims (12)

  1. 데이터 측정 장치가, 주 센서로부터 주 센싱 데이터를 제공 받는 단계;
    상기 데이터 측정 장치가, 상기 주 센싱 데이터에 영향을 미치는 외부 요인으로서 상기 주 센싱 데이터와는 별개의 데이터인 보조 센싱 데이터를 상기 보조 센싱 데이터를 측정한 보조 센서로부터 제공 받는 단계;
    상기 데이터 측정 장치가, 제1 시계열 구간의 상기 보조 센싱 데이터의 상기 제1 시계열 구간의 상기 주 센싱 데이터에 대한 영향도를 분석하여, 상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계;
    상기 데이터 측정 장치가, 상기 보조 센싱 데이터의 확률 분포를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 구하는 단계; 및
    상기 데이터 측정 장치가, 상기 예측값과 상기 신뢰 구간을 이용하여, 상기 외부 요인으로 인한 영향이 제거된 상기 주 센싱 데이터의 실제값(Noise Cancelling Value)을 구하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
  2. 제1항에 있어서,
    상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계는,
    상기 주 센싱 데이터와 상기 보조 센싱 데이터를 이용하여, 회귀 분석(Regression Analysis)을 수행하고, 상기 회귀 분석의 결과를 이용하여 상기 예측값을 구하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
  3. 제2항에 있어서,
    상기 회귀 분석의 결과를 이용하여 상기 예측값을 구하는 단계는,
    상기 주 센싱 데이터와 상기 보조 센싱 데이터의 동일한 시계열 구간(i-n 부터 i 까지, n개)을 분석 구간으로 선정하는 단계;
    상기 보조 센싱 데이터의 변동으로 인한 영향도를 분석하기 위해 상기 주 센싱 데이터의 회귀 모델을 생성하는 단계; 및
    상기 회귀 모델을 이용하여 상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
  4. 제3항에 있어서,
    상기 회귀 모델을 이용하여 상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계는,
    상기 분석 구간 다음의 시계열 구간(i+1)의 보조 센싱 데이터의 측정값을 상기 회귀 모델에 대입하는 단계;
    상기 대입의 결과로 얻은 주 센싱 데이터의 예측값과 상기 분석 구간 다음의 시계열 구간(i+1)의 주 센싱 데이터의 측정값을 비교하는 단계; 및
    상기 측정값에서 상기 예측값을 뺀 값으로 구한 SSE(오차 제곱합)가 기 설정된 임계치 τ보다 큰 경우, 1차 이상으로 판단하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
  5. 제3항에 있어서,
    상기 회귀 모델을 이용하여 상기 주 센싱 데이터가 정상 상태일 때의 예측값을 구하는 단계는,
    상기 분석 구간 다음의 시계열 구간(i-n+1 부터 i+1 까지, n개)을 분석 구간으로 재선정하는 단계; 및
    상기 재선정된 분석 구간(i-n+1 부터 i+1 까지)에 대해 상기 회귀 모델과 상기 예측값을 갱신하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
  6. 제1항에 있어서,
    상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 구하는 단계는,
    상기 보조 센싱 데이터의 확률 분포를 이용하여, 불확실성 분석(Uncertainty Analysis)를 수행하고, 상기 불확실성 분석의 결과를 이용하여 상기 신뢰 구간을 구하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
  7. 제6항에 있어서,
    상기 불확실성 분석의 결과를 이용하여 상기 신뢰 구간을 구하는 단계는,
    상기 보조 센싱 데이터의 특정 시계열 구간(i-n 부터 i 까지, n개)을 분석 구간을 선정하는 단계;
    상기 분석 구간동안 측정된 상기 보조 센싱 데이터의 평균과 분산을 연산하는 단계;
    상기 평균과 분산을 가우시안 함수(Gaussian PDF; Gaussian Probability Density Function)에 대입하여, 상기 보조 센싱 데이터의 정규 분포 함수를 구하는 단계;
    상기 보조 센싱 데이터의 정규 분포 함수에서 가상의 보조 센싱 데이터를 샘플링(sampling) 하는 단계; 및
    상기 가상의 보조 센싱 데이터를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 연산하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
  8. 제7항에 있어서,
    상기 가상의 보조 센싱 데이터를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 연산하는 단계는,
    상기 가상의 보조 센싱 데이터의 이상치(outlier)를 제거하는 단계;
    상기 주 센싱 데이터의 회귀 모델에 상기 가상의 보조 센싱 데이터를 대입하는 단계;
    상기 대입의 결과로 얻은 가상의 주 센싱 데이터의 예측값의 분포에서 최대값과 최소값 사이의 범위를 상기 신뢰 구간으로 결정하는 단계; 및
    주 센싱 데이터의 측정값이 상기 신뢰 구간을 벗어나는 경우, 2차 이상으로 판단하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
  9. 제7항에 있어서,
    상기 가상의 보조 센싱 데이터를 이용하여, 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간을 연산하는 단계는,
    상기 분석 구간 다음의 시계열 구간(i-n+1 부터 i+1 까지, n개)을 분석 구간을 재선정하는 단계; 및
    상기 재선정된 분석 구간(i-n+1 부터 i+1 까지)에 대해 상기 평균과 분산, 상기 정규 분포 함수 및 상기 신뢰 구간을 갱신하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
  10. 제1항에 있어서,
    상기 주 센싱 데이터의 측정값의 누적합(CUSUM)을 구하는 단계;
    상기 주 센싱 데이터의 측정값이 연속 증가하거나 연속 하강하는 경우, 3차 이상으로 판단하는 단계; 및
    3차 이상으로 판단된 경우에 한하여 상기 주 센싱 데이터의 실제값(Noise Cancelling Value)을 연산하는 단계를 더 포함하는,
    통계 분석 기반 데이터 측정 방법.
  11. 제10항에 있어서,
    상기 주 센싱 데이터의 측정값의 누적합을 구하는 단계는,
    상기 주 센싱 데이터의 상향 누적합과 하향 누적합을 연산하는 단계를 포함하고,
    상기 주 센싱 데이터의 측정값이 연속 증가하거나 연속 하강하는 경우에 3차 이상으로 판단하는 단계는,
    상기 상향 누적합이 결정 구간 H보다 크거나, 상기 하향 누적합이 결정 구간 -H보다 작은 경우, 3차 이상으로 판단하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
  12. 제1항에 있어서,
    상기 주 센싱 데이터의 실제값(Noise Cancelling Value)을 연산하는 단계는,
    상기 주 센싱 데이터의 측정값에서 상기 주 센싱 데이터가 정상 상태일 때의 신뢰 구간의 최대값을 뺀 값을 상기 실제값으로 연산하는 단계를 포함하는,
    통계 분석 기반 데이터 측정 방법.
KR1020160096057A 2016-07-28 2016-07-28 통계 분석 기반 데이터 측정 방법 및 장치 KR102502952B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160096057A KR102502952B1 (ko) 2016-07-28 2016-07-28 통계 분석 기반 데이터 측정 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160096057A KR102502952B1 (ko) 2016-07-28 2016-07-28 통계 분석 기반 데이터 측정 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20180013010A KR20180013010A (ko) 2018-02-07
KR102502952B1 true KR102502952B1 (ko) 2023-02-22

Family

ID=61203835

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160096057A KR102502952B1 (ko) 2016-07-28 2016-07-28 통계 분석 기반 데이터 측정 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102502952B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6471818B1 (ja) * 2018-02-27 2019-02-20 オムロン株式会社 メタデータ生成装置、メタデータ生成方法及びプログラム
KR102065435B1 (ko) * 2019-08-14 2020-01-13 주식회사 심플비트 사회기반시설물 건전성 모니터링 시스템 및 방법
KR20240029604A (ko) * 2022-08-25 2024-03-06 (주)우원엠앤이 빅데이터 및 ai를 활용한 냉난방 시스템 최적설계 시스템 및 그 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259223A (ja) * 1999-03-12 2000-09-22 Toshiba Corp プラント監視装置
JP2012014222A (ja) * 2010-06-29 2012-01-19 Mitsubishi Electric Corp センサ状態判定装置
KR101271876B1 (ko) * 2004-03-23 2013-06-10 더 리젠트스 오브 더 유니이버시티 오브 캘리포니아 네트워크를 통하여 수집된 센서 데이터의 신뢰도를개선하기 위한 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259223A (ja) * 1999-03-12 2000-09-22 Toshiba Corp プラント監視装置
KR101271876B1 (ko) * 2004-03-23 2013-06-10 더 리젠트스 오브 더 유니이버시티 오브 캘리포니아 네트워크를 통하여 수집된 센서 데이터의 신뢰도를개선하기 위한 장치 및 방법
JP2012014222A (ja) * 2010-06-29 2012-01-19 Mitsubishi Electric Corp センサ状態判定装置

Also Published As

Publication number Publication date
KR20180013010A (ko) 2018-02-07

Similar Documents

Publication Publication Date Title
AU2015292882B2 (en) Weighing scale diagnostics method
KR102502952B1 (ko) 통계 분석 기반 데이터 측정 방법 및 장치
US10466221B2 (en) Systems and methods for predicting gas concentration values
US10002514B2 (en) Machine tool having function of monitoring sealing of control panel
JP2002509324A (ja) センサおよびプロセスの超高感度監視
EP2508881B1 (en) Testing a humidity sensor
US20160018373A1 (en) Systems and methods for monitoring and controlled capture of air samples for analysis
KR102408426B1 (ko) 설비 노화 지수를 이용한 이상 감지 방법 및 장치
US20150233873A1 (en) System for monitoring operating status of chromatograph
US11860059B2 (en) Smart seals for monitoring and analysis of seal properties useful in semiconductor valves
KR20180030989A (ko) 가스 검출 장치 및 방법
CN114730184A (zh) 用于估算逃逸性排放上的变化的计算机系统及方法
WO2015019067A1 (en) Gas sensor measurements
KR20180048702A (ko) 가스 분석 시스템 및 가스 분석 방법
JP2015045942A (ja) 品質管理装置、品質管理方法、及びプログラム
KR101754165B1 (ko) 비주기 가속도 데이터를 병합한 구조물 이상거동 검출 및 안전성 평가 시스템
KR20170048843A (ko) 센서 데이터를 이용한 이상 감지 장치 및 방법
CN113624929B (zh) 一种气体传感器全量程自动标定方法
KR102092856B1 (ko) 기계 모니터링 장치
KR102533572B1 (ko) 수분 혼입 검출 장치, 수분 혼입 검출 프로그램, 수분 혼입 검출 방법, 및 수분 혼입 검출 시스템
Claro et al. Locating poor models in MPC applications
Magaji et al. Assessing the effects of autocorrelation on the performance of statistical process control charts
KR20200103341A (ko) 기계 설비의 유지 보수 평가 방법
Valente et al. Framework for the Validation of Mechanistic and Hybrid Models as Process Analytical Tools in the Pharmaceutical Industry
Du et al. A novel critical point detection method for mechanical deformation in tightening processes

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant