KR100965756B1 - 하수처리장 공정 운영 상태 진단을 위한 방법 및 장치 - Google Patents

하수처리장 공정 운영 상태 진단을 위한 방법 및 장치 Download PDF

Info

Publication number
KR100965756B1
KR100965756B1 KR1020080004365A KR20080004365A KR100965756B1 KR 100965756 B1 KR100965756 B1 KR 100965756B1 KR 1020080004365 A KR1020080004365 A KR 1020080004365A KR 20080004365 A KR20080004365 A KR 20080004365A KR 100965756 B1 KR100965756 B1 KR 100965756B1
Authority
KR
South Korea
Prior art keywords
data
treatment plant
sewage treatment
analysis
data set
Prior art date
Application number
KR1020080004365A
Other languages
English (en)
Other versions
KR20090078502A (ko
Inventor
김창원
김예진
김종락
문태섭
Original Assignee
부산대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 부산대학교 산학협력단 filed Critical 부산대학교 산학협력단
Priority to KR1020080004365A priority Critical patent/KR100965756B1/ko
Publication of KR20090078502A publication Critical patent/KR20090078502A/ko
Application granted granted Critical
Publication of KR100965756B1 publication Critical patent/KR100965756B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Abstract

본 발명은 하수처리장의 공정 운영 상태를 손쉽고 객관적으로 진단하기 위한 객관적인 도구를 개발하는 것으로, 다변량 통계분석인 PCA, K-means 군집 분석, Fisher의 선형 판별 분석 등의 기법들의 적용을 통해 하수처리장의 과거 데이터 셋들에 내재되어 있는 공정 운영 상태에 대한 정보가 효과적으로 추출될 수 있도록 하고, 그 결과 개발된 Operational map은 도출된 판별함수식들과 함께 공정 운영 상태와 유출수질을 평가하기 위한 하나의 도구로써 활용될 수 있도록 하는 하수처리장 공정 운영 상태 진단을 위한 방법 및 장치에 관한 것이다.
하수처리장, 주성분 분석, K-means 군집 분석, 판별 분석, 오퍼레이셔널 맵

Description

하수처리장 공정 운영 상태 진단을 위한 방법 및 장치{APPARATUS AND METHOD FOR DIAGNOSIS OF OPERATING STATES IN MUNICIPAL WASTEWATER TREATMENT PLANT}
본 발명은 운전자에 의해 주관적으로 평가 운영되고 있는 하수처리장의 공정 운영 상태를 객관적으로 평가하기 위한 오퍼레이셔널 맵의 개발과 판별함수의 도출을 위한 하수처리장 공정 운영 상태 진단을 위한 방법 및 장치에 관한 것이다.
하수처리장의 처리 성능과 운영을 최적화하기 위한 ICA(Instrumentation, Control and Automation) 기술에 대한 연구가 지난 40년간 지속적으로 수행되어 왔고, 이는 ICA 기술의 상당한 발전을 초래했다.
이러한 향상된 ICA 기술은 하수처리공정에 대한 단순 PID제어뿐만 아니라 모델 기반 제어들을 가능하게 하였다.
이와 더불어 하수처리장의 안정적 운전을 위한 다양한 제어 전략들이 제안되었고, 이들 중 일부 제어전략들은 실제 하수처리장에 적용되어 하수처리장의 안정적 운전에 기여하고 있다.
덴마크에 설치 운영되고 있는 SMAC(Smart control of wastewater system; Kr?ger, 2004)은 하나의 좋은 예가 될 수 있다.
그러나, 이러한 ICA 기술의 발전에도 불구하고 하수처리장의 공정 성능과 상태를 진단하는 작업은 각 하수처리장에서의 최종의사결정을 수행하기 위한 운전자의 경험적인 지식과 추론과정을 자동화하는 기술이 부재하기 때문에, 여전히 운전자의 고유한 작업 영역으로 남아 있고, 이는 ICA 기술 적용의 주요한 걸림돌(bottleneck)이 되고 있다.
하수처리장의 주요 처리 공정인 생물 반응조는 오염물질(Pollutant)들의 제거와 관련된 내부 메커니즘의 불확실성이 높고 비선형적이라는 특성을 가지며, 처리장에 따라 각각 다른 특성을 가지고 있다. 이러한 점이 처리장마다 운전자에게 고유한 운전적 경험을 축적시키며, 하수처리공정의 상태 진단을 위한 운전자의 역할의 중요성을 증대시킨다. 실제 대부분의 하수처리장에서는 운전자들은 하수처리공정의 운영 상태를 진단하기 위해 매일 대상 처리장으로부터 얻어지는 수많은 변수들의 값을 관찰하고 그들의 경험에 기반한 귀납적 추론(Heuristic reasoning)을 수행함으로써 얻어지는 다양한 정보들의 통합 및 분석을 수행하고 있다.
이러한 인간 운전자에 기반한 하수처리장의 공정 운영 상태의 진단은, 어떠한 결론을 얻기까지 다소 시간이 많이 걸리며, 운전자의 경험에 따라 가변적이며 주관적이라는 단점을 가지고 있다. 그러므로 숙련된 운전자의 이직이나 퇴직으로 인해 숙련된 운전자의 하수처리장에서의 부재 시, 공정 진단 결과의 신뢰성은 낮아질 수밖에 없다.
본 발명은 이러한 운전자에 의한 하수처리공정의 진단의 한계를 극복하여 공정 운영 상태를 정확하고 객관적으로 평가할 수 있는 오퍼레이셔널 맵과 판별함수의 개발을 위한 하수처리장 공정 운영 상태 진단을 위한 방법을 제공하고자 한다.
또한 본 발명은 오퍼레이셔널 맵(Operational map)과 판별함수를 개발하기 위해, 데이터마이닝 기법 중 하나인 주성분 분석(PCA:Principal Component Analysis), 군집 분석(Cluster analysis)과 판별함수와 같은 다변량 통계분석(Multivariate statistical analysis) 기법을 적용하는 하수처리장 공정 운영 상태 진단을 위한 방법을 제공하고자 한다.
상기 과제를 해결하기 위한 본 발명은 하수처리장 공정 운영 상태 진단 장치에 있어서, 하수처리장 공정 운영 상태에 필요한 유입/유출 수질 및 공정 운영 데이터들을 입력받는 데이터수집부(10)와; 상기 데이터수집부(10)로부터 입력된 데이터셋들을 전달받아 이들에 대해 분석기법들을 적용하여 하수처리장의 과거 데이터 셋들에 내재되어 있는 공정 운영 상태에 대한 정보가 효과적으로 추출될 수 있도록 데이터 셋들을 변형하고 그룹화시키는 데이터처리부(20)와; 상기 데이터처리부(20)로부터 그룹화하여 분류된 하수처리장의 공정 운영 상태를 통해 오퍼레이셔널 맵과 판별함수를 도출하는 진단부(30)와; 상기 진단부(30)로부터 도출된 오퍼레이셔널 맵과 판별함수를 화면에 출력하여 가시화하는 표시부로 구성되는 것을 특징으로 하는 하수처리장 공정 운영 상태 진단을 위한 장치에 의해 달성된다.
또한 본 발명은, 상기 데이터처리부(20)는 입력된 데이터셋들을 통해 주성분 분석, K-means 군집 분석, Fisher의 선형 판별 분석 중 어느 하나 이상의 기법들을 적용하여 하수처리장의 공정 운영 상태를 5개 그룹으로 분류하는 것이 바람직하다
또한 본 발명에 따르면, 상기 데이터수집부(10)의 일측은 데이터베이스(11)가 구축되어 있어, 과거 측정된 데이터셋들을 저장해 두고 있으며, 이들 데이터 셋은 오퍼레이셔널 맵과 판별함수의 도출 혹은 상기 도출된 오퍼레이션 맵과 함수의 활용성 평가 중 어느 하나에 사용되는 것이 바람직하다
또한 본 발명에 따르면, 상기 데이터수집부(10)에 입력되는 데이터셋은 유입농도와 유입 부하, 슬러지 침전 지표, 공정 운전 조건 및 유출농도 중 어느 하나 이상의 변수들로 구성되는 것이 바람직하다
또한 본 발명에 따르면, 하수처리장 공정 운영 상태 진단 방법에 있어서, 하수처리장으로부터 유입 농도와 유입 부하, 슬러지 침전 지표, 공정 운전 조건 및 유출 농도 데이터 중 어느 하나 이상의 데이터들을 입력하는 수집 단계와; 상기 수집된 데이터 셋을 구성하는 변수들 간에 존재하는 높은 상관성을 제거하도록 주성분 분석에 의해 데이터셋 중 주성분들만을 도출하는 데이터 셋의 차원 축소 단계와; 상기 주성분들을 유입 데이터 셋으로 하여, K-means 군집 분석에 의한 공정 상태의 특성에 따라 데이터 셋의 그룹 분류를 수행하는 군집 분석에 의한 공정 상태별 그룹화 단계와; 상기 주성분 값들을 주성분으로 구성된 2차원 좌표에 표기함으 로써 오퍼레이셔널 맵이 제작되는 오퍼레이셔널 맵의 작성 단계와; 판별 분석에 의한 공정 상태 분류를 행하도록 판별 함수의 도출 단계와; 상기 오퍼레이셔널 맵과 판별함수의 공정 운영 상태를 진단하는 실용성 평가의 단계로 구성되는 것이 바람직하다
또한 본 발명에 따르면, 상기 군집 분석에 의한 공정 상태별 그룹화 단계는 복수개의 초기 군집수를 지정하여 군집 분석을 수행하고, 각 주성분들의 그룹별 평균 값의 크기 순서와 각 주성분들을 대변하는 주요 변수들의 평균값의 크기 순서를 비교하여 일치되는 경우 적절한 군집수로 결정하는 것이 바람직하다
또한 본 발명에 따르면, 상기 판별 분석은 K-means 군집 분석에 의해 분류된 그룹을 외적 기준으로 두고, Fisher의 선형 판별 분석을 통해 분류된 각 그룹에 대한 함수식인 판별 함수식을 도출하는 것이 바람직하다
또한 본 발명에 따르면, 상기 도출된 판별 함수식은, 새로운 데이터 셋이 주어졌을 때 상기 데이터 셋을 각 그룹의 판별함수식을 통해 계산된 값의 크기를 비교하여, 상기 데이터 셋이 가장 큰 값을 나타내는 그룹에 해당하는 것이 바람직하다
또한 본 발명에 따르면, 상기 판별 함수에 의해 분류된 그룹의 정확성을 평가하도록 교차 타당성 기법을 이용하는 것이 바람직하다.
따라서 본 발명의 하수처리장 공정 운영 상태 진단을 위한 방법에 의해 2차원의 주성분 좌표들에 도출된 각 주성분들의 값을 Scatter plot을 함으로써 공정 운영 상태를 좌표 상에 놓이는 위치에 따라 가시적으로 손쉽게 평가 가능한 오퍼레이셔널 맵이 제작되고, 이로 인해 공정 운영상태가 빠르고 손쉽게 규명될 수 있었으며, 또한 시간에 따른 공정 운영 상태의 변화 추이가 상기 오퍼레이셔널 맵에 의해 평가될 수 있다.
본 발명에서 개발된 Operational map과 판별함수가 공정 운영 상태를 진단하기 위해 현장에서 활용된다면, 공정 운전 상태를 진단하는 데 있어 소요되는 시간을 절약 할 수 있을 뿐만 아니라 공정 운영 및 관리에 대한 오랜 경험과 많은 지식을 가지고 있지 않은 비전문 인력에 의해서도 이들 개발된 결과물들을 활용하여 공정 운영 상태가 객관적으로 손쉽게 이루어질 수 있다.
이하 본 발명의 하수처리장 공정 운영 상태 진단을 위한 방법 및 장치에 대해 첨부되는 도면을 통해 보다 상세히 설명하도록 한다.
도 1은 본 발명의 하수처리장 공정 운영 상태 진단을 위한 장치의 블록 구성도이며 이를 통해 입력 데이터값에 대한 분석결과가 도출된다.
이를 위해 본 발명은 도면에서 보는 바와 같이 데이터수집부(10), 데이터처리부(20), 진단부(30), 표시부(40)로 구성된다.
상기 데이터수집부(10)는 하수처리장 공정 운영 상태에 필요한 데이터를 입력받는 모듈로써, 도시하수를 처리하기 위한 대표적인 생물학적 처리 공정인 표준 활성슬러지 공정으로 운전되고 있는 하수처리장의 유입/유출 수질 및 공정 운영 데이터들을 수집하게 된다.
따라서 상기 데이터수집부(10)의 일측에 구축되어 있는 데이터베이스(11)는 과거에 측정된 데이터셋들을 저장해 두고 있으며, 이들 데이터 셋은 Operational map과 판별함수의 도출을 위해 사용되거나, 이를 통해 도출된 오퍼레이션 맵과 함수의 활용성을 평가하기 위해 사용된다.
여기서 상기 데이터수집부(10)로부터 수집되는 데이터셋은 유입농도와 유입 부하, 슬러지 침전 지표, 공정 운전 조건 및 유출농도와 관련된 19개의 변수들로 구성된다.
상기 데이터처리부(20)는 상기 데이터수집부(10)로부터 수집된 데이터셋들을 전달받아 이들에 대한 다양한 분석기법을 적용하여 오퍼레이셔널 맵과 판별함수를 도출한다.
이때, 상기 데이터처리부(20)에서 행해지는 모든 분석은 상용 다변량 통계 분석 소프트웨어인 SPSS(ver. 13.0)를 사용하게 되므로, 상기 소프트웨어가 데이터처리부(20)에 셋업되어 있다.
상기 데이터수집부(10)로부터 데이터 셋을 입력받은 데이터처리부(20)는 대표적인 데이터마이닝 기법 중 하나인 다변량 통계분석 즉 PCA, K-means 군집 분석, Fisher의 선형 판별 분석 등의 기법들의 적용을 통해 하수처리장의 과거 데이터 셋들에 내재되어 있는 공정 운영 상태에 대한 정보가 효과적으로 추출될 수 있도록 데이터 셋들을 변형하고 그룹화시키게 되며, 그 결과 대상 하수처리장의 공정 운영 상태는 그 특성에 따라 5개 그룹으로 분류된다.
상기 진단부(30)는 상기 데이터처리부(20)로부터 그룹화하여 분류된 하수처리장의 공정 운영 상태를 통해 오퍼레이셔널 맵과 판별함수를 도출하게 된다.
상기 표시부(40)는 성가 추출된 공정 상태에 대한 정보들을 Operational map이라는 형태로 출력시켜 가시화하도록 하는 화면이다.
도 2는 본 발명의 하수처리장 공정 운영 상태 진단을 위한 방법의 순서도를 도시한 것이다.
도 2에서 보는 바와 같이, 본 발명은 실제 하수처리장으로부터의 데이터 수집, PCA에 의한 데이터 셋의 차원 축소, 군집 분석에 의한 공정 상태별 그룹화 및 Operational map의 개발, 판별 분석에 의한 공정 상태 분류를 위한 판별 함수의 도출, 개발에 사용되지 않은 새로운 데이터 셋을 이용한 개발된 Operational map과 판별함수의 공정 운영 상태의 진단을 위한 실용성의 평가의 단계로 수행된다.
우선, 실제 하수처리장으로부터의 데이터를 데이터수집부(10)에 입력하는 데이터 수집단계(S10)를 수행하게 된다.
이를 위해 도시하수를 처리하기 위해 대표적 생물학적 처리 공정인 표준 활성슬러지 공정으로 운전되고 있는 실제 하수처리장(B시 A하수처리장, 설계 용량: 65000m3/d)으로부터 2005년 1월부터 2006년 8월까지의 유입/유출 수질 및 공정 운영 데이터들이 수집되었다.
이 중, 2005년 365개의 데이터 셋은 Operational map과 판별함수의 도출을 위해 사용되었고, 2006년 243개의 데이터 셋은 이들의 활용성을 평가하기 위해 사용되었다.
상기 데이터 수집단계(S10)를 수행하여 데이터수집부(10)에서 데이터셋을 입력받게 되면, 데이터처리부(20)는 상기 데이터셋을 전달받아 주성분 분석에 의한 데이터 처리단계(S20)를 수행하게 된다.
일반적으로 하수처리장으로부터 확보되는 데이터 셋은 고차원이고 이 데이터 셋을 구성하는 변수들 간에는 높은 상관성(Correlation)이 존재한다.
이러한 고차원 데이터의 변수들 간의 높은 상관성은 데이터 셋으로부터 효율적인 지식을 추출하는 데 있어 방해 요인이 될 수 있다.
주성분분석은 원래의 데이터 셋을 구성하는 변수들의 선형 결합을 통해 고차원의 데이터 셋을 저차원의 데이터 셋으로 변형함으로써 데이터 셋을 구성하는 변수들 간에 존재하는 높은 상관성을 제거하는 데 있어 유용한 기법이라고 할 수 있다.
본 발명에서는 <표 1> 과 같이 유입 농도와 유입 부하, 슬러지 침전 지표, 공정 운전 조건 및 유출 농도와 관련된 19개의 변수들로 구성된 원래의 데이터 셋의 차원을 축소하기 위해 주성분 분석이 수행되었고, 이를 통해 상호 관련되지 않으면서 원래 데이터 셋에 내재되어 있는 공정 특성들의 대부분을 설명 가능한 새로운 변수들의 셋인 주성분들(PCs)이 도출되었다.
이 때 주성분들의 수는 고유 값(eigen value) 1을 기준으로 하여 결정되었다. 또한, 주성분 계수(Principal component coefficient)에 기반해서 각 주성분들에 크게 영향을 미치는 주요 변수들이 규명되었고 이는 이 후 개발된 군집 분석을 통해 그룹화 된 공정 특성들을 해석하는 데 있어 활용되었다.
<표 1> 주성분 분석을 위한 변수들
Figure 112008003268135-pat00001
주성분 분석을 통해 고유 값이 1이상인 성분을 선택한 결과, 4개의 주성분(PC1,PC2,PC3,PC4)이 선택되었다. 19차원의 변수들이 각 변수들의 선형 결합을 통해 4차원으로 축소됨으로써, 원래 변수들이 가지는 변량의 77.2% 정도를 설명 가능하였다
<표 2> 선택된 4개의 주성분들
Figure 112008003268135-pat00002
<표 3>은 주성분 분석을 통해 도출된 주성분 계수를 보여준다.
Figure 112008003268135-pat00003
식 2에 의해 주성분들의 값의 크기가 결정된다는 것을 고려하였을 때(예: PC1= 0.008BODi + 0.078CODi + 0.136SSi + ....-0.078SSe - 0.025TNe - 0.059TPe), 도출된 4개의 주성분들 중 PC1은 유입 부하 관련 변수들에 의해 크게 영향을 받고, PC2는 유출농도와 관련된 변수들, PC3은 슬러지 침전성과 관련된 변수들(SVI, SV30) 과 운전 변수 중 슬러지 반송율, PC4는 호기조 DO 농도에 의해 크게 영향(음의 영향)을 받는다는 것을 알 수 있었다.
그러므로, PC1의 값이 크다는 것은 유입 부하가 높다는 의미가 될 수 있을 것이고, 다른 주성분들의 값도 이와 같은 의미로 해석될 수 있을 것이다.
상기 주성분 분석을 행하게 되면, 주성분 분석을 통해 선택된 주성분들을 유입 데이터 셋으로 하여, K-means 군집 분석에 의한 공정 상태의 특성에 따른 데이터 셋의 그룹 분류가 수행되는 궁정 상태별 그룹화 단계(S30)를 수행하게 된다.
상기 K-means 군집 분석은 데이터 셋을 구성하는 관측치를 K-independent 군집으로 분류하고, 각각의 관측치들이 어떤 군집(Cluster)에 해당되는지 결정해주는 방법론이다.
본 발명에서는 euclidian distance가 distance parameter로 사용되었다.
상기 K-means 군집 분석의 경우 적절한 군집수를 결정하는 것이 쉬운 일이 아니고 일반적으로 운전자의 경험에 의존하여 결정된다.
본 발명에서는, 우선 다양한 초기 군집수를 지정하여 군집 분석이 수행되었고, 각 주성분들의 그룹별 평균 값의 크기 순서와 각 주성분들을 대변하는 주요 변수들의 평균값의 크기 순서를 비교하여 잘 일치되는 경우 적절한 군집수로 결정하였다.
예를 들어, PC1(제1 주성분)의 값의 그룹별 평균 값 크기 순서가 그룹 1 > 그룹 2 > 그룹 3 > 그룹 4의 순서를 나타낸다고 하였을 때, PC1을 대변하는 주요 변 수들(BOD 유입 부하, COD 유입 부하 등)의 평균 값의 크기가 그룹 1> 그룹 2> 그룹 3> 그룹 4의 크기 순서를 보일 때 적절한 군집 수라고 결정되었다.
그리고, 주성분 값들을 주성분으로 구성된 2차원 좌표(예: X축 - PC1, Y축 - PC2)에 scatter-plot을 함으로써 오퍼레이셔널 맵이 제작되었다.
K-means 군집 분석 기법을 적용하여 그룹 분류를 수행한 결과, 공정 운영 상태는 그 특성에 따라 5개 그룹으로 분류될 수 있었다.
각 그룹의 공정 특성에 대한 정보는 아래의 <표 4>와 같이 추출되었다.
<표 4>
Figure 112008003268135-pat00004
이를 통해 알 수 있듯이 높은 유출 수질 즉 불량한 공정 성능(Poor performance)을 나타내는 그룹에 대한 정보는 다음과 같이 제공될 수 있었다.
그룹 1 - 호기성 탱크 내의 높은 유입수 부하, 중간 침강, 슬러지 반송 비율 그리고 고농도 용존산소량을 가지는 고농도 유출수.
그룹 5 - 호기성 탱크 내의 중간 유입수 부하, 높은 침강, 슬러지 반송 비율 그리고 저농도 용존산소량을 가지는 고농도 유출수.
도 4는 주성분 값들을 2차원 주성분 좌표에 scatter-plot한 결과를 보여준다. 도면을 통해 알 수 있듯이, 주성분들 값이 scatter-plot된 좌표에서 각 그룹별로 고유한 영역을 가진다는 것이 확인 되었다.
이는 공정 운영 상태에 대한 추출된 정보들이 이러한 2차원 좌표에 가시화 되어 나타내어졌다는 것을 의미하고, 각 주성분들의 값들이 scatter-plot된 2차원 좌표가 새로운 데이터 셋이 주어졌을 때 단지 계산된 PCs값이 위치하는 영역에 대한 정성적 평가만으로 공정 운영 상태를 평가 가능한 하나의 Operational map이 될 수 있다는 것을 의미한다.
상기 오퍼레이셔널 맵이 작성되면, 공정상태 분류를 위한 판별 함수 도출단계(S50)를 수행하게 된다.
상기 판별 분석은 일반적으로, 사전에 외적 기준을 주어 그룹 간 차이를 가장 잘 구분짓는 설명변수 조합을 찾아냄으로써 소속 그룹이 알려지지 않은 개체의 그룹을 알아내기 위해 일반적으로 많이 사용되는 방법이다.
본 발명에서는, K-means clustering에 의해 분류된 그룹을 외적 기준으로 두고, Fisher의 선형 판별 분석을 통해 분류된 각 그룹에 대한 함수식 즉, 판별 함수식을 도출하였다.
도출된 판별 함수식은 새로운 데이터 셋이 주어졌을 때, 각 그룹의 판별함수식을 통해 계산된 값의 크기 비교를 통해 가장 큰 값을 나타내는 그룹에 해당한다는 결론을 도출하게 함으로써, 기존의 분류된 그룹 중 어느 그룹에 속하는지에 대 한 평가를 가능하게 한다. 그리고, 판별 함수에 의한 그룹 분류의 정확성의 평가를 위해 교차 타당성(Cross-validation) 기법이 이용되었다.
교차 타당성 기법은 일반적으로 다음과 같은 방법에 의해 수행된다; 총 관측치들의 수가 N개라고 할 때, I번째(I=1,2, ..., N) 관측치를 제외한 N-1개의 관측치가 분류 규칙 즉 판별함수를 도출하기 위한 분석 표본으로 사용되고, I번째 관측치가 평가 표본(validation sample)으로 사용된다. I번째 관측치에 N-1개의 관측치들을 사용하여 도출된 분류 규칙을 적용하여, I번째 관측치가 속하는 그룹이 결정되고, 이러한 절차가 첫 번째 관측치에서부터 N 번째 관측치에 이르기까지(즉, I=1에서부터 N까지) 순차적으로 반복 적용된다. 그 뒤, 도출된 분류 규칙에 의한 그룹 분류의 정확도는 이들 규칙에 의해 분류된 그룹과 외적 기준에 의해 주어진 실제 그룹을 비교함으로써 평가된다.
이에 새로운 데이터 셋이 주어졌을 때 이 데이터 셋이 군집 분석을 통해 분류된 그룹들 중 어디에 소속되는지를 결정해 주는 정량적 기준이 되는 각 그룹별 판별 함수식이 Fisher의 선형 판별 분석에 의해 아래와 같이 도출되었다.
Group1 = 1.938PC1+4.678PC2-0.252PC3-1.199PC4-7.426
Group2 = -0.265PC1-1.018PC2-1.768PC3+0.563PC4-2.311
Group3 = -1.672PC1-2.113PC2+0.029PC3-1.793PC4-2.991
Group4 = 2.477PC1-0.712PC2+1.508PC3+0.62PC4-4.115
Group5 = -0.443PC1+4.267PC2+2.232PC3+3.128PC4-7.662
<표 5>는 교차 타당성 기법의 적용을 통한 판별함수에 의한 그룹 분류의 정확성에 대한 평가 결과를 보여준다.
<표 5>
Figure 112008003268135-pat00005
이를 통해 도출된 판별 함수식에 의한 그룹 분류의 정확도는 전체적으로 약 95% 정도임을 알 수 있었다. 이는 도출된 판별함수식들이 소속되는 그룹을 결정하기 위해 적절하게 사용될 수 있음을 의미한다.
상기 판별함수를 도출하게 되면 상기 오퍼레이셔널 맵과 판별함수의 효용성 평가하기 위한 공정운영 상태의 진단단계(S60)를 수행하게 된다.
도 3에서와 같이 상기 진단부(30)에서는 개발된 Operational map과 판별함수의 공정 운영 상태 진단을 위한 활용성에 대한 평가를 이들의 개발에 사용되지 않은 새로운 데이터 셋을 이용하여 수행한다.
도 5는 이들의 공정 운영 상태 진단을 위한 실질적 적용의 절차를 보여준다.
새로운 데이터 셋이 주어졌을 때, 새로운 데이터 셋을 구성하는 각 변수들은 식 1에 의해 표준화(Normalization)되었고, 식 2에 의해 각 주성분들(PCs)의 값이 계산되었다.
Figure 112008003268135-pat00006
(1)
Figure 112008003268135-pat00007
(2)
여기서,
Figure 112008003268135-pat00008
은 새로운 데이터 셋을 구성하는 변수들의 표준화된 값이고,
Figure 112008003268135-pat00009
는 새로운 데이터 셋을 구성하는 각 변수들의 값,
Figure 112008003268135-pat00010
Figure 112008003268135-pat00011
는 operational map과 판별함수를 개발하기 위해 사용된 각 변수들의 평균과 표준편차, 는 주성분 분석에 의해 도출된 각 변수들의 주성분 계수(표 3 참조), i는 새로운 데이터 셋들을 구성하는 각 변수들이다(즉, i는 F/MBOD, F/McOD, ...., TNeff).
마지막으로, 개발된 Operational map에 계산된 주성분들 값을 plot하여 이 값이 놓이는 Map 상에 놓이는 위치를 보고 정성적으로 평가하여 기존의 분류된 그룹 중 어느 그룹에 속하는지에 대한 평가가 이루어졌고, Fisher의 선형 판별 분석에 의해 도출된 판별함수식에 계산된 PCs의 값을 대입함으로써, 정량적 기준에 의해 기존의 분류된 그룹 중 어느 그룹에 속하는지에 대한 평가가 이루어질 수 있었다.
도 5와 표 6은 2006년 4월 3일부터 4월 23일까지 21일 간의 표준화된 새로운 데이터 셋을 사용하여 평가된 결과를 보여준다.
<표 6>
Figure 112008003268135-pat00012
그 결과, 공정 운영 상태는 개발된 Operational map에 계산된 주성분들의 값을 단지 plot 함으로써 가시적으로 규명될 수 있고, 또한 이들 계산된 주성분들의 값들을 도출된 판별함수식에 대입함으로써 정량적으로 쉽게 규명될 수 있었다.
그리고, 개발된 operational map은 시간에 따른 공정 상태의 변화 추이에 대 한 정보를 가시적으로 제공가능하다는 것이 확인되었다. 도 5에 나타난 그 기간 동안, 공정 운영 상태가 처음에는 높은 유출 수질을 나타내다가 시간이 지남에 따라 낮은 유출 수질을 나타내는 그룹으로 이동되고 있다는 것을 간단히 알 수 있다.
도 1은 본 발명의 하수처리장 공정 운영 상태 진단을 위한 장치의 전체 구성도,
도 2는 본 발명의 하수처리장 공정 운영 상태 진단을 위한 방법의 전체 순서도,
도 3~ 도 5는 본 발명에 의해 작성된 오퍼레이셔널 맵.
*도면 부호의 상세한 설명*
10 : 데이터 수집부 11 : 데이터베이스
20 : 데이터 처리부 30 : 진단부
40 : 표시부

Claims (9)

  1. 하수처리장 공정 운영 상태 진단 장치에 있어서,
    하수처리장의 공정 운영 상태에 필요한 유입/유출 수질 및 공정 운영 데이터들을 수집하되 수집된 데이터셋은 유입농도와 유입 부하, 슬러지 침전 지표, 공정 운전 조건 및 유출농도 중 어느 하나 이상의 변수들로 구성되며, 과거 측정된 데이터셋들이 저장된 데이터베이스가 구축되는 데이터수집부(10)와;
    상기 데이터수집부(10)로부터 수집된 데이터셋들을 입력받고, 입력된 데이터셋들을 통해 주성분 분석, K-means 군집 분석, Fisher의 선형 판별 분석 중 어느 하나 이상의 분석기법들을 적용하여 하수처리장의 과거 데이터 셋들에 내재되어 있는 공정 운영 상태에 대한 정보가 추출될 수 있도록 데이터셋들을 변형하고 그룹화시키는 데이터처리부(20)와;
    상기 데이터처리부(20)로부터 그룹화하여 분류된 하수처리장의 공정 운영 상태를 통해 오퍼레이셔널 맵과 판별함수를 도출하는 진단부(30)와;
    상기 진단부(30)로부터 도출된 오퍼레이셔널 맵과 판별함수를 화면에 출력하여 가시화하는 표시부로 구성되는 것을 특징으로 하는 하수처리장 공정 운영 상태 진단을 위한 장치.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 하수처리장 공정 운영 상태 진단 방법에 있어서,
    하수처리장으로부터 유입 농도와 유입 부하, 슬러지 침전 지표, 공정 운전 조건 및 유출 농도 데이터 중 어느 하나 이상의 데이터들을 데이터수집부로 입력하는 수집 단계와;
    데이터처리부에서 상기 데이터수집부로부터 수집된 데이터 셋을 구성하는 변수들 간에 존재하는 높은 상관성을 제거하도록 주성분 분석에 의해 데이터셋 중 주성분들만을 도출하는 데이터 셋의 차원 축소 단계와;
    상기 데이터처리부에서 상기 주성분들을 유입 데이터 셋으로 하여, K-means 군집 분석에 의한 공정 상태의 특성에 따라 데이터 셋의 그룹 분류를 수행하는 군집 분석에 의한 공정 상태별 그룹화 단계와;
    상기 주성분 값들을 주성분으로 구성된 2차원 좌표에 표기함으로써 오퍼레이셔널 맵이 제작되는 오퍼레이셔널 맵의 작성 단계와;
    판별 분석에 의한 공정 상태 분류를 행하도록 판별 함수의 도출 단계와;
    진단부에서 상기 오퍼레이셔널 맵과 판별함수의 공정 운영 상태를 진단하는 실용성 평가의 단계로 구성되는 것을 특징으로 하는 하수처리장 공정 운영 상태 진단을 위한 방법.
  6. 제 5항에 있어서,
    상기 군집 분석에 의한 공정 상태별 그룹화 단계는 복수개의 초기 군집수를 지정하여 군집 분석을 수행하고, 각 주성분들의 그룹별 평균 값의 크기 순서와 각 주성분들을 대변하는 주요 변수들의 평균값의 크기 순서를 비교하여 일치되는 경우 적절한 군집수로 결정하는 것을 특징으로 하는 하수처리장 공정 운영 상태 진단을 위한 방법.
  7. 제 5항에 있어서,
    상기 판별 분석은 K-means 군집 분석에 의해 분류된 그룹을 외적 기준으로 두고, Fisher의 선형 판별 분석을 통해 분류된 각 그룹에 대한 함수식인 판별 함수식을 도출하는 것을 특징으로 하는 하수처리장 공정 운영 상태 진단을 위한 방법.
  8. 제 7항에 있어서,
    상기 도출된 판별 함수식은, 새로운 데이터 셋이 주어졌을 때 상기 데이터 셋을 각 그룹의 판별함수식을 통해 계산된 값의 크기를 비교하여, 상기 데이터 셋이 가장 큰 값을 나타내는 그룹에 해당하는 것을 특징으로 하는 하수처리장 공정 운영 상태 진단을 위한 방법.
  9. 제 8항에 있어서,
    상기 판별 함수에 의해 분류된 그룹의 정확성을 평가하도록 교차 타당성 기법을 이용하는 것을 특징으로 하는 하수처리장 공정 운영 상태 진단을 위한 방법.
KR1020080004365A 2008-01-15 2008-01-15 하수처리장 공정 운영 상태 진단을 위한 방법 및 장치 KR100965756B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080004365A KR100965756B1 (ko) 2008-01-15 2008-01-15 하수처리장 공정 운영 상태 진단을 위한 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080004365A KR100965756B1 (ko) 2008-01-15 2008-01-15 하수처리장 공정 운영 상태 진단을 위한 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20090078502A KR20090078502A (ko) 2009-07-20
KR100965756B1 true KR100965756B1 (ko) 2010-06-24

Family

ID=41336598

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080004365A KR100965756B1 (ko) 2008-01-15 2008-01-15 하수처리장 공정 운영 상태 진단을 위한 방법 및 장치

Country Status (1)

Country Link
KR (1) KR100965756B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101237444B1 (ko) 2010-06-29 2013-02-26 부산대학교 산학협력단 하폐수 처리장의 공정진단 시스템 및 방법
WO2015147353A1 (ko) * 2014-03-27 2015-10-01 부산대학교 산학협력단 환경영향평가를 이용한 다수의 하수처리시설에 대한 슬러지 통합관리 시스템 및 그 방법
WO2015147351A1 (ko) * 2014-03-26 2015-10-01 부산대학교 산학협력단 하수처리장의 혐기성 소화조의 운영상태의 진단 및 소화가스의 발생량의 예측시스템 및 그 방법

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013125737A1 (ko) * 2012-02-20 2013-08-29 부산대학교 산학협력단 하수처리장 공정상태 진단에 따른 규칙기반 제어장치 및 방법
KR101432436B1 (ko) * 2013-03-27 2014-08-21 부산대학교 산학협력단 최근린기법을 이용한 하수처리장의 유입유량과 유입성분농도의 예측 장치 및 방법
KR20140117966A (ko) * 2013-03-27 2014-10-08 부산대학교 산학협력단 하수처리장 에너지소비상태 진단에 따른 에너지 절감 예측시스템 및 방법
KR20140117959A (ko) * 2013-03-27 2014-10-08 부산대학교 산학협력단 하수처리장 유출수질의 상태에 대한 원인인자 제공장치 및 방법
CN112305184B (zh) * 2020-10-12 2023-10-13 桂林理工大学 一种污水处理多故障诊断系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
논문:대한상하수도학회
논문:한국물환경학회

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101237444B1 (ko) 2010-06-29 2013-02-26 부산대학교 산학협력단 하폐수 처리장의 공정진단 시스템 및 방법
WO2015147351A1 (ko) * 2014-03-26 2015-10-01 부산대학교 산학협력단 하수처리장의 혐기성 소화조의 운영상태의 진단 및 소화가스의 발생량의 예측시스템 및 그 방법
WO2015147353A1 (ko) * 2014-03-27 2015-10-01 부산대학교 산학협력단 환경영향평가를 이용한 다수의 하수처리시설에 대한 슬러지 통합관리 시스템 및 그 방법

Also Published As

Publication number Publication date
KR20090078502A (ko) 2009-07-20

Similar Documents

Publication Publication Date Title
KR100965756B1 (ko) 하수처리장 공정 운영 상태 진단을 위한 방법 및 장치
Props et al. Measuring the biodiversity of microbial communities by flow cytometry
CA3049807A1 (en) Intelligent systems and methods for process and asset health diagnosis, anomoly detection and control in wastewater treatment plants or drinking water plants
CN109711674A (zh) 一种用于湖库水体污染溯源的指纹图谱库构建方法及装置
KR101237444B1 (ko) 하폐수 처리장의 공정진단 시스템 및 방법
Villas-Boas et al. Assessment of the water quality monitoring network of the Piabanha River experimental watersheds in Rio de Janeiro, Brazil, using autoassociative neural networks
Ginoris et al. Recognition of protozoa and metazoa using image analysis tools, discriminant analysis, neural networks and decision trees
CN110672144B (zh) 污染源检测方法和装置
Boyacioglu et al. Application of factor analysis in the assessment of surface water quality in Buyuk Menderes River Basin
Everaert et al. An applicability index for reliable and applicable decision trees in water quality modelling
KR20140117959A (ko) 하수처리장 유출수질의 상태에 대한 원인인자 제공장치 및 방법
Upton et al. Rapid gravity filtration operational performance assessment and diagnosis for preventative maintenance from on-line data
Sadler et al. Computational surveillance of microbial water quality with online flow cytometry
CN113658640B (zh) 一种淡水生态系统健康评价方法
Shi et al. Core and conditionally rare taxa as indicators of agricultural drainage ditch and stream health and function
Moon et al. Identification of process operating state with operational map in municipal wastewater treatment plant
Saintilan et al. Principles for the monitoring and evaluation of wetland extent, condition and function in Australia
Liukkonen et al. A software platform for process monitoring: Applications to water treatment
Díez et al. Different levels of macroalgal sampling resolution for pollution assessment
CN113702609A (zh) 一种水质检测方法及系统
Huang et al. A feature extraction method based on the entropy-minimal description length principle and GBDT for common surface water pollution identification
Steele et al. Assessment of FlowCam technology as a potential tool for rapid semi-automatic analysis of lacustrine Arcellinida (testate lobose amoebae)
CN113421643B (zh) 一种ai模型可靠性判断方法、装置、设备及存储介质
CN113990407B (zh) 对多氯萘及其同系物的含量及来源进行解析的解析方法
CN114702155A (zh) 一种村镇微污染饮用水水源生物生态修复装置系统

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130604

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee