KR20230039090A - 머신러닝 모델을 이용한 하폐수처리공정 안정성 평가 방법 및 시스템 - Google Patents

머신러닝 모델을 이용한 하폐수처리공정 안정성 평가 방법 및 시스템 Download PDF

Info

Publication number
KR20230039090A
KR20230039090A KR1020210121984A KR20210121984A KR20230039090A KR 20230039090 A KR20230039090 A KR 20230039090A KR 1020210121984 A KR1020210121984 A KR 1020210121984A KR 20210121984 A KR20210121984 A KR 20210121984A KR 20230039090 A KR20230039090 A KR 20230039090A
Authority
KR
South Korea
Prior art keywords
wastewater treatment
treatment process
machine learning
learning model
candidatus
Prior art date
Application number
KR1020210121984A
Other languages
English (en)
Inventor
배효관
전준범
박수인
에스더 에이다 옥페테우첸나
송민수
박지혜
Original Assignee
부산대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 부산대학교 산학협력단 filed Critical 부산대학교 산학협력단
Priority to KR1020210121984A priority Critical patent/KR20230039090A/ko
Publication of KR20230039090A publication Critical patent/KR20230039090A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • CCHEMISTRY; METALLURGY
    • C02TREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
    • C02FTREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
    • C02F3/00Biological treatment of water, waste water, or sewage
    • C02F3/006Regulation methods for biological treatment
    • CCHEMISTRY; METALLURGY
    • C02TREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
    • C02FTREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
    • C02F3/00Biological treatment of water, waste water, or sewage
    • C02F3/34Biological treatment of water, waste water, or sewage characterised by the microorganisms used
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W10/00Technologies for wastewater treatment
    • Y02W10/10Biological treatment of water, waste water, or sewage

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Software Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Environmental & Geological Engineering (AREA)
  • Hydrology & Water Resources (AREA)
  • Biophysics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Water Supply & Treatment (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)

Abstract

본 발명은 머신러닝 모델을 이용한 하폐수처리공정 평가 시스템, 방법 또는 상기 평가 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체에 관한 것이다. 본 발명의 미생물 반응조를 이용하는 하폐수처리공정의 안정성 또는 효율성 평가 시스템, 방법 및 이를 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체를 이용하면, 하폐수처리 공정의 상태를 즉각적으로 분석 및 파악할 수 있으며, 그에 따라 하폐수처리를 실시간으로 효율적으로 운영할 수 있는 효과가 있다.

Description

머신러닝 모델을 이용한 하폐수처리공정 안정성 평가 방법 및 시스템{Method and System for Determination of Stability of Wastewater Treatment Process Using Machine Learning Model}
본 발명은 머신러닝 모델을 이용한 하폐수처리공정 안정성 평가에 관한 것이다.
지속되는 산업화와 도시화로 환경오염은 날로 심각해지고 있으며, 배출되는 하수, 폐수, 오수(이하 '하폐수')의 형상 또한 매우 다양해지고 있으며, 이의 처리를 위한 시설 역시 고도화되고 처리비용도 증가되고 있는 실정이다.
또한, 완전히 처리되지 않은 하폐수 중의 수질오염물질이 하천, 호수, 늪, 습원을 비롯한 기타 상수원에 유입됨에 따라 효율적인 수질관리에 많은 문제점을 발생시키고 있다.
현재 하폐수의 정화처리기술로는 여과설비, 약품응집, 침전, 산화처리 등의 물리화학적인 방법과, 활성슬러지가 저류된 생물반응조 내에서 미생물의 대사과정을 극대화하여 각종 오염물질을 제거하는 생물학적 처리방법이 있는데, 상기 생물학적 처리방법은 비용대비 처리효율측면에서 물리화학적 방법보다 유리하여 중소규모 뿐만 아니라 대규모의 하폐수를 처리하는 주처리공정으로 국내외 대부분의 하폐수처리공정에 이용되고 있다. 최근 하폐수처리시설은 수학적 모델을 하수처리장에 도입하고 있다. Xiong 등 (2020)은 실규모 카니발 공정에 혐기소화와 활성슬러지 공정의 결합에 기반한 수학적 모델을 적용해 각 반응조의 미생물 농도와 유출수의 농도를 분석하고 해당 공정에서 잉여 슬러지 생산량이 낮아지는 이유에 대해 설명했다. 또한, Phillips 등 (2020)은 소규모 하폐수처리시설에 대해 각 반응조의 체류시간 분포를 파악하기 위해 수학적 모델을 사용했다. 이 외에도, 생활 하폐수처리시설을 모델링하는데 쓰이는 Biowin(Envirosim), 수계를 모사하기 위해 쓰이는 Aquasim(Eawag) 등 하폐수처리공정에 관련한 동역학적 미생물 활성(Microbial Kinetics)을 설명할 수 있는 여러 수학적 모델이 하폐수처리시설에 사용되고 있다.
그러나, 상술한 바와 같은 수학적 모델이 개발되어 있음에도 불구하고, 종래의 하폐수처리시설은 운영자의 경험에 의해 운전되어 왔기 때문에, 적절한 시설 점검 시기를 파악하기 어려웠고, 시설 점검 및 보수가 제 때 이루어지지 않을 경우, 하폐수 처리시설의 안정성을 저해하는 요인으로 작용해 하폐수 처리비용의 증가를 야기한다. 하폐수처리시설의 최적화를 위해 사용되는 수학적 모델은 pH, 온도, 수리학적 체류시간 등의 공정인자를 따라 변동되는 각 처리단계의 동역학적 미생물 활성을 예측한다. 모델에서 정확한 출력값을 도출해 이에 기반한 하폐수처리시설의 최적화를 수행하더라도 반응조 내 미생물의 군집구조는 운영조건에 따라 불규칙적으로 변할 수 있다.
즉, 예상되지 못한 특정 미생물의 상대우점도가 높아질 경우, 잘못된 운영조건 설정으로 인해 하수처리시설 안정성의 저하를 가져오며 장기화될 시 많은 경제적 손실이 발생한다. 이는 공정인자 외에도 미생물의 군집구조와 같은 생물지표 데이터가 하수처리장의 운영 최적화를 위한 지표로 반드시 사용되어야 한다는 것을 의미한다.
한편, 머신러닝은 기계나 컴퓨터가 학습할 수 있는 알고리즘을 개발하는 기술이다. 머신러닝에 적용되는 모델은 다수 개발되어 왔다. 그 중 가장 대표적인 인공신경망 모델은 뇌 속의 뉴런과 같은 원리로 작동하며, 입력층에서 특정 입력값이 입력되면 은닉층에서 서로 다른 가중치로 입력값들의 선형합이 계산되고 출력층의 비선형 함수를 통해 최종 결과값이 나오는 구조로 이루어져 있다. 최근에는 인공신경망을 하폐수처리시설에 적용한 연구들이 이루어지고는 있으나, 적합한 모델은 거의 전무한 실정이다.
이러한 상황하에서, 본 발명자들은, 인공 신경망 기술을 기반으로 하여, 기존 공정인자뿐만 아니라 생물지표를 함께 독립변인으로 사용하여 하폐수처리 공정의 안정성을 판단할 수 있는 하폐수처리시설 효율 예측 모델을 개발하였다. 그 결과, 본 발명자들은, 유입수 질소 농도, 질소 부하 속도와 같은 기존 공정인자 모델과는 독립적으로 또는 이에 추가로 기능성 핵심 미생물 군집구조의 생물지표(유전적 정보)를 고려하여, 반응기 내 기능성 미생물 DNA의 T-RFLP 분석을 시행하고, 이의 데이터를 이용하여 인공신경망을 패턴 학습시킨 경우, 보다 높은 공정 효율의 예측이 가능함을 규명함으로써, 본 발명을 완성하였다.
따라서, 본 발명의 일 목적은 미생물 반응조의 샘플 내 미생물 DNA 정보를 인공신경망 모델에 학습시켜, 하폐수처리공정을 평가하는 방법 및 시스템을 제공하는 데 있다.
본 명세서에서 사용한 용어는 단지 설명을 목적으로 사용된 것으로, 한정하려는 의도로 해석되어서는 안된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명을 보다 상세하게 설명한다.
본 발명의 일 양태에 따르면, 본 발명은 다음 단계를 포함하는, 미생물 반응조를 이용하는 하폐수처리공정의 안정성 또는 효율성을 예측할 수 있는, 머신러닝 모델을 이용한 하폐수처리공정 평가 방법을 제공한다:
(1) 생물학적으로 하폐수가 처리되는 미생물 반응조로부터 샘플을 수집하는 단계;
(2) 상기 미생물 반응조에서 샘플링된 기준 미생물의 군집구조데이터를 산출하는 단계; 및
(3) 산출된 군집구조데이터 및 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정효율 예측 모델을 구성하는 단계.
일 실시예로서, 상기 군집구조데이터를 산출하는 단계는 다음 단계를 포함할 수 있다.
(1) 상기 샘플로부터 미생물 DNA를 추출하는 단계;
(2) 상기 추출한 DNA에 프라이머를 사용하여 PCR 증폭하는 단계;
(3) PCR 산물을 T-RFLP 분석하여, T-RF 피크 데이터를 도출하는 단계;
본 발명에 있어서, 상기 T-RFLP(Terminal Restriction Fragment Length Polymorphism)는 환경 DNA시료에서 16S rRNA(박테리아)나 18S rRNA(곰팡이) 유전자 정보를 PCR(polymerase chain reaction)로 증폭하여 확보한 후 제한 효소 소화(restriction enzyme digestion)를 통해서 해당 미생물군집의 지문정보(fingerprint)를 획득하는 방법이다. T-RFLP는 환경시료로부터 PCR을 통해 증폭된 미생물 DNA 염기서열의 차이를 빠르게 비교할 수 있으며 많은 양의 시료를 한번에 분석할 수 있는 장점이 있다(Dunbar 등, 2001). 하지만 종에 대한 정확한 정보를 알 수 없고, 종 다양성 분석 시 해상도(resolution)가 다소 떨어지는 단점이 있다.
본 발명의 바람직한 구현예에 따르면, 상기 T-RF 피크 데이터를 도출하는 단계는 샘플 내 기준 미생물의 피크 면적을 전체 피크 면적으로 나눈 상대우점도 데이터를 T-RF 데이터로서 도출한다.
또한, 본 발명의 상기 하폐수처리공정효율 예측 모델을 구성하는 단계는 산출된 군집구조데이터에 추가로 미생물 반응조의 운전 변수와 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 폐수처리공정 효율 예측 모델을 구성할 수 있다. 상기 운전 변수는 공지된 공정 관련 인자로서, 유입수 암모니아성 질소, 아질산성 질소 농도, 유입수 염도, 유입수 pH, 유출수 pH 및 질소부하속도로 이루어진 그룹에서 선택된 1 종 이상일 수 있으나, 이에 제한되지 않으며, 본 발명의 목적을 달성할 수 있는 한, 임의의 공정 인자를 이용할 수 있다.
머신러닝 모델을 생성함에 있어서 변수(features, 또는 variables, attributes)가 사용되는데, 많은 수의 변수 또는 부적절한 변수들이 사용되면 머신러닝 모델이 과적합(Overfitting)되거나 예측 정확도가 감소하는 문제가 발생한다. 이에, 머신러닝 모델이 높은 예측 정확도를 갖기 위해서는 적절한 변수들의 조합을 사용할 필요가 있다. 즉, 예측하고자 하는 반응변수와 가장 연관성이 높은 변수들을 선택하여 가능한 한 적은 수의 변수를 사용하면서 머신러닝 모델의 복잡도(complexity)를 낮출 수 있다.
바람직하게는, 상기 기준 미생물은 혐기성 암모늄-산화(ANAMMOX, Anaerobic Ammonium Oxidation) 균주(bacteria)이며, 아나목스 균주는 혐기성 암모늄 산화를 할 수 있는 미생물로써, 질소를 이용하여 대사할 수 있다. 본 발명의 아나목스 균주는 질소화합물을 질소 기체로 최종 환원시킬 수 있다면 특별히 제한되는 것은 아니나, 상기 아나목스 균주는 칸디다투스 쿠에네니아(Candidatus Kuenenia), 칸디다투스 브로카디아(Candidatus Brocadia), 칸디다투스 아나목소글로버스(Candidatus Anammoxoglobus), 칸디다투스 제테니아(Candidatus Jettenia), 칸디다투스 스칼린두아(Candidatus Scalindua) 및 플랑크토마이세테스(Planctomycetes)로 이루어진 그룹에서 선택된 1 종 이상일 수 있다.
본 발명에 있어서 '프라이머'는 적절한 완충용액 중의 적절한 조건(예를 들면, 4개의 다른 뉴클레오시드 트리포스페이트 및 DNA, RNA 폴리머라제 또는 역전사 효소와 같은 중합제) 및 적당한 온도 하에서 주형-지시 DNA 합성의 시작점으로서 작용할 수 있는 단일가닥 올리고뉴클레오티드를 말한다. 상기 프라이머의 적절한 길이는 사용 목적에 따라 달라질 수 있으나, 통상 15 내지 30 뉴클레오티드이며, 바람직하게는 15 내지 25 뉴클레오티드이나, 이에 제한되는 것은 아니다.
본 발명의 일 구현예에 따르면, 상기 PCR 증폭 단계의 프라이머는 아나목스 균주의 16s rRNA 유전자를 타겟팅하여 결합하며, 바람직하게는, 상기 프라이머는 서열번호 1의 염기서열로 구성된 프라이머 내지 서열번호 18의 염기서열로 구성된 프라이머로 이루어진 그룹에서 선택된 1 종 이상일 수 있다.
또한, 상기 PCR 증폭 단계의 프라이머는 각 서열번호 1 내지 18 중 어느 하나의 염기 서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상의 서열 상동성을 가지는 염기 서열일 수 있다.
일 실시예로서, 상기 하폐수처리공정효율 예측 모델은, 하폐수의 총질소제거효율을 예측할 수 있다. 그리고 일 실시예로서 본 발명의 방법은, 예측된 총질소제거효율이 기결정된 값 이하이면 0 또는 실패를 출력하고 기결정된 값 이상이면 1 또는 성공을 출력하는 하폐수처리공정 안정성 평가 단계를 더 포함할 수 있다.
본 발명의 방법은 미생물 반응조로부터 획득한 샘플 내 종래 공정인자의 분석 결과에 기초하여 또는 이와 독립적으로, 미생물 관련 변수로서 샘플 내 미생물 DNA 정보를 고려함으로써, 하폐수처리공정의 안정성 유무 또는 효율성 유무를 평가하는 머신러닝 모델의 성능을 향상시킨다.
또한, 본 발명의 다른 양태에 따르면, 본 발명은 상술한 하폐수처리공정 평가 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체를 제공한다.
본 발명에 따른 방법은 하드웨어, 펌웨어, 또는 소프트웨어 또는 이들의 조합으로 구현될 수 있다. 소프트웨어로 구현되는 경우 저장매체는 컴퓨터와 같은 장치에 의해 판독 가능한 형태의 저장 또는 전달하는 임의의 매체를 포함한다. 예를 들면 컴퓨터 판독 가능한 매체는 ROM(read only memory); RAM(random access memory); 자기디스크 저장 매체; 광저장 매체; 플래쉬 메모리 장치 및 기타 전기적, 광학적 또는 음향적 신호 전달 매체 등을 포함한다.
또한, 본 발명의 또 다른 양태에 따르면, 본 발명은 다음을 포함하는, 미생물 반응조를 이용하는 하폐수처리공정에 적용가능한 머신러닝 모델을 이용한 하폐수처리공정 평가 시스템을 제공한다:
생물학적으로 하폐수가 처리되는 미생물 반응조에서 샘플링된 기준 미생물의 군집구조데이터를 산출하는 군집구조데이터 산출부; 및
산출된 군집구조데이터 및 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정효율 예측 모델을 구성하는 예측 모델부.
여기서 군집구조데이터 산출부는, 미생물 반응조에서 수집된 샘플에서 추출된 DNA에 프라이머를 사용하여 PCR 증폭하고, PCR 산물을 T-RFLP 분석하여 기준 미생물의 T-RF 피크 데이터를 도출함으로써, 상기 기준 미생물의 군집구조데이터를 산출할 수 있다.
일 실시예에서, 하폐수처리공정효율 예측 모델은, 하폐수의 총질소제거효율을 예측할 수 있다. 그리고 본 발명의 일 실시예에 따른 시스템은, 예측된 총질소제거효율이 기결정된 값 이하이면 0 또는 실패를 출력하고 기결정된 값 이상이면 1 또는 성공을 출력하는 하폐수처리공정 안정성 평가부를 더 포함할 수 있다.
일 실시예에서 상기 예측 모델부는, 상기 산출된 군집구조데이터에 추가로 상기 미생물 반응조의 운전 변수 및 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정 효율 예측 모델을 구성할 수 있다.
본 발명의 시스템은 상술한 방법을 이용하므로, 이와 중복된 내용은 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
본 발명의 미생물 반응조를 이용하는 하폐수처리공정의 안정성 또는 효율성 예측이 가능한 평가 방법, 이를 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체, 및 평가 시스템을 이용하면, 하폐수처리 공정의 상태를 즉각적으로 분석 및 파악할 수 있으며, 그에 따라 하폐수처리를 실시간으로 효율적으로 운영할 수 있는 효과가 있다.
도 1(a)는 본 발명의 일 실시예에 따른 하폐수처리 공정 평가 시스템의 블록도를 보여준다.
도 1(b)는 실험실 규모의 아나목스 고정생물막 반응기를 보여준다.
도 2는 생물 반응기 운영 기간 중 질소 성분의 변화를 보여준다.
도 3은 패턴인식 모델에서의 예측율을 보여준다.
도 4는 데이터 조합에 따른 예측 정확도를 보여준다.
도 5는 본 발명의 일 실시예에 따른 하폐수처리공정 평가 방법의 순서도이다.
도 6은 도 5의 군집구조데이터 산출 단계의 순서도이다.
도 7은 본 발명의 다른 실시예에 따른 하폐수처리공정 평가 방법의 순서도이다.
이하, 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
도 1(a)는 본 발명의 일 실시예에 따른 머신러닝 모델을 이용한 하폐수처리공정 평가 시스템의 구성도이고, 도 1(b)는 본 발명이 적용될 수 있는 미생물 반응조의 일 예로서 구현한 연속식 고정생물막 반응기의 모습이다.
본 발명의 일 실시예에 따른 하폐수처리공정 평가 시스템(100)은, 군집구조데이터 산출부(110) 및 예측 모델부(120)를 포함하며, 선택적으로 안정성 평가부(130)를 추가로 포함할 수 있다. 군집구조데이터 산출부(110)는, 미생물 반응조에서 샘플링된 기준 미생물의 군집구조데이터를 산출한다. 예측 모델부(120)는 산출된 군집구조데이터 및 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정효율 예측 모델을 구성한다. 다른 실시예에서 예측 모델부(120)는, 산출된 군집구조데이터, 미생물 반응조의 운전 변수, 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정효율 예측 모델을 구성할 수도 있다.
미생물 반응조에서는, 하폐수인 반응조 유입수의 생물학적 처리를 위해 기능성 미생물(기준 미생물)이 존재하며, 기능성 미생물은 혐기성 암모늄-산화(ANAMMOX, Anaerobic Ammonium Oxidation) 균주(bacteria)일 수 있다. 그리고 하폐수처리공정효율 예측 모델은 총질소제거효율을 예측할 수 있다. 이때 안정성 평가부(130)는, 총질소제거효율이 기결정된 값 이하이면 0 또는 실패를 출력하고, 총질소제거효율이 기결정된 값 이상이면 1 또는 성공을 출력함으로써 공정의 안정성을 평가할 수 있다.
미생물 반응조에서 수집한 샘플에서 추출한 미생물 DNA에 기초하여 아나목스균의 군집구조데이터를 산출할 수 있다. 구체적으로 군집구조데이터 산출부(110)는, 추출된 DNA에 프라이머를 사용하여 PCR 증폭하고, PCR 산물을 T-RFLP 분석하여 아나목스균의 T-RF 피크 데이터를 도출함으로써, 군집구조데이터를 산출한다. 이하에서 상세하게 설명한다.
실시예 1. 머신러닝의 입력 데이터 확보
1-1. 실험실 규모의 생물 반응기 구축
본 발명자들은 머신러닝의 입력값을 확보하기 위해 도 1(b)와 같이 유리와 철제로 구성된 1.8 L부피의 연속식 고정생물막 반응기를 245 일 동안 운영하였다. 이때, 고염성 하수처리 생물반응을 모사하기 위해 반응기에 아나목스균을 접종하였다.
질소제거를 위한 아나목스의 반응식은 하기 식 1과 같다.
Figure pat00001
합성 질소폐수를 이용하여 아나목스균의 생장을 유도했으며, NaCl을 첨가해 배지의 염 농도를 1%까지 서서히 높였다. 아나목스 공정에 사용한 기본 배지의 조성은 표 1에 나타내었다.
또한, 아나목스균의 최적 생장 조건을 조성하기 위해 온도 조절기를 이용하여 반응기의 온도를 37℃로 유지하였다. 아나목스 고정생물막 반응기의 운영 조건은 표 2에 정리하였다. 머신러닝 모델의 입력값 범위를 넓게 하기 위해 기질과 염도를 높여 반응기의 효율이 저해되는 조건까지 입력값을 획득하였다. 상세하게는, 운영일 84 일부터 110 일까지 기질 농도와 염도를 높여 아나목스 미생물에게 부하를 주었으며, 이에 따라 질소제거효율이 저감되었다. 111 일부터는 아나목스 미생물의 활성 회복을 위해 질소 부하율을 낮추어 98 일 동안 저부하 조건을 유지하였다. 운영일 208 일부터는 수리학적 체류시간을 24 hr에서 8 hr까지 줄여 질소제거율 고속화를 시도하였다. 해당 실험에서 머신러닝 모델 입력값 확보를 위해 암모니아성 질소(NH4 +-N), 아질산성 질소(NO2 --N), 질산성 질소(NO3 --N), pH, 염도를 측정하였으며, 25 회의 DNA 샘플링을 통해 생물지표 데이터를 확보하였다.
이와 더불어 질소부하속도와 총질소제거효율을 하기 식 2, 3과 같이 산정하였다.
[식 2]
Figure pat00002
[식 3]
Figure pat00003
Figure pat00004
Figure pat00005
1-2. 아나목스 공정 효율 변화
본 발명자들은 아나목스 공정 효율 변화를 확인하기 위하여, 아나목스 공정의 실험 1 일에 암모니아 이온 100 mg-N/L, 아질산 이온 110 mg-N/L를 투여하고 점차 농도를 높여 84 일에 암모니아 이온 185 mg-N/L, 아질산 이온 209 mg-N/L를 투여한 후 분석하였다.
그 결과, 도 2에 나타낸 바와 같이, 염도와 질소부하속도에 따라 유출수의 잔류 질소 농도의 변동이 심했다. 초기 염도는 0.5%에서 1.34%까지 상승시켜 총질소제거효율은 100%에서 34%까지 감소하였다. 이후, 질소제거효율이 지속적으로 약화되어 101 일에 질소제거효율은 5% 이하로 감소했으며, 111 일부터 암모니아 이온 26 mg-N/L, 아질산 이온 25 mg-N/L, 염 농도 1%를 주어 질소제거효율은 76%까지 증가하였다. 최종단계인 197 일부터 245 일까지 평균 4.19 mg-N/L, 3.99 mg-N/L에서 총질소제거효율은 평균 78.3±14.1%를 나타내 안정화된 질소제거 성능을 보였다.
1-3. 머신러닝에 이용된 공정 정보 및 예측대상 정의
본 발명자들은, 하기 표 3에 나타낸 바와 같이, 반응기 운영 기간 동안 유입수 암모니아성 질소, 아질산성 질소 농도, 유입수 염도, 유입수 pH, 유출수 pH 및 질소부하속도 정보를 머신러닝을 위한 입력값으로 선정하여, 25 회에 걸쳐 DNA를 샘플링하였다. 상기 샘플링된 DNA로부터 아나목스균의 정량적/정성적 정보를 획득하였다.
본 실시예에서 목표로 하는 예측대상은 유입수 총질소농도의 합 대비 유출수 총질소농도의 합을 비교한 총질소제거효율이며, 총질소제거효율은 식 3에 따라 계산하였다. 총질소제거효율이 80% 이하면 실패로 정의하고 총질소제거효율이 80% 이상이면 성공으로 정의하여 아나목스 공정의 안정성을 판별할 수 있는 머신러닝 모델을 개발하였다. 이때, 머신러닝의 출력 데이터는 성공을 의미하는 1 또는 실패를 의미하는 0으로 출력된다.
Figure pat00006
실시예2. 말단 제한절편다형성(Terminal Restriction Fragment Length Polymorphism, T-RFLP)을 이용한 미생물 군집구조 데이터 구축
2-1. T-RFLP 수행을 위한 프라이머 제작
본 발명자들은 미생물 군집 구조 데이터를 구축하는 데 이용하기 위한 T-RFLP용 프라이머를 제작하였다.
간략하게는 다음과 같다: T-RFLP 수행을 위한 유니버셜 아나목스균용 프라이머 제작을 위해 Ribosomal Database Project Tool 및 NCBI 데이터베이스(http://www.ncbi.nlm.nih.gov/)에서 Aanmmoxoglobus, Brocadia, Kuenenia, Scalindua 및 Unclassified Brocadiaceae genus의 16S rRNA 염기서열 V3-V5 영역을 확인하였다.
확인된 염기서열을 광범위하게 증폭할 수 있도록 기존에 공지된 amx368과 809R의 프라이머를 개조하였다(표 4, 제작된 프라이머 염기서열). 본 실시예의 개조된 프라이머를 적용할 때, 아나목스 미생물의 증폭가능 여부는 표 5(프라이머 염기서열을 이용한 아나목스16S rRNA 유전체 증폭가능 여부)에 나타냈다.
Figure pat00007
Figure pat00008
2-2. PCR 증폭 및 제한효소를 이용한 유전체 절편화
본 발명자들은, 생물 반응기에서 바이오매스를 샘플링한 후, MP Biomedicals사의 FastDNA® SPIN kit를 이용해 DNA를 추출하였다. 추출된 DNA는 20℃ 조건에서 보관되었고 PCR에 사용되었다. 개조된 유니버셜 아나목스균용 정방향 프라이머 amx368m(5'-TTCGCAATGCCCGRAAGG-3'; 서열번호 1)와 역방향 프라이머 809Rm(5'-RCCGTAAACGATGGGCACT-3'; 서열번호 5)를 이용해 DNA 증폭을 위한 PCR을 실시하였다. 정방향 프라이머에는 FAM 형광물질과 역방향 프라이머에는 HEX 형광물질을 표지하여 말단 부위의 절편을 형광 Scanner로 검출 가능하도록 하였다. 검출이라 함은 DNA 절편의 크기(bp)와 형광의 강도(Intensity)이다. Thermo Fisher Scientific 사의 SimpliAmp™ Thermal Cycler제품을 사용했으며, 25 μL의 PCR pre-Mix(Solgent, Korea), 정방향 프라이머 1 μL, 역방향 프라이머 1 μL, 1 μL의 주형 DNA, 22 uL의 증류수를 사용해 총 50 uL의 PCR 혼합물을 구성했다. PCR 조건은 다음과 같다: 95℃에서 2 분의 1 사이클, 95℃에서 20 초, 57℃에서 40 초, 72℃에서 40 초의 30 사이클, 72℃에서 5 분의 1사이클(Bae 등, 2011). PCR 진행 후, 제한효소를 이용해 증폭된 유전체의 절편화를 진행하였다.
2-3. 절편화된 말단절편에 따른 종판별
본 발명자들은 효소를 이용해 증폭된 유전체의 절편화를 실시하였다. RsaI 제한효소가 사용되었으며, 해당 제한효소는 GTAC 서열의 T-A 사이를 절단한다. 이러한 반응에 의해 형성되는 말단절편(Terminal Restriction Fragment, T-RF)의 서로 다른 길이 패턴을 아래의 표 6과 같이 정리하였다.
Figure pat00009
2-4. 절편화된 말단절편의 크기와 상대우점도 분석
본 발명자들은, 미세전기영동 서비스(Solgent사)를 통해, 제한효소에 의해 절편화된 정방향(amx368m) 및 역방향(809Rm) T-RF의 크기와 상대적 우점도를 분석하였다.
그 결과, 표 6에 나타낸 바와 같이, 각 제한효소에 의해 발생하는 말단절편의 다양성을 기반으로 아나목스균의 종을 판별하였다. Peak Scanner로부터 얻은 피크 중 크기가 50 bp 이하인 데이터는 PCR 과정에서의 오류로 간주하여 삭제하고, 아나목스균의 피크 면적을 전체 피크 면적으로 나눈 상대우점도를 머신러닝을 위한 입력값을 사용하였다.
또한, Thermo Fisher의 Peak Scanner소프트웨어를 이용해 T-RF 피크 분포를 확인하고 각 피크의 상대우점도를 표 7(7-1 내지 7-5)에 나타냈다. RsaI 제한효소의 경우 Anaerobic Ammonium-Oxidizing Planctomycete KOLLA2A, Candidatus Kuenenia Stuttgartiensis, Anaerobic Ammonium-Oxidizing Planctomycete JMK-1을 제외한 대부분 종의 피크가 460 bp 부근에서 나타났다. 본 실시예에서 발생한 정방향(FAM 형광표지) 및 역방향(HEX 형광표지) T-RF를 구분하기 위하여 각각 F와 H의 기호를 사용하였고, T-RF의 크기와 조합하였다. 예를 들어, F54-58은 정방향 T-RF이며 54 bp와 58 bp 사이의 T-RF를 통합하여 같은 종류로 간주하였다. H459-462는 역방향 T-RF이며 459 bp와 462 bp 사이의 T-RF를 통합하여 같은 종류로 간주하였다.
Figure pat00010
Figure pat00011
Figure pat00012
Figure pat00013
Figure pat00014
본 실시예에서 발생한 정방향(FAM 형광표지) 및 역방향(HEX 형광표지) T-RF를 총질소제거효율 80% 이상과 80% 미만의 경우로 구분하여 R 소프트웨어 패키지 중의 하나인 Indicspecies에 입력하였다. 이를 통해, 각 반응기 총질소제거효율에 따라 특이적으로 발생하는 인덱스 T-RF를 도출하고자 하였다.
그 결과, 총질소제거효율 80% 이상을 대변할 수 있는 T-RF는 F457-462로 나타났다. 표6에 의하면 이러한 T-RF는 Candidatus Brocadia와 Scalindua를 대변하는 인자이다. 80% 미만의 총질소제거효율을 대변하는 T-RF는 F88로 나타났으며, 이는 본 실시예에서 수행한 데이터베이스(표5)에서 확인되지 않는 표지이며, 공정효율이 저하되었을 때에 미생물 생태를 교란하는 종으로 예상된다.
본 실시예에서는 Indicspecies를 시행하지 않은 표7의 데이터와 Indicspecies의 지표종인 F457-462, F88 두 T-RF의 상대우점도만을 정리한 경우 두 가지로 머신러닝을 수행하여 예측효율을 검증하였다.
실시예 3. DNA 추출 및 실시간 중합효소연쇄반응(Real-time qPCR)을 이용한 생물지표 데이터 구축
3-1. DNA 추출 및 종별 아나목스 정량
본 발명자들은 생물 반응기에서 바이오매스를 샘플링한 후, MP Biomedicals사의 FastDNA® SPIN kit를 이용해 DNA를 추출하였다. 추출된 DNA는 20℃ 조건에서 보관되었고 Cho 등 (2018)에 명시된 방법을 따라 종별 아나목스 정량화를 위한 Real-time qPCR을 진행하였다. PCR 혼합물은 Taq-Man® Fast Advanced Master Mix(Applied Biosystems, USA) 프로토콜에 따라 준비되었으며, 종별 아나목스 정량화를 위해 Jettenia, Bricadia, Kuenenia spp. 정방향 프라이머, 역방향 프라이머 및 Taq-man 프로브의 정보는 표 8에 나타내었다.
Real-time qPCR의 조건은 다음과 같다: 50℃에서 2 분의 1 사이클, 95℃에서 10 분의 1 사이클, 95℃에서 15 초, 60℃에서 1 분의 1 사이클의 50 주기.
Real-time qPCR을 통해 얻은 총미생물량 데이터는 표 9에 나타내었고, 표 9의 정보는 아나목스 공정의 안정성을 판단하고자 하는 목적의 머신러닝 입력(Input) 데이터로 사용되었다.
Figure pat00015
Figure pat00016
실시예 4. 머신러닝에 의한 반응기 안정성 예측
4-1. 입력값의 전처리
머신러닝의 입력값 입력 시, 변수간의 데이터 범위 불일치가 발생할 경우 예측 모델의 성능 저해를 야기한다. 본 발명자들은 이를 예방하기 위해 데이터 전처리가 실시하였다. 일반적으로 데이터 전처리에 최대/최소 정규화(Min-Max Normalization)이 쓰이며, 식 4를 따른다.
[식 4]
Figure pat00017
xi: 정규화된 값, x: 원래 데이터 값,
xmin: 데이터 세트 중 최소값, xman: 데이터 세트 중 최대값
통상적으로 신경망 모델에서 정규화를 사용할 시, 훈련되는 네트워크의 신뢰성을 높일 수 있는 것으로 알려져 있다. 이에, 머신러닝 모델의 입력값들에 대해, 최대/최소 정규화를 실시해 데이터의 범위를 0~1 사이의 값으로 조정하였다. 생물지표 데이터인 T-RFLP는 50 bp 이하의 크기에서 나타난 피크 면적을 삭제하고 각 T-RF의 피크면적을 전체 피크면적으로 나눈 값을 상대우점도로 정의하였다. real-time qPCR 값은 전체 합으로 나누지 않고 측정된 DNA Copy Number를 상용로그 값으로 전환 후, Min-Max 처리하여 사용하였다.
4-2. 머신러닝 모델 학습
본 발명자들은 공정인자와 생물지표를 입력값으로 사용해 머신러닝 모델에 학습시키고 예측 성능을 평가하였다. 모델의 출력값은 성공(Success) 또는 실패(Failure) 방식을 채택하였다. 상세하게는, 총질소제거효율 80%를 기준으로 각 샘플의 운영조건에서 제거효율이 80% 이상이면 1, 이하면 0을 출력하도록 하는 이진분류법을 적용하였다. 공정인자와 생물지표 데이터를 표 10과 같이 정의하고 데이터 세트에 따른 머신러닝을 진행하였다.
Figure pat00018
파이썬의 사이킷런 라이브러리(Scikit-learn Library)에 내장된 패턴인식을 훈련 모델로 선정했으며, 패턴인식은 모델의 과적합을 피하기 위해, 교차검증(Cross validation) 전략을 사용하였다. 분류 모델에 교차검증을 적용할 경우, 훈련 데이터의 출력값이 특정 값으로 편중되어 있으면 교차검증의 성능이 떨어지게 된다. 이러한 경우, 계층별 교차검증(Stratified cross validation)을 사용하면 편중된 데이터에 대해 일반화된 교차검증을 성능을 도출할 수 있다.
계층별 교차검증은 데이터 세트를 몇 개의 하위 데이터 세트로 나눈 후, 각 하위 데이터 세트에서 일정 비율을 훈련 데이터 및 검증 데이터로 선정해 교차검증을 진행해 편중된 데이터를 이용한 학습을 방지한다.
본 실시예에서 사용된 데이터는 출력값이 0에 편중되는 경향을 보이므로 계층별 교차검증 전략을 적용해 훈련 데이터와 교차 데이터를 변경해가며 예측을 진행하였다. 모델의 학습 횟수는 6,000회로 설정했으며, 파이썬 소프트웨어에 내장된 최적화 기법인 그리드서치를 적용하였다. 그리드서치는 모델 파라미터의 조합을 바꿔가며 반복적으로 머신러닝을 수행해 가장 좋은 예측 성능을 나타내는 파라미터를 도출하는 최적화 기법이다. 최적화 기법에 쓰인 모델 파라미터는 표 11과 같다.
Figure pat00019
본 발명자들은 구축된 패턴인식 모델에 대해, 표 10의 데이터 세트를 사용했을 때 나타나는 예측성능을 시각화하였다.
그 결과, 도 3에 나타낸 바와 같이, 공정인자(OP)만 사용했을 경우 76%의 예측 정확도를 보인 반면, Indicspecies를 적용한 T-RF 데이터(TRF-Indics)와 Real-time qPCR 데이터(qPCR)는 각각 80% 및 68%의 정확도를 보였다.
또한, 본 발명자들은, T-RFLP 데이터 중 가장 높은 정확도를 보인 데이터 세트(TRF-Indics)와 Real-time qPCR 데이터(qPCR) 및 공정인자(OP) 조합에 따른 모델 성능을 평가하였다.
그 결과, 도 4에 나타낸 바와 같이, 생물지표와 공정인자를 함께 사용할 시, 모델의 예측 성능은 향상되는 것으로 나타났다. TRF-Indics와 OP를 조합했을 때, 가장 높은 정확도(92%)를 보였으며, OP와 T-RF 및 qPCR을 모두 사용했을 때 88%, OP와 qPCR의 조합은 84%, 생물지표 TRF-Indics와 qPCR만을 조합한 경우 76% 순으로 나타났다. 모델에 적용된 최적화 기법으로부터 도출된 데이터 세트별 모델 파라미터는 표 12와 같다.
Figure pat00020
가장 높은 정확도를 보인 데이터 조합인 OP+TRF-Indics에 대해 각 데이터에 대한 예측값과 실제값을 비교해 표 13와 같이 나타냈다. 이 결과에 따르면 총 샘플 개수 25 개 중 정확한 예측을 보인 샘플은 23 개 이므로, 산출된 예측 정확도는 92%이다.
Figure pat00021
결론적으로, 본 발명의 인공신경망 모델은, 변수로서 종래 공정인자와 함께 반응조 내 미생물의 DNA를 샘플링하여 획득한 기능성 미생물(아나목스균)양의 데이터(T-RF 피크 데이터)를 기계학습의 입력값으로 선택하여 머신러닝 모델을 학습한 경우, 하폐수처리공정의 효율을 예측하는 머신러닝 모델의 성능을 향상시킬 수 있는 것을 확인하였고, 이는 보다 높은 하폐수처리공정의 안정성 예측(평가)이 가능함을 입증한다.
도 5는 본 발명의 일 실시예에 따른 머신러닝 모델을 이용한 하폐수처리공정 평가 방법의 순서도이다. 본 발명의 일 실시예에 따른 평가 방법은 미생물 반응조로부터 샘플을 수집하는 단계(S110), 미생물 반응조에서 샘플링된 아나목스균의 군집구조데이터를 산출하는 단계(S120), 산출된 군집구조데이터 및 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정효율 예측 모델을 구성하는 단계(S130)를 포함한다. 또한 선택적으로 본 발명에 따른 평가 방법은, 예측된 하폐수처리공정효율에 기초하여 하폐수처리공정의 안정성을 평가하는 단계(S140)를 더 포함할 수 있다.
도 6은 도 5의 아나목스균의 군집구조데이터를 산출하는 단계의 순서도이다. 군집구조데이터를 산출하는 단계(S120)는, 샘플로부터 미생물 DNA를 추출하는 단계(S121), 추출한 DNA에 프라이머를 사용하여 PCR 증폭하는 단계(S123), PCR 산물을 T-RFLP 분석하여, 아나목스균의 T-RF 피크 데이터를 도출하는 단계(S125)를 포함할 수 있다.
도 7은 본 발명의 다른 실시예에 따른 머신러닝 모델을 이용한 하폐수처리공정 평가 방법의 순서도이다. 도 5의 실시예와 하폐수처리공정효율 예측 모델을 구성하는 단계를 제외하고 각 단계가 동일하다. 도 7의 실시예에서는 하폐수처리공정효율 예측 모델을 구성하는 단계(S131)가 산출된 군집구조데이터, 미생물 반응조의 운전 변수 및 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정효율 예측 모델을 구성할 수 있다.
각 단계에 대한 상세한 설명은 전술한 바와 동일하므로 중복되는 내용에 대해서는 설명을 생략한다.
이상, 본 발명내용의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적인 기술은 단지 바람직한 실시양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의해 정의된다고 할 것이다.
<110> Pusan National University Industry-University Cooperation Foundation <120> Method and System for Determination of Stability of Wastewater Treatment Process Using Machine Learning Model <130> PNU1-434p <160> 18 <170> KoPatentIn 3.0 <210> 1 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 1 ttcgcaatgc ccgraagg 18 <210> 2 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 2 ttcgcaatgc ccgraagg 18 <210> 3 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 3 gccgtaaacg atgggcact 19 <210> 4 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 4 agtgcccatc gtttacggc 19 <210> 5 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 5 rccgtaaacg atgggcact 19 <210> 6 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 6 agtgcccatc gtttacggy 19 <210> 7 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 7 gtaagggggt gaatagccct c 21 <210> 8 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 8 cagcagccgc ggtaatacag a 21 <210> 9 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 9 agttgatact atagggctgg a 21 <210> 10 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 10 tccagcccta tagtatcaac t 21 <210> 11 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 11 gatgggaaya acaacgttcc a 21 <210> 12 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 12 ttcgcaatgc ccgaaagg 18 <210> 13 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 13 gagagtggaa cttctggt 18 <210> 14 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 14 accagaagtt ccactctc 18 <210> 15 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 15 gcaggtgcgt taatagcgca c 21 <210> 16 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 16 cagcagccgc ggtaatacag a 21 <210> 17 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 17 atctgatact acagggcttg a 21 <210> 18 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 18 tcaagccctg tagtatcaga t 21

Claims (19)

  1. 생물학적으로 하폐수가 처리되는 미생물 반응조에서 샘플링된 기준 미생물의 군집구조데이터를 산출하는 단계; 및
    산출된 군집구조데이터 및 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정효율 예측 모델을 구성하는 단계를 포함하고,
    상기 군집구조데이터를 산출하는 단계는,
    상기 미생물 반응조에서 수집된 샘플에서 추출된 DNA에 프라이머를 사용하여 PCR 증폭하는 단계; 및
    PCR 산물을 T-RFLP 분석하여 기준 미생물의 T-RF 피크 데이터를 도출하는 단계를 포함하는,
    머신러닝 모델을 이용한 하폐수처리공정 평가 방법.
  2. 제1항에 있어서,
    상기 기준 미생물은 혐기성 암모늄-산화 (ANAMMOX, Anaerobic Ammonium Oxidation) 균주(bacteria)인,
    머신러닝 모델을 이용한 하폐수처리공정 평가 방법.
  3. 제2항에 있어서,
    상기 아나목스 균주는 칸디다투스 쿠에네니아(Candidatus Kuenenia), 칸디다투스 브로카디아(Candidatus Brocadia), 칸디다투스 아나목소글로버스(Candidatus Anammoxoglobus), 칸디다투스 제테니아(Candidatus Jettenia), 칸디다투스 스칼린두아(Candidatus Scalindua) 및 플랑크토마이세테스(Planctomycetes)로 이루어진 그룹에서 선택된 1 종 이상인,
    머신러닝 모델을 이용한 하폐수처리공정 평가 방법.
  4. 제2항에 있어서,
    상기 프라이머는 아나목스 균주의 16s rRNA 유전자를 타겟팅하는,
    머신러닝 모델을 이용한 하폐수처리공정 평가 방법.
  5. 제4항에 있어서,
    상기 프라이머는 서열번호 1의 염기서열로 구성된 프라이머 내지 서열번호 18의 염기서열로 구성된 프라이머로 이루어진 그룹에서 선택된 1 종 이상인,
    머신러닝 모델을 이용한 하폐수처리공정 평가 방법.
  6. 제2항에 있어서,
    상기 하폐수처리공정효율 예측 모델은, 총질소제거효율을 예측하는,
    머신러닝 모델을 이용한 하폐수처리공정 평가 방법.
  7. 제6항에 있어서,
    예측된 총질소제거효율이 기결정된 값 이하이면 0을 출력하고 기결정된 값 이상이면 1을 출력하는 하폐수처리공정 안정성 평가 단계를 더 포함하는,
    머신러닝 모델을 이용한 하폐수처리공정 평가 방법.
  8. 제6항에 있어서,
    하폐수처리공정효율 예측 모델을 구성하는 단계는,
    상기 산출된 군집구조데이터, 상기 미생물 반응조의 운전 변수 및 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정 효율 예측 모델을 구성하는,
    머신러닝 모델을 이용한 하폐수처리공정 평가 방법.
  9. 제8항에 있어서,
    상기 운전 변수는, 유입수 암모니아성 질소, 아질산성 질소 농도, 유입수 염도, 유입수 pH, 유출수 pH 및 질소부하속도로 이루어진 그룹에서 선택된 1 종 이상인,
    머신러닝 모델을 이용한 하폐수처리공정 평가 방법.
  10. 생물학적으로 하폐수가 처리되는 미생물 반응조에서 샘플링된 기준 미생물의 군집구조데이터를 산출하는 군집구조데이터 산출부; 및
    산출된 군집구조데이터 및 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정효율 예측 모델을 구성하는 예측 모델부;를 포함하고,
    상기 군집구조데이터 산출부는, 미생물 반응조에서 수집된 샘플에서 추출된 DNA에 프라이머를 사용하여 PCR 증폭하고, PCR 산물을 T-RFLP 분석하여 기준 미생물의 T-RF 피크 데이터를 도출함으로써, 상기 기준 미생물의 군집구조데이터를 산출하는,
    머신러닝 모델을 이용한 하폐수처리공정 평가 시스템.
  11. 제10항에 있어서,
    상기 기준 미생물은 혐기성 암모늄-산화 (ANAMMOX, Anaerobic Ammonium Oxidation) 균주(bacteria)인,
    머신러닝 모델을 이용한 하폐수처리공정 평가 시스템.
  12. 제11항에 있어서,
    상기 아나목스 균주는 칸디다투스 쿠에네니아(Candidatus Kuenenia), 칸디다투스 브로카디아(Candidatus Brocadia), 칸디다투스 아나목소글로버스(Candidatus Anammoxoglobus), 칸디다투스 제테니아(Candidatus Jettenia), 칸디다투스 스칼린두아(Candidatus Scalindua) 및 플랑크토마이세테스(Planctomycetes)로 이루어진 그룹에서 선택된 1 종 이상인,
    머신러닝 모델을 이용한 하폐수처리공정 평가 시스템.
  13. 제11항에 있어서,
    상기 프라이머는 아나목스 균주의 16s rRNA 유전자를 타겟팅하는,
    머신러닝 모델을 이용한 하폐수처리공정 평가 시스템.
  14. 제13항에 있어서,
    상기 프라이머는 서열번호 1의 염기서열로 구성된 프라이머 내지 서열번호 18의 염기서열로 구성된 프라이머로 이루어진 그룹에서 선택된 1 종 이상인,
    머신러닝 모델을 이용한 하폐수처리공정 평가 시스템.
  15. 제11항에 있어서,
    상기 하폐수처리공정효율 예측 모델은, 총질소제거효율을 예측하는,
    머신러닝 모델을 이용한 하폐수처리공정 평가 시스템.
  16. 제15항에 있어서,
    예측된 총질소제거효율이 기결정된 값 이하이면 0을 출력하고 기결정된 값 이상이면 1을 출력하는 하폐수처리공정 안정성 평가부를 더 포함하는,
    머신러닝 모델을 이용한 하폐수처리공정 평가 시스템.
  17. 제10항 또는 제11항에 있어서,
    상기 예측 모델부는, 상기 산출된 군집구조데이터, 상기 미생물 반응조의 운전 변수 및 반응조 유출수의 수질 간의 상관관계에 대한 패턴 학습을 기반으로 하폐수처리공정 효율 예측 모델을 구성하는,
    머신러닝 모델을 이용한 하폐수처리공정 평가 시스템.
  18. 제17항에 있어서,
    상기 운전 변수는, 유입수 암모니아성 질소, 아질산성 질소 농도, 유입수 염도, 유입수 pH, 유출수 pH 및 질소부하속도로 이루어진 그룹에서 선택된 1 종 이상인,
    머신러닝 모델을 이용한 하폐수처리공정 평가 시스템.
  19. 제1항 내지 제9항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체.
KR1020210121984A 2021-09-13 2021-09-13 머신러닝 모델을 이용한 하폐수처리공정 안정성 평가 방법 및 시스템 KR20230039090A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210121984A KR20230039090A (ko) 2021-09-13 2021-09-13 머신러닝 모델을 이용한 하폐수처리공정 안정성 평가 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210121984A KR20230039090A (ko) 2021-09-13 2021-09-13 머신러닝 모델을 이용한 하폐수처리공정 안정성 평가 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR20230039090A true KR20230039090A (ko) 2023-03-21

Family

ID=85800978

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210121984A KR20230039090A (ko) 2021-09-13 2021-09-13 머신러닝 모델을 이용한 하폐수처리공정 안정성 평가 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR20230039090A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117174198A (zh) * 2023-11-02 2023-12-05 山东鸿远新材料科技股份有限公司 一种基于氧氯化锆生产的自动检测清洁方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117174198A (zh) * 2023-11-02 2023-12-05 山东鸿远新材料科技股份有限公司 一种基于氧氯化锆生产的自动检测清洁方法及系统
CN117174198B (zh) * 2023-11-02 2024-01-26 山东鸿远新材料科技股份有限公司 一种基于氧氯化锆生产的自动检测清洁方法及系统

Similar Documents

Publication Publication Date Title
Luo et al. Microbial community structures in a closed raw water distribution system biofilm as revealed by 454-pyrosequencing analysis and the effect of microbial biofilm communities on raw water quality
Jang et al. Bacterial and methanogenic archaeal communities during the single-stage anaerobic digestion of high-strength food wastewater
TWI715564B (zh) 預測規則生成系統、預測系統、預測規則生成方法及預測方法
Slater et al. Monitoring associations between clade-level variation, overall community structure and ecosystem function in enhanced biological phosphorus removal (EBPR) systems using terminal-restriction fragment length polymorphism (T-RFLP)
Ye et al. Machine learning-aided analyses of thousands of draft genomes reveal specific features of activated sludge processes
Saikaly et al. Use of 16S rRNA gene terminal restriction fragment analysis to assess the impact of solids retention time on the bacterial diversity of activated sludge
Dollhopf et al. Interpreting 16S rDNA T-RFLP data: application of self-organizing maps and principal component analysis to describe community dynamics and convergence
Zhao et al. The heterogeneity of composition and assembly processes of the microbial community between different nutrient loading lake zones in Taihu Lake
CN105868545B (zh) 一种地下水生态系统健康评价方法
Cydzik-Kwiatkowska et al. Structure of nitrogen-converting communities induced by hydraulic retention time and COD/N ratio in constantly aerated granular sludge reactors treating digester supernatant
Wen et al. Nitrification kinetics and microbial communities of activated sludge as a full-scale membrane bioreactor plant transitioned to low dissolved oxygen operation
Cao et al. Responses of aerobic and anaerobic ammonia/ammonium-oxidizing microorganisms to anthropogenic pollution in coastal marine environments
Smith et al. Seasonal changes in bacterial and archaeal gene expression patterns across salinity gradients in the Columbia River coastal margin
CN104232766A (zh) 一种检测废水系统中氨氧化菌群落结构和丰度的方法
Nielsen et al. Microbiology and microbial ecology of the activated sludge process
Valk et al. Exploring the microbial influence on seasonal nitrous oxide concentration in a full-scale wastewater treatment plant using metagenome assembled genomes
KR20230039090A (ko) 머신러닝 모델을 이용한 하폐수처리공정 안정성 평가 방법 및 시스템
Lu et al. Reverse transcription of 16S rRNA to monitor ribosome-synthesizing bacterial populations in the environment
Santillan et al. Microbiome assembly predictably shapes diversity across a range of disturbance frequencies in experimental microcosms
Zhou et al. Predicting the abundance of metal resistance genes in subtropical estuaries using amplicon sequencing and machine learning
KR102537092B1 (ko) 인공신경망 모델을 이용한 토양 오염원 예측 방법
Dezotti et al. Molecular biology techniques applied to the study of microbial diversity of wastewater treatment systems
Bellucci et al. A preliminary and qualitative study of resource ratio theory to nitrifying lab‐scale bioreactors
Rowan et al. A comparitive study of ammonia-oxidizing bacteria in lab-scale industrial wastewater treatment reactors
Leddy et al. High-throughput DNA sequencing to profile microbial water quality of potable reuse

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application