KR102622449B1 - 식품용수 오염 예측 방법 및 그 시스템 - Google Patents

식품용수 오염 예측 방법 및 그 시스템 Download PDF

Info

Publication number
KR102622449B1
KR102622449B1 KR1020230014206A KR20230014206A KR102622449B1 KR 102622449 B1 KR102622449 B1 KR 102622449B1 KR 1020230014206 A KR1020230014206 A KR 1020230014206A KR 20230014206 A KR20230014206 A KR 20230014206A KR 102622449 B1 KR102622449 B1 KR 102622449B1
Authority
KR
South Korea
Prior art keywords
watershed
water quality
groundwater
trend
food
Prior art date
Application number
KR1020230014206A
Other languages
English (en)
Inventor
이강봉
최종동
오현숙
조혜진
이지선
남성우
전선금
정혜민
이명재
천정용
박은규
Original Assignee
주식회사 지오그린21
경북대학교 산학협력단
대한민국 (식품의약품안전처장)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 지오그린21, 경북대학교 산학협력단, 대한민국 (식품의약품안전처장) filed Critical 주식회사 지오그린21
Priority to KR1020230014206A priority Critical patent/KR102622449B1/ko
Application granted granted Critical
Publication of KR102622449B1 publication Critical patent/KR102622449B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Pathology (AREA)
  • Evolutionary Biology (AREA)
  • Food Science & Technology (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Library & Information Science (AREA)
  • Immunology (AREA)
  • Algebra (AREA)
  • Medicinal Chemistry (AREA)
  • Software Systems (AREA)

Abstract

식품용수 오염 예측 방법 및 그 시스템이 개시된다. 수질 검사 포인트마다 설치되어 지하수의 수질오염을 측정하는 다수의 센서장치를 통해 측정 데이터를 수집하여 지하수의 오염 상태를 분석하는 모니터링 서버에 의해 수행되는 식품용수 오염 예측 시스템은 지점 좌표 생성부, 적합 유역 선정부, 1차 대상 유역 선정부, 분석 대상 항목 선정부 및 지하수 수질 추세 예측부를 포함한다. 지점 좌표 생성부는 지하수를 사용하는 지하수 사용 식품업소의 주소 좌표를 생성한다. 적합 유역 선정부는 수자원단위 및 집수구역단위의 유역도를 비교 검토하여 표준유역을 적합 유역 단위로 선정한다. 1차 대상 유역 선정부는 표준유역내 유역별 포인트 수를 집계하여 1차 대상 유역을 선정한다. 분석 대상 항목 선정부는 각 표준유역의 분기별 검사항목별 대푯값을 도출하고 추세 분석 대상 항목을 선정한다. 지하수 수질 추세 예측부는 테일-센(Theil-Sen) 기울기 분석을 이용하여 관측기간 동안의 추세변화를 해석하여 미래의 수질 변화를 예측한다. 이에 따라, 수질 검사 포인트마다 지하수의 수질오염을 측정한 측정 데이터를 근거로 지하수의 오염 상태를 분석하여 지하수 오염 예측 모델 개발을 통해 선제적인 유역별 맞춤형 지하수 관리를 통해서 사전 예방적 식품 안전관리를 구현할 수 있다.

Description

식품용수 오염 예측 방법 및 그 시스템{METHOD AND SYSTEM FOR PREDICTING CONTAMINATION OF FOOD WATER}
본 발명은 식품용수 오염 예측 방법 및 그 시스템에 관한 것으로, 보다 상세하게는 선제적인 유역별 맞춤형 지하수 관리를 통해서 사전 예방적 식품 안전관리를 구현하기 위한 식품용수 오염 예측 방법 및 그 시스템에 관한 것이다.
식품용수란 식품의 제조, 가공, 조리, 소분 등에 사용하는 물을 말하며, 우리나라에서는 지하수가 식품용수로 식품의 제조, 가공, 조리 등 많은 부분에 활용되고 있다. 이러한 경향은 지하수를 식품용수로 사용하는 업소의 증가로 나타나고 있으며, 식품 산업의 발달과 깨끗한 물에 관한 관심 증가로 업소와 식품용수로 사용하는 지하수의 이 용량은 지속해서 증가할 것으로 예상된다.
식품용수로 사용되는 지하수는 오염될 경우 해당 식품의 불특정 이용자에게 동시다발적으로 위해를 미칠 수 있는 파급성을 지니고 있으며, 식품업소의 영업 형태 등에 따라 지역에만 국한되지 않는다는 점에서 심각성을 내포하고 있다. 이에 현행「식품위생법」에서는 수돗물이 아닌 지하수 등을 먹는물 또는 식품의 가공은 물론 조리, 세척 등에 사용하는 경우 먹는물 수질 검사기관에서 검사를 받아 마시기에 적합하다고 인정된 물을 사용하도록 규정하고 있다. 수질 검사의 주기는 같은 법 시행규칙에 따라 1년마다 실시하고, 음료류 등 마시는 용도의 식품이면 6개월마다 수질 검사를 수행하도록 의무화한 안전장치를 마련해두고 있다.
그러나 영업 형태에 따라서는 먹는물 기준의 검사가 2년 주기로 이루어지기도 하며, 검사 결과에서 용수로서의 적합성 여부만을 확인하는 경우가 대부분을 차지하고 있었다. 일부 영업소의 경우「식품위생법」제23조(식품 등의 재검사) 조항을 잘못 해석하여 부적합 항목에 대한 재검사를 시행하는 등 식품용수 지하수질 관리의 사각지대가 일부 확인되기도 하였다.
한 개의 영업소에서 식품용수로 사용되는 지하수에 대한 수질 검사를 수행하면 검사 용도별로 회 당 12~46개 항목의 수질 검사 결과가 생성되는데 이를 전국으로 확대해보면 생성되는 수질 자료의 개수는 연간 약 1,500개(2019년 식품업소 기준)로 추산된다. 또한, 시료 당 약 27만 원에 달하는 먹는물 수질 검사 수수료를 고려하면 데이터 생성에 드는 비용이 막대하다는 것을 알 수 있다.
생성되는 데이터의 양과 그 비용을 고려할 때, 지하수질의 적합성 여부만 확인하는 등의 단편적인 관리에서 벗어나 사장되는 수질 자료의 활용성을 증대시킬 방안이 필요하다. 식품용수로 사용되는 지하수의 오염으로 인한 위해성과 파급력을 고려할 때, 지하수질 관리의 사각지대를 보완하여 부적합이 우려되는 지하수가 식품의 제조, 가공, 조리 등에 사용되는 것을 차단하고, 그 동안 많은 비용을 들여 생성된 식품용수 지하수질 데이터를 효과적으로 활용하기 위하여, 데이터 기반의 지하수질 오염예측 모델의 개발이 필수적이며, 예측된 결과를 식품업체에 제공하여 선제적으로 식품용수 안전관리를 할 수 있는 방법론의 개발이 요구된다.
한국등록특허 제10-1409440호(2014. 06. 18. 공고) 한국등록특허 제10-1625619호(2016. 05. 31. 공고)
본 발명의 목적은 지하수 오염 예측 모델 개발을 통해 선제적인 유역별 맞춤형 지하수 관리를 통해서 사전 예방적 식품 안전관리를 구현할 수 있는 식품용수 오염 예측 방법을 제공하는 것이다.
본 발명의 다른 목적은 상기한 식품용수 오염 예측 방법을 수행하기 위한 식품용수 오염 예측 시스템을 제공하는 것이다.
상기한 본 발명의 목적을 실현하기 위하여 일실시예에 따르면 수질 검사 포인트마다 설치되어 지하수의 수질오염을 측정하는 다수의 센서장치를 통해 측정 데이터를 수집하여 지하수의 오염 상태를 분석하는 모니터링 서버에 의해 수행되는 식품용수 오염 예측 방법은, (i) 지하수를 사용하는 지하수 사용 식품업소의 주소 좌표를 생성하는 단계; (ii) 수자원단위 및 집수구역단위의 유역도를 비교 검토하여 표준유역을 적합 유역 단위로 선정하는 단계; (iii) 표준유역내 유역별 포인트 수를 집계하여 1차 대상 유역을 선정하는 단계; (iv) 각 표준유역의 분기별 검사항목별 대푯값을 도출하고 추세 분석 대상 항목을 선정하는 단계; 및 (v) 테일-센(Theil-Sen) 기울기 분석을 이용하여 관측기간 동안의 추세변화를 해석하여 미래의 수질 변화를 예측하는 단계를 포함한다.
본 발명의 일실시예에서, 단계(i)는, (i-1) 전국의 지하수 사용 식품업소의 일정 기간 동안의 수질 검사 자료를 취합하는 단계; (i-2) 업체명, 주소, 소유주의 정보를 활용하여 주소정보를 정제하는 단계; 및 (i-3) 생성된 주소정보에 대해 지오코딩툴을 활용하여 각 수질 검사 식품업소 위치 좌표를 생성하는 단계를 포함할 수 있다.
본 발명의 일실시예에서, 단계(ii)는, (ii-1) 수자원단위 및 집수구역단위의 4가지 유역도를 추출하는 단계; (ii-21) 유역 적합도 평가기준으로서, 유역 면적 및 갯수가 행정관리 실무 시 적합한지의 여부를 체크하는 단계; (ii-3) 유역 면적 및 갯수가 행정관리 실무 시 적합한 것으로 체크되면, 유역 적합도 평가기준으로서 추세 분석이 가능한 유역의 비율이 높은 단위인지의 여부를 체크하는 단계; (ii-4) 유역의 비율이 높은 단위인 것으로 체크되면, 유역 적합도 평가기준으로서 추세 분석 시 추세의 정확도가 높은 단위인지의 여부를 체크하는 단계; (ii-5) 추세의 정확도가 높은 단위인 것으로 체크되면, 유역 적합도 평가기준으로서 공신력있는 자료인지의 여부를 체크하는 단계; 및 (ii-6) 공신력있는 자료인 것으로 체크되면 해당 표준유역을 적합 유역단위로 선정하는 단계를 포함할 수 있다.
본 발명의 일실시예에서, 단계(iii)는, (iii-1) GIS를 활용하여 포인트별 표준유역 코드를 부여하는 단계; (iii-2) 수소이온 값이 적합한지의 여부를 체크하는 단계; (iii-3) 상기 수소이온 값이 부적합인 것으로 체크되면, 해당 검사 전체를 분석에서 제외하는 단계; 및 (iii-4) 상기 수소이온 값이 적합한 것으로 체크되나 단계 (iii-3)을 수행한 후, 유역별 검사 수가 일정 수 이상인 유역을 추출하여 1차 대상 유역을 선정하는 단계를 포함할 수 있다.
본 발명의 일실시예에서, 상기 대푯값은 산술 평균, 기하 평균, 중앙값 및 표준편차 중 어느 하나를 포함할 수 있다.
본 발명의 일실시예에서, 단계(iv)는, (iv-1) 수질 검사 포인트마다 부여받은 표준유역 코드를 이용하여 검사항목 측정값을 정리하는 단계; (iv-2) 각 검사항목의 분기별 대푯값을 도출하는 단계; 및 (iv-3) 검사항목 중 값이 가장 많아 예측의 신뢰성이 높고 지하수 수질의 대표성 판단이 가능한 질산성질소를 추세 분석 대상으로 선정하는 단계를 포함할 수 있다.
본 발명의 일실시예에서, 단계(v)는, 단계(v)는, (v-1) 관측자료 내 (여기서, I는 관측시간의 수)개 쌍 자료들의 기울기를 모두 구하는 단계; 및 (v-2) 해당 기울기들의 중앙값(median)을 최종 추세선의 기울기( )로 결정하여 미래 수질 변화 예측을 수행하는 단계를 포함할 수 있다.
상기한 본 발명의 다른 목적을 실현하기 위하여 일실시예에 따르면 수질 검사 포인트마다 설치되어 지하수의 수질오염을 측정하는 다수의 센서장치를 통해 측정 데이터를 수집하여 지하수의 오염 상태를 분석하는 모니터링 서버에 의해 수행되는 식품용수 오염 예측 시스템은, 지하수를 사용하는 지하수 사용 식품업소의 주소 좌표를 생성하는 지점 좌표 생성부; 수자원단위 및 집수구역단위의 유역도를 비교 검토하여 표준유역을 적합 유역 단위로 선정하는 적합 유역 선정부; 표준유역내 유역별 포인트 수를 집계하여 1차 대상 유역을 선정하는 1차 대상 유역 선정부; 각 표준유역의 분기별 검사항목별 대푯값을 도출하고 추세 분석 대상 항목을 선정하는 분석 대상 항목 선정부; 및 테일-센(Theil-Sen) 기울기 분석을 이용하여 관측기간 동안의 추세변화를 해석하여 미래의 수질 변화를 예측하는 지하수 수질 추세 예측부를 포함한다.
본 발명의 일실시예에서, 상기 지점 좌표 생성부는, 전국의 지하수 사용 식품업소의 일정 기간 동안의 수질 검사 자료를 취합하고, 업체명, 주소, 소유주의 정보를 활용하여 주소정보를 정제하고, 생성된 주소정보에 대해 지오코딩툴을 활용하여 각 수질 검사 식품업소 위치 좌표를 생성할 수 있다.
본 발명의 일실시예에서, 상기 적합 유역 선정부는, 수자원단위 및 집수구역단위의 4가지 유역도를 추출하고, 유역 적합도 평가기준으로서, 유역 면적 및 갯수가 행정관리 실무 시 적합한 것으로 체크되고, 유역의 비율이 높은 단위인 것으로 체크되고, 추세의 정확도가 높은 단위인 것으로 체크되고, 공신력있는 자료인 것으로 체크되면 해당 표준유역을 적합 유역단위로 선정할 수 있다.
본 발명의 일실시예에서, 상기 1차 대상 유역 선정부는, GIS를 활용하여 포인트별 표준유역 코드를 부여하고, 수소이온 값이 부적합인 것으로 체크되면, 해당 검사 전체를 분석에서 제외하고, 유역별 검사 수가 일정 수 이상인 유역을 추출하여 1차 대상 유역을 선정할 수 있다.
본 발명의 일실시예에서, 상기 분석 대상 항목 선정부는, 수질 검사 포인트마다 부여받은 표준유역 코드를 이용하여 검사항목 측정값을 정리하고, 각 검사항목의 분기별 대푯값을 도출하고, 검사항목 중 값이 가장 많아 예측의 신뢰성이 높고 지하수 수질의 대표성 판단이 가능한 질산성질소를 추세 분석 대상으로 선정할 수 있다.
본 발명의 일실시예에서, 상기 지하수 수질 추세 예측부는, 관측자료 내 (여기서, I는 관측시간의 수)개 쌍 자료들의 기울기를 모두 구한 후, 해당 기울기들의 중앙값(median)을 최종 추세선의 기울기( )로 결정하여 미래 수질 변화 예측을 수행할 수 있다.
이러한 식품용수 오염 예측 방법 및 그 시스템에 의하면, 수질 검사 포인트마다 지하수의 수질오염을 측정한 측정 데이터를 근거로 지하수의 오염 상태를 분석하여 지하수 오염 예측 모델 개발을 통해 선제적인 유역별 맞춤형 지하수 관리를 통해서 사전 예방적 식품 안전관리를 구현할 수 있다.
도 1은 본 발명의 일실시예에 따른 식품용수 오염 예측 시스템을 설명하기 위한 블럭도이다.
도 2는 테일-센(Theil-Sen) 기울기 분석기법 및 선형회귀 분석기법의 비교를 설명하기 위한 그래프이다.
도 3은 본 발명의 일실시예에 따른 식품용수 오염 예측 방법을 설명하기 위한 흐름도이다.
도 4는 도 3에 도시된 지하수 사용 식품업소의 주소 좌표를 생성하는 단계 S100을 설명하기 위한 흐름도이다.
도 5는 도 4에서 설명된 수질 검사 식품업소 위치 좌표 생성 과정을 설명하기 위한 도면이다.
도 6은 도 3에 도시된 표준유역을 적합 유역 단위로 선정하는 단계 S200을 설명하기 위한 흐름도이다.
도 7은 유역단위 및 수질 검사 지점분포를 설명하기 위한 도면들이다.
도 8은 도 3에 도시된 표준유역내 유역별 포인트 수를 집계하여 1차 대상 유역을 선정하는 단계 S300을 설명하기 위한 흐름도이다.
도 9는 도 3에 도시된 표준유역의 분기별 검사항목별 대푯값 도출 및 추세 분석 대상 항목을 선정하는 단계 S400을 설명하기 위한 흐름도이다.
도 10은 도 3에 도시된 미래의 수질 변화를 예측하는 단계 S500의 예를 설명하기 위한 흐름도이다.
도 11은 도 3에 도시된 미래의 수질 변화를 예측하는 단계 S500의 다른 예를 설명하기 위한 흐름도이다.
도 12는 시간별 농도 그래프에 설정되는 변곡점을 설명하기 위한 그래프이다.
도 13은 수질 추세 예측 결과를 예시적으로 나타낸 그래프들이다.
이하, 첨부한 도면들을 참조하여, 본 발명을 보다 상세하게 설명하고자 한다. 본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
도 1은 본 발명의 일실시예에 따른 식품용수 오염 예측 시스템을 설명하기 위한 블럭도이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 식품용수 오염 예측 시스템은 지점 좌표 생성부(110), 적합 유역 선정부(120), 1차 대상 유역 선정부(130), 분석 대상 항목 선정부(140) 및 지하수 수질 추세 예측부(150)를 포함한다. 본 실시예에서, 식품용수 오염 예측 시스템은 지점 좌표 생성부(110), 적합 유역 선정부(120), 1차 대상 유역 선정부(130), 분석 대상 항목 선정부(140) 및 지하수 수질 추세 예측부(150)로 구성된 것을 설명하였으나, 이는 설명의 편의를 위해 논리적으로 구분할 것일 뿐 하드웨어적으로 구분한 것은 아니다.
지점 좌표 생성부(110)는 지하수를 사용하는 식품업소의 일정 기간 동안의 수질 검사 자료를 취합하고, 업체명, 주소, 소유주 정보를 활용하여 주소정보를 정제하고, 생성된 주소정보를 지오코딩툴을 활용하여 각 검사 결과별 지점좌표를 생성하는 방식으로 지하수 사용 식품업소 주소 좌표를 생성한다.
적합 유역 선정부(120)는 수자원단위 및 집수구역단위의 유역도를 비교 검토하여 표준유역을 적합 유역 단위로 선정하여 지하수 수질 추세 예측에 적합한 유역도를 비교 및 검토하여 표준유역을 적합 유역단위로 선정한다.
1차 대상 유역 선정부(130)는 GIS를 활용하여 포인트별 표준유역 코드를 부여하고, 수소이온 값이 부적합일 경우 해당 검사 전체를 분석에서 제외하고, 표준유역의 각 유역 내 포인트 수를 집계하고, 유역별 검사 수(포인트 수)가 일정 수 이상인 유역을 추출하는 방식으로 표준유역내 유역별 포인트 수를 집계하여 1차 대상 유역을 선정한다.
분석 대상 항목 선정부(140)는 수질 검사 포인트마다 부여받은 표준유역 코드를 이용하여 검사 항목 측정값을 정리하고, 각 검사항목의 분기별 대푯값을 도출하는 방식으로 각 표준유역의 분기별 검사항목별 대푯값 도출 및 추세 분석 대상 항목을 선정한다.
지하수 수질 추세 예측부(150)는 관측기간 동안의 추세변화를 해석하여 미래의 수질 변화를 예측한다. 본 발명에 따른 분석 및 추세 예측 과정은 전처리 과정을 거쳐 전처리된 데이터를 활용하여 추세 분석을 실시하는 과정이다. 상기한 분석 및 추세 예측 과정을 설명하기 위해, 본 명세서에서는 예시적으로 2010년부터 2019년까지 최근 10년간 식품업소 지하수 수질 검사 자료를 바탕으로 2020년부터 2025년까지 향후 5년의 수질 추세를 예측하였으며, 지하수 수질 추세 분석을 위한 통계적 방법으로, 회귀분석, 최소절사제곱(Least Trimmed Squares, LTS), 맨-켄달 검증법(Mann-Kendall test), 테일-센(Theil-Sen) 기울기 분석 등의 분석 기법이 사용될 수 있다.
관측기간 동안 추세의 변화를 해석하기 위하여 자료분할 회귀분석(Segmented regression) 기법을 적용할 수 있다. 이는 모수적(parametiric) 추세 분석 기법 중 하나로, 추세를 제거한 자료의 오차가 정규분포를 이루는 경우 일반적으로 적용되는 선형회귀(linear regression) 분석법의 노이즈로 인한 부정확성을 보완한 분석법이다. 예를 들어, 2010년부터 2020년까지 10년 간의 관측자료를 사용하는 만큼, 해당 기간 동안 기후변화, 도시개발, 토지이용 변화, 인구변동 등으로 인한 수질 변화가 발생할 수 있으며, 이는 다른 추세가 보이는 변곡점으로 나타날 수 있다. 관측 기간 동안 최소 1회의 수질 변화가 발생했을 것이라 가정하여 예측 모델에 변곡점을 설정한다. 변곡점 설정과 관련된 일련의 과정은 모두 자동화하여 적합한 변곡점으로 분석하는 코드를 추가하여 예측의 정확도를 향상시켰다.
본 발명에서는 하나의 변곡점을 가지고 두 가지의 다른 추세가 있는 경우를 모델링하기 위해 강력한 분할 선형회귀 분석 방법을 개발하였다. 또한, 유역을 대표하는 지하수 수질의 변화가 일반적으로 급변하지 않는다는 가정 하에 두 가지의 추세가 변곡점에서 만나도록 회귀 모델을 설계하였고, 따라서 분할 선형회귀 방정식은 아래의 수식 (1)과 같다.
[수식 1]
여기서, t는 시간, ω10과 ω11은 변곡점 이전의 추세를 설명하는 계수이며, 와 ω20과 ω21은 변곡점 이후의 계수이고, tBP는 분할지점이다.
두 추세가 변곡점에서 서로 교차하기 때문에 계수는 아래의 수식 (2)와 같이 변곡점과 관련된다.
한편, 식품업소의 지하수 수질 검사 결과가 각기 다른 분석기관에 의해 생성되었기 때문에, 분석과정에서의 오차 등으로 발생하는 이상치의 영향을 배제하기 위하여 최소절사제곱(Least Trimmed Squares, LTS) 기법을 적용할 수 있다. LTS는 50%의 변곡점(Breakdown point)을 지녀 이상치의 영향을 가장 잘 배제할 수 있는 로버스트 회귀모델(robust regression)의 하나로, 일반적으로 많은 이상치를 포함하는 지하수 수질자료의 적용에 유리하고 선형회귀에 기반하여 계절적 지하수 수질변동에 용이하게 적용된다는 장점이 있다.
수질의 느린 변화속도에 기초하여 추세의 연속성을 가정할 경우 상기한 수식 (1)에서 분할지점(tBP)은 아래의 수식 (2)로 결정하였다.
[수식 2]
상기한 수식 (1)에서 추세식의 α는 전반기 및 후반기의 지시인자이며 아래의 수식 (3)으로 계산하였다.
[수식 3]
LTS 기반 추세 추정에는 아래의 수식 (4) 및 (5)의 목적함수를 이용하였다.
[수식 4]
[수식 5]
여기서, N은 대표적인 데이터를 획득한 시간 간격의 수이고, 은 n번째 시간 간격이다.
다음으로, 본 발명에서는 자료의 75%만 신뢰할 수 있다는 가정하에 아래의 수식 (6)의 가중치를 적용하였다.
[수식 6]
여기서, 는 가장 작은 것부터 큰 것까지 정렬된 오차의 75% 순위에 해당하는 오차 값의 제곱을 나타낸다.
목적함수의 미분 불가능 특성을 고려하여 목적함수의 최적화에는 비선형 최적화 방법이 적용되었다. 상기한 비선형 최적화 방법으로는 내부점법(Interior point method)을 이용하였다.
미래의 수질 변화 예측 부분에는 아래의 수식 (7)의 선형회귀 및 추세의 신뢰구간을 적용하였다. 신뢰구간은 평균 수질농도 추세가 위치할 가능성이 99% 이상인 범위로 선정하였으며, 2020년까지의 10년치 관측자료에 기초하여 향후 5년, 즉 2025년까지의 수질 변화 예측을 수행하였다.
[수식 7]

CI(t)는 t시간에서의 신뢰구간을 나타내며, μ(t)는 t시간에서의 수질 추정값을 나타내고, σc는 수질값의 표준편차를 나타내며, n은 자료의 개수를 나타내고, N은 대표적인 데이터를 획득한 시간 간격의 수를 나타내며, σt는 수질자료 측정시간의 분산을 나타낸다.
매 자료에 대하여 분할회귀 추정결과는 선형회귀 추정 결과와 벤치마크되었으며, 두 가지의 추정에 대하여 각각 맨-켄달 검증법(Mann-Kendall test)의 p-value 값을 얻었다. 맨-켄달 검증법을 이용하여 p-value를 도출하여 추세가 나타날 가능성이 높은 유역을 값으로 파악할 수 있다. 상기 맨-켄달 검증법은 비모수적 통계방법 중 하나로써 Mann(1945)에 의해 제안되었으며, Kendall(1975)의 추가적인 연구를 통해 개선되었다. 캔-켄달 검정법은 관측값의 서열 또는 변동 기울기를 이용하여 경향성을 분석하는 방법이다. 즉, 관측 자료간의 차이를 증가, 감소, 상등으로 표현하여 추정 통계치를 도출한다. 추정 통계치에 대한 분산을 산정한 후, 표준정규변량을 산정한다. 표준정규변량이 양의 값이면 상승추세고, 음의 값이면 감소추세며, 0이면 추세가 없는 것이다.
이를 통해, 두 추정 중 더 낮은 p-value 값을 보이는 결과가 합리적인 추세라고 정의하였다. 도출 결과 파일은 아래의 표 1과 같이 5가지 항목이 표기된다.
[표 1]
표 1에서, 1)은 추세변화지점(breakpoint)으로 이전의 자료 개수를 의미하고, 2)는 추세변화 이후 추세선의 기울기, 3)은 단순 선형회귀 분석결과 추세선의 기울기, 4)는 분할회귀 추정 결과 우측 선형추세의 p-value, 5)는 변곡점이 없는 단순 선형회귀 분석추정의 p-value 값을 의미한다. 예를 들어, 유역코드 100701의 결과 값이 1) 32, 2) 0.09, 3) 0.03, 4) 0.08, 5) 0.23 이라면, 해당 유역은 p-value 값인 4)와 5) 중 4)의 값이 0.08로 더 작으므로 변곡점이 있는 추세가 변곡점이 없는 추세보다 더 우세함을 뜻하며, 따라서 해당 유역의 기울기 값은 2) 0.09로 상승추세다.
예측 결과는 후술되는 도 11에 도시된 바와 같이 그래프로 도출되도록 하였으며, 변곡점이 있거나 없을 가능성 중 더 높은 가능성의 추세가 실선으로 표현되고, 나머지가 점선으로 표현되도록 하였다. 또한, 수질농도 추세가 위치할 가능성이 99% 이상인 범위를 회색으로 표현하였다.
후술되는 도 11의 예측결과 그래프에서 점선은 변곡점을 설정하지 않은 결과를 나타내고 실선은 변곡점을 설정한 결과를 나타낸다. 변곡점이 설정되지 않았을 때는 수질의 상승 추세를 예측할 수 없으나, 변곡점을 설정하면 2016년도 기점으로 수질이 상승하는 추세임을 예측할 수 있다.
한편, 지하수 수질 농도값의 단조 증가 및 감소와 같은 추세 형태를 예측하는데 이용되는 비모수 추세분석 기법 중 가장 일반적으로 이용되는 방법인 테일-센(Theil-Sen) 기울기 분석이 이용될 수 있다. 테일-센(Theil-Sen) 기울기 분석은 선형회귀 추세분석 기법 보다 자료 내 이상치(outlier)에 대해 비교적 견고한 분석을 할 수 있다는 장점이 있다. 여기서, 견고성이란 추세 산정 시 이상치의 영향을 배제할 수 있음을 의미한다.
테일-센(Theil-Sen) 기울기 분석은 일반적으로 약 29.3%의 변곡점(breakdown point)을 가지는 것으로 알려져 있으며, 이는 이상치의 비율이 29.3% 이하일 경우 올바른 추세예측을 할 수 있음을 의미한다.
총 I개의 시간(, i=1,??,I)에 대한 관측자료 (,i=1,??,I)가 존재할 때, 자료 내 개 쌍 자료들의 기울기를 모두 구한 후, 해당 기울기들의 중앙값(median) 을 최종 추세선의 기울기( )로 결정한다.
도 2는 테일-센(Theil-Sen) 기울기 분석기법 및 선형회귀 분석기법의 비교를 설명하기 위한 그래프이다.
도 2를 참조하면, 실제 정선용산 국가관측망의 2008~2014년 질산성질소 관측결과를 테일-센(Theil-Sen) 기울기 분석과 선형회귀 분석 결과를 적용하여 비교한 결과, 선형회귀 분석에 의한 추세예측은 2010년부터 2011년까지의 높은 질산성질소 농도에 의한 영향에 의해 다수의 관측농도가 보이는 추세에서 이탈한 추세예측을 보여준다.
하지만, 테일-센(Theil-Sen) 기울기 분석에 의한 추세는 이상치의 영향을 받지 않으며 다수의 관측, 농도가 보이는 추세를 잘 반영하고 있어 선형회귀 분석에 비하여 우월성이 있음을 확인할 수 있다.
도 3은 본 발명의 일실시예에 따른 식품용수 오염 예측 방법을 설명하기 위한 흐름도이다.
도 3을 참조하면, 지하수를 사용하는 식품업소의 일정 기간 동안의 수질 검사 자료를 취합하여 업체명, 주소, 소유주 정보를 활용하여 주소정보를 정제하고, 생성된 주소정보를 지오코딩툴을 활용하여 각 검사 결과별 지점좌표를 생성하는 방식으로 지하수 사용 식품업소 주소 좌표를 생성한다(단계 S100). 상기한 지하수 사용 식품업소 주소 좌표의 생성은 도 1에 도시된 지점 좌표 생성부(110)에 의해 수행될 수 있다.
이어, 수자원단위 및 집수구역단위의 유역도를 비교 검토하여 표준유역을 적합 유역 단위로 선정하여 지하수 수질 추세 예측에 적합한 유역도를 비교 및 검토하여 표준유역을 적합 유역단위로 선정한다(단계 S200). 상기한 표준유역을 적합 유역단위로 선정은 도 1에 도시된 적합 유역 선정부(120)에 의해 수행될 수 있다.
이어, GIS를 활용하여 포인트별 표준유역 코드를 부여하고, 수소이온 값이 부적합일 경우 해당 검사 전체를 분석에서 제외하고, 표준유역의 각 유역 내 포인트 수를 집계하고, 유역별 검사 수(포인트 수)가 일정 수 이상인 유역을 추출하는 방식으로 표준유역내 유역별 포인트 수를 집계하여 1차 대상 유역을 선정한다(단계 S300). 상기한 1차 대상 유역의 선정은 도 1에 도시된 1차 대상 유역 선정부(130)에 의해 수행될 수 있다.
이어, 수질 검사 포인트마다 부여받은 표준유역 코드를 이용하여 검사 항목 측정값을 정리하고, 각 검사항목의 분기별 대푯값을 도출하는 방식으로 각 표준유역의 분기별 검사항목별 대푯값 도출 및 추세 분석 대상 항목을 선정한다(단계 S400). 상기한 분기별 검사항목별 대푯값 도출 및 추세 분석 대상 항목의 선정은 도 1에 도시된 분석 대상 항목 선정부(140)에 의해 수행될 수 있다.
이어, 관측기간 동안의 추세변화를 해석하여 미래의 수질 변화를 예측한다(단계 S500). 예를 들어, 최근 10년간 식품용수 지하수 수질 검사 자료를 바탕으로 지하수 수질 추세 분석을 위한 통계적 방법을 이용하여 향후 5년간의 수질 추세를 예측한다. 상기한 미래의 수질 변화의 예측은 도 1에 도시된 지하수 수질 추세 예측부(150)에 의해 수행될 수 있다.
도 4는 도 3에 도시된 지하수 사용 식품업소의 주소 좌표를 생성하는 단계 S100을 설명하기 위한 흐름도이다.
도 3 및 도 4를 참조하면, 전국의 지하수 사용 식품업소의 일정 기간 동안의 수질 검사 자료를 취합한다(단계 S110). 예를 들어, 약 10년간 수질 검사 자료를 취합할 수 있다.
이어, 업체명, 주소, 소유주 등의 정보를 활용하여 주소정보를 정제한다(단계 S120).
이어, 생성된 주소정보에 대해 지오코딩툴을 활용하여 각 검사 결과별 지점좌표, 즉 수질 검사 식품업소 위치 좌표를 생성한다(단계 S130). 상기한 지오코딩툴은 주소나 지명 등 고유명사를 통해 위도와 경도의 좌표값으로 변환하는 프로그램이다.
도 5는 도 4에서 설명된 수질 검사 식품업소 위치 좌표 생성 과정을 설명하기 위한 도면이다.
도 5를 참조하면, 영업소 정보 표준화 및 주소를 통합한 자료와 지오코딩툴을 활용하여 생성된 경위도 좌표를 통합하여 일변번호, 주소, 일자, 수질 검사 값 등을 수질 검사 지점 분포도 상에 포인트화한다.
도 6은 도 3에 도시된 표준유역을 적합 유역 단위로 선정하는 단계 S200을 설명하기 위한 흐름도이다.
도 3 내지 도 6을 참조하면, 수자원단위 및 집수구역단위의 4가지 유역도, 예를 들어, 대권역 유역단위, 중권역 유역단위, 표준유역 유역단위, 집수구역 유역단위에 대응하는 유역도를 추출한다(단계 S210).
도 7은 유역단위 및 수질 검사 지점분포를 설명하기 위한 도면들이다.
도 7을 참조하면, 대권역 유역단위는 광역시에 대응하는 영역들 또는 광역시가 몇 개의 영역으로 구분된 영역들을 포함한다. 대권역 유역단위 각각에는 수질 검사지점이 배치된다.
중권역 유역단위는 대권역 유역단위가 몇 개의 영역으로 구분된 영역들을 포함한다. 중권역 유역단위 각각에는 수질 검사지점이 배치된다.
표준유역 유역단위는 중권역 유역단위가 몇 개의 영역으로 구분된 영역들을 포함한다. 표준유역 유역단위 각각에는 수질 검사지점이 배치된다.
집수구역 유역단위는 표준유역 유역단위가 몇 개의 영역으로 구분된 영역들을 포함한다. 집수구역 유역단위 각각에는 수질 검사지점이 배치된다.
도 3 내지 도 6을 다시 참조하면, 유역 적합도 평가기준으로서, 유역 면적 및 갯수가 행정관리 실무 시 적합한지의 여부를 체크한다(단계 S220). 예를 들어, 행정관리 실무에 따라 유역 면적 및 개수의 최저한도를 기설정하고, 유역 적합도 평가기준이 되는 유역 면적 및 갯수가 기설정된 유역 면적 및 기설정된 개수에 미달되는지 여부를 판단한다. 유역 면적 및 개수가 기설정된 유역 면적 및 기설정된 개수에 미달되는 경우에는 유역 면적 및 개수가 행정관리 실무에 부적합하다고 판단하며, 반대로 유역 면적 및 개수가 기설정된 유역 면적 및 개수 이상인 경우에는 행정관리 실무에 적합하다고 판단한다.
단계 S220에서 유역 면적 및 갯수가 행정관리 실무 시 적합한 것으로 체크되지 않으면 단계 S210으로 피드백하고, 유역 면적 및 갯수가 행정관리 실무 시 적합한 것으로 체크되면, 유역 적합도 평가기준으로서 추세 분석이 가능한 유역의 비율이 높은 단위인지의 여부를 체크한다(단계 S230). 예를 들어, 각 유역의 데이터가 기설정된 기간동안 관측된 데이터를 포함하는 경우에는 추세 분석이 가능한 유역으로 판단하고, 전체 유역 데이터 중에서 추세 분석이 가능한 유역의 비율이 기설정된 비율에 미달되는지 여부를 판단한다.
단계 S230에서 유역의 비율이 높은 단위인 것으로 체크되지 않으면, 즉, 추세 분석이 가능한 유역의 비율이 기설정된 비율에 미달되는 경우에는 단계 S210으로 피드백하고, 유역의 비율이 높은 단위인 것으로 체크되면, 즉, 추세 분석이 가능한 유역의 비율이 기설정된 비율 이상인 경우에는 유역 적합도 평가기준으로서 추세 분석 시 추세의 정확도가 높은 단위인지의 여부를 체크한다(단계 S240). 예를 들어, 추세의 정확도의 최저한도를 기설정하고, 유역 데이터의 추세의 정확도가 기설정된 최저한도에 미달되는지 여부를 판단한다.
단계 S240에서 추세의 정확도가 높은 단위인 것으로 체크되지 않으면 단계 S210으로 피드백하고, 추세의 정확도가 높은 단위인 것으로 체크되면, 유역 적합도 평가기준으로서 공신력있는 자료인지의 여부를 체크한다(단계 S250).
단계 S250에서 공신력있는 자료인 것으로 체크되지 않으면 단계 S210으로 피드백하고, 단계 S250에서 공신력있는 자료인 것으로 체크되면 해당 표준유역을 적합 유역단위로 선정한다(단계 S260). 즉, 유역 면적 및 갯수가 행정관리 실무 시 적합하고, 추세 분석이 가능한 유역의 비율이 높은 단위이고, 추세 분석 시 추세의 정확도가 높은 단위이고, 공신력있는 자료인 경우 표준유역을 적합 유역단위로 선정한다.
이상에서 설명된 바와 같이, 수자원단위 및 집수구역단위의 4가지 유역도(예를 들어, 대권역, 중권역, 표준유역, 집수구역)를 비교 검토하여 표준유역을 적합 유역단위로 선정하는데, 유역 적합도 평가기준으로서 유역 면적 및 갯수가 행정관리 실무 시 적합하고, 추세 분석이 가능한 유역의 비율이 높은 단위이고, 추세 분석 시 추세의 정확도가 높은 단위이고, 공신력있는 자료인 표준유역이 적합 유역단위로 선정된다.
도 8은 도 3에 도시된 표준유역내 유역별 포인트 수를 집계하여 1차 대상 유역을 선정하는 단계 S300을 설명하기 위한 흐름도이다.
도 3 내지 도 8을 참조하면, 단계 S230에 이어, GIS를 활용하여 포인트별 표준유역 코드를 부여한다(단계 S310).
이어, 수소이온 값이 적합한지의 여부를 체크한다(단계 S320).
단계 S320에서 수소이온 값이 부적합인 것으로 체크되면, 해당 검사 전체를 분석에서 제외한다(단계 S330). 즉, 수소이온 값 부적합으로 재검사하는 경우는 없다고 가정할 수 있다. 예를 들어, 표준유역 851개의 각 유역 내 포인트 수를 집계한다. 즉, 각 유역 내 검사 결과는 모두 그 지역을 대표한다고 가정할 수 있다.
단계 S320에서 수소이온 값이 적합한 것으로 체크되나 단계 S330을 수행한 후, 유역별 검사 수(포인트 수)가 일정 수(예를 들어 50개) 이상인 유역을 추출하여 1차 대상 유역을 선정한다(단계 S340).
도 9는 도 3에 도시된 표준유역의 분기별 검사항목별 대푯값 도출 및 추세 분석 대상 항목을 선정하는 단계 S400을 설명하기 위한 흐름도이다.
도 3 내지 도 9를 참조하면, 수질 검사 포인트마다 부여받은 표준유역 코드를 이용하여 검사항목 측정값을 정리한다(단계 S410). 상기한 검사항목 측정값은 일련번호, 수질 검사일련번호, 허가신고번호, 수질 검사기타내용, 상호명, 주소, 시도명, 조사코드(예를 들어, 음용은 221, 미음용은 222), 지하수용도코드(예를 들어, 생활용은 01, 공업용은 02, 농업용은 03, 기타용은 04), 연도, 분기, 수질 검사목적내용 원수분류코드(예를 들어, 원수는 1, 정수는 2), 수질 검사 결과코드(예를 들어, 적합은 1, 부적합은 2), 요청일자, 수질 검사일자, 결과통보일자, 일반세균, 총대장균군, 대장균군수, 분원성대장균, 대장균, 납, 불소, 비소, 셀레늄, 수은, 시안, 페놀 암모니아성질소, 질산성질소, 카드뮴, 보론, 다이아지논, 파라티온, 매니트로티온, 카바릴, 1,1,1-트리클로로에탄, 테트라클로로에틸렌, 트리클로로에틸렌, 디클로로메탄, 벤젠, 톨루엔, 에틸벤젠, 크실렌, 사염화탄소, 1,2-디브로모-3-클로로프로판, 유기인, 경도, 과망간산칼륨소비량, 냄새, 맛, 동, 색도, 세제, 수소이온농도, 아연, 염소이온, 증발잔류물, 철, 망간, 탁도, 황산이온, 알루미늄, 1,1-디클로로에틸렌, 6가크롬, 크롬, 1,4-다이옥산, 검사기관 등의 정보를 포함할 수 있다.
이어, 각 검사항목의 분기별 대푯값(산술/기하평균, 표준편차, 중앙값)을 도출한다(단계 S420). 여기서, 대푯값을 도출하는 것은 자료수집의 경향성을 고려하고, 개별 자료의 변동성을 억제하기 위함이다. 본 실시예에서는 개개 수질관측의 신뢰성이 높지 않을 것으로 추정하여 각 검사항목의 분기별 중앙값을 추세 분석에 이용한다.
이어, 검사항목 중 값이 가장 많아 예측의 신뢰성이 높고 지하수 수질의 대표성 판단이 가능한 질산성질소를 추세 분석 대상으로 선정한다(단계 S430). 본 실시예에서는, 질산성질소를 추세 분석 대상으로 선정하였으나, 질산성질소가 아닌 다른 요소를 추세 분석 대상으로 선정할 수도 있다.
각 유역의 분기별 질산성질소 값이 15개 이상인 유역에 대해 후술하는 추세 분석을 실시한다.
도 10은 도 3에 도시된 미래의 수질 변화를 예측하는 단계 S500의 예를 설명하기 위한 흐름도이다.
도 3 내지 도 10을 참조하면, 관측기간 동안의 추세변화(추세 역전 등)를 해석하기 위해 단계 S400에서 선정된 추세 분석 대상 항목, 즉 관측자료 내 N개 쌍 자료들의 기울기를 모두 구한다(단계 S510). 예를 들어, 총 I개의 시간(, i=1,??,I)에 대한 관측자료 (,i=1,??,I)가 존재할 때, 자료 내 개 쌍 자료들의 기울기를 모두 구한다.
이어, 해당 기울기들의 중앙값(median)을 최종 추세선의 기울기()로 결정하여 미래 수질변화 예측을 수행한다(단계 S520).
도 11은 도 3에 도시된 미래의 수질 변화를 예측하는 단계 S500의 다른 예를 설명하기 위한 흐름도이다.
도 3 내지 도 9 및 도 11을 참조하면, 관측기간 동안의 추세변화(추세 역전 등)를 해석하기 위하여 단계 S400에서 선정된 추세 분석 대상 항목에 대해 자료분할 회귀분석(segmented regression) 기법을 적용한다(단계 S610).
이어, 수질 변화가 발생했을 것으로 가정하여 예측 모델에 변곡점을 설정한다(단계 S620). 전반기는 Theil-Sen sloope test를 이용하여 이상치에 의한 영향을 최소화하고, 후반기는 선형회귀 분석을 이용한다. 다만, 선형회귀 분석의 시작점은 전반기-후반기를 연계하는 변곡점(Breakpoint)으로 고정한다.
이어, 회귀 모델을 설계한 후(단계 S630), 결과 그래프인 시간별 농도 그래프를 도출한다(단계 S640). 10년간 1회 이상 수질 변화가 발생할 것으로 가정하여, 변곡점을 적용한 결과와 변곡점을 적용하지 않은 결과 모두 도출하고, 우세한 결과는 실선으로 우세하지 않는 경우는 파선으로 표현하여 두 가지를 비교 검토할 수 있도록 한다.
도 12는 시간별 농도 그래프에 설정되는 변곡점을 설명하기 위한 그래프이다.
도 12를 참조하면, 2010년부터 2020년까지 매분기마다 수행된 수질 검사에서 실측된 수질의 농도가 그래프에 표시된다. 예를 들어, 2011년 1/4분기에 실측된 수질의 농도로써 8.5mg/l이 표시되고, 2/4분기에 실측된 수질의 농도로써 4mg/l이고, 3/4분기에 실측된 수질의 농도로써 1.5mg/l이 표시되고, 4/4분기에 실측된 수질의 농도로써 3.51mg/l이 표시된다. 또한, 2012년 1/4분기에 실측된 수질의 농도로써 10.1mg/l이 표시되고, 2/4분기에 실측된 수질의 농도로써 5.8mg/l이고, 3/4분기에 실측된 수질의 농도로써 5.2mg/l이고, 4/4분기에 실측된 수질의 농도로써 3.9mg/l이 표시된다. 2013년 1/4분기에 실측된 수질의 농도로써 2.2mg/l이 표시되고, 2/4분기에 실측된 수질의 농도로써 11.8mg/l이고, 3/4분기에 실측된 수질의 농도로써 5.8mg/l이 표시되고, 4/4분기에 실측된 수질의 농도로써 3.9mg/l이 표시된다. 이러한 방식으로 2019년 1/4분기에 실측된 수질의 농도로써 7.5mg/l이 표시되고, 2/4분기에 실측된 수질의 농도로써 5mg/l이고, 3/4분기에 실측된 수질의 농도로써 3.8mg/l이 표시되고, 4/4분기에 실측된 수질의 농도로써 4mg/l이 표시된다.
실선과 파선이 만나는 교점은 변곡점으로 설정된다. 1차 추세 분석 시행 시 변곡점 5로 진행한다. 여기서, 변곡점 5는 5개 점 값을 분석 후 선형회귀 분석으로 전환하는 것을 의미한다.
이어, 실제 점분포와 변곡점 위치의 적합성을 검토하여 변곡점을 조절한다(단계 S650).
이어, 선형회귀와 신뢰구간을 이용하여 미래 수질 변화 예측을 수행한다(단계 S660). 미래 5년간 수질 변화 예측 구간은 상술된 수식 (7)의 선형회귀 및 추세의 신뢰구간을 이용한다. 여기서, 신뢰구간은 평균 수질농도가 위치할 가능성이 99% 이상인 범위로 선정하였으며, 향후 5년에 대한 수질 변화 예측을 수행한다.
변곡점 이후의 기울기 값을 도출하여 추세가 나타날 가능성이 높은 유역의 예측 추세(예를 들어, 상승, 유지, 하강 등)를 빠르게 판단할 수 있도록 한다.
도 13은 수질 추세 예측 결과를 예시적으로 나타낸 그래프들이다.
도 13을 참조하면, 시간에 따른 농도로 표현되는 수질 추세 그래프는 증가, 하강, 지속, 증가후 하강, 하강후 증가, 지속후 하강, 증가 후 지속, 하강후 지속, 지속적 증가 등의 형태로 표시된다. 이러한 그래프를 통해 상승추세 유역의 개수, 하강추세 유역의 개수, 유지 유역의 개수 등을 판별할 수 있다.
이러한 수질 추세 그래프를 통해 개별 업소 자료로는 얻을 수 없는 표준유역 전반의 추세 분석 결과를 획득할 수 있다. 또한 수질 추세 그래프를 통해 유역별 상승 심화인지, 상승 둔화인지, 추세 역전 등과 같은 다양한 추세를 확인할 수 있다.
본 발명에 따른 수질 추세 예측 결과는 마련 기준에 따라 홈페이지 시스템에 적용하여 행정 및 업소에서 식품용수 수질을 사전에 확인하고 관리 및 대처 방안을 마련할 수 있도록 제공될 수 있다.
또한 수질 추세 예측 모델을 식품용수 관리에 실제로 적용하기 위해 추세 결과를 해석하고 등급을 분류하는 과정으로서 후처리 과정이 추가될 수 있다.
추세 예측을 통한 수질 관리는 등급으로 분류하여 관리하는 것이 최선이며, 이를 위해서는 기준 설정이 중요하다. 본 실시예에서는 질산성질소의 먹는물 수질기준(MCL, Maximum Contaminant Level)인 10mg/L와 추세의 기울기 값에 따른 추세 방향을 고려하여 등급을 분류할 수 있다.
먼저, 추세 해석을 위해 10년간의 자료에서 최근 5년에 해당하는 분기별 중앙값이 MCL을 초과하는 경우는 나쁨(poor)으로, 그렇지 않은 경우 좋음(good)으로 구분하고, 이를 다시 문턱값(MCL의 75%)의 초과 또는 미만으로 구분할 수 있다. MCL 초과, MCL 75% 초과 및 MCL 75% 미만 각각에서 기울기(a) 값에 따라 상승추세(a>0.01), 유지추세(-0.01≤a≤0.01), 하강추세(a<-0.01)의 9가지로 구분할 수 있다. 이어, 수질 등급은 행정 실무자나 식품업소 등이 해당 유역의 수질을 빠르게 판단하고 조치하기 위해 관리의 중요도와 위험도에 따라 9가지 예측 추세를 긴급, 조치, 관찰, 안심의 4단계 등급으로 분류할 수 있다.
추세 해석 결과 최근 5년간 분기별 중앙값이 MCL을 초과하면서 증가추세인 경우 긴급등급(RED) 지역, MCL을 초과하지만 유지 추세거나 하강 추세인 경우 조치등급(ORANGE) 지역, 최근 5년간 분기별 중앙값이 MCL 기준 75%(문턱값)을 초과하면서 증가 추세인 경우 관찰등급(GREEN) 지역, 초과하지만 하강, 유지 추세거나 문턱값 미만인 모든 지역은 안심등급(BLUE) 지역으로 분류될 수 있다. 이를 정리하면 아래 표 2와 같다.
[표 2]
한편, 본 발명에 따른 수질 추세 예측은 정책적으로 활용될 수 있다. 즉, 지하수 수질예측 모델 마련 및 수질관리 정책가드라인을 수립할 수 있다. 또한 식품용수 수질 기준 초과 사전 조치 및 예방적 관리를 통한 국민 불안 감소시킬 수 있다. 또한 구축된 지하수 관리 시스템을 통한 지하수 사용 식품업소의 능동적, 선제적 관리를 수행할 수 있다. 또한 수질 예측 시스템을 통한 행정기관 유역 단위의 지하수 사용 식품용수 관리를 실현할 수 있다.
이상에서는 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
110 : 지점 좌표 생성부 120 : 적합 유역 선정부
130 : 1차 대상 유역 선정부 140 : 분석 대상 항목 선정부
150 : 지하수 수질 추세 예측부

Claims (13)

  1. 수질 검사 포인트마다 설치되어 지하수의 수질오염을 측정하는 다수의 센서장치를 통해 측정 데이터를 수집하여 지하수의 오염 상태를 분석하는 모니터링 서버에 의해 수행되는 식품용수 오염 예측 방법에서,
    (i) 지하수를 사용하는 지하수 사용 식품업소의 주소 좌표를 생성하는 단계;
    (ii) 수자원단위 및 집수구역단위의 유역도를 비교 검토하여 표준유역을 적합 유역 단위로 선정하는 단계;
    (iii) 표준유역내 유역별 포인트 수를 집계하여 1차 대상 유역을 선정하는 단계;
    (iv) 각 표준유역의 분기별 검사항목별 대푯값을 도출하고 추세 분석 대상 항목을 선정하는 단계; 및
    (v) 테일-센(Theil-Sen) 기울기 분석을 이용하여 관측기간 동안의 추세변화를 해석하여 미래의 수질 변화를 예측하는 단계를 포함하되,
    단계(i)는,
    (i-1) 전국의 지하수 사용 식품업소의 일정 기간 동안의 수질 검사 자료를 취합하는 단계;
    (i-2) 업체명, 주소, 소유주의 정보를 활용하여 주소정보를 정제하는 단계; 및
    (i-3) 생성된 주소정보에 대해 지오코딩툴을 활용하여 각 수질 검사 식품업소 위치 좌표를 생성하는 단계를 포함하고,
    단계(iii)는,
    (iii-1) GIS를 활용하여 포인트별 표준유역 코드를 부여하는 단계;
    (iii-2) 수소이온 값이 적합한지의 여부를 체크하는 단계;
    (iii-3) 상기 수소이온 값이 부적합인 것으로 체크되면, 해당 검사 전체를 분석에서 제외하는 단계; 및
    (iii-4) 상기 수소이온 값이 적합한 것으로 체크되나 단계 (iii-3)을 수행한 후, 유역별 검사 수가 일정 수 이상인 유역을 추출하여 1차 대상 유역을 선정하는 단계를 포함하고,
    상기 대푯값은 산술 평균, 기하 평균, 중앙값 및 표준편차 중 어느 하나를 포함하고,
    단계(iv)는,
    (iv-1) 수질 검사 포인트마다 부여받은 표준유역 코드를 이용하여 검사항목 측정값을 정리하는 단계;
    (iv-2) 각 검사항목의 분기별 대푯값을 도출하는 단계; 및
    (iv-3) 검사항목 중 값이 가장 많아 예측의 신뢰성이 높고 지하수 수질의 대표성 판단이 가능한 질산성질소를 추세 분석 대상으로 선정하는 단계를 포함하고,
    단계(v)는,
    (v-1) 관측자료 내 (여기서, I는 관측시간의 수)개 쌍 자료들의 기울기를 모두 구하는 단계; 및
    (v-2) 해당 기울기들의 중앙값(median)을 최종 추세선의 기울기( )로 결정하여 미래 수질 변화 예측을 수행하는 단계를 포함하고,
    단계(v-2)는,
    하기의 [수식 1] 및 [수식 2]의 최소절사제곱(Least Trimmed Squares, LTS) 방식을 적용하되,
    [수식 1]
    Figure 112023136957921-pat00042

    [수식 2]

    (N은 대표적인 데이터를 획득한 시간 간격의 수이고, 은 n번째 시간 간격이고, ω10과 ω11은 변곡점 이전의 추세를 설명하는 계수이며, ω20과 ω21은 변곡점 이후의 계수이다)
    상기 관측자료의 75%만 신뢰할 수 있는 것으로 가정하여 [수식 3]과 같이 가중치를 적용하고,
    [수식 3]

    (는 가장 작은 것부터 큰 것까지 정렬된 오차의 75% 순위에 해당하는 오차 값의 제곱을 나타낸다)
    상기 미래 수질 변화 예측은 [수식 4]를 적용하는 것을 특징으로 하는 식품용수 오염 예측 방법.
    [수식 4]
    Figure 112023136957921-pat00043

    (CI(t)는 t시간에서의 신뢰구간을 나타내며, μ(t)는 t시간에서의 수질 추정값을 나타내고, σc는 수질값의 표준편차를 나타내며, n은 자료의 개수를 나타내고, N은 대표적인 데이터를 획득한 시간 간격의 수를 나타내며, σt는 수질자료 측정시간의 분산을 나타낸다)
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
KR1020230014206A 2023-02-02 2023-02-02 식품용수 오염 예측 방법 및 그 시스템 KR102622449B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230014206A KR102622449B1 (ko) 2023-02-02 2023-02-02 식품용수 오염 예측 방법 및 그 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230014206A KR102622449B1 (ko) 2023-02-02 2023-02-02 식품용수 오염 예측 방법 및 그 시스템

Publications (1)

Publication Number Publication Date
KR102622449B1 true KR102622449B1 (ko) 2024-01-08

Family

ID=89533036

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230014206A KR102622449B1 (ko) 2023-02-02 2023-02-02 식품용수 오염 예측 방법 및 그 시스템

Country Status (1)

Country Link
KR (1) KR102622449B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101409440B1 (ko) 2012-11-27 2014-06-18 한국지질자원연구원 통계적 분석 방법을 이용한 지하수 수질 시계열 자료의 오염 등급 정량화 및 지하수 수질등급 평가방법
KR101625619B1 (ko) 2015-12-16 2016-05-31 오리온시스템즈 주식회사 웹 기반 스마트 수질원격감시 데이터 분석 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101409440B1 (ko) 2012-11-27 2014-06-18 한국지질자원연구원 통계적 분석 방법을 이용한 지하수 수질 시계열 자료의 오염 등급 정량화 및 지하수 수질등급 평가방법
KR101625619B1 (ko) 2015-12-16 2016-05-31 오리온시스템즈 주식회사 웹 기반 스마트 수질원격감시 데이터 분석 시스템

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
등록특허공보 제10-1409440호 (2014.06.18.)*
한국지하수토양환경학회지. 한국지하수토양환경학회. "가우시안 프로세스 회귀분석을 이용한 지하수 수질자료의 해석" (2016.12.31.)* *
한국지하수토양환경학회지. 한국지하수토양환경학회. "식품용수 수질자료를 이용한 지하수 오염 예측 모델 개발 및 소규모 유역에서의 검증" (2021.12.31.)* *

Similar Documents

Publication Publication Date Title
US11335179B1 (en) Water environment risk prediction and early warning method
Kuehne et al. Past, present, and future of ecological integrity assessment for fresh waters
Linkov et al. Use of multicriteria decision analysis to support weight of evidence evaluation
Leonardsson et al. Theoretical and practical aspects on benthic quality assessment according to the EU-Water Framework Directive–examples from Swedish waters
Kang et al. Data-driven water quality analysis and prediction: A survey
Kang et al. Multicriteria Evaluation of Water Resources Sustainability in the Context of Watershed Management 1
CN110674858A (zh) 一种基于时空关联与大数据挖掘的交通拥堵检测方法
Clarke et al. Effects of locally rare taxa on the precision and sensitivity of RIVPACS bioassessment of freshwaters
Danielson et al. An algal model for predicting attainment of tiered biological criteria of Maine's streams and rivers
Chatagnier et al. Scale and zonation effects on internal migration indicators in the United Kingdom
Osmani et al. Integrating fuzzy logic with Pearson correlation to optimize contaminant detection in water distribution system with uncertainty analyses
Sabia et al. Assessing the quality of biogeochemical coastal data: a step-wise procedure
CN114841518A (zh) 一种内河助航标志服役状态评价方法
Goovaerts How geostatistics can help you find lead and galvanized water service lines: The case of Flint, MI
KR102622449B1 (ko) 식품용수 오염 예측 방법 및 그 시스템
McKenna et al. Event detection from water quality time series
JP6010059B2 (ja) 設備メンテナンス負担評価方法および装置
Masud Rana et al. Contaminant spread forecasting and confirmatory sampling location identification in a water-distribution system
Zamenian et al. Systematic approach for asset management of urban water pipeline infrastructure systems
Rossouw A review of methods and generic criteria for determining impact significance
Koushki et al. Evaluation of reported and measured compositions of household solid waste in Kuwait
Chessman Predicting reference assemblages for freshwater bioassessment with limiting environmental difference analysis
Herlihy et al. An approach for evaluating the repeatability of rapid wetland assessment methods: the effects of training and experience
Levine Spatial autocorrelation statistics
Wong Segmented R2: A Proposed Variant for Unbalanced and Skewed Dataset

Legal Events

Date Code Title Description
AMND Amendment
AMND Amendment
AMND Amendment
E601 Decision to refuse application
E801 Decision on dismissal of amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant