KR20230144249A - How to construct an optimal water quality observation network - Google Patents

How to construct an optimal water quality observation network Download PDF

Info

Publication number
KR20230144249A
KR20230144249A KR1020220043296A KR20220043296A KR20230144249A KR 20230144249 A KR20230144249 A KR 20230144249A KR 1020220043296 A KR1020220043296 A KR 1020220043296A KR 20220043296 A KR20220043296 A KR 20220043296A KR 20230144249 A KR20230144249 A KR 20230144249A
Authority
KR
South Korea
Prior art keywords
water quality
observation
analysis
similarity
distance
Prior art date
Application number
KR1020220043296A
Other languages
Korean (ko)
Inventor
김민정
이설
강혜진
김현웅
이영주
박혜민
박재연
Original Assignee
(주)푸른환경
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)푸른환경 filed Critical (주)푸른환경
Priority to KR1020220043296A priority Critical patent/KR20230144249A/en
Publication of KR20230144249A publication Critical patent/KR20230144249A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Mathematical Analysis (AREA)
  • Educational Administration (AREA)
  • Analytical Chemistry (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Food Science & Technology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)

Abstract

본 발명은 최적 수질 관측망 구성에 관한 것으로, 수체의 수질을 측정 한 수질 데이터를 바탕으로 각 관측 지점별 수질경향을 분석하고 관측 지점 간 유사성을 계산하여, 수질관리를 위한 최적의 수질 관측망을 구성할 수 있도록 지원하기 위한 것이다. 이러한 본 발명은 대상 수체의 수질 데이터를 수집하는 수집 단계, 상기 수질 데이터의 각 항목들에 대한 주성분분석, 상관계수행렬, 다차원척도법 적용을 기반으로 하는 관측 지점별 수질 유사성 분석을 수행하는 유사성 분석 단계, 상기 유사성 분석 결과를 기반으로 계층적으로 분류하여 관측 지점의 개수 및 대표 관측 지점을 결정하는 결정 단계를 포함하는 최적 수질 관측망 구성 방법을 개시한다.The present invention relates to the construction of an optimal water quality observation network. Based on water quality data measuring the water quality of water bodies, water quality trends at each observation point are analyzed and similarity between observation points is calculated to construct an optimal water quality observation network for water quality management. This is to support you. The present invention includes a collection step of collecting water quality data of the target water body, and a similarity analysis step of performing water quality similarity analysis for each observation point based on the application of principal component analysis, correlation coefficient matrix, and multidimensional scaling method for each item of the water quality data. , discloses a method of configuring an optimal water quality observation network, which includes a decision step of determining the number of observation points and representative observation points by hierarchically classifying them based on the similarity analysis results.

Description

최적 수질 관측망 구성 방법{How to construct an optimal water quality observation network}{How to construct an optimal water quality observation network}

본 발명은 최적 수질 관측망 구성 방법에 관한것으로, 보다 상세하게는 수질 데이터를 바탕으로 각 관측 지점별 수질경향을 분석하고, 이를 활용하여 관측 지점 간 유사성을 계산하여, 수질관리를 위한 최적의 수질 관측망을 구성할 수 있도록 하는 방법에 관한 것이다.The present invention relates to a method of configuring an optimal water quality observation network. More specifically, the water quality trend at each observation point is analyzed based on water quality data, and the similarity between observation points is calculated using this to create an optimal water quality observation network for water quality management. It is about a method to configure .

1992년 리우환경회의 이후 국제사회는 환경적으로 지속가능한 개발을 달성하기 위해 각종 국제규범들을 통해 환경보전에 관한 의무를 강화하고 있으며, 세계 각국들은 환경보전을 위하혀 통합적 관리 및 지속가능한 개발을 정책목표로 하고 있다. Since the Rio Conference on the Environment in 1992, the international community has been strengthening environmental conservation obligations through various international norms to achieve environmentally sustainable development, and countries around the world have established policies for integrated management and sustainable development for environmental conservation. Aiming.

우리나라도 환경보전을 위한 국제적 흐름에 부응하여 환경오염의 예방을 위해 통합적 관리에 대한 계획을 수립하여 추진하고 있으며, 오염원인자에게 환경개선의 부담을 부여하여 지역의 무분별한 개발로 인한 오염 부하량의 증가를 예방하기 위해 전국 4대강에 대해 오염총량제등을 시행하고 있다. 그러나 급속한 토지이용의 변화로 짧은 시간 동안 일시에 배출되는 오염물질 부하량이 자연이 제공할 수 있는 자정능력을 크게 상회하기도 한다. 이 와 같은 현상은 전국 어디에서나 발생될 수 있으며 이에 대한 대책이 시급한 실정이다.In response to the international trend for environmental conservation, Korea is also establishing and promoting an integrated management plan to prevent environmental pollution, and preventing an increase in pollution load due to indiscriminate development of the region by placing the burden of environmental improvement on the polluter. To this end, a total pollution load system is being implemented for the four major rivers across the country. However, due to rapid changes in land use, the load of pollutants emitted at once over a short period of time may greatly exceed the self-cleaning capacity that nature can provide. This phenomenon can occur anywhere in the country, and countermeasures against it are urgently needed.

저수지나 호소는 중력에 의해 자연적으로 흐르는 하천과는 달리 오염물질이 대량 또는 장기간 유입되었을 경우 호내에 오염물질이 축적 보존되는 특징을 가지므로, 한번 기능을 상실한 저수지를 복원하는데 막대한 시간과 재 원이 소요된다. 이러한 문제점을 보완하기 위하여 최근에 와서 저수지 및 간척지호에 대한 수질정보 종합시스템의 개발 및 수질오염 모니터링을 위한 측정망의 확충 등과 같은 관리체계의 개선에 대한 노력이 활발히 진행되고 있다. 그러나 저수지 수질관리 등에 관한 조치는 아직도 대책수립과 개선방안 수준을 벗어나지 못하고 있으며, 실제로 저수지에서 더욱 중요한 유입 오염물에 의한 호내 반응과 같은 과학적인 문제해결 접근노력은 매우 소극적이다.Unlike rivers that naturally flow by gravity, reservoirs and lakes have the characteristic of accumulating and preserving pollutants within the lake when they are introduced in large quantities or for a long period of time. Therefore, it takes a huge amount of time and resources to restore a reservoir that has once lost its function. It takes. To make up for these problems, efforts have recently been made to improve the management system, such as the development of a comprehensive water quality information system for reservoirs and reclaimed lakes and the expansion of measurement networks for water pollution monitoring. However, measures related to reservoir water quality management have not yet gone beyond the level of establishing countermeasures and improvement plans, and in fact, efforts to approach scientific problem solving, such as the reaction within the lake caused by inflow contaminants, which are more important in reservoirs, are very passive.

한편 수질측정망은 전국 하천 및 호소 등 수질보전대상 공공수역에 대한 수질현황을 종합적으로 파악하여 수질 변화 추세를 파악하고 이미 집행된 주요 정책 사업의 효과를 분석하여 장래 수질보전정책수립을 위한 기초자료를 확보하기 위해서 운영된다. 그러나 국내에서 지금까지 운영되어온 수질측정망 구성은 과학적으로 수립된 측 정목적에 따른 체계적 설계방법에 기초한 것이라기 보다는 관리의 필요성 증대에 따라 관리자의 경험과 주관적 판단에 의해 이루어져 왔다. 따라서 현재 운영되고 있는 측정망은 수계관리를 위해 요구되는 다양한 수질정보를 생산한다는 점에서나 활용 필요성을 충족시키지 못한다는 문제를 내포한다고 볼 수 있다.Meanwhile, the water quality measurement network comprehensively understands the water quality status of public waters subject to water quality conservation, such as rivers and lakes across the country, identifies water quality change trends, analyzes the effects of major policy projects that have already been implemented, and provides basic data for establishing future water quality conservation policies. It is operated to secure. However, the construction of the water quality measurement network that has been operated so far in Korea has been made based on the experience and subjective judgment of managers as the need for management increases, rather than based on a systematic design method according to scientifically established measurement purposes. Therefore, it can be seen that the currently operating measurement network has a problem in that it does not meet the need for utilization or the production of various water quality information required for water system management.

더구나 수질은 조사하는 항목이 다양하고 오염원이 다양하며, 계절과 유량변화에 영향을 받게 된다. 따라서 수질 특성과 계절적 추이를 고려한 관측 지점 유사성을 평가하고 이를 활용한 관측 지점 개수결정 및 대표관측 지 점 선택을 통한 최적 수질 관측망을 형성하는 작업이 필요하다.Moreover, water quality has a variety of investigated items, diverse sources of pollution, and is affected by seasons and changes in flow rate. Therefore, it is necessary to form an optimal water quality observation network by evaluating the similarity of observation points considering water quality characteristics and seasonal trends, determining the number of observation points using this, and selecting representative observation points.

따라서 상술한 문제를 해결하기 위한 본 발명의 목적은 수체의 각 조사 지점에서 측정된 시계열 자료를 바탕으로 관측 지점 간 유사성을 계산하고 유사성이 높은 관측 지점을 계층적으로 분류하여 사용자가 요구하는 최적 수질 관측망을 용이하게 구성할 수 있도록 하는 방법을 제공하는 것이다.Therefore, the purpose of the present invention to solve the above-mentioned problem is to calculate the similarity between observation points based on time series data measured at each survey point of the water body and hierarchically classify observation points with high similarity to achieve the optimal water quality required by the user. The goal is to provide a method to easily configure an observation network.

본 발명의 일측면에 따르면 대상 수체의 수질 데이터를 수집하는 수집 단계; 상기 수질 데이터의 각 항목들에 대한 주성분분석, 상관계수행렬, 다차원 척도법 적용을 기반으로 하는 관측 지 점별 수질 유사성 분석을 수행하는 유사성 분석 단계; 상기 유사성 분석 결과를 기반으로 계층적으로 분류하여 관측 지점의 개수 및 대표 관측 지점을 결정하는 결정단계; 를 포함하고, 상기 수집된 수질 데이터에 포함된 대상 수체 각 지점별 자료에 대하여 선택된 변수의 상관분석, 시계열 그래프, 산점도를 포함하는 수질 변동 추세 분석을 수행하는 단계; 를 더 포함한다.According to one aspect of the present invention, a collection step of collecting water quality data of a target water body; A similarity analysis step of performing water quality similarity analysis for each observation point based on application of principal component analysis, correlation coefficient matrix, and multidimensional scaling method to each item of the water quality data; A decision step of hierarchically classifying based on the similarity analysis results to determine the number of observation points and representative observation points; Comprising: performing water quality fluctuation trend analysis including correlation analysis of selected variables, time series graph, and scatter plot for data for each point of the target water body included in the collected water quality data; It further includes.

상기 유사성 분석 단계는 상기 대상 수체의 수질을 축약한 주성분 점수의 유클리디안 거리나 상기 대상 수체의 수질 패턴의 시계열 변화를 고려하기 위하여 상관계수행렬 및 다차원 척도법 적용하여 얻은 좌표의 거리를 이용하여 수체의 유사성을 계산하는 단계이고, 상기 결정 단계는 상기 유사성 분석 결과를 계층적 군집 분석 방법으로 분류하고 덴드로그램 방식에 따라 적절한 군집의 개수를 결정하는 단계; 상기 결정된 군집의 중심점 산출을 통한 대표 관측 지점을 결정하는 단계; 를 더 포함한다.The similarity analysis step uses the Euclidean distance of the principal component score that abbreviates the water quality of the target water body or the distance of the coordinates obtained by applying the correlation coefficient matrix and multidimensional scaling method to consider time series changes in the water quality pattern of the target water body. A step of calculating similarity, wherein the determining step includes classifying the similarity analysis result using a hierarchical cluster analysis method and determining an appropriate number of clusters according to a dendrogram method; determining a representative observation point by calculating the center point of the determined cluster; It further includes.

상기 계층적 군집 분석 방법 적용 시 군집 분석 이후 군집 간 거리 최대화, 군집내 거리를 최소화하기 위하여 두 군집의 개체 거리 중 가장 가까운 것을 사용하는 단일 연결, 가장 먼 거리를 사용하는 완전 연결, 군집 간 개체들의 거리 평균을 이용하는 평균 연결, 군집 내 개체의 중심간 거리를 사용하는 중심 연결, 군집화 과정에서 발생하는 정보 희생을 최소화하는 방법으로 제안된 Wald 분산최소화연결 중 적어도 하나를 이용하는 단계; 를 더 포함한다.When applying the hierarchical cluster analysis method, in order to maximize the distance between clusters after cluster analysis, minimize the intra-cluster distance, single connection using the closest of the object distances of the two clusters, full connection using the farthest distance, and Using at least one of average linking using the distance average, central linking using the distance between the centers of objects in the cluster, and Wald variance minimization linking, which has been proposed as a method of minimizing information sacrifice that occurs during the clustering process; It further includes.

이상 살펴본 바와 같은 본 발명에 따르면 수집된 수질 데이터를 평가하여 각 관측 지점별 수질경향을 분석하고 관측 지점 간 유사성을 계산하여, 수질 관리를 위한 최적의 수질측정망 구성을 제공할 수 있다.According to the present invention as described above, it is possible to evaluate collected water quality data, analyze water quality trends at each observation point, and calculate similarity between observation points, thereby providing an optimal water quality measurement network configuration for water quality management.

도 1은 본 발명에 따른 최적 수질 관측망 구성 방법을 설명하기 위한 순서도.1 is a flowchart illustrating a method of configuring an optimal water quality observation network according to the present invention.

본 발명은 최적 수질 관측망 구성 방법을 제공한다.The present invention provides a method for configuring an optimal water quality observation network.

도 1은 본 발명에 따른 최적 수질 관측망 구성 방법을 설명하기 위한 도면이다.Figure 1 is a diagram for explaining a method of configuring an optimal water quality observation network according to the present invention.

본 발명의 최적 수질 관측망 구성 방법은 먼저 데이터 수집단계에서 관측망 선정 장치가 수체의 각 관측 지점에서의 수질 데이터를 수집한다. 여기서 상기 수질 데이터는 관측 지점 시계열 수질 데이터가 될 수 있다. 수질은 조사하는 항목이 다양하고 오염원이 다양하며, 계절과 유량변화에 영향을 받기 때문에 정확 한 관측 지점 산출을 위해서는 수질 특성과 계절적 추이를 함께 적용할 수 있는 수질 및 수리 수문 데이터 수집이 필요하다. 이를 위하여 해당 수체의 관측 지점에는 수질 특성과 계절적 추이를 함께 포함하는 수질 데이터를 수집할 수 있도록 구조물이 마련되거나, 조사되는 것이 바람직하다. In the method of configuring the optimal water quality observation network of the present invention, first, in the data collection stage, the observation network selection device collects water quality data from each observation point of the water body. Here, the water quality data may be observation point time series water quality data. Since water quality has a variety of investigated items, diverse sources of pollution, and is affected by seasons and flow changes, it is necessary to collect water quality and hydrological data that can apply both water quality characteristics and seasonal trends to calculate accurate observation points. For this purpose, it is desirable that a structure be prepared or investigated at the observation point of the relevant water body to collect water quality data including water quality characteristics and seasonal trends.

여기서 상기 수질 데이터는 수질과 관련된 다양한 측정 항목들에 대한 데이터를 포함할 수 있으며, 예를 들면 pH, 수온, 용존산소, 탁도, 전기전도도 등을 포함하는 항목들이 기본 항목이 될 수 있다. 또한 상기 수질 데이터는 해당 데이터 사용 목적 등에 따라 COD, TN, NO3-N, NH3-N, TP, PO4-P, SS, 투명도, chl-a 등 다양한 종류의 항목이 더 추가될 수 있다.Here, the water quality data may include data on various measurement items related to water quality. For example, basic items may include pH, water temperature, dissolved oxygen, turbidity, electrical conductivity, etc. In addition, various types of items such as COD, TN, NO3-N, NH3-N, TP, PO4-P, SS, transparency, chl-a, etc. may be added to the water quality data depending on the purpose of use of the data.

다음으로 유사성 계산 단계에서 관측망 선정 장치가 관측 지점 간 유사성을 계산한다. 이를 위하여 상기 관측망 선정 장치는 대상 수체의 각 지점별 자료에 대하여 선택된 변수의 시계열 그래프를 활용한 수질 변동 추세 분석을 수행한다. 그리고 상기 관측망 선정 장치는 상기 분석된 수질 변동 추세 분석 결과를 기반으로 주성분분석을 수행하여 주성분 점수를 산출하며, 각 수질 항목들에 대한 상관계수행렬 산출 및 다차원 척도분석의 적용하여 수행할 수 있다. Next, in the similarity calculation step, the observation network selection device calculates the similarity between observation points. To this end, the observation network selection device performs water quality change trend analysis using a time series graph of selected variables for data at each point of the target water body. In addition, the observation network selection device calculates a principal component score by performing principal component analysis based on the analyzed water quality change trend analysis results, and can be performed by calculating a correlation coefficient matrix for each water quality item and applying multidimensional scale analysis.

특히, 상기 관측망 선정 장치는 수질조사지점에 대한 관측치 즉 수질 데이터를 활용하여 수질패턴의 시계열 변화를 고려할 수 있는 방법으로 상관계수행렬과 다차원 척도분석을 활용하여 관측 지점 간 유사성을 계산한다.In particular, the observation network selection device calculates the similarity between observation points using a correlation coefficient matrix and multidimensional scale analysis in a way that can consider time series changes in water quality patterns using observations of water quality survey points, that is, water quality data.

이를 보다 상세히 설명하면, 먼저 관측망 선정 장치는 주성분 점수 산출을 위하여 관측 수질 데이터의 총합적 평균을 구하고 이를 이용하여 각 관측 지점의 주성분 점수를 계산한다. 관측 지점의 주성분 점수의 유클리디안 거리가 관측 지점 간 유사성이 될 수 있다. 주성분분석(principal component analysis)은 선형상관 관계가 있는 다수의 원변수들을 서로 독립이며 원변수의 선형결합인 주성분변수로 변환하여 원 데이터의 차수를 줄이는 다변량분석방법이다. To explain this in more detail, first, the observation network selection device calculates the overall average of the observed water quality data to calculate the main component score and uses this to calculate the main component score for each observation point. The Euclidean distance of the principal component scores of observation points can be the similarity between observation points. Principal component analysis is a multivariate analysis method that reduces the order of the original data by converting a number of linearly correlated raw variables into principal component variables that are independent of each other and are a linear combination of the original variables.

원변수의 공분산행렬로부터 고유치를 계산하고, 이에 대응하는 고유벡터를 선형계수로 하여 주 성분 변수를 얻는다. 축약되는 차원의 개수는 주성분 변수의 원변수의 변동 설명 누적 기여율 80%이상이거나 고유치가 1 이상인 주성분을 선택하여 결정한다.Eigenvalues are calculated from the covariance matrix of the original variables, and the main component variables are obtained using the corresponding eigenvectors as linear coefficients. The number of dimensions to be reduced is determined by selecting the main component whose cumulative contribution rate to explaining the change in the original variable is 80% or more or whose eigenvalue is 1 or more.

한편 측정 변수들의 측정 단위가 차이가 나는 경우 분산의 크기도 달라진다. 이로 인하여 측정 단위가 큰 변수에 대한 분산, 공분산이 커지므로 본 발명의 관측망 선정 장치는 공분산행렬에서 각 변수의 분산의 변동을 나누어 준 상관 계수 행렬로부터 고유치 및 고유 벡터를 구하여 이를 이용하여 주성분을 구할 수 있다.On the other hand, if the measurement units of the measured variables are different, the size of the variance also changes. As a result, the variance and covariance for variables with large measurement units increase, so the observation network selection device of the present invention obtains eigenvalues and eigenvectors from a correlation coefficient matrix dividing the variance of each variable in the covariance matrix and uses them to obtain the main component. You can.

한편 측정 변수들의 측정 단위가 차이가 나는 경우 분산의 크기도 달라진다. 이로 인하여 측정 단위가 큰 변수에 대한 분산, 공분산이 커지므로 본 발명의 관측망 선정 장치는 공분산행렬에서 각 변수의 분산의 변동을 나누어 준 상관 계수 행렬로부터 고유치 및 고유 벡터를 구하여 이를 이용하여 주성분을 구할 수 있다.On the other hand, if the measurement units of the measured variables are different, the size of the variance also changes. As a result, the variance and covariance for variables with large measurement units increase, so the observation network selection device of the present invention obtains eigenvalues and eigenvectors from a correlation coefficient matrix dividing the variance of each variable in the covariance matrix and uses them to obtain the main component. You can.

계산된 유사성을 이용하여 그룹화 단계에서 유사 관측 지점 그룹화 과정을 수행한다. 이때 상기 관측망 선정 장치는 유사성에 의한 개체분류를 위해 관심변수들에 의해 개체 간 유사성을 측정하 고 이를 이용하여 유사한 개체를 분류하는 방법으로 군집 분석(clustering analysis)을 적용한다.A similar observation point grouping process is performed in the grouping step using the calculated similarity. At this time, the observation network selection device measures the similarity between objects based on variables of interest in order to classify objects based on similarity, and uses this to apply clustering analysis to classify similar objects.

상기 군집 분석(cluster analysis)은 주어진 데이터의 구조에 의해 유사성이 높은 개체 순으로 개체를 묶어가는 계층적(hierarchical) 방법과 일정수준의 유사성을 기준으로 개체를 묶거나 사전에 결정된 군집의 개수에 의해 개체를 분류하는 비계층적 (non-hierarchical) 방법이 있다. 계층적 군집 분석 방법은 사용이 용이하나 개체가 일단 어느 군집에 소속되면 다른 군집으로 이동될 수 없고 이상 개체는 제거되지 않고 반드시 어느 군집에 속하게 된다. 비계층적 군집 분석은 일정한 군집 수준을 보장하나 사전에 군집 수를 결정해야 사용이 가능하다. 그러므로 군집 분석의 일반적인 순서는 계층적 군집 분석 방법에 의해 적절한 군집 개수를 결정할 수 있다.The cluster analysis is a hierarchical method that groups objects in order of high similarity according to the structure of the given data, and groups objects based on a certain level of similarity or by the number of clusters determined in advance. There is a non-hierarchical way to classify entities. The hierarchical cluster analysis method is easy to use, but once an object belongs to a cluster, it cannot be moved to another cluster, and abnormal objects are not removed but must belong to a certain cluster. Non-hierarchical cluster analysis guarantees a certain level of clustering, but can only be used if the number of clusters is determined in advance. Therefore, the general order of cluster analysis is to determine the appropriate number of clusters by using the hierarchical cluster analysis method.

유사성이 높은 순서대로 묶어가는 계층적 군집 분석 방법의 경우 개체와 군집, 군집 간 거리를 계산해야 하는데 이를 연결(linkage)방법이라 한다. 상기 연결 방법에는 두 군집의 개체 거리 중 가장 가까운 것을 사용하는 단일(single)연결, 가장 먼 거리를 사용하는 완전(complete)연결, 군집 간 개체들의 거리 평균(중위수)을 이용하는 평균(중위수 average, median)연결, 군집 내 개체의 중심간 거리를 사용하는 중심(centroid)연결, 그리고 군집화 과정에서 발생하는 정보 희생(loss of information)을 최소화하는 방법으로 제안된 Wald 분산최소 화연결 방법이 있다(Johnson et. al., 2007). 적합한 연결방법은 계층적 군집분석 결과로 얻어지는 덴드로그램에 의해 판단하게 된다. 본 관측망 선정 장치에서는 사용 빈도가 가장 높은 평균 연결방법을 디폴트로 적용하였 지만, 이는 향후 장치 이용자가 연결방법을 선택할 수 있는 옵션도 설정할 수 있도록 업그레이드할 수 있다.In the case of a hierarchical cluster analysis method that groups groups in order of highest similarity, the distance between objects and clusters must be calculated, which is called the linkage method. The above connection methods include single connection using the closest of the distances of the objects in the two clusters, complete connection using the farthest distance, and average (median) using the average distance (median) of the objects between the clusters. ) connection, centroid connection using the distance between the centroids of objects in the cluster, and the Wald variance minimization connection method proposed as a method to minimize the loss of information that occurs during the clustering process (Johnson et al. . al., 2007). The appropriate connection method is determined by the dendrogram obtained as a result of hierarchical cluster analysis. In this observation network selection device, the most frequently used average connection method was applied as default, but this can be upgraded to allow device users to set options to select the connection method in the future.

Claims (3)

대상 수체의 수질 데이터를 수집하는 수집 단계;
상기 수질 데이터의 각 항목들에 대한 주성분분석, 상관계수행렬, 다차원 척도법 적용을 기반으로 하는 관측 지 점별 수질 유사성 분석을 수행하는 유사성 분석 단계;
상기 유사성 분석 결과를 기반으로 계층적으로 분류하여 관측 지점의 개수 및 대표 관측 지점을 결정하는 결정단계; 를 포함하고
상기 수집된 수질 데이터에 포함된 대상 수체 각 지점별 자료에 대하여 선택된 변수의 상관분석, 시계열 그래프, 산점도를 포함하는 수질 변동 추세 분석을 수행하는 단계; 를 더 포함하는 것을 특징으로 최적 수질 관측망 구성 방법.
A collection step of collecting water quality data of the target water body;
A similarity analysis step of performing water quality similarity analysis for each observation point based on application of principal component analysis, correlation coefficient matrix, and multidimensional scaling method to each item of the water quality data;
A decision step of hierarchically classifying based on the similarity analysis results to determine the number of observation points and representative observation points; includes
Performing water quality change trend analysis including correlation analysis of selected variables, time series graph, and scatter plot for data for each point of the target water body included in the collected water quality data; A method of configuring an optimal water quality observation network, further comprising:
제 1항에 있어서,
상기 유사성 분석 단계는 상기 대상 수체의 수질을 축약한 주성분 점수의 유클리디안 거리나 상기 대상 수체의 수질 패턴의 시계열 변화를 고려하기 위하여 상관계수행렬 및 다차원 척도법 적용하여 얻은 좌표의 거리를 이용하여 수체의 유사성을 계산하는 단계이고,
상기 결정 단계는 상기 유사성 분석 결과를 계층적 군집 분석 방법으로 분류하고 덴드로그램 방식에 따라 적절한 군집의 개수를 결정하는 단계; 상기 결정된 군집의 중심점 산출을 통한 대표 관측 지점을 결정하는 단계; 를 더 포함하는 것을 특징으로 하는 최적 수질 관측망 구성 방법.
According to clause 1,
The similarity analysis step uses the Euclidean distance of the principal component score that abbreviates the water quality of the target water body or the distance of the coordinates obtained by applying the correlation coefficient matrix and multidimensional scaling method to consider time series changes in the water quality pattern of the target water body. This is the step of calculating the similarity of
The determining step includes classifying the similarity analysis result using a hierarchical cluster analysis method and determining an appropriate number of clusters according to a dendrogram method; determining a representative observation point by calculating the center point of the determined cluster; A method of configuring an optimal water quality observation network further comprising:
제 2항에 있어서,
상기 계층적 군집 분석 방법 적용 시 군집 분석 이후 군집 간 거리 최대화, 군집내 거리를 최소화하기 위하여 두 군집의 개체 거리 중 가장 가까운 것을 사용하는 단일 연결, 가장 먼 거리를 사용하는 완전 연결, 군집 간 개체들의 거리 평균을 이용하는 평균 연결, 군집 내 개체의 중심간 거리를 사용하는 중심 연결, 군집화 과정에서 발생하는 정보 희생을 최소화하는 방법으로 제안된 Wald 분산최소화연결 중 적어도 하나를 이용하는 단계; 를 더 포함하는 것을 특징으로 하는 최적 수질 관측망 구성 방법.
According to clause 2,
When applying the hierarchical cluster analysis method, in order to maximize the distance between clusters after cluster analysis, minimize the intra-cluster distance, single connection using the closest of the object distances of the two clusters, full connection using the farthest distance, and Using at least one of average linking using the distance average, central linking using the distance between the centers of objects in the cluster, and Wald variance minimization linking, which has been proposed as a method of minimizing information sacrifice occurring in the clustering process; A method of configuring an optimal water quality observation network further comprising:
KR1020220043296A 2022-04-07 2022-04-07 How to construct an optimal water quality observation network KR20230144249A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220043296A KR20230144249A (en) 2022-04-07 2022-04-07 How to construct an optimal water quality observation network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220043296A KR20230144249A (en) 2022-04-07 2022-04-07 How to construct an optimal water quality observation network

Publications (1)

Publication Number Publication Date
KR20230144249A true KR20230144249A (en) 2023-10-16

Family

ID=88506475

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220043296A KR20230144249A (en) 2022-04-07 2022-04-07 How to construct an optimal water quality observation network

Country Status (1)

Country Link
KR (1) KR20230144249A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118191257A (en) * 2024-05-17 2024-06-14 乐百氏(广东)饮用水有限公司 On-line monitoring method, system and storage medium for water quality of drinking water source

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118191257A (en) * 2024-05-17 2024-06-14 乐百氏(广东)饮用水有限公司 On-line monitoring method, system and storage medium for water quality of drinking water source

Similar Documents

Publication Publication Date Title
CN110929956B (en) Flood forecasting scheme real-time optimization method based on machine learning
WO2022135265A1 (en) Failure warning and analysis method for reservoir dispatching rules under effects of climate change
Di Prinzio et al. Data-driven catchment classification: application to the pub problem
Li et al. A new flood forecasting model based on SVM and boosting learning algorithms
CN104809658B (en) A kind of rapid analysis method of low-voltage distribution network taiwan area line loss
CN109063730A (en) A kind of convex programming cluster water pollution source tracing method
CN116070886B (en) Multidimensional adaptive regulation and control method and system for water resource system
CN116976529B (en) Cross-river-basin water diversion method and system based on supply-demand prediction dynamic correction
CN110135708A (en) Ball valve quality multi-step Fuzzy Comprehensive Evaluation based on AHP and comentropy
CN110047015A (en) A kind of water total amount prediction technique merging KPCA and thinking Optimized BP Neural Network
Nourani et al. Classification of groundwater level data using SOM to develop ANN-based forecasting model
KR20230144249A (en) How to construct an optimal water quality observation network
CN110728409A (en) Flood process type similarity mining and rapid prediction method
CN110299192A (en) A kind of environmental suitability evaluation method of firearm components and its composite material, high molecular material
Ji et al. Urban flood resilience assessment using RAGA-PP and KL-TOPSIS model based on PSR framework: A case study of Jiangsu province, China
Huo et al. Evaluation method of multiobjective functions’ combination and its application in hydrological model evaluation
CN109190709A (en) A method of for the selection feature of pollutant prediction
CN117078114B (en) Water quality evaluation method and system for water-bearing lakes under influence of diversion engineering
CN117808214A (en) Hydraulic engineering data analysis system
CN114239962A (en) Refined space load prediction method based on open source information
CN111914488B (en) Data area hydrologic parameter calibration method based on antagonistic neural network
Ahani et al. Assessment of some combinations of hard and fuzzy clustering techniques for regionalisation of catchments in Sefidroud basin
CN112906762A (en) Method and system for defining and identifying critical state of water resource system
Candelieri et al. Improving analytics in urban water management: A spectral clustering-based approach for leakage localization
CN115358587A (en) Regional multi-department collaborative infrastructure planning method and system