WO2020189706A1 - クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム - Google Patents

クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム Download PDF

Info

Publication number
WO2020189706A1
WO2020189706A1 PCT/JP2020/011917 JP2020011917W WO2020189706A1 WO 2020189706 A1 WO2020189706 A1 WO 2020189706A1 JP 2020011917 W JP2020011917 W JP 2020011917W WO 2020189706 A1 WO2020189706 A1 WO 2020189706A1
Authority
WO
WIPO (PCT)
Prior art keywords
clusters
raw water
value indicating
value
indicating
Prior art date
Application number
PCT/JP2020/011917
Other languages
English (en)
French (fr)
Inventor
佳秀 太田
北村 慎吾
和典 戸田
Original Assignee
株式会社日立産業制御ソリューションズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立産業制御ソリューションズ filed Critical 株式会社日立産業制御ソリューションズ
Priority to CN202080018786.3A priority Critical patent/CN113557538A/zh
Publication of WO2020189706A1 publication Critical patent/WO2020189706A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Definitions

  • the present invention relates to a cluster division evaluation device, a cluster division evaluation method, and a cluster division evaluation program.
  • a coagulant is injected into the raw water obtained from rivers, etc. to coagulate the pollutants contained in the raw water. Aggregated pollutants are precipitated or filtered.
  • the amount of flocculant to be injected varies depending on the values indicating the properties of the raw water (turbidity, temperature, hydrogen ion concentration, etc.). Therefore, it is necessary to predict the amount of flocculant to be injected based on the properties of raw water.
  • Recently, not only water purification plants, but also technologies for predicting various numerical values necessary for creating an operation plan for social infrastructure using a prediction model have become widespread. Then, for more accurate prediction, a technique of selecting an explanatory variable that best explains the objective variable of the operation plan is also widespread.
  • the characteristic value predictor of Patent Document 1 creates a combination of one variable, a combination of two variables, a combination of three variables, ..., A combination of n variables from n candidates for explanatory variables. To do. The total number of these combinations is n C 1 + n C 2 + n C 3 + ... + n C n .
  • the prediction device creates a prediction model using the measured values of the explanatory variables belonging to each combination and the measured values of the objective variable at that time. Then, the prediction device obtains the difference (error) between the predicted value of the objective variable output by the prediction model and the measured value, and sets the logarithm of the distribution of the error with a negative sign as the "reference value".
  • the prediction device calculates reference values in order from the combination with the smallest number of explanatory variables. Then, as the number of explanatory variables increases, the reference value rises.
  • the prediction device sets the combination immediately before the degree of increase becomes smaller than a predetermined threshold value as the combination of explanatory variables for predicting the objective variable.
  • an object of the present invention is to divide a multidimensional space of variables so that a plurality of highly accurate prediction models can be used according to operating conditions.
  • the cluster division evaluation device of the present invention includes an actual measurement value acquisition unit that acquires an actual measurement value indicating the properties of raw water acquired by a water purification plant and an actual measurement value indicating the amount of a drug injected into the raw water, and a raw water.
  • an actual measurement value acquisition unit that acquires an actual measurement value indicating the properties of raw water acquired by a water purification plant and an actual measurement value indicating the amount of a drug injected into the raw water, and a raw water.
  • the parameters of the prediction model with the value indicating the properties of raw water as the explanatory variable and the value indicating the amount of drug as the objective variable are optimized for each of multiple clusters, and the amount of drug output by the prediction model with optimized parameters is calculated.
  • regression analysis unit that evaluates the difference between the predicted value of the indicated value and the measured value indicating the amount of the drug for each number of clusters and determines the number of clusters based on the evaluation result. It is a feature. Other means will be described in the form for carrying out the invention.
  • the multidimensional space of variables can be divided so that a plurality of highly accurate prediction models can be used according to operating conditions.
  • the present embodiment is an example of injecting a flocculant into raw water at a water purification plant.
  • the present invention can also be applied to an example of injecting a drug other than a coagulant (coagulation aid, oxidizing agent, adsorbent, disinfectant, etc.) into raw water.
  • the present invention is more generally applicable to the analysis of the quantitative relationship between the nature of an event and the outcome after the event has changed.
  • the configuration of the cluster division evaluation device 1 and the like will be described with reference to FIG.
  • the cluster division evaluation device 1 is a general computer and includes a central control device 11, an input device 12 such as a mouse and a keyboard, an output device 13 such as a display, a main storage device 14, an auxiliary storage device 15, and a communication device 16. .. These are connected to each other by a bus.
  • the auxiliary storage device 15 stores the prediction model 31, the measured value information 32, the cluster information 33, and the error information 34 (details will be described later).
  • the actual measurement value acquisition unit 21, the clustering unit 22, the regression analysis unit 23, and the display processing unit 24 in the main storage device 14 are programs.
  • the central control device 11 reads these programs from the auxiliary storage device 15 and loads them into the main storage device 14, thereby realizing the functions of the respective programs (details will be described later).
  • the auxiliary storage device 15 may have a configuration independent of the cluster division evaluation device 1.
  • the water purification plant 3 has a mixing pond 4, a flocculant injection device 5, and a floc forming pond 7.
  • the raw water 6a acquired from the natural environment such as a river flows into the mixing pond 4.
  • the coagulant injection device 5 injects the coagulant 9 into the raw water 6a stored in the mixing pond.
  • the raw water 6a into which the flocculant 9 has been injected is rapidly stirred and then flows into the floc forming pond 7 as mixed water 6b.
  • the mixed water 6b stored in the flock forming pond 7 is slowly agitated. Then, the colloidal pollutants begin to aggregate.
  • the agglomerated pollutants are then precipitated or filtered.
  • the substance (drug) generally used as the flocculant 9 is aluminum sulfate, polyaluminum chloride, or the like.
  • the pollutants in the raw water are negatively charged and repel each other.
  • the coagulant 9 neutralizes the charge, the pollutants attract each other by intermolecular force and grow large to become flocs.
  • Turbidity exists as a physical quantity that indicates the degree of pollution of raw water.
  • Turbidity is the mass (mg) of pollutants per liter of raw water.
  • the coagulant injection rate is the mass (mg / liter) of the coagulant injected per liter of raw water.
  • the turbidity meter 8a, the pH meter 8b, and the thermometer 8c are arranged in the mixing pond 4, and the injection amount meter 8d is arranged in the coagulant injection device 5. These are connected to the cluster division evaluation device 1 via the network 2.
  • the prediction model 31 of the present embodiment is a linear equation such as the following equation 1.
  • y a 0 + a 1 x 1 + a 2 x 2 + a 3 x 3 (Equation 1)
  • Equation 1 is a function with x 1 , x 2 and x 3 as explanatory variables and y as the objective variable. Then, by changing the values of a 0 , a 1 , a 2 and a 3 in various ways, the shape and the position of the prediction model 31 in the four-dimensional space are changed in various ways.
  • the number (type) of variables is set to "4", which is just an example. The number of variables may be larger, that is, the dimensions of the prediction model may be larger.
  • the cluster division evaluation device 1 uses a combination of actually measured values to minimize a combination of parameters “[a 0 , a 1 , a 2 , a 3 ” that minimizes the sum of squares “ ⁇ (YY) 2 ” of the error. ] ”Is determined (details below).
  • FIG. 2 is an example of the measured value information 32.
  • the measured value of the objective variable is stored in the objective variable column 102 and the measured value of the explanatory variable is stored in the explanatory variable column 103 in association with the time stored in the time column 101.
  • the time in the time column 101 is the time when the measured value of the explanatory variable and the measured value of the objective variable are acquired by the turbidity meter 8a, the pH meter 8b, the thermometer 8c, and the injection volume meter 8d.
  • the time t1, t2, t3, ... Indicates the time abbreviated. The larger the number, the later the time.
  • the actual measurement value of the objective variable in the objective variable column 102 is the actual measurement value of the coagulant injection rate measured by the injection amount meter 8d. “#” Indicates a different value abbreviated (the same applies hereinafter).
  • the measured values of the explanatory variables in the explanatory variable column 103 were measured by the turbidity of the raw water measured by the turbidity meter 8a (column 103a), the hydrogen ion concentration of the raw water measured by the pH meter 8b (column 103b), and the thermometer 8c. The temperature of raw water (column 103c).
  • Clustering Grouping many points drawn in a multidimensional space by those that are close to each other is generally called “clustering”.
  • clustering As a clustering method, the "k-means method” is well known.
  • the cluster division evaluation device 1 also uses the k-means method as described in (1) to (5) below.
  • the cluster division evaluation device 1 appropriately assigns each of the plurality of points to any of the k groups.
  • FIG. 3 is an example of cluster information 33.
  • the actual measurement value of the objective variable is in the objective variable column 112
  • the actual measurement value of the explanatory variable is in the explanatory variable column 113
  • the actual measurement value of the explanatory variable is in the belonging cluster ID column 114 in relation to the time stored in the time column 111.
  • the time in the time field 111 is the same as the time in FIG.
  • the actually measured value of the objective variable in the objective variable column 112 is the same as the actually measured value of the objective variable of FIG.
  • the measured value of the explanatory variable in the explanatory variable column 113 is the turbidity of the raw water (column 103a) among the measured values of the explanatory variable in FIG.
  • the explanatory variable in FIG. 3 is only "turbidity".
  • the affiliation cluster ID column 114 is divided into a cluster number 1 column 114a, a cluster number 2 column 114b, a cluster number 3 column 114c, a cluster number 4 column 114d, and so on, according to the number of clusters.
  • the cluster ID is stored in each of the separated columns.
  • the cluster ID is an identifier that uniquely identifies the cluster.
  • Each cluster corresponds to operating conditions such as four seasons and weather. In general, the water purification plant determines various numerical values (operation patterns) including the coagulant injection rate according to the operating conditions. Even if the points to which they belong are the same as in "c3" and "c10", different cluster IDs are assigned if the number of clusters is different ( Dk is recalculated). Because).
  • FIG. 4 to 7 are diagrams for explaining the relationship between the cluster and the prediction model 31.
  • FIG. 4 corresponds to the number of clusters 1 column 114a in FIG.
  • the horizontal axis of the coordinate plane of FIG. 4 is the explanatory variable (turbidity), and the vertical axis is the objective variable (aggregator injection rate).
  • Twenty points ⁇ corresponding to the times t1 to t20 are drawn on the coordinate plane (the same applies to FIGS. 5 to 7).
  • the circle c1 represents the cluster c1.
  • the straight line 31a represents the prediction model 31 (FIG. 1). The method of creating the prediction model will be described later.
  • FIG. 5 corresponds to the number of clusters column 2 114b in FIG.
  • the circle c2 represents the cluster c2.
  • the circle c3 represents the cluster c3.
  • the straight line 31b represents the prediction model 31 (FIG. 1).
  • the straight line 31c also represents the prediction model 31 (FIG. 1).
  • FIG. 6 corresponds to the number of clusters 3 column 114c in FIG.
  • FIG. 7 corresponds to the number of clusters in column 114d in FIG.
  • the description of FIGS. 6 and 7 is based on the description of FIG. In FIGS. 4 to 7, the center of the circle c1 or the like is not the center of gravity of the cluster c1 or the like (the average of the coordinate values of all the points ⁇ ) due to the restrictions on drawing.
  • the cluster division evaluation device 1 creates a prediction model for each cluster by using only the actually measured values ⁇ belonging to the cluster.
  • Clustering evaluation apparatus 1 substitutes random manner the values of the parameters a 0 and a 1 which is generated in a 0 and a 1 of the prediction model. (12) The cluster division evaluation device 1 substitutes the actually measured value X into x 1 of the prediction model and calculates y. (13) The cluster division evaluation device 1 calculates an error “YY”. (14) The cluster division evaluation device 1 changes the values of [X, Y] for each time and repeats the processes (12) and (13).
  • the cluster division evaluation device 1 calculates " ⁇ (Y-y) 2 " which is the sum of "(Y-y) 2 " at each time. (16) The cluster division evaluation device 1 substitutes the other values of the parameters a 0 and a 1 randomly generated into the prediction models a 0 and a 1, and then substitutes the values (12) to (15). Is repeated a sufficiently large number of times. (17) The cluster division evaluation device 1 determines the values of the parameters a 0S and a 1S that minimize “ ⁇ (YY) 2 ”. Here, "S” indicates that it is "optimized”.
  • FIG. 8 is a diagram illustrating an error.
  • the horizontal axis of the coordinate plane of FIG. 8 is turbidity, and the vertical axis is the coagulant injection rate.
  • the 20 points ⁇ indicate the combination [X, Y] of the measured values in FIG.
  • An error "YY" is defined for each of the points ⁇ . As mentioned above, “ ⁇ (Y-y) 2 " is minimized, but when paying attention to each point ⁇ , there are some with almost no error and some with relatively large error. There is.
  • FIG. 9 is an example of the error information 34.
  • an error is stored in the error column 122 and an error evaluation value is stored in the error evaluation value column 123 in association with the number of clusters stored in the cluster number column 121.
  • the number of clusters in the number of clusters column 121 is the number of clusters.
  • the error in the error column 122 is “ ⁇ ( ⁇ (YY) 2 / n)”.
  • n is the number of points ⁇ in the cluster.
  • “ ⁇ ( ⁇ (YY) 2 / n)” is the square root of the average of the sum of squares of the errors in FIG.
  • the cluster ID is described in parentheses attached to "#".
  • the error evaluation value in the error evaluation value column 123 is an arbitrary value obtained by processing the error, and the smaller the value, the higher the evaluation for the number of clusters.
  • the error evaluation value is, for example, the average of the errors included in the record (row) of the error information 34, the minimum value of the error, the variance of the error, and the like. Depending on how the error evaluation value is defined, the larger the value, the higher the evaluation for the number of clusters.
  • FIG. 10 is a flowchart of the processing procedure.
  • the actually measured value information 32 (FIG. 2) is stored in the auxiliary storage device 15 in a completed state.
  • the actual measurement value acquisition unit 21 of the cluster division evaluation device 1 acquires the actual measurement value. Specifically, the actually measured value acquisition unit 21 acquires the actually measured value information 32 (FIG. 2) from the auxiliary storage device 15.
  • step S202 the clustering unit 22 of the cluster division evaluation device 1 receives the variable. Specifically, the clustering unit 22 accepts the user to select a part or all of the plurality of explanatory variables via the input device 12. For example, the value a 1 of the parameters of turbidity of the user description variable is largest will likely of all the parameters except a 0, i.e., turbidity is likely the largest influence on the objective variable If expected, the user may select "turbidity". Here, it is assumed that the user selects "turbidity".
  • the clustering unit 22 receives the maximum value of the number of clusters and the like. Specifically, the clustering unit 22 selects the minimum and maximum values of the number of clusters and the minimum value of the points ⁇ (the number of records of the cluster information 33) included in one cluster via the input device 12. Accept to do. Here, it is assumed that the user inputs "1" as the minimum value of the number of clusters, "4" as the maximum value of the number of clusters, and "4" as the minimum value of the points ⁇ included in one cluster.
  • step S205 the clustering unit 22 creates cluster information 33 (FIG. 3). Specifically, the clustering unit 22 creates cluster information 33 based on the result of clustering in the “second” step S204.
  • step S206 the regression analysis unit 23 of the cluster division evaluation device 1 creates the prediction model 31.
  • the regression analysis unit 23 accepts the user to describe the mathematical formula of the prediction model on the screen, or displays the template of the general prediction model on the screen and accepts the user to select.
  • the prediction model 31 created here does not have to be a linear equation as in Equation 1 described above, and may be a higher-order equation or a non-linear equation including an exponent, a logarithm, and the like. .. However, it is assumed that the prediction model 31 includes parameters (values are unknown at this stage) for each variable received in step S202.
  • step S207 the regression analysis unit 23 optimizes the parameters for each cluster. Specifically, the regression analysis unit 23 determines the parameters of the prediction model for each cluster by the method described above. That is, the regression analysis unit 23 uses the measured values of the measured value information 32 (FIG. 3) at times t1 to t20 that belong to the cluster to be processed, and minimizes “ ⁇ (YY) 2 ”. Determine the parameters to be used.
  • the regression analysis unit 23 uses the measured values of the measured value information 32 (FIG. 3) at times t1 to t20 that belong to the cluster to be processed, and minimizes “ ⁇ (YY) 2 ”. Determine the parameters to be used.
  • step S208 the regression analysis unit 23 creates the error information 34 (FIG. 9). Specifically, first, the regression analysis unit 23 creates the error information 34. The error information 34 created here has four records, and "1", “2", “3”, and "4" are stored in the cluster number column 121. The error column 122 and the error evaluation value column 123 are blank. Second, the regression analysis unit 23 calculates the error “ ⁇ ( ⁇ (Y-y) 2 / n)" using the minimum “ ⁇ (Y-y) 2 " in step S207. It is stored in the error column 122. Third, the regression analysis unit 23 calculates an error evaluation value based on the error of each record and stores it in the error evaluation value column 123.
  • step S209 the regression analysis unit 23 determines the number of clusters based on the error evaluation value.
  • the regression analysis unit 23 determines the number of clusters of records having the minimum error evaluation value.
  • the cluster c7 corresponds to the time points t1 to t4 in FIG. Time points t1 to t4 are, for example, a specific season of the previous year (for example, fine weather continues).
  • the regression analysis unit 23 uses the prediction model 31 g when predicting the flocculant injection rate on the same day of the same month of the following year.
  • the cluster c10 corresponds to the time points t17 to t20 in FIG. Time points t17 to t20 are, for example, some other specific season of the previous year (such as the rainy season continuing).
  • the regression analysis unit 23 uses the prediction model 31j when predicting the coagulant injection rate on the same day of the same month of the following year. The same applies to other clusters.
  • the clustering unit 22 clusters for all the clusters, and the regression analysis unit 23 calculates the error evaluation value for all the clusters (brute force processing).
  • the clustering unit 22 and the regression analysis unit 23 repeat the process until the error evaluation value reaches a predetermined threshold value (target) or the amount of decrease in the error evaluation value from the previous time becomes equal to or less than the predetermined threshold value.
  • the effects of the cluster division evaluation device of this embodiment are as follows. (1) The cluster division evaluation device can create a highly accurate prediction model for each operating condition. (2) The cluster division evaluation device can display the expected error evaluation value and the number of clusters corresponding to the operating conditions. (3) The cluster division evaluation device enables the user to specify the number and size of clusters. (4) The cluster division evaluation device can be applied to predict the coagulant injection rate in a water purification plant.
  • the present invention is not limited to the above-described embodiment, and includes various modifications.
  • the above-described embodiment has been described in detail in order to explain the present invention in an easy-to-understand manner, and is not necessarily limited to the one including all the configurations described.
  • it is possible to replace a part of the configuration of one embodiment with the configuration of another embodiment and it is also possible to add the configuration of another embodiment to the configuration of one embodiment.
  • each of the above configurations, functions, processing units, processing means and the like may be realized by hardware by designing a part or all of them by, for example, an integrated circuit. Further, each of the above configurations, functions, and the like may be realized by software by the processor interpreting and executing a program that realizes each function. Information such as programs, tables, and files that realize each function can be placed in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.
  • the control lines and information lines are shown as necessary for explanation, and not all control lines and information lines are shown in the product. In practice, it can be considered that almost all configurations are interconnected.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Operations Research (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Water Supply & Treatment (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Separation Of Suspended Particles By Flocculating Agents (AREA)

Abstract

本発明のクラスタ分割評価装置(1)は、浄水場が取得する原水の性質を示す値の実測値、及び、原水に注入された薬剤の量を示す値の実測値を取得する実測値取得部(21)と、原水の性質を示す値の実測値及び原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部(22)と、実測値を使用して、原水の性質を示す値を説明変数とし薬剤の量を示す値を目的変数とする予測モデルのパラメータを、複数のクラスタごとに最適化し、パラメータが最適化された予測モデルが出力する薬剤の量を示す値の予測値と、薬剤の量を示す値の実測値との差分を、クラスタの数ごとに評価し、評価の結果に基づき、クラスタの数を決定する回帰分析部(23)と、を備えることを特徴とする。

Description

クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム
 本発明は、クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラムに関する。
 浄水場において、河川等から取得した原水に対して凝集剤が注入され、原水に含まれる汚濁物質を凝集させる。凝集した汚濁物質は、沈殿し、又は、濾過される。注入すべき凝集剤の量は、原水の性質を示す値(濁度、温度、水素イオン濃度等)によって変化する。そこで、原水の性質に基づき、注入すべき凝集剤の量を予測することが必要となる。近時、浄水場に限らず、社会インフラの運転計画作成に必要な諸数値を予測モデルを使用して予測する技術が普及している。そして、より正確な予測のために、運転計画の目的変数を最もよく説明する説明変数を選択する技術も普及している。
 特許文献1の特性値予測装置は、説明変数のn個の候補のうちから1つの変数の組合せ、2つの変数の組合せ、3つの変数の組合せ、・・・、n個の変数の組合せを作成する。これらの組合せの総数は、+・・・+となる。当該予測装置は、各組合せに属する説明変数の実測値及びその時点の目的変数の実測値を使用して、予測モデルを作成する。そして、当該予測装置は、予測モデルが出力する目的変数の予測値と実測値との差分(誤差)を求め、誤差の分散の対数に負の符号を付したものを“基準値”とする。当該予測装置は、説明変数の数が少ない組合せから順に基準値を算出していく。すると、説明変数の数が増えるにつれて基準値は上昇する。当該予測装置は、この上昇の度合いが所定の閾値より小さくなる直前の組合せを、目的変数を予測するための説明変数の組合せとする。
特開平7-93284号公報
 浄水場の凝集剤の注入量を予測する場合、説明変数は、原水の濁度、温度、水素イオン濃度等にほぼ固定化され、これらのうちのあるものを選択する動機は乏しい。むしろ、四季、天候等の運転条件ごとに予測モデルを使い分けることの必要性が大きい。特許文献1の特性値予測装置は、最適な予測モデルを作成するためのものであるが、説明変数の選択に注意を集中しており、予測モデルを運転条件に応じて使い分けるという発想に欠ける。
 そこで、本発明は、精度の高い複数の予測モデルを運転条件に応じて使用できるように、変数の多次元空間を分割することを目的とする。
 本発明のクラスタ分割評価装置は、浄水場が取得する原水の性質を示す値の実測値、及び、原水に注入された薬剤の量を示す値の実測値を取得する実測値取得部と、原水の性質を示す値の実測値及び原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部と、実測値を使用して、原水の性質を示す値を説明変数とし薬剤の量を示す値を目的変数とする予測モデルのパラメータを、複数のクラスタごとに最適化し、パラメータが最適化された予測モデルが出力する薬剤の量を示す値の予測値と、薬剤の量を示す値の実測値との差分を、クラスタの数ごとに評価し、評価の結果に基づき、クラスタの数を決定する回帰分析部と、を備えることを特徴とする。
 その他の手段については、発明を実施するための形態のなかで説明する。
 本発明によれば、精度の高い複数の予測モデルを運転条件に応じて使用できるように、変数の多次元空間を分割することができる。
クラスタ分割評価装置の構成等を説明する図である。 実測値情報の一例である。 クラスタ情報の一例である。 クラスタと予測モデルとの関係を説明する図である。 クラスタと予測モデルとの関係を説明する図である。 クラスタと予測モデルとの関係を説明する図である。 クラスタと予測モデルとの関係を説明する図である。 誤差を説明する図である。 誤差情報の一例である。 処理手順のフローチャートである。
 以降、本発明を実施するための形態(“本実施形態”という)を、図等を参照しながら詳細に説明する。本実施形態は、浄水場において原水に凝集剤を注入する例である。しかしながら、原水に対し凝集剤以外の薬剤(凝集補助剤、酸化剤、吸着剤、消毒剤等)を注入する例にも本発明は適用可能である。さらに、本発明は、より一般的に、ある事象の性質及びその事象が変化した後の結果の数量的関係の分析にも適用可能である。
(クラスタ分割評価装置)
 図1に沿って、クラスタ分割評価装置1の構成等を説明する。クラスタ分割評価装置1は、一般的なコンピュータであり、中央制御装置11、マウス、キーボード等の入力装置12、ディスプレイ等の出力装置13、主記憶装置14、補助記憶装置15及び通信装置16を備える。これらは、バスで相互に接続されている。補助記憶装置15は、予測モデル31、実測値情報32、クラスタ情報33及び誤差情報34(詳細後記)を格納している。
 主記憶装置14における実測値取得部21、クラスタリング部22、回帰分析部23及び表示処理部24は、プログラムである。中央制御装置11は、これらのプログラムを補助記憶装置15から読み出し主記憶装置14にロードすることによって、それぞれのプログラムの機能(詳細後記)を実現する。補助記憶装置15は、クラスタ分割評価装置1から独立した構成となっていてもよい。
 浄水場3は、混和池4、凝集剤注入装置5及びフロック形成池7を有する。河川等の自然環境から取得された原水6aは、混和池4に流入する。凝集剤注入装置5は、混和池に貯留された原水6aに凝集剤9を注入する。凝集剤9を注入された原水6aは、急速撹拌された後、混和水6bとしてフロック形成池7に流入する。フロック形成池7に貯留された混和水6bは、緩速撹拌される。すると、コロイド状の汚濁物質が凝集し始める。凝集した汚濁物質は、その後沈殿するか、濾過される。
 凝集剤9として一般に使用されている物質(薬剤)は、硫酸アルミニウム、ポリ塩化アルミニウム等である。原水中の汚濁物質はマイナスに帯電しており相互に反発している。凝集剤9が当該帯電を中和すると、汚濁物質は分子間力によって相互に引き合い大きく成長してフロックとなる。
 原水の汚濁の程度を示す物理量として“濁度”が存在する。濁度は、原水1リットル当たりの汚濁物質の質量(mg)である。ある都道府県水道局のホームページによれば、一般的な河川の水の晴天時の濁度は、通常、“5”である。しかしながら、台風の直後において濁度“2600”が記録されたことがある。浄水場は、濁度が所定の基準値以下に下がるように、凝集剤注入率を決定する。凝集剤注入率は、原水1リットル当たりに注入される凝集剤の質量(mg/リットル)である。凝集剤注入率を決定する要因となる原水の性質を示す物理量としては、濁度、水素イオン濃度(pH、中性=7)、温度(水温、℃)等が存在する。
 そこで、濁度計8a、pHメータ8b及び温度計8cが、混和池4に配置され、注入量計8dが、凝集剤注入装置5に配置される。これらは、ネットワーク2を介してクラスタ分割評価装置1に接続されている。
(予測モデル)
 本実施形態の予測モデル31は、以下の式1のような1次式である。
 y=a+a+a+a    (式1)
 ここで、yは、凝集剤注入率である。xは、濁度である。xは、水素イオン濃度である。xは、水温である。a、a、a及びaは、定数(パラメータ)である。式1は、x、x及びxを説明変数としyを目的変数とする関数になっている。そして、a、a、a及びaの値を様々に変化させることによって、4次元空間における予測モデル31の形状及びその位置が様々に変化する。ここで、変数の数(種類)を“4”としたのは、あくまでも一例である。変数の数がさらに多くても、すなわち、予測モデルの次元がさらに大きくてもよい。
 いま、凝集剤注入率、濁度、水素イオン濃度及び水温の過去における実測値の組合せとして、“[Y,X,X,X]”が多数存在するとする。Y、X、X及びXのそれぞれが示す物理量は、y、x、x及びxのそれぞれが示す物理量と同じである。しかしながら、説明の便宜上、実測値を大文字で示し、予測モデルの変数を小文字で示している。予測モデルの出力(目的変数)yは、“予測値”である。“Y-y”を誤差と呼ぶ。クラスタ分割評価装置1は、実測値の組合せを使用して、誤差の2乗和“Σ(Y-y)”を最小にするパラメータの組合せ“[a,a,a,a]”を決定する(詳細後記)。
(実測値情報)
 図2は、実測値情報32の一例である。実測値情報32においては、時刻欄101に記憶された時刻に関連付けて、目的変数欄102には目的変数の実測値が、説明変数欄103には説明変数の実測値が記憶されている。
 時刻欄101の時刻は、説明変数の実測値及び目的変数の実測値が、濁度計8a、pHメータ8b、温度計8c及び注入量計8dによって取得された時刻である。時刻t1、t2、t3、・・・は、時刻を省略的に示している。数字が大きいほど、後の時刻である。
 目的変数欄102の目的変数の実測値は、注入量計8dが計測した凝集剤注入率の実測値である。“#”は、異なる値を省略的に示している(以下同様)。
 説明変数欄103の説明変数の実測値は、濁度計8aが計測した原水の濁度(欄103a)、pHメータ8bが計測した原水の水素イオン濃度(欄103b)及び温度計8cが計測した原水の温度(欄103c)である。
(クラスタリング)
 多次元空間に描画された多くの点を、位置が近いもの同士でグループ分けすることを一般に“クラスタリング”と呼ぶ。クラスタリングの手法として、“k-平均法”がよく知られている。クラスタ分割評価装置1もまた、以下の(1)~(5)のようにk-平均法を使用する。
(1)クラスタ分割評価装置1は、複数の点のそれぞれを、k個のグループのいずれかに適当に所属させる。
(2)クラスタ分割評価装置1は、あるグループの重心から当該グループに属する点までの距離の2乗和dをグループごとに算出する。iは、グループの番号(i=1、2、・・・、k)である。
(3)クラスタ分割評価装置1は、1個の点の所属をあるグループから他のグループに変えたうえで、D=Σdを算出する。Dは、k個のグループのdの総和である。クラスタ分割評価装置1は、所属を変える点及び新たな所属先のすべての組合せごとに当該処理を繰り返す。
(4)クラスタ分割評価装置1は、Dを最小にするような、各点の所属を決定する。
(5)クラスタ分割評価装置1は、kを1、2、3、・・・と変化させたうえで、(1)~(4)の処理を繰り返す。
(クラスタ情報)
 図3は、クラスタ情報33の一例である。クラスタ情報33においては、時刻欄111に記憶された時刻に関連付けて、目的変数欄112には目的変数の実測値が、説明変数欄113には説明変数の実測値が、所属クラスタID欄114には所属クラスタIDが記憶されている。
 時刻欄111の時刻は、図2の時刻と同じである。
 目的変数欄112の目的変数の実測値は、図2の目的変数の実測値と同じである。
 説明変数欄113の説明変数の実測値は、図2の説明変数の実測値のうちの原水の濁度(欄103a)である。説明の単純化のため、図3の説明変数は、“濁度”だけとしている。
 所属クラスタID欄114は、クラスタの数ごとに、クラスタ数1欄114a、クラスタ数2欄114b、クラスタ数3欄114c、クラスタ数4欄114d、・・・に分かれている。そして分かれた各欄に、クラスタIDが記憶されている。クラスタIDは、クラスタを一意に特定する識別子である。各クラスタは、四季、天候等の運転条件に対応している。一般に、浄水場は、この運転条件に応じて、凝集剤注入率を含む様々な数値(運転パタン)を決定する。なお、“c3”及び“c10”のように、所属する点が結果的に同じになったとしても、クラスタの数が異なれば、異なるクラスタIDが採番されている(Dを算出し直しているため)。
 図4~図7は、クラスタと予測モデル31との関係を説明する図である。図4は、図3のクラスタ数1欄114aに対応している。図4の座標平面の横軸は説明変数(濁度)であり、縦軸は目的変数(凝集剤注入率)である。座標平面上に、時刻t1~t20に対応する20個の点●が描画されている(図5~図7においても同様)。円c1は、クラスタc1を表している。直線31aは、予測モデル31(図1)を表している。予測モデルの作成方法については後記する。
 図5は、図3のクラスタ数2欄114bに対応している。円c2は、クラスタc2を表している。円c3は、クラスタc3を表している。直線31bは、予測モデル31(図1)を表している。直線31cも、予測モデル31(図1)を表している。
 図6は、図3のクラスタ数3欄114cに対応している。図7は、図3のクラスタ数4欄114dに対応している。図6及び図7の説明は、図5の説明に準ずる。
 なお、図4~図7においては、作図上の制約に起因し、円c1等の中心は、クラスタc1等の重心(すべての点●の座標値の平均)とはなっていない。
 図4~図7において、クラスタ分割評価装置1は、クラスタごとに、当該クラスタに所属する実測値●のみを使用して、予測モデルを作成している。クラスタ分割評価装置1が予測モデル“y=a+a”を作成する方法は、以下の(11)~(17)の通りである。
(11)クラスタ分割評価装置1は、無作為的に発生させたパラメータa及びaの値を予測モデルのa及びaに代入する。
(12)クラスタ分割評価装置1は、実測値Xを予測モデルのxに代入し、yを算出する。
(13)クラスタ分割評価装置1は、誤差“Y-y”を算出する。
(14)クラスタ分割評価装置1は、時刻ごとに [X,Y]の値を変化させて前記(12)及び前記(13)の処理を繰り返す。
(15)クラスタ分割評価装置1は、各時刻の“(Y-y)”の総和である“Σ(Y-y)”を算出する。
(16)クラスタ分割評価装置1は、無作為的に発生させたパラメータa及びaの他の値を予測モデルのa及びaに代入したうえで、前記(12)~(15)の処理を充分多い回数だけ繰り返す。
(17)クラスタ分割評価装置1は、“Σ(Y-y)”を最小にするパラメータa0S及びa1Sの値を決定する。ここで“S”は、“最適化されている”ことを示す。
(誤差)
 図8は、誤差を説明する図である。図8の座標平面の横軸は濁度であり、縦軸は凝集剤注入率である。20個の点●は、図3における実測値の組合せ[X,Y]を示している。直線31aは、予測モデル31(図1)であり、その式は、“y=a0S+a1S”である。点●のそれぞれについて、誤差“Y-y”が定義される。前記したように、“Σ(Y-y)”は最小化されてはいるが、個々の点●に注目した場合、誤差が殆どないものと、誤差が比較的大きいものとが混在している。
(誤差情報)
 図9は、誤差情報34の一例である。誤差情報34においては、クラスタ数欄121に記憶されたクラスタ数に関連付けて、誤差欄122には誤差が、誤差評価値欄123には誤差評価値が記憶されている。
 クラスタ数欄121のクラスタ数は、クラスタの数である。
 誤差欄122の誤差は、“√(Σ(Y-y)/n)”である。ここで、nは、クラスタ内の点●の数である。“√(Σ(Y-y)/n)”は、図8における誤差の2乗和の平均の平方根である。“#”に付された括弧内には、クラスタIDが記載されている。
 誤差評価値欄123の誤差評価値は、誤差を加工して得られる任意の値であり、その値が小さいほど、クラスタ数に対する評価は高い。誤差評価値は、例えば、誤差情報34のレコード(行)に含まれる誤差の平均、誤差の最小値、誤差の分散等である。なお、誤差評価値の定義の仕方によっては、その値が大きいほど、クラスタ数に対する評価が高い場合もある。
(処理手順)
 図10は、処理手順のフローチャートである。処理手順を開始する前提として、実測値情報32(図2)が、完成された状態で補助記憶装置15に格納されているものとする。
 ステップS201において、クラスタ分割評価装置1の実測値取得部21は、実測値を取得する。具体的には、実測値取得部21は、補助記憶装置15から実測値情報32(図2)を取得する。
 ステップS202において、クラスタ分割評価装置1のクラスタリング部22は、変数を受け付ける。具体的には、クラスタリング部22は、複数の説明変数の一部又は全部をユーザが入力装置12を介して選択するのを受け付ける。例えば、ユーザが説明変数のうち濁度のパラメータの値aがaを除くすべてのパラメータのうちで最も大きくなりそうである、すなわち、濁度が目的変数に与える影響が最も大きくなりそうであると予測している場合、ユーザは“濁度”を選択してもよい。ここでは、ユーザは“濁度”を選択したとする。
 ステップS203において、クラスタリング部22は、クラスタ数の最大値等を受け付ける。具体的には、クラスタリング部22は、クラスタ数の最小値及び最大値、並びに、1つのクラスタに含まれる点●(クラスタ情報33のレコード数)の最小値をユーザが入力装置12を介して選択するのを受け付ける。ここでは、ユーザはクラスタ数の最小値として“1”、クラスタ数の最大値として“4”、1つのクラスタに含まれる点●の最小値として“4”を入力したとする。
 ステップS204において、クラスタリング部22は、クラスタリングを行う。具体的には、第1に、クラスタリング部22は、実測値情報32(図2)から、“濁度”以外の説明変数の欄を削除する。
 第2に、クラスタリング部22は、前記したk-平均法を使用して、実測値情報32(図2)の20個の点●“[X,Y]=[濁度,凝集剤注入率]”を、k個(k=1、2、3、4)のクラスタに分割する。このとき、クラスタリング部22は、いずれのクラスタにも少なくとも4個の点●が含まれるようにする。
 ステップS205において、クラスタリング部22は、クラスタ情報33(図3)を作成する。具体的には、クラスタリング部22は、ステップS204の“第2”におけるクラスタリングの結果に基づきクラスタ情報33を作成する。
 ステップS206において、クラスタ分割評価装置1の回帰分析部23は、予測モデル31を作成する。具体的には、回帰分析部23は、ユーザが画面上で予測モデルの数式を記述するのを受け付け、又は、一般的な予測モデルのひな型を画面表示し、ユーザが選択するのを受け付ける。ここで作成される予測モデル31は、前記した式1のような1次式である必要はなく、高次式であってもよいし、指数、対数等を含む非線形の式であってもよい。ただし、予測モデル31は、ステップS202において受け付けた各変数についてのパラメータ(この段階では値は未知である)を含むものとする。
 ステップS207において、回帰分析部23は、クラスタごとにパラメータを最適化する。具体的には、回帰分析部23は、前記した方法で、予測モデルのパラメータをクラスタごとに決定する。つまり、回帰分析部23は、実測値情報32(図3)の時刻t1~t20の実測値のうち、処理対象のクラスタに属するものを使用して、“Σ(Y-y)”を最小にするパラメータを決定する。
 ステップS208において、回帰分析部23は、誤差情報34(図9)を作成する。具体的には、第1に、回帰分析部23は、誤差情報34を作成する。ここで作成される誤差情報34は、4本のレコードを有し、クラスタ数欄121には、“1”、“2”、“3”及び“4”が記憶されている。誤差欄122及び誤差評価値欄123は、空欄である。
 第2に、回帰分析部23は、ステップS207において最小となった“Σ(Y-y)”を使用して、誤差“√(Σ(Y-y)/n)”を算出し、誤差欄122に記憶する。
 第3に、回帰分析部23は、各レコードの誤差に基づいて、誤差評価値を算出し、誤差評価値欄123に記憶する。
 ステップS209において、回帰分析部23は、誤差評価値に基づきクラスタ数を決定する。なお、本実施形態では、具体的には、回帰分析部23は、誤差評価値が最小であるレコードのクラスタ数を決定する。
 ステップS210において、クラスタ分割評価装置1の表示処理部24は、決定したクラスタ数及び誤差評価値を表示する。具体的には、第1に、表示処理部24は、ステップS209において決定したクラスタ数及びそのクラスタ数に対する誤差評価値を出力装置13に表示する。ここでは、“クラスタ数=4”が表示されたとする。
 第2に、表示処理部24は、4個のクラスタc7、c8、c9及びc10に対応する予測モデル31g、31h、31i及び31j(図7)を補助記憶装置15に記憶する。その後、処理手順を終了する。
(予測モデルの活用)
 ステップS210の“第1”において“クラスタ数=4”が表示されたという前提で、その後の予測モデルの活用方法を説明する。クラスタc7は、図3の時点t1~t4に対応している。時点t1~t4は、例えば前年のある特定の季節(快晴が続く等)である。回帰分析部23は、翌年同月同日の凝集剤注入率を予測する場合、予測モデル31gを使用する。クラスタc10は、図3の時点t17~t20に対応している。時点t17~t20は、例えば前年のある他の特定の季節(梅雨が続く等)である。回帰分析部23は、翌年同月同日の凝集剤注入率を予測する場合、予測モデル31jを使用する。他のクラスタについても同様である。
(処理手順の変形例)
 前記では、クラスタリング部22は、すべてのクラスタ数についてクラスタリングを行い、回帰分析部23は、すべてのクラスタ数について誤差評価値を算出している(総当たり処理)。しかしながら、クラスタ数k=1、2、3、4の降順又は昇順に、クラスタリング部22がクラスタリングを行い、回帰分析部23が誤差評価値を算出する処理を繰り返してもよい。この場合、所定の閾値(目標)に誤差評価値が達するまで、又は、誤差評価値の対前回比減少分が所定の閾値以下になるまで、クラスタリング部22及び回帰分析部23は処理を繰り返す。
(本実施形態の効果)
 本実施形態のクラスタ分割評価装置の効果は以下の通りである。
(1)クラスタ分割評価装置は、運転条件ごとに精度の高い予測モデルを作成することができる。
(2)クラスタ分割評価装置は、期待し得る誤差評価値及び運転条件に対応するクラスタ数を表示することができる。
(3)クラスタ分割評価装置は、ユーザがクラスタの数及び大きさを指定することを可能にする。
(4)クラスタ分割評価装置は、浄水場における凝集剤注入率の予測に適用することができる。
 なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は、本発明を分かり易く説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
 また、前記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウエアで実現してもよい。また、前記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウエアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、又は、ICカード、SDカード、DVD等の記録媒体に置くことができる。
 また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。
 1   クラスタ分割評価装置
 2   ネットワーク
 3   浄水場
 4   混和池
 5   凝集剤注入装置
 6a  原水
 6b  混和水
 7   フロック形成池
 8a  濁度計
 8b  pHメータ
 8c  温度計
 8d  注入量計
 9   凝集剤
 11  中央制御装置
 12  入力装置
 13  出力装置
 14  主記憶装置
 15  補助記憶装置
 16  通信装置
 21  実測値取得部
 22  クラスタリング部
 23  回帰分析部
 24  表示処理部
 31  予測モデル
 32  実測値情報
 33  クラスタ情報
 34  誤差情報

Claims (7)

  1.  浄水場が取得する原水の性質を示す値の実測値、及び、前記原水に注入された薬剤の量を示す値の実測値を取得する実測値取得部と、
     前記原水の性質を示す値の実測値及び前記原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部と、
     前記実測値を使用して、前記原水の性質を示す値を説明変数とし前記薬剤の量を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
     前記パラメータが最適化された予測モデルが出力する前記薬剤の量を示す値の予測値と、前記薬剤の量を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
     評価の結果に基づき、前記クラスタの数を決定する回帰分析部と、
     を備えることを特徴とするクラスタ分割評価装置。
  2.  前記決定したクラスタの数、及び、当該クラスタの数に対応する評価の結果を表示する表示処理部を備えること、
     を特徴とする請求項1に記載のクラスタ分割評価装置。
  3.  前記クラスタリング部は、
     前記クラスタの数の最小値及び最大値、並びに、前記クラスタが含む前記実測値の数の最小値をユーザが入力するのを受け付けること、
     を特徴とする請求項2に記載のクラスタ分割評価装置。
  4.  前記薬剤は、
     前記原水に含まれる汚濁物質を凝集させるものであり、
     前記原水の性質を示す値は、
     前記原水における濁度、前記原水の温度、及び、前記原水の水素イオン濃度のうちの少なくとも1つであること、
     を特徴とする請求項3に記載のクラスタ分割評価装置。
  5.  ある事象の性質を示す値の実測値、及び、前記事象が変化した後の結果を示す値の実測値を取得する実測値取得部と、
     前記事象の性質を示す値の実測値及び前記事象が変化した後の結果を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部と、
     前記実測値を使用して、前記事象の性質を示す値を説明変数とし前記事象が変化した後の結果を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
     前記パラメータが最適化された予測モデルが出力する前記事象が変化した後の結果を示す値の予測値と、前記事象が変化した後の結果を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
     評価の結果に基づき、前記クラスタの数を決定する回帰分析部と、
     を備えることを特徴とするクラスタ分割評価装置。
  6.  クラスタ分割評価装置の実測値取得部は、
     浄水場が取得する原水の性質を示す値の実測値、及び、前記原水に注入された薬剤の量を示す値の実測値を取得し、
     前記クラスタ分割評価装置のクラスタリング部は、
     前記原水の性質を示す値の実測値及び前記原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割し、
     前記クラスタ分割評価装置の回帰分析部は、
     前記実測値を使用して、前記原水の性質を示す値を説明変数とし前記薬剤の量を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
     前記パラメータが最適化された予測モデルが出力する前記薬剤の量を示す値の予測値と、前記薬剤の量を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
     評価の結果に基づき、前記クラスタの数を決定すること、
     を特徴とするクラスタ分割評価装置のクラスタ分割評価方法。
  7.  クラスタ分割評価装置の実測値取得部に対し、
     浄水場が取得する原水の性質を示す値の実測値、及び、前記原水に注入された薬剤の量を示す値の実測値を取得する処理を実行させ、
     前記クラスタ分割評価装置のクラスタリング部に対し、
     前記原水の性質を示す値の実測値及び前記原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割する処理を実行させ、
     前記クラスタ分割評価装置の回帰分析部に対し、
     前記実測値を使用して、前記原水の性質を示す値を説明変数とし前記薬剤の量を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
     前記パラメータが最適化された予測モデルが出力する前記薬剤の量を示す値の予測値と、前記薬剤の量を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
     評価の結果に基づき、前記クラスタの数を決定する処理を実行させること、
     を特徴とするクラスタ分割評価装置を機能させるためのクラスタ分割評価プログラム。
PCT/JP2020/011917 2019-03-20 2020-03-18 クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム WO2020189706A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202080018786.3A CN113557538A (zh) 2019-03-20 2020-03-18 聚类分割评价装置、聚类分割评价方法以及聚类分割评价程序

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-053445 2019-03-20
JP2019053445A JP6637206B1 (ja) 2019-03-20 2019-03-20 クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム

Publications (1)

Publication Number Publication Date
WO2020189706A1 true WO2020189706A1 (ja) 2020-09-24

Family

ID=69183651

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/011917 WO2020189706A1 (ja) 2019-03-20 2020-03-18 クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム

Country Status (3)

Country Link
JP (1) JP6637206B1 (ja)
CN (1) CN113557538A (ja)
WO (1) WO2020189706A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117009303A (zh) * 2023-07-06 2023-11-07 苏州领威电子科技有限公司 一种芯片视觉测试数据的存储方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117501282A (zh) 2021-05-12 2024-02-02 索尼集团公司 信息处理装置、信息处理服务器、信息处理方法及非暂时性计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006330988A (ja) * 2005-05-25 2006-12-07 Toshiba Corp データ分割装置、データ分割方法およびプログラム
JP2009294731A (ja) * 2008-06-02 2009-12-17 Toshiba Corp 運用ノウハウを自動抽出するプラント制御装置
JP2010092432A (ja) * 2008-10-10 2010-04-22 Nec Corp データ類似度計算システム、データ類似度計算方法およびデータ類似度計算プログラム
JP2014178878A (ja) * 2013-03-14 2014-09-25 Toshiba Corp ノウハウ可視化装置及びノウハウ可視化方法
WO2019026523A1 (ja) * 2017-08-03 2019-02-07 国立大学法人東北大学 クラスタリングの評価値算出方法及びクラスタ数決定方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5208061B2 (ja) * 2009-06-29 2013-06-12 株式会社日立製作所 凝集剤注入制御システム
CN106951993A (zh) * 2017-03-20 2017-07-14 国网江苏省电力公司常州供电公司 一种电能量数据预估方法
CN106991524A (zh) * 2017-03-20 2017-07-28 国网江苏省电力公司常州供电公司 一种台区线损率预估方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006330988A (ja) * 2005-05-25 2006-12-07 Toshiba Corp データ分割装置、データ分割方法およびプログラム
JP2009294731A (ja) * 2008-06-02 2009-12-17 Toshiba Corp 運用ノウハウを自動抽出するプラント制御装置
JP2010092432A (ja) * 2008-10-10 2010-04-22 Nec Corp データ類似度計算システム、データ類似度計算方法およびデータ類似度計算プログラム
JP2014178878A (ja) * 2013-03-14 2014-09-25 Toshiba Corp ノウハウ可視化装置及びノウハウ可視化方法
WO2019026523A1 (ja) * 2017-08-03 2019-02-07 国立大学法人東北大学 クラスタリングの評価値算出方法及びクラスタ数決定方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117009303A (zh) * 2023-07-06 2023-11-07 苏州领威电子科技有限公司 一种芯片视觉测试数据的存储方法
CN117009303B (zh) * 2023-07-06 2024-02-13 苏州领威电子科技有限公司 一种芯片视觉测试数据的存储方法

Also Published As

Publication number Publication date
JP2020154825A (ja) 2020-09-24
JP6637206B1 (ja) 2020-01-29
CN113557538A (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
Klyuev et al. Methods of forecasting electric energy consumption: A literature review
WO2020189706A1 (ja) クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム
Notaristefano et al. Data size reduction with symbolic aggregate approximation for electrical load pattern grouping
Ghaffarizadeh et al. Multistable switches and their role in cellular differentiation networks
JP6609391B1 (ja) 予測モデル作成装置、予測モデル作成方法及び予測モデル作成プログラム
CN103177177A (zh) 信息处理设备、估计器生成方法和程序
CN110119558A (zh) 一种基于差分优化算法的电路参数优化方法
Nimmegeers et al. Interactive multi‐objective dynamic optimization of bioreactors under parametric uncertainty
CN110796159A (zh) 基于k-means算法的电力数据分类方法及系统
CN114168761A (zh) 多媒体数据的推送方法、装置、电子设备及存储介质
CN106156857B (zh) 变分推理的数据初始化的方法和装置
Fan et al. Variable selection and model prediction based on lasso, adaptive lasso and elastic net
Sijben et al. Multi-modal multi-objective model-based genetic programming to find multiple diverse high-quality models
CN108564110A (zh) 一种基于聚类算法的空气质量预测方法
Chauhan et al. An efficient multi-unit production planning strategy based on continuous variables
Butka et al. Reduction of concepts from generalized one-sided concept lattice based on subsets quality measure
US12014436B2 (en) Intellectual-property landscaping platform
US11809694B2 (en) Intellectual-property landscaping platform with interactive graphical element
CN110163280A (zh) 一种聚类方法及装置
Makarenkov et al. Inferring multiple consensus trees and supertrees using clustering: A review
JP6233432B2 (ja) 混合モデルの選択方法及び装置
CN104794186A (zh) 数据库负载响应时间预测模型训练样本的采集方法
Feng Generalized rough fuzzy sets based on soft sets
Li et al. A weighted mutual information biclustering algorithm for gene expression data
Li et al. Analysis of gene coexpression by B-spline based CoD estimation

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20773521

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20773521

Country of ref document: EP

Kind code of ref document: A1