WO2020189706A1

WO2020189706A1 - クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム

Info

Publication number: WO2020189706A1
Application number: PCT/JP2020/011917
Authority: WO
Inventors: 佳秀太田; 北村　慎吾; 和典戸田
Original assignee: 株式会社日立産業制御ソリューションズ
Priority date: 2019-03-20
Filing date: 2020-03-18
Publication date: 2020-09-24
Also published as: JP2020154825A; JP6637206B1; CN113557538A

Abstract

本発明のクラスタ分割評価装置（１）は、浄水場が取得する原水の性質を示す値の実測値、及び、原水に注入された薬剤の量を示す値の実測値を取得する実測値取得部（２１）と、原水の性質を示す値の実測値及び原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部（２２）と、実測値を使用して、原水の性質を示す値を説明変数とし薬剤の量を示す値を目的変数とする予測モデルのパラメータを、複数のクラスタごとに最適化し、パラメータが最適化された予測モデルが出力する薬剤の量を示す値の予測値と、薬剤の量を示す値の実測値との差分を、クラスタの数ごとに評価し、評価の結果に基づき、クラスタの数を決定する回帰分析部（２３）と、を備えることを特徴とする。

Description

クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム

　本発明は、クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラムに関する。

　浄水場において、河川等から取得した原水に対して凝集剤が注入され、原水に含まれる汚濁物質を凝集させる。凝集した汚濁物質は、沈殿し、又は、濾過される。注入すべき凝集剤の量は、原水の性質を示す値（濁度、温度、水素イオン濃度等）によって変化する。そこで、原水の性質に基づき、注入すべき凝集剤の量を予測することが必要となる。近時、浄水場に限らず、社会インフラの運転計画作成に必要な諸数値を予測モデルを使用して予測する技術が普及している。そして、より正確な予測のために、運転計画の目的変数を最もよく説明する説明変数を選択する技術も普及している。

　特許文献１の特性値予測装置は、説明変数のｎ個の候補のうちから１つの変数の組合せ、２つの変数の組合せ、３つの変数の組合せ、・・・、ｎ個の変数の組合せを作成する。これらの組合せの総数は、_ｎＣ_１＋_ｎＣ_２＋_ｎＣ_３＋・・・＋_ｎＣ_ｎとなる。当該予測装置は、各組合せに属する説明変数の実測値及びその時点の目的変数の実測値を使用して、予測モデルを作成する。そして、当該予測装置は、予測モデルが出力する目的変数の予測値と実測値との差分（誤差）を求め、誤差の分散の対数に負の符号を付したものを“基準値”とする。当該予測装置は、説明変数の数が少ない組合せから順に基準値を算出していく。すると、説明変数の数が増えるにつれて基準値は上昇する。当該予測装置は、この上昇の度合いが所定の閾値より小さくなる直前の組合せを、目的変数を予測するための説明変数の組合せとする。

特開平７－９３２８４号公報

　浄水場の凝集剤の注入量を予測する場合、説明変数は、原水の濁度、温度、水素イオン濃度等にほぼ固定化され、これらのうちのあるものを選択する動機は乏しい。むしろ、四季、天候等の運転条件ごとに予測モデルを使い分けることの必要性が大きい。特許文献１の特性値予測装置は、最適な予測モデルを作成するためのものであるが、説明変数の選択に注意を集中しており、予測モデルを運転条件に応じて使い分けるという発想に欠ける。
　そこで、本発明は、精度の高い複数の予測モデルを運転条件に応じて使用できるように、変数の多次元空間を分割することを目的とする。

　本発明のクラスタ分割評価装置は、浄水場が取得する原水の性質を示す値の実測値、及び、原水に注入された薬剤の量を示す値の実測値を取得する実測値取得部と、原水の性質を示す値の実測値及び原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部と、実測値を使用して、原水の性質を示す値を説明変数とし薬剤の量を示す値を目的変数とする予測モデルのパラメータを、複数のクラスタごとに最適化し、パラメータが最適化された予測モデルが出力する薬剤の量を示す値の予測値と、薬剤の量を示す値の実測値との差分を、クラスタの数ごとに評価し、評価の結果に基づき、クラスタの数を決定する回帰分析部と、を備えることを特徴とする。
　その他の手段については、発明を実施するための形態のなかで説明する。

　本発明によれば、精度の高い複数の予測モデルを運転条件に応じて使用できるように、変数の多次元空間を分割することができる。

クラスタ分割評価装置の構成等を説明する図である。実測値情報の一例である。クラスタ情報の一例である。クラスタと予測モデルとの関係を説明する図である。クラスタと予測モデルとの関係を説明する図である。クラスタと予測モデルとの関係を説明する図である。クラスタと予測モデルとの関係を説明する図である。誤差を説明する図である。誤差情報の一例である。処理手順のフローチャートである。

　以降、本発明を実施するための形態（“本実施形態”という）を、図等を参照しながら詳細に説明する。本実施形態は、浄水場において原水に凝集剤を注入する例である。しかしながら、原水に対し凝集剤以外の薬剤（凝集補助剤、酸化剤、吸着剤、消毒剤等）を注入する例にも本発明は適用可能である。さらに、本発明は、より一般的に、ある事象の性質及びその事象が変化した後の結果の数量的関係の分析にも適用可能である。

（クラスタ分割評価装置）
　図１に沿って、クラスタ分割評価装置１の構成等を説明する。クラスタ分割評価装置１は、一般的なコンピュータであり、中央制御装置１１、マウス、キーボード等の入力装置１２、ディスプレイ等の出力装置１３、主記憶装置１４、補助記憶装置１５及び通信装置１６を備える。これらは、バスで相互に接続されている。補助記憶装置１５は、予測モデル３１、実測値情報３２、クラスタ情報３３及び誤差情報３４（詳細後記）を格納している。

　主記憶装置１４における実測値取得部２１、クラスタリング部２２、回帰分析部２３及び表示処理部２４は、プログラムである。中央制御装置１１は、これらのプログラムを補助記憶装置１５から読み出し主記憶装置１４にロードすることによって、それぞれのプログラムの機能（詳細後記）を実現する。補助記憶装置１５は、クラスタ分割評価装置１から独立した構成となっていてもよい。

　浄水場３は、混和池４、凝集剤注入装置５及びフロック形成池７を有する。河川等の自然環境から取得された原水６ａは、混和池４に流入する。凝集剤注入装置５は、混和池に貯留された原水６ａに凝集剤９を注入する。凝集剤９を注入された原水６ａは、急速撹拌された後、混和水６ｂとしてフロック形成池７に流入する。フロック形成池７に貯留された混和水６ｂは、緩速撹拌される。すると、コロイド状の汚濁物質が凝集し始める。凝集した汚濁物質は、その後沈殿するか、濾過される。

　凝集剤９として一般に使用されている物質（薬剤）は、硫酸アルミニウム、ポリ塩化アルミニウム等である。原水中の汚濁物質はマイナスに帯電しており相互に反発している。凝集剤９が当該帯電を中和すると、汚濁物質は分子間力によって相互に引き合い大きく成長してフロックとなる。

　原水の汚濁の程度を示す物理量として“濁度”が存在する。濁度は、原水１リットル当たりの汚濁物質の質量（ｍｇ）である。ある都道府県水道局のホームページによれば、一般的な河川の水の晴天時の濁度は、通常、“５”である。しかしながら、台風の直後において濁度“２６００”が記録されたことがある。浄水場は、濁度が所定の基準値以下に下がるように、凝集剤注入率を決定する。凝集剤注入率は、原水１リットル当たりに注入される凝集剤の質量（ｍｇ／リットル）である。凝集剤注入率を決定する要因となる原水の性質を示す物理量としては、濁度、水素イオン濃度（ｐＨ、中性＝７）、温度（水温、℃）等が存在する。

　そこで、濁度計８ａ、ｐＨメータ８ｂ及び温度計８ｃが、混和池４に配置され、注入量計８ｄが、凝集剤注入装置５に配置される。これらは、ネットワーク２を介してクラスタ分割評価装置１に接続されている。

（予測モデル）
　本実施形態の予測モデル３１は、以下の式１のような１次式である。
　ｙ＝ａ_０＋ａ_１ｘ_１＋ａ_２ｘ_２＋ａ_３ｘ_３　　　　（式１）

　ここで、ｙは、凝集剤注入率である。ｘ_１は、濁度である。ｘ_２は、水素イオン濃度である。ｘ_３は、水温である。ａ_０、ａ_１、ａ_２及びａ_３は、定数（パラメータ）である。式１は、ｘ_１、ｘ_２及びｘ_３を説明変数としｙを目的変数とする関数になっている。そして、ａ_０、ａ_１、ａ_２及びａ_３の値を様々に変化させることによって、４次元空間における予測モデル３１の形状及びその位置が様々に変化する。ここで、変数の数（種類）を“４”としたのは、あくまでも一例である。変数の数がさらに多くても、すなわち、予測モデルの次元がさらに大きくてもよい。

　いま、凝集剤注入率、濁度、水素イオン濃度及び水温の過去における実測値の組合せとして、“[Ｙ，Ｘ_１，Ｘ_２，Ｘ_３]”が多数存在するとする。Ｙ、Ｘ_１、Ｘ_２及びＸ_３のそれぞれが示す物理量は、ｙ、ｘ_１、ｘ_２及びｘ_３のそれぞれが示す物理量と同じである。しかしながら、説明の便宜上、実測値を大文字で示し、予測モデルの変数を小文字で示している。予測モデルの出力（目的変数）ｙは、“予測値”である。“Ｙ－ｙ”を誤差と呼ぶ。クラスタ分割評価装置１は、実測値の組合せを使用して、誤差の２乗和“Σ（Ｙ－ｙ）^２”を最小にするパラメータの組合せ“[ａ_０，ａ_１，ａ_２，ａ_３]”を決定する（詳細後記）。

（実測値情報）
　図２は、実測値情報３２の一例である。実測値情報３２においては、時刻欄１０１に記憶された時刻に関連付けて、目的変数欄１０２には目的変数の実測値が、説明変数欄１０３には説明変数の実測値が記憶されている。
　時刻欄１０１の時刻は、説明変数の実測値及び目的変数の実測値が、濁度計８ａ、ｐＨメータ８ｂ、温度計８ｃ及び注入量計８ｄによって取得された時刻である。時刻ｔ１、ｔ２、ｔ３、・・・は、時刻を省略的に示している。数字が大きいほど、後の時刻である。

　目的変数欄１０２の目的変数の実測値は、注入量計８ｄが計測した凝集剤注入率の実測値である。“＃”は、異なる値を省略的に示している（以下同様）。
　説明変数欄１０３の説明変数の実測値は、濁度計８ａが計測した原水の濁度（欄１０３ａ）、ｐＨメータ８ｂが計測した原水の水素イオン濃度（欄１０３ｂ）及び温度計８ｃが計測した原水の温度（欄１０３ｃ）である。

（クラスタリング）
　多次元空間に描画された多くの点を、位置が近いもの同士でグループ分けすることを一般に“クラスタリング”と呼ぶ。クラスタリングの手法として、“ｋ－平均法”がよく知られている。クラスタ分割評価装置１もまた、以下の（１）～（５）のようにｋ－平均法を使用する。

（１）クラスタ分割評価装置１は、複数の点のそれぞれを、ｋ個のグループのいずれかに適当に所属させる。
（２）クラスタ分割評価装置１は、あるグループの重心から当該グループに属する点までの距離の２乗和ｄ_ｉをグループごとに算出する。ｉは、グループの番号（ｉ＝１、２、・・・、ｋ）である。

（３）クラスタ分割評価装置１は、１個の点の所属をあるグループから他のグループに変えたうえで、Ｄ_ｋ＝Σｄ_ｉを算出する。Ｄ_ｋは、ｋ個のグループのｄ_ｉの総和である。クラスタ分割評価装置１は、所属を変える点及び新たな所属先のすべての組合せごとに当該処理を繰り返す。
（４）クラスタ分割評価装置１は、Ｄ_ｋを最小にするような、各点の所属を決定する。
（５）クラスタ分割評価装置１は、ｋを１、２、３、・・・と変化させたうえで、（１）～（４）の処理を繰り返す。

（クラスタ情報）
　図３は、クラスタ情報３３の一例である。クラスタ情報３３においては、時刻欄１１１に記憶された時刻に関連付けて、目的変数欄１１２には目的変数の実測値が、説明変数欄１１３には説明変数の実測値が、所属クラスタＩＤ欄１１４には所属クラスタＩＤが記憶されている。

　時刻欄１１１の時刻は、図２の時刻と同じである。
　目的変数欄１１２の目的変数の実測値は、図２の目的変数の実測値と同じである。
　説明変数欄１１３の説明変数の実測値は、図２の説明変数の実測値のうちの原水の濁度（欄１０３ａ）である。説明の単純化のため、図３の説明変数は、“濁度”だけとしている。

　所属クラスタＩＤ欄１１４は、クラスタの数ごとに、クラスタ数１欄１１４ａ、クラスタ数２欄１１４ｂ、クラスタ数３欄１１４ｃ、クラスタ数４欄１１４ｄ、・・・に分かれている。そして分かれた各欄に、クラスタＩＤが記憶されている。クラスタＩＤは、クラスタを一意に特定する識別子である。各クラスタは、四季、天候等の運転条件に対応している。一般に、浄水場は、この運転条件に応じて、凝集剤注入率を含む様々な数値（運転パタン）を決定する。なお、“ｃ３”及び“ｃ１０”のように、所属する点が結果的に同じになったとしても、クラスタの数が異なれば、異なるクラスタＩＤが採番されている（Ｄ_ｋを算出し直しているため）。

　図４～図７は、クラスタと予測モデル３１との関係を説明する図である。図４は、図３のクラスタ数１欄１１４ａに対応している。図４の座標平面の横軸は説明変数（濁度）であり、縦軸は目的変数（凝集剤注入率）である。座標平面上に、時刻ｔ１～ｔ２０に対応する２０個の点●が描画されている（図５～図７においても同様）。円ｃ１は、クラスタｃ１を表している。直線３１ａは、予測モデル３１（図１）を表している。予測モデルの作成方法については後記する。

　図５は、図３のクラスタ数２欄１１４ｂに対応している。円ｃ２は、クラスタｃ２を表している。円ｃ３は、クラスタｃ３を表している。直線３１ｂは、予測モデル３１（図１）を表している。直線３１ｃも、予測モデル３１（図１）を表している。
　図６は、図３のクラスタ数３欄１１４ｃに対応している。図７は、図３のクラスタ数４欄１１４ｄに対応している。図６及び図７の説明は、図５の説明に準ずる。
　なお、図４～図７においては、作図上の制約に起因し、円ｃ１等の中心は、クラスタｃ１等の重心（すべての点●の座標値の平均）とはなっていない。

　図４～図７において、クラスタ分割評価装置１は、クラスタごとに、当該クラスタに所属する実測値●のみを使用して、予測モデルを作成している。クラスタ分割評価装置１が予測モデル“ｙ＝ａ_０＋ａ_１ｘ_１”を作成する方法は、以下の（１１）～（１７）の通りである。

（１１）クラスタ分割評価装置１は、無作為的に発生させたパラメータａ_０及びａ_１の値を予測モデルのａ_０及びａ_１に代入する。
（１２）クラスタ分割評価装置１は、実測値Ｘを予測モデルのｘ_１に代入し、ｙを算出する。
（１３）クラスタ分割評価装置１は、誤差“Ｙ－ｙ”を算出する。
（１４）クラスタ分割評価装置１は、時刻ごとに [Ｘ，Ｙ]の値を変化させて前記（１２）及び前記（１３）の処理を繰り返す。

（１５）クラスタ分割評価装置１は、各時刻の“（Ｙ－ｙ）^２”の総和である“Σ（Ｙ－ｙ）^２”を算出する。
（１６）クラスタ分割評価装置１は、無作為的に発生させたパラメータａ_０及びａ_１の他の値を予測モデルのａ_０及びａ_１に代入したうえで、前記（１２）～（１５）の処理を充分多い回数だけ繰り返す。
（１７）クラスタ分割評価装置１は、“Σ（Ｙ－ｙ）^２”を最小にするパラメータａ_０Ｓ及びａ_１Ｓの値を決定する。ここで“Ｓ”は、“最適化されている”ことを示す。

（誤差）
　図８は、誤差を説明する図である。図８の座標平面の横軸は濁度であり、縦軸は凝集剤注入率である。２０個の点●は、図３における実測値の組合せ[Ｘ，Ｙ]を示している。直線３１ａは、予測モデル３１（図１）であり、その式は、“ｙ＝ａ_０Ｓ＋ａ_１Ｓｘ_１”である。点●のそれぞれについて、誤差“Ｙ－ｙ”が定義される。前記したように、“Σ（Ｙ－ｙ）^２”は最小化されてはいるが、個々の点●に注目した場合、誤差が殆どないものと、誤差が比較的大きいものとが混在している。

（誤差情報）
　図９は、誤差情報３４の一例である。誤差情報３４においては、クラスタ数欄１２１に記憶されたクラスタ数に関連付けて、誤差欄１２２には誤差が、誤差評価値欄１２３には誤差評価値が記憶されている。
　クラスタ数欄１２１のクラスタ数は、クラスタの数である。
　誤差欄１２２の誤差は、“√（Σ（Ｙ－ｙ）^２／ｎ）”である。ここで、ｎは、クラスタ内の点●の数である。“√（Σ（Ｙ－ｙ）^２／ｎ）”は、図８における誤差の２乗和の平均の平方根である。“＃”に付された括弧内には、クラスタＩＤが記載されている。

　誤差評価値欄１２３の誤差評価値は、誤差を加工して得られる任意の値であり、その値が小さいほど、クラスタ数に対する評価は高い。誤差評価値は、例えば、誤差情報３４のレコード（行）に含まれる誤差の平均、誤差の最小値、誤差の分散等である。なお、誤差評価値の定義の仕方によっては、その値が大きいほど、クラスタ数に対する評価が高い場合もある。

（処理手順）
　図１０は、処理手順のフローチャートである。処理手順を開始する前提として、実測値情報３２（図２）が、完成された状態で補助記憶装置１５に格納されているものとする。
　ステップＳ２０１において、クラスタ分割評価装置１の実測値取得部２１は、実測値を取得する。具体的には、実測値取得部２１は、補助記憶装置１５から実測値情報３２（図２）を取得する。

　ステップＳ２０２において、クラスタ分割評価装置１のクラスタリング部２２は、変数を受け付ける。具体的には、クラスタリング部２２は、複数の説明変数の一部又は全部をユーザが入力装置１２を介して選択するのを受け付ける。例えば、ユーザが説明変数のうち濁度のパラメータの値ａ_１がａ_０を除くすべてのパラメータのうちで最も大きくなりそうである、すなわち、濁度が目的変数に与える影響が最も大きくなりそうであると予測している場合、ユーザは“濁度”を選択してもよい。ここでは、ユーザは“濁度”を選択したとする。

　ステップＳ２０３において、クラスタリング部２２は、クラスタ数の最大値等を受け付ける。具体的には、クラスタリング部２２は、クラスタ数の最小値及び最大値、並びに、１つのクラスタに含まれる点●（クラスタ情報３３のレコード数）の最小値をユーザが入力装置１２を介して選択するのを受け付ける。ここでは、ユーザはクラスタ数の最小値として“１”、クラスタ数の最大値として“４”、１つのクラスタに含まれる点●の最小値として“４”を入力したとする。

　ステップＳ２０４において、クラスタリング部２２は、クラスタリングを行う。具体的には、第１に、クラスタリング部２２は、実測値情報３２（図２）から、“濁度”以外の説明変数の欄を削除する。
　第２に、クラスタリング部２２は、前記したｋ－平均法を使用して、実測値情報３２（図２）の２０個の点●“[Ｘ，Ｙ]＝[濁度，凝集剤注入率]”を、ｋ個（ｋ＝１、２、３、４）のクラスタに分割する。このとき、クラスタリング部２２は、いずれのクラスタにも少なくとも４個の点●が含まれるようにする。

　ステップＳ２０５において、クラスタリング部２２は、クラスタ情報３３（図３）を作成する。具体的には、クラスタリング部２２は、ステップＳ２０４の“第２”におけるクラスタリングの結果に基づきクラスタ情報３３を作成する。

　ステップＳ２０６において、クラスタ分割評価装置１の回帰分析部２３は、予測モデル３１を作成する。具体的には、回帰分析部２３は、ユーザが画面上で予測モデルの数式を記述するのを受け付け、又は、一般的な予測モデルのひな型を画面表示し、ユーザが選択するのを受け付ける。ここで作成される予測モデル３１は、前記した式１のような１次式である必要はなく、高次式であってもよいし、指数、対数等を含む非線形の式であってもよい。ただし、予測モデル３１は、ステップＳ２０２において受け付けた各変数についてのパラメータ（この段階では値は未知である）を含むものとする。

　ステップＳ２０７において、回帰分析部２３は、クラスタごとにパラメータを最適化する。具体的には、回帰分析部２３は、前記した方法で、予測モデルのパラメータをクラスタごとに決定する。つまり、回帰分析部２３は、実測値情報３２（図３）の時刻ｔ１～ｔ２０の実測値のうち、処理対象のクラスタに属するものを使用して、“Σ（Ｙ－ｙ）^２”を最小にするパラメータを決定する。

　ステップＳ２０８において、回帰分析部２３は、誤差情報３４（図９）を作成する。具体的には、第１に、回帰分析部２３は、誤差情報３４を作成する。ここで作成される誤差情報３４は、４本のレコードを有し、クラスタ数欄１２１には、“１”、“２”、“３”及び“４”が記憶されている。誤差欄１２２及び誤差評価値欄１２３は、空欄である。
　第２に、回帰分析部２３は、ステップＳ２０７において最小となった“Σ（Ｙ－ｙ）^２”を使用して、誤差“√（Σ（Ｙ－ｙ）^２／ｎ）”を算出し、誤差欄１２２に記憶する。
　第３に、回帰分析部２３は、各レコードの誤差に基づいて、誤差評価値を算出し、誤差評価値欄１２３に記憶する。

　ステップＳ２０９において、回帰分析部２３は、誤差評価値に基づきクラスタ数を決定する。なお、本実施形態では、具体的には、回帰分析部２３は、誤差評価値が最小であるレコードのクラスタ数を決定する。

　ステップＳ２１０において、クラスタ分割評価装置１の表示処理部２４は、決定したクラスタ数及び誤差評価値を表示する。具体的には、第１に、表示処理部２４は、ステップＳ２０９において決定したクラスタ数及びそのクラスタ数に対する誤差評価値を出力装置１３に表示する。ここでは、“クラスタ数＝４”が表示されたとする。
　第２に、表示処理部２４は、４個のクラスタｃ７、ｃ８、ｃ９及びｃ１０に対応する予測モデル３１ｇ、３１ｈ、３１ｉ及び３１ｊ（図７）を補助記憶装置１５に記憶する。その後、処理手順を終了する。

（予測モデルの活用）
　ステップＳ２１０の“第１”において“クラスタ数＝４”が表示されたという前提で、その後の予測モデルの活用方法を説明する。クラスタｃ７は、図３の時点ｔ１～ｔ４に対応している。時点ｔ１～ｔ４は、例えば前年のある特定の季節（快晴が続く等）である。回帰分析部２３は、翌年同月同日の凝集剤注入率を予測する場合、予測モデル３１ｇを使用する。クラスタｃ１０は、図３の時点ｔ１７～ｔ２０に対応している。時点ｔ１７～ｔ２０は、例えば前年のある他の特定の季節（梅雨が続く等）である。回帰分析部２３は、翌年同月同日の凝集剤注入率を予測する場合、予測モデル３１ｊを使用する。他のクラスタについても同様である。

（処理手順の変形例）
　前記では、クラスタリング部２２は、すべてのクラスタ数についてクラスタリングを行い、回帰分析部２３は、すべてのクラスタ数について誤差評価値を算出している（総当たり処理）。しかしながら、クラスタ数ｋ＝１、２、３、４の降順又は昇順に、クラスタリング部２２がクラスタリングを行い、回帰分析部２３が誤差評価値を算出する処理を繰り返してもよい。この場合、所定の閾値（目標）に誤差評価値が達するまで、又は、誤差評価値の対前回比減少分が所定の閾値以下になるまで、クラスタリング部２２及び回帰分析部２３は処理を繰り返す。

（本実施形態の効果）
　本実施形態のクラスタ分割評価装置の効果は以下の通りである。
（１）クラスタ分割評価装置は、運転条件ごとに精度の高い予測モデルを作成することができる。
（２）クラスタ分割評価装置は、期待し得る誤差評価値及び運転条件に対応するクラスタ数を表示することができる。
（３）クラスタ分割評価装置は、ユーザがクラスタの数及び大きさを指定することを可能にする。
（４）クラスタ分割評価装置は、浄水場における凝集剤注入率の予測に適用することができる。

　なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は、本発明を分かり易く説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。

　また、前記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウエアで実現してもよい。また、前記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウエアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、ＳＳＤ（Solid State Drive）等の記録装置、又は、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に置くことができる。
　また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。

　１　　　クラスタ分割評価装置
　２　　　ネットワーク
　３　　　浄水場
　４　　　混和池
　５　　　凝集剤注入装置
　６ａ　　原水
　６ｂ　　混和水
　７　　　フロック形成池
　８ａ　　濁度計
　８ｂ　　ｐＨメータ
　８ｃ　　温度計
　８ｄ　　注入量計
　９　　　凝集剤
　１１　　中央制御装置
　１２　　入力装置
　１３　　出力装置
　１４　　主記憶装置
　１５　　補助記憶装置
　１６　　通信装置
　２１　　実測値取得部
　２２　　クラスタリング部
　２３　　回帰分析部
　２４　　表示処理部
　３１　　予測モデル
　３２　　実測値情報
　３３　　クラスタ情報
　３４　　誤差情報

Claims

　浄水場が取得する原水の性質を示す値の実測値、及び、前記原水に注入された薬剤の量を示す値の実測値を取得する実測値取得部と、
　前記原水の性質を示す値の実測値及び前記原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部と、
　前記実測値を使用して、前記原水の性質を示す値を説明変数とし前記薬剤の量を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
　前記パラメータが最適化された予測モデルが出力する前記薬剤の量を示す値の予測値と、前記薬剤の量を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
　評価の結果に基づき、前記クラスタの数を決定する回帰分析部と、
　を備えることを特徴とするクラスタ分割評価装置。
　前記決定したクラスタの数、及び、当該クラスタの数に対応する評価の結果を表示する表示処理部を備えること、
　を特徴とする請求項１に記載のクラスタ分割評価装置。
　前記クラスタリング部は、
　前記クラスタの数の最小値及び最大値、並びに、前記クラスタが含む前記実測値の数の最小値をユーザが入力するのを受け付けること、
　を特徴とする請求項２に記載のクラスタ分割評価装置。
　前記薬剤は、
　前記原水に含まれる汚濁物質を凝集させるものであり、
　前記原水の性質を示す値は、
　前記原水における濁度、前記原水の温度、及び、前記原水の水素イオン濃度のうちの少なくとも１つであること、
　を特徴とする請求項３に記載のクラスタ分割評価装置。
　ある事象の性質を示す値の実測値、及び、前記事象が変化した後の結果を示す値の実測値を取得する実測値取得部と、
　前記事象の性質を示す値の実測値及び前記事象が変化した後の結果を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部と、
　前記実測値を使用して、前記事象の性質を示す値を説明変数とし前記事象が変化した後の結果を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
　前記パラメータが最適化された予測モデルが出力する前記事象が変化した後の結果を示す値の予測値と、前記事象が変化した後の結果を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
　評価の結果に基づき、前記クラスタの数を決定する回帰分析部と、
　を備えることを特徴とするクラスタ分割評価装置。
　クラスタ分割評価装置の実測値取得部は、
　浄水場が取得する原水の性質を示す値の実測値、及び、前記原水に注入された薬剤の量を示す値の実測値を取得し、
　前記クラスタ分割評価装置のクラスタリング部は、
　前記原水の性質を示す値の実測値及び前記原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割し、
　前記クラスタ分割評価装置の回帰分析部は、
　前記実測値を使用して、前記原水の性質を示す値を説明変数とし前記薬剤の量を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
　前記パラメータが最適化された予測モデルが出力する前記薬剤の量を示す値の予測値と、前記薬剤の量を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
　評価の結果に基づき、前記クラスタの数を決定すること、
　を特徴とするクラスタ分割評価装置のクラスタ分割評価方法。
　クラスタ分割評価装置の実測値取得部に対し、
　浄水場が取得する原水の性質を示す値の実測値、及び、前記原水に注入された薬剤の量を示す値の実測値を取得する処理を実行させ、
　前記クラスタ分割評価装置のクラスタリング部に対し、
　前記原水の性質を示す値の実測値及び前記原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割する処理を実行させ、
　前記クラスタ分割評価装置の回帰分析部に対し、
　前記実測値を使用して、前記原水の性質を示す値を説明変数とし前記薬剤の量を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
　前記パラメータが最適化された予測モデルが出力する前記薬剤の量を示す値の予測値と、前記薬剤の量を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
　評価の結果に基づき、前記クラスタの数を決定する処理を実行させること、
　を特徴とするクラスタ分割評価装置を機能させるためのクラスタ分割評価プログラム。