JP6637206B1 - クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム - Google Patents

クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム Download PDF

Info

Publication number
JP6637206B1
JP6637206B1 JP2019053445A JP2019053445A JP6637206B1 JP 6637206 B1 JP6637206 B1 JP 6637206B1 JP 2019053445 A JP2019053445 A JP 2019053445A JP 2019053445 A JP2019053445 A JP 2019053445A JP 6637206 B1 JP6637206 B1 JP 6637206B1
Authority
JP
Japan
Prior art keywords
value
raw water
clusters
cluster
indicating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019053445A
Other languages
English (en)
Other versions
JP2020154825A (ja
Inventor
佳秀 太田
佳秀 太田
北村 慎吾
慎吾 北村
和典 戸田
和典 戸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Industry and Control Solutions Co Ltd
Original Assignee
Hitachi Industry and Control Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Industry and Control Solutions Co Ltd filed Critical Hitachi Industry and Control Solutions Co Ltd
Priority to JP2019053445A priority Critical patent/JP6637206B1/ja
Application granted granted Critical
Publication of JP6637206B1 publication Critical patent/JP6637206B1/ja
Priority to CN202080018786.3A priority patent/CN113557538A/zh
Priority to PCT/JP2020/011917 priority patent/WO2020189706A1/ja
Publication of JP2020154825A publication Critical patent/JP2020154825A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Separation Of Suspended Particles By Flocculating Agents (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】精度の高い複数の予測モデルを運転条件に応じて使用できるように、変数の多次元空間を分割する。【解決手段】本発明のクラスタ分割評価装置は、浄水場が取得する原水の性質を示す値の実測値、及び、原水に注入された薬剤の量を示す値の実測値を取得する実測値取得部と、原水の性質を示す値の実測値及び原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部と、実測値を使用して、原水の性質を示す値を説明変数とし薬剤の量を示す値を目的変数とする予測モデルのパラメータを、複数のクラスタごとに最適化し、パラメータが最適化された予測モデルが出力する薬剤の量を示す値の予測値と、薬剤の量を示す値の実測値との差分を、クラスタの数ごとに評価し、評価の結果に基づき、クラスタの数を決定する回帰分析部と、を備えることを特徴とする。【選択図】図7

Description

本発明は、クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラムに関する。
浄水場において、河川等から取得した原水に対して凝集剤が注入され、原水に含まれる汚濁物質を凝集させる。凝集した汚濁物質は、沈殿し、又は、濾過される。注入すべき凝集剤の量は、原水の性質を示す値(濁度、温度、水素イオン濃度等)によって変化する。そこで、原水の性質に基づき、注入すべき凝集剤の量を予測することが必要となる。近時、浄水場に限らず、社会インフラの運転計画作成に必要な諸数値を予測モデルを使用して予測する技術が普及している。そして、より正確な予測のために、運転計画の目的変数を最もよく説明する説明変数を選択する技術も普及している。
特許文献1の特性値予測装置は、説明変数のn個の候補のうちから1つの変数の組合せ、2つの変数の組合せ、3つの変数の組合せ、・・・、n個の変数の組合せを作成する。これらの組合せの総数は、+・・・+となる。当該予測装置は、各組合せに属する説明変数の実測値及びその時点の目的変数の実測値を使用して、予測モデルを作成する。そして、当該予測装置は、予測モデルが出力する目的変数の予測値と実測値との差分(誤差)を求め、誤差の分散の対数に負の符号を付したものを“基準値”とする。当該予測装置は、説明変数の数が少ない組合せから順に基準値を算出していく。すると、説明変数の数が増えるにつれて基準値は上昇する。当該予測装置は、この上昇の度合いが所定の閾値より小さくなる直前の組合せを、目的変数を予測するための説明変数の組合せとする。
特開平7−93284号公報
浄水場の凝集剤の注入量を予測する場合、説明変数は、原水の濁度、温度、水素イオン濃度等にほぼ固定化され、これらのうちのあるものを選択する動機は乏しい。むしろ、四季、天候等の運転条件ごとに予測モデルを使い分けることの必要性が大きい。特許文献1の特性値予測装置は、最適な予測モデルを作成するためのものであるが、説明変数の選択に注意を集中しており、予測モデルを運転条件に応じて使い分けるという発想に欠ける。
そこで、本発明は、精度の高い複数の予測モデルを運転条件に応じて使用できるように、変数の多次元空間を分割することを目的とする。
本発明のクラスタ分割評価装置は、浄水場が取得する原水の性質を示す値の実測値、及び、原水に注入された薬剤の量を示す値の実測値を取得する実測値取得部と、原水の性質を示す値の実測値及び原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部と、実測値を使用して、原水の性質を示す値を説明変数とし薬剤の量を示す値を目的変数とする予測モデルのパラメータを、複数のクラスタごとに最適化し、パラメータが最適化された予測モデルが出力する薬剤の量を示す値の予測値と、薬剤の量を示す値の実測値との差分を、クラスタの数ごとに評価し、評価の結果に基づき、クラスタの数を決定する回帰分析部と、を備えることを特徴とする。
その他の手段については、発明を実施するための形態のなかで説明する。
本発明によれば、精度の高い複数の予測モデルを運転条件に応じて使用できるように、変数の多次元空間を分割することができる。
クラスタ分割評価装置の構成等を説明する図である。 実測値情報の一例である。 クラスタ情報の一例である。 クラスタと予測モデルとの関係を説明する図である。 クラスタと予測モデルとの関係を説明する図である。 クラスタと予測モデルとの関係を説明する図である。 クラスタと予測モデルとの関係を説明する図である。 誤差を説明する図である。 誤差情報の一例である。 処理手順のフローチャートである。
以降、本発明を実施するための形態(“本実施形態”という)を、図等を参照しながら詳細に説明する。本実施形態は、浄水場において原水に凝集剤を注入する例である。しかしながら、原水に対し凝集剤以外の薬剤(凝集補助剤、酸化剤、吸着剤、消毒剤等)を注入する例にも本発明は適用可能である。さらに、本発明は、より一般的に、ある事象の性質及びその事象が変化した後の結果の数量的関係の分析にも適用可能である。
(クラスタ分割評価装置)
図1に沿って、クラスタ分割評価装置1の構成等を説明する。クラスタ分割評価装置1は、一般的なコンピュータであり、中央制御装置11、マウス、キーボード等の入力装置12、ディスプレイ等の出力装置13、主記憶装置14、補助記憶装置15及び通信装置16を備える。これらは、バスで相互に接続されている。補助記憶装置15は、予測モデル31、実測値情報32、クラスタ情報33及び誤差情報34(詳細後記)を格納している。
主記憶装置14における実測値取得部21、クラスタリング部22、回帰分析部23及び表示処理部24は、プログラムである。中央制御装置11は、これらのプログラムを補助記憶装置15から読み出し主記憶装置14にロードすることによって、それぞれのプログラムの機能(詳細後記)を実現する。補助記憶装置15は、クラスタ分割評価装置1から独立した構成となっていてもよい。
浄水場3は、混和池4、凝集剤注入装置5及びフロック形成池7を有する。河川等の自然環境から取得された原水6aは、混和池4に流入する。凝集剤注入装置5は、混和池に貯留された原水6aに凝集剤9を注入する。凝集剤9を注入された原水6aは、急速撹拌された後、混和水6bとしてフロック形成池7に流入する。フロック形成池7に貯留された混和水6bは、緩速撹拌される。すると、コロイド状の汚濁物質が凝集し始める。凝集した汚濁物質は、その後沈殿するか、濾過される。
凝集剤9として一般に使用されている物質(薬剤)は、硫酸アルミニウム、ポリ塩化アルミニウム等である。原水中の汚濁物質はマイナスに帯電しており相互に反発している。凝集剤9が当該帯電を中和すると、汚濁物質は分子間力によって相互に引き合い大きく成長してフロックとなる。
原水の汚濁の程度を示す物理量として“濁度”が存在する。濁度は、原水1リットル当たりの汚濁物質の質量(mg)である。ある都道府県水道局のホームページによれば、一般的な河川の水の晴天時の濁度は、通常、“5”である。しかしながら、台風の直後において濁度“2600”が記録されたことがある。浄水場は、濁度が所定の基準値以下に下がるように、凝集剤注入率を決定する。凝集剤注入率は、原水1リットル当たりに注入される凝集剤の質量(mg/リットル)である。凝集剤注入率を決定する要因となる原水の性質を示す物理量としては、濁度、水素イオン濃度(pH、中性=7)、温度(水温、℃)等が存在する。
そこで、濁度計8a、pHメータ8b及び温度計8cが、混和池4に配置され、注入量計8dが、凝集剤注入装置5に配置される。これらは、ネットワーク2を介してクラスタ分割評価装置1に接続されている。
(予測モデル)
本実施形態の予測モデル31は、以下の式1のような1次式である。
y=a+a+a+a (式1)
ここで、yは、凝集剤注入率である。xは、濁度である。xは、水素イオン濃度である。xは、水温である。a、a、a及びaは、定数(パラメータ)である。式1は、x、x及びxを説明変数としyを目的変数とする関数になっている。そして、a、a、a及びaの値を様々に変化させることによって、4次元空間における予測モデル31の形状及びその位置が様々に変化する。ここで、変数の数(種類)を“4”としたのは、あくまでも一例である。変数の数がさらに多くても、すなわち、予測モデルの次元がさらに大きくてもよい。
いま、凝集剤注入率、濁度、水素イオン濃度及び水温の過去における実測値の組合せとして、“[Y,X,X,X]”が多数存在するとする。Y、X、X及びXのそれぞれが示す物理量は、y、x、x及びxのそれぞれが示す物理量と同じである。しかしながら、説明の便宜上、実測値を大文字で示し、予測モデルの変数を小文字で示している。予測モデルの出力(目的変数)yは、“予測値”である。“Y−y”を誤差と呼ぶ。クラスタ分割評価装置1は、実測値の組合せを使用して、誤差の2乗和“Σ(Y−y)”を最小にするパラメータの組合せ“[a,a,a,a]”を決定する(詳細後記)。
(実測値情報)
図2は、実測値情報32の一例である。実測値情報32においては、時刻欄101に記憶された時刻に関連付けて、目的変数欄102には目的変数の実測値が、説明変数欄103には説明変数の実測値が記憶されている。
時刻欄101の時刻は、説明変数の実測値及び目的変数の実測値が、濁度計8a、pHメータ8b、温度計8c及び注入量計8dによって取得された時刻である。時刻t1、t2、t3、・・・は、時刻を省略的に示している。数字が大きいほど、後の時刻である。
目的変数欄102の目的変数の実測値は、注入量計8dが計測した凝集剤注入率の実測値である。“#”は、異なる値を省略的に示している(以下同様)。
説明変数欄103の説明変数の実測値は、濁度計8aが計測した原水の濁度(欄103a)、pHメータ8bが計測した原水の水素イオン濃度(欄103b)及び温度計8cが計測した原水の温度(欄103c)である。
(クラスタリング)
多次元空間に描画された多くの点を、位置が近いもの同士でグループ分けすることを一般に“クラスタリング”と呼ぶ。クラスタリングの手法として、“k−平均法”がよく知られている。クラスタ分割評価装置1もまた、以下の(1)〜(5)のようにk−平均法を使用する。
(1)クラスタ分割評価装置1は、複数の点のそれぞれを、k個のグループのいずれかに適当に所属させる。
(2)クラスタ分割評価装置1は、あるグループの重心から当該グループに属する点までの距離の2乗和dをグループごとに算出する。iは、グループの番号(i=1、2、・・・、k)である。
(3)クラスタ分割評価装置1は、1個の点の所属をあるグループから他のグループに変えたうえで、D=Σdを算出する。Dは、k個のグループのdの総和である。クラスタ分割評価装置1は、所属を変える点及び新たな所属先のすべての組合せごとに当該処理を繰り返す。
(4)クラスタ分割評価装置1は、Dを最小にするような、各点の所属を決定する。
(5)クラスタ分割評価装置1は、kを1、2、3、・・・と変化させたうえで、(1)〜(4)の処理を繰り返す。
(クラスタ情報)
図3は、クラスタ情報33の一例である。クラスタ情報33においては、時刻欄111に記憶された時刻に関連付けて、目的変数欄112には目的変数の実測値が、説明変数欄113には説明変数の実測値が、所属クラスタID欄114には所属クラスタIDが記憶されている。
時刻欄111の時刻は、図2の時刻と同じである。
目的変数欄112の目的変数の実測値は、図2の目的変数の実測値と同じである。
説明変数欄113の説明変数の実測値は、図2の説明変数の実測値のうちの原水の濁度(欄103a)である。説明の単純化のため、図3の説明変数は、“濁度”だけとしている。
所属クラスタID欄114は、クラスタの数ごとに、クラスタ数1欄114a、クラスタ数2欄114b、クラスタ数3欄114c、クラスタ数4欄114d、・・・に分かれている。そして分かれた各欄に、クラスタIDが記憶されている。クラスタIDは、クラスタを一意に特定する識別子である。各クラスタは、四季、天候等の運転条件に対応している。一般に、浄水場は、この運転条件に応じて、凝集剤注入率を含む様々な数値(運転パタン)を決定する。なお、“c3”及び“c10”のように、所属する点が結果的に同じになったとしても、クラスタの数が異なれば、異なるクラスタIDが採番されている(Dを算出し直しているため)。
図4〜図7は、クラスタと予測モデル31との関係を説明する図である。図4は、図3のクラスタ数1欄114aに対応している。図4の座標平面の横軸は説明変数(濁度)であり、縦軸は目的変数(凝集剤注入率)である。座標平面上に、時刻t1〜t20に対応する20個の点●が描画されている(図5〜図7においても同様)。円c1は、クラスタc1を表している。直線31aは、予測モデル31(図1)を表している。予測モデルの作成方法については後記する。
図5は、図3のクラスタ数2欄114bに対応している。円c2は、クラスタc2を表している。円c3は、クラスタc3を表している。直線31bは、予測モデル31(図1)を表している。直線31cも、予測モデル31(図1)を表している。
図6は、図3のクラスタ数3欄114cに対応している。図7は、図3のクラスタ数4欄114dに対応している。図6及び図7の説明は、図5の説明に準ずる。
なお、図4〜図7においては、作図上の制約に起因し、円c1等の中心は、クラスタc1等の重心(すべての点●の座標値の平均)とはなっていない。
図4〜図7において、クラスタ分割評価装置1は、クラスタごとに、当該クラスタに所属する実測点●のみを使用して、予測モデルを作成している。クラスタ分割評価装置1が予測モデル“y=a+a”を作成する方法は、以下の(11)〜(17)の通りである。
(11)クラスタ分割評価装置1は、無作為的に発生させたパラメータa及びaの値を予測モデルのa及びaに代入する。
(12)クラスタ分割評価装置1は、実測値Xを予測モデルのxに代入し、yを算出する。
(13)クラスタ分割評価装置1は、誤差“Y−y”を算出する。
(14)クラスタ分割評価装置1は、時刻ごとに [X,Y]の値を変化させて前記(12)及び前記(13)の処理を繰り返す。
(15)クラスタ分割評価装置1は、各時刻の“(Y−y)”の総和である“Σ(Y−y)”を算出する。
(16)クラスタ分割評価装置1は、無作為的に発生させたパラメータa及びaの他の値を予測モデルのa及びaに代入したうえで、前記(12)〜(15)の処理を充分多い回数だけ繰り返す。
(17)クラスタ分割評価装置1は、“Σ(Y−y)”を最小にするパラメータa0S及びa1Sの値を決定する。ここで“S”は、“最適化されている”ことを示す。
(誤差)
図8は、誤差を説明する図である。図8の座標平面の横軸は濁度であり、縦軸は凝集剤注入率である。20個の点●は、図3における実測値の組合せ[X,Y]を示している。直線31aは、予測モデル31(図1)であり、その式は、“y=a0S+a1S”である。点●のそれぞれについて、誤差“Y−y”が定義される。前記したように、“Σ(Y−y)”は最小化されてはいるが、個々の点●に注目した場合、誤差が殆どないものと、誤差が比較的大きいものとが混在している。
(誤差情報)
図9は、誤差情報34の一例である。誤差情報34においては、クラスタ数欄121に記憶されたクラスタ数に関連付けて、誤差欄122には誤差が、誤差評価値欄123には誤差評価値が記憶されている。
クラスタ数欄121のクラスタ数は、クラスタの数である。
誤差欄122の誤差は、“√(Σ(Y−y)/n)”である。ここで、nは、クラスタ内の点●の数である。“√(Σ(Y−y)/n)”は、図8における誤差の2乗和の平均の平方根である。“#”に付された括弧内には、クラスタIDが記載されている。
誤差評価値欄123の誤差評価値は、誤差を加工して得られる任意の値であり、その値が小さいほど、クラスタ数に対する評価は高い。誤差評価値は、例えば、誤差情報34のレコード(行)に含まれる誤差の平均、誤差の最小値、誤差の分散等である。なお、誤差評価値の定義の仕方によっては、その値が大きいほど、クラスタ数に対する評価が高い場合もある。
(処理手順)
図10は、処理手順のフローチャートである。処理手順を開始する前提として、実測値情報32(図2)が、完成された状態で補助記憶装置15に格納されているものとする。
ステップS201において、クラスタ分割評価装置1の実測値取得部21は、実測値を取得する。具体的には、実測値取得部21は、補助記憶装置15から実測値情報32(図2)を取得する。
ステップS202において、クラスタ分割評価装置1のクラスタリング部22は、変数を受け付ける。具体的には、クラスタリング部22は、複数の説明変数の一部又は全部をユーザが入力装置12を介して選択するのを受け付ける。例えば、ユーザが説明変数のうち濁度のパラメータの値aがaを除くすべてのパラメータのうちで最も大きくなりそうである、すなわち、濁度が目的変数に与える影響が最も大きくなりそうであると予測している場合、ユーザは“濁度”を選択してもよい。ここでは、ユーザは“濁度”を選択したとする。
ステップS203において、クラスタリング部22は、クラスタ数の最大値等を受け付ける。具体的には、クラスタリング部22は、クラスタ数の最小値及び最大値、並びに、
1つのクラスタに含まれる点●(クラスタ情報33のレコード数)の最小値をユーザが入力装置12を介して選択するのを受け付ける。ここでは、ユーザはクラスタ数の最小値として“1”、クラスタ数の最大値として“4”、1つのクラスタに含まれる点●の最小値として“4”を入力したとする。
ステップS204において、クラスタリング部22は、クラスタリングを行う。具体的には、第1に、クラスタリング部22は、実測値情報32(図2)から、“濁度”以外の説明変数の欄を削除する。
第2に、クラスタリング部22は、前記したk−平均法を使用して、実測値情報32(図2)の20個の点●“[X,Y]=[濁度,凝集剤注入率]”を、k個(k=1、2、3、4)のクラスタに分割する。このとき、クラスタリング部22は、いずれのクラスタにも少なくとも4個の点●が含まれるようにする。
ステップS205において、クラスタリング部22は、クラスタ情報33(図3)を作成する。具体的には、クラスタリング部22は、ステップS204の“第2”におけるクラスタリングの結果に基づきクラスタ情報33を作成する。
ステップS206において、クラスタ分割評価装置1の回帰分析部23は、予測モデル31を作成する。具体的には、回帰分析部23は、ユーザが画面上で予測モデルの数式を記述するのを受け付け、又は、一般的な予測モデルのひな型を画面表示し、ユーザが選択するのを受け付ける。ここで作成される予測モデル31は、前記した式1のような1次式である必要はなく、高次式であってもよいし、指数、対数等を含む非線形の式であってもよい。ただし、予測モデル31は、ステップS202において受け付けた各変数についてのパラメータ(この段階では値は未知である)を含むものとする。
ステップS207において、回帰分析部23は、クラスタごとにパラメータを最適化する。具体的には、回帰分析部23は、前記した方法で、予測モデルのパラメータをクラスタごとに決定する。つまり、回帰分析部23は、実測値情報32(図3)の時刻t1〜t20の実測値のうち、処理対象のクラスタに属するものを使用して、“Σ(Y−y)”を最小にするパラメータを決定する。
ステップS208において、回帰分析部23は、誤差情報34(図9)を作成する。具体的には、第1に、回帰分析部23は、誤差情報34を作成する。ここで作成される誤差情報34は、4本のレコードを有し、クラスタ数欄121には、“1”、“2”、“3”及び“4”が記憶されている。誤差欄122及び誤差評価値欄123は、空欄である。
第2に、回帰分析部23は、ステップS207において最小となった“Σ(Y−y)”を使用して、誤差“√(Σ(Y−y)/n)”を算出し、誤差欄122に記憶する。
第3に、回帰分析部23は、各レコードの誤差に基づいて、誤差評価値を算出し、誤差評価値欄123に記憶する。
ステップS209において、回帰分析部23は、誤差評価値に基づきクラスタ数を決定する。なお、本実施形態では、具体的には、回帰分析部23は、誤差評価値が最小であるレコードのクラスタ数を決定する。
ステップS210において、クラスタ分割評価装置1の表示処理部24は、決定したクラスタ数及び誤差評価値を表示する。具体的には、第1に、表示処理部24は、ステップS209において決定したクラスタ数及びそのクラスタ数に対する誤差評価値を出力装置13に表示する。ここでは、“クラスタ数=4”が表示されたとする。
第2に、表示処理部24は、4個のクラスタc7、c8、c9及びc10に対応する予測モデル31g、31h、31i及び31j(図7)を補助記憶装置15に記憶する。その後、処理手順を終了する。
(予測モデルの活用)
ステップS210の“第1”において“クラスタ数=4”が表示されたという前提で、その後の予測モデルの活用方法を説明する。クラスタc7は、図3の時点t1〜t4に対応している。時点t1〜t4は、例えば前年のある特定の季節(快晴が続く等)である。回帰分析部23は、翌年同月同日の凝集剤注入率を予測する場合、予測モデル31gを使用する。クラスタc10は、図3の時点t17〜t20に対応している。時点t17〜t20は、例えば前年のある他の特定の季節(梅雨が続く等)である。回帰分析部23は、翌年同月同日の凝集剤注入率を予測する場合、予測モデル31jを使用する。他のクラスタについても同様である。
(処理手順の変形例)
前記では、クラスタリング部22は、すべてのクラスタ数についてクラスタリングを行い、回帰分析部23は、すべてのクラスタ数について誤差評価値を算出している(総当たり処理)。しかしながら、クラスタ数k=1、2、3、4の降順又は昇順に、クラスタリング部22がクラスタリングを行い、回帰分析部23が誤差評価値を算出する処理を繰り返してもよい。この場合、所定の閾値(目標)に誤差評価値が達するまで、又は、誤差評価値の対前回比減少分が所定の閾値以下になるまで、クラスタリング部22及び回帰分析部23は処理を繰り返す。
(本実施形態の効果)
本実施形態のクラスタ分割評価装置の効果は以下の通りである。
(1)クラスタ分割評価装置は、運転条件ごとに精度の高い予測モデルを作成することができる。
(2)クラスタ分割評価装置は、期待し得る誤差評価値及び運転条件に対応するクラスタ数を表示することができる。
(3)クラスタ分割評価装置は、ユーザがクラスタの数及び大きさを指定することを可能にする。
(4)クラスタ分割評価装置は、浄水場における凝集剤注入率の予測に適用することができる。
なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は、本発明を分かり易く説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、前記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウエアで実現してもよい。また、前記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウエアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、又は、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。
1 クラスタ分割評価装置
2 ネットワーク
3 浄水場
4 混和池
5 凝集剤注入装置
6a 原水
6b 混和水
7 フロック形成池
8a 濁度計
8b pHメータ
8c 温度計
8d 注入量計
9 凝集剤
11 中央制御装置
12 入力装置
13 出力装置
14 主記憶装置
15 補助記憶装置
16 通信装置
21 実測値取得部
22 クラスタリング部
23 回帰分析部
24 表示処理部
31 予測モデル
32 実測値情報
33 クラスタ情報
34 誤差情報

Claims (7)

  1. 浄水場が取得する原水の性質を示す値の実測値、及び、前記原水に注入された薬剤の量を示す値の実測値を取得する実測値取得部と、
    前記原水の性質を示す値の実測値及び前記原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部と、
    前記実測値を使用して、前記原水の性質を示す値を説明変数とし前記薬剤の量を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
    前記パラメータが最適化された予測モデルが出力する前記薬剤の量を示す値の予測値と、前記薬剤の量を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
    評価の結果に基づき、前記クラスタの数を決定する回帰分析部と、
    を備えることを特徴とするクラスタ分割評価装置。
  2. 前記決定したクラスタの数、及び、当該クラスタの数に対応する評価の結果を表示する表示処理部を備えること、
    を特徴とする請求項1に記載のクラスタ分割評価装置。
  3. 前記クラスタリング部は、
    前記クラスタの数の最小値及び最大値、並びに、前記クラスタが含む前記実測値の数の最小値をユーザが入力するのを受け付けること、
    を特徴とする請求項2に記載のクラスタ分割評価装置。
  4. 前記薬剤は、
    前記原水に含まれる汚濁物質を凝集させるものであり、
    前記原水の性質を示す値は、
    前記原水における濁度、前記原水の温度、及び、前記原水の水素イオン濃度のうちの少なくとも1つであること、
    を特徴とする請求項3に記載のクラスタ分割評価装置。
  5. の性質を示す値の実測値、及び、前記水に対する処理に関する値の実測値を取得する実測値取得部と、
    前記の性質を示す値の実測値及び前記水に対する処理に関する値の実測値を示す点を、多次元空間内において複数のクラスタに分割するクラスタリング部と、
    前記実測値を使用して、前記の性質を示す値を説明変数とし前記水に対する処理に関する値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
    前記パラメータが最適化された予測モデルが出力する前記水に対する処理に関する値の予測値と、前記水に対する処理に関する値の実測値との差分を、前記クラスタの数ごとに評価し、
    評価の結果に基づき、前記クラスタの数を決定する回帰分析部と、
    を備えることを特徴とするクラスタ分割評価装置。
  6. クラスタ分割評価装置の実測値取得部は、
    浄水場が取得する原水の性質を示す値の実測値、及び、前記原水に注入された薬剤の量を示す値の実測値を取得し、
    前記クラスタ分割評価装置のクラスタリング部は、
    前記原水の性質を示す値の実測値及び前記原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割し、
    前記クラスタ分割評価装置の回帰分析部は、
    前記実測値を使用して、前記原水の性質を示す値を説明変数とし前記薬剤の量を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
    前記パラメータが最適化された予測モデルが出力する前記薬剤の量を示す値の予測値と、前記薬剤の量を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
    評価の結果に基づき、前記クラスタの数を決定すること、
    を特徴とするクラスタ分割評価装置のクラスタ分割評価方法。
  7. クラスタ分割評価装置の実測値取得部に対し、
    浄水場が取得する原水の性質を示す値の実測値、及び、前記原水に注入された薬剤の量を示す値の実測値を取得する処理を実行させ、
    前記クラスタ分割評価装置のクラスタリング部に対し、
    前記原水の性質を示す値の実測値及び前記原水に注入された薬剤の量を示す値の実測値を示す点を、多次元空間内において複数のクラスタに分割する処理を実行させ、
    前記クラスタ分割評価装置の回帰分析部に対し、
    前記実測値を使用して、前記原水の性質を示す値を説明変数とし前記薬剤の量を示す値を目的変数とする予測モデルのパラメータを、前記複数のクラスタごとに最適化し、
    前記パラメータが最適化された予測モデルが出力する前記薬剤の量を示す値の予測値と、前記薬剤の量を示す値の実測値との差分を、前記クラスタの数ごとに評価し、
    評価の結果に基づき、前記クラスタの数を決定する処理を実行させること、
    を特徴とするクラスタ分割評価装置を機能させるためのクラスタ分割評価プログラム。
JP2019053445A 2019-03-20 2019-03-20 クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム Active JP6637206B1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019053445A JP6637206B1 (ja) 2019-03-20 2019-03-20 クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム
CN202080018786.3A CN113557538A (zh) 2019-03-20 2020-03-18 聚类分割评价装置、聚类分割评价方法以及聚类分割评价程序
PCT/JP2020/011917 WO2020189706A1 (ja) 2019-03-20 2020-03-18 クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019053445A JP6637206B1 (ja) 2019-03-20 2019-03-20 クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム

Publications (2)

Publication Number Publication Date
JP6637206B1 true JP6637206B1 (ja) 2020-01-29
JP2020154825A JP2020154825A (ja) 2020-09-24

Family

ID=69183651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019053445A Active JP6637206B1 (ja) 2019-03-20 2019-03-20 クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム

Country Status (3)

Country Link
JP (1) JP6637206B1 (ja)
CN (1) CN113557538A (ja)
WO (1) WO2020189706A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022239264A1 (ja) 2021-05-12 2022-11-17
CN117009303B (zh) * 2023-07-06 2024-02-13 苏州领威电子科技有限公司 一种芯片视觉测试数据的存储方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4509860B2 (ja) * 2005-05-25 2010-07-21 株式会社東芝 データ分割装置、データ分割方法およびプログラム
JP2009294731A (ja) * 2008-06-02 2009-12-17 Toshiba Corp 運用ノウハウを自動抽出するプラント制御装置
JP5391637B2 (ja) * 2008-10-10 2014-01-15 日本電気株式会社 データ類似度計算システム、データ類似度計算方法およびデータ類似度計算プログラム
JP5208061B2 (ja) * 2009-06-29 2013-06-12 株式会社日立製作所 凝集剤注入制御システム
JP5722371B2 (ja) * 2013-03-14 2015-05-20 株式会社東芝 ノウハウ可視化装置及びノウハウ可視化方法
CN106991524A (zh) * 2017-03-20 2017-07-28 国网江苏省电力公司常州供电公司 一种台区线损率预估方法
CN106951993A (zh) * 2017-03-20 2017-07-14 国网江苏省电力公司常州供电公司 一种电能量数据预估方法
US11610083B2 (en) * 2017-08-03 2023-03-21 Tohoku University Method for calculating clustering evaluation value, and method for determining number of clusters

Also Published As

Publication number Publication date
WO2020189706A1 (ja) 2020-09-24
JP2020154825A (ja) 2020-09-24
CN113557538A (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
Font-Clos et al. Topography of epithelial–mesenchymal plasticity
Bayer et al. Tiebout sorting, social multipliers and the demand for school quality
JP6637206B1 (ja) クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム
Pontius Jr et al. Accuracy assessment for a simulation model of Amazonian deforestation
Krakauer Darwinian demons, evolutionary complexity, and information maximization
Zareian et al. The effect of climate change on watershed water balance
CN108647492B (zh) 一种染色质拓扑相关结构域的表征方法及装置
Thorne et al. Inference of temporally varying Bayesian networks
JP2020154826A (ja) 予測モデル作成装置、予測モデル作成方法及び予測モデル作成プログラム
Brentan et al. Water demand time series generation for distribution network modeling and water demand forecasting
Yuan et al. A system dynamics simulation model for water conflicts in the Zhanghe River Basin, China
Zhang et al. Is there a spatial relationship between urban landscape pattern and habitat quality? Implication for landscape planning of the yellow river basin
Sijben et al. Multi-modal multi-objective model-based genetic programming to find multiple diverse high-quality models
JP5110891B2 (ja) 水処理施設における流入水水質の統計的予測方法及びその装置
Nabel Upscaling with the dynamic two-layer classification concept (D2C): TreeMig-2L, an efficient implementation of the forest-landscape model TreeMig
Li et al. Multi-Scenario Simulation of Ecosystems Based on Adaptive Restoration to Promote Human–Nature Harmony: A Case Study of Loess Hills Micro-Watershed
JP7045531B1 (ja) プラント運転支援システム、プラント運転支援方法、およびプラント運転支援プログラム
Curry et al. Finding general equilibria in many-agent economic simulations using deep reinforcement learning
Sheremetiev et al. Modern and Cretaceous–Cenozoic diversification of angiosperms
Mu et al. A general model for creating robust choropleth maps
Aderhold et al. Reconstructing ecological networks with hierarchical Bayesian regression and Mondrian processes
Chrobak et al. Combining indicators for better decisions–Algorithms vs experts on lakes ecological status assessment
CN110543613A (zh) 一种多尺度滑窗计算和显示梁-克里曼信息流的方法
JP7438723B2 (ja) 製造プロセスの適正化システムおよびその方法
CN103400192A (zh) 一种基于triz理论的技术经济寿命的评估方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190320

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190320

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190401

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190903

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191017

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191219

R150 Certificate of patent or registration of utility model

Ref document number: 6637206

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150