JP6609808B2 - 決定木学習アルゴリズムを用いた予測プログラム、装置及び方法 - Google Patents

決定木学習アルゴリズムを用いた予測プログラム、装置及び方法 Download PDF

Info

Publication number
JP6609808B2
JP6609808B2 JP2016002285A JP2016002285A JP6609808B2 JP 6609808 B2 JP6609808 B2 JP 6609808B2 JP 2016002285 A JP2016002285 A JP 2016002285A JP 2016002285 A JP2016002285 A JP 2016002285A JP 6609808 B2 JP6609808 B2 JP 6609808B2
Authority
JP
Japan
Prior art keywords
explanatory variable
prediction
explanatory
decision tree
variable group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016002285A
Other languages
English (en)
Other versions
JP2017123088A (ja
Inventor
雅昭 泉
浩平 有吉
秀一郎 古瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YE Digital Co Ltd
Original Assignee
YE Digital Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YE Digital Co Ltd filed Critical YE Digital Co Ltd
Priority to JP2016002285A priority Critical patent/JP6609808B2/ja
Publication of JP2017123088A publication Critical patent/JP2017123088A/ja
Application granted granted Critical
Publication of JP6609808B2 publication Critical patent/JP6609808B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Separation Of Suspended Particles By Flocculating Agents (AREA)
  • Treatment Of Water By Oxidation Or Reduction (AREA)
  • Water Treatment By Sorption (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、決定木学習アルゴリズムを用いて予測する技術に関する。
近年、機械学習の技術分野によれば、例えばR(The R Foundation for Statistical Computing Platform)のようなパッケージが、フリーソフトウェアとしてGNU(General Public License)から配布されている。そのために、機械学習に特別な知識を要することなく、様々なソリューションシステムに適用されてきている。機械学習の中でも、決定木学習アルゴリズムのような教師有り学習は、人間の勘や経験、ノウハウによって調整されてきた過去の膨大なデータを用いることができる。
また、ソリューションシステムとして、例えば浄水場の水処理システムへの適用を想定することもできる。浄水場は、水処理工程の中で、凝集用のPAC(ポリ塩化アルミニウム)と殺菌用の次亜塩素酸との薬品注入率を制御している。これによって、ろ過池で凝集フロックを除去することができ、処理水の水質を目標値とすることができる。
従来技術によれば、水処理システムにおける凝集処理について、PAC注入率や次亜塩素酸注入率は、原水の濁度に応じて比例制御する技術がある(例えば特許文献1,2参照)。また、ジャーテストと称される水質に対する薬品注入率を実験で算定し、単なる比例制御ではなく、水質と薬品注入率と対応付けて制御する技術もある。
既存の水処理システムによれば、各工程で検出されるセンシングデータに基づいて、オペレータ(熟練技術者)が多大の時間で蓄積された勘と経験、ノウハウに依存して、薬品注入量が調整されている。これに対し、ニューラルネットワークを用いて、複数の注入条件で、PAC注入率や活性炭注入率に基づく処理水の水質を予測する技術もある(例えば特許文献3参照)。この技術によれば、膜ろ過方式であって、超微細な細孔を持つ膜に圧力差を利用して原水を通し、膜の孔径よりも大きな原水中の不純物を分離して除去するものである。
特開2007−61800号公報 特開2007−185610号公報 特開2012−213759号公報
決定木学習アルゴリズムのような教師有り学習によれば、過去長期間の膨大な教師データを用いることによって予測モデルを構築し、その予測モデルを用いて将来的なデータを予測することができる。しかしながら、実運用中における直近短期間のデータに変化があっても、過去長期間の教師データによって構築された予測モデルにおける予測精度に依存するという問題があった。一方で、直近短期間のデータのみで予測モデルを構築しても、過去の教師データの振る舞いを反映することはできない。
また、決定木学習アルゴリズムによれば、予測に無関係なデータ(説明変数)が多いと予測精度が上がらないという問題もある。更に、過去長期間の膨大な教師データのみを用いた場合、その教師データの一部に抜けがあると、最適な予測モデルを構築できなくなるという問題もある。
このような問題は、機械学習を、水処理システムに適用した場合にも顕著に現れる。即ち、過去長期間に運用された膨大な薬品注入率のデータに基づいて決定木学習アルゴリズムの予測モデルを構築しても、大雨や藻類の増殖などに起因する突発的な原水濁度の変化に対応できない。即ち、原水濁度に応じて薬品注入率を比例制御しても、ニューラルネットワークを用いても、この問題を解決することは極めて難しい。
そこで、本発明によれば、決定木学習アルゴリズムのような教師有り学習であっても、過去長期間の膨大な教師データに対して、直近短期間の教師データに変化があっても、予測モデルにおける予測精度を高めることができる予測プログラム、装置及び方法を提供することを目的とする。特に、水処理システムに適用した場合、過去長期間に運用された膨大な薬品注入率のデータに基づく予測モデルを構築しても、大雨や藻類の増殖などに起因する突発的な原水濁度の変化に対応して薬品注入率を決定することができる。
本発明によれば、過去長期間に時系列に取得された異なる種類の説明変数全群を記憶し、次の時点の予測対象種類の予測値を算出するようにコンピュータに実行させる予測プログラムにおいて、
学習段階として、
説明変数全群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第1の所定数の第1の説明変数群を抽出する第1のステップと、
第1の説明変数群に含まれる説明変数毎に、直近短期間に時系列に取得された第2の説明変数群を取得する第2のステップと、
第2の説明変数群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第2の所定数の第3の説明変数群を抽出する第3のステップと、
第3の説明変数群を教師データとして、決定木学習アルゴリズムにおける予測モデルを作成する第4のステップと
を有し、
運用段階として、第3の説明変数群に対応する直近短期間の説明変数群を、予測モデルに基づく決定木学習アルゴリズムに入力し、次の時点の予測対象種類の予測値を算出する
ようにコンピュータに実行させることを特徴とする。
本発明の予測プログラムにおける他の実施形態によれば、
決定木学習アルゴリズムは、ランダムフォレスト(Random Forest)である
ようにコンピュータに実行させることも好ましい。
本発明の予測プログラムにおける他の実施形態によれば、
説明変数は、実測値、複数の実測値の積算値、又は、複数の実測値の平均値であり、
過去長期間は、年単位の実測期間に基づくものであり、
直近短期間は、現時点から過去に時間単位の実測期間に基づくものである
ようにコンピュータに実行させることも好ましい。
本発明の予測プログラムにおける他の実施形態によれば、
説明変数は、水処理システムにおけるセンシングデータ及び薬品注入データであり、
予測値は、次の時点の薬品注入データである
ようにコンピュータに実行させることも好ましい。
本発明の予測プログラムにおける他の実施形態によれば、
センシングデータは、原水水温、原水濁度、前処理水濁度、前処理水pH値、中間処理遊離残留塩素値、ろ過池水圧、ろ過池ろ過時間、浄水濁度、配水池水位の1つ以上であり、
薬品注入データは、前次亜塩素酸注入率、活性炭注入率、PAC(ポリ塩化アルミニウム)注入率、中次亜塩素酸注入率、硫酸バンド注入率、後次亜塩素酸注入率の1つ以上であるようにコンピュータに実行させることも好ましい。
本発明の予測プログラムにおける他の実施形態によれば、
センシングデータ又は薬品注入データについて、任意の種類の所定時刻で記録されていない場合、当該種類における所定時刻の直近短期間の実測値の平均値によって、所定時刻の当該説明変数を補間する
ようにコンピュータに実行させることも好ましい。
本発明によれば、前述した予測プログラムをコンピュータによって実行する水処理予測サーバであって、
水処理システムの各工程に設置されたセンサ又はコントローラから、センシングデータ及び薬品注入データを逐次受信するデータ受信手段と、
予測された薬品注入データを、ユーザ操作の端末へ送信する予測結果送信手段と
を更に有することを特徴とする。
本発明によれば、過去長期間に時系列に取得された異なる種類の説明変数全群を記憶し、次の時点の予測対象種類の予測値を算出する予測装置において、
学習段階として、
説明変数全群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第1の所定数の第1の説明変数群を抽出する第1の説明変数群抽出手段と、
第1の説明変数群に含まれる説明変数毎に、直近短期間に時系列に取得された第2の説明変数群を取得する第2の説明変数群抽出手段と、
第2の説明変数群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第2の所定数の第3の説明変数群を抽出する第3の説明変数群抽出手段と、
第3の説明変数群を教師データとして、決定木学習アルゴリズムにおける予測モデルを作成する予測モデル作成手段と
を有し、
運用段階として、第3の説明変数群に対応する直近短期間の説明変数群を、予測モデルに基づく決定木学習アルゴリズムに入力し、次の時点の予測対象種類の予測値を算出する
ことを特徴とする。
本発明によれば、過去長期間に時系列に取得された異なる種類の説明変数全群を記憶し、次の時点の予測対象種類の予測値を算出する装置の予測方法において、
装置は、
学習段階として、
説明変数全群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第1の所定数の第1の説明変数群を抽出する第1のステップと、
第1の説明変数群に含まれる説明変数毎に、直近短期間に時系列に取得された第2の説明変数群を取得する第2のステップと、
第2の説明変数群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第2の所定数の第3の説明変数群を抽出する第3のステップと、
第3の説明変数群を教師データとして、決定木学習アルゴリズムにおける予測モデルを作成する第4のステップと
を実行し、
運用段階として、第3の説明変数群に対応する直近短期間の説明変数群を、予測モデルに基づく決定木学習アルゴリズムに入力し、次の時点の予測対象種類の予測値を算出する
ことを特徴とする。
本発明の予測プログラム、装置及び方法によれば、決定木学習アルゴリズムのような教師有り学習であっても、過去長期間の膨大な教師データに対して、直近短期間の教師データに変化があっても、予測モデルにおける予測精度を高めることができる予測プログラム、装置及び方法を提供することを目的とする。特に、水処理システムに適用した場合、過去長期間に運用された膨大な薬品注入率のデータに基づく予測モデルを構築しても、大雨や藻類の増殖などに起因する突発的な原水濁度の変化に対応して薬品注入率を決定することができる。
本発明の予測サーバが設置された水処理のシステム構成図である。 本発明における予測サーバの機能構成図である。 本発明における予測方法を表すフローチャートである。 本発明における学習時点と予測時点とを表す時系列チャートである。 ランダムフォレストの機能構成図である。 水処理システムにおける学習段階のデータを表す説明図である。 本発明におけるオペレータ用の端末に表示された薬品注入ガイダンスを表す画面図である。 本発明における予測精度を表すグラフである。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図1は、本発明の予測サーバが設置された水処理のシステム構成図である。
図1における水処理システム(浄水場)は、「急速ろ過方式」を用いたものである。急速ろ過方式とは、水中の小さな濁りや細菌類などを薬品で凝集、沈殿させた後の上澄みを、砂利や砂などが敷き詰めてあるろ過池に、120〜180m/日の速度で水を流してろ過する。比較的濁りの多い河川水や湖沼水の処理に適しており、狭い敷地でも多量の水を処理できる。
図1によれば、以下の水処理工程の中で、センシングデータの取得と、薬品注入率の制御とが実行される。
[原水]
(原水温度センサ) ->予測サーバへのセンシングデータ
(原水濁度センサ) ->予測サーバへのセンシングデータ
[生物処理池]
(前処理水濁度センサ) ->予測サーバへのセンシングデータ
(前処理水PHセンサ) ->予測サーバへのセンシングデータ
[活性炭混和池]
<-(前次亜注入装置) <-予測サーバからの薬品注入率
->予測サーバへの薬品注入データ
<-(活性炭注入装置) <-予測サーバからの薬品注入率
->予測サーバへの薬品注入データ
[凝集混和池]
<-(PAC注入装置) <-予測サーバからの薬品注入率
->予測サーバへの薬品注入データ
<-(中次亜注入装置) <-予測サーバからの薬品注入率
->予測サーバへの薬品注入データ
(中間処理遊離残留塩素センサ)->予測サーバへのセンシングデータ
[急速ろ過池]
(ろ過池水圧センサ) ->予測サーバへのセンシングデータ
(ろ過池ろ過時間計測器) ->予測サーバへのセンシングデータ
(浄水濁度センサ) ->予測サーバへのセンシングデータ
[浄水池]
[配水池]
(配水池水位センサ) ->予測サーバへのセンシングデータ
尚、制御可能なものとして薬剤注入率以外にも、取水量/配水量であってもよい。
図1の水処理システムによれば、過去長期間の運用データ(センシングデータ及び薬品注入データ)を予測サーバによって学習させることにより、その浄水場に適した予測モデルを作成することができる。これによって、例えば現時点から1時間後の薬品注入率を予測することができる。これは、浄水場の構造や規模に関係なく適用でき、オペレータにおける過去長期間の経験値を用いて薬品注入率を制御することができる。
浄水場の運用について、各種センサのアナログ信号を、コントローラとしてのテレメータやPLC(Programmable Logic Controller)で集約する。水処理システムの工程は、SCADA(Supervisory Control And Data Acquisition)は、コンピュータによるシステム監視とプロセス制御を行う産業制御システムである。SCADAは、HMI(Human Machine Interface)とリンクしており、現場のオペレータに対して運用データを明示する。ビッグデータ分析ではセンシング値を速やかにクラウドの管理サーバへ送信する必要があるため、既存設備に影響をあたえないよう、PLCからデータを収集してクラウドサーバへデータを送信する。
尚、本発明の予測サーバ、プログラム及び方法は、水処理システムの実施形態に限定されるものではなく、様々な用途のソリューションシステムに適用することができる。以下では、実施形態を説明する上で、水処理システムに適用して説明する。
本発明の予測サーバ1は、学習段階と運用段階とに区別して実行される。
学習段階とは、過去長期間の教師データ(説明変数)を用いて、決定木学習エンジンの予測モデルを作成する。
運用段階とは、作成された予測モデルの決定木学習エンジンを用いて、直近短期間のデータ(説明変数)から、将来のデータを予測する
図2は、本発明における予測サーバの機能構成図である。
図3は、本発明における予測方法を表すフローチャートである。
図4は、本発明における学習時点と予測時点とを表す時系列チャートである。
図1によれば、予測サーバ1は、運用段階として、データ受信部111と、決定木学習エンジン110と、予測結果送信部112とを有する。また、学習段階として、データベース120と、第1の説明変数抽出部121と、第2の説明変数抽出部122と、第3の説明変数抽出部123と、予測モデル作成部124とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現できる。また、これら機能構成部の処理の流れは、予測方法としても理解できる。
[決定木学習エンジン110]
決定木学習エンジン110は、機械学習のアルゴリズムとして「ランダムフォレスト(Random Forest)」を用いる。ランダムフォレストとは、決定木を弱学習器とする集団(アンサンブル)学習アルゴリズムであって、ランダムサンプリングされた説明変数によって学習した多数の決定木を構築する。ランダムフォレストを利用する理由として、説明変数の寄与度(重要度)を算出することができる。本発明によれば、決定木学習エンジンであればよいが、説明変数の寄与度(重要度)を算出可能なアルゴリズムであることを要する。
図5は、ランダムフォレストの機能構成図である。
ランダムフォレストは、大量の説明変数を、ブートストラップサンプリングによってB組のサブサンプルに分類する。サブサンプル毎に、計算負荷の低い決定木の機械学習アルゴリズムを用いて学習モデルを生成する。そして、B組のサブサンプルを単純に多数決又は平均化する。これによって、ノイズに強く且つパフォーマンスに優れた機械学習分類モデルを作成することができる。ブートストラップサンプリングによって、説明変数同士の相関が低い決定木群を作成し、学習の偏りを避けることができる。ランダムフォレストは、膨大な数の説明変数であっても十分に機能する。また、サブサンプル毎の決定木の学習は、完全に独立しているので、並列処理が可能であって高速に実行することできる。
ランダムフォレストの決定木学習アルゴリズムは、例えばRの{randomForest}パッケージのrandomForest関数を用いることができる。また、ランダムフォレストは、分類モデルであっても、回帰と同じように説明変数毎に寄与度(重要度)を算出することができる。これには、importance関数を用いることができる。
<学習段階S12>
[データベース120]
データベース120は、過去長期間に時系列に取得された異なる種類の説明変数全群を記憶する。説明変数は、具体的には、1時間毎に計測及び制御された運用データ(センシングデータ及び薬品注入率)であって、学習期間として例えば過去1年分(年単位の実測期間)のものである。
説明変数は、実測値、複数の実測値の積算値、又は、複数の実測値の平均値であり、
センシングデータ又は薬品注入データについて、任意の種類の所定時刻で記録されていない場合、当該種類について所定時刻の直近短期間の実測値における平均値によって、所定時刻の当該説明変数を補間する。
[第1の説明変数抽出部121(S121)]
第1の説明変数抽出部121は、説明変数全群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第1の所定数の第1の説明変数群を抽出する。
図6は、水処理システムにおける学習段階のデータを表す説明図である。
図6(a)によれば、説明変数全群は、図1の水処理システムにおけるセンシングデータ及び薬品注入データである。
センシングデータは、原水水温、原水濁度、前処理水濁度、前処理水pH値、中間処理遊離残留塩素値、ろ過池水圧、ろ過池ろ過時間、浄水濁度、配水池水位の1つ以上である。
薬品注入データは、前次亜塩素酸注入率、活性炭注入率、PAC(ポリ塩化アルミニウム)注入率、中次亜塩素酸注入率、硫酸バンド注入率、後次亜塩素酸注入率の1つ以上である。
これら説明変数は、決定木学習エンジン110へ入力され、説明変数毎の寄与度を算出する。ここでの予測値は、次の時点の薬品注入率となる。
図6(b)によれば、寄与度の高い順に上位から、例えば20件(第1の所定数)の第1の説明変数群が抽出される。
[第2の説明変数抽出部122(S122)]
第2の説明変数抽出部122は、第1の説明変数群に含まれる説明変数毎に、直近短期間に時系列に取得された第2の説明変数群を取得する。直近短期間とは、現時点から過去に時間単位の実測期間に基づくものである。
図6(c)によれば、図6(b)によって選択された20件の第1の説明変数群について、その説明変数毎に過去6時間(直近短期間)に取得された1時間毎の説明変数を取得する。例えば第1の説明変数群に含まれる「原水濁度」について、直近6時間における1時間毎の6個の説明変数を取得する。
原水濁度-> 原水濁度1h、原水濁度2h、原水濁度3h、
原水濁度4h、原水濁度5h、原水濁度6h
第1の説明変数群が20件であるならば、各6時間分で、20件×6時間=120件の第2の説明変数群を取得する。
[第3の説明変数抽出部123(S123)]
第3の説明変数抽出部123は、第2の説明変数群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第2の所定数の第3の説明変数群を抽出する。
図6(c)の120件の第2の説明変数群を、決定木学習エンジン110へ入力し、説明変数毎の寄与度を算出する。
図6(d)によれば、寄与度の高い順に上位から、例えば40件(第3の所定数)の第3の説明変数群が抽出される。
[予測モデル作成部124(S124)]
予測モデル作成部124は、第3の説明変数群を教師データとして、決定木学習アルゴリズムにおける予測モデルを作成する。
尚、説明変数の数は、例えば以下のような関係にあるのが好ましい。
説明変数全群の数 > 第1の説明変数群の数
第1の説明変数群の数 << 第2の説明変数群の数
第2の説明変数群の数 >> 第3の説明変数群の数
第1の説明変数群の数 < 第3の説明変数群の数
<運用段階S11>
[データ受信部111(S111)]
データ受信部111は、データ(説明変数)を受信する。水処理システム用の予測サーバ1によれば、水処理システムの各工程に設置されたセンサ又はコントローラから、センシングデータ及び薬品注入率を、説明変数として逐次、受信する。そして、そのデータを、決定木学習エンジン110及びデータベース120へ出力する。
[決定木学習エンジン110(S110)]
決定木学習エンジン110は、運用段階として、第3の説明変数群に対応する直近短期間の説明変数群を、リアルタイムに入力する。決定木学習アルゴリズムには、学習段階S12で作成された予測モデルに基づくものである。図4のS110を参照すると、現時点となる実測時点(運用時点)の過去6時間分に対応する第3の説明変数群を入力する。
そして、次の1時間後の時点の予測対象種類の予測値を算出する。予測対象種類とは、水処理システムにおける「薬品注入率」となる。具体的には、過去のセンシングデータ及び薬品注入率を用いて、未来の予測時点における薬品注入率を予測することができる。
[予測結果送信部112(S112)]
予測結果送信部112は、予測された薬品注入データ(薬品注入率)を、ユーザ操作の端末4へ送信する。水処理システムにおけるオペレータは、端末4に表示された薬品注入率を視認することによって、熟練技術者でなくても経験値の高い運用をすることができる。また、薬品を自動的に注入するコントローラに対して予測結果を送信することによって、薬品注入率の制御が可能となる。
図7は、本発明におけるオペレータ用の端末に表示された薬品注入ガイダンスを表す画面図である。
図7によれば、端末4の画面には、「PAC注入率」「活性炭注入率」「前次亜塩素酸注入率」「中次亜塩素酸注入率」毎に、予測結果としての注入率が表示されている。
図8は、本発明における予測精度を表すグラフである。
図8は、約20,000m/日の水処理能力を有する浄水場で、過去長期間1年分の運用データに基づいて、本発明によって薬品注入率を制御することによって、実績値に近い予測値を算出することを表したものである。説明変数全群は約150種類であり、学習データサンプリングは1時間周期のものである。そして、現時点から1時間後の薬品注入率を予測する。予測した薬品注入率は、3種類である。
例えば従来の回帰モデルに基づく予測精度は90%程度である。これに対し、本発明によれば、予測精度は97%程度となり、突発的な濁度変化にも対応できる精度となった。尚、予測精度の算定は、過去の運用値と本発明の予測結果とを比較して、以下の式で算出したものである。
予測精度=100−|実績値−予測値|/実績値×100
以上、詳細に説明したように、本発明の予測プログラム、装置及び方法によれば、決定木学習アルゴリズムのような教師有り学習であっても、過去長期間の膨大な教師データに対して、直近短期間の教師データの変化があっても、予測モデルにおける予測精度を高めることができる。特に、水処理システムに適用した場合、過去長期間の膨大な薬品注入率に基づく予測モデルを構築しても、大雨や藻類の増殖などに起因する突発的な原水濁度の変化に対応して薬品注入率を決定することができる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 予測サーバ
110 決定木学習エンジン
111 データ受信部
112 予測結果送信部
120 データベース
121 第1の説明変数抽出部
122 第2の説明変数抽出部
123 第3の説明変数抽出部
124 予測モデル作成部
2 水処理システム
21 生物処理池
22 活性炭混和池
23 凝集混和池
24 急速ろ過池
25 浄水池
26 配水池
3 コントローラ
4 オペレータ用の端末

Claims (9)

  1. 過去長期間に時系列に取得された異なる種類の説明変数全群を記憶し、次の時点の予測対象種類の予測値を算出するようにコンピュータに実行させる予測プログラムにおいて、
    学習段階として、
    説明変数全群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第1の所定数の第1の説明変数群を抽出する第1のステップと、
    第1の説明変数群に含まれる説明変数毎に、直近短期間に時系列に取得された第2の説明変数群を取得する第2のステップと、
    第2の説明変数群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第2の所定数の第3の説明変数群を抽出する第3のステップと、
    第3の説明変数群を教師データとして、決定木学習アルゴリズムにおける予測モデルを作成する第4のステップと
    を有し、
    運用段階として、第3の説明変数群に対応する直近短期間の説明変数群を、前記予測モデルに基づく決定木学習アルゴリズムに入力し、次の時点の予測対象種類の予測値を算出する
    ようにコンピュータに実行させることを特徴とする予測プログラム。
  2. 前記決定木学習アルゴリズムは、ランダムフォレスト(Random Forest)である
    ようにコンピュータに実行させることを特徴とする請求項1に記載の予測プログラム。
  3. 前記説明変数は、実測値、複数の実測値の積算値、又は、複数の実測値の平均値であり、
    前記過去長期間は、年単位の実測期間に基づくものであり、
    前記直近短期間は、現時点から過去に時間単位の実測期間に基づくものである
    ようにコンピュータに実行させることを特徴とする請求項1又は2に記載の予測プログラム。
  4. 前記説明変数は、水処理システムにおけるセンシングデータ及び薬品注入データであり、
    前記予測値は、次の時点の薬品注入データである
    ようにコンピュータに実行させることを特徴とする請求項1から3のいずれか1項に記載の予測プログラム。
  5. 前記センシングデータは、原水水温、原水濁度、前処理水濁度、前処理水pH値、中間処理遊離残留塩素値、ろ過池水圧、ろ過池ろ過時間、浄水濁度、配水池水位の1つ以上であり、
    前記薬品注入データは、前次亜塩素酸注入率、活性炭注入率、PAC(ポリ塩化アルミニウム)注入率、中次亜塩素酸注入率、硫酸バンド注入率、後次亜塩素酸注入率の1つ以上である
    ようにコンピュータに実行させることを特徴とする請求項4に記載の予測プログラム。
  6. 前記センシングデータ又は前記薬品注入データについて、任意の種類の所定時刻で記録されていない場合、当該種類における所定時刻の直近短期間の実測値の平均値によって、所定時刻の当該説明変数を補間する
    ようにコンピュータに実行させることを特徴とする請求項4又は5に記載の予測プログラム。
  7. 請求項4から6のいずれか1項に記載の予測プログラムをコンピュータによって実行する水処理予測サーバであって、
    水処理システムの各工程に設置されたセンサ又はコントローラから、前記センシングデータ及び前記薬品注入データを逐次受信するデータ受信手段と、
    予測された薬品注入データを、ユーザ操作の端末へ送信する予測結果送信手段と
    を更に有することを特徴とする予測サーバ。
  8. 過去長期間に時系列に取得された異なる種類の説明変数全群を記憶し、次の時点の予測対象種類の予測値を算出する予測装置において、
    学習段階として、
    説明変数全群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第1の所定数の第1の説明変数群を抽出する第1の説明変数群抽出手段と、
    第1の説明変数群に含まれる説明変数毎に、直近短期間に時系列に取得された第2の説明変数群を取得する第2の説明変数群抽出手段と、
    第2の説明変数群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第2の所定数の第3の説明変数群を抽出する第3の説明変数群抽出手段と、
    第3の説明変数群を教師データとして、決定木学習アルゴリズムにおける予測モデルを作成する予測モデル作成手段と
    を有し、
    運用段階として、第3の説明変数群に対応する直近短期間の説明変数群を、前記予測モデルに基づく決定木学習アルゴリズムに入力し、次の時点の予測対象種類の予測値を算出する
    ことを特徴とする予測装置。
  9. 過去長期間に時系列に取得された異なる種類の説明変数全群を記憶し、次の時点の予測対象種類の予測値を算出する装置の予測方法において、
    前記装置は、
    学習段階として、
    説明変数全群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第1の所定数の第1の説明変数群を抽出する第1のステップと、
    第1の説明変数群に含まれる説明変数毎に、直近短期間に時系列に取得された第2の説明変数群を取得する第2のステップと、
    第2の説明変数群を教師データとして、決定木学習アルゴリズムによって説明変数毎の寄与度を算出し、寄与度の高い順に上位から第2の所定数の第3の説明変数群を抽出する第3のステップと、
    第3の説明変数群を教師データとして、決定木学習アルゴリズムにおける予測モデルを作成する第4のステップと
    を実行し、
    運用段階として、第3の説明変数群に対応する直近短期間の説明変数群を、前記予測モデルに基づく決定木学習アルゴリズムに入力し、次の時点の予測対象種類の予測値を算出する
    ことを特徴とする装置の予測方法。
JP2016002285A 2016-01-08 2016-01-08 決定木学習アルゴリズムを用いた予測プログラム、装置及び方法 Active JP6609808B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016002285A JP6609808B2 (ja) 2016-01-08 2016-01-08 決定木学習アルゴリズムを用いた予測プログラム、装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016002285A JP6609808B2 (ja) 2016-01-08 2016-01-08 決定木学習アルゴリズムを用いた予測プログラム、装置及び方法

Publications (2)

Publication Number Publication Date
JP2017123088A JP2017123088A (ja) 2017-07-13
JP6609808B2 true JP6609808B2 (ja) 2019-11-27

Family

ID=59305902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016002285A Active JP6609808B2 (ja) 2016-01-08 2016-01-08 決定木学習アルゴリズムを用いた予測プログラム、装置及び方法

Country Status (1)

Country Link
JP (1) JP6609808B2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7005255B2 (ja) * 2017-09-29 2022-01-21 三菱重工業株式会社 評価システム、評価方法及びプログラム
JP7067895B2 (ja) * 2017-10-25 2022-05-16 株式会社東芝 末端圧力制御支援装置、末端圧力制御支援方法及びコンピュータプログラム
US20200050932A1 (en) 2017-12-25 2020-02-13 Sony Corporation Information processing apparatus, information processing method, and program
WO2019156070A1 (ja) * 2018-02-09 2019-08-15 国立大学法人静岡大学 機械学習システム及び機械学習方法
JP7126360B2 (ja) * 2018-03-01 2022-08-26 株式会社牧野フライス製作所 工具経路を生成するための方法及び装置
JP2019215743A (ja) * 2018-06-13 2019-12-19 水ing株式会社 データベースの製造方法、及び水処理または汚泥処理システム
JP7056497B2 (ja) * 2018-10-03 2022-04-19 トヨタ自動車株式会社 重回帰分析装置及び重回帰分析方法
CN109264801B (zh) * 2018-10-12 2019-08-27 中国水利水电科学研究院 基于调度和处置的渠道型饮用水源地控除刚毛藻的方法
JP2020114570A (ja) * 2019-01-17 2020-07-30 株式会社明電舎 操作値算出装置
JP7125358B2 (ja) 2019-01-30 2022-08-24 株式会社日立製作所 計算機システム及び入力データに対する予測結果の根拠に関する情報の提示方法
JP7234013B2 (ja) * 2019-04-04 2023-03-07 株式会社東芝 運転支援装置、運転支援方法及びコンピュータプログラム
JP7151604B2 (ja) * 2019-04-15 2022-10-12 日本電信電話株式会社 モデル学習装置、データ分析装置、モデル学習方法、及びプログラム
JP7257262B2 (ja) * 2019-06-06 2023-04-13 三菱重工業株式会社 評価システム、評価方法及びプログラム
JP7175250B2 (ja) * 2019-09-18 2022-11-18 鹿島建設株式会社 水位予測装置、水位予測方法及び水位予測プログラム
JP7414502B2 (ja) 2019-12-11 2024-01-16 株式会社東芝 情報処理装置、情報処理方法およびプログラム
CN112988499B (zh) * 2019-12-16 2022-10-21 阿波罗智联(北京)科技有限公司 数据处理方法、装置、电子设备和存储介质
JP7032485B2 (ja) * 2020-07-09 2022-03-08 水ing株式会社 水処理又は汚泥処理システムの運転制御方法
CN114906913B (zh) * 2022-05-31 2023-08-22 上海环保(集团)有限公司 一种基于智能学习的化学除磷精准加药系统及装置
CN115645972B (zh) * 2022-09-13 2024-04-16 安徽理工大学 一种化工制药用提取设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718315B1 (en) * 2000-12-18 2004-04-06 Microsoft Corporation System and method for approximating probabilities using a decision tree
JP2004086896A (ja) * 2002-08-06 2004-03-18 Fuji Electric Holdings Co Ltd 適応的予測モデル構築方法及び適応的予測モデル構築システム
JP5011830B2 (ja) * 2006-06-09 2012-08-29 富士通セミコンダクター株式会社 データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
JP5845117B2 (ja) * 2011-03-30 2016-01-20 メタウォーター株式会社 薬品注入制御方法及び薬品注入制御装置
US9501693B2 (en) * 2013-10-09 2016-11-22 Honda Motor Co., Ltd. Real-time multiclass driver action recognition using random forests

Also Published As

Publication number Publication date
JP2017123088A (ja) 2017-07-13

Similar Documents

Publication Publication Date Title
JP6609808B2 (ja) 決定木学習アルゴリズムを用いた予測プログラム、装置及び方法
AU2017232158B2 (en) Water treatment system and method
JP6661426B2 (ja) プロセス診断装置、プロセス診断方法及びコンピュータプログラム
JP4746385B2 (ja) 水処理プラントに適用する凝集剤注入制御装置
Heddam et al. A new approach based on the dynamic evolving neural-fuzzy inference system (DENFIS) for modelling coagulant dosage (Dos): case study of water treatment plant of Algeria
Han et al. Data-driven decision-making for wastewater treatment process
Branisavljević et al. Automatic, semi-automatic and manual validation of urban drainage data
dos Santos et al. Intelligent system for improving dosage control
JP2011197714A (ja) プロセス制御システム
Wu et al. Data-driven intelligent warning method for membrane fouling
KR20090078502A (ko) 하수처리장 공정 운영 상태 진단을 위한 방법 및 장치
CN112132700A (zh) 用于调控水质的配方决策方法
Heo et al. Digitally-transformed early-warning protocol for membrane cleaning based on a fouling-cumulative sum chart: Application to a full-scale MBR plant
Wu et al. Intelligent Warning of Membrane Fouling Based on Robust Deep Neural Network
JP2023033927A (ja) 水処理状況監視システム及び水処理状況監視方法
JP2014178878A (ja) ノウハウ可視化装置及びノウハウ可視化方法
Kale et al. Prediction of water filter bed backwash time for water treatment plant using machine learning algorithm
JP5349228B2 (ja) プラント運用のノウハウ自動抽出システム
Dologlu et al. Data driven identification of industrial reverse osmosis membrane process
JP4906799B2 (ja) 自動運転制御システム
Brauns et al. On the concept of a supervisory, fuzzy set logic based, advanced filtration control in membrane bioreactors
RAO et al. Research and development of coagulation dosage control system for a waterworks based on artificial neural network
Wei et al. Soft-sensor software design of dissolved oxygen in aquaculture
JP7422571B2 (ja) 水処理技術の装置、システム、及び方法
Kim et al. Optimizing coagulant dosage using deep learning models with large-scale data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191003

R150 Certificate of patent or registration of utility model

Ref document number: 6609808

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250