TWI715564B

TWI715564B - 預測規則生成系統、預測系統、預測規則生成方法及預測方法

Info

Publication number: TWI715564B
Application number: TW105110649A
Authority: TW
Inventors: 中園明子; 岡文美; 朝子弘之
Original assignee: 日商住友化學股份有限公司
Priority date: 2015-04-03
Filing date: 2016-04-01
Publication date: 2021-01-11
Also published as: US11225680B2; KR20240135071A; JP6501593B2; CN107531528A; TW201702186A; US20180105858A1; CN107531528B; JP2016195974A; WO2016159154A1; KR20170132329A

Abstract

本發明係生成高精度且確實地進行水處理後之水質之預測的預測規則。

預測規則生成系統1之電腦10具備：輸入部12，其輸入進行水處理之活性污泥中存在之複數種微生物各自之存在比例或該活性污泥中存在之複數種鹼基序列各自之存在比例之時間序列資料、及與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊；主成分分析部13，其對所輸入之時間序列資料進行主成分分析，算出構成時間序列資料之各時刻之資料之主成分得分；及預測規則生成部14，其基於所算出之主成分得分、及所輸入之表示水處理後之水質之水質資訊，根據複數種微生物各自或複數種鹼基序列各自之存在比例而生成用以預測水處理後之水質之預測規則。

Description

預測規則生成系統、預測系統、預測規則生成方法及預測方法

本發明係關於一種生成用以預測水處理後之水質之預測規則之預測規則生成系統及預測規則生成方法、以及與其等相關之預測系統及預測方法。

業界期望化學或鋼鐵之重化學工業等之排水於使對人類或環境生物之影響充分地降低之狀態下排出至自然環境中。作為為此而進行之排水處理，進行有使用作為複合微生物系之活性污泥之生物處理。通常，為了適當地進行排水處理，進行處理後之排水之水質監測。具體而言，藉由測定處理後之排水之生物化學需氧量(BOD)、化學需氧量(COD)、總有機碳(TOC)、總氮(TN)等水質資料等而進行水質監測。作為生物處理中重要之管理指標之BOD由於至獲得測定結果之前通常需要5日左右之時間，故而有根據其他水質資料、或溫度、pH值、溶氧濃度(DO)等生物反應槽之運轉參數而推測當日之BOD之情形。又，根據當前之排水之狀態而預測BOD、COD、TOC、TN等水質資料之將來之值亦於管理上較重要，亦有基於水質之時間序列資料或生物反應槽之運轉參數之時間序列資料，進行BOD(生物化學需氧量)等之預測之情形(參照專利文獻1及2)。

[先前技術文獻] [專利文獻]

[專利文獻1]日本專利特開2007-229550號公報

[專利文獻2]日本專利特開2007-263723號公報

然而，如上所述之使用水質或生物反應槽之運轉參數之時間序列資料之預測並非考慮活性污泥中之微生物相之狀態而進行之預測，有無法進行具有充分之精度之預測之情形。於對多樣之排水進行處理之狀況下尤其難以預測。因此，對於處理後之水之狀態預測，要求提高預測精度。

本發明係鑒於上述情況而完成者，其目的在於提供一種可生成高精度且確實地進行水處理後之水質之預測之預測規則的預測規則生成系統及預測規則生成方法、以及與其等相關之預測系統及預測方法。

為了達成上述目的，本發明之一實施形態之預測規則生成系統具備：輸入機構，其輸入進行水處理之活性污泥中存在之複數種微生物各自之存在比例或該活性污泥中存在之複數種鹼基序列各自之存在比例之時間序列資料(以下，有記為「微生物資訊之時間序列資料」之情形)、及與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊；主成分分析機構，其對利用輸入機構所輸入之時間序列資料進行主成分分析，算出構成該時間序列資料之各時刻之資料之主成分得分；及預測規則生成機構，其基於藉由主成分分析機構所算出之構成時間序列資料之各時刻之資料之主成分得分、及利用輸入機構所輸入之與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊，生成用以根據複數種微生物各自之存在比例、或複數種鹼基序列各自之存在比例而預測水處理後之水質之預測規則。作為水處理後之水質，例如可列舉處理後之水之生物化學需氧量(BOD)、化學需氧量(COD)、總有機碳(TOC)或總氮(TN)等。

本發明之一實施形態之預測規則生成系統中，基於進行水處理之活性污泥中存在之微生物或鹼基序列之存在比例之時間序列資料、及與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊而生成預測規則。因此，可進行考慮到活性污泥中之微生物相之狀態的預測，與僅使用水質或生物反應槽之運轉參數之時間序列資料之預測相比，可高精度地進行預測。

又，於本發明之一實施形態之預測規則生成系統中，進行主成分分析。通常，活性污泥中存在之微生物之種類之數量龐大。藉由對微生物資訊之時間序列資料進行主成分分析，可引入全部資訊而不減少資訊量地以較少之變數表現微生物資訊。藉由以本發明之一實施形態之方式進行主成分分析而使用於預測規則之生成之變數減少，可確實地進行預測規則之生成。即，根據本發明之一實施形態之預測規則生成系統，可生成高精度且確實地進行水處理後之水質之預測之預測規則。

主成分分析機構亦可進行使用相關矩陣之主成分分析。使用變異數共變異數矩陣之主成分分析中，主要反映多數種之微生物之行為，相對於此，於如該構成般進行使用相關矩陣之主成分分析之情形時，雖然與使用變異數共變異數矩陣之情形相比需要較多之變數，但可生成更反映少數種類之微生物(存在比例較小之微生物)之行為的預測規則。存在少數種類之微生物之行為會對水處理後之水質產生影響之情形。因此，根據該構成，可生成精度更高地進行預測之預測規則。

預測規則生成機構亦可藉由進行機器學習而生成預測規則，該機器學習係將利用主成分分析機構所算出之構成時間序列資料之各時刻之資料之主成分得分作為預測規則中之輸入，將利用輸入機構所輸入之與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊作為預測規則中之輸出。根據該構成，可確實地生成預測規則。

預測規則生成系統亦可進而具備：讀取機構，其自活性污泥中存在之複數種微生物讀取基因之鹼基序列；及資料生成機構，其基於利用讀取機構所讀取之基因之鹼基序列生成時間序列資料而供輸入機構進行輸入。根據該構成，可確實地輸入微生物或鹼基序列之存在比例之時間序列資料，可確實地實施本發明之一實施形態。

本發明之一實施形態之預測系統係基於藉由本發明之一實施形態之預測規則生成系統所生成之預測規則而預測水處理後之水質者，其具備：輸入機構，其輸入成為預測對象之複數種微生物各自之存在比例或成為預測對象之複數種鹼基序列各自之存在比例之資料；主成分分析機構，其基於利用預測規則生成系統進行之主成分分析，算出利用輸入機構所輸入之預測對象之資料之主成分得分；及預測機構，其基於利用預測規則生成系統所生成之預測規則，根據藉由主成分分析機構所算出之預測對象之資料之主成分得分而預測水處理後之水質。根據本發明之一實施形態之預測系統，可進行基於利用預測規則生成系統所生成之預測規則之預測。

且說，本發明除了可如上所述般記述為預測規則生成系統及預測系統之發明以外，亦可以如下方式記述為預測規則生成方法及預測方法之發明。該等僅係範疇不同，實質上為同一發明，發揮同樣之作用及效果。

即，本發明之一實施形態之預測規則生成方法係作為預測規則生成系統之運作方法之預測規則生成方法，其包括：輸入步驟，其係輸入進行水處理之活性污泥中存在之複數種微生物各自之存在比例或該活性污泥中存在之複數種鹼基序列各自之存在比例之時間序列資料、及與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊；主成分分析步驟，其係對輸入步驟中所輸入之時間序列資料進行主成分分析，算出構成該時間序列資料之各時刻之資料之主成分得分；及預測規則生成步驟，其係基於主成分分析步驟中所算出之構成時間序列資料之各時刻之資料之主成分得分、及輸入步驟中所輸入之與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊，根據複數種微生物各自之存在比例、或複數種鹼基序列各自之存在比例而生成用以預測水處理後之水質之預測規則。

又，本發明之一實施形態之預測方法係作為基於藉由本發明之一實施形態之預測規則生成系統所生成之預測規則而預測水處理後之水質之預測系統之運作方法之預測方法，其包括：輸入步驟，其係輸入成為預測對象之複數種微生物各自之存在比例或成為預測對象之複數種鹼基序列各自之存在比例之資料；主成分分析步驟，其係基於利用預測規則生成系統進行之主成分分析，算出輸入步驟中所輸入之預測對象之資料之主成分得分；及預測步驟，其係基於藉由預測規則生成系統所生成之預測規則，根據主成分分析步驟中所算出之預測對象之資料之主成分得分而預測水處理後之水質。

於本發明之一實施形態中，可進行考慮到活性污泥中之微生物相之狀態之預測，與僅使用水質或生物反應槽之運轉參數之時間序列資料之預測相比，可高精度地進行預測。又，於本發明之一實施形態中，藉由減少用於生成預測規則之變數，可確實地進行預測規則之生成。即，根據本發明之一實施形態，可生成高精度且確實地進行水處理後之水質之預測的預測規則。

1‧‧‧預測規則生成系統

10‧‧‧電腦

11‧‧‧資料生成部

12‧‧‧輸入部

13‧‧‧主成分分析部

14‧‧‧預測規則生成部

15‧‧‧預測部

20‧‧‧定序儀

S01~S05、S11~S15‧‧‧步驟

圖1係表示本發明之實施形態之預測規則生成系統之構成的圖。

圖2係活性污泥中存在之複數種微生物各自之存在比例之主成分得分(表示全部主成分得分中之12個)與BOD之時間序列資料之例的圖表。

圖3係表示本發明之實施形態之預測規則生成系統中於生成預測規則時所執行之處理(預測規則生成方法)的流程圖。

圖4係表示本發明之實施形態之預測規則生成系統中於預測時所執行之處理(預測方法)的流程圖。

圖5係表示使用所生成之預測規則之預測之結果之例的圖表。

以下，與圖式一併詳細地對本發明之預測規則生成系統、預測系統、預測規則生成方法及預測方法之實施形態進行說明。再者，於圖式之說明中，對相同要素標註相同符號，並省略重複之說明。

圖1中表示本實施形態之預測規則生成系統1。預測規則生成系統1係生成用以預測水處理後之水質之預測規則之系統。本實施形態中作為對象之水處理例如為用以減小工業排水或公共生活排水、污水等對自然環境有害之水對自然環境之影響的處理。又，該水處理係利用使用包含作為複數種微生物之集合之微生物相之活性污泥之水處理系統進行者。活性污泥中所包含之微生物之種類之數量通常為數千~數萬以上。又，該活性污泥通常被加入生物反應槽(生物處理槽、活性污泥槽)中，藉由使處理對象之水流入該生物反應槽內而進行水處理。生物反應槽中，通常包括好氧槽及厭氧槽。該水處理係根據例如工廠之運轉而持續進行者。再者，該水處理本身係自先前開始一直進行者。

具體而言，預測規則生成系統1生成預測自預測時點起於預先設定之期間(例如1週或2週)以內BOD等水質資料是否超過預先設定之閾值之預測規則。該閾值例如設為可判斷為與適當地進行有水處理之情形相比水處理後之水質惡化(未適當地進行水處理)之程度之值。又，該預測規則係用以將基於活性污泥中存在之複數種微生物各自之存在比例或活性污泥中存在之複數種鹼基序列各自之存在比例之資訊作為輸入而進行預測者。即，該預測規則係根據預測時點之上述存在比例而預測預先設定之期間內有無包括BOD等水質資料之突發惡化的惡化者。又，預測規則亦可為用以將複數種微生物各自之存在比例、及複數種鹼基序列各自之存在比例兩者作為輸入而進行預測者。又，預測規則生成系統1使用所生成之預測規則進行預測。作為預測對象之水質，除BOD以外，亦可同樣地對COD、TOC、TN等進行預測。

如圖1所示，預測規則生成系統1係包含電腦10、與定序儀20而構成。電腦10係承擔預測規則生成系統1之主要功能之裝置，係進行預測規則之生成及使用預測規則之預測之裝置。具體而言，電腦10具備CPU(Central Processing Unit，中央處理單元)或記憶體、通訊模組等硬體。藉由使該等構成要素利用程式等進行運作，而發揮下述之電腦10之功能。

定序儀20係自活性污泥中存在之複數種微生物讀取(確定)基因之鹼基序列之讀取機構。作為定序儀20，亦可使用同時讀取(解析)複數種微生物之基因之所謂下一代定序儀。作為定序儀20，亦可使用先前之定序儀、例如Roche公司製造之GS Junior System定序儀、Roche公司製造之GS FLX+System定序儀、或Illumina公司製造之MiSeq System定序儀。又，定序儀20亦可讀取16S核糖體RNA(Ribonucleic Acid，核糖核酸)基因之鹼基序列作為微生物之基因之鹼基序列。其原因在於：16S核糖體RNA基因之鹼基序列對於微生物之每種類別而言為相對特徵性之序列。再者，為了讀取16S核糖體RNA基因之鹼基序列，預先製備自活性污泥採取並輸入定序儀20之定序用樣品(污泥樣品)。活性污泥例如分別自好氧槽及厭氧槽採取。定序用樣品之製備、及鹼基序列之讀取(定序)例如可藉由如下方式進行。

[微生物相之DNA(Deoxyribonucleic Acid，去氧核糖核酸)之製備]

自活性污泥採取約1.5ml之包含微生物群之溶液，於室溫下進行離心(13,000rpm×5分鐘)。將上清液去除後，添加殺菌生理鹽水1ml，倒置混合5秒左右後，於室溫下進行離心(13,000rpm×5分鐘)。將上清液去除後，添加Lysis buffer(裂解緩衝液)(AMR公司製造)300μl，充分進行混合後，將所獲得之懸浮液添加至放入有珠粒之試管(EZ-EXTRACT for DNA(AMR公司製造))，其後，利用旋渦混合器攪拌破碎2分鐘。向破碎液添加300μl之TE(Tris-EDTA)溶液(10mM之Tris(Trishydroxymethyl aminomethane，三羥甲基胺基甲烷)、1mM之EDTA(Ethylene Diamine Tetraacetic Acid，乙二胺四乙酸)、pH值8.0)(以下，TE)，於4℃下進行離心(13,000rpm×5分鐘)。其後，將上清液450μl加入新的試管中，並向其添加600μl之苯酚混合液(EZ-EXTRACT for DNA所附屬(AMR公司製造))，旋渦攪拌1分鐘後，於4℃下進行離心(13,000rpm×5分鐘)。將上清液300μl回收並加入至新的試管(1.5ml)中，並向其添加1200μl之乙醇(99.5%)，於4℃下進行離心(13,000rpm×5分鐘)。將上清液去除後，添加1000μl之冷乙醇(70%)，於4℃下進行離心(13,000rpm×5分鐘)，將所獲得之DNA顆粒真空乾燥，繼而添加150μl之TE，製成細菌相DNA之溶液。

[16S核糖體RNA基因之V3-V4區域之PCR(Polymerase Chain Reaction，聚合酶鏈鎖反應)擴增]

測定細菌相DNA之溶液中之雙螺旋DNA濃度，基於其測定值將50ng之DNA作為模板，使用通用引子組(正向引子fw357F(序列編號1)與反向引子RV926r(序列編號2))，將16S核糖體RNA基因(以下，16S 基因)之V3-V4區域進行PCR擴增。PCR係使用Takara Bio公司製造之「Premix Ex Taq Hot Start Version」(註冊商標)，製作包含50pmol之各引子之反應液50μl，於94℃下進行2分鐘之預熱後，分別以98℃×10秒、50℃×30秒、72℃×80秒之條件進行改性、退火、伸長，並重複進行25個循環。

下文示出正向引子HA13621-fw357F之序列之結構。該正向引子於5'末端側包含利用定序儀20進行之序列確定所需之銜接子A序列(以大寫字母記載)，隔著各檢體固有之10個鹼基之條碼序列，於3'末端側包含對全部真細菌之16S基因進行退火之通用引子序列fw357F(以小寫記載)。上述條碼序列係用於樣品間之識別者，同時係與供於定序儀20之樣品數量對應之任意設計之鹼基序列。

銜接子A序列(序列編號3)5'-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3'

通用引子序列fw357F(序列編號1)5'-cctacgggaggcagcag-3'

對上述條碼序列之作用進行說明。例如，於同時解析10個檢體之情形時，只要製作10組具有不同之條碼序列之HA13621-fw357F，使用各者對各檢體進行PCR擴增即可。若將該等混合並供於定序儀20，則於利用可藉由1次運轉獲得100萬資料之GS FLX+System定序儀之情形時，可藉由使用與100個檢體對應之100組條碼序列，而藉由1次運轉獲得1萬資料/檢體之序列資料。

下文示出反向引子HA13619-RV926r之序列之結構。該反向引子於5'末端側包含利用定序儀20進行之序列確定所需之銜接子B序列(以大寫字母記載)，於3'末端側包含對全部真細菌之16S基因進行退火之通用引子序列RV926r(以小寫記載)。

HA13619-RV926r之序列(序列編號4) 5'-CCTATCCCCTGTGTGCCTTGGCAGTCTCAGccgtcaattccttttragttt-3'

可藉由使用上述通用引子組進行之PCR，使包含構成細菌相之各種細菌種之16S基因之V3-V4區域之DNA(約570個鹼基)擴增，而獲得其等之混合物作為其PCR產物DNA。

[PCR產物之生成及定序用樣品之製備]

將自各細菌相DNA獲得之PCR產物DNA(包含構成該細菌相之各種細菌種之16S基因之V3-V4區域的DNA之混合物)混合，利用DNA清除劑(和光純藥公司製造)進行處理，將過剩之引子或受質之核苷酸等去除而進行純化。純化DNA係利用200μl之TE進行洗脫而回收。繼而，將所回收之純化DNA溶液供於瓊脂糖凝膠電泳，切出約570bp之DNA片段，利用MinElute凝膠提取套組(Qiagen公司製造)進行提取，而製備供於定序儀20之DNA。將其作為用於以下之定序之定序用樣品。

[16S基因之定序與序列資料之精度評價]

將上述定序用樣品供於作為定序儀20之Roche公司製造之GS FLX+System定序儀進行定序。定序之條件、步驟等依照製造商規定之操作流程。再者，於該定序儀中，將上述所製備之PCR產物DNA之1分子固定於1個珠粒，繼而，對水(包含用於定序用模板DNA之擴增之PCR引子、受質核苷酸、DNA合成酵素)與油之乳化液中獨立地形成之一個個微小水滴逐個捕獲珠粒，於其中進行PCR使定序用模板DNA擴增而進行製備。因此，將固定有該經擴增之模板DNA之各珠粒劃分於滴定盤上後，於其劃分位置上讀取定序反應之訊息，藉此可隨機地確定上述定序用樣品中所包含之PCR產物DNA(包含構成該細菌相之各種細菌種之16S基因之V3-V4區域的DNA之混合物)之鹼基序列。又，若預先將正向引子HA13621-fw357F中之上述條碼序列設為對於每個源自各樣品之檢體而言具有特徵性之任意之序列，則可使用GS FLX+System定序儀同時解析約100種細菌相樣品，可對於來自某一活性污泥之樣品花費約10~23小時確定2,000~10,000之16S基因之序列資料。即，可不限定菌種地全面地對活性污泥中所包含之細菌相進行解析。

以上係進行定序用樣品之製備、及鹼基序列之讀取之方法之一例。再者，亦可利用上述方法以外之方法進行定序用樣品之製備、及鹼基序列之讀取。定序儀20與電腦10係以可進行資訊之收發之方式連接。定序儀20將所讀取之表示每種微生物之鹼基序列之資訊(序列資訊)發送至電腦10。此處，發送至電腦之序列資訊直接為定序儀20所定序之序列之資料、即所謂初步序列資料。

繼而，對本實施形態之電腦10之功能進行說明。如圖1所示，電腦10係具備資料生成部11、輸入部12、主成分分析部13、預測規則生成部14、及預測部15而構成。

資料生成部11係自定序儀20接收利用定序儀20所讀取之活性污泥中存在之複數種微生物之鹼基序列，基於該鹼基序列生成用以生成預測規則之資料之資料生成機構。用以生成預測規則之資料係活性污泥中存在之複數種微生物各自之存在比例(存在機率)之時間序列資料。該存在比例係每種微生物之類別(微生物種、菌種)之活性污泥中所包含之該類別之微生物之數量相對於該活性污泥中所包含之全部微生物之數量之比例。但是，於難以嚴密地掌握其比例之情形等時，無需嚴密地為數量相對於全部微生物之數量之比例，只要為近似於預測規則之生成所需之程度之比例即可。又，該資料係對於同一活性污泥(預測對象之活性污泥)表示複數個時點(時刻)之存在比例者、即時間序列資料。此處言及之時間序列資料係指某一定期間內於複數個時點取得之資料，各測定時刻之間隔可固定，亦可不固定。為了提高預測精度，亦可以大致固定之時間間隔取得。例如為每週1份之複數週之存在比例之資料。即，每週自活性污泥採取包含微生物群之溶液，算出存在比例。因此，該資料例如可設為微生物之類別之數量×時間序列之時點之數量之矩陣資料。

又，於活性污泥層分為好氧槽與厭氧槽之情形時，獲得好氧槽與厭氧槽各者中之存在比例之資料而作為分開之時間序列資料，亦可將兩者用於其後之處理。作為微生物之種類，可不限定於參與被處理水中之處理對象物質之分解之微生物等特定之種類地隨機設定解析對象。微生物之類別之數量亦取決於活性污泥，為2萬左右之數量。亦可自恰當地獲得之全部微生物種中存在比例較大者中進行選擇，而使用總微生物種數之50%以上之數量之微生物種之資料，進而亦可使用75%以上。所謂恰當地獲得之微生物種，係指將例如以如下方式藉由OTU(運算分類單位(Operational Taxonomic Unit)，運算分類單元)解析所獲得之全部OTU種中序列資料數(序列數之計數)非常少(例如為1、2或3)者除外者。微生物種之數量之選擇係於構成微生物資訊之時間序列資料之各時刻之資料中算出各微生物種之存在比例，將針對每種微生物種對於全部時刻求出存在比例之總和者設為各微生物種之存在比例，自其存在比例較大者中進行選擇。又，時點之數量例如相當於半年之資料。即，時點之數量為數十至數百左右。上述之資料生成及以下之資料之處理亦可使用活性污泥中存在之複數種鹼基序列各自之存在比例代替微生物之存在比例，亦可使用微生物之存在比例與鹼基序列之存在比例兩者。

例如，資料生成部11以如下方式進行該資料之生成。資料生成部11自定序儀20接收初步序列資料。再者，自定序儀20接收之初步序列資料係複數個時點之活性污泥之資料，係可對於各時點推定活性污泥中所包含之複數種微生物或鹼基序列各自之存在比例之程度之數量之資料。即，以獲得此種資料之方式利用定序儀20進行定序。上述複數個時點係相當於時間序列資料之各時點者。

資料生成部11對於所獲得之初步序列資料(例如，上述例中為約570個鹼基/資料)，基於序列資料中所包含之樣品固有之條碼序列，將各序列分配至各固有之樣品(相當於時間序列資料之各時點)。資料生成部11將該序列資料之序列長度未達200、1000以上、與通用引子序列(fw357F)之錯配為1以上、使用附屬於定序儀之質量程式進行序列確定之鹼基序列之平均質量值為25以下之序列資料去除，擷取高精度資料。

資料生成部11將所取得之高精度序列資料供於利用叢聚(相似度95%、97%、或99%之閾值)進行之運算分類單位(Operational Taxonomic Unit)解析(以下，稱為OTU解析)。於OTU解析中，以序列資料之相似度為基準進行使各序列資料群組化之操作。此處，檢測相互具有95%以上之序列相似度之序列資料之叢集群組(以下，稱為OTU)。再者，序列資料之叢聚可藉由先前技術、例如免費軟體Uclust等而進行。可推測各OTU來自大致相同之種類之細菌(微生物)。因此，可認為藉由叢聚而獲得之OTU之總數(OTU數)於可檢測出之範圍內與構成其細菌相(微生物相)之細菌種(微生物種)之數量相等。資料生成部11確定代表各叢集群組之鹼基序列即代表序列資料。代表序列資料之確定可藉由先前一直使用之方法而進行。

又，可根據各OTU中所包含之序列資料數而求出序列資料數整體中之各OTU之比例、即菌種組成比或鹼基序列組成比、即上述存在比例。進而，可藉由對各OTU之代表序列資料進行向上述16S基因及細菌基因體之資料庫之同源性檢索，而歸屬至具有最高之序列相似度之已知菌種，即，特定出OTU之菌種。再者，於本實施形態中，未必必須進行菌種之特定，但由於可掌握具體何種菌種之細菌包含於活性污泥中，故而於預測結果之解析等方面有益。再者，對於構成微生物資訊之時間序列資料之全部時刻之資料中所包含之序列資料數(序列數之計數)非常少(例如1、2或3)之OTU(叢集群組)，並非有效之資訊之情形較多，有時成為計算上之雜訊，因此亦可預先自時間序列資料去除。

資料生成部11藉由對於複數個時點算出上述每個細菌種或每個鹼基序列種之存在比例，而以例如上述矩陣之形式生成時間序列資料。資料生成部11將所生成之時間序列資料輸出至輸入部12。

輸入部12係輸入上述微生物資訊之時間序列資料、及與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊的輸入機構。對於上述微生物資訊之時間序列資料，輸入部12係自資料生成部11進行輸入。水質資訊係表示其時點之水質之狀態者，例如為表示自時間序列資料中之上述時點(自活性污泥採取包含微生物相之溶液之時點)起於預先設定之期間(例如1週)以內BOD等水質資料是否超過預先設定之閾值者等。該閾值係與上述預測規則之閾值相同者。水質資訊可藉由對水處理後之水測定BOD等水質資料而獲得。BOD等水質資料之測定較理想為每日等高頻度，但只要根據上述期間進行即可。例如，於水質資訊為表示於1週以內BOD等水質資料是否超過預先設定之閾值者之情形時，只要1週進行2次左右之測定即可。例如，水質資訊係將於1週以內BOD等水質資料超過預先設定之閾值之情形設為1，將其以外之情形設為0。

例如，藉由受理使用者對於電腦10之水質資訊之輸入操作而輸入水質資訊。該水質資訊係微生物資訊之時間序列資料中之每個上述時點之資料之資訊，即，包含時間序列之時點之數量的資訊。輸入部12輸入與每個時點之資料建立對應之水質資訊。例如，被輸入至電腦10之水質資訊中，對應有表示為何時點之水質資訊之資訊。再者，輸入部12亦可輸入時間序列之BOD等水質資料之值，判斷該值自上述時點起於1週以內是否超過閾值，生成上述水質資訊。該時間序列之BOD等水質資料之時點亦可不同於微生物資訊之時間序列資料之時點。

利用輸入部12所輸入之資訊中，微生物資訊之時間序列資料係與對藉由預測規則生成系統1所生成之預測規則輸入之資料對應者。又，水質資訊係與根據利用預測規則生成系統1所生成之預測規則所預測之水質對應者。輸入部12將所輸入之資訊中之微生物資訊之時間序列資料輸出至主成分分析部13。輸入部12將所輸入之資訊中之水質資訊輸出至預測規則生成部14。

主成分分析部13係對利用輸入部12所輸入之微生物資訊之時間序列資料進行主成分分析，算出構成該時間序列資料之各時刻之資料之主成分得分之主成分分析機構。如上所述，時間序列資料為矩陣資料，因此可進行主成分分析。主成分分析部13係以算出構成時間序列資料之各時刻之資料、即各時點之活性污泥中存在之微生物或鹼基序列之存在比例之資料之主成分得分之方式進行主成分分析。即，以壓縮矩陣資料之微生物或鹼基序列之類別之數量(變數)之方式進行主成分分析。於自好氧槽與厭氧槽取得微生物資訊之時間序列資料之情形時，可組合雙方之資料而進行主成分分析。此時，對於好氧槽、厭氧槽各者之微生物資訊之時間序列資料，算出主成分得分。

具體而言，主成分分析部13亦可考慮活性污泥中存在之微生物對於水處理之性質而進行使用相關矩陣之主成分分析。即，將微生物資訊之時間序列資料轉換為相關矩陣後，進行主成分分析。藉由進行使用相關矩陣之主成分分析，可反映少數種之微生物之行為。但是，根據活性污泥中存在之微生物之構成等，亦可使用變異數共變異數矩陣。主成分分析可使用先前之套裝軟體等而進行。

主成分分析部13例如對於構成微生物資訊之時間序列資料之各時刻之資料各者，將累積貢獻率達到預先設定之閾值(例如80%)以上為止之數量之主成分得分設為以後之處理中所使用之主成分得分。又，主成分分析部13亦可按照貢獻率之高低順序將預先設定之數量之主成分得分設為以後之處理中所使用之主成分得分。又，亦可將其以外之任意種類之主成分得分設為以後之處理中所使用之主成分得分。以後之處理中所使用之主成分得分之數量可考慮以後之處理之處理負荷等，而大致(對於構成時間序列資料之各時刻之資料而言)設為十數至數十左右。為了如下所述般於預測部中選擇所使用之主成分得分，此處算出較多數量之主成分得分。主成分分析部13進行算出，並將設為以後之處理中所使用之主成分得分之構成時間序列資料之各時刻之資料之主成分得分輸出至預測規則生成部14。又，主成分分析部13為了進行利用預測規則之預測，而預先記憶用以根據微生物或鹼基序列之存在比例之向量資料而算出主成分得分的資訊。或者，可利用資料生成部11同時生成用於預測規則之微生物資訊之時間序列資料與用於預測之微生物資訊，並自輸入部12進行輸入，組合兩者之資料而設為矩陣資料，計算用於預測規則之主成分得分，同時預先計算用於預測之主成分得分。

預測規則生成部14係基於利用主成分分析部13所算出之構成微生物資訊之時間序列資料之各時刻之資料之主成分得分、及利用輸入部12所輸入之與構成該時間序列資料之各時刻之資料建立對應之水質資訊，根據複數種微生物或鹼基序列各自之存在比例而生成用以預測水處理後之水質之預測規則的預測規則生成機構。圖2係主成分得分與成為水質資訊之依據之BOD之時間序列資料之例之圖表。圖2之圖表中，橫軸表示時間，縱軸表示主成分得分之值及BOD之值。主成分得分係示出進行使用相關矩陣之主成分分析時之貢獻率為第1至第6之主成分得分。示出6個好氧槽之主成分得分與6個厭氧槽之主成分得分，共計12個。用於預測規則之主成分得分係自好氧槽、厭氧槽各30個主成分得分中選擇10個。複數條線S之各者表示主成分得分之值。又，線B表示BOD之值。

預測規則係根據某一時點(於微生物相觀測時，例如為圖2之實線L1所表示之時點)之主成分得分，預測其時點及其時點以後之水質之狀態者，例如用於預測自其時點起於預先設定之期間(例如，至圖2之虛線L2所表示之時點為止之期間)內BOD是否超過預先設定之閾值T等。

具體而言，預測規則生成部14基於所輸入之構成微生物資訊之時間序列資料之各時刻之資料之主成分得分及與構成該時間序列資料之各時刻之資料建立對應之水質資訊，例如藉由進行機器學習(利用機器學習進行之訓練)等而生成預測規則。即，所輸入之構成時間序列資料之各時刻之資料之主成分得分及與構成該時間序列資料之各時刻之資料建立對應之水質資訊係用以進行機器學習之正確資料(樣品資料)。於該機器學習中，將構成微生物資訊之時間序列資料之各時刻之資料之主成分得分設為預測規則中之輸入(解釋變數)，將與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊設為預測規則中之輸出(目標變數)。進而，此處亦可對用作解釋變數之主成分得分進行選擇。用於預測之主成分得分之數量越多，預測精度未必越高，又，所使用之主成分得分之貢獻率越高，預測精度未必越高。進行如下操作：於利用主成分分析部所算出之主成分得分中使組合進行各種變化而進行機器學習，反覆對其預測精度進行評價，將預測精度為一定標準值以上之較高之主成分得分之組合選作解釋變數。標準值例如可設為75%、85%等。

作為機器學習之方法，例如可使用線性回歸模型。此時，亦可使用貝氏推論法。又，作為線性回歸模型之一，可使用二元或有序型之離散選擇模型。具體而言，可使用常態機率模型或羅吉特機率模型、位元模型等。亦可對該等使用貝氏推論法。或者，可使用SVM(Support Vector Machine，支持向量機)等。或者，亦可使用貝氏網路。預測規則生成部14將表示所生成之預測規則之資訊輸出至預測部15。

預測部15係基於利用預測規則生成部14所生成之預測規則進行預測水處理後之水質之預測的預測機構。如上所述，預測規則係用以根據主成分得分而預測BOD等水質資料之預測時點及其以後之狀態者，例如為用以進行預測自預測時點起於預先設定之期間內BOD等水質資料是否超過預先設定之閾值等者。即，預測部15輸入預測對象之主成分得分，基於預測規則進行預測。預測對象係使用有包含(欲進行預測之時點之)微生物相之活性污泥的水處理系統(之微生物相)。預測對象之水處理系統可設為與取得用於預測規則之生成之資料之水處理系統相同者。但是，預測對象之水處理系統亦可為取得用於預測規則之生成之資料之水處理系統以外者。

預測對象之主成分得分係以與生成預測規則時之微生物資訊之時間序列資料之1個時點之主成分得分相同之方式求出。即，主成分得分之生成係以如下方式進行。定序儀20自預測對象之水處理系統之活性污泥中存在之複數種微生物讀取基因之鹼基序列。定序儀20將表示所讀取之成為預測對象之複數種微生物之每種之鹼基序列的資訊(序列資訊)發送至電腦10。

於電腦10中，資料生成部11自定序儀20接收序列資訊，根據該序列資訊，而生成成為預測對象之複數種微生物或鹼基序列各自之存在比例的資料。該資料例如可設為包含微生物或鹼基序列之類別之數量之要素的向量資料。再者，該向量資料對應於用以生成預測規則之矩陣資料。即，對於用以生成預測規則之矩陣資料與預測用之向量資料而言，每種微生物或鹼基序列之存在比例之值之順序、及微生物或鹼基序列之類別之數量(向量資料之要素之數量)相同。

資料生成部11將所生成之預測用之微生物或鹼基序列之存在比例之向量資料輸出至輸入部12。輸入部12輸入該向量資料並輸出至主成分分析部13。主成分分析部13輸入該向量資料，基於生成預測規則時所進行之主成分分析，算出該向量資料之主成分得分。主成分分析部13將所算出之主成分得分輸出至預測部15。又，預測對象之主成分得分亦可於求出生成預測規則時之微生物資訊之時間序列資料之主成分得分之時同時求出。即，可藉由增加用以生成預測規則之矩陣資料(微生物類別之數量×時點)之時點，組入預測用之向量資料，而預先算出。

預測部15對預測規則輸入自主成分分析部13輸入之預測對象之主成分得分，可將根據預測規則之輸出作為預測結果。預測結果係依據所生成之預測規則而獲得者，於本實施形態中所示之例中，為表示自預測時點起於預先設定之期間(例如1週)以內BOD等水質資料是否超過預先設定之閾值的資訊。預測部15輸出所獲得之預測結果。預測結果之輸出例如藉由利用電腦10所具備之顯示器等顯示裝置進行顯示而進行。又，預測結果之輸出例如亦可藉由發送至其他裝置或電腦10內之其他模組而進行。以上係本實施形態之電腦10之功能。

繼而，利用圖3及圖4之流程圖，對作為藉由本實施形態之預測規則生成系統1所執行之處理(預測規則生成系統1之運作方法)之預測規則生成方法及預測方法進行說明。首先利用圖3之流程圖，對生成預測規則時所執行之處理進行說明。於本處理中，首先，利用定序儀20讀取構成水處理系統中所使用之微生物相的微生物之基因之鹼基序列(S01、讀取步驟)。此處，讀取複數個時點之構成微生物相之微生物之基因之鹼基序列。所讀取之鹼基序列之資料自定序儀20被輸出至電腦10。

於電腦10中，利用資料生成部11接收自定序儀20發送之鹼基序列之資料。繼而，利用資料生成部11基於鹼基序列之資料而生成微生物資訊之時間序列資料(S02、資料生成步驟)。如上所述，所生成之時間序列資料係微生物或鹼基序列之類別之數量×時間序列之時點之數量之矩陣資料。繼而，所生成之時間序列資料自資料生成部11被輸入至輸入部12。又，利用輸入部12與時間序列資料之輸入一併輸入每個上述時點之資料之水質資訊(S03、輸入步驟)。水質資訊之輸入例如藉由讀入定期或不定期地更新之資料檔案、或受理使用者對於電腦10之水質資訊之輸入操作而進行。

所輸入之微生物資訊之時間序列資料自輸入部12被輸出至主成分分析部13。又，所輸入之水質資訊自輸入部12被輸出至預測規則生成部14。繼而，利用主成分分析部13進行對於微生物資訊之時間序列資料之主成分分析(S04、主成分分析步驟)。利用主成分分析所獲得之構成時間序列資料之各時刻之資料之主成分得分自主成分分析部13被輸出至預測規則生成部14。

繼而，利用預測規則生成部14，基於自主成分分析部13輸入之主成分得分、及自輸入部12輸入之與構成該時間序列資料之各時刻之資料建立對應之水質資訊，而生成預測規則(S05、預測規則生成步驟)。如上所述，預測規則之生成例如藉由機器學習而進行，該機器學習係將主成分得分設為預測規則中之輸入(解釋變數)，將水質資訊設為預測規則中之輸出(目標變數)。表示所生成之預測規則之資訊自預測規則生成部14被輸出至預測部15。以上係生成預測規則時所執行之處理。

繼而，利用圖4之流程圖，對預測時所執行之處理進行說明。於本處理中，首先，利用定序儀20讀取預測對象之時點之構成水處理系統中所使用之微生物相的微生物之基因之鹼基序列(S11、讀取步驟)。所讀取之鹼基序列之資料自定序儀20被輸出至電腦10。

於電腦10中，利用資料生成部11接收自定序儀20發送之鹼基序列之資料。繼而，利用資料生成部11，基於鹼基序列之資料而生成微生物或鹼基序列各自之存在比例之資料(S12、資料生成步驟)。如上所述，所生成之資料係包含微生物或鹼基序列之類別之數量之要素之向量資料。繼而，所生成之資料自資料生成部11被輸入輸入部12(S13、輸入步驟)。

所輸入之資料自輸入部12被輸出至主成分分析部13。繼而，利用主成分分析部13，基於生成預測規則時之主成分分析，算出所輸入之資料之主成分得分(S14、主成分分析步驟)。藉由主成分分析所獲得之資料之主成分得分自主成分分析部13被輸出至預測部15。

繼而，利用預測部15，基於利用預測規則生成部14所生成之預測規則，根據自主成分分析部13輸入之主成分得分進行水質之預測(S15、預測步驟)。表示預測結果之資訊例如以可識別之方式對使用者顯示。以上係預測時所執行之處理。

如上所述，根據本實施形態，基於微生物資訊之時間序列資料、及與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊而生成預測規則。因此，與僅使用水質或生物反應槽之運轉參數之時間序列資料進行預測之情形不同，可進行考慮到活性污泥中之微生物相之狀態之預測。藉此，與僅使用水質或生物反應槽之運轉參數之時間序列資料之預測相比，可高精度地進行預測。

又，根據本實施形態，進行主成分分析。通常，活性污泥中存在之微生物之種類之數量龐大。藉由對微生物資訊之時間序列資料進行主成分分析，可引入全部資訊而不減少資訊量地以較少之變數表現微生物資訊。藉由如本實施形態般進行主成分分析，而減少用於預測規則之生成之變數，可確實地進行預測規則之生成。即，根據本實施形態，可生成高精度且確實地進行水處理後之水質之預測之預測規則。

如本實施形態般，主成分分析亦可設為使用相關矩陣者。藉由進行使用相關矩陣之主成分分析，與使用變異數共變異數矩陣之情形相比，即便進行主成分分析，亦可生成更反映少數種之微生物(存在比例較小之微生物)之行為的預測規則。存在少數種之微生物之行為會對水處理後之水質產生影響之情形。因此，根據該構成，可生成精度更高地進行預測之預測規則。但是，如上所述，根據活性污泥中存在之微生物之構成等，亦可使用變異數共變異數矩陣。

又，如本實施形態般，亦可藉由機器學習而生成預測規則。根據該構成，可確實地生成預測規則。但是，未必必須使用機器學習，亦可藉由其以外之方法而生成預測規則。例如，亦可使用時間序列解析而生成預測規則。具體而言，亦可使用多向量自我回歸(VAR)模型等時間序列解析。

又，如本實施形態般，讀取微生物之基因之鹼基序列之定序儀20亦可包含於預測規則生成系統1，基於所讀取之鹼基序列生成時間序列資料。根據該構成，可確實地輸入微生物或鹼基序列之存在比例之時間序列資料，可確實地實施本發明之一實施形態。但是，預測規則生成系統1中未必必須包含定序儀20。即，預測規則生成系統1(之電腦10之輸入部12)亦可自外部輸入微生物資訊之時間序列資料。

又，如本實施形態般，亦可具有使用所生成之預測規則進行預測之構成。即，預測規則生成系統1亦可如本實施形態般兼具預測系統。根據該構成，可進行基於所生成之預測規則之預測。但是，未必必須於預測規則生成系統1中進行預測，亦可利用預測規則生成系統1 以外之裝置或系統進行預測。於該情形時，利用預測規則生成系統1所生成之預測規則被輸出至該預測規則生成系統1以外之預測系統。該預測系統具有上述之預測規則生成系統1之預測之功能。

繼而，對使用利用本實施形態之預測規則生成系統1所生成之預測規則的預測結果之例進行說明。圖5中表示該預測結果之例之圖表。圖5中之橫軸為時間軸。橫軸之一個點相當於上述之一個時點。縱軸表示自該時點(預測時點)起於1週以內BOD是否超過預先設定之閾值、即有(於1週以內BOD超過閾值)無(於1週以內BOD未超過閾值)突發情況。於該例中，示出作為生成預測規則時之機器學習之方法使用利用貝氏推論法之二元常態機率模型(線性回歸模型)之情形與使用SVM之情形之結果。圖5中，虛線左側之資料係用於機器學習之訓練者，虛線右側之資料係未用於機器學習之訓練者。使用常態機率模型之情形與使用SVM之情形各者之值係使用預測規則之預測結果(根據預測規則之輸出)。

亦如圖5所示，於使用常態機率模型作為機器學習之方法之情形時，藉由未用於機器學習之訓練之資料之輸出，與實測79%一致。於使用SVM作為機器學習之方法之情形時，藉由未用於機器學習之訓練之資料之輸出，與實測81%一致。即，本實施形態之方法之預測率大致為80%，為較高之值。於圖5所示之例中，使用利用半年之訓練資料(虛線之左側之資料)而製作之預測模型(預測規則)，對於其後半年應用預測規則，而預測BOD值。具體而言，於其後半年之微生物存在比例之時間序列資料之各時點，進行BOD是否超過閾值之預測。認為若使用根據不久前(例如1~2週前)所取得之資料進行更新而製作之預測規則，則預測率會變得更高。於日常之水質管理中，可一面加入新取得之資料而更新預測規則，一面進行預測。

繼而，對上述實施形態之變化例進行說明。於上述實施形態中，將微生物或鹼基序列之存在比例之資料作為對預測規則之輸入，但亦可除其以外亦將其以外之資料作為輸入。作為其以外之資料，例如亦可使用先前之水質之預測中所使用之處理後之水(排水)之水質資料或生物反應槽之運轉參數。具體而言係COD(化學需氧量)、溫度、TOC、TN等水質資料、pH值、排水品項、溶氧量(DO)、氧化還原電位(ORP)等生物反應槽之運轉參數。或者，亦可使用向水處理系統之處理對象之水之流入條件之資料。又，於切換排水品項而使用之排水處理系統之情形時，亦可使用其時點或其前後進行處理之排水品項作為資料。於使用微生物或鹼基序列之存在比例之資料以外之資料之情形時，只要亦對其等資料準備正確資料而進行機器學習即可。亦可組合該等資料而選擇預測精度較高之資料之組合。藉由成為預測之依據之資料增加，可生成精度更高之預測規則。藉由組合可高頻度地取得之資料，可進行更詳細之水質管理(預測)。

於上述實施形態中，所預測之水質係自預測時點起於預先設定之期間以內BOD是否超過預先設定之閾值，但只要與水質相關，則本發明中所生成之預測規則亦可為預測其以外者。例如可列舉COD、TOC、TN等水質之預測。亦可並非僅進行水質之值是否超過閾值之預測，而亦預測屬於以一定範圍劃分之複數個等級中之何一等級，或預測大致之推測值。

<110> 日商住友化學股份有限公司

<120> 預測規則生成系統、預測系統、預測規則生成方法及預測方法

<130> S40536WO01

<150> JP 2015-076945

<151> 2015-04-03

<160> 4

<170> PatentIn第3.1版

<210> 1

<211> 17

<212> DNA

<213> 人工

<220>

<223> 通用引子fw357F

<400> 1

<210> 2

<211> 21

<212> DNA

<213> 人工

<220>

<223> 通用引子RV926r

<400> 2

<210> 3

<211> 30

<212> DNA

<213> 人工

<220>

<223> 銜接子A

<400> 3

<210> 4

<211> 51

<212> DNA

<213> 人工

<220>

<223> 反向引子HA13619-RV926r

<400> 4

1‧‧‧預測規則生成系統

10‧‧‧電腦

11‧‧‧資料生成部

12‧‧‧輸入部

13‧‧‧主成分分析部

14‧‧‧預測規則生成部

15‧‧‧預測部

20‧‧‧定序儀

Claims

一種預測規則生成系統，其具備：輸入機構，其輸入進行水處理之活性污泥中存在之複數種微生物各自之相對於活性污泥所包含之全部微生物之存在比例或該活性污泥中存在之複數種鹼基序列各自之相對於活性污泥所包含之全部鹼基序列之存在比例之時間序列資料、及與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊；主成分分析機構，其對利用上述輸入機構所輸入之時間序列資料進行主成分分析，算出構成該時間序列資料之各時刻之資料之主成分得分；及預測規則生成機構，其基於利用上述主成分分析機構所算出之構成時間序列資料之各時刻之資料之主成分得分、及利用上述輸入機構所輸入之與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊，根據複數種微生物各自之存在比例、或複數種鹼基序列各自之存在比例而生成用以預測水處理後之水質之預測規則。
如請求項1之預測規則生成系統，其中上述主成分分析機構進行使用相關矩陣之主成分分析。
如請求項1之預測規則生成系統，其中上述預測規則生成機構藉由進行機器學習而生成上述預測規則，該機器學習係將利用上述主成分分析機構所算出之構成時間序列資料之各時刻之資料之主成分得分作為上述預測規則中之輸入，將利用上述輸入機構所輸入之與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊作為上述預測規則中之輸出。
如請求項1至3中任一項之預測規則生成系統，其進而具備：讀取機構，其自上述活性污泥中存在之複數種微生物讀取基因之鹼基序列；及資料生成機構，其基於利用上述讀取機構所讀取之基因之鹼基序列生成上述時間序列資料而供輸入機構進行輸入。
一種預測系統，其係基於利用如請求項1至4中任一項之預測規則生成系統所生成之預測規則而預測水處理後之水質的預測系統，並且具備：輸入機構，其輸入成為預測對象之複數種微生物各自之相對於活性污泥所包含之全部微生物之存在比例或成為預測對象之複數種鹼基序列各自之相對於活性污泥所包含之全部鹼基序列之存在比例之資料；主成分分析機構，其基於利用上述預測規則生成系統進行之主成分分析，算出利用上述輸入機構所輸入之上述預測對象之資料之主成分得分；及預測機構，其基於利用上述預測規則生成系統所生成之預測規則，根據藉由上述主成分分析機構所算出之上述預測對象之資料之主成分得分而預測水處理後之水質。
一種預測規則生成方法，其係作為預測規則生成系統之運作方法之預測規則生成方法，並且包括：輸入步驟，其係輸入進行水處理之活性污泥中存在之複數種微生物各自之相對於活性污泥所包含之全部微生物之存在比例或該活性污泥中存在之複數種鹼基序列各自之相對於活性污泥所包含之全部鹼基序列之存在比例之時間序列資料、及與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊；主成分分析步驟，其係對上述輸入步驟中所輸入之時間序列資料進行主成分分析，算出構成該時間序列資料之各時刻之資料之主成分得分；及預測規則生成步驟，其係基於上述主成分分析步驟中所算出之構成時間序列資料之各時刻之資料之主成分得分、及上述輸入步驟中所輸入之與構成該時間序列資料之各時刻之資料建立對應之表示水處理後之水質之水質資訊，根據複數種微生物各自之存在比例、或複數種鹼基序列各自之存在比例而生成用以預測水處理後之水質之預測規則。
一種預測方法，其係作為基於利用如請求項1至4中任一項之預測規則生成系統所生成之預測規則而預測水處理後之水質之預測系統之運作方法的預測方法，並且包括：輸入步驟，其係輸入成為預測對象之複數種微生物各自之相對於活性污泥所包含之全部微生物之存在比例或成為預測對象之複數種鹼基序列各自之相對於活性污泥所包含之全部鹼基序列之存在比例之資料；主成分分析步驟，其係基於利用上述預測規則生成系統進行之主成分分析，算出上述輸入步驟中所輸入之上述預測對象之資料之主成分得分；及預測步驟，其係基於利用上述預測規則生成系統所生成之預測規則，根據上述主成分分析步驟中所算出之上述預測對象之資料之主成分得分而預測水處理後之水質。