JP2020036579A - Microbial population identification method - Google Patents

Microbial population identification method Download PDF

Info

Publication number
JP2020036579A
JP2020036579A JP2019105590A JP2019105590A JP2020036579A JP 2020036579 A JP2020036579 A JP 2020036579A JP 2019105590 A JP2019105590 A JP 2019105590A JP 2019105590 A JP2019105590 A JP 2019105590A JP 2020036579 A JP2020036579 A JP 2020036579A
Authority
JP
Japan
Prior art keywords
microorganism
group
microorganisms
amount
selection step
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019105590A
Other languages
Japanese (ja)
Other versions
JP7299485B2 (en
Inventor
寿和 福島
Toshikazu Fukushima
寿和 福島
中川 淳一
Junichi Nakagawa
淳一 中川
加藤 敏朗
Toshiro Kato
敏朗 加藤
秀一 川野
Shuichi Kawano
秀一 川野
守 押木
Mamoru Oshiki
守 押木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Publication of JP2020036579A publication Critical patent/JP2020036579A/en
Application granted granted Critical
Publication of JP7299485B2 publication Critical patent/JP7299485B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

To provide a microbial population identification method capable of identifying a microbial population involved in the change of the amount of a particular substance in a biological treatment method using microorganisms.SOLUTION: A microbial population identification method characterized in identifying a microbial population involved in the change of the amount of a particular substance, comprises the following steps of: a specimen creation step of creating specimens by resampling from datasets obtained by measuring the rate of change of the amount of a particular substance and the contents of microbial populations in which microorganisms are classified in a microbial samples containing the particular substance and the microorganisms; a first selection step of selecting a microbial population corresponding to the independent variable selected based on the regression coefficient by performing a penal regression analysis the regression coefficient of which is reducible to 0, with the contents of the microbial populations as independent variables and the corresponding change rate of the amount of the particular substance as the dependent variable for the specimens created by the resampling; and an identification step of identifying the selected microbial population as the microbial population involved in the change of the amount of the particular substance.SELECTED DRAWING: Figure 5

Description

本発明は、特定物質の量の変化に係わる微生物群を特定する微生物群の特定方法に関する。   The present invention relates to a method for specifying a group of microorganisms that specifies a group of microorganisms involved in a change in the amount of a specific substance.

コークス炉排水(安水)からのCOD成分の除去に、活性汚泥法(微生物を用いた生物学的排水処理)などが用いられている。活性汚泥法などの生物学的排水処理プロセスを理解、最適化するため、微生物群集解析が一般的に行われる。   Activated sludge method (biological wastewater treatment using microorganisms) and the like are used to remove COD components from coke oven wastewater (amsible water). Microbial community analysis is commonly performed to understand and optimize biological wastewater treatment processes such as activated sludge.

従来、水処理に関与する主要微生物をスクリーニングするため、寒天培地などを用いた培養法による検討が長年試みられてきた。しかし、培養できる微生物は全体の1%にも満たず、主要微生物のスクリーニングはほぼ不可能であった。   Conventionally, for screening main microorganisms involved in water treatment, studies using a culture method using an agar medium or the like have been attempted for many years. However, less than 1% of the microorganisms can be cultured, and screening of major microorganisms was almost impossible.

一方、あらかじめ排水処理に影響することが分かっている微生物を対象とした解析も試みられている。特許文献1には、生物処理方法において出現する糸状性細菌のうち、固液分離障害を起こす原因となる糸状性細菌の存在を検出するプライマーセットが開示されている。係るプライマーセットによれば、固液分離障害をひきおこすSphaerotilus natansの存在を検出でき、固液分離障害の発生を抑制可能であるとされる。   On the other hand, an analysis for microorganisms that are known to affect wastewater treatment in advance has been attempted. Patent Literature 1 discloses a primer set for detecting the presence of a filamentous bacterium that causes solid-liquid separation failure among filamentous bacteria appearing in a biological treatment method. According to such a primer set, it is said that the presence of Sphaerotilus natans which causes a solid-liquid separation failure can be detected, and the occurrence of the solid-liquid separation failure can be suppressed.

特許第5337643号公報Japanese Patent No. 5337643

特許文献1に記載の方法では、すでに機能が知られている数種類の微生物の存在を検出することは可能であっても、活性汚泥中の、数千を超える膨大な数の微生物種について、其々の微生物がどの排水成分の処理を担っているかを判断することは困難である。   With the method described in Patent Document 1, it is possible to detect the presence of several types of microorganisms whose functions are already known. It is difficult to determine which wastewater components each microorganism is responsible for treating.

生物学的排水処理プロセス(活性汚泥法など)で処理を担う主要微生物を特定できれば、それら微生物が優先する環境を作り出すことで、水処理プロセスの最適化が可能である。近年、遺伝子解析装置である次世代シーケンサーの開発によって水処理プロセス中の微生物を網羅的に解析することが可能となった。しかし、主要微生物の特定は以下の理由から困難であった。   If the major microorganisms responsible for the treatment in a biological wastewater treatment process (such as the activated sludge method) can be identified, the environment in which those microorganisms take precedence can be optimized to optimize the water treatment process. In recent years, the development of a next-generation sequencer, which is a gene analyzer, has enabled comprehensive analysis of microorganisms in a water treatment process. However, identification of major microorganisms was difficult for the following reasons.

1)数千以上の膨大な数の微生物が混在且つ変動するため、生データやグラフから存在量(相対割合)の優先種を推定することはほぼ不可能である。
2)ほとんどの微生物の役割(分解能力など)が分かっていない。そもそも死んだ微生物の分解など水処理には関与していない微生物も多数存在する。
3)排水には有機物、窒素化合物、硫黄化合物など様々な汚濁物質が混在しており、それぞれの除去に係わる微生物が異なる。複数の汚濁物質の処理に係わる微生物もいるため、より複雑である。
以上のように複雑かつ膨大なデータを処理する必要があり、これまで水処理データに相関のある微生物種を推定することは不可能であった。たとえば、通常の回帰分析で水処理データに相関のある微生物種を推定することが当該分野ではしばしば試みられるが、水処理データ数(=採取した試料数)に対して、微生物種の数が100倍以上多くなるため、通常の回帰分析で推定することは不可能である。
1) Since an enormous number of microorganisms of thousands or more are mixed and fluctuated, it is almost impossible to estimate a priority species of abundance (relative ratio) from raw data or a graph.
2) The role of most microorganisms (decomposition ability, etc.) is unknown. Many microorganisms are not involved in water treatment, such as the decomposition of dead microorganisms.
3) Various pollutants such as organic substances, nitrogen compounds, and sulfur compounds are mixed in the wastewater, and the microorganisms involved in each removal are different. It is more complicated because some microorganisms are involved in the treatment of multiple pollutants.
As described above, it is necessary to process complicated and enormous data, and it has been impossible to estimate a microorganism species correlated with water treatment data. For example, it is often attempted in the art to estimate the microorganism species correlated with the water treatment data by ordinary regression analysis. However, when the number of microorganism species is 100 times the number of water treatment data (= the number of collected samples). Since it is more than twice as large, it is impossible to estimate by ordinary regression analysis.

本発明は、前述した事情に鑑みてなされたものであって、微生物を利用した生物処理方法において、特定物質の量の変化に係わる微生物群を特定可能な、微生物群の特定方法の提供を目的とする。   The present invention has been made in view of the above-mentioned circumstances, and an object of the present invention is to provide a method for identifying a group of microorganisms that can identify a group of microorganisms related to a change in the amount of a specific substance in a biological treatment method using microorganisms. And

本発明者は、前記課題を解決するべく鋭意検討した結果、再標本化により作成した標本に対して罰則付き回帰分析を行うことにより、微生物を利用した生物処理に関わる微生物群の特定が可能となることを見出し、本発明を完成させるに至った。
本発明は、上記課題を解決するための手段として、以下の構成を採用する。
The present inventor has conducted intensive studies to solve the above problems, and as a result of performing penalized regression analysis on a sample created by resampling, it is possible to specify a group of microorganisms involved in biological treatment using microorganisms. And found that the present invention was completed.
The present invention employs the following configuration as means for solving the above-mentioned problems.

(1)以下の工程を含み、特定物質の量の変化に係わる微生物群を特定することを特徴とする微生物群の特定方法:
特定物質及び微生物を含む微生物試料中の、特定物質の量の変化速度、及び前記微生物が分類された微生物群の含有量の測定によって得られたデータセットから、再標本化により標本を作成する標本作成工程、
前記再標本化により作成した標本に対し、前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰係数を0に縮小可能な罰則付き回帰分析を行い、回帰係数に基づき選出された独立変数に対応する微生物群を選出する第一選出工程、
選出された微生物群を特定物質の量の変化に係わる微生物群と特定する特定工程。
(2)前記データセットにおいて、前記微生物群の含有量は、前記特定物質の量の変化速度の測定基準時点と同一時点及び/又は同一時点よりも前の時点の微生物群の含有量の測定によって得られたものである、前記(1)に記載の微生物群の特定方法。
(3)更に、前記第一選出工程で選出された微生物群の、再標本化により作成した標本における選出頻度から信頼度を算出し、前記信頼度に基づいて微生物群を更に選出する第二選出工程を含む、前記(1)又は(2)に記載の微生物群の特定方法。
(4)更に、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰分析を行い、p値に基づいて微生物群を更に選出する、或いは
更に、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、赤池情報量規準(AIC)の計算を行い、得られたAICの値に基づいて、微生物群を更に選出する、第五選出工程を含む、前記(1)〜(3)のいずれか一つに記載の微生物群の特定方法。
(5)前記赤池情報量規準の値に基づく選出が、
前記AICの値が最小になる独立変数の組み合わせとして微生物群を選出する、
前記AICの値が小さい順からm番目までの独立変数の組み合わせで過半数を超えて含まれる微生物群を選出する、又は
前記上位数をAICのヒストグラムにより決定された前記m番目までの独立変数の組み合わせで過半数を超えて含まれる微生物群を選出するものである(前記mは1以上の整数である)、前記(4)に記載の微生物群の特定方法。
(6)更に、前記第一選出工程、前記第二選出工程、又は前記第五選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰分析を行い、正相関または負相関のいずれか一方を示す微生物群を更に選出する第三選出工程を含む、前記(1)〜(5)のいずれか一つに記載の微生物群の特定方法。
(7)更に、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、正則化項を備えた主成分回帰分析を行い、少なくとも正相関または負相関のいずれかを示す微生物群を更に選出する第四選出工程を含む、前記(1)〜(3)のいずれか一つに記載の微生物群の特定方法。
(8)前記主成分回帰分析に、スパース正則化による1段階主成分回帰モデルを用いる前記(7)に記載の微生物群の特定方法。
(9)前記罰則付き回帰に、L1正則化項付き回帰分析手法を用いる前記(1)〜(8)のいずれか一つに記載の微生物群の特定方法。
(10)更に、以下の工程を含む、前記(1)〜(9)のいずれか一つに記載の微生物群の特定方法:
前記微生物試料中の、特定物質の量の変化速度の値を取得する速度取得工程、
前記微生物試料に含まれる前記微生物の塩基配列を解読する解読工程、
解読された前記塩基配列から、前記微生物試料に含まれる微生物を微生物群に分類し、前記微生物試料中の前記微生物群の相対的含有割合を決定する割合決定工程、
前記決定された微生物群の相対的含有割合から、前記微生物試料中の前記微生物群の含有量を決定する量決定工程。
(11)前記塩基配列の解読に、シーケンサーを用いることを特徴とする前記(10)に記載の微生物群の特定方法。
(12)前記微生物が、生物学的排水処理に使用される微生物であり、
前記微生物試料は前記排水処理が行われる処理槽中の処理水であり、
前記変化速度は、前記処理水に対し測定される前記特定物質の量から算出され、
前記再標本化により作成した標本は同一の処理槽における2以上の時点での特定物質の量の変化速度及び、前記微生物群の含有量のデータを含む前記(1)〜(11)のいずれか一つに記載の微生物群の特定方法。
(13)前記特定物質が、アンモニア、フェノール、チオシアン、及びチオ硫酸からなる群から選ばれるいずれか一種以上である、前記(1)〜(12)のいずれか一つに記載の微生物群の特定方法。
(14)前記微生物が、アンモニアを酸化し亜硝酸を生成する微生物、フェノールを分解する微生物、チオシアンを分解する微生物、及びチオ硫酸を分解する微生物からなる群から選ばれるいずれか一以上である、前記(1)〜(13)のいずれか一つに記載の微生物群の特定方法。
(1) A method for identifying a group of microorganisms, comprising the following steps, wherein the group of microorganisms is involved in a change in the amount of a specific substance:
A specimen for preparing a specimen by resampling from a data set obtained by measuring the rate of change of the amount of the specific substance in the microorganism sample containing the specific substance and the microorganism, and the content of the microorganism group in which the microorganism is classified Creation process,
For the sample created by the re-sampling, the content of the microorganism group as an independent variable, the corresponding change rate of the amount of the specific substance as a dependent variable, a regression analysis with penalties that can reduce the regression coefficient to 0, Performing, the first selection step of selecting a microorganism group corresponding to the independent variable selected based on the regression coefficient,
A specifying step of specifying the selected microorganism group as a microorganism group related to a change in the amount of the specific substance.
(2) In the data set, the content of the microorganism group is determined by measuring the content of the microorganism group at the same time and / or before the same time as the measurement reference time of the rate of change in the amount of the specific substance. The method for identifying a microorganism group according to the above (1), which is obtained.
(3) The second selection in which the reliability is calculated from the frequency of selection of the microorganisms selected in the first selection step in a sample created by resampling, and the microorganisms are further selected based on the reliability. The method for identifying a microorganism group according to the above (1) or (2), comprising a step.
(4) Further, a regression analysis is performed using the content of the microorganism group selected in the first selection step or the second selection step as an independent variable and the corresponding change rate of the amount of the specific substance as a dependent variable. The microorganism group is further selected based on the p value, or, further, the content of the microorganism group selected in the first selection step or the second selection step as an independent variable, the corresponding amount of the specific substance The above (1) to (3), including a fifth selection step of calculating the Akaike information criterion (AIC) using the rate of change as a dependent variable and further selecting a microorganism group based on the obtained AIC value. )).
(5) The selection based on the value of the Akaike information criterion
Selecting a microorganism group as a combination of independent variables that minimizes the value of the AIC,
Selecting a group of microorganisms containing more than a majority by a combination of independent variables from the smallest AIC value to the m-th one, or a combination of the m-th independent variables determined by the histogram of the AIC for the higher number. The method for identifying a group of microorganisms according to the above (4), wherein a group of microorganisms contained in more than a majority is selected (where m is an integer of 1 or more).
(6) Further, the content of the microorganism group selected in the first selection step, the second selection step, or the fifth selection step is used as an independent variable, and the rate of change of the amount of the corresponding specific substance is dependent. The microorganism group according to any one of (1) to (5), further including a third selection step of performing a regression analysis as a variable to further select a microorganism group exhibiting either a positive correlation or a negative correlation. How to identify.
(7) Further, the content of the microorganism group selected in the first selection step or the second selection step is used as an independent variable, and the rate of change in the amount of the specific substance is used as a dependent variable, and a regularization term is used. The microorganism according to any one of (1) to (3), further comprising a fourth selection step of performing a principal component regression analysis to further select a group of microorganisms exhibiting at least one of a positive correlation and a negative correlation. How to identify groups.
(8) The method for identifying a microorganism group according to (7), wherein a one-step principal component regression model based on sparse regularization is used for the principal component regression analysis.
(9) The method for identifying a microorganism group according to any one of (1) to (8), wherein a regression analysis method with an L1 regularization term is used for the regression with penalties.
(10) The method for identifying a microorganism group according to any one of (1) to (9), further comprising the following steps:
In the microorganism sample, a speed acquisition step of acquiring a value of a change rate of the amount of the specific substance,
Decoding step of decoding the base sequence of the microorganism contained in the microorganism sample,
From the decoded base sequence, classify the microorganisms contained in the microorganism sample into microorganism groups, a ratio determining step of determining the relative content of the microorganism group in the microorganism sample,
An amount determination step of determining the content of the microorganism group in the microorganism sample from the determined relative content ratio of the microorganism group.
(11) The method for identifying a microorganism group according to (10), wherein a sequencer is used for decoding the base sequence.
(12) The microorganism is a microorganism used for biological wastewater treatment,
The microorganism sample is treated water in a treatment tank where the wastewater treatment is performed,
The change rate is calculated from the amount of the specific substance measured for the treated water,
The sample prepared by the re-sampling includes any one of the above (1) to (11) including data on the rate of change of the amount of the specific substance at two or more times in the same treatment tank and the content of the microorganism group. A method for identifying a microorganism group according to one of the above.
(13) The identification of the microorganism group according to any one of (1) to (12), wherein the specific substance is any one or more selected from the group consisting of ammonia, phenol, thiocyanate, and thiosulfate. Method.
(14) the microorganism is at least one selected from the group consisting of a microorganism that oxidizes ammonia to produce nitrite, a microorganism that decomposes phenol, a microorganism that decomposes thiocyanate, and a microorganism that decomposes thiosulfate; The method for identifying a microorganism group according to any one of (1) to (13).

本発明の微生物群の特定方法によれば、特定物質の量の変化に係わる微生物群を特定可能である。   According to the method for specifying a microorganism group of the present invention, it is possible to specify a microorganism group related to a change in the amount of a specific substance.

本発明に係る微生物群の特定方法の実施形態を示すフロー図である。FIG. 1 is a flowchart showing an embodiment of a method for identifying a microorganism group according to the present invention. 本発明の実施形態に係る、特定物質の量の変化速度と、微生物群の含有量と、の測定により得られたデータセットの一例を示す模式図である。FIG. 4 is a schematic diagram illustrating an example of a data set obtained by measuring a change rate of an amount of a specific substance and a content of a microorganism group according to an embodiment of the present invention. 本発明の実施形態に係る、Bootstrap標本の作成の一例を示す模式図である。FIG. 4 is a schematic diagram illustrating an example of creation of a Bootstrap specimen according to the embodiment of the present invention. Lasso推定値の求解の概念を説明する模式図である。It is a schematic diagram explaining the concept of solution of a Lasso estimation value. 本発明の実施形態に係る、Bootstrap標本に対してLasso解析を行った結果の一例を示す模式図である。FIG. 7 is a schematic diagram showing an example of a result of performing Lasso analysis on a Bootstrap sample according to the embodiment of the present invention. 本発明の実施形態に係る、第二選出工程の一例を説明する模式図である。It is a mimetic diagram explaining an example of the 2nd selection process concerning an embodiment of the present invention. 実施例で用いられた、生物処理装置の構成を示す模式図である。FIG. 2 is a schematic diagram illustrating a configuration of a biological treatment apparatus used in an example. 実施例において取得された、生物処理装置での亜硝酸生成速度の結果を示す図である。It is a figure which shows the result of the nitrous acid production rate in the biological treatment apparatus acquired in the Example. 実施例において取得された、生物処理装置でのチオシアン除去速度の結果を示す図である。It is a figure which shows the result of the thiocyan removal rate in the biological treatment apparatus acquired in the Example. 実施例において取得された、生物処理装置での検出された全3752OTUに対する各OTUの相対割合の結果を示す図である。It is a figure which shows the result of the relative ratio of each OTU with respect to all 3752 OTU detected by the biological treatment apparatus acquired in the Example. 実施例において取得された、生物処理装置での亜硝酸生成速度の実測値、回帰分析による予測値および交差検証による予測値の平均値を示す図である。It is a figure which shows the average value of the measured value of the nitrite production | generation rate in a biological treatment apparatus, the predicted value by regression analysis, and the predicted value by cross-validation acquired in the Example. 実施例において取得された、生物処理装置でのチオシアン除去速度の実測値、回帰分析による予測値および交差検証による予測値の平均値を示す図である。It is a figure which shows the average value of the measured value of the thiocyan removal rate in the biological treatment apparatus, the predicted value by regression analysis, and the predicted value by cross-validation acquired in the Example. 実施例において取得された、生物処理装置での亜硝酸生成速度の結果を示す図である。It is a figure which shows the result of the nitrous acid production rate in the biological treatment apparatus acquired in the Example. 実施例において取得された、生物処理装置でのチオシアン除去速度の結果を示す図である。It is a figure which shows the result of the thiocyan removal rate in the biological treatment apparatus acquired in the Example. 実施例において取得された、生物処理装置でのチオ硫酸除去速度の結果を示す図である。It is a figure which shows the result of the thiosulfuric acid removal rate in the biological treatment apparatus acquired in the Example. 実施例において取得された、生物処理装置でのフェノール除去速度の結果を示す図である。It is a figure obtained in the example which shows the result of the phenol removal rate in the biological treatment apparatus. 実施例において取得された、生物処理装置での亜硝酸生成速度の実測値、回帰分析による予測値および交差検証による予測値の平均値を示す図である。It is a figure which shows the average value of the measured value of the nitrite production | generation rate in a biological treatment apparatus, the predicted value by regression analysis, and the predicted value by cross-validation acquired in the Example. 実施例において取得された、生物処理装置でのチオシアン除去速度の実測値、回帰分析による予測値および交差検証による予測値の平均値を示す図である。It is a figure which shows the average value of the measured value of the thiocyan removal rate in the biological treatment apparatus, the predicted value by regression analysis, and the predicted value by cross-validation acquired in the Example. 実施例において取得された、生物処理装置でのチオ硫酸除去速度の実測値、回帰分析による予測値および交差検証による予測値の平均値を示す図である。It is a figure which shows the average value of the measured value of the thiosulfuric acid removal rate in a biological treatment apparatus, the predicted value by regression analysis, and the predicted value by cross-validation acquired in the Example. 実施例において取得された、生物処理装置でのフェノール除去速度の実測値、回帰分析による予測値および交差検証による予測値の平均値を示す図である。It is a figure which shows the average value of the measured value of the phenol removal rate in a biological treatment apparatus, the predicted value by regression analysis, and the predicted value by cross-validation acquired in the Example. 実施例において取得された、生物処理装置での亜硝酸生成速度の実測値、および交差検証による予測値を示す図である。It is a figure which shows the measured value of the nitrite production | generation rate in the biological treatment apparatus acquired in the Example, and the predicted value by cross-validation. 実施例において取得された、生物処理装置でのチオシアン除去速度の実測値、および交差検証による予測値を示す図である。It is a figure which shows the actual value of the thiocyan removal rate in the biological treatment apparatus acquired in the Example, and the predicted value by cross-validation. 実施例において取得された、生物処理装置でのチオ硫酸除去速度の実測値、および交差検証による予測値を示す図である。It is a figure which shows the measured value of the thiosulfuric acid removal rate in the biological treatment apparatus acquired in the Example, and the predicted value by cross-validation. 実施例において取得された、生物処理装置でのフェノール除去速度の実測値、および交差検証による予測値を示す図である。It is a figure which shows the measured value of the phenol removal rate in the biological treatment apparatus acquired in the Example, and the predicted value by cross-validation.

≪微生物群の特定方法≫
以下、適宜図を参照しながら、実施形態の微生物群の特定方法について、例を挙げて説明する。なお、本発明の微生物群の特定方法は以下の実施形態に限定されない。
≪Method of identifying microorganisms≫
Hereinafter, the method for identifying a microorganism group according to the embodiment will be described with reference to examples as appropriate. In addition, the method for specifying a microorganism group of the present invention is not limited to the following embodiments.

図1に示すとおり、実施形態の微生物群の特定方法は、速度取得工程、解読工程、割合決定工程、量決定工程、標本作成工程、第一選出工程を有する選出工程及び特定工程を含む。選出工程がさらに含んでもよい工程として、第二選出工程、第三選出工程、第四選出工程、第五選出工程を例示する。
これら、速度取得工程、解読工程、割合決定工程、及び量決定工程により、標本作成工程に用いられるデータを取得する。特定物質の量の変化速度と、微生物群の含有量の測定により得られるデータセットの夫々の取得は、並列又は独立に行ってよい。
以下、各工程について詳細に説明する。
As shown in FIG. 1, the method for specifying a microorganism group according to the embodiment includes a speed acquisition step, a decoding step, a ratio determination step, a quantity determination step, a sample preparation step, a selection step having a first selection step, and a specification step. As the steps that the selection step may further include, a second selection step, a third selection step, a fourth selection step, and a fifth selection step are exemplified.
Through these speed acquisition step, decoding step, ratio determination step, and quantity determination step, data used in the sample preparation step is acquired. The acquisition of the data set obtained by measuring the change rate of the amount of the specific substance and the content of the microorganism group may be performed in parallel or independently.
Hereinafter, each step will be described in detail.

(速度取得工程)
速度取得工程は、微生物試料中の、特定物質の量の変化速度の値を取得する工程である。
本実施形態では、微生物試料が、生物学的排水処理が行われる処理槽中の処理水(以下単に「処理水」という場合がある。)である場合について説明する。
(Speed acquisition process)
The speed acquisition step is a step of acquiring a value of a change rate of the amount of the specific substance in the microorganism sample.
In the present embodiment, a case will be described in which the microorganism sample is treated water in a treatment tank in which biological wastewater treatment is performed (hereinafter sometimes simply referred to as “treated water”).

処理水としては、例えば、コークス工場から排出されたコークス排水が挙げられる。生物学的排水処理では、処理水には、生物学的排水処理に使用される微生物と、当該微生物の処理対象の特定物質が含まれる。処理槽中の特定物質は、前記微生物が分類された特定の微生物群によって処理され、量が変動する。処理槽中に特定物質を処理する微生物群が多く存在しているほど、特定物質の処理速度がより高められていると仮定できる。   Examples of the treated water include coke wastewater discharged from a coke plant. In biological wastewater treatment, treated water contains microorganisms used for biological wastewater treatment and specific substances to be treated by the microorganisms. The specific substance in the processing tank is processed by a specific microorganism group into which the microorganism has been classified, and the amount thereof varies. It can be assumed that the more microorganisms that process the specific substance are present in the processing tank, the higher the processing speed of the specific substance is.

特定物質としては、微生物が直接的又は間接的に処理することのできるものであれば特に限定されるものではない。例えば、特定物質としては、アンモニア、フェノール、チオシアン、及びチオ硫酸からなる群から選ばれるいずれか一種以上を挙げることができる。   The specific substance is not particularly limited as long as it can be directly or indirectly treated by the microorganism. For example, the specific substance may include any one or more selected from the group consisting of ammonia, phenol, thiocyanate, and thiosulfuric acid.

処理槽で処理水をバッチ処理する場合、処理水に含まれる特定物質の量の変化速度の値は、例えば、所定の時間内の処理水中の特定物質の変化量を求めることで得られる。特定物質の量は、処理水あたりの特定物質の濃度で表されてもよい。処理水中の特定物質の量は、処理槽からサンプリングして得られた処理水サンプルに対して求めてもよい。   When the treated water is batch-processed in the treatment tank, the value of the change rate of the amount of the specific substance contained in the treated water can be obtained, for example, by calculating the amount of change of the specific substance in the treated water within a predetermined time. The amount of the specific substance may be represented by a concentration of the specific substance per treated water. The amount of the specific substance in the treated water may be determined for a treated water sample obtained by sampling from the treatment tank.

処理槽中の処理水は常に完全混合されることが望ましいが、処理槽中の処理水に含まれる特定物質の量は、処理槽内で均一であるとは限らない。微生物が担体に固定化されている場合など、処理槽内で微生物の配置に偏りがある場合もある。特定物質の量の変化に係わる微生物を特定するという観点から、処理槽中での処理水に含まれる特定物質の量は、処理槽中で微生物の配置された近傍の処理水に対して求めることが好ましい。   Although it is desirable that the treated water in the treatment tank is always completely mixed, the amount of the specific substance contained in the treated water in the treatment tank is not always uniform in the treatment tank. In some cases, for example, when the microorganisms are immobilized on a carrier, the arrangement of the microorganisms in the treatment tank is biased. From the viewpoint of identifying the microorganisms involved in the change in the amount of specific substances, the amount of specific substances contained in the treated water in the treatment tank should be determined for the treated water near the microorganisms in the treatment tank. Is preferred.

処理槽で処理水を連続処理する場合、処理槽中の処理水に含まれる特定物質の量の変化速度の値は、例えば、処理槽中での処理水の滞留時間、水処理時間、処理槽中に流入する被処理水に含まれる特定物質の濃度、及び処理槽で処理された処理水に含まれる特定物質の濃度から求めることができる。
被処理水に含まれる特定物質の量は、処理槽に流入する前の被処理水から求めることが好ましい。係る被処理水として、後述の実施例の場合では、図6の処理槽中の24付近の処理水が挙げられる。
一方、処理槽で処理された処理水に含まれる特定物質の量は、微生物による生物学的処理を経たものでればよく、処理槽中で微生物の配置位置から下流側の処理水に対して求めることが好ましい。係る処理水として、後述の実施例の場合では、図6の処理槽中の20bや処理水25が挙げられる。ただし、上記のように処理槽中の処理水は常に完全混合されることが多く、そのような場合、20aの処理水に対して求めることができる。
When the treated water is continuously treated in the treatment tank, the value of the rate of change of the amount of the specific substance contained in the treated water in the treatment tank is, for example, the residence time of the treated water in the treatment tank, the water treatment time, the treatment tank. It can be obtained from the concentration of the specific substance contained in the water to be treated flowing into the water and the concentration of the specific substance contained in the treated water treated in the treatment tank.
The amount of the specific substance contained in the water to be treated is preferably obtained from the water to be treated before flowing into the treatment tank. In the case of an embodiment described later, such water to be treated includes treated water near 24 in the treatment tank of FIG.
On the other hand, the amount of the specific substance contained in the treated water treated in the treatment tank may be a value that has undergone biological treatment with microorganisms. It is preferable to obtain it. In the case of an embodiment described later, such treated water includes the treated water 20b and the treated water 25 in FIG. However, the treated water in the treatment tank is always completely mixed as described above, and in such a case, it can be determined for the treated water of 20a.

(解読工程)
解読工程は、前記微生物試料に含まれる前記微生物の塩基配列を解読する工程である。
生物学的排水処理では、処理水には、生物学的排水処理に使用される微生物と、当該微生物の処理対象の特定物質が含まれる。
(Decryption process)
The decoding step is a step of decoding the base sequence of the microorganism contained in the microorganism sample.
In biological wastewater treatment, treated water contains microorganisms used for biological wastewater treatment and specific substances to be treated by the microorganisms.

本実施形態における生物学的排水処理が対象とする微生物としては、例えば、アンモニアを酸化し亜硝酸を生成する微生物、フェノールを分解する微生物、チオシアンを分解する微生物、及びチオ硫酸を分解する微生物からなる群から選ばれるいずれか一以上を挙げることができる。
アンモニアを酸化し亜硝酸を生成する微生物としては、アンモニア酸化細菌(ammonia-oxidizing bacteria)やアンモニア酸化古細菌(ammonia-oxidizing archaea)が挙げられる。チオ硫酸を分解する微生物としては、チオバシラス・チオパルス(Thiobacillus Thioparus)などが挙げられる。しかしながら、同一の特定物質であっても多種多様な微生物が量の変化に係わるため、特定されている微生物群はごく一部である。加えて、多くの特定物質において量の変化に係わる微生物群は特定されていない。
Microorganisms targeted for biological wastewater treatment in this embodiment include, for example, microorganisms that oxidize ammonia to produce nitrite, microorganisms that degrade phenol, microorganisms that degrade thiocyan, and microorganisms that degrade thiosulfate. One or more selected from the group consisting of:
Examples of microorganisms that oxidize ammonia to produce nitrite include ammonia-oxidizing bacteria and ammonia-oxidizing archaea. Examples of microorganisms that decompose thiosulfate include Thiobacillus Thioparus. However, even with the same specific substance, a variety of microorganisms are involved in the change in the amount, so that only a small number of the specified microorganism groups are used. In addition, the number of microorganisms involved in the change in the amount of many specific substances has not been identified.

通常、処理槽中の処理水に含まれる微生物は、1種類のみではなく、複数の微生物群が含まれる。本明細書において「微生物群」とはある形質又は遺伝子型に基づいて分類された微生物集団を指し、例えば属、種、亜種が挙げられ、これらに限定されない。当該遺伝子型としては単に微生物のゲノムの塩基配列も含むものとする。
処理槽中の処理水に含まれる微生物群の数は、一例として、100種類以上100万種類以下であってもよく、1000種類以上1万種類以下であってもよい。
Usually, the microorganisms contained in the treated water in the treatment tank include not only one kind but a plurality of microorganism groups. As used herein, the term “microorganism group” refers to a population of microorganisms classified based on a certain trait or genotype, and includes, but is not limited to, genus, species, and subspecies. The genotype simply includes the base sequence of the genome of the microorganism.
The number of microorganisms contained in the treated water in the treatment tank may be, for example, 100 to 1,000,000, or 1,000 to 10,000.

処理槽中の処理水に含まれる微生物の塩基配列は、処理槽からサンプリングして得られた処理水サンプルから求めてもよい。微生物の塩基配列は、微生物のDNAの塩基配列であってもよく、微生物のRNAの塩基配列であってもよく、微生物のcDNA等の逆転写産物の塩基配列であってもよい。処理水が、微生物が固定化若しくは付着した担体を含む、又は微生物が固定化若しくは付着した担体と接触する場合には、処理水に含まれる微生物とは、当該担体に固定化若しくは付着した微生物であってもよい。   The base sequence of the microorganisms contained in the treated water in the treatment tank may be obtained from a treated water sample obtained by sampling from the treatment tank. The base sequence of the microorganism may be the base sequence of DNA of the microorganism, may be the base sequence of RNA of the microorganism, or may be the base sequence of a reverse transcript such as cDNA of the microorganism. When the treated water contains a carrier on which the microorganisms are immobilized or adhered, or when the microorganisms come into contact with a carrier on which the microorganisms are immobilized or adhered, the microorganisms contained in the treated water are microorganisms immobilized or adhered to the carrier. There may be.

本実施形態の解読工程では、例えば、先ず当該担体からDNAを抽出する。抽出されたDNAには、処理槽中の処理水に含まれる微生物のDNAが含まれている。得られたDNAの塩基配列は網羅的に解読してもよく、一部のみを解読してもよい。一部のみを解読する場合として、例えば、特定の遺伝子のDNAの塩基配列を対象に解読してもよい。また、当該担体から抽出されたRNAの逆転写産物(cDNA)の塩基配列を対象に解読してもよい。
通常、処理水に含まれる微生物を系統学的に分類しようとする場合、微生物のリボソームRNA遺伝子(rRNA遺伝子またはrDNA)の塩基配列の全長またはその一部を解読する。また、処理対象の特定物質が単一の場合、機能遺伝子の塩基配列を解読しても良い。一例として、アンモニアを酸化し亜硝酸を生成する微生物の場合、アンモニアモノオキシゲナーゼ遺伝子の塩基配列を解読してもよい。本実施形態では16SリボソームRNA遺伝子の塩基配列の一部を解読する場合を説明する。
In the decoding step of the present embodiment, for example, first, DNA is extracted from the carrier. The extracted DNA contains DNA of microorganisms contained in the treated water in the treatment tank. The base sequence of the obtained DNA may be decoded comprehensively or only a part thereof. As a case where only a part is decoded, for example, the base sequence of DNA of a specific gene may be decoded. Alternatively, the base sequence of the reverse transcript (cDNA) of RNA extracted from the carrier may be decoded.
Usually, when trying to phylogenetically classify microorganisms contained in treated water, the full length or a part of the base sequence of the ribosomal RNA gene (rRNA gene or rDNA) of the microorganism is decoded. When the specific substance to be processed is a single substance, the base sequence of the functional gene may be decoded. As an example, in the case of a microorganism that oxidizes ammonia to produce nitrite, the base sequence of the ammonia monooxygenase gene may be decoded. In the present embodiment, a case where a part of the base sequence of the 16S ribosomal RNA gene is decoded will be described.

解読された塩基配列からは、微生物種を特定できる場合もあるが、本実施形態の微生物の特定方法において、種の特定は必須ではない。例えば、1リードの塩基配列を1つの微生物とみなし、塩基配列の同一性や相同性等に基づいて、塩基配列を分類し、分類された塩基配列の分類群を、微生物の微生物群として扱ってもよい。通常、相同性が97%以上の塩基配列データを1つのグループのクラスタとしてまとめ、各クラスタ配列の中で最も出現頻度の高い配列を代表OTU(OTU; Operational Taxonomic Unit; 操作的分類単位)配列とし、1OTUを1微生物群として扱う。なお、相同性は97%以上でも以下でもよく、例えば、80%以上であってもよく、90%以上であってもよく、95%以上であってもよく、98%以上であってもよい。本実施形態では、当該OTUに基づいて微生物群を分類する。   In some cases, the species of the microorganism can be identified from the decoded base sequence, but in the method for identifying a microorganism of the present embodiment, the identification of the species is not essential. For example, a base sequence of one read is regarded as one microorganism, the base sequence is classified based on the identity and homology of the base sequence, and the taxonomic group of the classified base sequence is treated as a microorganism group of the microorganism. Is also good. Normally, base sequence data having a homology of 97% or more are grouped into one group of clusters, and the most frequently occurring sequence in each cluster sequence is represented as a representative OTU (Operative Taxonomic Unit) sequence. One OTU is treated as one group of microorganisms. Incidentally, the homology may be 97% or more, or may be, for example, 80% or more, 90% or more, 95% or more, or 98% or more. . In the present embodiment, the microorganism group is classified based on the OTU.

DNAの抽出及び解読は、公知の方法により行うことができる。塩基配列の解読にはシーケンサーを用いることができる。
本実施形態の微生物群の特定方法は、非常に多くの微生物情報を含むデータに対して好適に用いられる。そのため、前記塩基配列の解読に、次世代シーケンサーを用いることが好ましい。次世代シーケンサーとしては、DNAポリメラーゼ等による逐次的DNA合成反応を利用したものが代表的である。前記塩基配列の解読に用いるシーケンサープラットフォームとして、454、Illumina、SOLiD、Ion torrent、PacBioが挙げられる。
Extraction and decoding of DNA can be performed by a known method. A sequencer can be used for decoding the nucleotide sequence.
The method for identifying a microorganism group according to the present embodiment is suitably used for data including a great deal of microorganism information. Therefore, it is preferable to use a next-generation sequencer for decoding the base sequence. As a next-generation sequencer, a sequencer utilizing a sequential DNA synthesis reaction by a DNA polymerase or the like is typical. Sequencer platforms used for decoding the base sequence include 454, Illumina, SOLiD, Ion torrent, and PacBio.

(割合決定工程)
割合決定工程は、前記解読工程で解読された前記塩基配列から、前記微生物試料に含まれる微生物を微生物群に分類し、前記微生物試料中の前記微生物群の相対的含有割合を決定する工程である。
例えば、前記処理水サンプルに、分類群Aに分類される塩基配列30リードと、分類群Bに分類される塩基配列20リードとが含まれているとする。この場合、この処理水サンプルには、分類群Aに分類される微生物群30部と、分類群Bに分類される微生物群20部とが含まれていると見なすことができる。
(Ratio determination process)
The ratio determining step is a step of classifying the microorganisms contained in the microorganism sample into microorganism groups from the base sequence decoded in the decoding step, and determining a relative content ratio of the microorganism group in the microorganism sample. .
For example, it is assumed that the treated water sample contains 30 base sequence reads classified into taxonomic group A and 20 base sequence reads classified into taxonomic group B. In this case, it can be considered that the treated water sample contains 30 parts of microorganisms classified into taxon A and 20 parts of microorganisms classified into taxon B.

(量決定工程)
量決定工程は、前記割合決定工程で決定された微生物群の相対的含有割合から、前記微生物試料中の前記微生物群の含有量を決定する工程である。例えば、処理槽中の処理水に含まれる微生物群の含有量は、相対的含有割合を得た処理水サンプルに対応する処理水サンプルに含まれる微生物数の値を得て、相対的含有割合に該微生物数を乗じることで求めることができる。
微生物数の値は、微生物数の値そのものである必要はなく、処理水サンプル間での微生物数の値が反映されているものであればよい。これは、上記の全分類群に分類された微生物を共通して検出できるものがよい。例えば、処理水サンプルに含まれるDNA量から、処理水サンプルに含まれる微生物数を求めてもよい。また、処理水サンプルに含まれる共通の遺伝子の数から、処理水サンプルに含まれる微生物数を求めてもよい。なお、試料間での微生物数の値に違いがないと判断される場合などでは、前期割合決定工程で決定された微生物群の相対割合を微生物群の含有量とすることもできる。
また、上記量決定工程で決定した微生物群の含有量を標準化した値を標準化された微生物量とすることもできる。
(Quantity determination process)
The amount determination step is a step of determining the content of the microorganism group in the microorganism sample from the relative content ratio of the microorganism group determined in the ratio determination step. For example, the content of the microorganisms contained in the treated water in the treatment tank, the value of the number of microorganisms contained in the treated water sample corresponding to the treated water sample obtained the relative content ratio, the relative content ratio It can be determined by multiplying by the number of microorganisms.
The value of the number of microorganisms does not need to be the value of the number of microorganisms itself, but may be any value that reflects the value of the number of microorganisms between treated water samples. It is preferable that the microorganisms classified into all the above-mentioned taxa can be detected in common. For example, the number of microorganisms contained in the treated water sample may be determined from the amount of DNA contained in the treated water sample. Further, the number of microorganisms contained in the treated water sample may be obtained from the number of common genes contained in the treated water sample. When it is determined that there is no difference in the number of microorganisms between samples, for example, the relative ratio of the microorganisms determined in the ratio determination step in the previous period may be used as the content of the microorganisms.
Further, a value obtained by standardizing the content of the microorganism group determined in the above-mentioned amount determination step can be used as the standardized microorganism amount.

上記の速度取得工程、解読工程、割合決定工程、及び量決定工程を経て、前記標本作成工程に用いられる特定物質の量の変化速度、及び前記微生物が分類された微生物群の含有量のデータが取得される。
これらのデータは、例えば処理水サンプルごとに取得される。特定物質の量の変化速度と、微生物群の含有量のデータとは、それぞれ同一の処理水サンプルから取得されてもよい。又は、処理槽中の各微生物群の含有量と、処理槽で処理された特定物質の量の変化との相関を仮定できる範囲において、特定物質の量の変化速度と、微生物群の含有量のデータとは、それぞれ別々の処理水サンプルから取得されてもよい。別々の処理水サンプルを用いる場合の一例としては、処理槽から微生物群の含有量のデータ取得に使用された処理水サンプルが採取され、その後数日後に同一の処理槽から、特定物質の量の変化速度を求めるのに使用された処理水サンプルが採取される場合が挙げられる。
また、処理水サンプルは同一の処理槽に由来するものであってもよいが、処理槽中の各微生物群の含有量と、処理槽で処理された特定物質の量の変化との相関を仮定できる範囲において、別々の処理槽に由来するものであってもよい。
Through the above speed acquisition step, decoding step, ratio determination step, and amount determination step, the rate of change of the amount of the specific substance used in the sample preparation step, and the data of the content of the microorganism group in which the microorganisms are classified are Is obtained.
These data are acquired, for example, for each treated water sample. The rate of change in the amount of the specific substance and the data on the content of the microorganism group may be obtained from the same treated water sample. Or, within a range in which the correlation between the content of each microorganism group in the treatment tank and the change in the amount of the specific substance treated in the treatment tank can be assumed, the rate of change in the amount of the specific substance and the content of the microorganism group The data may be obtained from separate treated water samples. As an example of using a separate treated water sample, a treated water sample used for data acquisition of the content of the microorganism group is collected from the treatment tank, and several days later, the amount of the specific substance is removed from the same treatment tank. In some cases, a sample of the treated water used to determine the rate of change is taken.
In addition, the treated water sample may be derived from the same treatment tank, but the correlation between the content of each microorganism group in the treatment tank and the change in the amount of the specific substance treated in the treatment tank is assumed. To the extent possible, they may be derived from different treatment tanks.

処理水サンプルから得られた特定物質の量の変化速度のデータと、微生物群の含有量のデータとを、これらの相関が仮定できる範囲で組み合わせることにより、特定物質の量の変化速度、及び前記微生物が分類された微生物群の含有量の測定により得られるデータセットを作成する。このデータセットを初期標本として、実施形態の再標本化による標本の作成に用いることができる。前記再標本化により作成した標本は同一の処理槽における2以上の時点での特定物質の量の変化速度及び、前記微生物群の含有量のデータを含むことが好ましい。   By combining the data on the rate of change in the amount of the specific substance obtained from the treated water sample and the data on the content of the microorganisms within a range in which these correlations can be assumed, the rate of change in the amount of the specific substance, and A data set obtained by measuring the content of the microorganism group into which the microorganism has been classified is created. This data set can be used as an initial sample for creating a sample by resampling in the embodiment. It is preferable that the sample prepared by the re-sampling includes data on the rate of change of the amount of the specific substance at two or more times in the same treatment tank and the content of the microorganism group.

(標本作成工程)
標本作成工程は、特定物質及び微生物を含む微生物試料中の、特定物質の量の変化速度、及び前記微生物が分類された微生物群の含有量の測定により得られたデータセットから、再標本化により標本を作成する工程である。
(Sample preparation process)
In the sample preparation step, the rate of change in the amount of the specific substance in the microorganism sample containing the specific substance and the microorganism, and a data set obtained by measuring the content of the microorganism group in which the microorganism is classified, by re-sampling. This is the step of creating a specimen.

図2は、本実施形態における、処理槽中の処理水に含まれる特定物質の量の変化速度と、処理槽中の処理水に含まれる微生物群の含有量と、の測定により得られたデータセットの一例を示す模式図である。
図2中、tは処理水中から特定物質の変化速度及び微生物群の含有量を取得したデータセット数を表し、1〜n番目まで順に番号が付されている。ここでは特定物質が亜硝酸である場合を示す。
Denovoは微生物群の種類を表し、pは微生物群の数を表す。図2中の丸は各微生物群の含有量のデータを表す。例えば、p=3752である場合、処理水に3752種類の微生物群が含まれ、各測定により得られたデータセットには、3752個の各微生物群の含有量のデータが含まれる。図2中の四角は処理水に含まれる亜硝酸量の変化速度のデータを表す。各データセットには、1個の亜硝酸量の変化速度のデータが含まれる。例えば、1日1回、処理水から前記データセットを取得すると、n=23である場合、23日間に取得された23個の処理水の前記データセットがあることを意味する。
FIG. 2 shows data obtained by measuring the rate of change of the amount of the specific substance contained in the treated water in the treatment tank and the content of the microorganisms contained in the treated water in the treatment tank in the present embodiment. It is a schematic diagram which shows an example of a set.
In FIG. 2, t represents the number of data sets in which the rate of change of the specific substance and the content of the microorganism group have been obtained from the treated water, and numbers are assigned in order from the first to the nth. Here, the case where the specific substance is nitrous acid is shown.
Denovo represents the type of microorganism group, and p represents the number of microorganism groups. The circles in FIG. 2 represent data on the content of each microorganism group. For example, when p = 3752, the treated water contains 3752 kinds of microorganism groups, and the data set obtained by each measurement contains data on the content of 3752 microorganism groups. The squares in FIG. 2 represent data on the rate of change of the amount of nitrous acid contained in the treated water. Each data set includes data on the rate of change of the amount of nitrite. For example, if the data set is obtained from treated water once a day, if n = 23, it means that there are 23 data sets of treated water acquired during 23 days.

データの取得頻度は、任意に設定でき、例えば1日1回、3日に1回、7日に1回である。微生物群の特定を精度よく行うためには、データの取得頻度は高いほうが良いのだが、あまり短い取得頻度を設けると偶発的な変動の結果も取得してしまう場合もあるので、取得頻度はある程度の期間を設けてよい。また処理槽内の微生物群の滞留時間等も考慮して、取得頻度を適宜設定すればよい。   The data acquisition frequency can be set arbitrarily, for example, once a day, once every three days, or once every seven days. In order to identify microorganisms with high accuracy, it is better to acquire data at a high frequency.However, if the acquisition frequency is too short, accidental fluctuation results may also be acquired. May be provided. In addition, the acquisition frequency may be appropriately set in consideration of the residence time of the microorganisms in the treatment tank.

前記データセットにおいて、前記微生物群の含有量は、前記特定物質の量の変化速度の測定基準時点と同一時点のデータ及び/又は同一時点よりも前の時点の含有量のデータを使用してもよい。   In the data set, the content of the microorganism group may be determined by using data at the same time as the measurement reference time of the change rate of the amount of the specific substance and / or data of the content at a time earlier than the same time. Good.

上記表に示す例では、運転開始N日から7日ごと(Nは0以上の整数を表す)の取得頻度でデータを取得する場合を示している。特定物質の量の変化速度は、例えば流入する被処理水の濃度から処理水に含まれる特定物質の濃度を引いた値を水処理時間で割ることで算出できる。
上記同一時点のデータを用いてデータセットを作成する場合、例えば2時点目のデータを用いてデータセットを作成する場合には、運転(N+14)日目の物質量から算出した特定物質の量の変化速度のデータと、運転(N+14)日目に取得した微生物群の含有量の値のデータとを用いる場合を例示できる。
上記同一時点よりも前の時点の含有量のデータを用いてデータセットを作成する場合、例えば2時点目の特定物質の量の変化速度のデータを用いてデータセットを作成する場合には、運転(N+14)日目の物質量から算出した特定物質の量の変化速度のデータと、運転(N+7)日目に取得した微生物群の含有量の値のデータとを用いる場合を例示できる。
The example shown in the above table shows a case in which data is acquired at an acquisition frequency of every seven days (N represents an integer of 0 or more) from the Nth day of operation start. The rate of change of the amount of the specific substance can be calculated by, for example, dividing a value obtained by subtracting the concentration of the specific substance contained in the treated water from the concentration of the inflowing treated water by the water treatment time.
When a data set is created using the data at the same time point, for example, when a data set is created using the data at the second time point, the amount of the specific substance calculated from the substance amount on the operation (N + 14) day is calculated. A case where the data of the change speed and the data of the content value of the microorganism group acquired on the (N + 14) th day of operation can be exemplified.
When a data set is created using the content data at a time point earlier than the same time point, for example, when a data set is created using the change rate data of the amount of the specific substance at the second time point, the operation A case where the data of the change rate of the amount of the specific substance calculated from the substance amount on the (N + 14) day and the data of the value of the content of the microorganism group acquired on the (N + 7) day of the operation can be exemplified.

また、データセットには、異なる複数の時点での微生物群の含有量のデータを含めることができる。上記同一時点及び同一時点よりも前の時点の微生物群の含有量のデータを用いてデータセットを作成する場合、例えば2時点目の特定物質の量の変化速度のデータを用いてデータセットを作成する場合には、運転(N+14)日目の物質量から算出した特定物質の量の変化速度のデータと、運転(N+14)日目に取得した微生物群の含有量の値のデータに加え、運転(N+7)日目に取得した微生物群の含有量の値のデータを用いる場合を例示できる。
同一時点よりも前の時点とは、上記に例示したような一時点前のデータの他、二時点前、三時点前等の任意の時点前のデータを採用でき、これら各時点でのデータは、それぞれ組み合わせて使用することも可能である。また、上記例では7日ごとの等間隔の時点を例示しているが、各時点の時間間隔は、同一であってもよく異なっていてもよい。
このように、データセットに、異なる複数の時点での微生物群の含有量のデータを含めることで、特定物質の量の変化速度と含有量との相関に、ある程度のタイムラグがある微生物群のデータも幅広く解析に含めることができ、より高精度に微生物群の特定を行うことが可能である。
In addition, the data set can include data on the content of the microorganism group at a plurality of different time points. When a data set is created using the data on the content of the microorganisms at the same time point and a time point earlier than the same time point, for example, a data set is created using the change rate data of the amount of the specific substance at the second time point In this case, in addition to the data on the rate of change in the amount of the specific substance calculated from the substance amount on the operation (N + 14) day and the data on the content of the microorganisms obtained on the operation (N + 14) day, the operation A case where the data of the value of the content of the microorganism group acquired on the (N + 7) day is used can be exemplified.
The point in time before the same point in time can be, in addition to the data before the temporary point as exemplified above, data before any point in time, such as two points before, three points in time, etc. , Can be used in combination. Further, in the above example, time points at equal intervals every seven days are illustrated, but the time intervals at each time point may be the same or different.
In this way, by including data on the content of microbial communities at multiple different time points in the data set, data on microbial communities that have a certain time lag in the correlation between the rate of change of the amount of specific substances and the content Can be widely included in the analysis, and the microorganism group can be specified with higher accuracy.

図2中、異なる複数の時点での微生物群の含有量のデータを含める場合として、1時点目と2時点目の微生物群の含有量のデータを追加で含めた場合、例えば、処理水に3752種類の微生物群ごとに2時点分のデータが含まれ、p=3752×2となる。   In FIG. 2, when data on the content of the microorganisms at a plurality of different time points is included, when data on the content of the microorganisms at the first time and the second time are additionally included, for example, 3752 Data for two time points is included for each type of microorganism group, and p = 3752 × 2.

再標本化する手法として、Bootstrap法、Jackknife法等が使用できる。本実施形態では再標本化する手法としてBoootstrap法を用いる場合を説明する。
図3は、本実施形態において、図2に示す取得データのデータセットからBootstrap法によりBootstrap標本を作成する場合の一例を示す模式図である。図3中、前記のn個のデータセット(図中左)から、無作為にn´個のデータセットを再サンプリングし(図中右)、n´個のデータセットからなる複数組(B組)のBootstrap標本を作成する。前記nとn´の値は通常同じだが、異なっても良い。サンプリングされる前記データセットは重複していてもよい。例えば、図3中の1組目に示す例では、t=1が2つ重複してサンプリングされている。図3中、Bは組の番号を表す。例えば、B=1000である場合、1000組のBootstrap標本を作成する。組数は100組以上が好ましく、1000組以上がより好ましい。より好ましくは、組数を徐々に増やしながらBoootstrap標本を作成し、後述の第一選出工程で選出される微生物群の数が変わらなくなるまで組数を増やすことが望ましい。
As a technique for resampling, the Bootstrap method, the Jacknife method, or the like can be used. In the present embodiment, a case will be described in which the Bootstrap method is used as a technique for resampling.
FIG. 3 is a schematic diagram illustrating an example of a case where a Bootstrap sample is created from the data set of the acquired data illustrated in FIG. 2 by the Bootstrap method in the present embodiment. In FIG. 3, from the n data sets (left in the figure), n ′ data sets are resampled at random (right in the figure), and a plurality of sets of the n ′ data sets (group B) Create a bootstrap sample of ()). The values of n and n 'are usually the same, but may be different. The data sets to be sampled may overlap. For example, in the example shown in the first set in FIG. 3, t = 1 is sampled in duplicate. In FIG. 3, B represents a set number. For example, if B = 1000, 1000 sets of Bootstrap samples are created. The number of sets is preferably 100 or more, more preferably 1000 or more. More preferably, it is desirable to create a Bootstrap specimen while gradually increasing the number of groups, and to increase the number of groups until the number of microorganism groups selected in the first selection step described below does not change.

(第一選出工程)
第一選出工程は、前記再標本化により作成した標本に対し、前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、罰則付き回帰分析を行い、回帰係数に基づき選出された独立変数に対応する微生物群を選出する工程である。
本実施形態における罰則付き回帰分析では、推定された係数の値をより小さくするような罰則を与えることを目的とし、回帰係数を0に縮小可能な罰則付き回帰分析を行う。回帰係数を0に縮小可能な罰則付き回帰分析としては、Lasso(Least Absolute Shrinkage and Selection Operator)、Elastic net及びSCAD(Smoothly Clipped Absolute Deviation)に代表されるL1ノルムの正則化項を備えた回帰式を使用できる。
(First selection process)
The first selection step, for the sample created by the re-sampling, the content of the microorganism group as an independent variable, the corresponding change rate of the amount of the specific substance as a dependent variable, performing a penalized regression analysis, This is a step of selecting a microorganism group corresponding to the independent variable selected based on the regression coefficient.
In the regression analysis with penalties according to the present embodiment, regression analysis with penalties that can reduce the regression coefficient to 0 is performed for the purpose of giving a penalty that makes the value of the estimated coefficient smaller. Examples of the regression analysis with penalties that can reduce the regression coefficient to 0 include Lasso (Least Absolute Shrinkage and Selection Operator), Elastic net, and SCAD (Smoothly Clipped Absolute equation with a regression equation that includes a regression equation with a regression equation that includes a regression equation). Can be used.

本実施形態では、罰則付き回帰分析として上記Lasso法を用いる場合を説明する。
例えば、特定物質が亜硝酸である場合、下記式(A)の関数が表される。
In the present embodiment, a case where the above-mentioned Lasso method is used as the regression analysis with penalties will be described.
For example, when the specific substance is nitrous acid, the function of the following formula (A) is expressed.

Lasso法では、係数を0に縮小させることができる。そのため、変数(微生物群)選択(選出)と、定数項及び係数の推定と、を同時に行うことができる。これにより、従来、現実的に分析が不可能であったような独立変数の個数が多いデータに対しても、回帰分析が可能となる。   In the Lasso method, the coefficient can be reduced to zero. Therefore, selection (selection) of a variable (microorganism group) and estimation of a constant term and a coefficient can be performed simultaneously. As a result, regression analysis can be performed even on data having a large number of independent variables, which has not been practically analyzed conventionally.

Lassoとは、下記式(I)で表す関数をパラメータβに関して最小化する方法である。下記式(I)式の第2項がL1ノルムの正則化項である。   Lasso is a method of minimizing the function represented by the following equation (I) with respect to the parameter β. The second term of the following equation (I) is a regularization term of the L1 norm.

上記式(I)式は、下記式(II)式に示す係数βに関するL1ノルムの条件付き最小化問題に書き換えることができる。   The above equation (I) can be rewritten as a conditional minimization problem of the L1 norm for the coefficient β shown in the following equation (II).

これを図的に理解すると図4のようになる。図4は、Lasso推定値の求解の概念を説明する模式図である。網掛けで示した正方形の制約領域と等高線が接する部分が解となる。以下に、Lasso推定値を決定するためのアルゴリズムを示す。   FIG. 4 shows this diagrammatically. FIG. 4 is a schematic diagram for explaining the concept of solving a Lasso estimation value. The portion where the square restricted area shown by hatching and the contour line are in contact is the solution. The following is an algorithm for determining the estimated Lasso value.

線形回帰モデルの場合、下記式(III)の最小化を考える。ここで、独立変数は平均0、分散は1に基準化、従属変数は0に平均化している。   In the case of a linear regression model, minimization of the following equation (III) is considered. Here, the independent variable is averaged to 0, the variance is normalized to 1, and the dependent variable is averaged to 0.

次に、任意のjについてβ=0とし、j=1,2,…,p,1,2,…、として下記式(IV)を計算する。 Next, β j = 0 for an arbitrary j, and the following equation (IV) is calculated with j = 1, 2,..., P, 1, 2,.

λは固定として、下記式(V)と更新し、S(・,・)は下記式(VI)で表される。   λ is fixed and updated with the following equation (V), and S (·, ·) is represented by the following equation (VI).

本実施形態に係る罰則付き回帰分析において、データセット数nに対する微生物群の数pの比(p/n)は、10≦p/n≦10000であってもよく、100≦p/n≦1000であってもよい。
本実施形態に係る罰則付き回帰分析の、関数あたりの微生物群の数pは、100以上100万以下であってもよく、1000以上1万以下であってもよい。
In the regression analysis with penalties according to this embodiment, the ratio (p / n) of the number p of the microorganism groups to the number n of the data sets may be 10 ≦ p / n ≦ 10000, and 100 ≦ p / n ≦ 1000. It may be.
In the regression analysis with penalties according to the present embodiment, the number p of microorganism groups per function may be 100 or more and 1,000,000 or less, or may be 1000 or more and 10,000 or less.

図5は、前記B組のBootstrap標本に対し、それぞれLasso解析を行った結果を示す模式図である。図5中の1組目のBootstrap標本からは、係数の0とならなかった変数に対応する3つのDenovo(微生物群)が選出されたことを示す。
同じく、B組目のBootstrap標本からは、2つのDenovo(微生物群)が選出されたことを示す。ここで示すように、各Bootstrap標本をLasso解析した場合、選ばれるDenovoの種類は同じとは限らず、選ばれるDenovoの個数も同じとは限らない。
後述の実施例1で具体的に示される例では、3752種類の微生物群から、27種の微生物群が選出できた。
第一選出工程により、特定物質の量の変化に寄与が大きい微生物群が選出される。
FIG. 5 is a schematic diagram showing the results of performing Lasso analysis on the Bootstrap samples of the B group. FIG. 5 shows that three Denovo (microorganism groups) corresponding to the variables whose coefficients did not become 0 were selected from the first set of Bootstrap samples in FIG.
Similarly, it shows that two Denovo (microorganisms) were selected from the Bootstrap specimen of the B group. As shown here, when each Bootstrap sample is subjected to Lasso analysis, the type of selected Denovo is not always the same, and the number of selected Denovo is not necessarily the same.
In the example specifically shown in Example 1 to be described later, 27 kinds of microorganisms could be selected from 3752 kinds of microorganisms.
In the first selection step, a group of microorganisms that greatly contributes to the change in the amount of the specific substance is selected.

(第二選出工程)
第二選出工程は、前記第一選出工程で選出された微生物群の、再標本化により作成した標本における選出頻度から信頼度を算出し、前記信頼度に基づいて微生物群を更に選出する工程である。
(Second selection process)
The second selection step is a step of calculating reliability from a selection frequency in a sample created by resampling of the microorganism group selected in the first selection step, and further selecting a microorganism group based on the reliability. is there.

前記第一選出工程で再標本化により作成した標本をB組作成して解析し、前記第一選出工程での各微生物群の選出回数をU回とすると、各微生物群の第一選出工程での選出頻度はU/Bで表され、当該値を信頼度とすることができる。   In the first selection step, samples prepared by re-sampling are prepared and analyzed in group B. If the number of selections of each microorganism group in the first selection step is U times, in the first selection step of each microorganism group, Is represented by U / B, and the value can be used as the reliability.

図6は、第二選出工程を説明する模式図である。まず、各微生物群が選出されたことの信頼度を算出する。図6に示すとおり、B組のBootstrap標本を解析した結果を集計し、前記第一選出工程で選出された回数を集計する。図6に示す例では、前記第一選出工程でDenovo1は988回選出され、Denovo2は675回選出されている。ここで、Bootstrap標本を1000組とした場合、Denovo1の信頼度は988/1000=0.988であり、Denovo2の信頼度は675/1000=0.675である。
この得られた信頼度に基づいて、前記第一選出工程で選出された微生物群を更に選出する。大きな信頼度の値を得た微生物群であるほど、特定物質の量の変化に寄与が大きいものであると推定できる。第二選出工程における信頼度の基準値は適宜選択すればよいが、例えば、信頼度0.3以上、0.4以上、0.5以上、0.6以上、0.7以上、0.8以上、又は0.9以上の微生物群をさらに選出することが挙げられる。後述の実施例1で具体的に示されるチオシアン除去の例では、信頼度0.6以上を基準として、27種類の微生物群から、さらに5種の微生物群が選出できた。
第二選出工程により、特定物質の量の変化に寄与がより大きい微生物群が選出される。
FIG. 6 is a schematic diagram illustrating the second selection step. First, the degree of reliability that each microorganism group has been selected is calculated. As shown in FIG. 6, the results of analyzing the Bootstrap samples of group B are totaled, and the number of times selected in the first selection step is totaled. In the example shown in FIG. 6, Denovo1 is selected 988 times and Denovo2 is selected 675 times in the first selection step. Here, when 1000 sets of Bootstrap samples are used, the reliability of Denovo1 is 988/1000 = 0.988, and the reliability of Denovo2 is 675/1000 = 0.675.
Based on the obtained reliability, the microorganism group selected in the first selection step is further selected. It can be estimated that the greater the reliability of the microorganism group, the greater the contribution to the change in the amount of the specific substance. The reference value of the reliability in the second selection step may be appropriately selected. For example, the reliability is 0.3 or more, 0.4 or more, 0.5 or more, 0.6 or more, 0.7 or more, 0.8 or more. More than or a group of 0.9 or more microorganisms may be further selected. In the example of thiocyan removal specifically shown in Example 1 described below, five more microorganism groups could be selected from 27 kinds of microorganism groups based on a reliability of 0.6 or more.
In the second selection step, a group of microorganisms that contribute more to the change in the amount of the specific substance is selected.

(第三選出工程)
第三選出工程は、前記第一選出工程、前記第二選出工程又は後述の第五選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰分析を行い、正相関または負相関のどちらか一方を示す微生物群を更に選出する工程である。
本実施形態では、前記第一選出工程、前記第二選出工程又は第五選出工程のうち、前記第二選出工程で選出された微生物群を用いて解析を行う場合を説明する。なお、第三選出工程では第一及び第二選出工程を経て、既に独立変数の数が絞り込まれているため、第三選出工程における回帰分析は罰則付き回帰分析に限定されず、最小二乗法や最尤法等による罰則項なしの回帰分析の手法を採用してもよい。また、例えば、解析したDenovoに対するp値を得てもよい。得られたp値を基準に、第三選出工程で選出された微生物群から、さらに微生物群を選出することもできる。例えば、p値が0.05未満の微生物群を選出することを例示できる。この工程におけるp値とは、用いた回帰分析における回帰係数の推定値の信頼度である。
第三選出工程の回帰分析を行い、各独立変数の回帰係数を算出する。そして、回帰係数が正または負のどちらか一方を示す微生物群を選出する。後述の実施例1で具体的に示されるチオシアン除去の例では、回帰係数が正を示す微生物として、5種類の微生物群から、さらに3種の微生物群が選出できた。
第三選出工程により、特定物質の量の変化に寄与がより大きく、特定物質の量の変化に正または負のどちらか一方に相関する微生物群が選出される。
(Third selection process)
The third selection step, the first selection step, the second selection step or the content of the microorganisms selected in the fifth selection step described later as an independent variable, the corresponding change rate of the amount of the specific substance the specific substance. This is a step of performing a regression analysis as a dependent variable and further selecting a microorganism group showing either a positive correlation or a negative correlation.
In the present embodiment, a case will be described in which the analysis is performed using the microorganisms selected in the second selection step among the first selection step, the second selection step, and the fifth selection step. In the third selection step, the number of independent variables has already been narrowed down after the first and second selection steps.Therefore, the regression analysis in the third selection step is not limited to regression analysis with penalties. A method of regression analysis without a penalty term by the maximum likelihood method or the like may be adopted. Further, for example, a p-value for the analyzed Denovo may be obtained. Based on the obtained p value, a group of microorganisms can be further selected from the group of microorganisms selected in the third selection step. For example, selecting a microorganism group having a p value of less than 0.05 can be exemplified. The p-value in this step is the reliability of the estimated value of the regression coefficient in the used regression analysis.
The regression analysis of the third selection step is performed, and the regression coefficient of each independent variable is calculated. Then, a group of microorganisms whose regression coefficient indicates either positive or negative is selected. In the example of thiocyan removal specifically shown in Example 1 described later, three more microorganism groups could be selected from the five microorganism groups as the microorganisms having a positive regression coefficient.
In the third selection step, a group of microorganisms that contributes more to the change in the amount of the specific substance and correlates positively or negatively with the change in the amount of the specific substance is selected.

(第四選出工程)
第四選出工程は、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、正則化項を備えた主成分回帰分析を行い、少なくとも正相関または負相関のいずれかを示す微生物群を更に選出する工程である。
本実施形態では、前記第一選出工程又は前記第二選出工程のうち、前記第一選出工程で選出された微生物群を用いて解析を行う場合を説明する。図1に示すとおり第二選出工程、第三選出工程及び第五選出工程に代えて第四選出工程により、微生物群を更に選出する。
まず、第四選出工程の正則化項を備えた主成分回帰分析を行い、設定した各主成分軸の回帰係数を算出する。そして、各主成分軸のいずれか1つ以上について、回帰係数と各主成分軸でのOTUの主成分の値とを乗じた値が、少なくとも正または負のどちらかを示す微生物群を選出する。正則化項が備わった主成分回帰では、各主成分軸でのOTUの主成分の値がゼロになることがある。このOTUは、特定物質の量の変化に関わらない微生物群と判断でき、選出から除外する。設定する主成分軸の数は任意であるが、統計処理が複雑になりすぎないよう、主成分軸の数は1〜5個程度とするのが好ましい。
(Fourth selection process)
In the fourth selection step, the content of the microorganism group selected in the first selection step or the second selection step as an independent variable, the corresponding change rate of the amount of the specific substance as a dependent variable, a regularization term This is a step of performing a principal component regression analysis provided with, and further selecting a group of microorganisms exhibiting at least either a positive correlation or a negative correlation.
In the present embodiment, a case will be described in which the analysis is performed using the microorganisms selected in the first selection step in the first selection step or the second selection step. As shown in FIG. 1, a microorganism group is further selected by a fourth selection step instead of the second selection step, the third selection step, and the fifth selection step.
First, a principal component regression analysis including a regularization term in the fourth selection step is performed, and a regression coefficient of each set principal component axis is calculated. Then, for any one or more of the principal component axes, a microorganism group in which the value obtained by multiplying the regression coefficient by the value of the OTU principal component in each principal component axis indicates at least either positive or negative is selected. . In principal component regression provided with a regularization term, the value of the principal component of OTU on each principal component axis may become zero. This OTU can be determined as a group of microorganisms not related to the change in the amount of the specific substance, and is excluded from the selection. The number of principal component axes to be set is arbitrary, but it is preferable that the number of principal component axes be about 1 to 5 so as not to make the statistical processing too complicated.

主成分回帰分析で設定された各主成分軸は、特定物質の変化に影響を及ぼす外部要因や内部要因等の何らかの要因を反映しているものと考えられる。主成分回帰分析を行うことで、主成分軸ごとに解析を行うことができ、選出された微生物群同士の関係性を推定することが可能となる。
前記要因としては、例えば、処理水のpH、温度、処理される特定物質の量、微生物群同士の相互作用等が挙げられる。
It is considered that each principal component axis set in the principal component regression analysis reflects some factor such as an external factor or an internal factor that affects the change of the specific substance. By performing the principal component regression analysis, the analysis can be performed for each principal component axis, and the relationship between the selected microorganism groups can be estimated.
Examples of the factors include the pH and temperature of the treated water, the amount of the specific substance to be treated, and the interaction between the microorganisms.

前記主成分回帰(PCR)分析は、スパース正則化による1段階主成分回帰モデルを用いることが好ましい。当該モデルは、スパース主成分回帰(SPCR;sparse principal component regression)モデルと呼ばれ、既報 (Kawano et al., Comput. Stat. Data Anal.89, (2015) 192-203) の内容に基づき解析を実施することが可能である。   The principal component regression (PCR) analysis preferably uses a one-step principal component regression model based on sparse regularization. This model is called a sparse principal component regression (SPCR) model, and analysis is performed based on the contents of a previously reported report (Kawano et al., Comput. Stat. Data Anal. 89, (2015) 192-203). It is possible to implement.

SPCRの概要について説明する。データx,... , xに加えて、従属変数に関するデータy,... , yが得られたと仮定し、従属変数がデータ行列X=(x,... , xの主成分に依存している場合を考える。SPCRでは、主成分Bxを用いた下記式(VII)に示す最小化問題(スパース正則化)を考える。ここで、γ0は切片、γ = (γ1,...,γk)Tは回帰係数ベクトル、λβとλγは正の値を取る正則化パラメータ、wとζは0から1の間に値を取るチューニングパラメータを表す。 The outline of the SPCR will be described. Assuming that data y 1 ,..., Y n on the dependent variables are obtained in addition to the data x 1 ,..., X n , the dependent variables are represented by a data matrix X = (x 1 ,. n ) Consider a case in which it depends on the main component of T. In the SPCR, a minimization problem (sparse regularization) represented by the following equation (VII) using the main component B T x is considered. Here, [gamma] 0 is the intercept, γ = (γ1, ..., γk) T is the regression coefficient vector, lambda beta and lambda gamma is the regularization parameter which takes a positive value, a value in between w and ζ from 0 to 1 Represents a tuning parameter to be taken.

主成分回帰(PCR)は、主成分分析を実行し独立変数の個数をある程度まで減らしてから回帰モデルを構築する2段階法である。主成分回帰では、主成分スコアが新しい独立変数となるが、この新しい独立変数(主成分スコア)の選択は、主成分分析のみから得られており、従属変数には合わされていない。
PCRに対してSPCRは、主成分分析に関連した損失関数と回帰誤差の損失関数の重み付き和を全体の損失関数とし、適当なスパース正則化を導入することにより、1段階法による主成分スコアを独立変数にした回帰モデルである。
SPCRを採用することで、従属変数に寄与する主成分スコアを自動的に抽出することが可能となり、より精度の高い分析が可能となる。
Principal component regression (PCR) is a two-step method that constructs a regression model after performing principal component analysis to reduce the number of independent variables to some extent. In the principal component regression, the principal component score becomes a new independent variable, but the selection of this new independent variable (principal component score) is obtained only from the principal component analysis and is not matched to the dependent variable.
In contrast to PCR, SPCR uses a weighted sum of a loss function related to principal component analysis and a loss function of regression error as an overall loss function, and introduces an appropriate sparse regularization to obtain a principal component score by a one-step method. Is a regression model in which is an independent variable.
By employing SPCR, it is possible to automatically extract the principal component score that contributes to the dependent variable, and it is possible to perform analysis with higher accuracy.

以下、第四選出工程でSPCRを行う場合について説明する。まず、前記第一選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、SPCRを行う。かかる処理において、特定物質の量の変化に関連の低い軸は統計的に自動的に省かれる。得られた各主成分軸の回帰係数を算出し、各主成分軸のいずれか1つ以上について、回帰係数と各主成分軸でのOTUの主成分の値とを乗じた値が、少なくとも正または負のどちらかを示す微生物群を選出する。
後述の実施例3で具体的に示されるチオシアン除去の例では、前記値が正または負を示す微生物として、34種類の微生物群から、27種の微生物群が選出できた。
Hereinafter, a case where SPCR is performed in the fourth selection step will be described. First, SPCR is performed using the content of the microorganism group selected in the first selection step as an independent variable and the corresponding change rate of the amount of the specific substance as a dependent variable. In such a process, the low axis related to the change in the amount of the specific substance is statistically automatically omitted. The obtained regression coefficient of each principal component axis is calculated, and the value obtained by multiplying the regression coefficient and the value of the principal component of OTU in each principal component axis is at least positive for at least one of the principal component axes. Or, a microorganism group showing either negative is selected.
In the example of thiocyan removal specifically shown in Example 3 to be described later, 27 kinds of microorganisms could be selected from 34 kinds of microorganisms as the microorganisms having the above-mentioned value of positive or negative.

なお、回帰係数と各主成分軸でのOTUの主成分の値とを乗じた値が正に大きいほど特定物質の量の変化にプラスに寄与し、当該値が負に大きいほど特定物質の量の変化にマイナスに寄与する微生物群であると考えられる。したがって、回帰係数と各主成分軸でのOTUの主成分の値とを乗じた値に基づき、微生物群を更に選出することもできる。   It should be noted that as the value obtained by multiplying the regression coefficient and the value of the principal component of OTU on each principal component axis is positively larger, the positive contribution to the change in the amount of the specific substance is positive. This is considered to be a group of microorganisms that negatively contributes to the change of the microorganism. Therefore, the microorganism group can be further selected based on a value obtained by multiplying the regression coefficient by the value of the main component of OTU on each principal component axis.

さらに、選出された微生物群同士の関係性を推察することもできる。実施例3の結果を例に、微生物群同士の関係性の推察について説明すると、例えば、表13に示すチオシアン除去のデータを参照すると、主成分軸が3つ得られており、実施例の生物学的排水処理プロセスでは、チオシアン除去に大きく3つの要因が影響しているといえる。   Further, it is possible to infer the relationship between the selected microorganism groups. Explaining the estimation of the relationship between the microbial groups using the result of Example 3 as an example, for example, referring to the data of thiocyanide removal shown in Table 13, three principal component axes are obtained. In the chemical wastewater treatment process, it can be said that three factors are largely affecting thiocyanide removal.

例えば、同じ主成分軸で主成分の値の得られた(主成分の値がゼロでない)微生物群は、同じ要因より影響を受けるものである可能性が推察できる。
同じ主成分軸で主成分の値の得られた微生物群のうち、回帰係数と各主成分軸でのOTUの主成分の値とを乗じた値が、正同士又は負同士のものは、同じ要因により同様の影響を受けるものである可能性が推察できる。対して、同じ主成分軸で主成分の値の得られた微生物群のうち、回帰係数と各主成分軸でのOTUの主成分の値とを乗じた値が、正と負とで逆であるものは、同じ要因により逆の影響を受けるものである可能性が推察できる。
あるいは、同じ主成分軸で値の得られた微生物群のうち、回帰係数と各主成分軸でのOTUの主成分の値とを乗じた値が、正同士又は負同士のものは、共生関係にあるなど、共に増殖しやすい可能性が推察できる。対して、同じ主成分軸で主成分の値の得られた微生物群のうち、回帰係数と各主成分軸でのOTUの主成分の値とを乗じた値が、正と負とで逆であるものは、競合関係にあるなど、共に増殖し難い可能性が推察できる。
For example, it can be inferred that a group of microorganisms whose principal component values are obtained on the same principal component axis (the values of the principal components are not zero) may be affected by the same factor.
Among the microorganisms whose principal component values are obtained on the same principal component axis, those obtained by multiplying the regression coefficient by the value of the main component of OTU on each principal component axis have the same positive or negative value. It can be inferred that factors may be affected in the same way. On the other hand, the value obtained by multiplying the regression coefficient and the value of the principal component of OTU on each principal component axis in the group of microorganisms whose principal component values are obtained on the same principal component axis is opposite between positive and negative. It can be inferred that some may be adversely affected by the same factors.
Alternatively, among the microbial groups whose values are obtained on the same principal component axis, those whose values obtained by multiplying the regression coefficient by the value of the principal component of OTU on each principal component axis are positive or negative are symbiotic relationships. It can be inferred that it is easy to proliferate together. On the other hand, the value obtained by multiplying the regression coefficient and the value of the principal component of OTU on each principal component axis in the group of microorganisms whose principal component values are obtained on the same principal component axis is opposite between positive and negative. It can be inferred that some of them are in a competitive relationship and are difficult to proliferate together.

異なる主成分軸では主成分の値が得られ、同じ主成分軸では主成分の値の得られていない微生物群同士は、異なる要因により影響を受けるものである可能性が推察できる。この場合、それぞれの微生物群では制御すべき因子が異なる可能性が推察できる。   The values of the principal components are obtained on different principal component axes, and it can be inferred that the groups of microorganisms for which the values of the principal components are not obtained on the same principal component axis may be affected by different factors. In this case, it can be inferred that the factors to be controlled may be different in each microorganism group.

各主成分軸がどのような要因を反映しているかを特定する方法としては、例えば、選出された微生物群の含有量又は特定物質の量の変化速度と、処理水の温度やpH等の想定される要因との相関を算出し、相関の高い要因を見つけることが挙げられる。同じ主成分軸で選出された他の微生物群についても調べ、同様の相関傾向を示すことを確認することで、上記要因を特定する精度を高めてもよい。   As a method of specifying what factors each principal component axis reflects, for example, the change rate of the content of the selected microorganism group or the amount of the specific substance and the assumption of the temperature and pH of the treated water, etc. Calculating a correlation with a factor to be performed and finding a factor having a high correlation. The accuracy of specifying the above factors may be increased by examining other microbial groups selected on the same principal component axis and confirming that they show the same correlation tendency.

第一選出工程のあとに第四選出工程を行った場合では、第二選出工程における信頼度に基づいた選別をしていないため、人為的な選別の意図によらない合理的なデータ解釈ができる可能性がある。
第一選出工程のあとに第四選出工程を行った場合では、信頼度が低くても特定物質の変化への関与が高いと算出された微生物群も選出される。
In the case where the fourth selection step is performed after the first selection step, since the selection based on the reliability in the second selection step is not performed, a reasonable data interpretation without intention of artificial selection can be performed. there is a possibility.
When the fourth selection step is performed after the first selection step, a group of microorganisms calculated to be highly involved in the change of the specific substance even if the reliability is low is also selected.

(第五選出工程)
第五選出工程は、以下の第五(A)選出工程、又は第五(B)選出工程を含む。
第五(A)選出工程は、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰分析を行い、p値に基づいて微生物群を更に選出する工程である。
第五(B)選出工程は、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、赤池情報量規準の計算を行い、得られた基準量の値(AIC)に基づいて、微生物群を更に選出する工程である。
本実施形態では、前記第一選出工程又は前記第二選出工程のうち、前記第二選出工程で選出された微生物群を用いて解析を行う場合を説明する。なお、第五選出工程の後に第三選出工程を行うことにより、微生物群を更に選出することもできる(図1の第五選出工程から第三選出工程の順)。
(Fifth selection process)
The fifth selection step includes the following fifth (A) selection step or fifth (B) selection step.
Fifth (A) selection step, the content of the microorganism group selected in the first selection step or the second selection step as an independent variable, the corresponding change rate of the amount of the specific substance as a dependent variable, This is a step of performing regression analysis and further selecting a microorganism group based on the p-value.
Fifth (B) selection step, the content of the microorganisms selected in the first selection step or the second selection step as an independent variable, the corresponding change rate of the amount of the specific substance as a dependent variable, This is a step of calculating the Akaike information criterion and further selecting a microorganism group based on the obtained reference value (AIC).
In the present embodiment, a case will be described in which the analysis is performed using the microorganism group selected in the second selection step in the first selection step or the second selection step. In addition, by performing the third selection step after the fifth selection step, a group of microorganisms can be further selected (in the order of the fifth selection step to the third selection step in FIG. 1).

以下、上記の第五(A)選出工程について説明する。本実施形態では、前記第一選出工程又は前記第二選出工程のうち、第二選出工程で選出された微生物群を用いて解析を行う場合を説明する。
本実施形態の第五(A)選出工程では、前記第二選出工程で選出された微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰分析を行い、p値が0.05未満の微生物群を選出する。この工程におけるp値とは、用いた回帰分析における回帰係数の推定値の信頼度である。
後述の実施例5で具体的に示される例では、6種類の微生物群から、5種の微生物群が選出できた。
第五(A)選出工程により、特定物質の量の変化に寄与がより大きい微生物群が選出される。
Hereinafter, the fifth (A) selection step will be described. In the present embodiment, a case will be described in which the analysis is performed using the microorganism group selected in the second selection step in the first selection step or the second selection step.
In the fifth (A) selection step of the present embodiment, the regression analysis is performed using the content of the microorganism group selected in the second selection step as an independent variable and the corresponding change rate of the amount of the specific substance as a dependent variable. Then, a microorganism group having a p value of less than 0.05 is selected. The p-value in this step is the reliability of the estimated value of the regression coefficient in the used regression analysis.
In the example specifically shown in Example 5 described later, five kinds of microorganism groups could be selected from the six kinds of microorganism groups.
In the fifth (A) selection step, a group of microorganisms that contribute more to the change in the amount of the specific substance is selected.

なお、第五(A)選出工程は、上記の第三選出工程とは異なり、正相関または負相関のどちらか一方を示す微生物群を更に選出するものではないが、第五選出工程の回帰分析で得られた回帰係数を基準に、第五選出工程で選出された微生物から、正相関または負相関のいずれか一方を示す微生物群を更に選出することもできる。   Unlike the third selection step, the fifth (A) selection step does not further select a microorganism group showing either a positive correlation or a negative correlation. Based on the regression coefficient obtained in the above, a group of microorganisms exhibiting either a positive correlation or a negative correlation can be further selected from the microorganisms selected in the fifth selection step.

以下、上記の第五(B)選出工程について説明する。本実施形態では、前記第一選出工程又は前記第二選出工程のうち、第二選出工程で選出された微生物群を用いて解析を行う場合を説明する。
本実施形態の第五(B)選出工程では、まず、前記第二選出工程で選出された前記微生物群の含有量を独立変数xとし、対応する前記特定物質の量の変化速度を従属変数Yとする線形回帰モデルを考える(下記の式(VIII)を参照)。
Hereinafter, the fifth (B) selection step will be described. In the present embodiment, a case will be described in which the analysis is performed using the microorganism group selected in the second selection step in the first selection step or the second selection step.
In the fifth (B) selection step of the present embodiment, first, the content of the microorganism group selected in the second selection step is set as an independent variable x, and the corresponding change rate of the amount of the specific substance is set as a dependent variable Y (Refer to the following equation (VIII)).

前記第二選出工程で選出された前記微生物群の組み合わせを対象に線形回帰モデルを構築し、構築したモデルを赤池情報量規準AIC(Akaike information criterion)で評価する。赤池情報量規準AICは、種々の公知のAICの公式又はその改良されたものを適宜採用してよく、例えば下記の式(IX)で表わされるものを採用できる。また、赤池情報量規準AICに関しては、例えば既報(小西貞則 北川源四郎著「情報量規準」朝倉書店2004年9月25日発行も参照できる。 A linear regression model is constructed for the combination of the microorganism groups selected in the second selection step, and the constructed model is evaluated by Akaike information criterion AIC (Akaike information criterion). As the Akaike information criterion AIC, formulas of various known AICs or improved ones thereof may be appropriately used. For example, a formula represented by the following formula (IX) can be used. As for the Akaike information criterion AIC, for example, a previous report ("Information criterion" written by Sadanori Konishi, Genshiro Kitagawa, published by Asakura Shoten on September 25, 2004) can be referred to.

そして、得られたAICの値に基づいて、微生物群を選出する。
用いられた説明変数の組み合わせで、得られたAICの値が小さいほど、その組み合わせが、従属変数を予測するのに適しているということができ、その考えのもと、AICに基づく選出方法を適宜行うことができる。
Then, a microorganism group is selected based on the obtained AIC value.
In the combination of the explanatory variables used, the smaller the value of the obtained AIC is, the more the combination is suitable for predicting the dependent variable, and based on this idea, the selection method based on the AIC is determined. It can be performed as appropriate.

例えば、以下の選出方法を例示できる。
方法1:AICの値が最小になる独立変数の組み合わせとして微生物群を選出する。
方法2:AICの値が小さい順からm番目までの独立変数の組み合わせで過半数を超えて含まれる微生物群を選出する。ここで、mは1以上の整数であり、例えば3以上である。
方法3:AICヒストグラムにより決定された前記m番目までの独立変数の組み合わせで過半数を超えて含まれる微生物群を選出する。
For example, the following selection methods can be exemplified.
Method 1: A microorganism group is selected as a combination of independent variables that minimizes the value of AIC.
Method 2: A group of microorganisms containing more than a majority is selected by a combination of independent variables from the smallest AIC value to the m-th one. Here, m is an integer of 1 or more, for example, 3 or more.
Method 3: A group of microorganisms contained in more than the majority by the combination of the independent variables up to the m-th determined by the AIC histogram is selected.

方法1について、後述の実施例7で具体的に示される例では、AICが最小(この例では236.63)になる独立変数の組み合わせとして、denovo2647_1を除外した5つの微生物群を選出できた。   Regarding Method 1, in the example specifically shown in Example 7 described later, five microbial groups excluding denovovo2647_1 could be selected as a combination of independent variables that minimizes AIC (236.63 in this example).

方法2について、後述の実施例7で具体的に示される例では、AICが小さい順からm=3番目(この例では236.63、238.25、241.33)までの独立変数の組み合わせのうち、denovo2647_1は、AICが238.25の場合でしか用いられていないので、過半数を超えて選出されていないdenovo2647_1を除外した5つの微生物群を選出できる。   Regarding method 2, in the example specifically shown in Example 7 described later, the combination of independent variables from the smallest AIC to the m = th (236.63, 238.25, 241.33 in this example) Among them, denovovo2647_1 is used only when the AIC is 238.25, so that it is possible to select five microbial groups excluding denovovo2647_1 that has not been selected in more than a majority.

方法3おけるAICヒストグラムとは、算出されたAICの最大値から最小値までを区間で区切り、各区間に対応する組み合わせの該当数を縦軸としたヒストグラムにおいて、2つ以上のピークができるよう前記区間を選択し、AICの値が小さい順から任意の数までのピーク数(ただし全ピーク数−1)のピークに含まれるm番目までの組み合わせを用いることを例示できる。ピークが2つ得られた場合の選択ピーク数としては例えば1であり、1番目のピークに含まれる組み合わせの数がmとなる。   The AIC histogram in the method 3 is such that two or more peaks are formed in a histogram in which the range from the maximum value to the minimum value of the calculated AIC is divided into sections and the number of combinations corresponding to each section is the vertical axis. An example is shown in which a section is selected, and combinations up to the m-th combination included in the peaks of the number of peaks from the smallest AIC value to the arbitrary number (however, the total number of peaks minus one) are used. When two peaks are obtained, the number of selected peaks is 1, for example, and the number of combinations included in the first peak is m.

第五(B)選出工程により、特定物質の量の変化に寄与がより大きい微生物群が選出される。   In the fifth (B) selection step, a group of microorganisms that contribute more to the change in the amount of the specific substance is selected.

本実施形態の微生物群の特定方法においては、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰分析を行い、p値に基づいて微生物群を更に選出する、或いは、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、赤池情報量規準の計算を行い、得られた基準量の値(AIC)に基づいて、微生物群を更に選出する第五選出工程を含む。既に第一選出工程又は第二選出工程で選出した、信頼度の高い微生物群のデータを用いるため、特定物質の量の変化速度への寄与のより大きな微生物群を、精度よく特定できる。   In the method for identifying a microorganism group of the present embodiment, the content of the microorganism group selected in the first selection step or the second selection step is used as an independent variable, and the rate of change in the amount of the corresponding specific substance is dependent. As a variable, a regression analysis is performed to further select a group of microorganisms based on the p value, or, as an independent variable, the content of the group of microorganisms selected in the first selection step or the second selection step as an independent variable. A fifth selection step of calculating the Akaike information criterion using the change rate of the amount of the specific substance as a dependent variable and further selecting a microorganism group based on the obtained reference amount value (AIC) is included. Since the data of the highly reliable microorganism group already selected in the first selection step or the second selection step is used, it is possible to accurately specify a microorganism group that greatly contributes to the change rate of the amount of the specific substance.

(特定工程)
本実施形態の特定工程は、選出工程で選出された微生物群を、特定物質の量の変化に係わる微生物群と特定する工程である。
選出工程は、第一選出工程を有し、更に第二〜第五選出工程からなる群から選択されるいずれか一以上の工程を有していてもよい。第一選出工程を経た後の各選出工程の組み合わせは、微生物群の選出が可能なよう、任意に選択できる。
その一例としては、図1に図示するように、例えば、
第一選出工程→第二選出工程の順、
第一選出工程→第二選出工程→第三選出工程の順、
第一選出工程→第三選出工程の順(不図示)、
第一選出工程→第二選出工程→第三選出工程→第五選出工程の順、
第一選出工程→第三選出工程→第五選出工程の順(不図示)、
第一選出工程→第四選出工程の順、
第一選出工程→第二選出工程→第四選出工程の順、
第一選出工程→第五選出工程の順、
第一選出工程→第二選出工程→第五選出工程の順、
第一選出工程→第五選出工程→第三選出工程の順、
第一選出工程→第二選出工程→第五選出工程→第三選出工程の順、等が挙げられる。
(Specific process)
The specifying step of the present embodiment is a step of specifying the microorganism group selected in the selecting step as a microorganism group related to a change in the amount of the specific substance.
The selection step includes a first selection step, and may further include any one or more steps selected from the group consisting of second to fifth selection steps. The combination of each selection step after the first selection step can be arbitrarily selected so that a microorganism group can be selected.
As an example, as shown in FIG.
First selection process → Second selection process,
First selection step → second selection step → third selection step,
First selection step → third selection step (not shown),
First selection step → Second selection step → Third selection step → Fifth selection step,
First selection process → third selection process → fifth selection process (not shown),
First selection process → fourth selection process,
First selection process → Second selection process → Fourth selection process,
First selection process → Fifth selection process,
First selection process → Second selection process → Fifth selection process,
First selection process → Fifth selection process → Third selection process,
The first selection step → the second selection step → the fifth selection step → the third selection step, and the like.

選出工程は第三選出工程又は第四選出工程を含むことが好ましい。上記第三選出工程、又は第四選出工程、で選出された微生物群は、特定物質の量の変化に寄与がより大きいもののうち、特定物質の量の変化に正または負に相関する微生物群であると判定できる。
特定物質の量の変化に正に相関する微生物群としては、例えば、特定物質の量の変化速度として、特定物質の量の増加速度を用いた場合、処理槽中の特定物質を増加させる方向に寄与する微生物群である。逆に、特定物質の量の変化速度として、特定物質の量の減少速度を用いた場合、処理槽中の特定物質を減少させる方向に寄与するものである。
特定物質の量の変化に負に相関する微生物群としては、例えば、特定物質の量の変化速度として、特定物質の量の増加速度を用いた場合、処理槽中の特定物質を減少させる方向に寄与する微生物群である。逆に、特定物質の量の変化速度として、特定物質の量の減少速度を用いた場合、処理槽中の特定物質を増加させる方向に寄与するものである。
The selection step preferably includes a third selection step or a fourth selection step. The microorganisms selected in the third selection step, or the fourth selection step, among those that greatly contribute to the change in the amount of the specific substance, are microorganism groups positively or negatively correlated with the change in the amount of the specific substance. It can be determined that there is.
As a microorganism group positively correlated with the change in the amount of the specific substance, for example, when the rate of change in the amount of the specific substance is used as the rate of change in the amount of the specific substance, in the direction of increasing the specific substance in the treatment tank, A group of contributing microorganisms. Conversely, when the rate of change in the amount of the specific substance is used as the rate of change in the amount of the specific substance, it contributes in the direction of reducing the specific substance in the treatment tank.
As a microorganism group negatively correlated with the change in the amount of the specific substance, for example, when the rate of change in the amount of the specific substance is used as the rate of change in the amount of the specific substance, in the direction of decreasing the specific substance in the treatment tank, A group of contributing microorganisms. Conversely, when the rate of change in the amount of the specific substance is used as the rate of change in the amount of the specific substance, the rate contributes to increasing the amount of the specific substance in the treatment tank.

以上のように、本実施形態の微生物群の特定方法においては、特定物質及び微生物を含む微生物試料中の、特定物質の量の変化速度、及び前記微生物が分類された微生物群の含有量の測定により得られたデータセットから、再標本化により標本を作成し、その再標本化により作成した標本に対し、前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、罰則付き回帰分析を合わせて行う。つまり、再標本化による標本作成と、それに対する罰則付き回帰分析とを合わせて行う。
従来、生物学的排水処理に係る微生物の解析を行う場合、微生物群の種類が多様で、且つデータ数が少ないため、罰則付き回帰分析では、十分な精度が得られなかった。本実施形態の微生物群の特定方法では、再標本化により標本を作成することで、統計学的にデータ数を大幅に増やすことができるため、その増やした標本を用いて罰則付き回帰分析を合わせて行うことにより、特定物質の量の変化速度に関連のある微生物群を、精度よく特定できる。
As described above, in the method for identifying a microorganism group of the present embodiment, the rate of change in the amount of the specific substance in the microorganism sample containing the specific substance and the microorganism, and the measurement of the content of the microorganism group in which the microorganism is classified From the data set obtained by, to create a sample by resampling, for the sample created by the resampling, the content of the microorganism group as an independent variable, the corresponding change rate of the amount of the specific substance amount Perform a regression analysis with penalties as the dependent variable. In other words, sample preparation by re-sampling and regression analysis with penalties for it are performed.
Conventionally, when analyzing microorganisms related to biological wastewater treatment, sufficient accuracy could not be obtained in penalized regression analysis because the types of microorganisms are diverse and the number of data is small. In the method for identifying a microorganism group according to the present embodiment, since the number of data can be significantly increased statistically by creating a sample by resampling, a regression analysis with penalties is performed using the increased sample. By doing so, a group of microorganisms related to the rate of change in the amount of the specific substance can be specified with high accuracy.

本実施形態の微生物群の特定方法においては、前記第一選出工程で選出された微生物群の、再標本化により作成した標本における選出頻度から信頼度を算出し、前記信頼度に基づいて微生物群を更に選出する第二選出工程を含む。再標本化により標本を作成し、統計学的にデータ数を大幅に増やすことで、精度よく選出の信頼度を導きだすことができる。
そのため、特定物質の量の変化速度に関連のある微生物群を、より精度よく特定できる。
In the method for identifying a microorganism group of the present embodiment, the reliability of the microorganism group selected in the first selection step is calculated from the selection frequency in a sample created by resampling, and the microorganism group is determined based on the reliability. And a second selection step of further selecting. By preparing a sample by resampling and statistically increasing the number of data significantly, the reliability of selection can be accurately derived.
Therefore, a group of microorganisms related to the change rate of the amount of the specific substance can be specified with higher accuracy.

本実施形態の微生物群の特定方法においては、前記第一選出工程、前記第二選出工程又は前記第五選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰分析を行い、正相関または負相関のいずれか一方を示す微生物群を更に選出する第三選出工程を含む。既に第一選出工程、第二選出工程又は前記第五選出工程で選出した、信頼度の高い微生物群のデータを用いるため、特定物質の量の変化速度に正または負に相関する微生物群を、精度よく特定できる。   In the method for identifying a microorganism group of the present embodiment, the content of the microorganism group selected in the first selection step, the second selection step or the fifth selection step as an independent variable, the corresponding specific substance The method includes a third selection step of performing a regression analysis using the rate of change in the amount as a dependent variable, and further selecting a microorganism group showing either a positive correlation or a negative correlation. Already selected in the first selection step, the second selection step or the fifth selection step, to use the data of the highly reliable microorganism group, a microorganism group that is positively or negatively correlated with the change rate of the amount of the specific substance, It can be specified accurately.

本実施形態の微生物群の特定方法においては、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、正則化項を備えた主成分回帰分析を行い、少なくとも正相関または負相関のいずれかを示す微生物群を更に選出する第四選出工程を含む。既に第一選出工程又は第二選出工程で選出した、信頼度の高い微生物群のデータを用いるため、特定物質の量の変化速度に正または負に相関する微生物群を、精度よく特定できる。   In the method for identifying a microorganism group of the present embodiment, the content of the microorganism group selected in the first selection step or the second selection step is used as an independent variable, and the rate of change in the amount of the corresponding specific substance is dependent. A fourth selection step of performing a principal component regression analysis including a regularization term as a variable to further select a microorganism group exhibiting at least one of a positive correlation and a negative correlation. Since data of highly reliable microorganisms already selected in the first selection step or the second selection step is used, a microorganism group positively or negatively correlated with the rate of change in the amount of the specific substance can be accurately specified.

本実施形態の微生物群の特定方法においては、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰分析を行い、p値に基づいて微生物群を更に選出する、或いは、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、赤池情報量規準(AIC)の計算を行い、得られたAICの値に基づいて、微生物群を更に選出する第五選出工程を含む。既に第一選出工程又は第二選出工程で選出した、信頼度の高い微生物群のデータを用いるため、特定物質の量の変化速度に正または負に相関する微生物群を、精度よく特定できる。   In the method for identifying a microorganism group of the present embodiment, the content of the microorganism group selected in the first selection step or the second selection step is used as an independent variable, and the rate of change in the amount of the corresponding specific substance is dependent. As a variable, perform a regression analysis, further select a microorganism group based on the p-value, or, as an independent variable the content of the microorganism group selected in the first selection step or the second selection step, as Akaike information A fifth selection step of calculating a quantity standard (AIC) and further selecting a microorganism group based on the obtained AIC value is included. Since data of highly reliable microorganisms already selected in the first selection step or the second selection step is used, a microorganism group positively or negatively correlated with the rate of change in the amount of the specific substance can be accurately specified.

従来、特定物質の量の変化に関与する微生物はほとんどが未知であった。このため、塩基配列を解読し、系統学的に分類しても、その微生物の機能を把握することは困難であったが、本実施形態により、特定物質の量の変化に相関する微生物群を精度よく特定できるようになった。   Heretofore, most microorganisms involved in changes in the amount of a specific substance have been unknown. For this reason, it was difficult to understand the function of the microorganism even if the base sequence was decoded and phylogenetically classified, but according to the present embodiment, a group of microorganisms correlated with the change in the amount of the specific substance was identified. It can be specified with high accuracy.

≪生物学的排水処理方法≫
本発明の微生物群の特定方法は、例えば生物学的排水処理方法に適用することができる。一実施形態として、本発明の微生物群の特定方法で特定された微生物群を検出し、前記微生物群の増減に基づいて処理水の処理条件を制御するものである。
ここで、本発明の微生物群の特定方法は、≪微生物群の特定方法≫の段で説明したものが挙げられ、詳細な説明を省略する。
≪Biological wastewater treatment≫
The method for specifying microorganisms of the present invention can be applied to, for example, a biological wastewater treatment method. In one embodiment, a microorganism group specified by the method for specifying a microorganism group of the present invention is detected, and the treatment condition of the treated water is controlled based on the increase or decrease of the microorganism group.
Here, the method for specifying a group of microorganisms of the present invention includes the method described in the section “Method for specifying a group of microorganisms”, and a detailed description thereof will be omitted.

まず、本発明の微生物群の特定方法によって、特定物質の量の変化に係わる微生物群が特定されている。特定された微生物群が処理水中に存在することは、例えば前記解読工程で得られた塩基配列に基づき、処理水中から係る配列を有する核酸を検出することで、検出可能である。また、特定された微生物群の処理水中の量は、前記割合決定工程及び前記量決定工程と同様の操作により求めることができる。
例えば、特定された微生物群が、処理水中で所望の物質の分解反応に寄与するものであると特定された場合、特定された微生物群の生育に適した条件に処理条件を制御すればよい。
例えば、特定された微生物群が、処理水中で所望の物質の分解反応を抑制するものであると特定された場合、特定された微生物群の生育に適さない条件に処理条件を制御すればよい。
処理条件とは、例えば、処理水の温度、pH、溶存酸素濃度、塩濃度、水理学的滞留時間(HRT)、汚泥滞留時間(SRT)、微生物固定用担体の投入、生育促進または阻害物質の添加、処理槽中の攪拌速度、及び前記処理条件の異なる処理槽の組み合わせ等が挙げられる。
First, a microorganism group related to a change in the amount of a specific substance is specified by the method for specifying a microorganism group of the present invention. The presence of the specified microorganism group in the treated water can be detected, for example, by detecting a nucleic acid having the sequence from the treated water based on the base sequence obtained in the decoding step. Further, the amount of the specified microorganisms in the treated water can be determined by the same operation as in the ratio determining step and the amount determining step.
For example, when the specified microorganism group is specified as contributing to the decomposition reaction of a desired substance in the treated water, the treatment conditions may be controlled to conditions suitable for the growth of the specified microorganism group.
For example, when it is specified that the specified microorganism group suppresses a decomposition reaction of a desired substance in the treated water, the treatment condition may be controlled to a condition that is not suitable for the growth of the specified microorganism group.
The treatment conditions include, for example, the temperature of treated water, pH, dissolved oxygen concentration, salt concentration, hydraulic retention time (HRT), sludge retention time (SRT), introduction of a microorganism-immobilizing carrier, growth promotion or inhibition of a substance. Addition, a stirring speed in the processing tank, and a combination of processing tanks having different processing conditions are mentioned.

実施形態の生物学的排水処理方法によれば、本発明の微生物群の特定方法によって、特定された微生物群を検出し、前記微生物群の増減に基づいて処理水の処理条件を制御することで、処理水の特定物質の処理効率を向上可能である。   According to the biological wastewater treatment method of the embodiment, by detecting the microorganism group specified by the method for identifying the microorganism group of the present invention, by controlling the treatment conditions of the treated water based on the increase or decrease of the microorganism group. In addition, it is possible to improve the treatment efficiency of a specific substance of treated water.

本発明の微生物群の特定方法を適用する生物学的排水処理方法の、別の実施形態としては、本発明の微生物群の特定方法で特定された微生物群の少なくとも一種を含む微生物資源を移植して、処理水を処理するものである。
微生物資源としては、例えば活性汚泥、微生物製剤、微生物担体、微生物株、土壌、底泥、海水、河川水、湖水等が挙げられる。
As another embodiment of the biological wastewater treatment method to which the method for identifying a microorganism group of the present invention is applied, a microorganism resource containing at least one of the microorganism groups identified by the method for identifying a microorganism group of the present invention is transplanted. To treat the treated water.
Examples of the microbial resources include activated sludge, microbial preparations, microbial carriers, microbial strains, soil, sediment, seawater, river water, lake water, and the like.

当該実施形態に係る生物学的排水処理方法によれば、本発明の微生物群の特定方法によって、特定された微生物群を積極的に処理水に移植することで、処理水の特定物質の処理効率を向上可能である。
例えば、生物学的排水処理装置を新設する際に、本発明の微生物群の特定方法で特定された微生物群の少なくとも一種を含み、好ましくはそれら微生物群の量が多い微生物資源を移植することで、短時間で必要な処理性能を得ることが可能である。
例えば、既設の生物学的排水処理装置の微生物が一時的な毒物の流入などにより死滅し、処理性能が悪化した場合に、本発明の微生物群の特定方法で特定された微生物群の少なくとも一種を含み、好ましくはそれら微生物群の量が多い微生物資源を移植することで、短時間で必要な処理性能まで回復することが可能である。
According to the biological wastewater treatment method according to the present embodiment, by the method for identifying microorganisms of the present invention, by actively transplanting the identified microorganisms into the treated water, the treatment efficiency of the specific substance of the treated water Can be improved.
For example, when a new biological wastewater treatment device is installed, it is preferable to transplant at least one microorganism group specified by the microorganism group identification method of the present invention, and preferably to transplant a microorganism resource having a large amount of the microorganism group. The required processing performance can be obtained in a short time.
For example, when the microorganisms in the existing biological wastewater treatment device are killed due to temporary influx of toxins and the treatment performance is deteriorated, at least one of the microorganisms specified by the method for specifying the microorganisms of the present invention is used. By transplanting a microbial resource that contains, and preferably has a large amount of, those microbial groups, it is possible to recover the required processing performance in a short time.

以下、本発明について試験例を挙げて具体的に説明する。但し、本発明はこれらに限定されるものではない。   Hereinafter, the present invention will be specifically described with reference to test examples. However, the present invention is not limited to these.

〔実施例1〕
(1)生物学的排水処理プロセスの運転、水質分析、分解速度算出および微生物試料の採取
工業用水と自然海水とを体積比2:3で混合して得られた溶媒中に、表2に示す溶質を表2に示す濃度で溶解し、人工排水(被処理水)を調製した。
[Example 1]
(1) Operation of biological wastewater treatment process, water quality analysis, decomposition rate calculation and collection of microbial samples Table 2 shows the solvents obtained by mixing industrial water and natural seawater at a volume ratio of 2: 3. Solutes were dissolved at the concentrations shown in Table 2 to prepare artificial wastewater (water to be treated).

また、図7に示すように、1つの槽内で生物処理領域20aと沈降領域20bとが隔壁23により互いに隔てられていると共にこの隔壁23の下方で互いに連通する構造を有する一体型の生物処理装置20(処理槽)を用意し、生物処理装置20の生物処理領域20a内に10mm×10mm×10mmの大きさのスポンジ担体21〔流動担体(関東イノアック製AQ−1)〕を体積比で20%(v/v)となるように投入した。   As shown in FIG. 7, an integrated biological treatment having a structure in which a biological treatment area 20a and a sedimentation area 20b are separated from each other by a partition wall 23 in one tank and communicate with each other below the partition wall 23. An apparatus 20 (processing tank) is prepared, and a sponge carrier 21 [fluid carrier (AQ-1 manufactured by Kanto INOAC)] having a size of 10 mm × 10 mm × 10 mm is placed in a biological treatment area 20 a of the biological treatment apparatus 20 in a volume ratio of 20. % (V / v).

このようにして準備された実施例1の生物処理装置20内にそれぞれ上記の被処理水24を流入させると共に微生物植種源として活性汚泥を投入し、スポンジ担体21に微生物を定着させる微生物馴致処理(第1段処理)時には、被処理水24の水理学的滞留時間が24時間となるように流入させた。また、各生物処理装置20内の被処理水24に空気曝気22を行って好気性流動床を形成させ、微生物の馴致を行った。   The above-mentioned water to be treated 24 flows into the biological treatment apparatus 20 of the first embodiment thus prepared, and activated sludge is introduced as a seed source of microorganisms, and the microorganisms are adapted to fix the microorganisms on the sponge carrier 21. At the time of the (first-stage treatment), the water to be treated 24 was introduced such that the hydraulic residence time was 24 hours. In addition, air aeration 22 was performed on the water 24 to be treated in each biological treatment apparatus 20 to form an aerobic fluidized bed, and the microorganisms were adapted.

この生物学的処理の運転開始後、すぐにチオシアン酸イオンの除去が認められたが、徐々にpHの低下傾向が認められ、また、チオシアン酸イオンの除去が不安定であったので、運転開始後69日目から5wt%−水酸化ナトリウム水溶液を用いてpHを7.5付近に調整しながら処理を継続し、チオシアン酸イオンの除去率が98%以上で安定した段階で微生物馴致処理(第1段処理)を終了した。この微生物馴致処理(第1段処理)の終了時には亜硝酸イオンが増加していた。   Immediately after the start of the biological treatment, the removal of thiocyanate ions was observed. However, the tendency of the pH to gradually decrease was observed, and the removal of thiocyanate ions was unstable. From the 69th day onward, the treatment was continued while adjusting the pH to about 7.5 using a 5 wt% -sodium hydroxide aqueous solution, and at the stage where the thiocyanate ion removal rate was 98% or more and stabilized, the microorganisms were treated (No. (One-stage processing) has been completed. At the end of the microbial adaptation treatment (first-stage treatment), nitrite ions had increased.

この微生物馴致処理(第1段処理)の終了後、各生物処理装置20の生物処理領域20a内の処理水についてチオシアン酸イオン濃度と亜硝酸イオン濃度とを測定してチオシアン酸イオン及び亜硝酸イオンのモニタリングを行なった。モニタリングは約7日ごとに行った。
また、各生物処理装置20の生物処理領域20a内の処理水のpHを測定してpH値のモニタリングを行いながら、運転開始後90日目より領域内の水理学的滞留時間が18時間となるように被処理水24の流入量を増やし(第2段処理)、また、運転開始後111日目より領域内の水理学的滞留時間が12時間となるように被処理水24の流入量を更に増やし(第3段処理)、更に、運転開始後118日目より領域内の水理学的滞留時間が8時間となるように被処理水24の流入量を更に増やし(第4段処理)、最終的に175日目まで運転を継続した。
After the completion of the microorganism accommodating treatment (the first-stage treatment), the thiocyanate ion concentration and the nitrite ion concentration of the treated water in the biological treatment region 20a of each biological treatment device 20 are measured, and the thiocyanate ion and the nitrite ion are measured. Was monitored. Monitoring was performed approximately every 7 days.
In addition, while measuring the pH of the treated water in the biological treatment region 20a of each biological treatment device 20 and monitoring the pH value, the hydraulic retention time in the region becomes 18 hours from 90 days after the start of operation. As described above, the inflow amount of the water 24 is increased (second stage treatment), and the inflow amount of the water 24 is set so that the hydraulic residence time in the region becomes 12 hours from the 111th day after the start of operation. Further increase (third stage treatment), and further increase the inflow of the water 24 to be treated so that the hydraulic residence time in the region becomes 8 hours from the 118th day after the start of operation (fourth stage treatment) Finally, the operation was continued until the 175th day.

この間、第2段処理において領域内の水理学的滞留時間を18時間に短縮したことにより、チオシアン酸イオンの除去率を高い値に維持しつつ、亜硝酸イオンの生成の減少傾向が観察され始め、また、第3段処理において領域内の水理学的滞留時間を12時間に短縮したことにより、チオシアン酸イオンの除去率を高い値に維持しつつ、亜硝酸イオンの生成をほぼ完全に抑制することができ、更に、第4段処理において領域内の水理学的滞留時間を8時間に短縮した場合にも、亜硝酸イオンの生成を抑制しつつチオシアン酸イオンの除去率を高い値に維持できることを確認した。   During this period, the reduction tendency of the production of nitrite ions began to be observed while maintaining the removal rate of thiocyanate ions at a high value by reducing the hydraulic residence time in the region to 18 hours in the second stage treatment. In addition, by reducing the hydraulic retention time in the region to 12 hours in the third stage treatment, the generation of nitrite ions is almost completely suppressed while maintaining the thiocyanate ion removal rate at a high value. Further, even when the hydraulic retention time in the region is reduced to 8 hours in the fourth stage treatment, the removal rate of thiocyanate ions can be maintained at a high value while suppressing the generation of nitrite ions. It was confirmed.

この実施例1での生物学的処理において、運転日数に対する一日当たりの亜硝酸生成速度およびチオシアン除去速度を式(1)および式(2)に従い算出した。   In the biological treatment in Example 1, the rate of nitrite generation and the rate of thiocyan removal per day with respect to the number of operating days were calculated according to equations (1) and (2).

運転日数一日当たりの、亜硝酸生成速度を図8に、チオシアン除去速度を図9に示す。   FIG. 8 shows the nitrite generation rate and FIG. 9 shows the thiocyan removal rate per operating days.

(2)DNA抽出、塩基配列解読および微生物群の決定
生物処理装置20の生物処理領域20a内の微生物が付着したスポンジ担体21からのDNA抽出および次世代シーケンス微生物相解析は委託(J−Bio21センター)により実施した。
特定物質の量の変化速度の測定時点と対応した時点ごとに、微生物が付着したスポンジ担体を採取し、採取したスポンジ担体を4分割した後、Extrap Soil DNA Plus ver.2(J−Bio21)を用いてDNAを抽出および精製を行った。
精製DNA溶液のDNA濃度を、PicoGreen dsDNA Assay Kit (Invitrogen)を用いて測定した。
表3に示したプライマーを用いて真正細菌の16S rRNA遺伝子のV4およびV5領域を対象にしたPCR増幅をおこなった。
(2) DNA extraction, base sequence decoding, and determination of microorganism group DNA extraction from sponge carrier 21 to which microorganisms are attached in biological treatment region 20a of biological treatment device 20 and next-generation sequencing microflora analysis are outsourced (J-Bio21). ).
At each time corresponding to the measurement time of the rate of change in the amount of the specific substance, the sponge carrier to which the microorganisms are attached is collected, and the collected sponge carrier is divided into four parts, and then the Extract Soil DNA Plus ver. DNA was extracted and purified using 2 (J-Bio21).
The DNA concentration of the purified DNA solution was measured using PicoGreen dsDNA Assay Kit (Invitrogen).
Using the primers shown in Table 3, PCR amplification was performed on the V4 and V5 regions of the 16S rRNA gene of eubacteria.

PCR産物を、次世代シーケンサー(MiSeq)を用いて解析することで、塩基配列を決定した。
得られた塩基配列をQIIME(Quantitative Insights Into MicrobialEcology)パイプラインを用いて次の解析を行った。まず、データのクオリティ、キメラをチェックし、基準を満たした配列データのみフィルタリングした。
基準を満たした配列データについて、類似性の高い(相同性97%以上の)配列データを1つのグループのクラスタとしてまとめ、各クラスタ配列の中で最も出現頻度の高い配列を代表OTU(OTU; Operational Taxonomic Unit;
操作的分類単位)配列とし、その代表配列を用いて以降の解析を実施した。すなわち、検出された各OTUの存在及び量が、一微生物群の存在及び量を示すものとして扱った。
この結果、実施例1および後に示す実施例2の微生物試料から合計3,752OTUが検出された。これらOTUは各試料で重複して検出されるもの、1試料のみから検出されるもの様々であった。
また、各OTUの検出回数から全OTUに対する各OTUの相対割合を算出した。
図10に、検出された全3752OTUに対する各OTUの相対割合をグラフ化したものを示す。
The nucleotide sequence was determined by analyzing the PCR product using a next-generation sequencer (MiSeq).
The obtained base sequence was subjected to the following analysis using a QIIME (Quantitative Insights Into Microbiological Economy) pipeline. First, the quality of the data and the chimeras were checked, and only the sequence data meeting the criteria were filtered.
For sequence data that satisfies the criterion, sequence data having high similarity (having a homology of 97% or more) are grouped into one group of clusters, and the most frequently occurring sequence in each cluster sequence is represented by a representative OTU (OTU; Operational). Taxonomic Unit;
(Operational classification unit) sequence, and the subsequent analysis was performed using the representative sequence. That is, the detected presence and amount of each OTU was treated as indicating the presence and amount of one microorganism group.
As a result, a total of 3,752 OTU was detected from the microorganism samples of Example 1 and Example 2 described later. These OTUs were variously detected in each sample, and variously detected in only one sample.
Further, the relative ratio of each OTU to all OTUs was calculated from the number of detections of each OTU.
FIG. 10 is a graph showing the relative ratio of each OTU to all the detected 3752 OTUs.

各代表のOTU配列について、Greengeneの16S rRNA遺伝子データベースに対する相同性検索を行い、系統分類を推定した。   For each representative OTU sequence, a homology search was performed against Greengene's 16S rRNA gene database to estimate the phylogenetic classification.

(3)各微生物群の量の決定
スポンジに付着した真正細菌の遺伝子数をリアルタイムPCR法の一つであるQP−PCR法(J−Bio21)により定量した。
上記(2)で精製したDNA溶液を適宜希釈した後、表4に示すプライマーおよびQProbeを用いて反応液を調製し、Rotor−Gene Q(QIAGEN)により遺伝子数を定量した。
(3) Determination of the amount of each microorganism group The number of eubacteria genes adhering to the sponge was quantified by the QP-PCR method (J-Bio21), which is one of the real-time PCR methods.
After appropriately diluting the DNA solution purified in the above (2), a reaction solution was prepared using the primers and QProbe shown in Table 4, and the number of genes was quantified by Rotor-Gene Q (QIAGEN).

上記(2)では全OTUに対する各OTUの相対割合を算出した。しかし、採取日によってスポンジに付着した微生物総量は異なる。そこで、生物学的排水処理プロセス運転期間における各OTUの変動を正確に把握するため、各OTUの相対割合に定量したスポンジに付着した真正細菌の遺伝子数を乗じることで、各OTUの量を決定した。   In the above (2), the relative ratio of each OTU to all OTUs was calculated. However, the total amount of microorganisms attached to the sponge varies depending on the collection date. Therefore, in order to accurately grasp the fluctuation of each OTU during the operation period of the biological wastewater treatment process, the amount of each OTU is determined by multiplying the relative ratio of each OTU by the number of the genuine bacteria attached to the sponge quantified. did.

(4)Bootstrap標本の作成、Lasso法による主要な水処理微生物群の絞り込み、回帰分析
亜硝酸生成およびチオシアン除去に係わった主要微生物群を統計解析により推定した。
上記(3)で示したように、各OTUの相対割合に、定量したスポンジに付着した真正細菌の遺伝子数を乗じることで補正をした各OTUの値を用いて統計解析することで、亜硝酸生成およびチオシアン除去に係わる主要なOTUを推定した。
推定に用いたデータセットにおける各OTUの量の値は、亜硝酸生成およびチオシアン除去速度のデータの測定基準時点と対応した時点ごと採取されて得られたものを用いた(例えば、運転(N+7)日目の物質量から算出した亜硝酸生成速度又はチオシアン除去速度のデータと、運転(N+7)日目に取得した各OTUの量の値のデータとを用いた。)。
しかしながら、亜硝酸生成およびチオシアン除去速度のデータは23であるのに対して、次世代シーケンサーを用いて得られたOTU総数は、その100倍以上多く、通常の回帰分析により相関関係を解析することは不可能であった。
そこで、本発明者らは、推定と変数選択を同時に実施できるLasso法を用いて解析を行うことにした。ここで、Bootstrap標本を1000組作成し、それら標本に対してLasso法を適用することで、測定により得られたデータセットの数を疑似的に増加させ、回帰分析により微生物群を推定することに成功した。この結果、亜硝酸生成およびチオシアン除去速度に影響する微生物群を27OTUに絞り込むことができた。
(4) Preparation of Bootstrap sample, narrowing down of main water treatment microorganisms by Lasso method, regression analysis The main microorganisms involved in nitrite generation and thiocyanogen removal were estimated by statistical analysis.
As shown in the above (3), the relative ratio of each OTU was multiplied by the number of eubacteria genes attached to the sponge that was quantified, and statistically analyzed using the value of each OTU corrected by multiplying it by nitrite. The major OTUs involved in formation and thiocyanate removal were estimated.
As the value of the amount of each OTU in the data set used for the estimation, a value obtained by collecting at each time corresponding to the measurement reference time of the data of nitrite generation and thiocyanate removal rate was used (for example, operation (N + 7)). The data of the nitrite generation rate or the thiocyanate removal rate calculated from the substance amount on the day and the data of the amount of each OTU obtained on the operation (N + 7) day were used.)
However, while the data on nitrite generation and thiocyanate removal rates was 23, the total number of OTUs obtained using the next-generation sequencer was more than 100 times that of the data, and the correlation was analyzed by ordinary regression analysis. Was impossible.
Therefore, the present inventors decided to perform analysis using the Lasso method, which can simultaneously perform estimation and variable selection. Here, 1000 sets of bootstrap samples were prepared, and the number of data sets obtained by the measurement was pseudo-increased by applying the Lasso method to those samples, and the microorganism group was estimated by regression analysis. Successful. As a result, it was possible to narrow down the microorganism group affecting nitrite generation and thiocyan removal rate to 27 OTU.

次に、上記で絞り込んだ27OTUのうち、亜硝酸生成およびチオシアン除去速度への影響について、さらに信頼度の高いOTUをさらに絞り込むことにした。OTUをさらに絞り込むことで、それぞれのOTUを定量する方法を確立することができ、また、定期的にOTUを定量することの時間とコストが低減される。
通常、Lasso法単独の回帰分析では信頼度を算出することが困難である。しかし今回、Bootstrap標本を1000組作成し、それら標本に対してLasso法を適用することで、推定された微生物群の信頼度を出すことにも成功した。
今回推定された27OTUのうち、亜硝酸生成に対して高い信頼度(0.6以上)を示したOTUは6OTU、チオシアン除去に対して高い信頼度を示したOTUは5OTUであった。
Next, out of the 27 OTUs narrowed down above, OTUs with higher reliability with respect to the effect on nitrite generation and thiocyanate removal rate were further narrowed down. By further narrowing down the OTUs, a method for quantifying each OTU can be established, and the time and cost of periodically quantifying the OTUs can be reduced.
Usually, it is difficult to calculate the reliability by the regression analysis using the Lasso method alone. However, this time, 1000 sets of Bootstrap samples were prepared, and the reliability of the estimated microbial population was successfully obtained by applying the Lasso method to those samples.
Of the 27 OTUs estimated this time, 6 OTUs showed high reliability (0.6 or more) for nitrite generation, and 5 OTUs showed high reliability for thiocyanate removal.

前記の通り、Bootstrap標本を作成し、Lasso法により解析することで、高い信頼度で亜硝酸生成およびチオシアン除去速度に影響するOTUを抽出することができた。しかし、負に寄与するOTUは、亜硝酸除去、チオシアン生成をしたことになり、亜硝酸生成、チオシアン除去とは真逆の反応をした微生物群となる。
そこで、前記の通り選定した6または5OTUについて、再び回帰分析(最尤法)を実施することで、亜硝酸生成およびチオシアン除去速度に対する回帰係数およびp値を算出した。この結果、亜硝酸生成およびチオシアン除去速度に正の相関を示すOTUはそれぞれ3OTUであり、それらが夫々、亜硝酸生成およびチオシアン除去に係る主要微生物群と結論付けられた。
As described above, a Bootstrap specimen was prepared and analyzed by the Lasso method, so that OTU that affects nitrite generation and thiocyanate removal rate could be extracted with high reliability. However, the OTU that contributes negatively has been nitrous acid removal and thiocyanogenesis, and is a group of microorganisms that have performed the opposite reaction to nitrite production and thiocyanogen removal.
Therefore, a regression analysis (maximum likelihood method) was again performed on the 6 or 5 OTUs selected as described above to calculate regression coefficients and p-values for nitrite generation and thiocyanate removal rates. As a result, OTUs positively correlated with nitrite generation and thiocyanate removal rate were 30 OTUs, respectively, and it was concluded that these were the main microbial groups involved in nitrite generation and thiocyanate removal, respectively.

結果を表5及び表6に示す。表5および表6は、Bootstrap標本を作成し、Lasso法により亜硝酸生成、チオシアン除去速度への影響が推定されたOTUとその信頼度、および高い信頼度(0.6以上)を示したOTUに対して回帰分析(最尤法)を行い算出した回帰係数およびp値を示す。
なお、さらに絞り込む必要がある場合は、回帰分析のp値に基づき、例えば0.05未満のOTUのみに絞り込めばよい。
The results are shown in Tables 5 and 6. Tables 5 and 6 show an OTU in which a bootstrap sample was prepared, the OTU of which the influence on the nitrite generation and the thiocyanate removal rate was estimated by the Lasso method, its reliability, and a high reliability (0.6 or more). Shows the regression coefficient and p-value calculated by performing a regression analysis (maximum likelihood method) on.
When it is necessary to further narrow down, based on the p-value of the regression analysis, for example, it is sufficient to narrow down to only OTU less than 0.05.

(5)回帰式作成による予測
上記(4)で選定されたOTU(信頼度0.6以上)を独立変数として回帰分析を行い、各水質を予測した。なお、ここでは回帰係数が負のOTUも含めて行った。
この結果、実験値と予測値が非常に高精度で一致した。また、交差検証法によりさらなる検証を行い、やはり高精度に一致することが分かった。
図11および図12に亜硝酸生成およびチオシアン除去速度の実測値、回帰分析による予測値および交差検証により1試料を除いて検証した予測値をそれぞれ示す。図中、一点鎖線は実測値、実線は回帰分析による予測値、破線は交差検証により1試料を除いて検証した予測値である。
これにより、高い精度で水処理微生物群を選定することができ、さらには選定した微生物群を独立変数にすることで、水質を予測できることを示した。
(5) Prediction by creating a regression equation A regression analysis was performed using the OTU (reliability 0.6 or more) selected in (4) as an independent variable to predict each water quality. In this case, the regression coefficient was also performed including the negative OTU.
As a result, the experimental value and the predicted value agreed with very high accuracy. In addition, further verification was performed by the cross-validation method, and it was also found that the results coincided with high accuracy.
11 and 12 show measured values of nitrite generation and thiocyanate removal rates, predicted values by regression analysis, and predicted values obtained by excluding one sample by cross-validation, respectively. In the figure, the dashed line indicates the actual measurement value, the solid line indicates the predicted value obtained by regression analysis, and the broken line indicates the predicted value obtained by cross-validation except for one sample.
As a result, it was shown that a water treatment microorganism group can be selected with high accuracy, and that water quality can be predicted by using the selected microorganism group as an independent variable.

〔実施例2〕
(1)生物学的排水処理プロセスの運転、水質分析、分解速度算出および微生物試料の採取
工業用水と自然海水とを体積比2:3で混合して得られた溶媒中に、表7に示す溶質を表7に示す濃度で溶解し、人工排水(被処理水)を調製した。この実施例2においては、実施例1の溶質に加えて、コークス炉排水に含まれる主なCOD成分のフェノール及びチオ硫酸イオンを追加した。
[Example 2]
(1) Operation of biological wastewater treatment process, analysis of water quality, calculation of decomposition rate, and collection of microorganism sample Table 7 shows the solvent obtained by mixing industrial water and natural seawater at a volume ratio of 2: 3. Solutes were dissolved at the concentrations shown in Table 7 to prepare artificial drainage (water to be treated). In Example 2, in addition to the solute of Example 1, phenol and thiosulfate ions, which are main COD components contained in coke oven wastewater, were added.

また、図7に示すように、1つの槽内で生物処理領域20aと沈降領域20bとが隔壁23により互いに隔てられていると共にこの隔壁23の下方で互いに連通する構造を有する一体型の生物処理装置20を用意した。また、ポリ瓶に10mm×10mm×10mmの大きさのスポンジ担体〔流動担体(関東イノアック製AQ−1)〕と微生物植種源として高濃度の活性汚泥を投入し、手でよく揉み、一晩蓋をして浸け置くことで、微生物をスポンジ担体に付着させた。
このようにして準備されたスポンジ担体21と活性汚泥を生物処理装置20の生物処理領域20a内にスポンジ担体21の体積比が20%(v/v)となるように投入し、生物処理装置20を準備した。
As shown in FIG. 7, an integrated biological treatment having a structure in which a biological treatment area 20a and a sedimentation area 20b are separated from each other by a partition wall 23 in one tank and communicate with each other below the partition wall 23. An apparatus 20 was prepared. In addition, a sponge carrier [fluid carrier (AQ-1 manufactured by Kanto INOAC)] having a size of 10 mm × 10 mm × 10 mm and a high concentration of activated sludge as a microbial seeding source are put into a plastic bottle, and the mixture is hand-kneaded overnight. Microorganisms were attached to the sponge carrier by immersing the lid.
The sponge carrier 21 and the activated sludge thus prepared are put into the biological treatment region 20a of the biological treatment device 20 so that the volume ratio of the sponge carrier 21 becomes 20% (v / v). Was prepared.

このようにして準備された実施例2の生物処理装置20内にそれぞれ上記の被処理水24を流入させ、スポンジ担体21に微生物を定着させる微生物馴致処理(第1段処理)時には、被処理水24の水理学的滞留時間が24時間となるように流入させた。また、各生物処理装置20内の被処理水24に空気曝気22を行って好気性流動床を形成させ、微生物の馴致を行った。また、5wt%−水酸化ナトリウム水溶液を用いてpHを7.5付近に調整しながら処理を行った。   In the biological treatment apparatus 20 of the second embodiment prepared as described above, the above-mentioned water to be treated 24 flows into the biological treatment apparatus 20, and at the time of the microorganism adaptation treatment (first-stage treatment) for fixing microorganisms to the sponge carrier 21, the water to be treated is Twenty-four hydraulic residence times were allowed to flow in for 24 hours. In addition, air aeration 22 was performed on the water 24 to be treated in each biological treatment apparatus 20 to form an aerobic fluidized bed, and the microorganisms were adapted. The treatment was performed while adjusting the pH to around 7.5 using a 5 wt% -sodium hydroxide aqueous solution.

この生物学的処理の運転開始後、すぐにチオシアン酸イオンの除去が認められ、その後チオシアン酸イオンの除去率が99%以上で安定したため、18日目で微生物馴致処理(第1段処理)を終了した。この微生物馴致処理(第1段処理)の期間、被処理水中のアンモニアの22%以上が亜硝酸イオンに酸化された。
なお、スポンジ担体に予め微生物を定着させなかった実施例1よりも71日も早く微生物馴致処理(第1段処理)を終了できた。これは、pHを調整したためと、また事前にスポンジ担体21手でよく揉み、一晩蓋をして浸け置いたためである。
Immediately after the start of the biological treatment, the removal of thiocyanate ions was observed. After that, the removal rate of thiocyanate ions was stabilized at 99% or more. finished. During this microbial adaptation treatment (first-stage treatment), 22% or more of the ammonia in the water to be treated was oxidized to nitrite ions.
The microbial adaptation treatment (first-stage treatment) could be completed 71 days earlier than in Example 1 in which the microorganisms were not fixed on the sponge carrier in advance. This is because the pH was adjusted and because the sponge carrier 21 was rubbed well in advance, covered overnight, and immersed.

この微生物馴致処理(第1段処理)の終了後、生物処理装置20の生物処理領域20a内の処理水についてチオシアン酸イオン濃度と亜硝酸イオン濃度とを測定してチオシアン酸イオン及び亜硝酸イオンのモニタリングを行なった。
かつ、生物処理装置20の生物処理領域20a内の処理水のpHを測定してpH値のモニタリング行いながら、運転開始後19日目より領域内の水理学的滞留時間が18時間となるように被処理水24の流入量を増やし(第2段処理)、次に、運転開始後39日目より領域内の水理学的滞留時間が12時間となるように被処理水24の流入量を更に増やし(第3段処理)、更に、運転開始後46日目より領域内の水理学的滞留時間が8時間となるように被処理水24の流入量を更に増やした(第4段処理)。その後、74日目より領域内の水理学的滞留時間が10時間となるように被処理水24の流入量を減らし(第5段処理)、更に96日目より領域内の水理学的滞留時間が24時間となるように被処理水24の流入量を減らし(第6段処理)、最終的に164日目まで運転を継続した。
After the completion of the microorganism acclimatization treatment (the first stage treatment), the thiocyanate ion concentration and the nitrite ion concentration of the treated water in the biological treatment region 20a of the biological treatment device 20 are measured, and the thiocyanate ion and the nitrite ion concentration are measured. Monitoring was performed.
In addition, while measuring the pH of the treated water in the biological treatment area 20a of the biological treatment apparatus 20 and monitoring the pH value, the hydraulic retention time in the area is set to 18 hours from the 19th day after the start of operation. The inflow of the water 24 to be treated is increased (second stage treatment), and the inflow of the water 24 to be treated is further increased from the 39th day after the start of operation so that the hydraulic residence time in the region becomes 12 hours. The amount of inflow of the water to be treated 24 was further increased so that the hydraulic residence time in the region became 8 hours from the 46th day after the start of operation (third stage treatment). Thereafter, the inflow of the water 24 to be treated was reduced so that the hydraulic retention time in the region became 10 hours from the 74th day (fifth stage treatment), and the hydraulic retention time in the region from the 96th day. Was reduced to 24 hours (the sixth-stage treatment), and finally the operation was continued until the 164th day.

この間、第2段処理において領域内の水理学的滞留時間を18時間に短縮したことにより、チオシアン酸イオンの除去率を高い値に維持しつつ、亜硝酸イオンの生成の減少傾向が観察され始め、更に領域内の水理学的滞留時間を12時間に短縮することにより、チオシアン酸イオンの除去率を高い値に維持しつつ、亜硝酸イオンの生成を更に抑制することができた。
しかしながら、更に、第4段処理において領域内の水理学的滞留時間を8時間に短縮した場合には、亜硝酸イオンの生成をほぼ完全に抑制しながらも、しばらく継続するとチオシアン酸イオンの除去率が低下した。これは実施例1の被処理水には含まれていなかったフェノール及びチオ硫酸を分解する微生物がスポンジ担体21の表面に生息したため、チオシアン酸イオンを除去する微生物がスポンジ担体21の表面で生息する場が少なくなり、その結果除去率が低下してしまったものと考えられる。
このように、チオシアン酸イオンの除去率が目標値を超えて上昇してしまったため、第5段処理においては、水理学的滞留時間を第4段処理の条件(水理学的滞留時間が12時間)に近い10時間に戻して生物学的処理を行った。その結果、チオシアン酸イオンの除去率を94%以上に維持しつつ、亜硝酸イオンの生成をほぼ完全に抑制することができた。
そこで更に、第6段処理においては、水理学的滞留時間を24時間に延長したところ、チオシアン酸イオンの除去率を高い値に維持しながらも、更に驚くべきことには、その後76日間にも亘って、亜硝酸イオンの生成をほぼ完全に抑制することができた。
During this period, the reduction tendency of the production of nitrite ions began to be observed while maintaining the removal rate of thiocyanate ions at a high value by reducing the hydraulic residence time in the region to 18 hours in the second stage treatment. By further reducing the hydraulic residence time in the region to 12 hours, the generation of nitrite ions could be further suppressed while maintaining the thiocyanate ion removal rate at a high value.
However, when the hydraulic retention time in the region is further reduced to 8 hours in the fourth stage treatment, while the generation of nitrite ions is almost completely suppressed, the removal rate of thiocyanate ions is maintained for a while. Decreased. This is because microorganisms that decompose phenol and thiosulfuric acid, which were not contained in the water to be treated in Example 1, lived on the surface of the sponge carrier 21, and microorganisms that remove thiocyanate ions lived on the surface of the sponge carrier 21. It is considered that the number of fields was reduced, and as a result, the removal rate decreased.
As described above, since the thiocyanate ion removal rate has risen beyond the target value, in the fifth stage treatment, the hydraulic residence time is reduced by the conditions of the fourth stage treatment (the hydraulic residence time is 12 hours). The biological treatment was carried out after returning to 10 hours close to ()). As a result, the generation of nitrite ions could be almost completely suppressed while maintaining the thiocyanate ion removal rate at 94% or more.
Therefore, in the sixth stage treatment, the hydraulic retention time was extended to 24 hours, and while maintaining the thiocyanate ion removal rate at a high value, more surprisingly, Over the period, the generation of nitrite ions could be almost completely suppressed.

この実施例2での生物学的処理において、運転日数に対する一日当たりの亜硝酸生成速度、チオシアン除去速度、チオ硫酸除去速度およびフェノール除去速度を、前記式(1)、前記式(2)、下記式(3)および下記式(4)に従い算出した。   In the biological treatment in Example 2, the nitrite generation rate, thiocyan removal rate, thiosulfuric acid removal rate, and phenol removal rate per day with respect to the number of operating days were determined by the above formulas (1), (2) and It was calculated according to equation (3) and equation (4) below.

この実施例2での生物学的処理において、運転日数一日当たりの、亜硝酸生成速度を図13に、チオシアン除去速度を図14に、チオ硫酸除去速度を図15に、フェノール除去速度を図16に示す。   In the biological treatment in Example 2, the nitrite generation rate, the thiocyanate removal rate, the thiosulfuric acid removal rate, and the phenol removal rate are shown in FIG. 13, FIG. 14, Thiosulfuric acid removal rate, and FIG. This is shown in FIG.

(2)DNA抽出、塩基配列解読および微生物群の決定
前記実施例1の(2)と同様にしてDNA抽出、塩基配列解読および微生物群決定を実施した。
(2) DNA extraction, base sequence decoding, and determination of microorganism group DNA extraction, base sequence decoding, and microorganism group determination were performed in the same manner as in (2) of Example 1 above.

(3)各微生物群の量の決定
前記実施例1の(3)と同様にしてDNA抽出、塩基配列解読および微生物群決定を実施した。
(3) Determination of the amount of each microorganism group DNA extraction, nucleotide sequence decoding, and microorganism group determination were performed in the same manner as in (3) of Example 1 above.

(4)Bootstrap標本の作成、Lassoによる主要な水処理微生物群の絞り込み
前記実施例1の(4)と同様にして亜硝酸生成、チオシアン除去、チオ硫酸除去およびフェノール除去に係わった主要微生物群を統計解析により推定した。
Lasso法による解析の結果、亜硝酸生成、チオシアン除去、チオ硫酸除去およびフェノール除去速度に影響する微生物群を、それぞれ28OTU、34OTU、36OTUおよび36OTUに絞り込むことができた。
(4) Preparation of Bootstrap specimen and narrowing down of main water treatment microorganisms by Lasso In the same manner as in (4) of Example 1, the main microorganisms involved in nitrite generation, thiocyanic acid removal, thiosulfuric acid removal and phenol removal were identified. Estimated by statistical analysis.
As a result of the analysis by the Lasso method, it was possible to narrow down the microorganisms that affect nitrite generation, thiocyanate removal, thiosulfate removal and phenol removal rates to 28 OTU, 34 OTU, 36 OTU and 36 OTU, respectively.

今回推定されたOTUのうち、亜硝酸生成に対して高い信頼度(0.6以上)を示したOTUは3OTU、チオシアン除去に対して高い信頼度を示したOTUは5OTU、チオ硫酸除去に対して高い信頼度を示したOTUは5OTU、フェノール除去に対して高い信頼度を示したOTUは6OTUであった。   Of the OTUs estimated this time, the OTU that showed high reliability (0.6 or more) for nitrite generation was 3 OTU, the OTU that showed high reliability for thiocyanide removal was 5 OTU, and the OTU that showed high reliability was thiosulfate removal. The OTU that showed high reliability was 5 OTU, and the OTU that showed high reliability for phenol removal was 6 OTU.

前記の通り、Bootstrap標本を作成し、Lasso法により解析することで、高い信頼度で亜硝酸生成、チオシアン除去、チオ硫酸除去およびフェノール除去速度に影響するOTUを抽出することができたが、負に寄与するOTUは、亜硝酸除去、チオシアン生成、チオ硫酸生成およびフェノール生成をしたことになり、亜硝酸生成、チオシアン除去、チオ硫酸除去、フェノール除去とはそれぞれ真逆の反応をした微生物群となる。
そこで、前記の通り選定した信頼度の高いOTUについて、回帰分析を実施することで、亜硝酸生成、チオシアン除去、チオ硫酸除去およびフェノール除去速度に対する回帰係数およびp値を算出した結果、全て正の回帰係数であった。このため、前記の通り選定した信頼度の高いOTUは、亜硝酸生成、チオシアン除去、チオ硫酸除去およびフェノール除去に係る主要微生物群と結論付けられた。
結果を表8〜11に示す。表8、表9、表10および表11はBootstrap標本を作成し、Lasso法により亜硝酸生成、チオシアン除去、チオ硫酸除去およびフェノール除去速度への影響が推定されたOTUとその信頼度、および高い信頼度(0.6以上)を示したOTUに対して回帰分析(最尤法)を行い算出した回帰係数およびp値を示す。
なお、さらに絞り込む必要がある場合は、回帰分析のp値に基づき、例えば0.05未満のOTUのみに絞り込めばよい。
As described above, by preparing a bootstrap sample and analyzing it by the Lasso method, it was possible to extract OTU which affects nitrite generation, thiocyanate removal, thiosulfate removal and phenol removal rate with high reliability. OTU that contributed to the reaction was nitrite removal, thiocyanate formation, thiosulfate formation and phenol formation, and the microorganisms that had the opposite reactions to nitrite formation, thiocyanate removal, thiosulfate removal and phenol removal, respectively. Become.
Therefore, by performing a regression analysis on the highly reliable OTU selected as described above, the regression coefficients and p-values for the nitrite generation, thiocyanate removal, thiosulfate removal and phenol removal rates were calculated. It was a regression coefficient. For this reason, it was concluded that the highly reliable OTU selected as described above was a major microorganism group related to nitrite generation, thiocyanate removal, thiosulfate removal and phenol removal.
The results are shown in Tables 8 to 11. Table 8, Table 9, Table 10 and Table 11 prepared Bootstrap specimens and estimated the effects on nitrous acid generation, thiocyanate removal, thiosulfate removal and phenol removal rates by the Lasso method and their reliability, and high The regression coefficient and p-value calculated by performing regression analysis (maximum likelihood method) on the OTU showing the reliability (0.6 or more) are shown.
When it is necessary to further narrow down, based on the p-value of the regression analysis, for example, it is sufficient to narrow down to only OTU less than 0.05.

(5)回帰式作成による予測
前記実施例1の(5)と同様にして回帰分析を行い、各水質を予測した結果、実験値と予測値が非常に高精度で一致した。また、交差検証法により更なる検証を行い、やはり高精度に一致することが分かった。
図17、図18、図19および図20に亜硝酸生成速度、チオシアン除去速度、チオ硫酸除去速度およびフェノール除去速度の実測値、回帰分析による予測値および交差検証により1試料を除いて検証した予測値をそれぞれ示す。図中、一点鎖線は実測値、実線は回帰分析による予測値、破線は交差検証により1試料を除いて検証した予測値である。
これにより、高い精度で水処理微生物群を選定することができ、さらには選定した微生物群を独立変数にすることで、水質を予測できることを示した。
(5) Prediction by Creating Regression Equation As a result of performing regression analysis in the same manner as in (5) of Example 1 and predicting each water quality, the experimental value and the predicted value matched with extremely high accuracy. In addition, further verification was performed by the cross-validation method, and it was found that the values coincided with high accuracy.
17, 18, 19, and 20 show the measured values of the nitrite generation rate, the thiocyanate removal rate, the thiosulfate removal rate, and the phenol removal rate, the predicted values by regression analysis, and the predictions except one sample by cross-validation. Each value is shown. In the figure, the dashed line indicates the actual measurement value, the solid line indicates the predicted value obtained by regression analysis, and the broken line indicates the predicted value obtained by cross-validation except for one sample.
As a result, it was shown that a water treatment microorganism group can be selected with high accuracy, and that water quality can be predicted by using the selected microorganism group as an independent variable.

〔実施例3〕
上記実施例2の(1)〜(3)の結果を用い、上記実施例2の(4)において、Bootstrap標本の作成及びLasso法により絞り込まれた微生物群に対し、以下の(4’)に示すSPCRによる解析を行った。
なお、上記実施例2では、Lasso法による解析の結果、亜硝酸生成、チオシアン除去、チオ硫酸除去およびフェノール除去速度に影響する微生物群は、それぞれ28OTU、34OTU、36OTUおよび36OTUに絞り込まれている。
[Example 3]
Using the results of (1) to (3) of Example 2 above, in (4) of Example 2 described above, the following (4 ′) was used for the preparation of Bootstrap specimens and the group of microorganisms narrowed down by the Lasso method. The analysis by SPCR shown was performed.
In the above Example 2, as a result of the analysis by the Lasso method, the microbial groups affecting the nitrite generation, thiocyanate removal, thiosulfate removal and phenol removal rates were narrowed down to 28 OTU, 34 OTU, 36 OTU and 36 OTU, respectively.

(4’)絞り込みされた微生物群に対するSPCR法による主要な水処理微生物群の絞り込み、微生物種間の関係性の推定および絞り込まれた微生物からの水処理速度の推定
上記の絞り込まれたOTUに対して、主要な水処理微生物群の絞り込みと同時に微生物種間の関係性を推定できるスパース主成分回帰モデル (SPCR)を用いて解析を行った。
SPCR法による解析の結果、亜硝酸生成、チオシアン除去、チオ硫酸除去およびフェノール除去速度に対して選択された主成分の個数は、それぞれ2つ、3つ、3つおよび1つとなった。同じ主成分軸のOTUは相互に関係している、もしくは同じ環境因子に影響されることが推察できる。
亜硝酸生成に対する各主成分軸を表12に、チオシアン除去に対する主成分軸を表13に、チオ硫酸除去に対する主成分軸を表14に、フェノール除去に対する主成分軸を表15に示す。各軸において主成分の値が0のOTUは、各物質の生成や処理に寄与がないOTUであると判断でき、各軸の主成分の値がいずれも0ではないOTUへと絞りこむことができる。したがって、SPCR法による解析の結果、亜硝酸生成、チオシアン除去、チオ硫酸除去およびフェノール除去速度に影響する微生物群を、それぞれ28OTU、27OTU、32OTUおよび35OTUに絞り込むことができた。
(4 ′) Narrowing down the main water treatment microorganisms by SPCR method for the narrowed down microorganisms, estimating the relationship between the microorganism species, and estimating the water treatment speed from the narrowed down microorganisms. Then, the analysis was performed using a sparse principal component regression model (SPCR) that can estimate the relationship between the microorganism species at the same time as narrowing down the main water treatment microorganism groups.
As a result of the analysis by the SPCR method, the numbers of the main components selected for the nitrite generation, the thiocyanate removal, the thiosulfate removal, and the phenol removal rate were 2, 3, 3, and 1, respectively. It can be inferred that OTUs with the same principal component axis are interrelated or affected by the same environmental factors.
Table 12 shows the main component axes for nitrite generation, Table 13 shows the main component axes for thiocyanate removal, Table 14 shows the main component axes for thiosulfuric acid removal, and Table 15 shows the main component axes for phenol removal. An OTU with a principal component value of 0 in each axis can be determined to be an OTU that does not contribute to the generation or processing of each substance, and can be narrowed down to an OTU in which the principal component value in each axis is not 0. it can. Therefore, as a result of the analysis by the SPCR method, the microorganism groups affecting the nitrite generation, thiocyanate removal, thiosulfate removal and phenol removal rates could be narrowed down to 28 OTU, 27 OTU, 32 OTU and 35 OTU, respectively.

図21、図22、図23および図24に亜硝酸生成速度、チオシアン除去速度、チオ硫酸除去速度およびフェノール除去速度の実測値、交差検証により1試料を除いて検証した予測値をそれぞれ示す。図中、一点鎖線は実測値、実線は交差検証により1試料を除いて検証した予測値である。   21, 22, 23, and 24 show measured values of nitrite generation rate, thiocyan removal rate, thiosulfuric acid removal rate, and phenol removal rate, and predicted values verified by removing one sample by cross-validation, respectively. In the figure, the dashed-dotted line is the actual measurement value, and the solid line is the predicted value verified by removing one sample by cross-validation.

亜硝酸生成に関する切片は32.70551、第一主成分軸に対する回帰係数は3.387741、第二主成分軸に対する回帰係数は4.634266であった。各主成分軸でのOTUの主成分の値に回帰係数を乗じた値が正であれば、亜硝酸生成に正の影響、負であれば負の影響をもたらすことがわかる。また交差検証法により算出した予測R値は0.575であり、実測値と予測値の推移は図21のようになり、実測値と予測値が高精度に一致していた。
実施例2で実施したBootstrap標本の作成、Lasso法で算出および回帰分析で得られた値の予測R値は0.709であり、実施例3で実施したBootstrap標本の作成、Lasso法で算出および主成分回帰分析(SPCR)法で得られた値の予測R値は0.575であった。
The intercept for nitrous acid production was 32.70551, the regression coefficient for the first principal component axis was 3.3777741, and the regression coefficient for the second principal component axis was 4.634266. It can be seen that if the value obtained by multiplying the value of the main component of OTU on each principal component axis by the regression coefficient is positive, it has a positive effect on nitrite generation, and if negative, it has a negative effect. The predicted R 2 value calculated by cross validation method is 0.575, changes in the measured and predicted values is as shown in FIG. 21, the predicted values and the measured values were consistent with high accuracy.
Creating Bootstrap specimens was carried out in Example 2, the predicted R 2 value of the values obtained by the calculation and regression in Lasso method is 0.709, creating a Bootstrap specimens was carried out in Example 3, calculated in Lasso method and predicted R 2 value of the values obtained by the principal component regression analysis (SPCR) method was 0.575.

チオシアン除去に関する切片は361.94、第一主成分軸に対する回帰係数は3.955、第二主成分軸に対する回帰係数は−22.30、第三主成分軸に対する回帰係数は−75.96となり、交差検証法により算出した予測R値は0.708であった。各主成分軸でのOTUの主成分の値に回帰係数を乗じた値が正であれば、チオシアン除去に正の影響、負であれば負の影響をもたらすことがわかる。実測値と予測値の推移は図22のようになり、実測値と予測値が高精度に一致していた。
実施例2で実施したBootstrap標本の作成、Lasso法で算出および回帰分析で得られた値の予測R値は0.676であり、実施例3で実施したBootstrap標本の作成、Lasso法で算出および主成分回帰分析(SPCR)法で得られた値の予測R値は0.708であるので、SPCR法を採用することで微生物特定精度がさらに向上したことが分かる。
The intercept for thiocyan removal is 361.94, the regression coefficient for the first principal component axis is 3.955, the regression coefficient for the second principal component axis is -22.30, and the regression coefficient for the third principal component axis is -75.96. , the predicted R 2 value calculated by cross-validation method was 0.708. It can be seen that if the value obtained by multiplying the value of the principal component of OTU on each principal component axis by the regression coefficient is positive, it has a positive effect on thiocyan removal, and if negative, it has a negative effect. The transition between the measured value and the predicted value was as shown in FIG. 22, and the measured value and the predicted value coincided with high accuracy.
Creating Bootstrap specimens was carried out in Example 2, the predicted R 2 value of the values obtained by the calculation and regression in Lasso method is 0.676, creating a Bootstrap specimens was carried out in Example 3, calculated in Lasso method and since the predicted R 2 values obtained by principal component regression analysis (SPCR) method is 0.708, it is understood that further improved microbial identification accuracy by adopting the SPCR method.

チオ硫酸除去に関する切片は399.47、第一主成分軸に対する回帰係数は0.398、第二主成分軸に対する回帰係数は22.99、第三主成分軸に対する回帰係数は60.04となり、交差検証法により算出した予測R値は0.721であった。各主成分軸でのOTUの主成分の値に回帰係数を乗じた値が正であれば、チオ硫酸除去に正の影響、負であれば負の影響をもたらすことがわかる。実測値と予測値の推移は図23のようになり、実測値と予測値が高精度に一致していた。
実施例2で実施したBootstrap標本の作成、Lasso法で算出および回帰分析で得られた値の予測R値は0.674であり、実施例3で実施したBootstrap標本の作成、Lasso法で算出および主成分回帰分析(SPCR)法で得られた値の予測R値は0.721であるので、SPCR法を採用することで微生物特定精度がさらに向上したことが分かる。
The intercept for thiosulfuric acid removal is 399.47, the regression coefficient for the first principal axis is 0.398, the regression coefficient for the second principal axis is 22.99, the regression coefficient for the third principal axis is 60.04, predicted R 2 value calculated by cross-validation method was 0.721. It can be seen that if the value obtained by multiplying the value of the main component of OTU on each principal component axis by the regression coefficient is positive, the removal of thiosulfuric acid has a positive effect. The transition between the measured value and the predicted value is as shown in FIG. 23, and the measured value and the predicted value match with high accuracy.
Creating Bootstrap specimens was carried out in Example 2, the predicted R 2 value of the values obtained by the calculation and regression in Lasso method is 0.674, creating a Bootstrap specimens was carried out in Example 3, calculated in Lasso method and since the predicted R 2 values obtained by principal component regression analysis (SPCR) method is 0.721, it is understood that further improved microbial identification accuracy by adopting the SPCR method.

フェノール除去に関する切片は204.8045、回帰係数は25.152、交差検証法により算出した予測R値は0.672であった。各主成分軸でのOTUの主成分の値に回帰係数を乗じた値が正であれば、フェノール除去に正の影響、負であれば負の影響をもたらすことがわかる。実測値と予測値の推移は図24のようになり、実測値と予測値が高精度に一致していた。
実施例2で実施したBootstrap標本の作成、Lasso法で算出および回帰分析で得られた値の予測R値は0.612であり、実施例3で実施したBootstrap標本の作成、Lasso法で算出および主成分回帰分析(SPCR)法で得られた値の予測R値は0.672であるので、SPCR法を採用することで微生物特定精度がさらに向上したことが分かる。
Sections related to the phenol removal 204.8045, regression coefficients 25.152, predicted R 2 value calculated by cross-validation method was 0.672. It can be seen that if the value obtained by multiplying the value of the main component of OTU on each principal component axis by the regression coefficient is positive, phenol removal has a positive effect, and if negative, it has a negative effect. The transition between the measured value and the predicted value is as shown in FIG. 24, and the measured value and the predicted value match with high accuracy.
Creating Bootstrap specimens was carried out in Example 2, the predicted R 2 value of the values obtained by the calculation and regression in Lasso method is 0.612, creating a Bootstrap specimens was carried out in Example 3, calculated in Lasso method and since the predicted R 2 values obtained by principal component regression analysis (SPCR) method is 0.672, it is understood that further improved microbial identification accuracy by adopting the SPCR method.

[実施例4]
上記実施例1の(1)〜(3)のチオシアン除去速度のデータを用い、上記実施例1の(4)において、推定に用いたデータセットにおける各OTUの量の値として、チオシアン除去速度のデータの測定基準時点に対応した時点ごと採取されて得られたもの、及び測定基準時点と対応した時点より一時点前に採取されて得られたものを用いた(例えば、運転(N+14)日目のチオシアン量から算出したチオシアン除去速度のデータと、運転(N+7)日目(一時点前)及び運転(N+14)日目に取得した各OTUの量の値のデータとを用いた。)こと以外は、前記実施例1の(4)と同様にしてBootstrap標本の作成及びLasso法により、微生物群を信頼度0.6以上のものに絞り込んだ。
結果を表16に示す。
[Example 4]
Using the data of the thiocyan removal rate in (1) to (3) of the first embodiment, in (4) of the first embodiment, the value of the amount of each OTU in the data set used for the estimation is used as the value of the thiocyan removal rate. Data obtained by sampling each time corresponding to the measurement reference time and data obtained by sampling one time before the time corresponding to the measurement reference time were used (for example, on the (N + 14) th day of operation). Of the thiocyanate removal rate calculated from the thiocyanine amount of the above and the data of the amount value of each OTU obtained on the operation (N + 7) day (before the temporary point) and the operation (N + 14) day. Other than that, the microorganism group was narrowed down to those having a reliability of 0.6 or more by the preparation of a Bootstrap specimen and the Lasso method in the same manner as in (4) of Example 1 described above.
Table 16 shows the results.

チオシアン除去に対して高い信頼度(0.6以上)を示したOTUは5OTUであった。表中の「_1」のOTUは、前記測定基準時点と対応した時点より一時点前に採取されて得られたもののデータである。
次いで、得られた結果をもとに、前記実施例1の(5)と同様にして、交差検証法により予測R値を算出した。算出された予測R値は0.903であり、非常に高い予測精度が認められた。
なお、チオシアン除去速度の測定基準時点より一時点前のOTUの量の値を用いない場合には、予測R値は0.765であったので、チオシアン除去速度の測定基準時点よりも一時点前の微生物群の含有量のデータを解析に含めたことで、微生物特定精度をさらに向上できたことがわかる。
The OTU which showed high reliability (0.6 or more) for thiocyan removal was 5 OTU. The OTU of “— 1” in the table is data obtained by sampling one time before the time corresponding to the measurement reference time.
Then, based on the results obtained, in the same manner as in Example 1 (5) to calculate the predicted R 2 value by cross-validation. Calculated prediction R 2 value is 0.903, very high prediction accuracy was observed.
Incidentally, in the case of not using the value of the quantity of one time before the OTU to the measurement reference time point of thiocyanate removal rate, because the predicted R 2 value was 0.765, one time than the measurement reference time point of thiocyanate removal rate It can be seen that by including the data on the content of the previous microorganism group in the analysis, the microorganism identification accuracy could be further improved.

[実施例5]
上記実施例4において、上記実施例2で得られたチオシアン除去速度のデータを用いたこと以外は、前記実施例4と同様にしてBootstrap標本の作成及びLasso法により、微生物群を信頼度0.6以上のものに絞り込んだ。
チオシアン除去に対して高い信頼度(0.6以上)を示したOTUは6OTUであった。表中の「_1」のOTUは、前記測定基準時点と対応した時点より一時点前に採取されて得られたもののデータである。
次いで、前記実施例1の(4)と同様にして、選定した6OTUについて、再び回帰分析(最尤法)を実施することで、チオシアン除去速度に対する回帰係数およびp値を算出した。
結果を表17に示す。
[Example 5]
In the above Example 4, a bootstrap sample was prepared and the microorganism group was determined to have a reliability of 0. 0 using the Lasso method in the same manner as in Example 4 except that the data on the thiocyan removal rate obtained in Example 2 was used. I narrowed down to 6 or more.
The OTU which showed high reliability (0.6 or more) for thiocyan removal was 6 OTU. The OTU of “— 1” in the table is data obtained by sampling one time before the time corresponding to the measurement reference time.
Next, a regression analysis (maximum likelihood method) was performed again on the selected 6 OTUs in the same manner as in (4) of Example 1 to calculate a regression coefficient and a p-value for the thiocyan removal rate.
Table 17 shows the results.

この結果、選定した6OTUの全てがチオシアン除去速度に正の関係を示し、6OTUのいずれもが、チオシアン除去に係る主要微生物群と結論付けられた。
さらに、選定した6OTUに対し、回帰分析のp値に基づき、p値が0.05未満のOTUに絞り込んだ。この結果、チオシアン除去速度に影響する微生物群を5OTUに絞り込むことができた。
次いで、前記実施例1の(5)と同様にして交差検証法により予測R値を算出した。最終的に絞りこまれた5OTUのデータを用いて算出された予測R値は0.711であった。
なお、チオシアン除去速度の測定基準時点より一時点前のOTUの量の値を用いない場合には、予測R値は0.677であったので、チオシアン除去速度の測定基準時点よりも一時点前の微生物群の含有量のデータを解析に含めたことで、微生物特定精度をさらに向上できことがわかる。
また、p値での絞り込みを行わなかった6OTUのデータを用いて算出された予測R値は0.622であったので、回帰分析のp値に基づく絞り込みを行うことで、微生物特定精度をさらに向上できたことがわかる。
As a result, all of the selected 6OTUs showed a positive relationship with the thiocyanate removal rate, and it was concluded that each of the 6OTUs was a major microorganism group related to thiocyanate removal.
Further, based on the p-value of the regression analysis, the selected 6 OTUs were narrowed down to OTUs having a p-value of less than 0.05. As a result, it was possible to narrow down the microorganism group affecting the thiocyanate removal rate to 5 OTU.
It was then calculated predicted R 2 value by cross validation method in the same manner as in Example 1 (5). Predicted R 2 value calculated using the data of 5OTU which narrowed down finally was 0.711.
Incidentally, in the case of not using the value of the quantity of one time before the OTU to the measurement reference time point of thiocyanate removal rate, because the predicted R 2 value was 0.677, one time than the measurement reference time point of thiocyanate removal rate It can be seen that by including the data on the content of the preceding microorganism group in the analysis, the microorganism identification accuracy can be further improved.
Moreover, since the predicted R 2 value data calculated using the 6OTU not subjected to narrowing at p value was 0.622, by performing the narrowing based on the p value of the regression analysis, the microorganism identification accuracy It can be seen that further improvement was achieved.

[実施例6]
上記実施例4において、上記実施例2で得られたフェノール除去速度のデータを用いたこと以外は、前記実施例4と同様にしてBootstrap標本の作成及びLasso法により、微生物群を信頼度0.6以上のものに絞り込んだ。
フェノール除去に対して高い信頼度(0.6以上)を示したOTUは6OTUであった。表中の「_1」のOTUは、前記測定基準時点と対応した時点より一時点前に採取されて得られたもののデータである。
次いで、前記実施例1の(4)と同様にして、選定した6OTUについて、再び回帰分析(最尤法)を実施することで、フェノール除去速度に対する回帰係数およびp値を算出した。
結果を表18に示す。
[Example 6]
In the above-mentioned Example 4, except that the data of the phenol removal rate obtained in the above-mentioned Example 2 was used, a microorganism group was determined to have a reliability of 0. 0 by the preparation of a Bootstrap sample and the Lasso method in the same manner as in the above-mentioned Example 4. I narrowed down to 6 or more.
The OTU which showed high reliability (0.6 or more) for phenol removal was 6 OTU. The OTU of “— 1” in the table is data obtained by sampling one time before the time corresponding to the measurement reference time.
Next, a regression analysis (maximum likelihood method) was performed again on the selected 60TU as in (4) of Example 1 to calculate a regression coefficient and a p-value for the phenol removal rate.
The results are shown in Table 18.

この結果、選定した6OTUの全てがフェノール除去速度に正の関係を示し、6OTUのいずれもが、フェノール除去に係る主要微生物群と結論付けられた。
さらに、選定した6OTUに対し、回帰分析のp値に基づき、p値が0.05未満のOTUに絞り込んだ。この結果、フェノール除去速度に影響する微生物群を5OTUに絞り込むことができた。
次いで、前記実施例1の(5)と同様にして交差検証法により予測R値を算出した。最終的に絞りこまれた5OTUのデータを用いて算出された予測R値は0.732であった。
なお、フェノール除去速度の測定基準時点より一時点前のOTUの量の値を用いない場合には、予測R値は0.613であったので、フェノール除去速度の測定基準時点よりも一時点前の微生物群の含有量のデータを解析に含めたことで、微生物特定精度をさらに向上できことがわかる。
また、p値での絞り込みを行わなかった6OTUのデータを用いて算出された予測R値は0.648であったので、回帰分析のp値に基づく絞り込みを行うことで、微生物特定精度をさらに向上できたことがわかる。
As a result, all of the selected 6OTUs showed a positive relationship with the phenol removal rate, and it was concluded that each of the 6OTUs was a major microorganism group related to phenol removal.
Further, based on the p-value of the regression analysis, the selected 6 OTUs were narrowed down to OTUs having a p-value of less than 0.05. As a result, the group of microorganisms affecting the phenol removal rate could be narrowed down to 5 OTU.
It was then calculated predicted R 2 value by cross validation method in the same manner as in Example 1 (5). Predicted R 2 value calculated using the data of 5OTU which narrowed down finally was 0.732.
Incidentally, in the case of not using the value of the quantity of one time before the OTU to the measurement reference time point of phenol removal rate, because the predicted R 2 value was 0.613, one time than the measurement reference time point of phenol removal rate It can be seen that by including the data on the content of the preceding microorganism group in the analysis, the microorganism identification accuracy can be further improved.
Moreover, since the predicted R 2 value data calculated using the 6OTU not subjected to narrowing at p value was 0.648, by performing the narrowing based on the p value of the regression analysis, the microorganism identification accuracy It can be seen that further improvement was achieved.

[実施例7]
上記実施例6と同じく、Bootstrap標本の作成及びLasso法により、微生物群を信頼度0.6以上の6OTUに絞り込んだ。
次いで、絞り込んだ結果について、AICによる絞り込みを実施した。
AICによる変数選択の組み合わせのパターン分けを表19に示す。
[Example 7]
Microorganisms were narrowed down to 6 OTU having a reliability of 0.6 or more by the preparation of a Bootstrap specimen and the Lasso method as in Example 6 above.
Next, the results of the narrowing down were narrowed down by the AIC.
Table 19 shows the patterns of combinations of variable selection by AIC.

表中、上段にAICの値を示す。また、表中の「〇」はAICの値の算出に微生物群の含有量のデータを使用した場合であることを表し、表中の「×」は微生物群の含有量のデータを使用しない場合であることを表す。
得られたAICの値に基づき、本実施例では、AICの値が最も小さいものを採用(最上位モデルを採用)した。
この結果、denovo2647_1を排除して、フェノール除去速度に影響する微生物群を5OTUに絞り込むことができた。
次いで、前記実施例1の(5)と同様にして交差検証法により予測R値を算出した。最終的に絞りこまれた5OTUのデータを用いて算出された予測R値は0.732であった。
なお、フェノール除去速度の測定基準時点より一時点前のOTUの量の値を用いない場合には、予測R値は0.613であったので、フェノール除去速度の測定基準時点よりも一時点前の微生物群の含有量のデータを解析に含めたことで、微生物特定精度をさらに向上できことがわかる。
また、AICでの絞り込みを行わなかった6OTUのデータを用いて算出された予測R値は0.648であったので、AICの値に基づく絞り込みを行うことで、微生物特定精度をさらに向上できたことがわかる。
In the table, AIC values are shown in the upper row. In addition, “〇” in the table indicates that the data on the content of the microorganism group was used to calculate the AIC value, and “×” in the table indicates that the data on the content of the microorganism group was not used. It represents that.
In this example, the one with the smallest AIC value was adopted (the highest model was adopted) based on the obtained AIC value.
As a result, denovo 2647_1 was excluded, and the microorganism group affecting the phenol removal rate could be narrowed down to 50 OTU.
It was then calculated predicted R 2 value by cross validation method in the same manner as in Example 1 (5). Predicted R 2 value calculated using the data of 5OTU which narrowed down finally was 0.732.
Incidentally, in the case of not using the value of the quantity of one time before the OTU to the measurement reference time point of phenol removal rate, because the predicted R 2 value was 0.613, one time than the measurement reference time point of phenol removal rate It can be seen that by including the data on the content of the preceding microorganism group in the analysis, the microorganism identification accuracy can be further improved.
Further, the predicted R 2 value calculated using the data of 6OTU you did not refine in AIC so was 0.648, by performing the narrowing based on the value of the AIC, can further improve the microbial identification accuracy You can see that

各実施形態における各構成及びそれらの組み合わせ等は一例であり、本発明の趣旨を逸脱しない範囲で、構成の付加、省略、置換、およびその他の変更が可能である。また、本発明は各実施形態によって限定されることはなく、請求項(クレーム)の範囲によってのみ限定される。   Each configuration and each combination in each embodiment is an example, and addition, omission, substitution, and other changes of the configuration are possible without departing from the gist of the present invention. The present invention is not limited by each embodiment, but is limited only by the scope of the claims.

20…生物処理装置、20a…生物処理領域、20b…沈降領域、21…スポンジ担体、
22…空気曝気、23…隔壁、24…被処理水、25…生物処理装置で処理された処理水
20: biological treatment apparatus, 20a: biological treatment area, 20b: sedimentation area, 21: sponge carrier,
22 ... air aeration, 23 ... partition walls, 24 ... treated water, 25 ... treated water treated by biological treatment equipment

Claims (14)

以下の工程を含み、特定物質の量の変化に係わる微生物群を特定することを特徴とする微生物群の特定方法:
特定物質及び微生物を含む微生物試料中の、特定物質の量の変化速度、及び前記微生物が分類された微生物群の含有量の測定によって得られたデータセットから、再標本化により標本を作成する標本作成工程、
前記再標本化により作成した標本に対し、前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰係数を0に縮小可能な罰則付き回帰分析を行い、回帰係数に基づき選出された独立変数に対応する微生物群を選出する第一選出工程、
選出された微生物群を特定物質の量の変化に係わる微生物群と特定する特定工程。
A method for identifying a group of microorganisms, comprising identifying the group of microorganisms involved in a change in the amount of a specific substance, comprising the following steps:
A specimen for preparing a specimen by resampling from a data set obtained by measuring the rate of change of the amount of the specific substance in the microorganism sample containing the specific substance and the microorganism, and the content of the microorganism group in which the microorganism is classified Creation process,
For the sample created by the re-sampling, the content of the microorganism group as an independent variable, the corresponding change rate of the amount of the specific substance as a dependent variable, a regression analysis with penalties that can reduce the regression coefficient to 0, Performing, the first selection step of selecting a microorganism group corresponding to the independent variable selected based on the regression coefficient,
A specifying step of specifying the selected microorganism group as a microorganism group related to a change in the amount of the specific substance.
前記データセットにおいて、前記微生物群の含有量は、前記特定物質の量の変化速度の測定基準時点と同一時点及び/又は同一時点よりも前の時点の微生物群の含有量の測定によって得られたものである、請求項1に記載の微生物群の特定方法。   In the data set, the content of the microorganism group was obtained by measuring the content of the microorganism group at the same time and / or before the same time as the measurement reference time of the rate of change in the amount of the specific substance. The method for identifying a microorganism group according to claim 1, which is a microorganism. 更に、前記第一選出工程で選出された微生物群の、再標本化により作成した標本における選出頻度から信頼度を算出し、前記信頼度に基づいて微生物群を更に選出する第二選出工程を含む、請求項1又は2に記載の微生物群の特定方法。   The method further includes a second selection step of calculating reliability from a selection frequency of a sample of the microorganism group selected in the first selection step in a sample created by resampling, and further selecting a microorganism group based on the reliability. The method for identifying a microorganism group according to claim 1 or 2. 更に、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰分析を行い、p値に基づいて微生物群を更に選出する、或いは
更に、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、赤池情報量規準(AIC)の計算を行い、得られたAICの値に基づいて、微生物群を更に選出する、第五選出工程を含む、請求項1〜3のいずれか一項に記載の微生物群の特定方法。
Further, the content of the microorganisms selected in the first selection step or the second selection step as an independent variable, the change rate of the corresponding amount of the specific substance as a dependent variable, regression analysis, p-value Further selecting a microorganism group based on, or, further, the content of the microorganism group selected in the first selection step or the second selection step as an independent variable, the corresponding change rate of the amount of the specific substance the change rate of the specific substance The method according to any one of claims 1 to 3, further comprising a fifth selection step of calculating an Akaike information criterion (AIC) as a dependent variable and further selecting a microorganism group based on the obtained AIC value. The method for identifying a microorganism group described in the above.
前記赤池情報量規準の値に基づく選出が、
前記AICの値が最小になる独立変数の組み合わせとして微生物群を選出する、
前記AICの値が小さい順からm番目までの独立変数の組み合わせで過半数を超えて含まれる微生物群を選出する、又は
前記上位数をAICのヒストグラムにより決定された前記m番目までの独立変数の組み合わせで過半数を超えて含まれる微生物群を選出するものである(前記mは1以上の整数である)、請求項4に記載の微生物群の特定方法。
The selection based on the value of the Akaike information criterion,
Selecting a microorganism group as a combination of independent variables that minimizes the value of the AIC,
Selecting a group of microorganisms containing more than a majority by a combination of independent variables from the smallest AIC value to the m-th one, or a combination of the m-th independent variables determined by the histogram of the AIC for the higher number. The method for identifying a group of microorganisms according to claim 4, wherein a group of microorganisms contained in a majority is selected in (m is an integer of 1 or more).
更に、前記第一選出工程、前記第二選出工程、又は前記第五選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、回帰分析を行い、正相関または負相関のいずれか一方を示す微生物群を更に選出する第三選出工程を含む、請求項1〜5のいずれか一項に記載の微生物群の特定方法。   Further, the first selection step, the second selection step, or the content of the microorganisms selected in the fifth selection step as an independent variable, as a dependent variable the rate of change of the amount of the specific substance corresponding, The method for identifying a group of microorganisms according to any one of claims 1 to 5, further comprising a third selection step of performing a regression analysis to further select a group of microorganisms showing either a positive correlation or a negative correlation. 更に、前記第一選出工程又は前記第二選出工程で選出された前記微生物群の含有量を独立変数とし、対応する前記特定物質の量の変化速度を従属変数として、正則化項を備えた主成分回帰分析を行い、少なくとも正相関または負相関のいずれかを示す微生物群を更に選出する第四選出工程を含む、請求項1〜3のいずれか一項に記載の微生物群の特定方法。   Furthermore, a regularization term, wherein the content of the microorganism group selected in the first selection step or the second selection step is used as an independent variable, and the corresponding change rate of the amount of the specific substance is used as a dependent variable, The method for identifying a group of microorganisms according to any one of claims 1 to 3, further comprising a fourth selection step of performing a component regression analysis to further select a group of microorganisms exhibiting at least one of a positive correlation and a negative correlation. 前記主成分回帰分析に、スパース正則化による1段階主成分回帰モデルを用いる請求項7に記載の微生物群の特定方法。   The method according to claim 7, wherein a one-step principal component regression model based on sparse regularization is used for the principal component regression analysis. 前記罰則付き回帰に、L1正則化項付き回帰分析手法を用いる請求項1〜8のいずれか一項に記載の微生物群の特定方法。   The method for identifying a microorganism group according to any one of claims 1 to 8, wherein a regression analysis method with an L1 regularization term is used for the regression with penalties. 更に、以下の工程を含む、請求項1〜9のいずれか一項に記載の微生物群の特定方法:
前記微生物試料中の、特定物質の量の変化速度の値を取得する速度取得工程、
前記微生物試料に含まれる前記微生物の塩基配列を解読する解読工程、
解読された前記塩基配列から、前記微生物試料に含まれる微生物を微生物群に分類し、前記微生物試料中の前記微生物群の相対的含有割合を決定する割合決定工程、
前記決定された微生物群の相対的含有割合から、前記微生物試料中の前記微生物群の含有量を決定する量決定工程。
The method for identifying a microorganism group according to any one of claims 1 to 9, further comprising the following steps:
In the microorganism sample, a speed acquisition step of acquiring a value of a change rate of the amount of the specific substance,
Decoding step of decoding the base sequence of the microorganism contained in the microorganism sample,
From the decoded base sequence, classify the microorganisms contained in the microorganism sample into microorganism groups, a ratio determining step of determining the relative content of the microorganism group in the microorganism sample,
An amount determination step of determining the content of the microorganism group in the microorganism sample from the determined relative content ratio of the microorganism group.
前記塩基配列の解読に、シーケンサーを用いることを特徴とする請求項10に記載の微生物群の特定方法。   The method according to claim 10, wherein a sequencer is used for decoding the base sequence. 前記微生物が、生物学的排水処理に使用される微生物であり、
前記微生物試料は前記排水処理が行われる処理槽中の処理水であり、
前記変化速度は、前記処理水に対し測定される前記特定物質の量から算出され、
前記再標本化により作成した標本は同一の処理槽における2以上の時点での特定物質の量の変化速度及び、前記微生物群の含有量のデータを含む請求項1〜11のいずれか一項に記載の微生物群の特定方法。
The microorganism is a microorganism used for biological wastewater treatment,
The microorganism sample is treated water in a treatment tank where the wastewater treatment is performed,
The change rate is calculated from the amount of the specific substance measured for the treated water,
The specimen prepared by the re-sampling includes the rate of change of the amount of the specific substance at two or more times in the same treatment tank and data on the content of the microorganism group according to any one of claims 1 to 11. A method for identifying the microorganism group described in the above.
前記特定物質が、アンモニア、フェノール、チオシアン、及びチオ硫酸からなる群から選ばれるいずれか一種以上である、請求項1〜12のいずれか一項に記載の微生物群の特定方法。   The method for identifying a microorganism group according to any one of claims 1 to 12, wherein the specific substance is at least one selected from the group consisting of ammonia, phenol, thiocyanate, and thiosulfuric acid. 前記微生物が、アンモニアを酸化し亜硝酸を生成する微生物、フェノールを分解する微生物、チオシアンを分解する微生物、及びチオ硫酸を分解する微生物からなる群から選ばれるいずれか一以上である、請求項1〜13のいずれか一項に記載の微生物群の特定方法。   2. The microorganism according to claim 1, wherein the microorganism is at least one selected from the group consisting of a microorganism that oxidizes ammonia to produce nitrite, a microorganism that decomposes phenol, a microorganism that decomposes thiocyanate, and a microorganism that decomposes thiosulfate. 14. The method for identifying a microorganism group according to any one of items 13 to 13.
JP2019105590A 2018-06-07 2019-06-05 Method for identifying microbial communities Active JP7299485B2 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2018109667 2018-06-07
JP2018109667 2018-06-07
JP2018164921 2018-09-03
JP2018164921 2018-09-03

Publications (2)

Publication Number Publication Date
JP2020036579A true JP2020036579A (en) 2020-03-12
JP7299485B2 JP7299485B2 (en) 2023-06-28

Family

ID=69736997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019105590A Active JP7299485B2 (en) 2018-06-07 2019-06-05 Method for identifying microbial communities

Country Status (1)

Country Link
JP (1) JP7299485B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110218626A (en) * 2019-06-04 2019-09-10 上海理工大学 A kind of microbial identification system and method based on Logistic four parameter model and MASCA algorithm

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002101884A (en) * 2000-09-27 2002-04-09 Nippon Steel Corp Method for specifying microorganism as status indicator of water treatment process utilizing multiple microorganism and method for status diagnosis and reaction control of water treatment process
JP2004242578A (en) * 2003-02-13 2004-09-02 Nippon Steel Corp Bacterium existing in activated sludge of ammonia solution treatment plant
JP2009112924A (en) * 2007-11-05 2009-05-28 Kobelco Eco-Solutions Co Ltd Simulation method, simulation apparatus, biological treatment method and biological treatment apparatus
JP2015226896A (en) * 2014-05-02 2015-12-17 国立研究開発法人産業技術総合研究所 Wastewater treatment system and wastewater treatment method
JP2016195974A (en) * 2015-04-03 2016-11-24 住友化学株式会社 System for generating prediction rule, prediction system, method for generating prediction rule, and prediction method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002101884A (en) * 2000-09-27 2002-04-09 Nippon Steel Corp Method for specifying microorganism as status indicator of water treatment process utilizing multiple microorganism and method for status diagnosis and reaction control of water treatment process
JP2004242578A (en) * 2003-02-13 2004-09-02 Nippon Steel Corp Bacterium existing in activated sludge of ammonia solution treatment plant
JP2009112924A (en) * 2007-11-05 2009-05-28 Kobelco Eco-Solutions Co Ltd Simulation method, simulation apparatus, biological treatment method and biological treatment apparatus
JP2015226896A (en) * 2014-05-02 2015-12-17 国立研究開発法人産業技術総合研究所 Wastewater treatment system and wastewater treatment method
JP2016195974A (en) * 2015-04-03 2016-11-24 住友化学株式会社 System for generating prediction rule, prediction system, method for generating prediction rule, and prediction method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110218626A (en) * 2019-06-04 2019-09-10 上海理工大学 A kind of microbial identification system and method based on Logistic four parameter model and MASCA algorithm

Also Published As

Publication number Publication date
JP7299485B2 (en) 2023-06-28

Similar Documents

Publication Publication Date Title
Xia et al. Diversity and assembly patterns of activated sludge microbial communities: a review
Santillan et al. Frequency of disturbance alters diversity, function, and underlying assembly mechanisms of complex bacterial communities
CN107531528B (en) Prediction rule generation system, prediction rule generation method, and prediction method
Birtel et al. Estimating bacterial diversity for ecological studies: methods, metrics, and assumptions
Guo et al. Taxonomic precision of different hypervariable regions of 16S rRNA gene and annotation methods for functional bacterial groups in biological wastewater treatment
Ye et al. Machine learning-aided analyses of thousands of draft genomes reveal specific features of activated sludge processes
Michaud et al. C/N ratio-induced structural shift of bacterial communities inside lab-scale aquaculture biofilters
Staley et al. Application of metagenomics to assess microbial communities in water and other environmental matrices
Xiong et al. Comparable ecological processes govern the temporal succession of gut bacteria and microeukaryotes as shrimp aged
Levi et al. Microbial community diversity and composition varies with habitat characteristics and biofilm function in macrophyte‐rich streams
Awolusi et al. Principal component analysis for interaction of nitrifiers and wastewater environments at a full-scale activated sludge plant
Severin et al. Variable effects of dispersal on productivity of bacterial communities due to changes in functional trait composition
Wágner et al. Seasonal microbial community dynamics complicates the evaluation of filamentous bulking mitigation strategies in full-scale WRRFs
JP4279802B2 (en) Water treatment management method
JP7299485B2 (en) Method for identifying microbial communities
Hong et al. Shifts in the abundance and community composition of particle-associated and free-living Nitrospira across physicochemical gradients in the pearl river estuary
EP2181966A1 (en) Simulation method, simulation apparatus, biological treatment method and biological treatment apparatus
Dottorini et al. Full-scale activated sludge transplantation reveals a highly resilient community structure
Suarez et al. Disturbance-based management of ecosystem services and disservices in partial nitritation-anammox biofilms
US20180251808A1 (en) Method and Reagents for Detecting Contaminants in Oil and Gas Environments
Shi et al. Influence of hydraulic regimes and Cl 2/NH 3-N mass ratios on the bacterial structure and composition in an experimental flow cell chloraminated drinking water system
Cao et al. Metagenomic sequencing of activated sludge filamentous bacteria community using the Ion Torrent platform
D'Anteo et al. Nitrifying biomass characterization and monitoring during bioaugmentation in a membrane bioreactor
KR20230039090A (en) Method and System for Determination of Stability of Wastewater Treatment Process Using Machine Learning Model
Santillan et al. Microbiome assembly predictably shapes diversity across a range of disturbance frequencies

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230529

R151 Written notification of patent or utility model registration

Ref document number: 7299485

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151