JP4762088B2 - Process abnormality diagnosis device - Google Patents
Process abnormality diagnosis device Download PDFInfo
- Publication number
- JP4762088B2 JP4762088B2 JP2006235312A JP2006235312A JP4762088B2 JP 4762088 B2 JP4762088 B2 JP 4762088B2 JP 2006235312 A JP2006235312 A JP 2006235312A JP 2006235312 A JP2006235312 A JP 2006235312A JP 4762088 B2 JP4762088 B2 JP 4762088B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- statistic
- abnormality
- prior information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、特に上下水処理プロセス、排水処理プロセス、浄水プロセス、または化学プロセスなどのプロセス系の異常診断を行なうためのプロセス異常診断装置に関する。 The present invention relates to a process abnormality diagnosis apparatus for performing abnormality diagnosis of a process system such as a water and sewage treatment process, a wastewater treatment process, a water purification process, or a chemical process.
近年、上下水道の水量プロセスおよび水質プロセスや、化学プロセスなどのプロセス系においては、制御目的の多目的化や多様化に伴って、プロセス制御方法として、従来用いられていたPID制御方法やシーケンス制御方法に加えて、様々なアドバンスト制御方法(高度に改良された制御方法)が用いられるようになってきている。例えば、モデル予測制御に代表されるアドバンストな自動制御や、プロセスシミュレータを利用した自動制御などを適用した方法である。 In recent years, in process systems such as water and sewage water quantity processes, water quality processes, and chemical processes, PID control methods and sequence control methods that have been conventionally used as process control methods in accordance with the diversification and diversification of control purposes. In addition, various advanced control methods (highly improved control methods) have come to be used. For example, there is a method to which advanced automatic control represented by model predictive control or automatic control using a process simulator is applied.
これらのアドバンスト制御方法を実現するためには、通常状態(正常状態)だけでなく、様々な異常状態を検出し、それに対する対処の手順を明確にしておく必要がある。例えば、プロセスの運用管理においては、プロセスの状態や操作量を計測するためのセンサの故障、アクチュエータなどの機器の故障、突発的な負荷変動(突発外乱)、プロセスの処理異常、制御系の異常などの様々な異常状況に対して適切に対処する必要がある。すなわち、プロセス異常診断装置は、プロセス系において、各種のアドバンストな自動制御の実現やプロセスの完全な自動化の実現を支えるための重要な基礎技術である。 In order to realize these advanced control methods, it is necessary to detect not only the normal state (normal state) but also various abnormal states and clarify the procedure for dealing with them. For example, in process operation management, sensor failure for measuring process status and operation amount, failure of equipment such as actuator, sudden load fluctuation (sudden disturbance), process processing error, control system error It is necessary to appropriately deal with various abnormal situations such as That is, the process abnormality diagnosis apparatus is an important basic technology for supporting various advanced automatic controls and complete process automation in the process system.
このような観点から、異常診断機能を有するプラントワイド最適プロセス制御が提案されている(例えば、特許文献1を参照)。この異常診断機能は、最適制御を実現するために必要最小限の構成からなる。これに対して、よりアドバンストなプロセス異常診断方法としては、多変量統計解析手法を用いた多変量統計的プロセス監視(MSPC:Multi-Variate Statistical Process Control)と呼ばれる方法が知られている(例えば、非特許文献1を参照)。MSPCは、ケモメトリクス手法と呼ばれることもあり、化学プロセスの分野で発展してきた異常診断方法である。このMSPCの中で、最も基本的であり、かつよく利用される手法として、主成分分析(PCA:Principal Component Analysis)に基づいた異常診断方法が広く用いられている。 From such a viewpoint, plant-wide optimum process control having an abnormality diagnosis function has been proposed (see, for example, Patent Document 1). This abnormality diagnosis function has a minimum configuration necessary for realizing optimal control. On the other hand, as a more advanced process abnormality diagnosis method, a method called multivariate statistical process control (MSPC) using a multivariate statistical analysis method is known (for example, (Refer nonpatent literature 1). MSPC is sometimes called a chemometrics method, and is an abnormality diagnosis method developed in the field of chemical processes. Among the MSPCs, an abnormality diagnosis method based on principal component analysis (PCA) is widely used as the most basic and frequently used method.
PCAに基づいた異常診断では、通常、(1)プロセスの異常や状況変化の検出、(2)その要因となる計測変数の特定、(3)真の要因の特定、(4)その状況への対策という手順をとる。この一連の手順において、最初に行うプロセスの異常や状況変化の検出をできる限り素早く、また正確に行うことが、この方法の実用化に際してキーポイントとなる。この理由としては、(1)異常等の状況変化は時間が経過してから検出しても意味が無いことが多く、また時間が経過してからであれば、このような監視システムが無くても人間が状況変化を察知できる。また、(2)異常等の要因特定は、異常等のイベントが生じてから時間が経過してしまうとなかなか行うことができないが,異常等のイベントが生じた直後であれば比較的容易に行える。さらに、(3)異常等の要因特定処理は、正しく異常などの検出ができれば、一連の数学的処理によって行えるが、異常と正常の違いをその限界付近で精度よく見極めることは極めて困難である。 In abnormality diagnosis based on PCA, usually, (1) detection of process abnormality or situation change, (2) identification of measurement variable that causes it, (3) identification of true factor, (4) identification of the situation Take a procedure called countermeasures. In this series of procedures, it is a key point in practical use of this method to detect the abnormality of the process performed first and the change of the situation as quickly and accurately as possible. The reason for this is that (1) situation changes such as abnormalities are often meaningless even if detected after the passage of time, and there is no such monitoring system after the passage of time. Even humans can detect changes in the situation. (2) Although it is difficult to specify the cause of an abnormality or the like after an event such as an abnormality has occurred, it can be relatively easily performed immediately after the occurrence of an event such as an abnormality. . Furthermore, (3) a factor specifying process such as an abnormality can be performed by a series of mathematical processes if the abnormality can be detected correctly, but it is extremely difficult to accurately determine the difference between the abnormality and the normal near the limit.
このように、プロセス異常を素早く正確に検出することが重要であるにもかかわらず、従来のプロセス異常診断方法では、プロセス異常を正確に素早く行うことができない場合がしばしば発生する。
前述のようなPCAに基づいた異常診断方法においても、必ずしもプロセスの異常を正確に検出することができるとは限らない。異常検出の誤りのタイプには、大別して以下のような2タイプがある。即ち、本当(実際)は異常であるのに、正常であると診断する誤りのタイプ(以下、Aタイプ)と、本当(実際)は正常であるのに、異常であると診断する誤りのタイプ(以下、Bタイプ)がある。 Even in the abnormality diagnosis method based on PCA as described above, it is not always possible to accurately detect a process abnormality. There are two types of error detection errors as follows. That is, an error type (hereinafter referred to as A type) that is diagnosed as normal even though true (actual) is abnormal, and an error type that is diagnosed as abnormal even though true (actual) is normal (Hereinafter referred to as B type).
プロセスの異常診断において、正確な異常検出を行うには、単に異常検出に対する感度を高めるだけでは不十分であり、Aタイプの誤りとBタイプの誤りのトレードオフを適切に調整することが重要である。Aタイプの誤りとBタイプの誤りを共に極力減らすことが理想ではあるが、実際上では、正常と異常の境界域では、異常と正常の重複があることが多い。このため、通常では、Aタイプの誤りを減少させようとすると、Bタイプの誤りが増大し、逆にBタイプの誤りを減少させようとすると、Aタイプの誤りが増大することが確認されている。 In order to accurately detect abnormalities in process abnormality diagnosis, it is not sufficient to simply increase sensitivity to abnormality detection, and it is important to appropriately adjust the trade-off between type A errors and type B errors. is there. Although it is ideal to reduce both A-type errors and B-type errors as much as possible, in practice, there are many cases where there is an overlap between normal and abnormal at the boundary between normal and abnormal. For this reason, it has been confirmed that, normally, an attempt to reduce the A type error increases the B type error, and conversely an attempt to reduce the B type error increases the A type error. Yes.
そこで、本発明の目的は、Aタイプの誤りとBタイプの誤りのトレードオフの適正化を図り、正確な異常検出と共に、実際的なプロセス監視に適切な異常診断性能を実現したプロセス異常診断装置を提供することにある。 Therefore, an object of the present invention is to optimize the trade-off between an A type error and a B type error, and realize an abnormality diagnosis performance suitable for actual process monitoring together with accurate abnormality detection. Is to provide.
本発明の観点に従ったプロセス異常診断装置は、対象プロセスの状態または操作量を計測する計測手段と、前記計測手段から計測結果を示す時系列データを収集して保存するデータ保存手段と、前記データ保存手段に保存された前記時系列データから、プロセス監視モデルを作成するために使用し、前記対象プロセスの状態を示すプロセスデータを取り出すプロセスデータ抽出手段と、前記プロセスデータ抽出手段により取り出されたプロセスデータを正規化するための正規化モデルを生成する正規化モデル生成手段と、前記正規化モデルにより正規化されたプロセスデータに対する主成分分析方式によるプロセス監視モデルを構築して、当該正規化プロセスデータの異常検出用データとして、Q統計量またはホテリングT2統計量の統計量データを算出し、当該統計量データに対する前記計測手段により計測している計測項目(計測変数)の寄与量を算出するプロセス監視モデル手段と、前記統計量データに含まれる異常データと正常データとの割合に関する事前情報であって、前記寄与量に対する前記事前情報を生成する事前情報生成手段と、前記事前情報及び前記プロセス監視モデル手段により算出される前記統計量データの寄与量を使用して、前記統計量データの異常状態と正常状態の判定を行うための閾値を決定する閾値決定手段と、前記閾値決定手段により決定された閾値及び前記統計量データを使用して、前記対象プロセスの異常を診断する異常診断手段とを備えた構成である。 A process abnormality diagnosis apparatus according to an aspect of the present invention includes a measurement unit that measures a state or an operation amount of a target process, a data storage unit that collects and stores time-series data indicating measurement results from the measurement unit, and Process data extraction means for extracting process data indicating the state of the target process, used to create a process monitoring model from the time series data stored in the data storage means, and extracted by the process data extraction means A normalization model generation means for generating a normalization model for normalizing the process data, and a process monitoring model based on a principal component analysis method for the process data normalized by the normalization model is constructed, and the normalization process Q statistics or Hotelling T 2 statistics statistics for data anomaly detection A process monitoring model unit that calculates data and calculates a contribution amount of a measurement item (measurement variable) measured by the measurement unit with respect to the statistical data; and abnormal data and normal data included in the statistical data a priori information about the percentage, the a priori information generation means for generating the prior information for the contribution amount, using the contribution of the statistic data which is calculated by the preliminary information and the process monitor model means , A threshold value determining means for determining a threshold value for determining an abnormal state and a normal state of the statistical data, and using the threshold value determined by the threshold value determining means and the statistical data, the target process abnormality And an abnormality diagnosis means for diagnosing the above.
本発明の別の観点としては、正常データに異常データが混在している可能性があり、少なくとも半数以上の正常データを含み、かつ、異常データと正常データの識別をデータの絶対値に対する閾値で決定できるような時系列データに対して、異常データと正常データの割合を決定する手段として、明らかに正常なデータと明らかに異常データを予め除外して異常データと正常データの閾値の存在範囲を限定する閾値存在範囲限定手段と、前記閾値存在範囲限定手段で決定した閾値存在範囲のデータに対して、クラスタリング法を用いて閾値を設定する閾値設定手段とを備えたプロセス異常診断装置である。 As another aspect of the present invention, there is a possibility that abnormal data is mixed with normal data, including at least half of normal data, and distinguishing abnormal data from normal data using a threshold value for the absolute value of the data. As a means of determining the ratio of abnormal data and normal data for time series data that can be determined, the normal data and clearly abnormal data are excluded in advance, and the existence range of the threshold of abnormal data and normal data is determined. A process abnormality diagnosis apparatus comprising: a threshold existence range limiting unit for limiting; and a threshold setting unit configured to set a threshold for the data of the threshold existence range determined by the threshold existence range limiting unit using a clustering method.
この装置は、換言すれば正常データ及び異常データのクラスタリング決定装置である。本装置によると、正常データと異常データが混在する任意の時系列データを単純にクラスタリングで2分割する様な方法では、クラスタリングを適用する対象データの性質によっては適切な閾値とは考えられない様な閾値を設定することが生じうるのに対し、予め正常データと異常データを分離する閾値の存在領域を絞り込むことによって、最悪な場合でも閾値が存在し得る領域に閾値を設定することができ、より高信頼に異常データと正常データをクラスタリングすることができる。 In other words, this apparatus is a clustering determination apparatus for normal data and abnormal data. According to this device, a method that simply divides any time-series data in which normal data and abnormal data are mixed into two by clustering may not be considered an appropriate threshold depending on the nature of the target data to which clustering is applied. However, it is possible to set a threshold in an area where the threshold can exist even in the worst case by narrowing down the existing area of the threshold that separates normal data and abnormal data in advance. It is possible to cluster abnormal data and normal data with higher reliability.
特に、異常・正常を判断する閾値の設定やプロセスデータを正規化する正規化パラメータ(スケーリングパラメータ)の設定は、異常検出用データ(例:Q統計量やHotellingのT2統計量等)やスケーリングを行いたいデータ(例:プロセス計測データ)の中から異常データと正常データの割合を推定して異常データと正常データを適切にクラスタリングすることに帰着されるため、あるデータの異常データと正常データの割合を適切にクラスタリングすることができる。また、より具体的に、PCAを用いたMSPCによる異常診断システムにおいて、(1)異常・正常の判断に対する感度を調整するための、PCAでプロセスの異常診断や状況判断を行うQ統計量及びHotellingのT2統計量と呼ばれる統計量の閾値の設定方法、(2)異常の要因に対する感度を調整するためのプロセスデータを正規化するパラメータの設定方法を適切に行なうことができる。 In particular, the setting of a threshold value for judging abnormality / normality and the setting of a normalization parameter (scaling parameter) for normalizing process data include anomaly detection data (eg, Q statistic, Hotelling T2 statistic, etc.) and scaling. Since the ratio of abnormal data and normal data is estimated from the data (eg process measurement data) to be performed and the abnormal data and normal data are appropriately clustered, The proportions can be appropriately clustered. More specifically, in an abnormality diagnosis system based on MSPC using PCA, (1) Q statistics for performing process abnormality diagnosis and situation determination with PCA and Hotling for adjusting sensitivity to abnormality / normality determination (2) A parameter setting method for normalizing process data for adjusting sensitivity to abnormal factors can be appropriately performed.
本発明によれば、特にPCAに基づいた異常診断において、Aタイプの誤りとBタイプの誤りのトレードオフの適正化を図り、正確な異常検出と共に、実際的なプロセス監視に適切な異常診断性能を実現したプロセス異常診断装置を提供できる。 According to the present invention, particularly in abnormality diagnosis based on PCA, the trade-off between an A-type error and a B-type error is optimized, and an abnormality diagnosis performance suitable for actual process monitoring along with accurate abnormality detection. Can provide a process abnormality diagnostic apparatus.
以下図面を参照して、本発明の実施形態を説明する。 Embodiments of the present invention will be described below with reference to the drawings.
[第1の実施形態]
(システム構成)
図1は、第1の実施形態に関するプロセス異常診断装置の構成を示すブロック図である。
[First Embodiment]
(System configuration)
FIG. 1 is a block diagram illustrating a configuration of a process abnormality diagnosis apparatus according to the first embodiment.
本実施形態に関するプロセス異常診断装置は、例えば窒素及びリンの除去を目的とした下水処理プロセスなどのプロセス1を監視対象とするプロセス監視システムに用いられる。なお、本実施形態のプロセス異常診断装置は、監視対象のプロセス1としては、下水処理プロセスに限定されるものではなく、化学プロセス等の他のプロセスにも適用できる。
The process abnormality diagnosis apparatus according to the present embodiment is used in a process monitoring system that monitors
下水処理プロセス1は、最初沈澱池101、第1嫌気槽102、第2好気槽103、第3無酸素槽104、第4好気槽105、及び最終沈澱池106を有する。また、下水処理プロセス1は、引き抜き流量センサを含む最初沈澱池余剰汚泥引き抜きポンプ111、投入量センサを含む酢酸系有機物を供給する酢酸投入ポンプ112、ステップ流入量センサを含むステップ流入ポンプ113、供給空気流量センサを含む第2好気槽に酸素を供給するブロワ114、投入量センサを含む炭素源(有機物)を供給する炭素源投入ポンプ115、循環流量センサを含む循環ポンプ116、返送流量センサを含む返送汚泥ポンプ117、および供給空気流量センサを含む第4好気槽に酸素を供給するブロワ118、投入量センサを含む凝集剤投入ポンプ119、及び引き抜き流量センサを含む最終沈澱池余剰汚泥引き抜きポンプ1110のそれぞれを、アクチュエータおよびその操作量センサ群として有する。
The
さらに、下水処理プロセス1は、流入下水量を計測する下水流入量センサ121、流入下水に含まれる全窒素量を計測する流入TNセンサ122、流入下水に含まれる全リン量を計測する流入TPセンサ123、流入下水に含まれる有機物量を計測する流入UVセンサあるいは流入CODセンサ124、第1嫌気槽102のリン酸濃度を計測するリン酸センサ125、第2好気槽103のアンモニア濃度を計測するアンモニアセンサ126、第2好気槽103の溶存酸素濃度を計測するDOセンサ127、及び第3無酸素槽104の硝酸濃度を計測する硝酸センサ128を有する。
Further, the
また、下水処理プロセス1は、第1嫌気槽102、第2好気槽103、第3無酸素槽104、第4好気槽105の少なくとも1ヶ所の槽で活性汚泥量を計測するMLSSセンサ129、第4好気槽105のリン酸濃度を計測するリン酸センサ1210、第4好気槽105の溶存酸素濃度を計測するDOセンサ1211、第4好気槽105のアンモニア濃度を計測するアンモニアセンサ1212、最終沈澱池106から引き抜かれる汚泥量のMLSS濃度を計測するMLSSセンサ1213、最終沈澱池106から放流される放流水のSS濃度を計測するSSセンサ1214、放流下水量を計測する下水放流量センサ1215、放流下水に含まれる全窒素量を計測する放流TNセンサ1216、放流下水に含まれる全リン量を計測する放流TPセンサ1217、および放流下水に含まれる有機物量を計測する放流UVセンサあるいは放流CODセンサ1218のそれぞれをプロセスセンサとして有する。
The
ここで、前述の各種アクチュエータ111〜1110は、所定の周期で動作している。また、各種アクチュエータ111〜1110の操作量センサ群、および各種プロセスセンサ121〜1218は所定の周期で計測を行っている。
Here, the above-described
プロセス異常診断装置は、プロセス1に設けられている各種のセンサから、プロセスの状態又は操作量の計測結果であるプロセスデータ(時系列データ)を所定の周期で収集し、保存するプロセス計測データ収集・保存部2を有する。
The process abnormality diagnosis apparatus collects process data (time-series data), which is a measurement result of a process state or an operation amount, from various sensors provided in the
さらに、プロセス異常診断装置は、プロセス監視モデル構築用プロセスデータ抽出部(以下単にプロセスデータ抽出部と表記)3と、プロセス監視モデル構築・供給部(以下単にモデル構築部と表記)4と、プロセス異常判定基準設定・供給部(以下単に異常判定基準設定部と表記)5と、プロセス監視部6と、プロセス異常診断部7と、プロセス異常要因センサ特定部8と、プロセス異常要因推定部9、及びユーザインターフェース部10とを有する。
Furthermore, the process abnormality diagnosis apparatus includes a process data extraction unit for process monitoring model construction (hereinafter simply referred to as process data extraction part) 3, a process monitoring model construction / supply part (hereinafter simply referred to as model construction part) 4, An abnormality determination criterion setting / supply unit (hereinafter simply referred to as an abnormality determination criterion setting unit) 5, a
プロセスデータ抽出部3は、プロセス計測データ収集・保存部2に保存された各種の時系列データの中から、プロセス監視モデルを構築するために、主に正常状態(通常状態)のデータを中心とした所定の期間に亘るプロセスデータを抽出する。モデル構築部4は、プロセスデータ正規化モデル生成部41および異常検出モデル生成部42を含む。プロセスデータ正規化モデル生成部41は、プロセスデータ正規化用事前情報入力部(以下単に正規化用事前情報入力部と表記)411及びパラメータ決定部412を含む。
The process
正規化用事前情報入力部411は、プロセスデータ抽出部3で取り出した各種のプロセスデータ(xi(t),t=1,2,---l=所定の期間,i=1,2,---28)に対して、これらのプロセスデータに含まれる正常データと異常データの割合に対する事前情報を入力する。また、パラメータ決定部412は、正規化用事前情報入力部411から入力される事前情報に従って、各種のプロセスデータを正規化するための式[(xi(t)-ai)/bi, xi(t)はi番目のプロセスデータ]のシフトパラメータ(ai)とスケーリングパラメータ(bi)を決定する。シフトパラメータ(ai)は、i番目のプロセスデータに対するシフトを表す定数である。また、スケーリングパラメータ(bi)は、i番目のプロセスデータに対するスケーリングを表す定数である。
The prior
異常検出モデル生成部42は、プロセスデータ正規化モデル生成部41で定義した正規化モデルによりプロセスデータを正規化した正規化プロセスデータに対して、前述の主成分分析(PCA)を施す。これにより、PCAのローディング行列(負荷行列)とスコア行列を算出し、これらを用いて定義されるQ統計量およびホテリング(Hotelling)のT2統計量を計算するための計算式(モデル)を設定する。
The abnormality detection
異常判定基準設定部5は、閾値決定用事前情報入力部51及び閾値決定部52を含む。閾値決定用事前情報入力部51は、プロセスデータ正規化モデル生成部41の正規化モデルにより正規化された正規化プロセスデータを、異常検出モデル生成部42により生成したQ統計量およびホテリングのT2統計量の計算式(モデル)を使用することで、当該各統計量に含まれる正常データと異常データの割合に対する事前情報を入力する。閾値決定部52は、閾値決定用事前情報入力部51から入力される事前情報に従って、Q統計量およびホテリングのT2統計量における正常と異常の閾値を設定する。
The abnormality determination
プロセス監視部6は、モデル構築部4から供給された正規化モデルとプロセス監視モデルとを用いて、プロセス計測データ収集・保存部2から、例えばオンラインで供給されるプロセスデータに対してQ統計量およびホテリングのT2統計量を計算して、プロセス1の正常状態または異常状態を監視する。プロセス異常診断部7は、プロセス監視部6で監視しているQ統計量およびホテリングのT2統計量に対して、異常判定基準設定部5で設定した異常判定の閾値を用いて、プロセス計測データ収集・保存部2から供給されたプロセスデータの正常または異常を判断する。
The
さらに、プロセス異常要因センサ特定部8は、プロセス異常診断部7によりプロセス1が通常状態(正常)でないと診断されたときに、その要因となる少なくとも一つ以上のセンサ11〜1Nを特定する。プロセス異常要因推定部9は、プロセス異常要因センサ特定部8によって特定された情報に基づいて、予め知識処理などを行っておくことにより,何故そのようなセンサ情報が出力されるかを推定する。ユーザインターフェース部10は、各種の情報を表示出力するための表示部を含み、プロセス監視部6、プロセス異常診断部7、プロセス異常要因センサ特定部8、プロセス異常要因推定部9からの少なくとも一つ以上の情報をオペレータに通知する。
Furthermore, when the process
(第1の実施形態の作用)
以下、本実施形態の作用効果を説明する。
(Operation of the first embodiment)
Hereinafter, the effect of this embodiment is demonstrated.
まず、下水処理プロセスなどのプロセス1では、各種のセンサ11〜1Nにより、所定の周期でプロセスの状態や操作に関する情報が計測されている。プロセス計測データ収集・保存部2は、当該各種のセンサ11〜1Nからの計測結果であるプロセスデータを所定の周期で収集し、予め決められたフォーマットに従って時系列データとして保存する。
First, in the
プロセスデータ抽出部3は、プロセス計測データ収集・保存部2に保存された各種の時系列データの中から、プロセス監視モデルを構築するために、主に正常状態(通常状態)のデータを中心とした所定の期間に亘る一連のプロセスデータを抽出する。換言すれば、プロセスデータ抽出部3は、例えばプロセス1の操作量やプロセス量の正常範囲に属しているデータが主要な構成要素となるように、一連のプロセスデータを取り出す。
The process
ここで、プロセスデータ抽出部3において、予め正常データのみを取り出すことは、不可能あるいは困難な場合が多い。即ち、予め正常データのみを取り出すことができるということは、少なくとも、プロセス監視モデル構築用データに対しては異常診断が完了し、正常であると判断されていることを意味するからである。従って、プロセスデータ抽出部3は、予め異常データと正常データの割合に関して推測された事前情報を取得して、ある程度の異常データを含むプロセスデータを抽出する。この事前情報としては、例えば、以下のような情報である。
Here, in the process
(1)抽出したデータの中には、殆ど異常データは含まれておらず、含まれていたとしても数点程度である。 (1) The extracted data contains almost no abnormal data. Even if it is included, there are only a few points.
(2)抽出したデータの中には、異常データは少し含まれていて、大体X%程度である。 (2) The extracted data includes a little abnormal data, which is about X%.
(3)抽出したデータの中には、異常データは数%以上含まれているが、割合に関しては不明である。 (3) The extracted data contains abnormal data of several percent or more, but the ratio is unknown.
プロセスデータ抽出部3は、以上のような事前情報(1)〜(3)を取得できない場合には、抽出したデータの中の異常データと正常データの割合に関しては不明という判断を実行する。但し、抽出したデータの中に、例えば数十%以上の異常データが含まれている場合、プロセス監視モデル自身を構築することができなくなるので、プロセスデータ抽出部3は、主たる構成要素が正常データであるプロセスデータを抽出する必要がある。また、抽出するデータの中には、正常動作範囲内のなるべく多様なデータが混在していることが好ましい。
If the prior data (1) to (3) as described above cannot be acquired, the process
さらに、プロセスデータの中に、欠測データや異常データ(アウトライアも含む)、あるいはノイズがのっているデータが含まれている場合には、プロセスデータ抽出部3は、予めこれらのデータに前処理を実行する前処理機能を有することが好ましい。アウトライアとは、伝送異常などにより時々突発的に生じる異常データを意味する。前処理機能としては、具体的には、例えば、ノイズを除去するためのFIRフィルタ機能やIIRフィルタ機能などのデジタルフィルタ機能である。アウトライアに対しては、メジアンフィルタ機能やウェーブレットフィルタ機能などを用いて、データの中から本当のプロセスデータであると思われるデータを抽出する。
Furthermore, if the process data includes missing data, abnormal data (including outliers), or data with noise, the process
プロセスデータ抽出部3は、抽出したプロセスデータをモデル構築部4に送る。モデル構築部4では、プロセスデータ正規化モデル生成部41は、各種センサ11〜1Nにより計測されたプロセスデータを正規化するための計算式(正規化モデル)を、プロセスデータ抽出部3で抽出したプロセスデータを用いて決定する。このとき、正規化モデル生成部41では、まず、正規化用事前情報入力部411が、プロセスデータ抽出部3で取り出した各種のプロセスデータに関する事前情報を入力する。この事前情報は、プロセスデータに含まれる正常データと異常データの割合に対する情報である。正規化用事前情報入力部411は、例えば図2に示すような画面情報を、ユーザインターフェース部10の表示部に表示して、プロセス監視モデルを構築するユーザに、例えば図2に示すような4つの事前情報(a)〜(d)から選択させる。ここで、ユーザが事前情報(d)を選択した場合には、さらに、プロセスデータの中に混在している異常データの概略的な割合(%)を同時に入力することを促す。
The process
パラメータ決定部412は、正規化用事前情報入力部411から入力される事前情報に基づいて、各種のプロセスデータの正規化に必要なシフトパラメータ(ai)、及びスケーリングパラメータ(bi)の値を、以下に示す手順により決定する。
The
正規化用事前情報入力部411から、図2に示す事前情報(a)が入力されると、事前情報は何も無いため、パラメータ決定部412は、なるべく異常値に左右されないロバストな正規化手法を採用した場合のパラメータを決定する。
When the prior information (a) shown in FIG. 2 is input from the normalization prior
具体的には、ロバスト標本平均、あるいはメジアンとロバスト標本標準偏差を用いる。ここで、ロバスト標本平均やロバスト標本標準偏差とは、予めプロセスデータの最大値の付近及び最小値の付近の例えば0.5%程度のデータを取り除いた上で求めた標本平均と標本標準偏差である。従って、パラメータ決定部412は、予め上下限値付近のいくつかのデータを除いた上で、シフトパラメータ(ai)を「ai=1/N(Σxi(k))」というプロセスデータの平均値、あるいは全データの中央値(メジアン)と決定する。ここで、メジアンは、それ自身異常値に影響されにくいロバストな統計量なのでそのまま用いる。ロバスト標本平均またはメジアンのいずれかを用いるかは、データの基準値を0にすることをより優先するか、またはロバスト性をより優先するかの判断に基づく。
Specifically, a robust sample average or median and robust sample standard deviation is used. Here, the robust sample average and the robust sample standard deviation are the sample average and the sample standard deviation obtained after removing, for example, about 0.5% of data in the vicinity of the maximum value and the minimum value of the process data in advance. is there. Therefore, the
統計量として標本平均は、メジアンよりもロバスト性が著しく低い。これは、次の様な簡単な例から明白である。例えば、「A=1.5, 2.3, 1.3, 1.8, 2.0, 1.7, 1.9, 2.1, 2.2, 1.6, 1.4」というプロセスデータがあり、何らかの理由で異常データ「10」が混入して、「Ab=1.5, 2.3, 1.3, 1.8, 2.0, 1.7, 1.9, 2.1, 10, 1.6, 1.4」という様に計測されたと想定する。この場合、本当のデータAの標本平均は「1.8」であり、メジアンも「1.8」である。しかし、計測されたデータAbの標本平均は、「2.5」となるが、メジアンは「1.8」のままである。このように、標本平均という統計量は、メジアンという統計量よりもロバスト性が弱く、異常データに対して大きく左右される。これを避けるために、プロセスデータの上下限付近のいくつかのデータを取り除いて計算するロバスト標本平均を用いることができる。しかし、上下限付近の何%のデータを取り除くかを、異常データに対する事前情報なしに決定することは困難である。この点においてメジアンは、極端に多くの異常データが存在したり、上限側あるいは下限側に極端に多量の異常データが存在しない限りはあまり異常データに左右されない。しかし、そもそもスケーリングでは、スケーリングされた後のデータの平均がおおよそゼロになる様に変換することが目的であるため、この点ではロバスト標本平均を用いる方が好ましい。このため、設計者がロバスト性を優先するか、スケーリング後の基準値を0に近くすることを優先するかによって、メジアンあるいはロバスト標本平均を使うことを決定することになる。 As a statistic, the sample mean is significantly less robust than the median. This is clear from the following simple example. For example, there is process data of “A = 1.5, 2.3, 1.3, 1.8, 2.0, 1.7, 1.9, 2.1, 2.2, 1.6, 1.4”, and abnormal data “10” is mixed for some reason, and “Ab = 1.5 , 2.3, 1.3, 1.8, 2.0, 1.7, 1.9, 2.1, 10, 1.6, 1.4 ”. In this case, the sample average of the true data A is “1.8”, and the median is also “1.8”. However, the sample average of the measured data Ab is “2.5”, but the median remains “1.8”. As described above, the statistical quantity called the sample average is less robust than the statistical quantity called the median, and greatly depends on the abnormal data. To avoid this, it is possible to use a robust sample average that is calculated by removing some data near the upper and lower limits of the process data. However, it is difficult to determine what percentage of data near the upper and lower limits is to be removed without prior information on abnormal data. In this respect, the median is not greatly affected by abnormal data unless there is an extremely large amount of abnormal data or an extremely large amount of abnormal data on the upper limit side or the lower limit side. However, since the purpose of scaling is to convert so that the average of the scaled data becomes approximately zero, it is preferable to use a robust sample average in this respect. For this reason, it is decided to use the median or the robust sample average depending on whether the designer gives priority to robustness or gives priority to making the scaled reference value close to zero.
一方、スケーリングパラメータは,予め上下限付近のいくつかのデータを除いた上で、下記式(1)に示すような標本標準偏差を採用する。
ここで、分散(標準偏差の2乗)を計算する場合には、不偏分散とするために「1/N」ではなく「1/(N−1)」とすることが多い。但し、不偏分散が最も良い推定であるとは限らないので、「1/N」または「1/(N−1)」とする。また、不偏分散の平方根は、不偏標準偏差ではなく、不偏標準偏差とするために別の係数を乗ずる場合もある。但し、データ数が十分に多ければ、結果として得られる値には殆ど差はない。 Here, when calculating the variance (square of the standard deviation), it is often set to “1 / (N−1)” instead of “1 / N” in order to obtain unbiased variance. However, since unbiased variance is not always the best estimate, it is set to “1 / N” or “1 / (N−1)”. Further, the square root of the unbiased variance may be multiplied by another coefficient in order to obtain an unbiased standard deviation instead of the unbiased standard deviation. However, if the number of data is sufficiently large, there is almost no difference in the resulting values.
前記の標本標準偏差を採用する理由は次の通りである。そもそもスケーリングとは、各種のセンサ11〜1Nで計測される様な異なる物理量を、同じ尺度で扱うためにデータの動作範囲を揃えるものである。従って、各センサ11〜1Nで計測している物理量の動作範囲が分かっているのであれば、その動作範囲(データレンジ)をそのままスケーリングパラメータとすることが一番素直であり、最も良い方法であると考えられる。しかし、データレンジという統計量は、異常値に対して極めて敏感である。即ち、少しでも異常データが混入すると、その値によってデータレンジは大幅に変化してしまう。例えば、前記の例では、プロセスデータAのデータレンジは1(最小値1.3,最大値2.3)であるが、Abのデータレンジは8.7(最小値1.3,最大値10)となってしまう。このために、前述した様に、プロセスデータの上下限付近のいくつかのデータを取り除いて計算することが考えられるが、上下限付近の何%のデータを取り除くかを、異常データに対する事前情報なしに決定することは困難である。
The reason for adopting the sample standard deviation is as follows. In the first place, the scaling is to align the operation range of data in order to handle different physical quantities as measured by
このようなデータレンジと比較すると、標本標準偏差はロバストな統計量であり、データの動作範囲を示す一つの指標となるため、通常スケーリングパラメータとしてよく利用される。ここで、仮にデータが正規分布に従うならば、標本標準偏差の3倍で99.7%のデータをカバーするので、標本標準偏差の3倍程度がデータレンジに相当する。しかし、データが正規分布に従うかどうかは分からないので、データレンジと標本標準偏差の対応関係は一般に不明である。但し、スケーリングは複数の異なる物理量同士を同じ指標で見るために実施するものであるから、標本標準偏差とデータレンジを対応づける必要は特にない。また、標本標準偏差は、データレンジと比較するとロバストな統計量であるが、異常データにある程度左右されるため、好ましくはロバスト標本標準偏差を用いる。 Compared to such a data range, the sample standard deviation is a robust statistic and is an index indicating the operating range of data, so it is often used as a normal scaling parameter. Here, if the data follow a normal distribution, 99.7% of the data is covered by 3 times the sample standard deviation, so about 3 times the sample standard deviation corresponds to the data range. However, since it is not known whether the data follows a normal distribution, the correspondence between the data range and the sample standard deviation is generally unknown. However, since the scaling is performed in order to see a plurality of different physical quantities with the same index, it is not particularly necessary to associate the sample standard deviation with the data range. In addition, the sample standard deviation is a robust statistic compared to the data range. However, since it depends to some extent on abnormal data, the robust sample standard deviation is preferably used.
また仮に、正規化用事前情報入力部411から、図2に示す事前情報(b)が入力されると、パラメータ決定部412は、予め殆ど全てのデータが正常であることが分かっているため、その情報(b)を利用してパラメータを設定する。具体的には、パラメータ決定部412は、シフトパラメータについては、前述した理由により、予め殆ど全てのデータが正常であるとわかっているため、標本平均を用いる。但し、多少の異常値が混入していることを想定して、上下限付近の例えば0.5%程度のデータを除いたロバスト標本平均を用いても良い。
Further, if the prior information (b) shown in FIG. 2 is input from the normalization prior
一方、パラメータ決定部412は、スケーリングパラメータについては、予め殆ど全てのデータが正常であるということが分かっているので、念のためプロセスデータの最大値の付近及び最小値の付近の例えば0.5%程度のデータを取り除いた上で、そのプロセスデータの動作範囲を直接スケーリングパラメータとする。
On the other hand, since the
また仮に、正規化用事前情報入力部411から、図2に示す事前情報(c)が入力されると、パラメータ決定部412は、異常データと正常データが混在し,異常データの割合は分からないため、その情報(c)を利用して、予め正常データと異常データの閾値をクラスタリングの方法を用いて決定しておく。クラスタリングとは、複数の異なる集合(クラス)に属していると考えられるデータが混在している場合に、各々のデータがどのクラスに属するかを決定する方法の総称である。この場合、正常データと異常データの2つのクラスに属しているデータが混在していると想定されるので、2クラスのクラスタリング手法を用いる。
Further, if the prior information (c) shown in FIG. 2 is input from the normalization prior
ここで、事前情報(a)の場合にも、このような2クラスのクラスタリング手法を適用できる様に思われるが、実際にはそうではない。この理由は、2クラスのクラスタリング手法は、正常データと異常データの2つのクラスのデータが混在している状況下で効果的に働くものであるため、もし事前情報が何もない場合に、2クラスのクラスタリング手法を適用した場合、データに殆ど異常データが混入していない場合に正常データを強引に2つに分割してしまうことになるためである。 Here, even in the case of prior information (a), it seems that such a two-class clustering method can be applied, but this is not the case. This is because the two-class clustering method works effectively in a situation where normal data and abnormal data are mixed, so if there is no prior information, 2 This is because when the class clustering method is applied, normal data is forcibly divided into two when abnormal data is hardly mixed in the data.
このようなクラスタリング手法は、様々な方法が開発されているので、任意の適切なものを用いれば良いが、例えば、「大津の閾値決定法」と呼ばれる一種の判別分析手法を用いることができる。「大津の閾値決定法」とは、2つの異なるクラスに属するデータが混合している際、2つのクラス同士のクラス間分散が最大となる様に閾値を設定する方法である。換言すれば、各々のクラスのクラス内の分散の平均値が、最小になる様に閾値を設定する方法である。すなわち、2つのクラスに属するデータを、お互いになるべく遠ざけるように閾値を決定する方法である。具体的には、以下の式(2)を最小化する様な閾値を求めることである。
ここで、ω1とω2は、各々、クラス1とクラス2に属するデータの割合(クラス発生確率)である。σ1とσ2は、各々、クラス1とクラス2のクラス内の分散である。これを、図3に示す。
Here, ω1 and ω2 are the ratios (class occurrence probabilities) of data belonging to
この大津の閾値決定法は、2つのクラスのデータが各々正規分布に従っているという条件、2つのクラスに属するデータ割合に著しい差がないという条件、さらに2つのクラスの正規分布の分散が等しいという条件下での閾値の最尤推定値となることが示されている。ここで、最尤推定値とは、統計的推定法に含まれる最尤推定法による推定値である。 This Otsu threshold determination method is based on the condition that the two classes of data each follow a normal distribution, the condition that there is no significant difference in the proportion of data belonging to the two classes, and the condition that the variances of the normal distributions of the two classes are equal. It is shown that this is the maximum likelihood estimate of the threshold below. Here, the maximum likelihood estimated value is an estimated value by the maximum likelihood estimation method included in the statistical estimation method.
通常では、正常データの割合は、異常データの割合よりかなり大きいため、前記の2つのクラスに属するデータ割合に著しい差がないという条件を満たさない。このように2つのクラスに属するデータ割合に著しい差がある場合には、前記式(2)の代わりに、以下の式(3)を最小化することが好ましい。
ここで、「ω1・σ1+ω2・σ2」の最小化は、「log(ω1・σ1+ω2・σ2)」の最小化と同じ事であることに注意すれば、式(3)は式(2)に対して、「-ω1・log(ω1) -ω2・log(ω2)」という補正項を加えたものになっている。これを以下では、修正大津の閾値決定法と呼ぶことにする。 Note that the minimization of “ω1 · σ1 + ω2 · σ2” is the same as the minimization of “log (ω1 · σ1 + ω2 · σ2)”. Thus, a correction term “-ω1 · log (ω1) -ω2 · log (ω2)” is added. Hereinafter, this is referred to as a modified Otsu threshold determination method.
このように、大津の閾値決定法や修正大津の閾値決定法などの2クラスのクラスタリング法を適用することによって、正常データと異常データの閾値を決定することができる。パラメータ決定部412は、この決定を、各種のセンサ11〜1Nで計測される全ての計測項目に対して実行する。図4は、この様にして正常データと異常データを分類する閾値410を決定の概念を示す図である。図4に示すように、クラスタリング手法によって、プロセス監視モデル構築用のプロセスデータは、正常データと異常データに暫定的に分類できるので、正常データの部分400のみを用いて、正常データの標本平均をシフトパラメータとし、正常データの標本標準偏差をスケーリングパラメータとする。
In this way, by applying a two-class clustering method such as the Otsu threshold determination method or the modified Otsu threshold determination method, the threshold values for normal data and abnormal data can be determined. The
なお、プロセスデータが上限方向と下限方向の両方向に異常が出る可能性のあるデータである場合には、予めプロセスデータの絶対値を計算した上で、大津の閾値決定法や修正大津の閾値決定法などの2クラスのクラスタリング法を適用する。この場合、結果として、図5に示す様なイメージで正常データと異常データを分類できる。 If the process data is data that may cause anomalies in both the upper limit and lower limit directions, calculate the absolute value of the process data in advance, and then determine the threshold value for Otsu and the threshold value for modified Otsu. Two classes of clustering methods such as the method are applied. In this case, as a result, normal data and abnormal data can be classified with an image as shown in FIG.
さらに、正規化用事前情報入力部411から、図2に示す事前情報(d)が入力されると、パラメータ決定部412は、正常データが混在している異常データの大よその割合を認識できる。この場合には、前述したように、異常データの割合が追加で入力される。例えば、異常データの割合が5%と入力された場合には、もしプロセスデータが片側方向にしか異常が出ない様なデータである場合には、プロセスデータの最大値(あるいは最小値)から5%のデータを含む点を閾値とする(図4の410を参照)。
Furthermore, when the prior information (d) shown in FIG. 2 is input from the normalization prior
また、プロセスデータが両側方向に異常が出る可能性のあるデータである場合には、プロセスデータの最大値および最小値から各々2.5%のデータを含む点を閾値とする(図5の510、511を参照)。このような操作により、正常データの範囲500を決定することができるため、正常データと見なされたデータの標本平均をシフトパラメータとし、標本標準偏差をスケーリングパラメータとする。
In addition, when the process data is data that may be abnormal in both directions, the threshold value is a point that includes 2.5% of data from the maximum value and the minimum value of the process data (510 in FIG. 5). 511). As a result of such an operation, the
以上に手順により、パラメータ決定部412は、正規化用事前情報入力部411から入力される事前情報に基づいて、各種のプロセスデータの正規化に必要なシフトパラメータ(ai)及びスケーリングパラメータ(bi)の値を決定する。即ち、プロセスデータ正規化モデル生成部41は、プロセスデータの事前情報に基づいて、正規化モデルによりプロセスデータを正規化する。
According to the procedure described above, the
ここで、プロセスデータの適切な正規化と、異常診断との関係について簡単に説明する。正規化という手段は、通常では、値が全く異なる複数の物理量を同じ尺度で評価できるように変換する手段である。この操作が適切でないと、複数の物理量を同じ尺度で評価できないことになり、結果として、異常検出や異常検出をした後の異常要因となるセンサ(=物理量)の特定を誤ることになる。例えば、Aという物理量の動作範囲が0〜10であり、Bという物理量の動作範囲が0〜100である場合に、Bを「1/10」にすることにより、両者を同じ尺度で評価できる。しかし、仮に正規化を間違えて、Bをそのまま用いてしまった場合には、AはBに対して非常に小さく評価されることになる。したがって、Aの量で異常が生じた場合でも、異常が検出されなくなることが多くなる。また、異常が検出された場合であっても、Bの方が大きい動作範囲であるため、ほとんどの場合、その異常要因はBと判断されることになる。このため、プロセスデータの適切な正規化は、異常検出精度や異常要因特定精度を向上させる上で極めて重要である。 Here, the relationship between appropriate normalization of process data and abnormality diagnosis will be briefly described. The means of normalization is usually means for converting a plurality of physical quantities having completely different values so that they can be evaluated on the same scale. If this operation is not appropriate, a plurality of physical quantities cannot be evaluated on the same scale, and as a result, the detection of an abnormality or a sensor (= physical quantity) that becomes an abnormal factor after detecting an abnormality is erroneous. For example, when the operation range of the physical quantity A is 0 to 10 and the operation range of the physical quantity B is 0 to 100, both can be evaluated on the same scale by setting B to “1/10”. However, if normalization is mistaken and B is used as it is, A will be evaluated very small with respect to B. Therefore, even when an abnormality occurs in the amount of A, the abnormality is often not detected. Even when an abnormality is detected, since B is a larger operating range, the abnormality factor is determined to be B in most cases. For this reason, proper normalization of process data is extremely important in improving the abnormality detection accuracy and the abnormality factor identification accuracy.
次に、モデル構築部4では、異常検出モデル生成部42は、プロセスデータ正規化モデル生成部41によりプロセス監視モデル構築用のプロセスデータを正規化するパラメータが決定されると、当該パラメータを用いてプロセス監視モデル構築用のプロセスデータを正規化する。そして、異常検出モデル生成部42は、当該正規化データを利用して、異常検出用モデルを構築する。
Next, in the
具体的には、異常検出モデル生成部42は、当該正規化データを横(行)方向に各種センサ11〜1Nに対応する変量を設定し、縦(列)方向に時間を考えた行列Xに設定する。次に、PCAを用いて、以下の式(4)に示す様にデータ分解を実行する。
前記式(4)は、元のデータ行列を、図6に示すように分解することと等価である。このように分解されたデータに対して、前記のローディング行列Pが、Q統計量やホテリングのT2統計量を計算するための元のモデルとなる。このローディング行列Pを、プロセス監視モデルと考えても良いが、実際には、異常検出を行うQ統計量とホテリングのT2統計量は次式(5),(6)で計算される。
ここで、∧は、PCA(主成分分析)による各主成分の分散を対角要素として持つ行列であり、分散を正規化していることを意味する。また、Iは適当なサイズの単位行列である。また、x(t)は、行列Xのt番目の要素である。実際のプロセス監視では、このx(t)がオンラインで計測されてくるプロセスデータに置き換わって計算されるため、前記式(5),(6)が異常検出モデル生成部42で生成されるモデルである。
Here, ∧ is a matrix having the variance of each principal component by PCA (principal component analysis) as a diagonal element, and means that the variance is normalized. I is a unit matrix of an appropriate size. X (t) is the t-th element of the matrix X. In actual process monitoring, this x (t) is calculated by replacing it with process data that is measured online, so the above equations (5) and (6) are models generated by the abnormality detection
ここで、前記式(5),(6)で定義されるQ統計量とホテリングのT2統計量の持つ意味について、図7を参照して簡単に説明する。 Here, the meaning of the Q statistic defined by the equations (5) and (6) and the Hotelling T 2 statistic will be briefly described with reference to FIG.
PCAを用いた異常診断方法は、複数の計測変数に含まれる相関情報を利用して異常検出を行う方法である。通常では、プロセスで計測される各変数の間には、何らかの相関があり、相互に完全に独立な情報は少ない。図7は、便宜的に2変数の場合を想定し、2つの変数X1とX2が相関を有する場合、X1の計測データとX2の計測データをX1−X2平面上にプロットした場合を示す。 The abnormality diagnosis method using PCA is a method of performing abnormality detection using correlation information included in a plurality of measurement variables. Normally, there is some correlation between the variables measured in the process, and there is little information that is completely independent of each other. FIG. 7 shows a case where two variables X1 and X2 are correlated for convenience, and the measurement data of X1 and the measurement data of X2 are plotted on the X1-X2 plane.
ここで、例えば、仮にX1のセンサが故障した場合、この相関関係が崩れるため、三角で示した様な点にデータがプロットされる。このように、相関関係を表す相関軸からのずれを表す量が、Q統計量の持つ意味である。一方、例えば、プロセスの負荷が急激に高くなった場合などでは、X1とX2は相関を持っているので、X1とX2の値がともに大きくなる(あるいは小さくなる)という事が生じる。このような場合、四角で表した様な点にデータがプロットされる。 Here, for example, if the X1 sensor fails, the correlation is lost, so data is plotted at points as indicated by triangles. Thus, the quantity representing the deviation from the correlation axis representing the correlation is the meaning of the Q statistic. On the other hand, for example, when the process load suddenly increases, X1 and X2 have a correlation, so that the values of X1 and X2 both increase (or decrease). In such a case, the data is plotted at points as represented by squares.
即ち、相関関係は崩れないが、通常の動作範囲以上に値が大きくなったり、小さくなったりする量を測る指標がホテリングのT2統計量である。換言すれば、複数項目のデータ分布のデータが、分布しない方向への乖離を表す指標がQ統計量である。また、複数項目のデータ分布のデータが、分布している方向への分散を表す量がホテリングのT2統計量である。 That is, although the correlation does not collapse, an index for measuring the amount by which the value increases or decreases beyond the normal operating range is the Hotelling T 2 statistic. In other words, the Q statistic is an index representing a deviation in a direction in which the data distribution of a plurality of items is not distributed. Further, the amount of distribution in the direction in which the data of the data distribution of a plurality of items is distributed is the Hotelling T 2 statistic.
以上要するに、モデル構築部4では、プロセス正規化モデル生成部41は、正規化用のシフトパラメータとスケーリングパラメータの値を決定する。異常検出モデル生成部42は、異常検出を行う際に必要となる計算モデルを決定し、正規化の計算式、Q統計量およびホテリングのT2統計量の計算式を生成する。
In short, in the
次に、異常判定基準設定部5は、異常検出モデルである前記式(5),(6)を使用して異常判定を行うための閾値を決定する。この際、プロセス監視モデル構築用データである正規化データXを用いて、前記式(5),(6)により計算したプロセス監視モデル構築用データのQ統計量およびホテリングのT2統計量を利用する。以下、異常判定基準設定部5による異常判定基準設定の方法を説明する。
Next, the abnormality determination
まず、閾値決定用事前情報入力部51は、異常検出モデル生成部42により生成したQ統計量およびホテリングのT2統計量の計算式(モデル)を使用することで、当該各統計量に含まれる正常データと異常データの割合に対する事前情報を入力する。なお、Q統計量やホテリングのT2統計量は、異常検出を行うための統計量であるため、これについての事前情報を取得できない場合には、プロセスデータに関する事前情報で代用してもよい。代用する場合には、事前情報入力部411から入力される事前情報をそのまま利用することになる。
First, the threshold determination prior
また、プロセスデータではなく、直接的にQ統計量やホテリングのT2統計量に関する事前情報を入力したい場合には、図2に示したものと同様の入力用画面情報をQ統計量とホテリングのT2統計量に対しても作成し、事前情報入力部411と全く同様の方法で、当該事前情報を入力する。プロセスデータとは異なり、通常では、Q統計量やホテリングのT2統計量に関する事前情報が明確に分かっていることは少ないが、プロセスで計測されるデータがいくつであっても、当該各統計情報はそれぞれ1つの計2つのデータになるので、プロセス監視モデル構築用データの正規化データXを用いて計算したQ統計量とホテリングのT2統計量をプロットすることによって判断しても良い。
Further, instead of the process data directly if you want to enter a pre-information on T 2 statistic Q statistic and Hotelling is similar input screen information to that shown in FIG. 2 Q statistic and Hotelling A T 2 statistic is also created, and the prior information is input in the same manner as the prior
このような可視化を行えば、異常データが混在してそうか否かなどの定性的な情報を取得できることが多い。正規化を行う場合のプロセスデータに対しても可視化を実行して事前情報を取得しても良いが、通常では、プロセスデータは、各種センサ11〜1Nで計測される項目に応じて少なくとも数十変数以上のデータである。従って、このようなデータに対して可視化を実行して、事前情報を得ることは非現実的である。これに対して、Q統計量やホテリングのT2統計量は、プロセスデータの計測変数の数がいくつであっても常に各々1つのデータであるので、可視化によって事前情報を取得しやすい。当該事前情報を取得できるのであれば、閾値決定用事前情報入力部51は、事前情報入力部411と同様の処理を実行する。
If such visualization is performed, it is often possible to acquire qualitative information such as whether or not abnormal data is mixed. Although prior information may be acquired by executing visualization on process data in the case of normalization, the process data is usually at least several tens according to items measured by
次に、閾値決定部52は、閾値決定用事前情報入力部51から入力される事前情報に従って、異常判定のための閾値を決定する。
Next, the
まず、事前情報が何も無い場合(Q統計量やホテリングのT2統計量に関する情報は不明)には、閾値決定部52は、デフォルトの設定法として、Q統計量の統計的信頼限界値とホテリングのT2統計量に関する統計的信頼限界値(公知の計算式により算出)を用いる。また、事前情報として、殆ど全てのデータが正常であるという情報が入力された場合には、閾値決定部52は、原理的に、プロセス監視モデル構築用データの正規化データXを用いて計算したQ統計量やホテリングのT2統計量の最大値を閾値として決定する。但し、ごく僅かに異常データが含まれている可能性があるので、例えば99%信頼区間の考え方を採用して、Q統計量およびホテリングのT2統計量の最大値から上位1%の値を閾値として決定する方法の方が好ましい。
First, when there is no prior information (information regarding the Q statistic and the Hotelling T 2 statistic is unknown), the
さらに、事前情報として、異常データと正常データが混在しているが異常データの割合は不明であるという情報が入力された場合には、閾値決定部52は、パラメータ決定部412と同様に、例えば、修正大津の閾値決定法などを用いて、Q統計量およびホテリングのT2統計量の閾値を決定する。これは、単に修正大津の閾値決定法などのクラスタリングアルゴリズムを適用するデータを、プロセスデータではなく、正規化データXを用いて計算したQ統計量およびホテリングのT2統計量のデータに変更するだけで実行できる。
Further, when information indicating that abnormal data and normal data are mixed but the ratio of abnormal data is unknown is input as prior information, the
また、事前情報として、異常データと正常データが混在しており、異常データの大よその割合は分かっているという情報が入力された場合には、閾値決定部52は、パラメータ決定部412と同様の処理を実行する。即ち、閾値決定部52は、正規化データXを用いて計算したQ統計量やホテリングのT2統計量のデータの上位α%(αは事前情報として入力した値)に該当する各値を、各々の統計量の閾値として決定する。
In addition, when information indicating that abnormal data and normal data are mixed and the approximate ratio of abnormal data is known is input as prior information, the
以上要するに、異常判定基準設定部5では、閾値決定部52は、閾値決定用事前情報入力部51から入力される事前情報に従って、プロセス1の正常と異常を判断する閾値を決定する。以上の一連の操作は、プロセス監視モデルを構築し、異常判断の基準を設定するためのものであり、通常はオフラインで行われる。
In short, in the abnormality determination
一方、以下で示す作用は、オンラインで実行される。まず、プロセス監視部6は、モデル構築部4で構築したプロセス監視モデルを使用して、プロセス1の監視を実行する。プロセス監視部6は、監視するプロセス変数として、各種センサ11〜1Nそのものではなく、これらの各センサから新たに生成されたQ統計量やホテリングのT2統計量である。ここでは、少なくとも、これらのいずれか一方を監視する。通常では、両方を監視し、必要に応じて他の変数、例えば各センサ11〜1Nそのものや、PCAによって計算されたスコアを平面上にプロットして監視することもできる。
On the other hand, the following actions are executed online. First, the
プロセス監視部6は、前述したQ統計量とホテリングのT2統計量を、プロセス計測変数収集・保存部2からオンラインで送信される各種センサ11〜1Nの値(ある時刻のこれらのセンサ値からなるベクトルをXnew(t)とする)と、モデル構築部4で構築したプロセス監視モデルを用いて、下記式(7),(8)に示すような計算を実行する。
これらの式(7),(8)と前記式(5),(6)の相違は、単にQ統計量とホテリングのT2統計量を計算するために入力するデータが異なるだけである。オンラインのプロセス監視では、既に構築したプロセス監視モデルに対して、単にオンラインで計測したプロセスデータを入力すればよい。このように計算されるQ(Xnew(t))やT2(Xnew(t))はスカラー値であるので、この値をトレンドグラフとして表示することで監視する事ができる。この際、異常判定基準設定部5で設定したQ統計量やホテリングのT2統計量の閾値(限界レベル:CL)も同時にプロットすることもできる。
The difference between these formulas (7) and (8) and the above formulas (5) and (6) is simply the difference in the data input to calculate the Q statistic and the Hotelling T 2 statistic. In online process monitoring, it is only necessary to input process data measured online to a process monitoring model that has already been established. Since Q (Xnew (t)) and T 2 (Xnew (t)) calculated in this way are scalar values, they can be monitored by displaying these values as a trend graph. In this case, failure determination reference Q set by the
次に、プロセス異常診断部7は、Q統計量やホテリングのT2統計量が、異常判定基準設定部5で設定したQ統計量やホテリングのT2統計量の限界レベル(CL)を超えた場合に異常と判断する。この際、異常判定基準設定部5で設定したQ統計量やホテリングのT2統計量の限界レベル以外に、例えば、別途警告レベル(WL)や注意レベル(NL)を設けた異常診断ルールに基づいた判断でもよい。
Next, the process error
具体的には、プロセス異常診断部7は、例えば、警告レベル(WL)を限界レベルの「2/3」と設定し、注意レベル(NL)を限界レベルの「1/3」と設定して、以下の様な診断ルールで正常と異常を判断する。即ち、(1)1点がCLを超えた時、(2)連続する3点のうち、2点以上がWLを超えた時、(3)連続する5点のうち4点以上が1σ(標準偏差)を超えた時、(4)連続する8点のデータが単調増加あるいは単調減少する場合、(5) 非ランダム性を持つなんらかのパターンが現れた場合に、プロセス異常診断部7は、異常と判断する。
Specifically, for example, the process
ここで、前記の様な複雑な異常診断ルールが必要でない場合や、これによってBタイプの誤り(後述する図13,14を参照)が増加してしまうようであれば、単純に異常判定基準設定部5で設定したQ統計量やホテリングのT2統計量の閾値を限界レベル(CL)として異常診断を行なう。要するに、プロセス異常診断部7は、以上の手順によってプロセス1の正常状態と異常状態を判断する。
Here, if a complicated abnormality diagnosis rule as described above is not necessary, or if a B type error (see FIGS. 13 and 14 to be described later) increases due to this, simply set the abnormality criterion. the threshold T 2 statistic Q statistic and Hotelling set in
次に、プロセス異常要因センサ特定部8は、プロセス異常診断部7によりプロセス1が異常状態であると診断されたときに、図8に示すように、異常と判断されたQ統計量あるいはホテリングのT2統計量に対する寄与プロットを行うことにより、その要因となるセンサを特定する。図8は、各バーグラフが各種のセンサ11〜1Nに対応しており、このバーの長さが最も長いものが異常である要因となるセンサ(ここでは、硝酸センサ)を示している。但し、ここでは、必ずしも図8に示す様に一つの要因だけが大きくなっているとは限らない。例えば、図9に示すように、いくつかのセンサが通常でないと考えられる場合がある。このような場合には、プロセス異常要因センサ特定部8は、複数のセンサを要因として特定する。
Next, when the process
次に、プロセス異常要因推定部9は、プロセス異常要因センサ特定部8によって特定されたセンサの情報に基づいて、プロセス1の本当の異常要因を推定する。プロセス異常要因推定部9は、具体的には、例えば過去の経験やシナリオシミュレーションなどに基づいて構築したエキスパートシステムとして推論を実行する。
Next, the process abnormality
具体的には、プロセス異常要因推定部9は、図8に示すように、一つのセンサ(ここでは硝酸センサ)だけが傑出して大きな値を示している場合には、そのセンサの故障であると推定する。また、センサによっては、故障信号を出すことができる様に構成されているものも多いので、そこから得られる故障信号との論理和あるいは論理積などを取ることによって、そのセンサの異常を推定する。図9は、アンモニアを除去する硝化菌という微生物が活動しなくなった硝化阻害と呼ばれる現象が生じた場合の図である。この場合、硝化が行わなくなるために、アンモニアの濃度が高くなり、また硝化菌が活動しなくなるので、その活動に必要な酸素量が小さくなり、結果として溶存酸素濃度が高くなっている。このようなプロセス知識が予め用意されていれば、プロセス異常要因推定部9は、「アンモニア濃度が高く、かつ溶存酸素濃度が高い場合には硝化阻害の可能性がある」などのエキスパートルールに基づいて、その要因を推定する。
Specifically, as shown in FIG. 8, the process abnormality
ユーザインターフェース部10は、プロセス監視部6、プロセス異常診断部7、プロセス異常要因センサ特定部8、プロセス異常要因推定部9からの少なくとも一つ以上の情報をオペレータに通知する。
The
(第1の実施形態の効果)
まず、前述したように、従来のPCAに基づいた異常診断方法における問題点を、図13から図16を参照して具体的に説明する。
(Effects of the first embodiment)
First, as described above, problems in the conventional abnormality diagnosis method based on PCA will be specifically described with reference to FIGS.
PCAに基づいた異常診断方法における誤り異常検出として、本当(実際)は異常であるのに、正常であると診断する誤りのAタイプと、本当(実際)は正常であるのに、異常であると診断する誤りのBタイプの2タイプがある。図13は、正常データと異常データの分布の重なりと、誤りタイプ(A,B)の関係を示す図である。図14は、誤りタイプの特徴を概念的に示す図である。即ち、Aタイプは、精度不十分である第2種誤り検出に相当する。また、Bタイプは、異常誤り検出である第1種誤り検出に相当する。 Error detection in an abnormality diagnosis method based on PCA is true (actual) is abnormal but type A of an error to diagnose as normal, and true (actual) is normal but abnormal There are two types of error B type. FIG. 13 is a diagram showing the relationship between the distribution of normal data and abnormal data and the error type (A, B). FIG. 14 is a diagram conceptually showing the characteristics of the error type. That is, the A type corresponds to type 2 error detection with insufficient accuracy. The B type corresponds to the first type error detection which is an abnormal error detection.
さらに、図15は、異常診断アルゴリズムを適用した場合の流入アンモニア濃度の時系列データを示す図であり、Bタイプの第1種誤り検出例である。即ち、図15に示す異常部分190は、実際には異常ではなく、異常診断アルゴリズムにより誤って異常であると判断された例である。また、図16は、異常診断アルゴリズムを適用した場合に、異常データ200を見落とたAタイプの第2種誤り検出例である。即ち、実際のプロセスデータからは明らかに異常と判断できるデータ200を正常であると判断する例であり、異常検出精度が十分でない場合である。
FIG. 15 is a diagram showing time-series data of the inflow ammonia concentration when the abnormality diagnosis algorithm is applied, and is a B type first type error detection example. That is, the
本実施形態のシステムであれば、多変量統計解析を用いた多変量統計的プロセス監視(MSPC)の異常検出の閾値を、プロセスデータに対する事前情報に応じて適切に決定することにより、前記のAタイプ及びBタイプの2タイプの異常検出の誤りを減少することが可能である。従って、MSPCによるプロセス異常監視の性能を向上させることができる。 In the system according to the present embodiment, the threshold value for detecting anomalies in multivariate statistical process monitoring (MSPC) using multivariate statistical analysis is appropriately determined according to prior information for process data, and the above-described A It is possible to reduce two types of abnormality detection errors of type B and type B. Therefore, the process abnormality monitoring performance by MSPC can be improved.
また、MSPCでプロセス監視モデルを構築する際に、複数のプロセスデータを正規化するパラメータをプロセスデータに対する事前情報に応じて適切に決定することにより、異常検出の誤りに加えて、異常要因を特定する際の要因変数の誤りを減少させることができる。従って、MSPCによるプロセス異常監視の性能を向上させることができる。 In addition, when building a process monitoring model with MSPC, by appropriately determining parameters for normalizing multiple process data according to prior information on the process data, the cause of the abnormality is identified It is possible to reduce the error of the factor variable when doing. Therefore, the process abnormality monitoring performance by MSPC can be improved.
換言すれば、MSPCによるプロセス監視(プロセス異常診断)において、異常検出の閾値をプロセスデータに対する事前知識の量と質に応じて適切に決定することにより、Aタイプの誤りとBタイプの誤りのトレードオフの適正化を図ることができ、異常検出性能を向上させることができる。 In other words, in process monitoring (process abnormality diagnosis) by MSPC, the threshold of abnormality detection is appropriately determined according to the amount and quality of prior knowledge of process data, thereby allowing trade between A type error and B type error. It is possible to optimize the off state and improve the abnormality detection performance.
[第2の実施形態]
第2の実施形態に関するシステムは、基本的な構成としては、図1に示すものと同様である。本実施形態のシステムは、前述の第1の実施形態のシステムと比較して、異常検出モデル生成部42、閾値決定部52、プロセス監視部6、プロセス異常診断部7、及びプロセス異常要因センサ特定部8のそれぞれの作用が異なる。以下、異なる部分の作用を中心として説明し、同様の作用については説明を省略する。
[Second Embodiment]
The system according to the second embodiment is the same as that shown in FIG. 1 as a basic configuration. Compared with the system of the first embodiment described above, the system of this embodiment is an abnormality detection
まず、本実施形態のシステムにおいて、プロセス計測データ収集・保存部2、プロセスデータ抽出部3、モデル構築部4におけるプロセスデータ正規化モデル生成部41の各作用は、前述の第1の実施形態のシステムの場合と同様である。
First, in the system of the present embodiment, the processes of the process measurement data collection /
異常検出モデル生成部42は、プロセスデータ正規化モデル生成部41によりプロセス監視モデル構築用のプロセスデータを正規化するパラメータが決定されると、当該パラメータを用いてプロセス監視モデル構築用のプロセスデータを正規化する。そして、異常検出モデル生成部42は、当該正規化データを利用して、異常検出用モデルを構築する。
When the parameter for normalizing process data for constructing the process monitoring model is determined by the process data normalization
具体的には、異常検出モデル生成部42は、当該正規化データを横(行)方向に各種センサ11〜1Nに対応する変量を設定し、縦(列)方向に時間を考えた行列Xに設定する。次に、前述と同様に、PCAを用いて、前記式(5),(6)に示す様に、Q統計量とホテリングのT2統計量を求める。さらに、本実施形態では、異常検出モデル生成部42は、Q統計量とホテリングのT2統計量に対する各種センサ11〜1Nの寄与量を下記式(9),(10),(11)により計算する。
ここで、x(t,n)は、変数xのn番目の要素の時刻tにおける値という意味であり、nは各種センサ11〜1Nに対応する。また、F(:,n)の表記は、行列Fのn行目を取り出すことを意味する。P(:,n)についても同様である。
Here, x (t, n) means the value at the time t of the nth element of the variable x, and n corresponds to the
この寄与量を計算する計算式(モデル)が、本実施形態でのプロセス監視モデルに相当する。通常のMSPCでは、前記式(10),(11)に示すような寄与量を計算する式は、通常では、次の様に用いられる。まず、前記式(5),(6)で表されるQ統計量やホテリングのT2統計量により異常の検出を実行し、仮に異常が生じていた場合には、前記式(10),(11)に示すような寄与量計算により、どのセンサで計測しているプロセスデータがその異常に寄与しているかを判断する。 A calculation formula (model) for calculating the contribution amount corresponds to the process monitoring model in the present embodiment. In a normal MSPC, the equations for calculating the contribution amount as shown in the equations (10) and (11) are usually used as follows. First, the equation (5), and executes fault detection by T 2 statistic Q statistic and Hotelling represented by (6), if the if abnormality has occurred, the equation (10), ( It is determined by which sensor process data measured by the contribution amount calculation as shown in 11) contributes to the abnormality.
これに対して、本実施形態は、この寄与量自身に対して閾値を設定して異常検出を行なう方式である。以下、図10を参照して説明する。 On the other hand, the present embodiment is a method for detecting an abnormality by setting a threshold value for the contribution amount itself. Hereinafter, a description will be given with reference to FIG.
図10は、2変数の場合においてQ統計量に対する寄与量の概念を示す図である。図10において、符号70はホテリングのT2統計量を示し、符号71はQ統計量を示す。Q統計量は、前述したように、データが分布しない方向への乖離を表す指標である。Q統計量自身は、図10に示すように、X1成分による寄与量72とX2成分による寄与量73とに分解できる。通常のMSPCでは、前記式(5)のQ統計量で異常を検出した場合に、前記式(10)で各成分に分解して異常要因を推定しているが、寄与量自身は異常を検出するかしないかに関わらず、前記式(10)で表される寄与量は常に計算できることがわかる。従って、常に前記式(10)で寄与量を計算しておけば、それに対して直接閾値を設定して異常検出を行っても良いことが容易にわかる。
FIG. 10 is a diagram showing the concept of the contribution amount to the Q statistic in the case of two variables. In FIG. 10,
さらに、本実施形態の方式であれば、Q統計量の寄与量を全ての変数に対して総和をとったものがQ統計量になるので、総和をとったQ統計量よりもそれを構成する要素で異常検出を行った方が、より精度の高い異常検出が行なうことができる。但し、この場合には、Q統計量やホテリングのT2統計量ではなく、その寄与量で診断を行うことになるため、寄与量に対して適切な閾値を設定しないと、却って異常診断性能が劣化することになる場合がある。本実施形態の方式は、このような場合にも適切な閾値を設定することを狙ったものである。 Furthermore, in the method of the present embodiment, the sum of the contribution amount of the Q statistic for all the variables becomes the Q statistic, so that it is configured rather than the summed Q statistic. More accurate abnormality detection can be performed by performing abnormality detection on elements. However, in this case, diagnosis is performed using the contribution amount, not the Q statistic or the hotelling T 2 statistic. Therefore, unless an appropriate threshold is set for the contribution amount, the abnormality diagnosis performance is It may deteriorate. The method of the present embodiment aims to set an appropriate threshold value even in such a case.
以上要するに、異常検出モデル生成部42は、プロセスデータ正規化モデル生成部41により正規化用のシフトパラメータとスケーリングパラメータの値が決定されると、異常検出を行う際に必要となる計算モデル(P,∧)を決定する。さらに、これらの値を用いた正規化の計算式、Q統計量、およびホテリングのT2統計量の計算式を生成する。
In short, when the process data normalization
次に、異常判定基準設定部5は、異常検出モデルである前記式(10),(11)を使用して異常判定を行うための閾値を決定する。この際、プロセス監視モデル構築用データである正規化データXを用いて、前記式(10),(11)により計算したプロセス監視モデル構築用データのQ統計量およびホテリングのT2統計量の寄与量を利用する。
Next, the abnormality determination
まず、閾値決定用事前情報入力部51は、Q統計量およびホテリングのT2統計量の寄与量に関する事前情報を入力する。なお、この寄与量に関する事前情報を取得できない場合には、プロセスデータに関する事前情報や、Q統計量やホテリングのT2統計量に対する事前情報で代替させてもよい。
First, the threshold determination prior
次に、閾値決定部52は、閾値決定用事前情報入力部51から入力される事前情報に従って、異常判定のための閾値を決定する。
Next, the
まず、事前情報が何も無い場合(Q統計量やホテリングのT2統計量に関する情報は不明)には、閾値決定部52は、デフォルトの設定法として、Q統計量の統計的信頼限界値とホテリングのT2統計量に関する統計的信頼限界値(公知の計算式により算出)を用いる。この場合、Q統計量とホテリングのT2統計量の閾値を計算する。通常のMSPCによる異常診断では、この閾値を越えた場合に異常を検出し、要因特定を行う場合にのみ寄与量を計算する。例えば、(i)最大の寄与量を持つものを要因候補としたり、(ii)寄与量の値が上位3つのものを要因候補としたり、(iii)寄与量の値が閾値に対してある割合を超えるものを異常要因候補とする。
First, when there is no prior information (information regarding the Q statistic and the Hotelling T 2 statistic is unknown), the
ここでは、通常実施される方法(iii)の考え方に従って、Q統計量とホテリングのT2統計量の閾値の例えば80%を閾値として決定する。通常の異常診断では、ある変数の寄与量が閾値の80%を超えていたとしても、寄与量の総和であるQ統計量あるいはホテリングのT2統計量自身が閾値を超えていなければ異常と判断されないことである。一方、寄与量に基づいて異常診断を実行する場合、Q統計量あるいはホテリングのT2統計量自身が閾値を超えていなくても、当該統計量に対する寄与量が閾値のある割合を超えていれば異常と診断される。このため、各種センサ11〜1Nの計測する変数で生じている異常に対する感度を高くすることができるメリットが得られる。 Here, for example, 80% of the threshold values of the Q statistic and the Hotelling T 2 statistic are determined as the threshold according to the concept of the method (iii) that is normally performed. In normal abnormality diagnosis, even the contribution of certain variables has exceeded 80% of the threshold, abnormality determination unless T 2 statistic own Q statistic or Hotelling is the sum of the contribution amount exceeds the threshold value Is not. On the other hand, when performing an abnormality diagnosis based on the contribution amount, even if the Q statistic or the hoteling T 2 statistic itself does not exceed the threshold, the contribution to the statistic exceeds a certain ratio of the threshold. Diagnosed as abnormal. For this reason, the merit which can raise the sensitivity with respect to the abnormality which has arisen with the variable which various sensors 11-1N measure is acquired.
但し、通常のMSPCの異常診断では、各変数が閾値の80%などのある割合を超えなくても、総和である統計量が閾値を超えていれば異常と判断される。このため、ここで記載している方法は、各変数が少しずつ正常からずれていているというような状況に対する異常検出精度は却って劣化する場合がある。このような状況に対処するためには、両方の手法を併用すればよい。 However, in normal MSPC abnormality diagnosis, even if each variable does not exceed a certain ratio such as 80% of the threshold value, it is determined as abnormal if the total statistic exceeds the threshold value. For this reason, the method described here may deteriorate the abnormality detection accuracy for a situation where each variable is slightly deviated from normal. In order to cope with such a situation, both methods may be used together.
次に、閾値決定用事前情報入力部51から、事前情報として、殆ど全てのデータが正常であるという情報が入力された場合には、閾値決定部52は、原理的に、プロセス監視モデル構築用データの正規化データXを用いて計算したQ統計量の寄与量や、ホテリングのT2統計量の寄与量の最大値を閾値として決定する。但し、ごく僅かに異常データが含まれている可能性があるので、例えば99%信頼区間の考え方を採用して、Q統計量の寄与量およびホテリングのT2統計量の寄与量の最大値から上位1%の値を閾値として決定する方法の方が好ましい。この場合、各種センサ11〜1Nの各寄与量毎に最大値が求まるが、事前情報として殆ど全てのデータが正常であるということが予め知られているため、寄与量毎に決定した最大値の中で最も大きい値を閾値として採用する。
Next, when information indicating that almost all data is normal is input as prior information from the threshold determination prior
さらに、事前情報として、異常データと正常データが混在しているが異常データの割合は不明であるという情報が入力された場合には、閾値決定部52は、例えば、修正大津の閾値決定法などを用いて、Q統計量の寄与量およびホテリングのT2統計量の寄与量の閾値を決定する。但し、異常データと正常データが混合していることが事前情報として入力されている場合でも、各種センサ11〜1Nの全ての計測変数に対して異常データと正常データが混合しているか否かは判断できない。このため、異常データが混合していない計測変数があった場合、その閾値を修正大津の閾値決定法などのクラスタリング法で決定すると、正常データを2分割してしまうことになり、適切な閾値が決定されない。しかし、各種センサ11〜1Nのいずれかの計測変数には、異常データが含まれているはずなので、各計測変数毎に修正大津の閾値決定法などの方法で決定した閾値の中のいずれかの閾値は、正常データと異常データを必ず分離しているはずである。各計測変数毎に決定した閾値の中の最大値は、必ず正常データと異常データを分離している。従って、各計測変数毎に修正大津の閾値決定法などの方法で決定した閾値の中の最大のものを閾値として採用する。
Furthermore, when information indicating that abnormal data and normal data are mixed but the ratio of abnormal data is unknown is input as prior information, the threshold
また、事前情報として、異常データと正常データが混在しており、異常データの大よその割合は分かっているという情報が入力された場合には、閾値決定部52は、正規化データXを用いて計算したQ統計量の寄与量やホテリングのT2統計量の寄与量のデータの上位α%(αは事前情報として入力した値)に該当する各値を、予め計算する。仮に、異常データと正常データの割合が全ての計測変数に対してわかっているのであれば、各計測変数毎に計算した閾値を適用してもよい。全ての計測変数に対してではなく、いずれかの計測変数にはおおよそα%の異常が含まれているというような事前情報が得られている場合には、計測変数毎に決定した閾値の中の最大値を閾値として採用する。
Further, when information indicating that abnormal data and normal data are mixed and the approximate ratio of abnormal data is known is input as prior information, the threshold
以上要するに、異常判定基準設定部5では、閾値決定部52は、閾値決定用事前情報入力部51から入力される事前情報に従って、プロセス1の正常と異常を判断する閾値を決定する。以上の一連の操作は、プロセス監視モデルを構築し、異常判断の基準を設定するためのものであり、通常はオフラインで行われる。
In short, in the abnormality determination
一方、以下で示す作用は、オンラインで実行される。まず、プロセス監視部6は、モデル構築部4で構築したプロセス監視モデルを使用して、プロセス1の監視を実行する。プロセス監視部6は、監視するプロセス変数として、各種センサ11〜1Nから新たに生成されたQ統計量の寄与量やホテリングのT2統計量の寄与量を直接監視する。即ち、プロセス監視部6は、下記式(12),(13),(14)を使用して、Q統計量の寄与量およびホテリングのT2統計量の寄与量を監視する。
即ち、プロセスの監視対象がQ統計量やホテリングのT2統計量ではなく、それらの寄与量である。 That is, the process monitoring target is not a Q statistic or a Hotelling T 2 statistic, but a contribution amount thereof.
次に、プロセス異常診断部7は、Q統計量やホテリングのT2統計量のいずれかの寄与量が閾値を超えた場合に異常と判断する。プロセス異常要因センサ特定部8は、プロセス異常診断部7により寄与量に基づいて異常診断がなされているため、閾値を超えた寄与量に対応する各種センサ11〜1Nの各計測変数が要因センサであると直接的に特定する。プロセス異常要因推定部9及びユーザインターフェース部10の動作は、前述の第1の実施形態と全く同様である。
Next, the process
以上のように第2の実施形態によれば、通常では、第1に異常の検出、第2に異常要因の特定という手順をとる方法を変更し、異常要因を特定するために計算する量(寄与量)を直接異常検出に用いる方法を採用している。この場合、その異常検出のための閾値を、プロセスデータに対する事前情報に応じて適切に決定することにより、異常検出の誤りを減少できる。これにより、MSPCによるプロセス異常監視の性能を向上させる事が可能となる。換言すれば、特にある特定のプロセス計測変数において生じている異常検出性能を向上させることができる。 As described above, according to the second embodiment, usually, the method of firstly detecting an abnormality and secondly specifying the abnormality factor is changed, and the amount calculated to specify the abnormality factor ( (Contribution amount) is directly used for abnormality detection. In this case, errors in abnormality detection can be reduced by appropriately determining the threshold value for detecting the abnormality according to prior information on the process data. As a result, the performance of process abnormality monitoring by MSPC can be improved. In other words, it is possible to improve the abnormality detection performance that occurs particularly in a specific process measurement variable.
[第3の実施形態]
第3の実施形態に関するシステムは、基本的な構成としては、図1に示すものと同様である。本実施形態のシステムは、前述の第1の実施形態のシステムと比較して、異常検出モデル生成部42、閾値決定部52、プロセス監視部6、プロセス異常診断部7、及びプロセス異常要因センサ特定部8のそれぞれの作用が異なる。以下、異なる部分の作用を中心として説明し、動揺の作用については説明を省略する。
[Third Embodiment]
The system according to the third embodiment is the same as that shown in FIG. 1 as a basic configuration. Compared with the system of the first embodiment described above, the system of this embodiment is an abnormality detection
まず、本実施形態のシステムにおいて、プロセス計測データ収集・保存部2、プロセスデータ抽出部3、モデル構築部4におけるプロセスデータ正規化モデル生成部41の各作用は、前述の第1の実施形態のシステムの場合と同様である。
First, in the system of the present embodiment, the processes of the process measurement data collection /
異常検出モデル生成部42は、プロセスデータ正規化モデル生成部41によりプロセス監視モデル構築用のプロセスデータを正規化するパラメータが決定されると、当該パラメータを用いてプロセス監視モデル構築用のプロセスデータを正規化する。そして、異常検出モデル生成部42は、当該正規化データを利用して、異常検出用モデルを構築する。
When the parameter for normalizing process data for constructing the process monitoring model is determined by the process data normalization
具体的には、異常検出モデル生成部42は、当該正規化データを横(行)方向に各種センサ11〜1Nに対応する変量を設定し、縦(列)方向に時間を考えた行列Xに設定する。次に、前述と同様に、PCAを用いて、前記式(5),(6)に示す様に、Q統計量とホテリングのT2統計量を求める。これでプロセス監視モデル構築が完了したが,本実施形態では、異常検出モデル生成部42は、前記式(5),(6)に示すQ統計量とホテリングのT2統計量を、各々離散ウェーブレット変換を使って複数の周波数帯域毎のデータに分解する。これは、離散ウェーブレット変換によるQ統計量とホテリングのT2統計量の分解と、分解された各々のデータを逆離散ウェーブレット変換で再構成することによって実現できる。この操作は、結果的にデジタルフィルタの形式で実現できるので、そのフィルタを「Wi,i=1,---,p(pはデータ分割数)」とすると、ウェーブレットによって分解された各統計量は,例えば,下記式(15),(16)のように表現できる。
この周波数帯域毎に分解された計算式(モデル)が、本実施形態でのプロセス監視モデルに相当する。図11は、Q統計量を離散ウェーブレット変換により複数の周波数帯域毎のデータに分解した具体例を示す図である。同図(A)は、Q統計量のグラフである。同図(B)〜(F)はそれぞれ、5つの周波数帯域に分割されたQ統計量を示す図である。ここで、図11(D)は、元のQ統計量を近似する図であり、最も遅い変化を表している。それ以外の同図(B),(C),(E),(F)はそれぞれ、平均がほぼゼロになるより速い周波数帯域のQ統計量の分解データを示す図である。図11において、横軸は速い周波数帯域から遅い周波数帯域の順に付けられている。 The calculation formula (model) decomposed for each frequency band corresponds to the process monitoring model in the present embodiment. FIG. 11 is a diagram illustrating a specific example in which the Q statistic is decomposed into data for each of a plurality of frequency bands by the discrete wavelet transform. FIG. 4A is a graph of Q statistics. FIGS. 7B to 7F are diagrams showing Q statistics divided into five frequency bands. Here, FIG. 11D is a diagram that approximates the original Q statistic, and represents the slowest change. The other figures (B), (C), (E), and (F) are diagrams showing the decomposition data of the Q statistics in the faster frequency band where the average becomes almost zero, respectively. In FIG. 11, the horizontal axis is assigned in order from the fast frequency band to the slow frequency band.
このように周波数帯域毎にデータを分解する意義は、以下の通りである。 The significance of decomposing data for each frequency band as described above is as follows.
図12は、Q統計量やホテリングのT2統計量ではないが、ある元データを、離散ウェーブレット変換を適用して分解した具体例を示す図である。図12の矢印の左側の元データには、データの中に高周波の異常が含まれていることが確認できる。この元データを、ウェーブレット変換で分解すると、矢印の右側に示すように、高周波部分の異常として現れる。 FIG. 12 is a diagram illustrating a specific example in which certain original data is decomposed by applying a discrete wavelet transform, although it is not a Q statistic or a Hotelling T 2 statistic. In the original data on the left side of the arrow in FIG. 12, it can be confirmed that the data includes a high-frequency abnormality. When this original data is decomposed by wavelet transform, it appears as an abnormality in the high frequency part as shown on the right side of the arrow.
一般的に、ウェーブレット変換を適用するか否かに関わらず、高周波の異常を人間が目視で確認することは比較的容易であるが、図12の矢印の左側に示すような元データで、異常を機械的に(自動的に)検出する場合、単に閾値を設定するだけでは、異常を検出することは不可能である。一方、図12の矢印の右側に示すような分解されたデータでは、単純に閾値を設定するだけで異常を検出することができる。このように、ウェーブレット変換は、通常行われる閾値による異常検出という単純な操作を継承したままで、より高度に異常を検出できる機能を有する。 In general, it is relatively easy for a human to visually confirm a high-frequency abnormality regardless of whether or not wavelet transform is applied, but the original data as shown on the left side of the arrow in FIG. Is detected mechanically (automatically), it is impossible to detect an abnormality simply by setting a threshold value. On the other hand, in the decomposed data as shown on the right side of the arrow in FIG. 12, an abnormality can be detected by simply setting a threshold value. As described above, the wavelet transform has a function of detecting an abnormality at a higher level while inheriting a simple operation of detecting an abnormality based on a normal threshold.
本実施形態は、ウェーブレット変換を適用して、Q統計量やホテリングのT2統計量をデータ分解して異常検出を実行するシステムである。この場合、本実施形態では、適切な閾値を設定することにより、異常検出の精度を向上させる構成である。 This embodiment applies a wavelet transform, a system for performing abnormality detection by fragmenting the T 2 statistic Q statistic and Hotelling. In this case, the present embodiment is configured to improve the accuracy of abnormality detection by setting an appropriate threshold value.
以上要するに、異常検出モデル生成部42は、プロセスデータ正規化モデル生成部41により正規化用のシフトパラメータとスケーリングパラメータの値が決定されると、ウェーブレット変換をQ統計量やホテリングのT2統計量に適用することにより、異常検出を行う際に必要となる計算モデル(P,∧,Wi)を決定する。さらに、これらの値を用いた正規化の計算式、周波数帯域毎に分解されたQ統計量、および周波数帯域毎に分解されたホテリングのT2統計量の計算式を生成する。
In short, when the process data normalization
次に、異常判定基準設定部5は、異常検出モデルである前記式(15),(16)を使用して異常判定を行うための閾値を決定する。この際、プロセス監視モデル構築用データである正規化データXを用いて、前記式(15),(16)により計算したプロセス監視モデル構築用データの周波数帯域毎に分解されたQ統計量、および周波数帯域毎に分解されたホテリングのT2統計量を利用する。
Next, the abnormality determination
まず、閾値決定用事前情報入力部51は、周波数帯域毎に分解されたQ統計量およびホテリングのT2統計量に関する事前情報を入力する。なお、この周波数帯域毎に分解された事前情報を取得できない場合には、プロセスデータに関する事前情報や、Q統計量やホテリングのT2統計量に対する事前情報で代替させてもよい。
First, the threshold value determination prior
次に、閾値決定部52は、閾値決定用事前情報入力部51から入力される事前情報に従って、異常判定のための閾値を決定する。
Next, the
まず、事前情報が何も無い場合(Q統計量やホテリングのT2統計量に関する情報は不明)には、閾値決定部52は、デフォルトの設定法として、以下の方法を採用する。
First, if prior information is nothing (information about T 2 statistic Q statistic and Hotelling unknown), the threshold
図11に示すように、周波数帯域毎に分解されたQ統計量やホテリングのT2統計量の中の最も遅い周波数のものは、元のQ統計量やホテリングのT2統計量の近似になっている。従って、Q統計量の統計的信頼限界値とホテリングのT2統計量に関する統計的信頼限界値、即ちQ統計量とホテリングのT2統計量の閾値を、そのまま最も遅い周波数帯域に分解されたQ統計量とホテリングのT2統計量の閾値として利用する。 As shown in FIG. 11, those of the slowest frequency in T 2 statistic Q statistic and Hotelling decomposed for each frequency band, turned approximation of T 2 statistic original Q statistic and Hotelling ing. Thus, Q statistic statistical confidence limits and statistical confidence limits about the T 2 statistic Hotelling, the threshold i.e. Q statistic and Hotelling T 2 statistic was degraded as it is the slowest frequency band Q It is used as a threshold for statistics and hotelling T 2 statistics.
一方、最も遅い周波数帯域以外の周波数帯域毎に分解されたQ統計量やホテリングのT2統計量は、図11に示すように、ゼロ平均の周りに正負方向にばらついた分布を示す。このため、事前情報が何も無いので、通常の統計的プロセス監視で行われる方法に従って、周波数帯域毎に分解されたQ統計量とホテリングのT2統計量の標本標準偏差(σrob)あるいはロバスト標本標準偏差(σrob)を利用して、その値の3倍である3σあるいは3σrobを閾値として設定する。 On the other hand, T 2 statistic slowest decomposed into each frequency band other than the Q statistic and Hotelling, as shown in FIG. 11 shows the variation distribution in the positive and negative directions around the zero mean. For this reason, since there is no prior information, the sample standard deviation (σrob) or robust sample of the Q statistic decomposed for each frequency band and the Hotelling T 2 statistic according to the method used in normal statistical process monitoring Using the standard deviation (σrob), 3σ or 3σrob, which is three times the value, is set as a threshold value.
次に、閾値決定用事前情報入力部51から、事前情報として、殆ど全てのデータが正常であるという情報が入力された場合には、閾値決定部52は、原理的に、プロセス監視モデル構築用データの正規化データXを用いて計算した周波数帯域毎に分解されたQ統計量や、周波数帯域毎に分解されたホテリングのT2統計量の最大値を閾値として決定する。但し、ごく僅かに異常データが含まれている可能性があるので、例えば99%信頼区間の考え方を採用して、周波数帯域毎に分解されたQ統計量および周波数帯域毎に分解されたホテリングのT2統計量の最大値から上位1%の値を閾値として決定する方法の方が好ましい。この場合、周波数帯域毎に最大値が求まるが、それぞれの周波数帯域は異なっているので、それぞれの値を周波数帯域毎の閾値として決定する。
Next, when information indicating that almost all data is normal is input as prior information from the threshold determination prior
ここで、前述の第2の実施形態での寄与量による異常検出の場合にも、複数の閾値が計算されたが、寄与量は、Q統計量やホテリングのT2統計量に対する各変数の寄与を意味しているので、同じ基準(閾値)で評価されることが普通である。しかし、本実施形態は、Q統計量やホテリングのT2統計量の異なる周波数帯域の成分によって異常検出を行っているので、本質的には異なる閾値を設定すべきである。 Here, also in the case of abnormality detection by the contribution amount in the second embodiment described above, a plurality of threshold values are calculated, but the contribution amount is the contribution of each variable to the Q statistic and the Hotelling T 2 statistic. Therefore, it is common to evaluate with the same standard (threshold value). However, the present embodiment, since the performing abnormality detection by components of different frequency band T 2 statistic Q statistic and Hotelling, essentially should set different thresholds.
さらに、事前情報として、異常データと正常データが混在しているが異常データの割合は不明であるという情報が入力された場合には、閾値決定部52は、例えば、修正大津の閾値決定法などを用いて、周波数帯域毎に分解されたQ統計量および周波数帯域毎に分解されたホテリングのT2統計量の閾値を決定する。
Furthermore, when information indicating that abnormal data and normal data are mixed but the ratio of abnormal data is unknown is input as prior information, the threshold
但し、異常データと正常データが混合していることが事前情報として入力されている場合でも、周波数帯域毎に分解された統計量に対して異常が混入しているとは限らない。このため、異常データが混入していない周波数帯域があった場合、その閾値を修正大津の閾値決定法などのクラスタリング法で決定すると、正常データを2分割してしまうことになり、適切な閾値が決定されない。しかし、寄与量による異常診断とは異なり、周波数帯域毎に分解されたQ統計量やホテリングのT2統計量による異常診断では、代表的な閾値を取り出すことができず、各々の計測変数毎に閾値を設定しなければならない。これに対処するためには、修正大津の閾値決定法などのクラスタリング法で決定した閾値と、(a)Q統計量とホテリングのT2統計量に関する情報は不明であるの場合の閾値決定方法で決定した閾値との値を比較し、クラスタリング法で決定した閾値が著しく小さい場合には、(a)の場合の閾値を採用するという方法を採ることができる。例えば、(a)の場合の閾値の50%を下回る閾値がクラスタリング手法で得られた場合には、(a)の場合の閾値を採用するというルールで対処する。 However, even if it is input as prior information that the abnormal data and the normal data are mixed, the abnormality is not always mixed with the statistical amount decomposed for each frequency band. For this reason, when there is a frequency band in which abnormal data is not mixed, if the threshold is determined by a clustering method such as the modified Otsu's threshold determination method, normal data will be divided into two, and an appropriate threshold is set. Not determined. However, unlike the abnormality diagnosis by the contribution amount, the abnormality diagnosis by T 2 statistic of degraded Q statistic and Hotelling for each frequency band, it can not be taken out typical threshold for each respective measurement variable A threshold must be set. To address this, a threshold determined by the clustering method such as modification Otsu threshold determination method, in (a) Q statistic and Hotelling T 2 statistic related information in the case of unclear threshold determination method When the threshold value determined by the clustering method is extremely small by comparing the value with the determined threshold value, the method of adopting the threshold value in the case (a) can be adopted. For example, when a threshold value that is less than 50% of the threshold value in the case of (a) is obtained by the clustering method, the rule of adopting the threshold value in the case of (a) is dealt with.
また、事前情報として、異常データと正常データが混在しており、異常データの大よその割合は分かっているという情報が入力された場合には、閾値決定部52は、正規化データXを用いて計算したQ統計量やホテリングのT2統計量を周波数帯域毎に分解したデータの上位α%(αは事前情報として入力した値)に該当する周波数帯域毎に分解されたQ統計量とホテリングのT2統計量の各値を、予め計算する。仮に、全ての周波数帯域に対しては、異常データの大よその割合がわからず、一部の周波数帯域に対してのみわかっている場合には、わかっていない周波数帯域の閾値は、前述(a)の方法で決定する。また、異常データの割合はおおよそわかっているが、それがどの周波数帯域に属するかはわからない場合には、周波数帯域毎に分解されたQ統計量とホテリングのT2統計量の各値に基づいて、一旦閾値を決定し、前述(a)の場合の閾値決定法で決定した閾値と比較し、(a)の場合の閾値の50%を下回る閾値がクラスタリング手法で得られた場合には、(a)の場合の閾値を採用するというルールで対処する。
Further, when information indicating that abnormal data and normal data are mixed and the approximate ratio of abnormal data is known is input as prior information, the threshold
以上要するに、異常判定基準設定部5では、閾値決定部52は、閾値決定用事前情報入力部51から入力される事前情報に従って、プロセス1の正常と異常を判断する閾値を決定する。以上の一連の操作は、プロセス監視モデルを構築し、異常判断の基準を設定するためのものであり、通常はオフラインで行われる。
In short, in the abnormality determination
一方、以下で示す作用は、オンラインで実行される。まず、プロセス監視部6は、モデル構築部4で構築したプロセス監視モデルを使用して、プロセス1の監視を実行する。プロセス監視部6は、監視するプロセス変数として、各種センサ11〜1Nから新たに生成されたQ統計量やホテリングのT2統計量を、ウェーブレット変換で分解した周波数帯域毎のQ統計量やホテリングのT2統計量を監視する。即ち、プロセス監視部6は、下記式(17),(18)を使用して、周波数帯域毎に分解したQ統計量およびホテリングのT2統計量を監視する。
即ち、プロセスの監視対象がQ統計量やホテリングのT2統計量ではなく、それらをウェーブレット変換で分解した周波数帯域毎のQ統計量やホテリングのT2統計量である。 That is, the process monitoring target is not a Q statistic or a Hotelling T 2 statistic, but a Q statistic for each frequency band or a Hotelling T 2 statistic obtained by decomposing them by wavelet transform.
次に、プロセス異常診断部7は、Q統計量やホテリングのT2統計量ではなく、それらをウェーブレット変換で分解した周波数帯域毎のQ統計量やホテリングのT2統計量のいずれか一つが閾値を超えた場合に異常と判断する。プロセス異常要因センサ特定部8、プロセス異常要因推定部9及びユーザインターフェース部10の動作は、前述の第1の実施形態と全く同様である。
Next, the process
以上のように第3の実施形態によれば、MSPCによるプロセス監視において、異常検出を行うデータを、ウェーブレット変換を用いて分解した周波数帯域毎のQ統計量やホテリングのT2統計量を使用することにより、異常検出に対する機能を向上させることができる。また、異常検出のための閾値をプロセスデータに対する事前情報に応じて適切に決定することにより、異常検出の誤りを減少熔させることができる。これにより、MSPCによるプロセス異常監視の性能を向上させる事が可能となる。 As described above, according to the third embodiment, in the process monitoring by MSPC, the Q statistic for each frequency band and the hotelling T 2 statistic obtained by decomposing the data to be subjected to abnormality detection using the wavelet transform are used. Thus, it is possible to improve the function for abnormality detection. In addition, by appropriately determining a threshold value for abnormality detection according to prior information for process data, errors in abnormality detection can be reduced. As a result, the performance of process abnormality monitoring by MSPC can be improved.
以上要するに各実施形態によれば、異常状態を見逃してしまう誤りと正常状態であるのに異常と検出してしまう誤りのトレードオフを適切に調整して、異常検出精度と異常要因特定精度を向上させたプロセス異常診断システムを提供することができる。また、プロセスを監視している監視者(プロセス運転員やプロセス管理者)の主観的な判断を、異常検出精度と異常要因特定精度に適切に反映させた適応的な学習機能を持つプロセス異常診断システムを提供することができる。 In short, according to each embodiment, the error detection accuracy and the error factor identification accuracy are improved by appropriately adjusting the trade-off between an error that misses an abnormal state and an error that is detected as an abnormality even in a normal state. A process abnormality diagnosis system can be provided. In addition, process abnormality diagnosis with an adaptive learning function that appropriately reflects the subjective judgments of process supervisors (process operators and process managers) on abnormality detection accuracy and abnormality factor identification accuracy A system can be provided.
なお、前述の各実施形態のプロセス異常診断装置を適用し、プロセス1のプロセスデータ及び異常診断結果を、サーバが管理するデータベースに蓄積して提供するサービスを行なうプロセス監視システムを構築できる。このシステムは、当該サーバからインターネットや専用通信回線を介して、プロセス1を管理運営している運転員蛾操作するユーザ端末にプロセスデータ及び異常診断結果を提供する。
In addition, by applying the process abnormality diagnosis device of each of the above-described embodiments, it is possible to construct a process monitoring system that provides a service that accumulates and provides process data and abnormality diagnosis results of
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。 Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.
1…プロセス、2…プロセス計測データ収集・保存部、
3…プロセス監視モデル構築用プロセスデータ抽出部、
4…プロセス監視モデル構築・供給部、5…プロセス異常判定基準設定・供給部、
6…プロセス監視部、7…プロセス異常診断部、8…プロセス異常要因センサ特定部、
9…プロセス異常要因推定部、10…ユーザインターフェース部、
41…プロセスデータ正規化モデル生成部、
42…異常検出モデル生成部、51…閾値決定用事前情報入力部、52…閾値決定部。
1 ... Process, 2 ... Process measurement data collection / storage unit,
3 ... Process data extraction unit for process monitoring model construction,
4 ... Process monitoring model construction / supply unit, 5 ... Process abnormality judgment standard setting / supply unit,
6 ... Process monitoring unit, 7 ... Process abnormality diagnosis unit, 8 ... Process abnormality factor sensor identification unit,
9 ... Process abnormality factor estimation unit, 10 ... User interface unit,
41 ... Process data normalization model generation unit,
42: Anomaly detection model generation unit, 51: Threshold determination prior information input unit, 52: Threshold determination unit.
Claims (3)
前記計測手段から計測結果を示す時系列データを収集して保存するデータ保存手段と、
前記データ保存手段に保存された前記時系列データから、プロセス監視モデルを作成するために使用し、前記対象プロセスの状態を示すプロセスデータを取り出すプロセスデータ抽出手段と、
前記プロセスデータ抽出手段により取り出されたプロセスデータを正規化するための正規化モデルを生成する正規化モデル生成手段と、
前記正規化モデルにより正規化されたプロセスデータに対する主成分分析方式によるプロセス監視モデルを構築して、当該正規化プロセスデータの異常検出用データとして、Q統計量またはホテリングT2統計量の統計量データを算出し、当該統計量データに対する前記計測手段により計測している計測項目(計測変数)の寄与量を算出するプロセス監視モデル手段と、
前記統計量データに含まれる異常データと正常データとの割合に関する事前情報であって、前記寄与量に対する前記事前情報を生成する事前情報生成手段と、
前記事前情報及び前記プロセス監視モデル手段により算出される前記統計量データの寄与量を使用して、前記統計量データの異常状態と正常状態の判定を行うための閾値を決定する閾値決定手段と、
前記閾値決定手段により決定された閾値及び前記統計量データを使用して、前記対象プロセスの異常を診断する異常診断手段と
を具備したことを特徴とするプロセス異常診断装置。 A measuring means for measuring the state or operation amount of the target process;
Data storage means for collecting and storing time-series data indicating measurement results from the measurement means;
Process data extraction means used to create a process monitoring model from the time series data stored in the data storage means, and to extract process data indicating the state of the target process;
Normalization model generation means for generating a normalization model for normalizing the process data extracted by the process data extraction means;
A process monitoring model based on a principal component analysis method for the process data normalized by the normalization model is constructed, and Q statistics or hotelling T 2 statistics statistics data is used as abnormality detection data of the normalized process data. Process monitoring model means for calculating the contribution amount of the measurement item (measurement variable) measured by the measurement means for the statistical data ,
Prior information relating to a ratio between abnormal data and normal data included in the statistical data, and prior information generating means for generating the prior information for the contribution amount ;
Threshold determination means for determining a threshold for determining an abnormal state and a normal state of the statistical data using the prior information and the contribution amount of the statistical data calculated by the process monitoring model means; ,
A process abnormality diagnosis device comprising: an abnormality diagnosis unit that diagnoses an abnormality of the target process using the threshold value determined by the threshold value determination unit and the statistical data.
前記計測手段から計測結果を示す時系列データを収集して保存するデータ保存手段と、
前記データ保存手段に保存された前記時系列データから、プロセス監視モデルを作成するために使用し、前記対象プロセスの状態を示すプロセスデータを取り出すプロセスデータ抽出手段と、
前記プロセスデータ抽出手段により取り出されたプロセスデータを正規化するための正規化モデルを生成する正規化モデル生成手段と、
前記正規化モデルにより正規化されたプロセスデータに対する主成分分析方式によるプロセス監視モデルを構築して、当該正規化プロセスデータの異常検出用データとして、Q統計量またはホテリングT2統計量の統計量データを算出し、離散ウェーブレット変換を適用することにより周波数帯域毎に分解された前記統計量データを算出するプロセス監視モデル手段と、
前記統計量データに含まれる異常データと正常データとの割合に関する事前情報であって、前記周波数帯域毎に分解された前記統計量データに対する前記事前情報を生成する事前情報生成手段と、
前記事前情報及び前記プロセス監視モデル手段により算出される前記周波数帯域毎に分解された統計量データを使用して、前記統計量データの異常状態と正常状態の判定を行うための閾値を決定する閾値決定手段と、
前記閾値決定手段により決定された閾値及び前記統計量データを使用して、前記対象プロセスの異常を診断する異常診断手段と
を具備したことを特徴とするプロセス異常診断装置。 A measuring means for measuring the state or operation amount of the target process;
Data storage means for collecting and storing time-series data indicating measurement results from the measurement means;
Process data extraction means used to create a process monitoring model from the time series data stored in the data storage means, and to extract process data indicating the state of the target process;
Normalization model generation means for generating a normalization model for normalizing the process data extracted by the process data extraction means;
A process monitoring model based on a principal component analysis method for the process data normalized by the normalization model is constructed, and Q statistics or hotelling T 2 statistics statistics data is used as abnormality detection data of the normalized process data. And process monitoring model means for calculating the statistical data decomposed for each frequency band by applying a discrete wavelet transform,
Prior information generation means for generating the prior information for the statistical data decomposed for each frequency band, which is prior information on the ratio between abnormal data and normal data included in the statistical data;
Using the prior information and the statistical data decomposed for each frequency band calculated by the process monitoring model means, a threshold for determining the abnormal state and the normal state of the statistical data is determined. Threshold determination means;
An abnormality diagnosis means for diagnosing an abnormality of the target process using the threshold value determined by the threshold value determination means and the statistical data;
A process abnormality diagnosis apparatus comprising:
前記事前情報生成手段は、前記周波数帯域毎に分解された前記統計量データの寄与量に対する前記事前情報を生成し、
前記閾値決定手段は、前記事前情報及び前記プロセス監視モデル手段により算出される前記周波数帯域毎に分解された統計量データの寄与量を使用して、異常状態と正常状態の判定を行うための閾値を決定することを特徴とする請求項1に記載のプロセス異常診断装置。 The process monitoring model means calculates a contribution amount of the statistic data decomposed for each frequency band by applying a discrete wavelet transform,
The prior information generating means generates the prior information for the contribution amount of the statistical data decomposed for each frequency band,
The threshold value determination means uses the contribution amount of the statistical data decomposed for each frequency band calculated by the prior information and the process monitoring model means to determine an abnormal state and a normal state The process abnormality diagnosis apparatus according to claim 1, wherein a threshold value is determined.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006235312A JP4762088B2 (en) | 2006-08-31 | 2006-08-31 | Process abnormality diagnosis device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006235312A JP4762088B2 (en) | 2006-08-31 | 2006-08-31 | Process abnormality diagnosis device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008059270A JP2008059270A (en) | 2008-03-13 |
JP4762088B2 true JP4762088B2 (en) | 2011-08-31 |
Family
ID=39241934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006235312A Expired - Fee Related JP4762088B2 (en) | 2006-08-31 | 2006-08-31 | Process abnormality diagnosis device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4762088B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022265292A1 (en) * | 2021-06-14 | 2022-12-22 | 주식회사 마키나락스 | Method and device for detecting abnormal data |
US11593299B2 (en) | 2017-03-28 | 2023-02-28 | Nec Corporation | Data analysis device, data analysis method and data analysis program |
EP4092501A4 (en) * | 2020-01-14 | 2023-07-19 | JFE Steel Corporation | Abnormality diagnosis system and abnormality diagnosis method |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102428445A (en) * | 2009-02-27 | 2012-04-25 | 奥索临床诊断有限公司 | Method for detecting the impending analytical failure of networked diagnostic clinical analyzers |
JP5621967B2 (en) * | 2010-07-09 | 2014-11-12 | 富士電機株式会社 | Abnormal data analysis system |
JP5881986B2 (en) * | 2010-07-12 | 2016-03-09 | メタウォーター株式会社 | Plant operation monitoring device, plant operation monitoring system, and plant operation monitoring method |
JP5025776B2 (en) * | 2010-09-28 | 2012-09-12 | 株式会社東芝 | Abnormality diagnosis filter generator |
KR20120046821A (en) * | 2010-10-27 | 2012-05-11 | 파웰테크윈주식회사 | Apparatus and method for self-diagnosing the status of any kind of sensors |
JP2012155361A (en) * | 2011-01-21 | 2012-08-16 | Toshiba Corp | Process monitoring device |
JP5284433B2 (en) * | 2011-09-14 | 2013-09-11 | 株式会社東芝 | Process monitoring / diagnosis / support equipment |
JP2013127403A (en) * | 2011-12-19 | 2013-06-27 | Railway Technical Research Institute | Abnormality detection method and abnormality detection device for speed detection means and vibration detection means |
JP6081598B2 (en) * | 2012-09-12 | 2017-02-15 | ゲーコーエヌ エアロスペース スウェーデン アーベー | Reliability limit logic to ensure high quality data |
JP5996384B2 (en) * | 2012-11-09 | 2016-09-21 | 株式会社東芝 | Process monitoring diagnostic device, process monitoring diagnostic program |
WO2014207789A1 (en) * | 2013-06-24 | 2014-12-31 | 株式会社 日立製作所 | Status monitoring device |
JP6186203B2 (en) * | 2013-08-09 | 2017-08-23 | 株式会社日立製作所 | Diagnostic system and elevator |
JP2016012158A (en) * | 2014-06-27 | 2016-01-21 | 株式会社日立製作所 | Plant abnormality prediction device, abnormality prediction device, display device and display method |
CN104075749A (en) * | 2014-06-30 | 2014-10-01 | 通号通信信息集团有限公司 | Abnormal state detecting method and system for equipment in internet of things |
JP6330864B2 (en) * | 2015-08-05 | 2018-05-30 | Jfeスチール株式会社 | MOTOR MONITORING DEVICE AND METHOD |
JP6873025B2 (en) | 2017-11-17 | 2021-05-19 | 株式会社日立製作所 | Parameter setting method, data analyzer, data analysis system and program |
JP7368736B2 (en) * | 2018-04-27 | 2023-10-25 | シンフォニアテクノロジー株式会社 | Abnormality detection device and vibration conveyance device equipped with the same |
JP7199436B2 (en) * | 2018-07-03 | 2023-01-05 | 三菱電機株式会社 | Obstacle detection device and driving support device |
JP7014686B2 (en) * | 2018-08-06 | 2022-02-01 | 三菱パワー株式会社 | Performance evaluation device, performance evaluation method and performance impact output method |
KR102096466B1 (en) * | 2019-08-12 | 2020-04-02 | (주)엠투엠솔루션 | Device and method for remote control and alarm using real time database |
JP7315017B2 (en) * | 2019-10-18 | 2023-07-26 | 日本電気株式会社 | Time series data processing method |
CN111767192B (en) * | 2020-06-30 | 2022-10-14 | 深圳赛安特技术服务有限公司 | Business data detection method, device, equipment and medium based on artificial intelligence |
CN113984114B (en) * | 2021-10-18 | 2022-12-06 | 大连理工大学 | Method for diagnosing abnormality of underwater structure of ocean floating platform |
CN114088389A (en) * | 2021-12-10 | 2022-02-25 | 华润电力技术研究院有限公司 | Data processing method and related device for gearbox |
CN114265359B (en) * | 2021-12-15 | 2023-08-25 | 昆船智能技术股份有限公司 | Intelligent detection system and method for abnormal operation time of conveying equipment |
CN115982665B (en) * | 2023-03-21 | 2023-07-14 | 北京东华博泰科技有限公司 | Quality anomaly auditing method and system for water turbine measurement data |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3529663B2 (en) * | 1999-03-31 | 2004-05-24 | 株式会社東芝 | Travel time information calculation device |
JP2002339178A (en) * | 2001-05-15 | 2002-11-27 | Murata Mach Ltd | False-twisting machine |
JP2002358120A (en) * | 2001-06-04 | 2002-12-13 | Mitsubishi Chemicals Corp | Batch plant operation managing device |
JP4289602B2 (en) * | 2003-03-31 | 2009-07-01 | 三菱化学株式会社 | Process monitoring method |
JP2005266965A (en) * | 2004-03-16 | 2005-09-29 | Toshiba Corp | Data monitoring device and method |
-
2006
- 2006-08-31 JP JP2006235312A patent/JP4762088B2/en not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11593299B2 (en) | 2017-03-28 | 2023-02-28 | Nec Corporation | Data analysis device, data analysis method and data analysis program |
EP4092501A4 (en) * | 2020-01-14 | 2023-07-19 | JFE Steel Corporation | Abnormality diagnosis system and abnormality diagnosis method |
WO2022265292A1 (en) * | 2021-06-14 | 2022-12-22 | 주식회사 마키나락스 | Method and device for detecting abnormal data |
US11803177B1 (en) | 2021-06-14 | 2023-10-31 | MakinaRocks Co., Ltd. | Method and apparatus for detecting anomaly data |
Also Published As
Publication number | Publication date |
---|---|
JP2008059270A (en) | 2008-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4762088B2 (en) | Process abnormality diagnosis device | |
JP4468269B2 (en) | Process monitoring apparatus and method | |
JP2009070071A (en) | Learning process abnormality diagnostic device and operator's judgement estimation result collecting device | |
JP5284433B2 (en) | Process monitoring / diagnosis / support equipment | |
JP6214889B2 (en) | Process monitoring and diagnosis device | |
WO2014073261A1 (en) | Process monitoring/diagnosis device and process monitoring/diagnosis program | |
JP5813317B2 (en) | Process status monitoring device | |
JP4604987B2 (en) | Operation management method and apparatus for water treatment plant | |
US7890200B2 (en) | Process-related systems and methods | |
EP3552013A1 (en) | Intelligent systems and methods for process and asset health diagnosis, anomoly detection and control in wastewater treatment plants or drinking water plants | |
Yu et al. | Statistical MIMO controller performance monitoring. Part II: Performance diagnosis | |
JP6862190B2 (en) | Process diagnostic device, process diagnostic method and process diagnostic system | |
CN111459700A (en) | Method and apparatus for diagnosing device failure, diagnostic device, and storage medium | |
CN112414694B (en) | Equipment multistage abnormal state identification method and device based on multivariate state estimation technology | |
JP2017187820A (en) | Process diagnostic device, process diagnostic method, and computer program | |
JP2024001315A (en) | Process monitoring system, process monitoring method, and program | |
Lai et al. | Accelerated multiple alarm flood sequence alignment for abnormality pattern mining | |
JP2003044123A (en) | Plant diagnostic device | |
CN114020598A (en) | Method, device and equipment for detecting abnormity of time series data | |
Rasay et al. | Integration of the decisions associated with maintenance management and process control for a series production system | |
CN109887253B (en) | Correlation analysis method for petrochemical device alarm | |
JP7163117B2 (en) | Process monitoring support device, process monitoring support system, process monitoring support method, and process monitoring support program | |
Booysen et al. | A practical methodology for the systematic identification of outliers | |
CN112816898A (en) | Battery failure prediction method and device, electronic equipment and storage medium | |
Lee et al. | Autoencoder-based detector for distinguishing process anomaly and sensor failure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100707 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100713 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110607 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |