WO2013037169A1 - 基于密度的参数优化单分类支持向量机故障检测方法 - Google Patents

基于密度的参数优化单分类支持向量机故障检测方法 Download PDF

Info

Publication number
WO2013037169A1
WO2013037169A1 PCT/CN2011/082850 CN2011082850W WO2013037169A1 WO 2013037169 A1 WO2013037169 A1 WO 2013037169A1 CN 2011082850 W CN2011082850 W CN 2011082850W WO 2013037169 A1 WO2013037169 A1 WO 2013037169A1
Authority
WO
WIPO (PCT)
Prior art keywords
sample
module
value
density
normal
Prior art date
Application number
PCT/CN2011/082850
Other languages
English (en)
French (fr)
Inventor
姚马
王焕钢
张琳
徐文立
Original Assignee
清华大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 清华大学 filed Critical 清华大学
Publication of WO2013037169A1 publication Critical patent/WO2013037169A1/zh

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0221Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/024Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks

Definitions

  • the invention relates to a data-driven production process fault detection method, in particular to a density-based parameter optimization single-class support vector machine (OCSVM) fault detection method.
  • OCSVM density-based parameter optimization single-class support vector machine
  • the automated process of industrial production requires real-time detection of the operating state of the equipment in the industrial production process through various sensors, and analyzes whether the production process is in an abnormal operating state based on the detected data.
  • the sensor detection data is used to analyze the abnormal production process.
  • the method is called a data-driven production process fault detection method.
  • PCA Principal Component Analysis
  • SPE Square Prediction Error
  • Hotlin statistics Fault detection in the production process.
  • the detection data of many production processes have strong nonlinear characteristics, and the data distribution characteristics do not satisfy the Gaussian distribution.
  • the PCA-based fault detection method cannot meet the requirements of the actual application.
  • some data-driven fault detection methods for solving nonlinear problems have been gradually proposed, such as ICA (Independent Component Analys is) and K- nearest neighbor (K-NN).
  • the OCSVM (One-class Support Vector Machine) fault detection method is a newly developed and effective fault detection method. Compared with other nonlinear methods, the biggest feature of the 0CSVM method is to construct a classification plane to surround the normal data set and determine whether the newly detected data is outside the classification plane.
  • the new data is outside the classification plane, it means that The data is abnormal data, and the production process is in an abnormal operating state, thereby achieving the purpose of fault detection.
  • the composition of the classification surface is only related to the part of the support vector in the dataset.
  • the number of support vectors is usually much smaller than the number of data sets. Therefore, this method can greatly reduce the complexity of data processing.
  • control parameter which is recorded as V.
  • V the degree of sub-sample punishment: the smaller the V, the degree of punishment for the wrong sub-sample The higher the V, the lower the V, the lower the penalty for the wrong subsample.
  • the other parameter is the width parameter of the Gaussian kernel function, which reflects the shape of the Gaussian kernel function: the smaller the value of the parameter, the narrower the graph of the Gaussian kernel function, the faster the attenuation; conversely, the larger the value of the parameter, the Gaussian kernel The wider the graph of the function, the slower the decay.
  • the width parameters are indicated by symbols below.
  • the technician can judge whether the parameter selection is appropriate through graphical observation.
  • the technician cannot draw high-dimensional graphics to determine whether the parameter selection is appropriate. This situation is common in actual production processes because the number of sensors in practical applications is usually large.
  • some researchers introduced the R0C curve (Receiver Operating Characteristics curve), and used the AUC value (Area under an R0C curve, the area value under the ROC curve) as an indicator to determine whether the parameter selection is appropriate.
  • the R0C curve is a two-dimensional graph in which the FPR (False Positive Rate) is used as the abscissa and the TPR (True Positive Rate) is plotted as the normal coordinate.
  • FPR False Positive Rate
  • TPR True Positive Rate
  • a fixed classifier produces a (FPR, TPR) data pair that corresponds to a point in the R0C space.
  • the AUC performance indicators take into account the two data of TPR and FPR, so that the performance of the classifier can be reasonably evaluated. The larger the AUC value, the better the classification result can obtain the larger TPR value and the smaller FPR value.
  • the calculation process of AUC does not change much with the increase of data dimension.
  • an object of the present invention is to provide a density-based parameter optimization single-class support vector machine fault detection method, which only needs a normal sample set, has a wide application range, is simple in optimization process, and has good fault detection performance.
  • the classification surface can well reflect the structural characteristics of the sample set and has a strong promotion ability.
  • a density-based parameter optimization single-class support vector machine fault detection method includes the following steps: 1) setting a data acquisition device, a confidence level setting module, and a monitoring computer a fault detecting device; a data preprocessing module, an optimized fault detector generating module and an optimized fault detector application module are preset in the monitoring computer; 2) the data collecting device collects normal data generated by each monitoring sensor in the industrial production line, And transmitted to the monitoring calculation The data preprocessing module of the machine, the data preprocessing module performs normalized preprocessing to obtain the total sample set.
  • N means that the data acquisition device performs N data acquisitions for each monitoring sensor;
  • X ( , X , ..., x it fe T, indicating that the monitoring sensors are performed
  • the single sample data value obtained by the sensor after the first data acquisition and normalization, _/ l, 2,..., ; 3)
  • the key to optimize the fault detector model is to obtain the optimal value of the control parameter V and the width parameter ⁇ through the optimization process, and finally obtain an optimized fault detector model
  • the steps are as follows:
  • the following sub-modules are preset in the optimized fault detector generation module: sample density estimation module, virtual abnormal sample generation module, training set generation module, test set generation module, OCSVM (One-class Support Vector Machine) training Module, ROC (Receiver Operating Characteristics curve) performance calculation module, control parameter setting module Block, width parameter optimization module, termination condition determination module, initial classifier generation module, control limit generation module, and optimized classifier synthesis module; 2, in step 2), the data preprocessing module normalizes the total sample obtained after preprocessing
  • the ⁇ input sample density estimation module is configured to obtain an estimated sample density value of each sample by the sample density estimation module, and input to the virtual abnormal sample generation module, and the virtual abnormal sample generation module generates a virtual abnormal sample set according to the estimated sample density value of each sample, Get positive at the same time
  • the normal sample set ⁇ ⁇ ..., ⁇ where, is the specified density limit, that is, the sample point with the smallest estimated sample density value before selection is selected as the abnormal sample point; L" represents the rounding operation; 3 training set
  • the generating module obtains the normal sample set ⁇ , ⁇ ,..., ⁇ ') from the virtual abnormal sample generating module, and randomly selects some normal samples from the normal sample set to form a training set ⁇ , ⁇ ,... ⁇ ⁇ , N represents the total number of samples in the training set; 4
  • N T Get the optimal solution of the optimization vector ⁇ ( « ⁇ ..., ⁇ ), denoted as "D, and get the classification surface.
  • step 6 Input the test surface obtained in step 5 and the test set obtained in step 4 test set generation module into the R0C performance calculation module, and calculate the AUC (Area under an ROC curve) value, which is recorded as A;
  • the final AUC value obtained in the above step 6 is input to the termination condition determination module, and the current AUC value and the AUC optimal value in the current termination condition determination module are compared, and the larger value of the two is stored according to the intelligent optimization algorithm.
  • the corresponding width parameter value is recorded as follows. In the initial state, the AUC optimal value in the termination condition determination module is 0, and the corresponding width parameter is also 0; the termination condition determination module determines whether the current state meets the preset in the termination condition determination module.
  • the termination condition for the optimization of the width parameter if the current state does not satisfy the termination condition, enter the width parameter optimization module, update the value of the width parameter according to the intelligent optimization algorithm, and return to step 5 to continue the iteration; if the current state satisfies the termination condition, Output the width parameter value corresponding to the AUC optimal value ⁇ * ; 8 input the width parameter obtained after the optimization of step 7
  • the start classifier generates a module to form an initial fault detector whose expression is as follows:
  • the limit generation module determines the size of the control limit according to the confidence level value and the approximate distance between each sample and the initial classification surface, and records
  • d( Xi ., X f) indicates the The average of the distance between the sample points and the nearest neighbor sample points
  • ( XX f) represents the average of the distance values w x , x f) for all sample points
  • Number, preferred range is
  • control parameter setting module controls The parameter V represents the upper bound of the proportion of the number of misclassified samples to the total number of samples; the lower bound of the ratio of the number of supporting vectors to the total number of samples, the preferred range of the control parameter V is 0.01 ⁇ 0. 1; width parameter optimization module width parameter (optimal range and initial value of 7: select 1/10 of the average value of the distance between samples as the lower bound, select the maximum distance between the samples as the upper bound The average value of the upper and lower bounds is taken as the initial value.
  • the present invention has the following advantages due to the above technical solution: 1.
  • the present invention uses the density information of the sample to construct a virtual abnormal sample for use in the subsequent classifier optimization process, thereby eliminating the need for the system itself to provide a sufficient number.
  • the anomaly samples therefore, can be applied to fault detection problems based only on normal sample data sets, and have a wide range of applications.
  • the invention constructs a virtual anomaly sample by sample density information and density limit, so that the shape of the classification surface can reflect the distribution characteristics of the normal sample in space, so that the optimized classification surface can more appropriately surround the sample data, and the degree of tightness is moderate. 3.
  • the present invention uses the AUC value as an evaluation index, so that the fault detector can reduce the value of the FPR while ensuring a higher TPR, thereby improving the generalization ability of the classification surface. 4.
  • the invention adopts single parameter optimization, and the optimization process is simple. 5.
  • the invention adjusts the position of the classification surface by the control limit, so that the classification surface is in an artificially controllable state, so that the first type of error rate (the probability that the normal sample is judged to be abnormal) and the second can be adjusted according to actual needs.
  • the error rate of the class error rate (the probability that the abnormal sample is judged to be normal), and the control limit also reduces the noise pair such as data acquisition error.
  • the impact of the classification surface The method is ingeniously designed, accurate and practical, and can be widely applied to fault detection in the operating state of industrial production lines.
  • Figure 1 is a schematic view of the structure of the present invention
  • FIG. 2 is a schematic structural view of a module of the present invention
  • FIG. 3 is a schematic diagram showing the structure of a sub-module of the optimization fault detector generating module of the present invention.
  • FIG. 4 is a display diagram of a two-dimensional sample point and a classification surface obtained by the present invention under a two-dimensional circular data set
  • Figure 5 is a R0C curve obtained by the present invention under a two-dimensional circular data set
  • Figure 5a is the result obtained by taking the width parameter ⁇ initial value of 1. 4067
  • Figure 5b is the result obtained by the optimization of the present invention.
  • the method of the invention comprises the following steps:
  • a fault detecting device including a data collecting device A, a confidence level setting module B, and a monitoring computer C with a display screen
  • the input end of the data collecting device A is connected to each monitoring sensor in the industrial production line, The output end is electrically connected to the monitoring computer C
  • the output end of the confidence level setting module B is connected to the monitoring computer
  • the monitoring computer C is pre-set with a data pre-processing module 1, an optimized fault detector generating module 2 and An optimized fault detector application module 3.
  • the optimized fault detector generation module 2 further includes the following sub-modules: a sample density estimation module 21, a virtual anomaly sample generation module 22, a training set generation module 23, and a test set generation.
  • the normal data generated in the production process is collected by the data collection device A, and the normal data is transmitted to the monitoring computer C, and the normal data is normalized by the data preprocessing module 1. Processing, thereby obtaining a total sample set ⁇ .
  • the number of monitoring sensors connected to the data acquisition device is one, and N times data acquisition is performed on the above-mentioned monitoring sensors, and after N acquisitions, the data is normalized by the data preprocessing module 1.
  • the sample data set obtained by processing is the total sample set ⁇ :
  • the data acquisition of the m monitoring sensors is performed for the first time, and the samples obtained after the normalization process are obtained.
  • the confidence level setting module B evaluate the true degree of normal data collected during the production process, and set the confidence level value.
  • the meaning of the confidence level value is: Due to the influence of factors such as measurement noise, the reliability of the obtained normal data is reduced. If it is empirically believed that the normal data obtained by (1- «)% is reliable, Then make sure that the (1- «)% of normal data is normal.
  • step 4) Enter the total sample set ⁇ in step 2) above and the confidence level value set in step 3) into the optimized fault detector generation module 2 to optimize the model of the fault detector.
  • Optimize the fault detector application module 3 Store the steps 4) Obtain the model of the optimized fault detector.
  • the data detected by each monitoring sensor is normalized by the data preprocessing module 1 in the data acquisition device ⁇ acquisition and monitoring computer C, and then input into the optimized fault detector application module 3, through optimization
  • the fault detector is stored in the fault detector application module 3, and the fault detection result is output in real time.
  • the key to optimizing the fault detector model is to obtain the optimal value of the control parameter V and the width parameter ⁇ through the optimization process, and finally obtain the optimized fault detector model, and the steps are as follows:
  • step 2) the data preprocessing module 1 normalizes the total sample set ⁇ input sample density estimation module 21 obtained by preprocessing, and obtains the estimated sample density value of each sample by the sample density estimation module 21, and then inputs it to the virtual
  • the abnormal sample generating module 22 the virtual abnormal sample generating module 22 generates a virtual abnormal sample set according to the estimated sample density values of the respective samples, and obtains the normal sample set at the same time, and the specific steps are as follows:
  • d( Xi ., X f) represents the distance between the first sample point and the closest nearest neighbor sample point Average
  • ( XX f) represents the average of the above distance values w x , x f) for all sample points; represents a sufficiently small positive number specified, preferably in the range
  • the training set generation module 23 obtains the normal sample set ⁇ AiJ+1 ', x M+2 ',..., x ⁇ from the virtual abnormal sample generation module 22, and randomly selects some normal samples from the normal sample set to form a training set.
  • ⁇ , , ,,.,., ⁇ , N represents the total number of samples in the training set.
  • the test set generation module 24 obtains the normal sample set ⁇ ,..., ⁇ and the virtual abnormal sample set ⁇ , ⁇ ',..., ⁇ " ⁇ from the virtual abnormal sample generation module 22, and will be normal.
  • the sample set and the virtual exception sample set are combined to get the test set:
  • - ⁇ represents a virtual anomaly sample
  • the training set ⁇ , ⁇ , ..., ⁇ obtained by the training set generation module 23 in step 2, the control parameter v set in the control parameter setting module 27, and the width parameter set in the current width parameter optimization module 28.
  • the ⁇ is input to the 0CSVM training module 25 to obtain a classification plane.
  • control parameter V in the control parameter setting module 27 The physical meaning of the control parameter V in the control parameter setting module 27: The number of misclassified samples (normal samples are judged as abnormal samples or abnormal samples are judged as normal samples) The upper bound of the proportion of the total number of samples; the number of support vectors accounts for the total number of samples The lower bound of the ratio.
  • the preferred range of the control parameter V is 0.01 to 0.1.
  • the optimization range and initial value of the width parameter ⁇ in the width parameter optimization module 28 Many existing literatures have analyzed the selection of the width parameter, and obtained some useful results; the upper and lower bounds and initial values of the actual selection width parameter ⁇ 7 When you can refer to the existing conclusions and consider the computational complexity to choose. If Taking 1/10 of the average value of the distance between samples as the lower bound, the maximum value of the distance between the samples is selected as the upper bound, and the average of the upper and lower bounds is used as the initial value; or the selection method used in the specific simulation example is used.
  • the 0CSVM training module 25 solves the following optimization problems by:
  • test surface obtained in the above step 4 and the test set obtained in the step 3 test set generation module 24 are input to the R0C performance calculation module 26, and the AUC value is calculated and recorded as A.
  • step (e) i i + l, and judge whether ⁇ N is satisfied: If the condition is satisfied, then step (c) is continued to iterate; if the condition is not satisfied, the loop is terminated, and the following step (f) is entered ;
  • the final AUC area value obtained in the above step 5 is input to the termination condition determination module 29, and the current AUC area value ⁇ and the AUC optimal value in the current termination condition determination module 29 are compared, and the two are selected according to the intelligent optimization algorithm.
  • the larger value is stored as, and the corresponding width parameter value is recorded therein.
  • the AUC optimal value in the termination condition determination module 29 is 0, and the corresponding width parameter is also 0; the termination condition determination module 29 determines whether the current state is The termination condition for the width parameter ⁇ preferred preset in the termination condition determination module 29 is satisfied:
  • step 4 If the current state does not satisfy the termination condition, enter the width parameter optimization module 28, update the value of the width parameter ⁇ according to the intelligent optimization algorithm, and return to step 4 to continue the iteration;
  • the width parameter value corresponding to the AUC optimal value is output.
  • the termination condition preset in the termination condition determination module 29 is not unique. Therefore, the difference parameter ⁇ may be optimized by using different intelligent optimization algorithms. For example, the total optimization may be set. The upper limit of the number of generations is used as the termination condition for the optimization of the width parameter ⁇ 7; or whether the temperature of the termination condition used in the simulated annealing algorithm in the simulation example is lowered to the termination temperature or the like.
  • the width parameter obtained by optimizing step 6 is input to the initial classifier generating module 210 to form an initial fault detector, and proceeds to a subsequent step;
  • the detection model of the initial fault detector is as follows:
  • ⁇ ( x ) sgn (6)
  • the initial fault detector obtained in step 7 and the control limit C_Jm obtained in step 8 are input to the optimized classifier synthesis module 212, and the final optimized fault detector is obtained.
  • the detection model function expression is as follows:
  • This simulation example uses a two-dimensional circular data set for simulation experiments.
  • the simulation steps and parameter settings are as follows:
  • the virtual exception sample set ⁇ «,..., ⁇ "' ⁇ of the sample point. Randomly selecting 2/3 parts of the normal sample set constitutes the training set, so the training set contains a total of 388 samples, ie ⁇ 388.
  • a normal test set and a virtual abnormal sample set are combined and a category tag is added to obtain a test set containing 600 samples.
  • the control parameter V is selected to be 0.05 according to the physical concept of the parameter.
  • the set of Euclidean distances between any two different sample points in the training set is ⁇
  • the intelligent optimization algorithm used in this simulation example is the simulated annealing algorithm.
  • the process of optimizing the parameter ⁇ 7 using the simulated annealing algorithm is as follows:
  • AUC -AUC ⁇ -s AUC and cx V ( AUC - ⁇ AUC ) is greater than the random number generated in the interval (0 1); ( c ) f / C ⁇ ⁇ ⁇
  • Figure 4 shows the two-dimensional sample point and classification surface display obtained under the two-dimensional circular data set.
  • Figure 4a shows the result obtained by taking the initial value, and
  • Figure 4b shows the result obtained by the optimization of the present invention. .
  • Fig. 4 there is a large gap inside the classification surface in Fig. 4a, and the classification surface does not well surround the sample points; and the classification surface in Fig. 4b surrounds the sample points just right, and the degree of tightness is moderate.
  • Figure 5 shows the R0C curve corresponding to the above two cases, wherein Figure 5 is (7 takes the initial value of the R0C curve, its AUC value is 0.6816; Figure 5b is the R0C curve obtained by the optimization of the present invention, its AUC The value is 0.9918. It can be seen that after the optimization process of the present invention, the AUC value corresponding to the fault detector is greatly improved, and the detection performance of the fault detector is greatly improved.
  • the above embodiments are only used to illustrate the present invention, wherein The structure and connection method of each component can be The equivalent transformations and improvements made on the basis of the technical solutions of the present invention should not be excluded from the scope of protection of the present invention.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Complex Calculations (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于密度的参数优化单分类支持向量机故障检测方法,其包括以下步骤:1)设置一包括数据采集设备、置信水平设置模块和监控计算机的故障检测设备;2)通过数据采集设备采集生产过程中产生的正常数据,输入监控计算机,归一化预处理得到总样本集;3)设定置信水平值;4)将总样本集和置信水平值输入到优化故障检测器生成模块中,寻优得到优化故障检测器的模型;5)优化故障检测器应用模块存储优化故障检测器的模型;6)工业生产过程中,通过数据采集设备将采集到的数据输入监控计算机,归一化处理后,输入优化故障检测器应用模块,通过优化故障检测器应用模块中存储的优化故障检测器,实时输出故障检测结果。本发明可广泛用于工业生产线运行状态的故障检测中。

Description

基于密度的参数优化单分类支持向量机故障检测方法 技术领域
本发明涉及一种基于数据驱动的生产过程故障检测方法, 特别是关于一种基 于密度的参数优化单分类支持向量机(One-class Support Vector Machine, OCSVM) 故障检测方法。 说
背景技术
工业生产的自动化过程需要对工业生产过程的设备运行状态通过各种传感器 进行实时的检测, 并根据检测到的数据分析生产过程是否处于异常运行状态, 通 常将这种利用传感器检测数据分析生产过程异常的方法称为基于数据驱动的生产 过程故障检测方法。 当检测数据之间具有较强的线性关系, 且满足高斯分布时, 可以采用 PCA (Principal Component Analysis, 主成书分分析)辅助以 SPE ( Squared Prediction Error, 平方预测误差)和霍特林 统计量进行生产过程的故障检测。 这方面已经有大量的文献报道和发明专利, 并且已经开始应用到生产过程当中, 并取得了一定的实际应用效果。
但是很多生产过程的检测数据之间具有较强的非线性特性, 而且数据分布特 点也不满足高斯分布。 在这种情况下, 基于 PCA 的故障检测方法就不能满足实际 应用的要求。 对此, 一些用于解决非线性的数据驱动故障检测方法被逐渐提出, 例如 ICA ( Independent Component Analys is ,独立成分分析)、 K-近邻(K- nearest neighbour, K- NN) 等方法。 其中 OCSVM (One-class Support Vector Machine, 单分类支持向量机) 的故障检测方法是一种最新发展起来且行之有效的故障检测 方法。与其他非线性方法相比, 0CSVM方法的最大特点是通过构造分类面将正常数 据集包围起来, 并判断新检测到的数据是否位于该分类面外, 若新数据位于分类 面外, 则说明该数据是异常数据, 生产过程处于异常运行状态, 由此达到故障检 测的目的。 而分类面的构成只和数据集中支持向量的部分有关, 又支持向量的个 数通常远远小于数据集的个数, 因此该方法可以大大降低数据处理的复杂度。
在基于 0CSVM 的故障检测方法具体应用过程中, 有两个对故障检测性能起到 至关重要的参数需要确定。其中一个参数是控制参数,记为 V——在引入允许分类 面外的数据点被判为正常数据的松弛变量后, 需要对松弛变量带来的错误进行惩 罚, 控制参数 V用于控制对错分样本惩罚的程度: V越小, 对错分样本的惩罚程度 越高; 反之, V越大, 对错分样本的惩罚程度越低。 另外一个参数是高斯核函数的 宽度参数, 该参数反映了高斯核函数的图形形状: 该参数值越小, 高斯核函数的 图形越窄, 衰减越快; 反之, 该参数值越大, 高斯核函数的图形越宽, 衰减越慢。 高斯核 函 数在使用 中 有 多 种 形式 , 应用 较 为 普遍 的 形式是 (χ,. , χ ) = εΧρ(- | | - χ | |2/σ2),该形式中的参数 即为宽度参数,以下均以符号 表 示宽度参数。
当数据的维数 (即传感器的个数) 较低时, 技术人员可以通过图形观测判断 参数选择是否合适。 但是, 当数据的维数增加时, 技术人员无法绘制高维图形以 判断参数选择是否合适, 这种情形在实际生产过程中普遍存在, 因为实际应用中 传感器的数量通常都很大。 为此, 有学者引入 R0C 曲线 (Receiver Operating Characteristics curve, 接受者操作特征曲线), 并以 AUC 值(Area under an R0C curve, ROC 曲线下的面积值) 作为判断参数选择是否合适的指标。 R0C 曲线是以 FPR (False Positive Rate, 异常样本被判为正常的比率) 作为横坐标、 以 TPR (True Positive Rate, 正常样本被判为正常的比率) 作为纵坐标绘制出的二维 图形。 一个固定的分类器产生一个 (FPR, TPR) 数据对, 对应 R0C空间上的一个 点。 AUC性能指标综合考虑了 TPR和 FPR这两项数据, 从而能够合理地评价分类器 的运行效果。 AUC值越大, 保证了分类结果能够同时获得较大的 TPR值和较小的 FPR值。 而 AUC的计算过程并不随着数据维数的增加而有太大的变化。
但是, 使用 AUC作为评价指标时, 需要一定数量的异常样本才能绘制出具有 实际使用价值的 R0C曲线和相应的 AUC值。 而工业生产过程中采集到的绝大部分 数据是正常样本, 因此很难得到足够数量的异常样本, 或者得到的异常样本并不 能反映全部的异常情况。 所以, 如何只根据正常样本或者根据含有极少量异常样 本的数据集进行故障检测是上述数据处理过程中遇到的关键问题。
发明内容
针对上述问题, 本发明的目的是提供一种基于密度的参数优化单分类支持向 量机故障检测方法, 该方法只需要正常样本集, 应用范围广, 寻优过程简单, 故 障检测性能好, 得到的分类面能够很好地反映样本集的结构特性、 推广能力强。
为实现上述目的, 本发明采取以下技术方案: 一种基于密度的参数优化单分 类支持向量机故障检测方法, 其包括以下步骤: 1 ) 设置一包括数据采集设备、 置 信水平设置模块和监控计算机的故障检测设备; 所述监控计算机内预设置有一数 据预处理模块、 一优化故障检测器生成模块和一优化故障检测器应用模块; 2 ) 数 据采集设备采集工业生产线中各监测传感器产生的正常数据, 并传输给监控计算 机的数据预处理模块, 数据预处理模块进行归一化预处理后得到总样本集
Q = { 2,..., N) ; 其中, N表示数据采集设备对各个监测传感器进行 N次数据采 集; X =( ,X ,...,xi tf e T, 表示对 个监测传感器进行第 次数据采集, 并经过 归一化处理后得到的样本, 表示监测传感器的个数, 表示 维列向量; = 1,2,...,N; ¾表示在样本 X中, 对第 _/个传感器在第 次数据采集并经过归一化 处理后得到的单个样本数据值, _/ = l,2,..., ; 3) 在置信水平设置模块中, 对生产 过程中采集到的正常数据的真实程度进行评估, 设定置信水平值《; 4) 将上述步 骤 2) 中的总样本集 β和步骤 3) 中设定的置信水平值《输入到优化故障检测器生 成模块中, 寻优得到优化故障检测器的模型: f (x) = sgn
Figure imgf000005_0001
其中, 当/ (x) = l时, 表示待测样本 x为正常样本, /(X) = -l时, 表示待测样本 X为 异常样本; η(·)是符号函数且满足 η(χ) = ≥ 0 ; N表示训练集的样本
[-1 x<0 总数; ^表示训练集样本; 表示拉格朗日乘子的最优解; (X,i )表示高斯核函 数; 表示分类面的偏移量; C_ J 表示控制限; 5)优化故障检测器应用模块 存储步骤 4) 得到的优化故障检测器的模型; 6) 工业生产过程中, 实时通过数据 采集设备采集各监测传感器输出的数据, 并通过监控计算机中的数据预处理模块 归一化处理后, 输入优化故障检测器应用模块中, 通过优化故障检测器应用模块 中存储的优化故障检测器, 实时输出故障检测结果。 所述步骤 4)中, 寻优得到优化故障检测器模型的关键是通过优化过程得到控 制参数 V和宽度参数 σ的最优值, 最终得到优化故障检测器模型, 其步骤如下: ① 在所述优化故障检测器生成模块中预置以下子模块: 样本密度估计模块、 虚拟异 常样本生成模块、 训练集生成模块、 测试集生成模块、 OCSVM (One-class Support Vector Machine, 单分类支持向量机) 训练模块、 ROC (Receiver Operating Characteristics curve, 接受者操作特征曲线) 性能计算模块、 控制参数设置模 块、 宽度参数优化模块、 终止条件判定模块、 初始分类器生成模块、 控制限生成 模块以及优化分类器合成模块; ②将步骤 2)中, 数据预处理模块归一化预处理后 得到的总样本集 β输入样本密度估计模块, 通过样本密度估计模块得到各个样本 的估计样本密度值, 并输入给虚拟异常样本生成模块, 虚拟异常样本生成模块根 据各个样本的估计样本密度值生成虚拟异常样本集 , 同时得到正
Figure imgf000006_0001
常样本集^ ^ …,^^; 其中, 为指定的密度限值, 即选取前 ^*^」个 估计样本密度值最小的样本点作为异常样本点; L」表示取整运算; ③训练集生成 模块从虚拟异常样本生成模块中得到正常样本集 ^^^,^^^ ,…,^'),并从正常 样本集中随机选取部分正常样本构成训练集{^,^,...^^}, N表示训练集的样本 总数; ④测试集生成模块从虚拟异常样本生成模块中得到正常样本集 ^^^ ^^,…,^^和虚拟异常样本集^ ,^,…,^^^, 并将正常样本集和虚 拟异常样本集组合得到测试集 r:
Figure imgf000006_0002
其中, 为样本类别标签, =-ι表示虚拟异常样本, =1表示正常样本, 且
_ J-l = 1,2"..,L *N」
y' ~ |l =L *W」+1,L *N」+2,...,N
⑤将步骤③中训练集生成模块得到的训练集 ^^,...^^^ 以及控制参数设置模 块中设置的控制参数 v、 当前宽度参数优化模块中设置的宽度参数 σ输入到 0CSVM 训练模块中, 0CSVM训练模块通过求解如下的优化问题:
Figure imgf000006_0003
s.t. 0<at≤~^~,i = \,...,NT (1)
NT 得到寻优向量 ^(«ρ^...,^) 的最优解, 记为 ,《D, 从而得到分类 面, 分类面表达式为:
Figure imgf000007_0001
其中: 式 (1) 中的01 = («1,《2,..., ^) 为拉格朗日乘子, 且为优化问题的寻优向量; 、 X X
^(,_/ = l,...,N)为训练集样本; (^,i = exp( -)为高斯核函数, Ντ% σ 训练集的样本总数; 式 (2) 中 Χ为变量; 满足 >0的样本 ^称为支持向量; 由 式 (3) 给出, 其中, 对应的^满足 0< <1:
Ντ
(3)
⑥将步骤⑤得到的分类面和步骤④测试集生成模块得到的测试集 Γ输入 R0C 性能 计算模块, 计算 AUC (Area under an ROC curve, ROC 曲线下的面积值) 值, 记 为 A ; ⑦将上述步骤⑥得到的最终 AUC 值 ^输入到终止条件判定模块中, 比较当 前 AUC值 ^和当前终止条件判定模块中的 AUC最优值 , 根据智能优化算法选择 二者中的较大值存储为 , 相应的宽度参数值记为 其中, 初始状态下, 终止 条件判定模块中的 AUC最优值 为 0,相应的宽度参数 也为 0;终止条件判定模 块判断当前状态是否满足终止条件判定模块中预置的对宽度参数 寻优的终止条 件: 如果当前状态不满足终止条件, 则进入宽度参数优化模块, 根据智能优化算 法更新宽度参数 的值, 并返回步骤⑤继续迭代; 如果当前状态满足终止条件, 则输出 AUC最优值 对应的宽度参数值 σ*; ⑧将步骤⑦优化后得到的宽度参数 输入初始分类器生成模块, 形成初始的故障检测器, 其表达式如下:
(χ) = η (4) 其中, ( = l,...,N )为式 (1)所示优化问题在宽度参数取 ^时得到的最优解; 与 N 的含义与步骤⑤所述相同, X为待检测的样本数据, η(·)是符号函数且满
; 由上式 (3) 给出; / (x) = l表示样本 X为正常样本,
Figure imgf000007_0002
-1表示样本 x为异常样本; ⑨将步骤 3) 中设定的置信水平值《、 总样本 集 ρ = {Χι,Χ2,...,ΧΛΓ}以及步骤⑧得到的初始故障检测器输入控制限生成模块, 根据 置信水平值《和各个样本到初始分类面的近似距离确定控制限的大小, 记为
C— Limits; ⑩将步骤⑧得到的初始故障检测器和步骤⑨得到的控制限^:_ ^^输 入优化分类器合成模块, 得到最终的优化故障检测器, 其表达式如下:
/(X) = sgn ^ *K(x, x.)- 7-C_ Limits (5) 其中,各符号的含义和计算方式与上述步骤相同; 当 /(χ) = 1时,表示待测样本 X为 正常样本, /(x) = -l表示待测样本 X为异常样本。
所述步骤②中, 通过样本密度估计模块得到各个样本的估计样本密度值, 虚 拟异常样本生成模块根据各个样本的估计样本密度值生成虚拟异常样本集和正常 样本集的步骤如下: (a) 估计各个样本点处的密度 Α( = 1,...,Λ 的表达式为;
3Κ
Pi = exp ('• = 1"..,N) (6) 其中, A( = 1,...,N)表示第 个样本点的密度估计值; d(Xi.,Xf)表示第 个样本点和 与其距离最近的 个最近邻样本点间距离的平均值; =i| (X Xf)表示所有 样本点上述距离值 wxxf)的平均值; 表示指定的充分小的正数, 优选范围为
10_7〜10- 4, 以防分母出现为零的情况; (b)将各个样本点处的密度按从小到大排 序,排序后记为 Α'≤ ≤…≤ A,排序后的密度对应的样本数据记为 {Χι',χ2',...,½'}, 即样本 x/处的密度值为 /; (c) 指定密度限值 ^, 密度限值;^可以根据经验公式 = min(0.015*m,0.1)进行选择, 其中, 为样本的维数, 即监测传感器的个数; 并 选取前 *N」个密度最小的样本点作为异常样本点, 其中, L」表示取整运算, 从 而得到虚拟异常样本集 {χ ,χ ,..., x^^'}和正常样本集 ^^」+1', +2',. 所述步骤⑤中, 控制参数设置模块中的控制参数 V表示错分样本数占总样本 数比例的上界; 支持向量数占总样本数比例的下界, 控制参数 V的优选范围为 0.01〜0. 1; 宽度参数优化模块中宽度参数(7的寻优范围和初始值为: 选择样本之 间距离的平均值的 1/10作为下界, 选择样本之间距离的最大值作为上界, 上下界 的平均值作为初始值。
所述步骤⑥中, R0C性能计算模块计算 AUC值的具体步骤如下: (a)计算测试 集 Γ中的每个样本点到步骤⑤得到的分类面的近似距离, 第 _ 个测试样本 x/到分 类面的近似距离 '为
Figure imgf000009_0001
其中, _/ = l,...,N, «;, ^以及 N的含义与步骤⑤所述相同, 由上式 (3) 给出; 按照近似距离大小递减排序, 测试集 Γ排序后重新记为:
其中, 对应的近似距离记为 , 且 (b) 初始化: 记测试集中正 常样本的数目为 Np, 虚拟异常样本的数目为 N„ ; 正常样本被判为正常的数目 TP = TP_pre = 0,异常样本被判为正常的数目 = _ pre = 0; AUC面积值 ^4 = 0, 样本点到分类面的近似距离值^_^^ = -∞,迭代步数 = 1; (c)如果排序后的第 个 测 试 样 本 ^ 对 应 的 近 似 距 离 满 足 : ≠d_pre , 则 : 令 A = A+\FP-FP_pre\*(TP + TP_pre)/2, d_pre = di, FP _pre = FP , TP pre = TP , 进入步骤(d); 如果 =d_ re, 直接进入步骤(d); (d)如果第 个测试样本 的 类别标签 =1, 则: ΓΡ = 7Ρ + 1 ; 否则 Ρ = ^ρ + ΐ ; (e) i = i + l , 并判断 ≤N是否满 足: 若满足该条件, 则转步骤 (c) 继续迭代; 若条件不满足, 则终止循环, 进入 下面的步骤 (f); (f) A = A+\Nn -FP pre \ Np +TP_pre)/2; (g) 由于 ROC曲线 是以异常样本被判为正常的比率 FPR 作为横坐标、 以正常样本被判为正常的比率 TPR作为纵坐标绘制出的二维图形, 因此, 步骤 (f) 中得到的 AUC面积值 的最 终结果为^ 4 = /(Np XN„), 输出最终的 AUC面积值 结束。 所述步骤⑦中, 终止条件判定模块中, 预置总的优化迭代次数的上限值作为 宽度参数^寻优的终止条件。
所述步骤⑨中, 控制限生成模块根据置信水平值 和各个样本到初始分类面 的近似距离, 确定控制限 C_ J to的步骤如下: (a) 在 {1,2,...,N}中随机选取一个 整数, 并记录该整数对应的总样本集^^ ^,…^^中的样本; 重复上述选取, 直至选取出 N个样本, 组成一个新的集合, 作为一组自助样本, 记为 ,^,...,^}; d ..., }中的样本数与总样本集 ρ = {Χι,Χ2,...,½}中的样本数相同, 都为 N个; (b)将上述步骤 (a) 重复 g次, 生成 g组与总样本集 ρ = {Χι,Χ2,...,½}含量相同的 自助样本; (c) 对每一个自助样本进行以下操作: 计算该自助样本中各样本点到 初始分类面的近似距离, 表达式 :
Figure imgf000010_0001
其中, ο 、 ^以及 N的含义与步骤⑧所述相同, i为自助样本中的第 _个样本, 由式 (3) 确定; 按照近似距离从小到大排序, 根据指定的置信水平值《选取第 ^*^」个距离值作为该自助样本的控制限; 第 个自助样本的控制限记为 C_ Limits, , k = l,2,...,q ; ( d) 取 g个控制限的平均值作为最终控制限 C_ m 的 值, BP:
1 q
C _ Limits =— C_ Limits k (9)
~ q t=i 本发明由于采取以上技术方案, 其具有以下优点: 1、 本发明利用样本的密度 信息构造出虚拟异常样本以用于后续的分类器优化过程当中, 从而不需要系统本 身提供足够数量的异常样本, 因此, 能够应用于只基于正常样本数据集的故障检 测问题, 应用范围广。 2、 本发明通过样本密度信息和密度限构造虚拟异常样本, 使得分类面的形状能够反映正常样本在空间中的分布特点, 从而使优化分类面能 够更加适当地包围样本数据, 松紧程度适中。 3、 本发明以 AUC值作为评价指标, 使故障检测器在保证得到较高 TPR的同时, 降低了 FPR的值, 从而提高了分类面 的推广能力。 4、 本发明采用单参数寻优, 寻优过程简单。 5、 本发明通过控制限 调整分类面的位置, 使得分类面处于人为可控的状态, 从而可以根据实际需要在 线折中调节第一类错误率 (正常样本被判为异常的概率) 和第二类错误率 (异常 样本被判为正常的概率) 的大小, 同时, 控制限还降低了数据采集误差等噪声对 分类面的影响。 本方法构思巧妙, 精确实用, 可广泛应用于工业生产线运行状态 的故障检测中。
附图说明
图 1是本发明结构示意图
图 2是本发明模块结构示意图
图 3是本发明优化故障检测器生成模块的子模块结构示意图
图 4是本发明在二维圆环形数据集下得到的二维样本点及分类面显示图, 图
4a是宽度参数 (7初始值取 1. 4067得到的结果, 图 4b是经过本发明优化后得到的 结果
图 5是本发明在二维圆环形数据集下得到的 R0C曲线, 图 5a是宽度参数 ^初 始值取 1. 4067得到的结果, 图 5b是经过本发明优化后得到的结果
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。
本发明方法包括以下步骤:
1 ) 如图 1所示, 设置一包括数据采集设备 A、 置信水平设置模块 B和带显示 屏的监控计算机 C的故障检测设备; 数据采集设备 A的输入端连接工业生产线中 的各个监测传感器,输出端电连接至监控计算机 C, 置信水平设置模块 B的输出端 连接监控计算机(。 如图 2所示, 监控计算机 C内预设置有一数据预处理模块 1、 一优化故障检测器生成模块 2和一优化故障检测器应用模块 3。如图 3所示,优化 故障检测器生成模块 2又包括以下子模块: 样本密度估计模块 21、 虚拟异常样本 生成模块 22、 训练集生成模块 23、 测试集生成模块 24、 0CSVM训练模块 25、 R0C 性能计算模块 26、控制参数设置模块 27、 宽度参数优化模块 28、终止条件判定模 块 29、 初始分类器生成模块 210、 控制限生成模块 211 以及优化分类器合成模块 212。
2 ) 如图 1〜3所示, 通过数据采集设备 A采集生产过程中产生的正常数据, 并将正常数据传输到监控计算机 C中, 通过数据预处理模块 1对上述正常数据进 行归一化预处理, 从而得到总样本集 β。
在监测工业生产过程中, 数据采集设备 Α连接的监测传感器的数量为 个, 对上述 个监测传感器进行 N次数据采集, 则 N次采集后, 通过数据预处理模块 1对上述数据进行归一化处理得到的样本数据集合即为总样本集 β :
β = {Χ1 , Χ2 " ··, ½ }
其中, 对 m个监测传感器进行第 次数据采集, 并经过归一化处理后得到的样 *¾xi =(x,1,x,2,...,x,m)i eRm , 表示 w维列向量; i = \,2 .,N ·, 在样本 x中, 对 第 j个监测传感器在第 次数据采集并经过归一化处理后得到的单个样本数据值为 ¾, j = H..,m。
3)在置信水平设置模块 B中, 对生产过程中采集到的正常数据的真实程度进 行评估, 设定置信水平值 。 置信水平值 的含义为: 由于测量噪声等因素的影 响, 使得得到的正常数据的可信赖程度降低, 若通过经验认为得到的正常数据中 有 (1-«)%的正常数据是可信赖的, 则确信该 (1-«)%的正常数据是正常的。
4) 将上述步骤 2) 中的总样本集 β和步骤 3) 中设定的置信水平值 输入到 优化故障检测器生成模块 2中, 寻优得到优化故障检测器的模型。
5) 优化故障检测器应用模块 3存储步骤 4) 得到的优化故障检测器的模型。
6)工业生产过程中, 通过各监测传感器检测到的数据经过数据采集设备 Α采 集和监控计算机 C中的数据预处理模块 1归一化处理后, 输入优化故障检测器应 用模块 3中, 通过优化故障检测器应用模块 3中存储的优化故障检测器, 实时输 出故障检测结果。
上述步骤 4) 中, 寻优得到优化故障检测器模型的关键是通过优化过程得到 控制参数 V和宽度参数 σ的最优值, 最终得到优化故障检测器模型, 其步骤如下:
①将步骤 2)中, 数据预处理模块 1归一化预处理后得到的总样本集 β输入样 本密度估计模块 21, 通过样本密度估计模块 21 得到各个样本的估计样本密度值 后,输入给虚拟异常样本生成模块 22, 虚拟异常样本生成模块 22根据各个样本的 估计样本密度值生成虚拟异常样本集, 同时得到正常样本集, 具体步骤如下:
(a)估计各个样本点处的密度 A.( = 1,...,N); 目前应用较为广泛的样本点密度 估计方法有以下两种: K-近邻密度估计法和 Parzen窗密度估计法; 本实施步骤中 采用 K-近邻密度估计法, :
Figure imgf000012_0001
其中, A.( = 1,...,N)表示第 个样本点的密度估计值; d(Xi.,Xf)表示第 个样本点和 与其距离最近的 个最近邻样本点间距离的平均值; =i| (X Xf)表示所有 样本点上述距离值 wxxf)的平均值; 表示指定的充分小的正数, 优选范围为
10_7〜10- 4, 以防分母出现为零的情况; (b) 将各个样本点处的密度按从小到大排序, 排序后记为
Figure imgf000013_0001
排序后的密度对应的样本数据记为 ^', ,...,½'}, 即样本 χ/处的密度值为 /;
(c) 指定密度限值 , 密度限值;^可以根据经验公式 = min(0.015* ,0.1)进 行选择, 其中, 为样本的维数, 即传感器的个数; 并选取前 L * N」个估计样本 密度值最小的样本点作为虚拟异常样本点, 其中, L」表示取整运算, 从而得到虚 拟异常样本集^ ^ ,…^^^^和正常样本集^^」 ,:^^」 ,...,:^')。
②训练集生成模块 23 从虚拟异常样本生成模块 22 中得到正常样本集 { AiJ+1',xM+2',...,x }, 并从正常样本集中随机选取部分正常样本构成训练集 { ,, ,,.,., ^} , N表示训练集的样本总数。
③测试集生成模块 24 从虚拟异常样本生成模块 22 中得到正常样本集 ^^^ ^^,…,^^和虚拟异常样本集^ ,^',...,^^」^, 并将正常样本集和虚 拟异常样本集组合得到测试集 Γ:
Figure imgf000013_0002
其中, 为样本类别标签, = -ι表示虚拟异常样本, =1表示正常样本, 且
_ J-l = 1,2"..,L *N
y' ~ |l =L *W +1,L *N +2,...,N
④将步骤②中训练集生成模块 23得到的训练集 {^,^,..., ^},控制参数设置 模块 27中设置的控制参数 v,以及当前宽度参数优化模块 28中设置的宽度参数 σ 输入到 0CSVM训练模块 25中, 得到一个分类面, 具体步骤如下。
控制参数设置模块 27中控制参数 V的物理意义: 错分样本数 (正常样本被判 为异常样本或异常样本被判为正常样本) 占总样本数比例的上界; 支持向量数占 总样本数比例的下界。 控制参数 V的优选范围为 0.01〜0.1。
宽度参数优化模块 28中宽度参数 ^的寻优范围和初始值: 现有不少文献针对 宽度参数 的选择进行了分析, 得到了一些有用的结果; 实际选择宽度参数 ^7的 上下界和初始值时, 可以参考已有的结论并综合考虑计算复杂度进行选择。 如可 以选择样本之间距离的平均值的 1/10作为下界, 选择样本之间距离的最大值作为 上界, 上下界的平均值作为初始值; 或采用后面具体仿真例中使用的选择方法等。
0CSVM训练模块 25通过求解如下的优化问题:
Figure imgf000014_0001
s.t. <at< (2)
Ντ
得到寻优向量 ^(«Ρ^...,^)的最优解, 记为 ,《D, 从而得到分类 面, 分类面表达式为:
Figure imgf000014_0002
其中: 式 (2) 中的 ο^^ρ ,...,^^;) 为拉格朗日乘子, 且为优化问题 (式 (2)) χ,·_χ
的寻优向量; i U = 1,...,N)为训练集样本; (^ = eXp( -)为高斯 σ 核函数, N为训练集的样本总数; 式 (3) 中 Χ为变量; 满足 >0的样本 ^称为 支持向量, 显然, 只有当 >0时, 式 (3) 中的对应项 (X,i)才有计算的必要; 表示分类面的偏移量, 由式 (4) 给出, 其中 对应的^满足 0< <1条件:
Ντ
(4)
⑤将上述步骤④得到的分类面和步骤③测试集生成模块 24得到的测试集 Γ输 入 R0C性能计算模块 26, 计算 AUC值, 记为 A。
计算 AUC值的具体步骤如下:
(a) 根据式 (5) 计算测试集 Γ中的每个样本点到步骤④得到的分类面的近 似距离, 第 _ /个测试样本 x/到分类面的近似距离 为
Figure imgf000014_0003
dj = laiK xj ^~p (5) 其中, _/ = l,...,N, «;, ^以及 N的含义与步骤④所述相同, 由上式 (4) 给出; 按照近似距离大小递减排序, 测试集 Γ排序后重新记为:
Figure imgf000015_0001
其中, 对应的近似距离记为 , 且
(b)初始化: 记测试集中正常样本的数目为 Np, 虚拟异常样本的数目为 N„; 正常样本被判为正常的数目 TP = TP_pre = 0 ,异常样本被判为正常的数目 FP = FP pre = Q, 其中 ROC曲线的横坐标 FPR =FP I Nn, 纵坐标 TPR = TP/Np; AUC 面积值 = 0, 当前循环的前一步存储的近似距离值^_/^6 = -∞, 迭代步数 = 1;
(c)如果排序后的第 个测试样本 对应的近似距离 满足: ≠d_pre,贝 IJ: A = A+\FP-FP _pre\*(TP + TP _pre)/2 , d _pre = di, FP _pre = FP , TP pre = TP , 进入步骤 (d); 如果 =d_/^, 直接进入步骤 (d);
(d)如果第 个测试样本 的类别标签 =1, 则 ΓΡ = 7Ρ + 1; 否则 F^FP + l;
(e) i = i + l, 并判断 ≤N是否满足: 若满足该条件, 则转步骤 (c) 继续迭 代; 若条件不满足, 则终止循环, 进入下面的步骤 (f);
(f)令^ 4 = + I N„ _ 尸_ re I *(Np + TP pre) 12;
(g) 由于 ROC曲线是以 FPR (False Positive Rate, 异常样本被判为正常的 比率) 作为横坐标、 以 TPR (True Positive Rate, 正常样本被判为正常的比率) 作为纵坐标绘制出的二维图形, 因此, 步骤 (f) 中得到的 AUC面积值 的最终结 果为^ 4 = /(Np XN„), 输出最终的 AUC面积值 结束。
⑥将上述步骤⑤得到的最终 AUC面积值 ^输入到终止条件判定模块 29中, 比 较当前 AUC面积值 ^和当前终止条件判定模块 29中的 AUC最优值 , 根据智能 优化算法选择二者中的较大值存储为 , 相应的宽度参数值记为 其中, 初始 状态下, 终止条件判定模块 29中的 AUC最优值 为 0, 相应的宽度参数 也为 0; 终止条件判定模块 29判断当前状态是否满足终止条件判定模块 29中预置的对 宽度参数^寻优的终止条件:
如果当前状态不满足终止条件, 则进入宽度参数优化模块 28, 根据智能优化 算法更新宽度参数 σ的值, 并返回步骤④继续迭代;
如果当前状态满足终止条件, 则输出 AUC最优值 对应的宽度参数值 。 终止条件判定模块 29中预置的终止条件不唯一, 因此, 采用不同的智能优化 算法进行宽度参数 σ寻优, 该终止条件就可能不同, 例如: 可以设置总的优化迭 代次数的上限值作为宽度参数^7寻优的终止条件; 或采用仿真例中模拟退火算法 中使用的终止条件 系统温度是否降至终止温度等。
⑦将步骤⑥优化后得到的宽度参数 ^输入初始分类器生成模块 210, 形成初 始的故障检测器, 并进入后续步骤; 此初始故障检测器的检测模型如下式所示:
(x) = sgn (6) 其中, ο ( = 1,..., )是上述式(2)所示优化问题在宽度参数取 时得到的最优解; ^与 N的含义与步骤④所述相同, X为待检测的样本数据, η(·)是符号函数且满 足 η X ; 由上式 (4) 给出; /to(x) = l表示样本 X为正常样本,
Figure imgf000016_0001
fflrst (χ) = -1表示样本 X为异常样本。
⑧将步骤 3)中设定的置信水平值"、总样本集 ρ = {Χι2,...,½}以及步骤⑦得 到的初始故障检测器输入控制限生成模块 211,根据置信水平值《和各个样本到初 始分类面的近似距离确定控制限的大小, 记为 C— Limits', 控制限的具体计算步骤 如下:
(a) 在 {1,2,...,N}中随机选取一个整数, 并记录该整数对应的总样本集 ρ = {Χι,Χ2,...,ΧΛΓ}中的样本; 重复上述选取 (包括多次选取同一整数的情况), 直至 选取出 N个样本, 组成一个新的集合, 这个新集合便是一组自助样本, 记为
{^2,. ,^}; ,^,..., }中的样本数与总样本集 ρ = {Χι2,...,½}中的样本数相 同, 都为 N个, 但是 ^^,...,^}中的样本有可能会出现重复。
(b)将步骤 (a) 重复 g次, 生成 g组与总样本集 ρ = {Χι,Χ2,...,½}含量相同的 自助样本;
(c)对每一个自助样本进行以下操作: 计算该自助样本中各样本点到初始分 类面的近似距离, 计算公式如下式 (7) :
Figure imgf000016_0002
其中, a:、 ^以及 N的含义与步骤⑦所述相同, i为自助样本中的第 _/个样本, 由式 (4) 确定; 按照近似距离从小到大排序, 根据指定的置信水平值《选取第 | «*N|个距离值作为该自助样本的控制限; 第 个自助样本的控制限记为 C— Limits k, k = \,2,...,q;
(d) 取 g个控制限的平均值作为最终控制限 C_ Jm 的值, 即:
1 q
C _ Limits =— C_ Limits k (8)
~ q
⑨将步骤⑦得到的初始故障检测器和步骤⑧得到的控制限 C_ Jm 输入优化 分类器合成模块 212, 得到最终的优化故障检测器, 其检测模型函数表达式如下:
/(X) = sgn ^ *K(x, x.)- 7-C_ Limits (9) 其中,各符号的含义和计算方式与上述步骤相同; 当 /(χ) = 1时,表示待测样本 X为 正常样本, /(x) = -l表示待测样本 X为异常样本。
下面列举一具体的仿真例进行说明:
本仿真例采用二维圆环形数据集进行仿真实验, 该数据集共有 600个正常样 本数据, 即 N = 600, m = 2 (即有两个传感器)。 其仿真步骤及参数设定情况如下:
(1) 对数据集进行归一化处理, 得到样本集 ρ = {Χι,Χ2,...,ΧΛΓ}。
(2) 指定置信水平"的值为 0.03。
(3) 根据式 (1) 计算各个样本点处的密度 A.( = 1,...,N), 其中 取为 10_6。 密度限 取为 = min(0.015*m,0.1) = 0.03, 得到含有 582 个样本点的正常样本集 ^^」+1', ^」+2',...,½'}和含有 18个样本点的虚拟异常样本集 {«,...,^^」'}。 随 机选取正常样本集中的 2/3部分构成训练集 ,因此训练集共含有 388 个样本, 即 Λ^=388。综合正常样本集和虚拟异常样本集并添加类别标签得到测试 集, 其含有 600个样本。
(4)根据参数的物理概念选择控制参数 V为 0.05。 记训练集中任意两两不同 样本点之间的欧式距离组成的集合为 { | \\,i< j,i = \,...,NT,j = \,...,NT}, 则宽度参数 σ的上限可取为 σ =^χ (其中, dmax是集合 中的最大值), 下限 可取为 ^^ e ^^VlO (其中, e «)是集合 }所有元素的平均值), 初始 值取为 σ )。
Figure imgf000017_0001
(5)本仿真例中使用的智能优化算法为模拟退火算法, 使用模拟退火算法对 参数 ^7进行寻优的过程如下:
①初始化: 初始温度 Γ =0.005, 终止温度 7} =0.0001, 降温函数的温差系数 ΔΓ = 0.0005 , c/c=0.001为很小的正数, 八^ ^皿-^^) 。, 并计算初始 σ值下
0CSVM训练结果的 AUC值和支持向量的数目 nsv
②设置内循环次数 "为 = 3l8(1/¾), 初始化 p = 1
③ 在 单 次 内 循 环 中 : 在 σ 的 邻 域 [σ-Δ σ + Δ ] ( 其 中 Af = mm(A ,a-amin,amiX-a)) 内随机产生一个新的 在新参数下进行 0CSVM 训练, 生成新的分类面, 并求取新的 AUC值 ^4^ 和相应的支持向量数目 / ; 若下述三种情况中的任意一种满足: ( a ) AUCnew-AUC>sAUC ( b )
AUC -AUC< -sAUC且 cxV(AUC-~AUC)大于 (0 1)区间上产生的随机数; ( c ) f/C ^ί^|≤^^且 / </ ; 则更新 σ = σ AUC = AUCnew, nsv = nsv^
④ / = p + l; 如果 p≤w, 则转步骤③继续迭代; 否则, 结束内循环, 转步骤
⑤;
⑤降温函数! 二! -八^, 比较此时的 Γ。和 7}的大小: 如果 7 ≥7}, 则返回步骤 ②继续迭代; 否则, 结束整个模拟退火算法, 输出最终得到的参数 σ的值, 记为 最优值 σ
(6)根据最优参数对 (ν,σ^训练样本, 得到初始分类器。 选择 g = 30, 再根据 置信水平 α = 0.03、 测试集和初始分类器计算得到控制限^_ ^^。 再将初始分类 器和控制限合成, 便可得到优化故障检测器, 其检测模型表达式如式 (8) 所示。
仿真得到的结果如图 4和图 5所示。 其中, 图 4显示的是在二维圆环形数据 集下得到的二维样本点及分类面显示图, 图 4a 为^取初始值得到的结果, 图 4b 为经过本发明优化后得到的结果。 从图 4中可以看出, 图 4a中分类面内部有很大 的空隙, 分类面并没有很好地包围样本点; 而图 4b中的分类面则将样本点包围地 恰到好处, 松紧程度适中。 图 5显示的是对应上述两种情况的 R0C曲线, 其中, 图 5 为(7取初始值得到的 R0C曲线, 其 AUC值为 0.6816; 图 5b为经过本发明优 化后得到的 R0C曲线, 其 AUC值为 0.9918。 可见, 经过本发明的优化处理后, 故 障检测器对应的 AUC值有了很大的提升, 大大提高了故障检测器的检测性能。 上述各实施例仅用于说明本发明, 其中各部件的结构、 连接方式等都是可以有所 变化的, 凡是在本发明技术方案的基础上进行的等同变换和改进, 均不应排除在 本发明的保护范围之外。

Claims

权 利 求 书
1、 一种基于密度的参数优化单分类支持向量机故障检测方法, 其包 括以下步骤:
1) 设置一包括数据采集设备、 置信水平设置模块和监控计算机的故 障检测设备; 所述监控计算机内预设置有一数据预处理模块、 一优化故障 检测器生成模块和一优化故障检测器应用模块;
2) 数据采集设备采集工业生产线中各监测传感器产生的正常数据, 并传输给监控计算机的数据预处理模块, 数据预处理模块进行归一化预处 理后得到总样本集 ρ = {Χι2,...,½};
其中, N表示数据采集设备对各个监测传感器进行 N次数据采集; x!.=(x,1,x,2,...,x,m)rei?"1, 表示对 个监测传感器进行第 次数据采集, 并 经过归一化处理后得到的样本, 表示监测传感器的个数, 表示 维列 向量; = 1,2,...,N; ¾表示在样本 X中, 对第 _/个传感器在第 次数据采集 并经过归一化处理后得到的单个样本数据值, j = l,2"."m;
3) 在置信水平设置模块中, 对生产过程中采集到的正常数据的真实 程度进行评估, 设定置信水平值《;
4)将上述步骤 2)中的总样本集 β和步骤 3)中设定的置信水平值《输 入到优化故障检测器生成模块中, 寻优得到优化故障检测器的模型:
/(X) = sgn ^ *K(x, X.) - 7-C_ Limits 其中, 当/ (x) = l时, 表示待测样本 X为正常样本, /(X) = -l时, 表示待 样本 X为异常样本; η(·)是符号函数且满足 sgn(x) ^表
Figure imgf000020_0001
示训练集的样本总数; ^表示训练集样本; 表示拉格朗日乘子的最优解; (x,i)表示高斯核函数; 表示分类面的偏移量; C_ J to表示控制限;
5)优化故障检测器应用模块存储步骤 4)得到的优化故障检测器的模 型;
6) 工业生产过程中, 实时通过数据采集设备采集各监测传感器输出 的数据, 并通过监控计算机中的数据预处理模块归一化处理后, 输入优化 故障检测器应用模块中, 通过优化故障检测器应用模块中存储的优化故障 检测器, 实时输出故障检测结果。
2、 如权利要求 1 所述的一种基于密度的参数优化单分类支持向量机 故障检测方法, 其特征在于: 所述步骤 4) 中, 寻优得到优化故障检测器 模型的关键是通过优化过程得到控制参数 V和宽度参数 σ的最优值, 最终 得到优化故障检测器模型, 其步骤如下:
①在所述优化故障检测器生成模块中预置以下子模块: 样本密度估计 模块、 虚拟异常样本生成模块、 训练集生成模块、测试集生成模块、 0CSVM
(One-class Support Vector Machine, 单分类支持向量机) 训练模块、 ROC ( Receiver Operating Characterist ics curve , 接受者操作特征曲 线) 性能计算模块、 控制参数设置模块、 宽度参数优化模块、 终止条件判 定模块、初始分类器生成模块、控制限生成模块以及优化分类器合成模块;
②将步骤 2 )中,数据预处理模块归一化预处理后得到的总样本集 ρ输 入样本密度估计模块, 通过样本密度估计模块得到各个样本的估计样本密 度值, 并输入给虚拟异常样本生成模块, 虚拟异常样本生成模块根据各个 样本的估计样本密度值生成虚拟异常样本集 ',^',...^^^'},同时得到正 常样本集 ^ 申', 其中, 为指定的密度限值, 即选取前 ^^* 」个估计样本密度值最小的样本点作为异常样本点; L」表示取整运
③训练集生成模块从虚拟异常样本生成模块中得到正常样本集
{ Vj+1', xM+2', ..., X }, 并从正常样本集中随机选取部分正常样本构成训 练集 ^,^,..., ^, N表示训练集的样本总数;
④测试集生成模块从虚拟异常样本生成模块中得到正常样本集 ^^^ ^^,…,^^和虚拟异常样本集^',^',..., ^」 , 并将正常样本 集和虚拟异常样本集组合得到测试集 Γ: )' · · · ' (½ Ί
Figure imgf000021_0001
其中, 为样本类别标签, =-ι表示虚拟异常样本, =1表示正常样本, 且 = = 1,2,...,L *N」
y' ~
Figure imgf000022_0001
=L *w」+i,L *N」+2,...,N
⑤将步骤③中训练集生成模块得到的训练集 , ,..., }, 以及控制 参数设置模块中设置的控制参数 V、 当前宽度参数优化模块中设置的宽度 参数 σ输入到 OCSVM训练模块中, 0CSVM训练模块通过求解如下的优化问
Figure imgf000022_0002
得到寻优向量 a = ( , a2, ..., a 的最优解, 记为 a = ( , , ..., f, 从而 得到分类面, 分类面表达式为:
Figure imgf000022_0003
其中: 式 (1) 中的 ^(^,^,…, ;^为拉格朗日乘子, 且为优化问题的寻 优向量; 、 ^( = 1,...,N)为训练集样本; (^, ) = 6 ( 2 ~~ -)为高 σ 斯核函数, N为训练集的样本总数; 式 (2) 中 Χ为变量; 满足 >0的样 本 ^称为支持向量; 由式(3)给出,其中, 对应的 满足 0< <1: νΝτ p = ^a*K(xk, ) (3)
⑥将步骤⑤得到的分类面和步骤④测试集生成模块得到的测试集 r输 入 ROC性能计算模块, 计算 AUC (Area under an ROC curve, ROC曲线下 的面积值) 值, 记为 A;
⑦将上述步骤⑥得到的最终 AUC值 A输入到终止条件判定模块中, 比 较当前 AUC值 ^和当前终止条件判定模块中的 AUC最优值 , 根据智能优 化算法选择二者中的较大值存储为 , 相应的宽度参数值记为 σ* ; 其中, 初始状态下,终止条件判定模块中的 AUC最优值 Α*为 0,相应的宽度参数 也为 0; 终止条件判定模块判断当前状态是否满足终止条件判定模块中预 置的对宽度参数 寻优的终止条件:
如果当前状态不满足终止条件, 则进入宽度参数优化模块, 根据智能 优化算法更新宽度参数^7的值, 并返回步骤⑤继续迭代;
如果当前状态满足终止条件,则输出 AUC最优值 对应的宽度参数值 σ
⑧将步骤⑦优化后得到的宽度参数 俞入初始分类器生成模块, 形成
Figure imgf000023_0001
其中, ( = l,...,N )为式 (1) 所示优化问题在宽度参数取 时得到的最 优解; ^与 N的含义与步骤⑤所述相同, X为待检测的样本数据, η(·)是 符号函数且满足 sgn(x) ; 由上式(3)给出; / (x) = l表示
Figure imgf000023_0002
样本 X为正常样本, /to(x) = _l表示样本 X为异常样本;
⑨将步骤 3) 中设定的置信水平值 、 总样本集 ρ χ,,χ ,...,χ
Figure imgf000023_0003
步骤⑧得到的初始故障检测器输入控制限生成模块, 根据置信水平值《和 各个样本到初始分类面的近似距离确定控制限的大小, 记为 C— Limits;
⑩将步骤⑧得到的初始故障检测器和步骤⑨得到的控制限^:_ ^^ 输入优化分类器合成模块, 得到最终的优化故障检测器, 其表达式如下:
/(X) = sgn ^ *K(x, x.)- 7-C_ Limits (5) 其中, 各符号的含义和计算方式与上述步骤相同; 当 /(χ) = 1时, 表示待 ί 样本 X为正常样本, /(χ) = -1表示待测样本 X为异常样本。 3、 如权利要求 2所述的一种基于密度的参数优化单分类支持向量机 故障检测方法, 其特征在于: 所述步骤②中, 通过样本密度估计模块得到 各个样本的估计样本密度值, 虚拟异常样本生成模块根据各个样本的估计 样本密度值生成虚拟异常样本集和正常样本集的步骤如下:
(a) 估计各个样本点处的密度 A.( = 1,...,N)的表达式为;
3Κ
Pi = exp ('• = 1"..,N) (6) 其中, A = 1,...,N)表示第 个样本点的密度估计值; d(Xi.,Xf)表示第 个样 本点和与其距离最近的 个最近邻样本点间距离的平均值; )表示所有样本点上述距离值 Wx Xf)的平均值; 表示
Figure imgf000024_0001
指定的充分小的正数, 优选范围为 10- 7〜10- 4, 以防分母出现为零的情况;
( b ) 将各个样本点处的密度按从小到大排序, 排序后记为 p» -≤(^ , 排序后的密度对应的样本数据记为 {«...,½'}, 即样 本 χ/处的密度值为 /;
( c ) 指定密度限值;^ , 密度限值;^可以根据经验公式 = min(0.015* ,0.1)进行选择, 其中, 为样本的维数, 即监测传感器的 个数;并选取前 *N」个密度最小的样本点作为异常样本点,其中, L」表 示取整运算, 从而得到虚拟异常样本集 ',^',...,^^'}和正常样本集
XL W」+1 ,XL *W」+2 ,···,ΧΝ I。
4、 如权利要求 2所述的一种基于密度的参数优化单分类支持向量机 故障检测方法, 其特征在于: 所述步骤⑤中, 控制参数设置模块中的控制 参数 V表示错分样本数占总样本数比例的上界; 支持向量数占总样本数比 例的下界, 控制参数 V的优选范围为 0.01〜0.1; 宽度参数优化模块中宽 度参数 σ的寻优范围和初始值为:选择样本之间距离的平均值的 1/10作为 下界,选择样本之间距离的最大值作为上界,上下界的平均值作为初始值。
5、 如权利要求 2 所述的一种基于密度的参数优化单分类支持向量机 故障检测方法, 其特征在于: 所述步骤⑥中, R0C 性能计算模块计算 AUC 值的具体步骤如下:
(a) 计算测试集 Γ中的每个样本点到步骤⑤得到的分类面的近似距 离, 第 _个测试样本 x 到分类面的近似距离 '为
其中, _/ = l,...,N, 、 ^以及 N的含义与步骤⑤所述相同, 由上式(3) 给出; 按照近似距离大小递减排序, 测试集 Γ排序后重新记为:
{(¾, i),(¾,y2),...,( N,yw)}
其中, ^对应的近似距离记为 , 且
(b) 初始化: 记测试集中正常样本的数目为^, 虚拟异常样本的数 目为 N„; 正常样本被判为正常的数目 7P = 7P _ pre = 0,异常样本被判为正 常的数目 FP = FP_pre = 0; AUC面积值 = 0, 样本点到分类面的近似距离 值 = -∞, 迭代步数 = 1;
(c) 如果排序后的第 个测试样本 对应的近似距离 满足: dt≠d_pre , 贝 U: 令 A = A+ \ FP - FP _ pre \ *( P + TP _ pre) / 2, d_pre = di , FP_pre = FP, TP pre = TP , 进入步骤 (d); 如果 =d_/^, 直接进入 步骤 (d);
(d) 如果第 个测试样本 的类别标签 =1, 则 ΓΡ = 7Ρ + 1 ; 否则 FP = FP + 1;
(e) i = i + l, 并判断 ≤N是否满足: 若满足该条件, 则转步骤 (c) 继续迭代; 若条件不满足, 则终止循环, 进入下面的步骤 (f);
(f) A = A+\Nn-FP_pre\ *(Np + TP pre) 12;
(g) 由于 ROC曲线是以异常样本被判为正常的比率 FPR作为横坐标、 以正常样本被判为正常的比率 TPR作为纵坐标,绘制出的二维图形, 因此, 步骤 (f) 中得到的 AUC面积值 的最终结果为 = /(Np XN„), 输出最终 的 AUC面积值 ^, 结束。
6、 如权利要求 2所述的一种基于密度的参数优化单分类支持向量机 故障检测方法, 其特征在于: 所述步骤⑦中, 终止条件判定模块中, 预置 总的优化迭代次数的上限值作为宽度参数 σ寻优的终止条件。
7、 如权利要求 2所述的一种基于密度的参数优化单分类支持向量机 故障检测方法, 其特征在于: 所述步骤⑨中, 控制限生成模块根据置信水 平值 c和各个样本到初始分类面的近似距离, 确定控制限 C _ Limits的步骤 如下:
(a) 在 {1,2,...,N}中随机选取一个整数, 并记录该整数对应的总样本 集^^ ^,…^^中的样本; 重复上述选取, 直至选取出 N个样本, 组成 一个新的集合, 作为一组自助样本, 记为 {^,^,..., }; {^,^, ..., }中的 样本数与总样本集 ρ = {Χι2,...,½}中的样本数相同, 都为 N个;
(b)将上述步骤 (a) 重复 g次, 生成 g组与总样本集 ρ = {Χι,Χ2,...,½} 含量相同的自助样本;
(c) 对每一个自助样本进行以下操作: 计算该自助样本中各样本点 到初始分类面的近似距离, :
Figure imgf000026_0001
其中, ο 、 ^以及 N的含义与步骤⑧所述相同, i 为自助样本中的第 _个 样本, 由式 (3) 确定; 按照近似距离从小到大排序, 根据指定的置信 水平值《选取第 L« * N\个距离值作为该自助样本的控制限; 第 A个自助样 本的控制限记为 C_£m , k = \,2,...,q;
(d) 取 g个控制限的平均值作为最终控制限 C_£ m 的值, 即:
1 q
C Limits =— C Limits, (9)
PCT/CN2011/082850 2011-09-14 2011-11-24 基于密度的参数优化单分类支持向量机故障检测方法 WO2013037169A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110271842.7 2011-09-14
CN 201110271842 CN102339389B (zh) 2011-09-14 2011-09-14 一种基于密度的参数优化单分类支持向量机故障检测方法

Publications (1)

Publication Number Publication Date
WO2013037169A1 true WO2013037169A1 (zh) 2013-03-21

Family

ID=45515111

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2011/082850 WO2013037169A1 (zh) 2011-09-14 2011-11-24 基于密度的参数优化单分类支持向量机故障检测方法

Country Status (2)

Country Link
CN (1) CN102339389B (zh)
WO (1) WO2013037169A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103439964B (zh) * 2013-08-13 2015-10-28 清华大学 一种ocsvm监控模型的在线更新系统及方法
JP2015076058A (ja) * 2013-10-11 2015-04-20 株式会社日立製作所 設備の監視診断装置
CN103914064B (zh) * 2014-04-01 2016-06-08 浙江大学 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN105703963B (zh) * 2014-11-26 2017-04-05 中国科学院沈阳自动化研究所 基于pso‑ocsvm的工业控制系统通信行为异常检测方法
CN105704103B (zh) 2014-11-26 2017-05-10 中国科学院沈阳自动化研究所 基于OCSVM双轮廓模型的Modbus TCP通信行为异常检测方法
CN104504583B (zh) * 2014-12-22 2018-06-26 广州品唯软件有限公司 分类器的评价方法
CN107451515A (zh) * 2016-06-01 2017-12-08 易程(苏州)电子科技股份有限公司 一种旋转机械设备故障识别方法及系统
CN106295712A (zh) * 2016-08-19 2017-01-04 苏州大学 一种故障检测方法和系统
CN106404442B (zh) * 2016-09-22 2018-09-04 宁波大学 基于数据邻域特征与非邻域特征保持的工业过程故障检测方法
CN107194815B (zh) * 2016-11-15 2018-06-22 平安科技(深圳)有限公司 客户分类方法及系统
CN107728028A (zh) * 2017-11-07 2018-02-23 武汉大学 基于单类支持向量机的gis局部放电故障判别方法
CN108563548B (zh) * 2018-03-19 2020-10-16 创新先进技术有限公司 异常检测方法及装置
CN108717496B (zh) * 2018-05-22 2022-04-05 北京无线电测量研究所 雷达天线阵面故障检测方法及系统
CN110874088B (zh) * 2018-09-03 2022-12-23 中国船舶集团有限公司第七一一研究所 基于多维向量模型的船舶关键设备系统的监测方法
CN110689324A (zh) * 2019-09-29 2020-01-14 国网湖北省电力有限公司电力科学研究院 一种配电变压器检测结果的辅助评判方法
CN110705654B (zh) * 2019-10-22 2022-11-08 中国工商银行股份有限公司 用于监控资产的方法、装置、电子设备及介质
CN111178436A (zh) * 2019-12-30 2020-05-19 深圳信息职业技术学院 数据处理方法、装置、计算机设备及存储介质
CN111461533B (zh) * 2020-03-31 2023-04-25 佛山科学技术学院 一种基于大数据的工业生产流水线的故障监测方法及系统
CN111898313B (zh) * 2020-06-30 2022-05-20 电子科技大学 一种基于ica与svm集成学习的故障检测方法
CN113266921A (zh) * 2021-06-08 2021-08-17 深圳市英维克信息技术有限公司 一种空调设备故障检测方法、装置、设备及介质
CN114453630B (zh) * 2022-01-20 2023-04-04 湖北文理学院 控制机床铣削不粘刀的方法、装置、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101216436A (zh) * 2008-01-03 2008-07-09 东华大学 一种基于支持向量数据描述理论的织物瑕疵自动检测方法
CN101907088A (zh) * 2010-05-27 2010-12-08 中国人民解放军国防科学技术大学 基于单类支持向量机的故障诊断方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100470417C (zh) * 2006-12-22 2009-03-18 浙江大学 工业生产过程小样本条件下的故障诊断系统及方法
CN101907681B (zh) * 2010-07-15 2012-07-04 南京航空航天大学 基于gsd_svdd的模拟电路动态在线故障诊断方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101216436A (zh) * 2008-01-03 2008-07-09 东华大学 一种基于支持向量数据描述理论的织物瑕疵自动检测方法
CN101907088A (zh) * 2010-05-27 2010-12-08 中国人民解放军国防科学技术大学 基于单类支持向量机的故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HYUN, J.S. ET AL.: "One-class support vector machines-an application in machine fault detection and classification", COMPUTER & INDUSTRIAL ENGINEERING., vol. 48, no. 2, March 2005 (2005-03-01), pages 395 - 408 *
WU, DING-HAI ET AL.: "Review of One-class Classification Method Based on Support Vector", COMPUTER ENGINEERING., vol. 37, no. 5, March 2011 (2011-03-01), pages 187 - 189 *
ZHANG, LI ET AL.: "Network fault detection based on fuzzy one class SVM with least squares and equality constraints", JOURNAL OF COMPUTER APPLICATIONS., vol. 30, no. 10, October 2010 (2010-10-01), pages 2834 - 2837 *

Also Published As

Publication number Publication date
CN102339389B (zh) 2013-05-29
CN102339389A (zh) 2012-02-01

Similar Documents

Publication Publication Date Title
WO2013037169A1 (zh) 基于密度的参数优化单分类支持向量机故障检测方法
JP6547069B2 (ja) 物体検出のためのサブカテゴリ認識機能付き畳み込みニューラルネットワーク
CN105044590B (zh) 一种单测量节点模拟电路故障诊断方法
JP6476861B2 (ja) 電磁界特徴分類提示装置
CN110376457A (zh) 基于半监督学习算法的非侵入式负荷监测方法及装置
US11520676B2 (en) Method and system for power equipment diagnosis based on windowed feature and Hilbert visualization
US20150276557A1 (en) State monitoring system, state monitoring method and medium
CN102999038A (zh) 发电设备的诊断装置、以及发电设备的诊断方法
CN110032490A (zh) 用于检测系统异常的方法及其装置
WO2022052548A1 (zh) 数据分析方法及装置、电子设备、存储介质
CN106198749A (zh) 一种基于金属裂纹监测的多路传感器的数据融合方法
CN115392408A (zh) 一种电子数粒机运行异常检测方法及系统
JP2020042519A (ja) 異常検知装置、異常検知方法、及び異常検知プログラム
CN115619778A (zh) 一种电力设备缺陷识别方法、系统、可读存储介质及设备
CN112955837A (zh) 异常诊断装置、异常诊断方法、及程序
CN110490486B (zh) 一种企业大数据管理系统
CN112785420A (zh) 信用评分模型的训练方法、装置、电子设备及存储介质
CN104268852B (zh) 红外序列图像中弱小目标的检测方法及其检测装置
CN115310499B (zh) 一种基于数据融合的工业设备故障诊断系统及方法
CN114529759B (zh) 一种甲状腺结节的分类方法、装置及计算机可读介质
KR102486463B1 (ko) 열화에 따른 시계열 데이터를 이용한 실시간 이상 감지 방법 및 그를 위한 장치
KR102319262B1 (ko) 인공지능을 이용한 태아 박동 진단방법, 장치 및 시스템
CN114609483A (zh) 一种基于Hilbert变换的GIS局部放电信号特征提取方法
CN113723245B (zh) 往复式压缩机运行状态监测方法、系统、设备及存储介质
CN116186524B (zh) 一种自监督机器异常声音检测方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11872426

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11872426

Country of ref document: EP

Kind code of ref document: A1