CN113009823A - 用于控制机器的方法和设备 - Google Patents
用于控制机器的方法和设备 Download PDFInfo
- Publication number
- CN113009823A CN113009823A CN202011503346.5A CN202011503346A CN113009823A CN 113009823 A CN113009823 A CN 113009823A CN 202011503346 A CN202011503346 A CN 202011503346A CN 113009823 A CN113009823 A CN 113009823A
- Authority
- CN
- China
- Prior art keywords
- value
- variable
- principal component
- variables
- target variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000005259 measurement Methods 0.000 claims abstract description 31
- 238000000513 principal component analysis Methods 0.000 claims abstract description 14
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 description 29
- 230000009021 linear effect Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 230000007547 defect Effects 0.000 description 10
- 230000006399 behavior Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 230000001276 controlling effect Effects 0.000 description 6
- 230000001364 causal effect Effects 0.000 description 5
- 230000002950 deficient Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000007257 malfunction Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000003466 welding Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0221—Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0259—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
- G05B23/0275—Fault isolation and identification, e.g. classify fault; estimate cause or root of failure
- G05B23/0281—Quantitative, e.g. mathematical distance; Clustering; Neural networks; Statistical analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
- G06F2218/16—Classification; Matching by matching signal segments
- G06F2218/20—Classification; Matching by matching signal segments by applying autoregressive analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Automation & Control Theory (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Factory Administration (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
用于控制机器的方法和设备。用于控制机器的计算机实现方法包括:在机器的操作期间感测多个测量事件的测量变量的值;确定多个测量事件中的每个测量事件的目标变量的值;针对每个测量事件确定观测,观测包括测量变量的感测值和目标变量的确定值;执行针对多个观测的主成分分析或内核主成分分析,从而结果得到观测的载荷值和主成分;针对目标变量确定一个或多个主成分,针对该主成分,载荷值的绝对值大于第一预定阈值;针对每个确定主成分标识一个或多个测量变量,针对该测量变量,载荷值的绝对值高于第二预定阈值;将针对每个确定主成分所标识的测量变量分组到相应的组中;和对分组到同一组中的测量变量表示的操作参数执行联合控制以修改目标变量。
Description
技术领域
本公开涉及一种用于通过控制机器的操作参数来控制机器的计算机实现方法。
背景技术
找出计算机控制系统(诸如,生产、制造线、机器人、监控系统或医学成像系统)出现错误、异常、失灵和/或故障的根本原因使得能够提供必要的信息,以便能够校正和改进这些系统。然而,对根本原因的搜索和测量并不是简单的任务,并且通常倾向于不同的潜在解释。
在给定输入数据集D和因果相关的目标变量V的情况下,根本原因分析的主要目标是要在D的给定观测的情况下找到针对V的行为的“最佳”且“最简单”的解释。
例如,在生产线的情况下,目标变量V可以是例如由所部署的机器学习模型预测的故障或逃逸(escape)的概率。理解故障背后的原因对于增加生产线的效率至关重要,例如通过学习并理解生产线的哪些操作参数影响目标变量V并且相应地对其进行修改以减少生产线的故障/逃逸率。
如果目标变量V或D中的变量是某个预测模型(诸如,机器学习模型)的输出,则根本原因分析还可以帮助阐明其一些偏差,从而允许对模型开发循环的更好理解,并且确保在将该模型部署在现场中之前恰当地验证和证实了该模型。
找到数据集中的因果关系可能由于数据集限制而是不可能的。因此,在实践中,找到因果关系通常被找到数据集中的相关性所代替。然而,利用明确解(clear cutsolution)来量化和表示数据集中的相关性是没有问题的。常见方法(诸如,单变量和多变量相关性方法)在传统上尝试从线性逼近的角度根据变量D的集合来解释变量V。通常由单个度量/数字来概括结果,该度量/数字可能通常是误导的或不充分信息源,以致于不能够标识数据集D中的基本动态性(dynamics)。对于其他常见的相关性统计量(诸如,皮尔逊相关性系数、互信息等)也是如此。
用以发现数据集中的相关性(通常也用于降维)的另一种方法是主成分分析PCA,其尝试通过将原始数据点映射到所谓的“主成分轴”上来系统性地分解给定数据集中的方差。PCA分解查找如何从这些轴的线性组合来(以递减次序)构造数据集的方差。
存在PCA方法的非线性扩展,例如内核PCA方法,用以找到数据集中的非线性关系。在例如等人()的发表于1996年《神经计算》中的论文“Nonlinear component analysis as a kernel eigenvalue problem”中对内核PCA进行了描述。
实际上,数据集D通常捕获描述分离但相关的动态过程的不同变量组。因此,对于许多应用而言,依靠简单的相关性量度或PCA来确定目标变量V如何依赖于数据集D的变量组(子集)是不充分的。
例如,在生产线(布置)的情况下,可以沿生产线连续地对来自多个传感器的数据进行采样。最后,例如出于质量控制目的,必须做出关于所生产的部件是否良好的某种判定。在没有评估目标变量V如何依赖于遍及生产过程而取得的测量阵列的变量子集的可解释方式的情况下,错误调试是困难且昂贵的。简单的相关性统计量并不揭示这种复杂系统的真实基本动态性,这是因为个体变量之间的依赖性被遗漏。
发明内容
独立权利要求的计算机实现方法和机器控制器允许解决以下情况:针对目标变量V,找到与目标变量V最强烈相关的数据集D的测量变量组(子集),即允许找到关于目标变量如何依赖于变量组的解释。在控制变量指示异常的情况下,各组可以帮助解释该异常的根本原因。
特别地,在生产线(布置)的情况下,通过该方法返回的测量变量组可以用于:例如确定部件具有缺陷或异常的原因或者解释系统失灵,从而减少成本并增加错误调试的效率,并且帮助证实和验证生产过程。
作为结果,这可以例如解决简单的相关性统计量的一些缺点。通过该方法确定的组描述了数据集D中的动态过程,并且比成对的变量统计量更具描述性。
特别地,数据集D中包含的整体方差被分解,即宽广得多地覆盖解空间,并且允许捕获可能影响目标变量V的所有效应(effect)。
下文中描述了进一步的示例:
一种用于控制机器的计算机实现方法可以包括:在机器的操作期间感测多个测量事件的测量变量的值,其中在所述多个测量事件中的每个测量事件处感测每个测量变量的值,每个测量变量表示机器的操作参数;确定所述多个测量事件中的每个测量事件的目标变量的值;针对每个测量事件来确定观测,所述观测包括测量变量的感测值和目标变量的确定值;执行针对多个观测的主成分分析或内核主成分分析,从而结果得到所述观测的载荷值和主成分;针对所述目标变量来确定一个或多个主成分,针对所述一个或多个主成分,载荷值的绝对值大于第一预定阈值;针对每个确定的主成分来标识一个或多个测量变量,针对所述一个或多个测量变量,载荷值的绝对值高于第二预定阈值;将针对每个确定的主成分所标识的测量变量分组到相应的组中;以及对分组到同一组中的测量变量所表示的操作参数执行联合控制以修改目标变量。本段中提到的计算机实现方法提供了第一示例。
确定对目标变量具有影响的测量变量组具有捕获个体测量变量之间的依赖性的效应,从而使得能够针对对于目标变量具有潜在非线性影响的测量变量整体来捕获更复杂的基本动态行为集群。
所确定的测量变量组有可能指示针对目标变量的行为的解释(其背后的根本原因),并且因此可以被联合地使用,以对分组到同一组中的测量变量所表示的操作参数执行控制,以相应地修改目标变量。
该方法可以进一步包括:滤除包括与另一组相同的测量变量的每个组,如果与该组相关联的主成分的特征值小于该另一组的主成分的特征值,并且该组和该另一组指示目标变量与测量变量之间的相反相关性。在本段中提到的特征结合第一示例提供了第二示例。
滤除包括与“较大”组(即,其中与该组相关联的主成分的特征值较大但是与目标变量具有相反相关性的组)完全相同的测量变量的组使得能够滤除组/发现物之间的矛盾。
由于主成分分析或内核成分分析的性质,预期找到组中的一些矛盾,这是由于包括测量变量整体的数据集的方差被完全分解,即“较小”组可以解释在折减所有先前观测到的效应/方差之后的方差,并且因此可以捕获该数据集中在“较大”组的相反方向上存在一些方差的效应。
该方法可以进一步包括设置第一阈值和/或第二阈值,使得针对主成分的组的总数包括至多预定百分比的测量变量。在本段中提到的特征结合第一示例至第二示例中的任一个提供了第三示例。
设置第一阈值和/或第二阈值,使得针对主成分的组的总数包括至多预定百分比的测量变量,使得能够设置最大数量的测量变量,其被认为对目标变量具有足够大的影响。这使得能够将针对目标变量的行为的根本原因的搜索减少到对目标变量具有最大效应的测量变量(其被包括在组中)。
一种机器控制器可以被配置成执行第一示例至第三示例中的任一个的方法。本段中提到的机器控制器提供了第四示例。
该机器控制器通过使用第一示例至第三示例中的任一个的方法来提供上面标识的优点。这种控制器可以例如被应用在生产线布置的上下文中。
一种计算机程序可以包括被布置成使计算机系统执行第一示例至第三示例中的任一个的计算机实现方法的指令。本段中提到的计算机程序提供了第五示例。
该计算机可读介质可以包括表示指令的暂时性或非暂时性数据,该指令被布置成使计算机系统执行第一示例至第三示例中的任一个的计算机实现方法。本段中提到的计算机可读介质提供了第六示例。
附图说明
在附图中,遍及不同的视图,同样的参考字符一般指代相同的部分。附图不一定是按比例的,取而代之,一般将重点置于说明本发明的原理上。在以下描述中,参考以下附图描述了各种方面,在附图中:
图1示出了示例性生产线布置。
图2示出了安斯库姆四重奏(Anscombe's quartet)。
图3示出了示例性主成分分析。
图4示出了用以确定对目标变量具有潜在因果影响的变量组的示例性方法。
图5示出了图示用于控制机器的示例性方法的流程图。
以下详细描述参考附图,附图通过图示的方式示出了其中可以实践本发明的本公开的具体细节和方面。在不脱离本发明的范围的情况下,可以利用其他方面并且可以进行结构、逻辑和电气改变。本公开的各种方面不一定相互排斥,因为本公开的一些方面可以与本公开的一个或多个其他方面组合以形成新的方面。
具体实施方式
在下文中,将更详细地描述各种示例。
图1示出了示例性生产线布置100。
在图1的示例中,部件101定位在生产线102上。
控制器103包括数据处理组件(例如,处理器(例如CPU(中央处理单元)))104和存储器105,存储器105用于存储控制器103根据其进行操作的控制软件、以及处理器104对其进行操作的数据。
存储在存储器105中的数据例如可以包括从一个或多个传感器106接收到的传感器信号/数据。一个或多个传感器106可以是输出连续数据的任何类型的传感器。一个或多个传感器也可以被联合地使用。例如,一个或多个传感器106可以感测温度、压力、浓度、扭矩、湿度等。
可选地,存储器105还从一个或多个图像传感器107(例如,相机)接收图像数据。在这种情况下,控制器103可以基于从一个或多个图像传感器107接收到的图像数据来确定部件101是有缺陷的(和/或具有异常)。该确定可以例如通过使用机器学习模型来实现,该机器学习模型将接收到的图像数据分类成“好的”和“不好的”图像。
对于被认为有缺陷的部件101,控制器103可以基于从一个或多个传感器106接收到的输入传感器数据来确定缺陷的(潜在)根本原因。特别地,控制器103可以确定最有可能对缺陷负责的一个或多个变量组(子集)。
例如,控制器103可以确定变量组(热、压力、焊接时间)是最有可能对部件缺陷负责的组。该特定的变量组可以与生产过程中的具体点相关联,即,追溯到问题在生产过程的哪个步骤/级别处最有可能发生可以是可能的。
应当注意的是,变量的值可以用传感器和/或经由受控的操作参数(例如,设置的焊接时间、设置的温度等)来测量。
然后,控制器103可以将反馈信号108发送到错误处置模块109。反馈信号108包含针对缺陷的解释,即代表缺陷原因的信息。例如,反馈信号108可以包含最有可能对缺陷负责的一个或多个变量(子)组,并且如果可以确定的话,则可以包含其中问题最有可能正在发生的生产线的对应步骤/级别。
然后,错误处置模块109可以例如使用反馈信号108来相应地适配生产过程。例如,错误处置模块109可以修改生产过程的操作参数(诸如,所施加的压力、热量、焊接时间等),以减少缺陷/故障的风险。错误处置模块109可以进一步命令致动器110适配生产过程和/或从生产线中去除有缺陷的部件。
在接收到反馈信号108之后并且依赖于对缺陷负责的所标识的一个或多个变量组与目标(控制)变量之间的相关性水平,错误处置模块109可以控制生产过程以便以安全模式进行操作或者可能将其关闭。目标变量例如可以是表示部件有缺陷和/或具有异常的概率的连续变量。
错误处置模块109可以作为对接收到反馈信号108的反应而实现其他用户指定的规则和/或对策。
可选地,错误处置模块109是控制器103的一部分。
与图1中所图示系统类似的系统可以被用在其他技术领域中,例如用于传达信息的系统、诸如监控系统或医学(成像)系统,或者计算机控制的机器、诸如机器人、家用电器、动力工具、个人助理或访问控制系统。
在下文中,将更详细地解释最有可能对部件缺陷负责的变量组的确定。
图2示出了安斯库姆四重奏。
在图2中,图示了安斯库姆四重奏200,它是四个样本分布的样本数据集,这四个样本分布全部具有相同的描述性统计量,即它们全部具有相同的均值、方差、相关性等。
然而,如图2中清楚地示出的,这四个集合中的每一个都具有独特的属性,即描述性统计量不足以描述它们。常用的相关性统计量(诸如,皮尔逊相关性系数、比值比、互信息等)通常不足以捕获复杂数据集/系统的基本动态性。
因此,对于许多应用、特别是对于根本原因分析,依靠传统的相关性方法和措施是不充分的。
用以找到数据集中的相关性的另一种方法是主成分分析PCA,其尝试通过将变量(数据点)的原始值映射到所谓的主成分或“主成分轴”上来系统性地分解给定数据集的方差。
图3示出了具有两个主成分(轴)的示例性主成分分析,其中第一主成分(轴)从y轴以正斜率开始,并且第二主成分(轴)与第一主成分正交。
在图3中,图示了针对具有两个轴的简单二维数据集的(线性)PCA。
PCA分解查找如何从这两个轴的线性组合来(以递减次序)构造数据集的方差。在该示例中,找到了两个新的主成分。
更详细地,PCA方法找到沿第一主成分散布的数据集中包含的方差的大部分(最大可能量),然后在与第一主成分的轴正交的所有其他方向当中,PCA方法找到第二主成分,该第二主成分解释了数据集中包含的剩余方差的大部分(最大可能量)。
换句话说,PCA方法是一种正交变换,其针对包含相关变量的值的样本集来确定线性不相关主成分的集合。
应当注意的是,PCA方法也通常用于数据集的降维。
PCA方法的扩展通常使用内核/内核方法,并且被称为内核主成分分析、内核PCA或KPCA。
执行这种内核PCA分解通常包括至少以下步骤:
首先,对输入数据集D进行归一化,其中通过减去变量的均值并且除以方差来对每个变量进行归一化,即归一化的变量具有等于零的均值和等于一的方差。
第二,计算数据集D的所谓的相似性内核。在线性PCA中,相似性内核通常是D的协方差。
第三,计算先前输出的特征值和特征向量,例如在线性PCA中协方差矩阵的特征值和特征向量。特征向量通常通过递减的特征值来排名,并且被布置在矩阵中。所得的矩阵通常被称为载荷矩阵(或“系数矩阵”),其中列对应于主成分,并且行对应于数据集D的变量。
载荷矩阵的值被称为载荷(或载荷值),并且可以为正或负。然而,不可以向载荷的符号分配具体含义,只有每个列/主成分内的相对符号对于确定变量之间的相关性或反相关性是重要的。
可选地,将第一步骤的输出与第三步骤的输出相乘,以检索PCA空间中的原始数据的映射。
关于内核PCA的更多细节,参见例如上面提到的等人()的发表于1996年《神经计算》中的论文“Nonlinear componentanalysis as a kernel eigenvalue problem”。
然而,PCA、内核PCA和其他多变量相关性分析方法未能捕获数据集D中包含的变量组如何与目标变量相关。
例如,在如图1所图示的生产线的情况下,确定目标变量V(表示部件有缺陷的概率)如何依赖于遍及生产过程而取得的变量/测量的不同组是不可能的,从而使错误调试困难且昂贵。
这是因为在相关性分析方法(诸如PCA)中明确地遗漏了个体变量之间的依赖性。
图4示出了用以确定对目标变量具有潜在因果影响的变量组的示例性方法400,该方法400例如由机器的控制器(诸如例如,图1中所图示的生产线布置100的控制器103)来实行。
在图4的示例中,明确地考虑了数据集401(在下文中被标记为D)的个体变量之间的依赖性。
这可以提供一种用以找到D的测量变量组的方式,所述测量变量组有可能是目标(控制)变量402(在下文中被标记为V)的行为背后的根本原因。
虚线403表示用以确定对目标变量V具有潜在因果影响的数据集D的测量变量组的处理与外部输入/参数之间的边界。
在步骤404中,如果还不是这种情况,则使用信号处理重采样技术对数据集D的所有变量和目标变量V进行重采样,以使得它们共享相同的采样率,即所有变量(包括目标变量V)具有相同数量的样本。
在步骤405中,构建新的数据集D',其中:
因此,将目标变量V添加到数据集D。可以以这样的方式来构造数据集D'使得在(矩阵的)列中给出变量,并且在(矩阵的)行中给出对应的样本。
在步骤406中,使用内核407将内核PCA应用于数据集D'。这结果得到数据集D'的载荷(系数)值和主成分。
可以从外部源来接收内核407,例如可以由用户输入内核407。
在要分析数据集D'以找到线性关系的情况下,可以使用线性内核,诸如例如线性协方差内核。为了找到非线性关系,可以使用非线性内核,诸如例如互信息内核。
在步骤408中,检查所得的载荷矩阵/标绘图输出以找到数据集D的(潜在)因果子(组),所述因果子(组)解释目标变量V的行为。
在不损失通用性的情况下,主成分可以例如被给出作为载荷矩阵的列,并且数据集D'的原始变量被给出作为载荷矩阵的行。
搜索所得载荷矩阵的列以找到如下列:其中(由各行中的一个给出的)目标变量V的载荷的绝对值高于预定阈值410。这结果得到列的集合S,该集合是其中目标变量V为活动的列的集合。
预定阈值410可以是用户指定的阈值,并且通常将是介于0与1之间的值。例如,预定阈值410可以具有值0.01、0.05、0.1、0.15或0.2。可以将预定阈值410选择为充分有区别的,即,变量总数中的仅小百分比(例如1%、5%、10%)应当处于随后确定的测量变量组中的每一个中。用以实现这一点的预定阈值410的正确值通常依赖于数据集/分布以及具体问题。
在步骤409中,针对所确定的列的集合S,标识/确定所有的测量变量,即数据集D的如下变量:针对该变量,载荷的绝对值高于预定阈值410。
应当注意的是,在步骤409中使用的预定阈值410可以不同于在步骤408中使用的预定阈值。例如,可以以这样的方式来选择预定阈值,使得(在步骤411中形成的)组包括至多预定百分比的测量变量。
在步骤411中,针对集合S中的每一列,如果在步骤409中已经针对该列标识了至少一个测量变量,则将所标识的一个或多个测量变量分组在一起以形成变量组。
这些是测量变量组,其在目标变量V的载荷符号与所标识的测量变量的载荷符号相同的情况下,与目标变量V显著相关(或者在目标变量V的载荷符号与所标识的测量变量的载荷符号相反的情况下,与目标变量V反相关)。
有时可以将各组进一步拆分成与目标变量V具有正相关性的组、以及与目标变量V具有负相关性的组。然而,以这样的方式来拆分变量并不总是可能的和/或合期望的,这是由于单个组可能具有与目标变量V正相关以及负相关的变量两者。
在步骤412中,滤除由步骤411提供的一些组。为此目的,首先以主成分(这由内核PCA在步骤406中提供)的递减的特征值的次序对各组进行排序。应当注意的是,一旦已经将内核PCA应用于数据集D(换句话说,在步骤406之后的任何点处),就可以进行该操作。
令D' 1, D' 2 ,..., D' n 标示有序组。如果存在另一组D' j (j<k),使得D' j 与来自D' k 的发现物矛盾,则滤除/去除组D' k 。
换句话说,滤除包括相同测量变量的组——如果与该组相关联的主成分的特征值小于与另一组相关联的主成分的特征值,并且如果该组和该另一组指示目标变量与测量变量之间的相反相关性的话。
对于滤除一些组的需要是由于PCA分解的性质,PCA分解完全地分解数据集中包括的方差。因此,通常情况是一些组彼此矛盾。例如在图3中图示了该效应,其中显然所标绘的数据具有正相关性。该信息由第一主成分所捕获,但是与第二主成分矛盾。这是因为第二主成分仅解释了数据集中包括的剩余方差,即仅解释了在折减所有先前观测到的效应之后的方差,并且因此微不足道地捕获了该数据中在相反方向上存在一些方差的效应。
然后,经过滤的组可以被输出以用于进一步处理,并且是根本原因(例如,在系统失灵/异常情况下的根本原因)的候选对象。
通过图4所描述的方法返回的组对应于动态行为集群,所述动态行为描述了数据集D中对目标变量V的行为具有潜在非线性影响的潜过程。测量变量组比成对的变量统计量更具描述性。
此外,因为测量变量组以成对正交轴的某种组合的形式来表述,并且由于PCA的性质,所以该方法分解数据集中找到的整体方差,即,如果一个组不解释数据集中包含的整体方差,则将找到进一步解释方差的其他组。这允许系统性地捕获可能显著影响目标变量V的效应。
使用标准数据集可视化技术(使用PCA载荷标绘图),可以容易地可视化并证实该方法的输出,即所确定的测量变量组。例如,可以通过如下方式将它们可视化:将一个变量映射到散点图的X轴,将另一个变量映射到Y轴,将另一个变量映射到标记大小、颜色、透明度等。
此外,该方法的输出可以被提供给控制器(图4中未示出),该控制器然后可以使用所提供的信息来控制一系统,诸如如图1所图示的机器(布置)或生产线。控制器可以例如在系统失灵的情况下使用所提供的信息来导出对策,或者可以使用该信息来使进度表自动化或者实行具体任务。
总之,根据各种实施例,如图5中所图示,提供了一种用于控制机器的计算机实现方法500。
在步骤501中,感测在机器操作期间多个测量事件的测量变量的值,其中在该多个测量事件中的每个测量事件处感测每个测量变量的值,每个测量变量表示机器的操作参数。
应当注意的是,感测意味着记录,即测量变量的值不一定必须由传感器来感测,它们可以是受控的操作参数,例如设置的焊接时间。它们也可以从外部源接收。
在步骤502中,确定该多个测量事件中的每个测量事件的目标变量的值。
在步骤503中,针对每个测量事件,确定包括测量变量的感测值和目标变量的确定值的观测。
在步骤504中,执行针对该多个观测的主成分分析或内核主成分分析,从而结果得到该观测的载荷值和主成分。
在步骤505中,针对目标变量,确定一个或多个主成分,针对该一个或多个主成分,载荷值的绝对值大于第一预定阈值。
在步骤506中,针对每个确定的主成分,标识一个或多个测量变量,针对该一个或多个测量变量,载荷值的绝对值高于第二预定阈值。
应当注意的是,第二预定阈值可以与第一预定阈值相同。
在步骤507中,将针对每个确定的主成分所标识的测量变量分组到相应的组中(使得生成多个组)。
在步骤508中,对分组到同一组中的测量变量所表示的操作参数执行联合控制以修改目标变量。
换句话说,根据各种实施例,通过在机器的操作期间执行多个测量来控制机器,其中每个测量变量表示机器的操作参数。然后,确定具有相同数量样本(值)的目标变量,并且将其添加到测量变量的数据集。然后,在该数据集上执行PCA或KPCA,从而结果得到载荷值和主成分。针对其中与目标变量相对应的载荷值为高(在预定阈值以上)、即其中目标变量为活动的每个主成分,选择也具有高(在(同一个或)另一个预定阈值以上)载荷值的所有测量变量。针对每个主成分所选择的测量变量形成一组。然后,这些测量变量组被用于控制机器的操作参数,以便修改目标变量。
例如,在其中目标变量表示部件具有异常的概率的生产线的情况下,所确定的测量变量组与目标变量具有最强相关性,即是该异常的最有可能的根本原因。基于该信息,可以改变/调整生产线的操作参数以避免未来的异常。
图5的方法可以由包括一个或多个数据处理单元的一个或多个计算机来执行。术语“数据处理单元”可以被理解为允许处理数据或信号的任何类型的实体。例如,可以根据由数据处理单元执行的至少一个(即,一个或多于一个)具体功能来处理数据或信号。数据处理单元可以包括模拟电路、数字电路、复合信号电路、逻辑电路、微处理器、微控制器、中央处理单元(CPU)、图形处理单元(GPU)、数字信号处理器(DSP)、可编程门阵列(FPGA)集成电路、或其任何组合或由其形成。下面将更详细地描述的实现相应功能的任何其他方式也可以被理解为数据处理单元或逻辑电路。将理解的是,本文中详细描述的方法步骤中的一个或多个可以由数据处理单元、通过由数据处理单元执行的一个或多个具体功能来执行(例如,实现)。
尽管本文中已经图示并且描述了具体实施例,但是本领域的普通技术人员将领会到,在不脱离本发明的范围的情况下,各种替换的和/或等同的实现方式可以替代所示出和描述的具体实施例。本申请意图覆盖本文中所讨论的具体实施例的任何改编或变型。因此意图的是,本发明仅由权利要求及其等同物来限制。
Claims (6)
1.一种用于控制机器的计算机实现方法,包括:
在机器的操作期间感测多个测量事件的测量变量的值,其中在所述多个测量事件中的每个测量事件处感测每个测量变量的值,每个测量变量表示机器的操作参数;
确定所述多个测量事件中的每个测量事件的目标变量的值;
针对每个测量事件来确定观测,所述观测包括测量变量的感测值和目标变量的确定值;
执行针对多个观测的主成分分析或内核主成分分析,从而结果得到所述观测的载荷值和主成分;
针对所述目标变量来确定一个或多个主成分,针对所述一个或多个主成分,载荷值的绝对值大于第一预定阈值;
针对每个确定的主成分来标识一个或多个测量变量,针对所述一个或多个测量变量,载荷值的绝对值高于第二预定阈值;
将针对每个确定的主成分所标识的测量变量分组到相应的组中;以及
对分组到同一组中的测量变量所表示的操作参数执行联合控制以修改目标变量。
2.根据权利要求1所述的方法,进一步包括:
滤除包括与另一组相同的测量变量的每个组——如果与所述组相关联的主成分的特征值小于所述另一组的主成分的特征值,并且所述组和所述另一组指示目标变量与测量变量之间的相反相关性的话。
3.根据权利要求1或2所述的方法,包括:设置第一阈值和/或第二阈值,使得针对主成分的组的总数包括至多预定百分比的测量变量。
4.一种机器控制器,其被配置成执行权利要求1至3中任一项所述的方法。
5.一种包括指令的计算机程序,所述指令被布置成使计算机系统执行根据权利要求1至3中任一项所述的方法。
6.一种计算机可读介质,包括表示指令的暂时性或非暂时性数据,所述指令被布置成使计算机系统执行根据权利要求1至3中任一项所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19218590.8 | 2019-12-20 | ||
EP19218590.8A EP3839680B1 (en) | 2019-12-20 | 2019-12-20 | Method and device for controlling a machine using principal component analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113009823A true CN113009823A (zh) | 2021-06-22 |
Family
ID=69185167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011503346.5A Pending CN113009823A (zh) | 2019-12-20 | 2020-12-18 | 用于控制机器的方法和设备 |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP3839680B1 (zh) |
CN (1) | CN113009823A (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115114571A (zh) * | 2022-06-26 | 2022-09-27 | 长安大学 | 一种基于核主成分分析增强无监督学习的非视距识别方法 |
CN117034043B (zh) * | 2023-10-09 | 2024-01-16 | 山东五棵松电气科技有限公司 | 基于多能源物联网的智慧建筑综合能耗监测方法及系统 |
-
2019
- 2019-12-20 EP EP19218590.8A patent/EP3839680B1/en active Active
-
2020
- 2020-12-18 CN CN202011503346.5A patent/CN113009823A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3839680B1 (en) | 2023-08-23 |
EP3839680A1 (en) | 2021-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5539382B2 (ja) | 航空エンジン内の故障の識別 | |
CN108463874B (zh) | 基于图像的样品过程控制 | |
KR20060026072A (ko) | 데이터 분석 방법 및 장치 | |
JP2009258890A (ja) | 影響要因特定装置 | |
CN113009823A (zh) | 用于控制机器的方法和设备 | |
WO2007064933A1 (en) | Method and apparatus for classifying manufacturing outputs | |
WO2020152741A1 (ja) | 異常要因推定装置、異常要因推定方法、及びプログラム | |
Haq et al. | Dynamics-inspired feature extraction in semiconductor manufacturing processes | |
JP3515756B2 (ja) | 処理装置の監視方法 | |
CN114077919A (zh) | 用于预测加工异常的系统 | |
JP4723544B2 (ja) | 基板分類方法および装置、基板分類方法をコンピュータに実行させるためのプログラム、並びに上記プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Yu et al. | Using minimum quantization error chart for the monitoring of process states in multivariate manufacturing processes | |
Buschmann et al. | Data-driven decision support for process quality improvements | |
Joshi et al. | Multivariate statistical process monitoring and control of machining process using principal component-based Hotelling T2 charts: A machine vision approach | |
CN114579391A (zh) | 异常数据的检测方法、系统、介质及终端 | |
Reis et al. | A large-scale statistical process control approach for the monitoring of electronic devices assemblage | |
Klees et al. | Building a smart database for predictive maintenance in already implemented manufacturing systems | |
Gaugel et al. | Data-driven multi-objective optimization of hydraulic pump test cycles via wrapper feature selection | |
Hensler et al. | Implementation and Optimization of a Data-Driven Soft Sensor in a Welding Process | |
Sand et al. | Holistic production analysis for actuator manufacturing using data mining | |
CN116882361B (zh) | 芯片缺陷分析方法、电子设备及存储介质 | |
Tang et al. | Monitoring and fault diagnosis using fisher discrimnant analysis | |
Huang | An improved fault detection methodology for semiconductor applications based on multi-regime identification | |
US20200082281A1 (en) | Verification device | |
Choi et al. | Multi-Stage Process Diagnosis Networks in Semiconductor Manufacturing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |