CN109829470A

CN109829470A - 用于确定异常的方法、装置和计算机程序

Info

Publication number: CN109829470A
Application number: CN201811398435.0A
Authority: CN
Inventors: B.考斯勒; L.贝格尔; M.希格; M.普法伊费尔
Original assignee: Robert Bosch GmbH
Current assignee: Robert Bosch GmbH
Priority date: 2017-11-23
Filing date: 2018-11-22
Publication date: 2019-05-31
Anticipated expiration: 2038-11-22
Also published as: US11215485B2; DE102017220954A1; US20190154474A1

Abstract

本发明涉及用于确定由传感器值（21）所组成的系列（20）是否包含异常的方法，包括以下步骤：提供Shapelet（22）和至少一个训练数据系列。在训练数据系列的多个不同的能够预先给定的位置处分别测量在Shapelet（22）和训练数据系列之间的距离（32a，32b）。从所测量的距离中确定至少一个最小距离和针对Shapelet（22）的至少一个能够预先给定的数据点（23）确定至少一个变化参量，其中变化参量以与所测量的距离（32a,32b）其中至少一个相关的方式来被确定。本方法还涉及用于实施根据本发明的方法（40）的计算机程序和装置以及机器可读的存储元件（15），计算机程序被存储在该存储元件上。

Description

用于确定异常的方法、装置和计算机程序

技术领域

本发明涉及一种用于确定在数据系列（Datenreihe）中的异常的方法。此外，本发明涉及计算机程序和装置，所述计算机程序和装置分别被设立用于实施所述方法。

背景技术

如下异常应该被自动化地探测，所述异常尤其在数据系列的区段之内表征数据系列与所述数据系列的假定的正常的变化过程（Verlauf）的偏差。这意味着，方法和/或装置可以自动化地探测数据系列中的异常，为此通常需要至少一个专家。该专家通过其专家知识来识别在数据系列中的异常。

可能的是，为了对数据系列分类，例如使用所谓的Shapelet，诸如在“ScaleableDiscovery of Time-Series Shapelets”，arXiv preprint arXiv：1503.03238，JosifGarbocka， Martin Wistuba， Lars Schmidt-Thieme中。

发明内容

本发明的优点

具有独立权利要求1的特征的方法与此相对具有如下优点：利用未标签（ungelabelt）的数据系列可以确定Shapelet，其中所述数据系列也可能包含异常。附加地，可以使用所述方法，以便探测出如下异常，迄今原本没有为了所述异常而使用Shapelet。由此得出所述方法的巨大优点：克服迄今为止的困难性，即，提供用于确定Shapelets的由训练数据系列组成的足够大的数据组，其中所述训练数据系列不包含异常或至少必须被标签。另一优点是：即使当少量的训练数据系列可供使用用于确定Shapelet时，能够借助所述方法学会（erlernen）没有异常的数据系列的高度概括（Generalisierung）。这是因为所述方法具有有利的特性：所述Shapelet也能够以与多个不同的数据系列相关的方式来同时地被确定。

在第一方面中，本发明涉及用于确定由传感器值所组成的系列是否包含异常。所述方法包括以下步骤：

- 提供Shapelet和至少一个训练数据系列。

- 在所述训练数据系列的多个不同的能够预先给定的位置处分别测量在Shapelet和训练数据系列之间的距离，

- 从所测量的所述距离中确定至少一个最小距离，

- 针对Shapelet的至少一个能够预先给定的数据点确定至少一个变化参量（Änderungsgröße）。所述变化参量以与所述所测量的距离其中的至少一个相关的方式来被确定。

Shapelet在下文中可以被理解为由数据点组成的系列。给所述数据点分别分配至少一个能够预先给定的值和分别分配在能够预先给定的扫描光栅（Abtastraster）中的位置。此外，“在多个不同的能够预先给定的位置处”可以被理解为：在训练数据系列的能够预先给定的扫描光栅中选择位置并且在该位置处使用数据系列的、尤其是由传感器值所组成的系列的区段，以便测量在该Shapelet和该数据系列的区段之间的距离。这针对多个位置来执行。所述训练数据系列的数据点分别也被分配给在训练数据系列的扫描光栅上的位置。

传感器值可以是所测量的或者以虚拟的方式所确定的传感器值。以虚拟的方式所确定的传感器值可以借助模型来被确定。该距离是如下参量，该参量表征在Shapelet和训练数据系列的所选择的区段之间的偏差。

所述方法有利的是，可以实现该Shapelet的逐点的变化并且因此可以对于异常探测的任务有针对性地训练该Shapelet。

特别有利的是，在确定最小距离之后进行决策参量（Entscheidungsgröße）的确定。该决策参量如此被确定，使得所述最小距离比能够预先给定的容限参量（Toleranzgröße）加上（zuzüglich）决策参量更小。这些步骤的后果是：容限参量表征该距离在决策参量以上的容许的超出。这提供如下优点：借助容限参量，该决策参量可以设计得尽可能小，但是仍然可以考虑到非特征点（Ausreißer），而并不在鉴于数据系列的、尤其是由传感器值所组成的系列的异常的检验中取得错误的结果。

此外有利的是，该变化参量也根据决策参量和容限参量来被确定。这具有如下优点：也可以使用其他所测量的距离，用于确定变化参量。同样地，可以因此使所述方法相对于错误确定的决策参量而言更加鲁棒性，因为借助容限参量使得大于决策参量的所测量的距离还是可以被考虑用于确定该决策参量。

在所述方法的特别有利的扩展方案中，借助梯度下降法鉴于该Shapelet的能够预先给定的数据点来确定变化参量。

鉴于数据点来使用梯度法意味着：该梯度方法被使用，以便以有针对性的方式来确定所述数据点的适合的值，尤其是通过根据Shapelet的能够预先给定的数据点、可选地也根据决策参量确定成本函数的导数（Ableitung）来确定。该梯度下降法可以有助于对Shapelet的以时间和计算有效的方式的确定。

在该方法的可替代的或附加的扩展方案中，根据该梯度下降法的至少一个梯度来确定该变化参量。此外，借助根据该变化参量来对该Shapelet的能够预先给定的数据点的适配来最小化成本函数。

在梯度下降法中，可以确定梯度并且根据所述梯度可以确定用于适配Shapelet的变化参量。

该成本函数可以是如下函数，该函数根据Shapelet、尤其是根据该Shapelet的数据点的值和决策参量、可选地也根据容限参量来表征在Shapelet至训练数据系列之间的距离。该成本函数的最小化导致：在Shapelet和训练数据系列之间的距离变得更小，尤其是在该Shapelet和没有异常的数据系列的表征性的片段之间的距离变得更小。

特别有利的是，借助该梯度下降法来确定至少一个所述梯度和至少一个子梯度（Subgradient）并且该梯度根据被用于确定变化参量的所测量的距离其中至少之一来被确定。该子梯度根据容限参量来被确定。该变化参量根据所述至少一个子梯度或所确定的梯度来被确定。子梯度可以被理解为近似的梯度。该子梯度可以在待评估的位置处借助在待评估的位置的相邻位置处梯度的加权的叠加（Überlagern）来被近似计算（approximieren）。

这具有如下优点：借助该容限参量并且因此通过该子梯度来提供用于确定Shapelet的突出的会聚特性，因为该容限参量允许也考虑其他的所测量的距离用于确定该Shapelet。

当最小距离大于决策参量时，在本方法的扩展方案中于是考虑在容限参量中的最小距离作为处罚参量（Bestrafungsgröße）。所述处罚参量取决于最小距离在决策参量以上的超出。

有利的是，该变化参量根据多个所测量的距离的加权的总计（Aufsummeierung）来被确定。同样地，特别有利的是，该梯度和该子梯度分别根据加权的、总计的距离来被确定。这具有如下优点：通过所测量的距离的加权的总计可以确定更精确的梯度，因为由于更多距离而有更多信息可供使用，以便确定梯度。

在所述方法的一种可替代的扩展方案中，在确定变化参量之后，该Shapelet的能够预先给定的数据点根据该变化参量来被适配。对多个距离的测量和对决策参量的适配和对至少一个适配参量的确定的步骤和对Shapelet的能够预先给定的数据点的适配的步骤多次地相继被实施。对多个距离的测量的步骤分别借助经适配的Shapelet来执行，其中所述经适配的Shapelet在根据变化参量来适配该Shapelet的数据点的尤其是在前面的步骤中已经被适配了。

所述扩展方案的优点是：该Shapelet更有针对性地被确定并且可以实现用于确定Shapelet的更鲁棒性的方法。因为该Shapelet可以在新适配的决策参量之内被确定，由此在决策参量已被适配了之后，例如可以克服该成本函数的局部最小值。该Shapelet可以特殊地针对经适配的决策参量来被确定。对决策参量的重复性的适配可以如用于确定Shapelet的附加条件那样来被理解，其导致：所测量的最小距离在所述决策参量的参考点的方向上被适配。也就是说，所述最小距离可以接近理想的最小距离或所期望的最小距离并且该Shapelet可以以并不仅适合于训练数据而是也可以适合于当前所使用的决策参量的方式来被适配。

有利地，提供多个不同的训练数据系列并且在测量距离时分别测量在所述Shapelet至所述训练数据系列其中分别一个之间的在相应的训练数据系列的不同的能够预先给定的点处的多个距离。随后，从每个训练数据系列的多个所测量的距离中分别确定至少一个最小距离。所述决策参量如此来被适配，使得分别所确定的最小距离比决策参量加上容限参量更小。此外，针对所述训练数据系列其中的每个分别确定用于所述Shapelet的至少一个能够预先给定的数据点的至少一个变化参量并且所述Shapelet的能够预先给定的数据点根据对所确定的变化参量取平均值来被适配。

按照所述方法的这些步骤的优点在于：所述方法也与不同的训练数据系列兼容，其中所述不同的训练数据系列并不表明（gekennzeichnet sind）：是否其分别具有至少一个异常。这意味着：该方法不需要已标签的训练数据，由此无需通过专家来执行昂贵的标签（Labelung），但也意味着，无需用于提取（Extraktion）Shapelet的专家知识，因为所述方法可以独立自主地确定Shapelet。此外，能够预先给定的数目的训练数据系列可以具有至少一个异常并且尽管如此可以利用所述训练数据系列来使用所述方法，以便确定该Shapelet。

另一优点是：按照该方法不仅确定在该数据系列中所包含的Shapelet的形式而是也可以更好找到适合的Shapelet，因为经由不同的训练数据系列，该Shapelet被适配。

在所述方法一种有利的扩展方案中，该决策参量如此被适配，使得能够预先给定的数目的最小距离分别大于决策参量。由此可以在确定Shapelet时考虑具有异常的训练数据系列，从而使该Shapelet并不针对具有至少一个异常的训练数据系列来被适配。能够预先给定的数目的比决策参量更大的最小距离可以以小于或等于假定数目的具有至少一个异常的训练数据系列的方式来被选择。

在所述方法的一种特别有利的扩展方案中，该子梯度仅根据大于决策参量的那些最小距离来被确定。这具有如下优点：大于决策参量的距离和与之相应地较不适合的用于确定所述距离的属于其的Shapelet也还是被考虑用于确定适合的Shapelet。

由此，显而易见地不适合的Shapelet也可能导致：借助较不适合的Shapelet来确定理想的Shapelet。另一优点是：无关于所提供的Shapelet的初始化，尽管目前不适合的形式，这也还是可以在适合的Shapelet中被适配。附加地，可以借助容限参量来在Shapelet的适配中考虑具有异常的训练数据系列，从而所述训练数据系列更微弱地（schwächer）被考虑到该Shapelet的确定中并且并不负面地对适合的Shapelet的确定起作用。

在所述方法的一种扩展方案中，在适配决策参量时此外也适配容限参量。

特别有利的是，根据决策参量来决策是否存在异常或者根据是否已决策了是否存在异常来操控执行机构（Aktor）。

该执行机构可以是至少半自主的机器的部分。该执行机构可以被用于，输出光学的、声学的和/或触觉的信号或者操控另一装置，以便鉴于所探测异常来触发或实施所述至少半自主的机器的活动（Aktion）。应用领域可以例如是医学技术（Medizintechnik），以便例如鉴于异常（例如心率干扰（Herzrhythmusstörung））来监控EKG信号或心跳/心音（Herztöne），但是也例如鉴于异常来监控在发动机中点火时所测量的噪声。

当噪声的变化或另一物理上能够测量的特性的变化出现时，可以借助所述方法来探测异常。此外，可以使用用于监控生产运行流程的方法。一旦识别出了异常，可以启动（starten）保护功能（例如扭矩的调节或紧急停止），以便例如预防损害。

此外，可以使用用于监控电信号的方法，以便例如监控电机的电源或者由电机和其能量源所组成的系统或者监控在电机和能量源之间的通信，以便因此（daraufhin）启动保护功能。

所述方法的另一用途可以例如在于质量控制（Qualitätskontrolle）。在此情况下可以例如检测声学的或光学的信号，尤其是超声信号，所述光学的信号被用于检验工件，其方式为用所述光学的信号来照射该工件。根据所述所检测的信号于是可以借助前面提到的方法之一来标识有缺陷的工件，那么其方式为，尤其是恰好为，当已决策了用于检验工件的所检测的信号具有异常时，则鉴于此来决策：工件是有缺陷的。随后，这种这样标识的工件可以自动化地被拣出（aussortieren）。

此外可以借助前面提及的方法来决策：是否在发出的电磁信号或声学信号的所检测的回声中存在异常，以便例如监控机动车的周围（Umfeld）。在此情况下可以规定：借助例如被安放在机动车中的电磁或声学信号的发射器来发射电磁的或声学的信号。随后，可以检测所发射的信号的回声。如果于是决策了在所检测的回声中存在异常，则可以相应地操控警告系统或控制系统（例如可以发出警告信号或者该控制系统被转变为安全模式）。

在另一方面中，本发明涉及计算机程序，该计算机程序被设立用于，实施前面所提到的方法之一，也即包括如下指令，当该计算机程序在计算机上运行时，所述指令促使实施所提到的方法连同其所有步骤。此外，本发明涉及机器可读的存储模块，其中该计算机程序被存储在该存储模块上，并且本发明涉及如下装置，尤其是计算机，该计算机被设立用于，实施所提到的方法之一。

在另一方面中，本发明涉及一种装置，所述装置被设立用于实施所述方法之一的每个步骤。

附图说明

本发明的实施例在所附附图中被示出并且在接下来的描述中进一步被阐述。在此，其中：

图1示出用于探测异常的系统的示意图；

图2A示出数据系列的示意图；

图2B 示出Shapelet的示意图；

图3示出Shapelet转换的结果的示意图，其中所述结果可以被用于利用决策参量来探测异常；

图4示出用于探测异常的方法的实施方式的示意图。

具体实施方式

图1示出用于尤其是在由传感器值所组成的系列中探测系统（10）的输入参量中的异常的系统（10）的实施方式的示意图。该系统（10）包括检测单元（11）、探测单元（12）和控制单元（13）。该系统（10）的输入参量借助该检测单元（11）来被检测并且被转发给该探测模块（12）。该探测模块（12）被设立用于，探测输入参量中的异常。根据所探测到的异常可以可选地借助控制单元（13）来产生控制参量，该控制参量可以被使用用于控制执行机构（16），该执行机构例如被安置（verbauen）在至少半自主的（teilautonom）机器中、尤其是车辆或机器人中。该执行机构（16）优选地是警告系统，该警告系统在出现异常的情况下输出警告信号。该系统（10）可以此外包括计算单元（14）和存储元件（15）。

图2A示出数据系列（20）的示意图。该数据系列（20）包括多个数据点（21）。这些数据点（21）分别被分配给在轴线（t）上的位置并且通过值（y）来被表征。优选地，该数据系列（20）是如下数据系列，所述数据系列包括一维的和真实（reell）的数据点（21）。“一维的”被理解为：每个数据点（21）仅根据值（y）来被表征。可替代地，该数据系列（20）可以包括多个多维的数据点（21）。在此情况下，可以给每个数据点（21）分配多个真实的值（y）。可替代地，该数据系列也可以包括多个复杂的（komplex）数据点（21）。这些数据点（21）优选地是如下传感器值，这些传感器值已借助该检测单元（11）来被检测。可替代地，这些传感器值也可以是所确定的虚拟值，这些虚拟值已根据例如模型来被算出（berechnen）。在可替代的实施方式中，该数据系列（20）的这些数据点（21）并彼此不等距地（布置，也就是说，相邻的数据点（21）彼此具有不同的间距。

根据图2B的数据系列的实施例并不限于如下数据系列，在所述数据系列情况下这些数据点沿着唯一的轴线（t）来布置。也能够设想的是：这些数据点沿着多个轴线来布置，尤其是在该数据系列包含图像的情况下。于是，异常可以在此情况下要么沿着确定的轴线来被确定，要么也针对在多个轴线上的区段，例如在图像片段中被确定。可替代地，该数据系列可以被划分成任意的区段，其中数据系列的区段分别鉴于异常来被检验。

借助该系统（10），可以探测在数据系列（20）中的异常。例如，在该系统（10）中，尤其是在探测模块（12）中存放如下参考模型，该参考模型表征数据系列（20）的正常状态（Normalzustand）或正常变化过程（Normalverlauf）。该系统（10）可以根据所存放的所述参考模型来探测在数据系列（20）中的异常。“异常”在下文中被理解为数据系列的多个数据点与所述数据点的按期望的序列（Abfolge）的偏差。该参考模型在下文中包括至少一个所谓的Shapelet，以便检测在该数据系列（20）中或在所述数据系列（20）的片段中的异常。

图2B示出示例性的Shapelet（22）的示意图，该Shapelet可以被使用，以便探测在该数据系列（20）中的异常。所述Shapelet（22）包括数据点（23）的能够预先给定的序列，其中所述数据点（23）的所述能够预先给定的序列比所述数据系列（20）的能够预先给定的序列更短。该Shapelet（20）的数据点（23）分别根据值（y）来被表征并且给每个数据点（23）分配在轴线（t）上的位置。优选地，该Shapelet（22）的维度与待研究的数据系列的维度和/或在各个数据点（21，23）之间的间距一致，使得可以给Shapelet的每个数据点（23）分配来自数据系列的所选的区段的数据点（21）。优选地，该Shapelet（22）是能够参数化的，其中这些数据点（23）的数目、在这些数据点之间的间距和这些数据点的值是能够参数化的。一旦多维的数据系列（20）应该被研究，就必须为此与之相应地以多维的方式来构造该Shapelet。

在用于确定异常的根据图2B的Shapelet（22）的实施方式中，给Shapelet（22）的每个数据点（23）分配具有与Shapelet（22）的长度相同的长度的数据系列（20）的能够预先给定的区段之内的数据系列（20）的数据点（21）。优选地，给Shapelet（22）的直接相继的数据点（23）分别分配数据系列（20）的能够预先给定的区段的直接相继的数据点（21）。例如，给该Shapelet（22）的数据点（23）分配该数据系列（20）的数据点（21）并且给该Shapelet（22）的数据点（23）的紧接着接下来的数据点分配该数据系列（20）的数据点（21）的紧接着接下来的数据点，并以此类推。可选地，在数据系列和Shapelet的数据点的两个位置之间的间距是相同大小的。

在一种可替代的实施方式中，给Shapelet（22）的每个数据点（23）分配在数据系列（20）的能够预先给定的区段中的数据系列（20）的至少一个数据点（21），并且并不强制性地给该Shapelet（22）的直接相继的数据点（23）分别分配该数据系列（20）的直接相继的数据点（21）。例如，给该Shapelet（22）的第一数据点（23）分配该数据系列（20）的所选区段的数据点（21）。例如在所述实施方式中，给该Shapelet（22）的数据点（23）的紧接着接下来的数据点分配来自该数据系列的该区段的数据点（21）的下下一个数据点。也就是说，在所述实施方式中，给该Shapelet（22）的直接相继的数据点分别仅分配该数据系列（20）的直接相继的数据点的每个下下一个数据点，并且并不考虑该数据系列（20）的所有相继的数据点。

优选地，该Shapelet（22）包含没有异常的数据系列的特性，也就是说，例如在该Shapelet（22）的该形式中，正常的数据系列的变化过程的信息是被编码的。根据该Shapelet（22）因此可能的是，确定在该数据系列（20）中与正常数据系列的偏差，以便探测异常。可选地，也可以根据该Shapelet（22）来标识所述异常的位置和所述异常的类型，其中已经根据该Shapelet来探测出异常，例如该偏差在哪个位置处出现。此外能够设想，可以确定：该数据系列是否包含多个异常，例如根据该Shapelet（22）对于数据系列（20）的偏差的分布。

如果多个不同的Shapelet被使用，则所述多个不同的Shapelet能够具有彼此不同的长度。

在下文中描述:如何能够借助预先给定的Shapelet来探测异常。在此已假设：所预先给定的Shapelet已经具有表征性的形式，该形式表征没有异常的数据系列。这样的Shapelet的创建接下来被公开。

在第一步骤中，在Shapelet和该数据系列的不同区段之间借助Shapelet转换来确定各个距离。在该实施例中，优选地利用以下方程式来执行Shapelet转换：

（方程式1）：

其中，T_i,j是来自数据系列的区段[T_i,j,…,T_i,(j+L-1)]的数据点的值，并且其中D_i,j，k表征总共K个不同的Shapelet中的第k个Shapelet在具有Shapelet的长度L的第i个数据系列的第j个位置处与该Shapelet的数据点S_k,l的距离。

优选地，在例如给该Shapelet的每个数据点仅分配该数据序列的所选的区段的每第二个数据点的情况下，该训练数据系列的区段具有至少恰好如该Shapelet那么多的数据点，但是可以在可替代的实施例中具有比该Shapelet更多的数据点。

优选地，所测量的距离并不是负的。非负的参量应理解为：该值大于等于0。这具有有利的效应：必须在更小的范围之内确定决策参量，以便在该范围内决策：是否存在异常。对是否存在异常的决策在接下来的图3中被进一步阐述。由于仅为正的、所测量的距离而仅需要具有正值的范围，该决策参量由此必须覆盖更小的范围并且以此能够实现用于探测异常的方法的更简单的可操纵性（Handhabbarkeit）.

对距离的确定可以可替代地在另一实施例中通过在Shapelet和数据系列之间的卷积（Faltung）来被执行。通过该卷积针对该数据系列的每个数据点的距离来确定距离。接着，可以在该卷积之后可选地进一步使用所测量的距离的子集（Untermenge）。

也能设想的是：有针对性地在特定的能够预先给定的位置处借助Shapelet转换来确定距离。此外，也能够设想用于确定所述距离的其他方法。

在借助Shapelet转换已确定了Shapelet和数据系列之间的距离之后，针对第k个Shapelet至第i个数据系列的Shapelet转换的最小距离M_i,k被确定：

（方程式2）：

其中J相应于所测量的距离的数目。

如果Shapelet的形式被包含在该数据系列中，在该Shapelet和该数据系列之间的所测量的距离的值是小的。因此，根据方程式（方程式2）最小的所测量的距离表征：该Shapelet的形式到何种程度地被包含在该数据系列中。因为该Shapelet表征不包含异常的数据系列，由此出发：一旦最小的所测量的距离具有小的值，该数据系列就不包含异常。可替代地，在另一实施方式中，例如替代于最小距离而使用平均距离。也能够设想的是，并不使用最小值，而是使用Shapelet转换的最大的距离。

当使用多个不同的Shapelet时，可以针对每个Shapelet来执行Shapelet转换。这也适合用于多个所使用的数据系列，其中可以针对每个Shapelet到每个数据系列来执行Shapelet转换，由此可以以每个Shapelet鉴于异常来检验每个数据系列。

图3示出用于根据Shapelet转换的结果来探测异常的示例性的实施方式的示意图。在该实施方式中，Shapelet转换的结果是从两个Shapelet（S₁，S₂）分别到具有异常的数据系列和没有异常的数据系列的最小的所测量的距离（32a，32b）。所述最小的所测量的距离（32a，32b）可以被录入（eintragen）到坐标系统中，其中给每个Shapelet分别分配该坐标系统的轴线，在该轴线上描绘该Shapelet与数据系列的Shapelet转换的结果，尤其是最小的所测量的距离（32a，32b）。

如在图3中示例性示出的，该坐标系统针对两个所使用的Shapelet（S₁,S₂）具有两个轴线，其中所述所使用的两个Shapelet已被使用用于Shapelet转换。此外，图3示出决策参量（31）。所述决策参量（31）可以表征在坐标系统之内的圆形片段并且被使用用于，当例如最小的所测量的距离（32a）之一大于决策参量（31）时，决策是否在待研究的（zu untersuchend）数据系列中存在异常。

当最小的所测量的距离（32b）小于决策参量（31）时或者位于该决策参量（31）的表征性的圆形片段之内时，该数据系列不包含异常。相反，如果最小的所测量的距离（32a）位于该决策参量（31）之外，则在该数据系列中存在异常。应说明（anmerken）的是，所使用的决策参量（31）已经被确定并且在图3中被假定为预先给定的和理想的决策参量。可选的决策参量的确定在下文中被进一步阐述。

优选地，该坐标系统的原点被选为决策参量（31）的参考点。这具有有利的效应：以理想的Shapelet和没有异常的数据系列进行的Shapelet转换的结果位于原点并且因此具有与决策参量（31）的最大可能距离（Entfernung），因为以理想的Shapelet进行的Shapelet转换的最小距离应输出值0。

作为参考点也能够设想在坐标系统中的其他位置，其中应说明：与原点不相等(ungleich)的参考点的位置在接下来公开的方法中与之相应地必须附加地被考虑和/或同样地必须被适配。可替代地，在图3中的坐标系统可以被转换成更高维度的坐标系统并且在所述更高维度的坐标系统之内借助用于这种更高维度的空间的决策参量来执行对是否存在异常的判定。

在另一实施例中，该决策参量（31）表征具有任意形式的超球体（Hypersphäre）。一旦所述最小的所测量的距离位于该超球体之外，可以由此出发（ausgegangen）：存在异常。

在一种可替代的实施例中，可以探测异常，其中在所述可替代的实施例中使用多个不同的Shapelet，其中，要么每个Shapelet的每个单独的所确定的最小距离小于能够预先给定的决策参量，要么在尤其是加权的最小的所确定的距离的总和小于该决策参量（31）的情况下。

也能够设想的是，该超球体的中心在原点中定位。但是，该中心也可以可替代地被布置在该空间内的任意位置处。其中在此同样地适用:当整个所测量的距离位于超球体的体积之外时，在该数据系列中存在异常。

超球体的形式优选地在更高维度的空间内是球形的，并且在二维的空间内是圆形的，并且在一维的空间内是界线（Grenze）。可替代地，该超球体也可以采纳任意的几何形式，由此可以实现有利的效应：可以执行对异常的更精确的和更可靠的探测。

在另一实施方式中，可以沿着该决策参量（31）来定义容限参量，该容限参量表征Shapelet转换的结果围绕（um）该决策参量（31）的最大的超出。例如，所述Shapelet转换的结果、尤其是最小的所测量的距离可以位于决策参量（31）之外，但是仍位于通过该容限参量所定义的范围之内。由于在该示例中最小的所测量的距离位于该决策参量（31）之外，可能存在异常，但是因为所述最小的所测量的距离位于该容限参量的范围之内，可以决策：不存在异常。该容限参量因此具有有利效应：可以选择小的决策参量，但是没有异常的数据系列以大的所测量的最小距离而正确归类（einordnen）。优选地，当多个不同的Shapelet被使用时，给每个Shapelet分别分配决策参量和容限参量。

可选地，该坐标系统的转换连同所录入的最小的所测量的距离可以被执行，由此例如可以去除在所测量的最小的距离中的冗余或者可以实现最小的所测量的距离关于超球体的适合的定位。

图4示出用于借助Shapelet来探测在数据系列中的异常的方法（40）的一种实施方式的示意图。

该方法（40）以步骤41开始。在步骤41，提供训练数据系列。可选地，也可以提供多个不同的训练数据系列。在一种可替代的实施例中，所述训练数据系列并不表明：是否所述训练数据系列包含异常，其中一定数目的训练数据系列包含至少一个异常并且并不已知：所述训练数据系列其中的哪个包含至少一个异常。

在接下来的步骤42，所述方法（40）的所使用的参量、尤其是决策参量（31）、容限参量和Shapelet被初始化（initialisieren）。可替代地，多个Shapelet可以被初始化。优选地，该决策参量被选择得相对大并且该容限参量以与所选择的决策参量成比例的方式来被初始化。该Shapelet在步骤42中随机地被初始化，也就是说，该Shapelet的数据点配备有随机值。可替代地，该Shapelet的值可以根据对(多个)训练数据系列的数据点的值的分析、尤其是聚类分析来被初始化。所述分析可以例如也是对（多个）训练数据系列的数据点的不同值的频率的分析。在另一变型方案中，也可以将数据系列的任意选择的片段或者已经将所提取的Shapelet作为Shapelet的初始化来使用。随后，在Shapelet的初始化之后借助Shapelet转换来测量在该Shapelet和训练数据系列之间的多个距离并且从多个所测量的距离中确定最小的距离。可替代地，在最小距离已被确定之后，也可以执行决策参量的初始化，其方式为，如此选择决策参量，使得其大于所述最小的距离。可选地，在此情况下也可以考虑容限参量。

在步骤42后接着是步骤43.在步骤43中，该Shapelet和该决策参量被确定，尤其是被优化，使得借助该Shapelet可以探测在数据系列中的异常。可替代地，可以在步骤43中除了对Shapelet和决策参量的优化之外也对容限参量优化。也能够设想的是，同样地对决策参量（31）的参考点优化。在此，经由相应的参量的适配来如此进行步骤43中的优化，使得在优化随着步骤43结束而已经以训练数据系列被训练了之后，该优化理想地鉴于探测在数据系列中的异常而言是能够使用的。可替代地，对决策参量和Shapelet的优化可以同时地执行。

优选地，该Shapelet如此被优化，使得所测量的距离、尤其是关于所测量的距离和决策参量和容限参量的总和（die Summe über die gemessenen Distanzen und derEntscheidungsgröße und der Toleranzgröße）被最小化。因为该决策参量和容限参量在优化Shapelet时没有被适配，这意味着，当该Shapelet转换重新在如下区段处以经优化的Shapelet来被执行时，新测量的距离借助Shapelet转换而在所使用的所述区段其中的所有区段或多个区段处具有更小的值，其中所述区段已被使用用于Shapelet转换。

在另一有利的实施方式中，Shapelet的所述优化如此来进行，使得在训练数据系列的相同区段处以经优化的Shapelet来重复性地进行的Shapelet转换之后，在具有未经优化的Shapelet的区段处所测量的最小的所测量的距离在以经优化的Shapelet所进行的重复性的测量中具有显著的更小的值。同样地，在具有未经优化的Shapelet的区段处所测量的较大的所测量的距离在以经优化的Shapelet所进行的重复性的测量中具有更小的值，其中所述所测量的值的最小化如更小的所测量的距离的值的最小化那样较不强烈地表现。在优化Shapelet之后更小的所测量的距离比更大的所测量的距离更强烈地被最小化这一趋势源于（rührt daher）：该Shapelet的优化也可以根据容限参量来被执行。该容限参量馈入（einfließen）到Shapelet的优化中，使得更大的所测量的距离以处罚参量而引起用于最小化的更高成本。大于决策参量的所测量的距离借助容限参量而被配备有用于最小化所述相应距离的更高成本，由此更小的所测量的距离优选地并且更显著地被最小化。对用于确定Shapelet的容限参量的考虑具有有利的效应：在决策参量之外的起初是大的所测量的距离也还能够在决策参量之内被引入并且因此也能够被最小化。

在步骤43中的优化可以例如在该实施方式中根据接下来的方程式来被执行，其可以被视为待最小化的成本函数：

（方程式3）：

其中以N*a个数据系列C=1/（N*a），其具有异常并且并不已知所述数据系列的其中的哪些具有异常，并且其中以不同数据系列的数目N、具有异常的数据系列的相对数目α、容限参量和重整化（Regularisierung），当k个不同的Shapelet被适配时：

（方程式4）：

在待优化的方程式（方程式3）已经被列出（aufstellen）之后并且各个参量、尤其是最小的所测量的距离在该方程式之内已经被确定了之后，在两个步骤中决策参量和Shapelet的数据点的值根据所述成本函数（方程式3）来被适配，尤其是被优化。可选地，用于适配Shapelet和决策参量的所述两个步骤可以交替地多重地（mehrfach）相继地被重复。这具有有利的效应：该Shapelet一再地重新针对经适配的决策参量来被优化，由此可以实现到理想的Shapelet的更快速的会聚（Konvergenz）。

第一步骤包括借助如下方程式（方程式3）来适配决策参量，其中在所述方程式情况下该决策参量被优化并且该Shapelet保持不变。对决策参量的优化如此进行，使得该方程式（方程式3）在适配决策参量的情况下对所给定的Shapelet变得最小。可选的决策参量可以利用线性编程的标准方法、例如利用“Lagrangian Multipliers（拉格朗日乘子）”来被确定。在可替代地使用超球体来作为决策参量的情况下，于是必须在此适配如下参数，所述参数表征该超球体。

在已经适配了决策参量之后，接下来适配Shapelet。

为了优化Shapelet的数据点，必须针对新适配的决策参量来最小化成本函数（方程式3）。通过适合地适配该Shapelet的数据点的所述一个或多个值其中之一，成本函数（方程式3）被最小化。优选地，应用梯度下降法，以便找到该成本函数（方程式3）的全局最小值。借助梯度下降法来确定的、所确定梯度可以于是被使用，以便适配该Shapelet的数据点之一的至少一个值。

因为决策参量保持不变并且仅该Shapelet被优化，该成本函数（方程式3）可以可选地被简化。在该实施例中，经简化的成本函数（方程式3）看起来可以是这样：

（方程式5）：

在项（Term）中容限参量的转化（Umwandlung）导致：针对Shapelet的优化也可以使用Shapelet转换的结果，其在不同的Shapelet和/或在训练数据系列的不同位置处的Shapelet转换期间是较不适合的，但是借助所述项更高地被加权并且因此配备有更高的成本，以便在Shapelet优化期间在决策参量之内引入（reinziehen）所述点并且使其因此也可以在Shapelet的优化中被考虑。

为了优化Shapelet的数据点，该方程式（方程式5）可以根据Shapelet的数据点来被最小化。为此，可以例如针对梯度下降法来应用所述梯度的以下近似计算：

方程式（6）：

应注意的是，方程式（方程式6）已经针对多个数据系列的第i个数据系列来被列出了。

在使用子梯度的情况下，可以如在下文中那样地根据方程式（方程式6）来组成（zusammensetzen）该导数。

来自方程式（方程式6）的第一项可以具有以下子梯度形式：

（方程式7）：

其中是来自第k个Shapelet至第i个数据系列的Shapelet转换的所测量的距离的能够预先给定的经加权的总和。可选地，也被归一化（normieren）并且所测量的距离D_i,k,j的加权以来进行，其中w是加权常量。可替代地，的归一化可以借助除以所使用的权重的总和来被归一化。是概率密度函数（Wahrscheinlichkeitsdichtefunktion），尤其是均匀分布。也能够设想的是其他概率密度函数、诸如高斯分布。是阶跃函数（Ursprungfunktion）（“Heaviside-Funktion（亥维赛函数）”）。

该方程式（方程式6）的第二项可以具有以下梯度形式：

（方程式8）：

其中利用方程式（方程式7）和（方程式8）可以通过梯度下降法来最小化方程式（方程式5）。在此，于是可以由根据方程式（方程式8）的子梯度和根据方程式（方程式8）的梯度的总和来组成该变化参量。应注意，所述方程式（方程式7）和（方程式8）适合于各一个训练数据系列。一旦使用多个不同的训练数据系列，就可以针对每个训练数据系列来确定变化参量，其中所述Shapelet的适配可以根据对所确定的变化参量取平均值来被执行，这具有有利的效应：这与所有训练数据系列叠加的成本函数的最小化相比是较不计算密集的。

借助该方程式（方程式6）可以针对Shapelet的数据点来确定变化参量。Shapelet的数据点的值根据所确定的变化参量来被适配。优选地，该梯度的变化参量和数据点的适配以学习率（Lernrate）根据对变化参量的权重来进行，其中所述权重被从数据点的当前值减去。

也能够设想的是，使用多个不同的Shapelet，为此可以根据以上提到的方程式之一针对每个Shapelet来单独地执行优化。此外，也可以使用多个不同的训练数据系列。一旦多个不同的训练数据系列被使用，就针对每个训练数据系列来执行每个Shapelet的优化。为此，针对每个Shapelet和针对每个数据系列分别确定用于相应的Shapelet的变化参量。在已确定了所述变化参量之后，例如针对每个Shapelet来确定该变化参量的平均并且根据已求平均的变化参量来适配相应的Shapelet。

当该Shapelet和决策参量的优化交替地多重地相继地被重复时，所述步骤优选地被多次地重复，直至该Shapelet的至少一个数据点的所确定的变化参量小于0.0001。可替代地，也可以使用其他中止标准（Abbruchkriterium）。

在另一实施例中，用于以多个不同初始化的Shapelet来确定Shapelet的方法被多重地实施，并且可以最好地被用于探测异常的新适配的Shapelet被跟踪（tracken）并且被进一步使用或者直接作为Shapelet用于探测。优选地，确定变化参量的和适配Shapelet的步骤被相继地实施10次并且在不同初始化的和随后被适配的Shapelet中的最适合的Shapelet被进一步使用。可替代地，该方法可以以交替适配决策参量和随后适配Shapelet来多重地针对具有不同初始化的相同Shapelet来被执行。作为Shapelet于是优选地使用如下Shapelet，所述Shapelet产生与正常数据系列的小距离并且因此适合作为用于正常的数据系列的代表（Repräsentant）。

在步骤43已结束了之后，接着步骤44。在步骤44中，经适配的Shapelet和经适配的决策参量被用于，在所检测的数据系列中探测异常，其中所述所检测的数据系列例如已借助检测单元（11）来被检测。在此，可以以所确定的Shapelet借助Shapelet转换来测量多个距离并且由此确定最小的所测量的距离。在检验是否在所检测的数据系列中存在异常的情况下，最小的所测量的距离被与决策参量比较，参见图3。

可选地，可以根据所探测的异常来确定控制参量，以便根据所述控制参量借助控制单元（13）来控制执行机构（16）。

在一种可替代的实施方式中，所述方法（40）的步骤43循环性地被重复，直至满足能够预先给定的中止标准。也能够设想的是：如果例如有另外的训练数据可供使用和/或已被确定了，借助经适配的Shapelet还可以探测到不容许的异常，则该方法（40）循环性地在步骤43结束之后以步骤42开始。

在一种用于优化Shapelet的优选的实施例中，选择在0.1%和5%之间的α，并且Shapelet的数目与待研究的数据系列的或训练数据系列的长度有关地（in Relation zu）被选择，其中所述Shapelet的数目位于该数据系列的长度的1%和10%之间。所使用的Shapelet的长度在所述优选的实施例中与所述数据系列的长度相关联地被选择为在数据系列的长度的5%和30%之间。

Claims

1.一种用于确定由传感器值（21）所组成的系列（20）是否包含异常的方法（40），所述方法包括：

- 提供Shapelet（22）和至少一个训练数据系列；

- 在所述训练数据系列的多个不同的能够预先给定的位置处分别测量在所述Shapelet（22）和所述训练数据系列之间的距离（32a，32b）；

- 从所测量的所述距离中确定至少一个最小距离；和

- 针对所述Shapelet（22）的至少一个能够预先给定的数据点（23）确定至少一个变化参量，其中所述变化参量以与所述所测量的距离（32a,32b）其中的至少一个相关的方式来被确定。

2.根据权利要求1所述的方法，其中，在所述最小距离的所述确定之后接着如此进行决策参量（31）的确定，使得所述最小距离比所述决策参量（31）加上能够预先给定的容限参量更小；和

其中所述变化参量此外根据所述决策参量（31）和所述能够预先给定的容限参量来被确定。

3.根据上述权利要求中任意一项所述的方法，其中借助梯度下降法鉴于所述Shapelet（22）的所述能够预先给定的数据点（23）来确定所述变化参量。

4.根据权利要求3所述的方法，其中所述变化参量根据所述梯度下降法的至少一个梯度（方程式8）来被确定，和

其中借助根据所述变化参量来对所述Shapelet（22）的所述能够预先给定的数据点（23）的适配来最小化成本函数（方程式3）。

5.根据权利要求4所述的方法，其中借助所述梯度下降法来确定至少一个所述梯度（方程式8）和至少一个子梯度（方程式7），

其中所述梯度根据被用于确定所述变化参量的所测量的所述距离其中至少之一来被确定，

其中所述子梯度（方程式7）根据所述容限参量来被确定，和

其中所述变化参量也根据所述至少一个子梯度或所确定的所述子梯度（方程式7）来被确定。

6.根据权利要求2至5中任意一项所述的方法，其中当所述最小距离大于所述决策参量（31）时，那么所述最小距离在所述容限参量中作为处罚参量来被考虑，其中所述处罚参量取决于所述最小距离在所述决策参量（31）以上的超出。

7.根据上述权利要求中任意一项所述的方法，其中所述变化参量根据多个所述所测量的距离（32a，32b）的加权的总计来被确定。

8.根据权利要求7所述的方法，其中所述梯度（方程式8）和所述子梯度（方程式7）分别根据加权的、总计的所述距离（32a，32b）来被确定。

9.根据上述权利要求中任意一项所述的方法，其中在确定所述变化参量之后，所述Shapelet（22）的所述能够预先给定的数据点（23）根据所述变化参量来被适配，

其中对多个所述距离（32a，32b）的所述测量和对所述决策参量（31）的所述适配和对至少一个适配参量的所述确定的步骤和对所述Shapelet（22）的所述能够预先给定的数据点（23）的所述适配的步骤多次地相继被实施，和

其中所述对多个所述距离（32a，32b）的所述测量的步骤分别借助经适配的所述Shapelet来执行，其中所述经适配的Shapelet在根据所述变化参量来适配所述Shapelet（22）的所述数据点（23）的步骤中已经被适配了。

10.根据上述权利要求中任意一项所述的方法，其中提供多个不同的训练数据系列，

其中在测量所述距离（32a，32b）时分别测量在所述Shapelet（22）至所述训练数据系列其中分别一个之间的在相应的所述训练数据系列的不同的能够预先给定的点处的多个距离，和

从每个训练数据系列的所述多个所测量的距离中分别确定至少一个最小距离，

其中所述决策参量（31）如此被适配，使得分别所确定的所述最小距离比所述决策参量（31）加上所述容限参量更小，

其中分别针对所述训练数据系列其中的每个分别确定用于所述Shapelet(22)的至少一个能够预先给定的数据点(23)的至少一个变化参量,

并且其中所述Shapelet（22）的所述能够预先给定的数据点（23）根据对所确定的所述变化参量取平均值来被适配。

11.根据权利要求10所述的方法，其中所述子梯度（方程式7）仅根据大于所述决策参量（31）的那些最小距离来被确定。

12.根据权利要求2至11中任意一项所述的方法，其中在适配所述决策参量（31）时此外也适配所述容限参量。

13.根据上述权利要求中任意一项所述的方法，其中根据所述决策参量（31）来决策是否存在异常，

其中根据是否已决策了是否存在异常来操控执行机构（16）。

14.计算机程序，所述计算机程序包括如下指令，当所述计算机程序在计算机上运行时，所述指令促使实施根据权利要求1至13中任意一项所述的方法。

15.机器可读的存储元件（15），根据权利要求14所述的计算机程序被存储在所述机器可读的存储元件上。

16.装置（10），所述装置被设立用于，实施根据权利要求1至13中任意一项所述的方法。