CN117556362A

CN117556362A - 一种基于数据分析的测量数据异常监管系统及方法

Info

Publication number: CN117556362A
Application number: CN202410033208.7A
Authority: CN
Inventors: 肖文科; 范国军; 曾群芳; 李成新
Original assignee: Boltzmann Guangzhou Technology Co ltd
Current assignee: Boltzmann Guangzhou Technology Co ltd
Priority date: 2024-01-10
Filing date: 2024-01-10
Publication date: 2024-02-13
Anticipated expiration: 2044-01-10
Also published as: CN117556362B

Abstract

本发明公开了一种基于数据分析的测量数据异常监管系统及方法，包括：损耗累积模块、刚性测量模块、神经网络模块、回归调校模块和异常归类模块，损耗累积模块用于计算仪器的动态损耗，并折算影响值，刚性测量模块用于评估材料的刚性程度，计算分散率区间，神经网络模块用于构建神经网络模型，回归调校模块用于处理测量点，并将其拟合为线性回归函数，异常归类模块用于提取异常点，计算异常点的分散率，并对异常点分类，本发明能够有效缓解由于设备仪器故障、数据采集错误或实验操作失误等原因而产生的数据污染，提高了测量的准确性，使实际测量数据能够为测量人员带来更高的参考价值。

Description

一种基于数据分析的测量数据异常监管系统及方法

技术领域

本发明涉及数据分析技术领域，具体为一种基于数据分析的测量数据异常监管系统及方法。

背景技术

精密测量是指对物体或物理量进行高精度、高精确度的测量，使人们获取准确的数据和信息，从而更好地理解和应用于生产和科研实践。在工业制造中，精密测量用于检测产品的尺寸、形状、表面质量等，需要采用光学测量仪、电子测量仪器、机械测量仪器等多种测量设备和仪器。

但在实际测量中，这些仪器很容易出现异常，例如机械测量仪的偶然卡壳、光学测量仪的光栅干扰等，都会影响对材料板厚度的测量结果，从而在测量数据中表现出数据异常，与材料本身的异常数据混杂在一起，污染测量结果，从而影响精密测量仪器的测量效果，而由于不同材料物理特性的不同，分离这些数据会变得异常困难。

此外，在需要频繁测量的场景中，测量仪器在测量过程中会发生损耗，从而影响测量结果，对于一些寿命较短的仪器，频繁的标度调整会大大加重测量仪器探头的损耗并导致结果偏移，且在测量厚度的表面时，损耗的表现程度也不同，现有的损耗补偿通过经验公式来判断，不能精确反映出损耗对实测数据的影响情况。

发明内容

本发明的目的在于提供一种基于数据分析的测量数据异常监管系统及方法，以解决上述背景技术中提出的问题。

为了解决上述技术问题，本发明提供如下技术方案：一种基于数据分析的测量数据异常监管系统，包括：损耗累积模块、刚性测量模块、神经网络模块、回归调校模块和异常归类模块；

所述损耗累积模块用于计算仪器在测量过程受到的动态损耗，并将其折算为对测量数据的影响值；

所述刚性测量模块用于获取已测量的测量点，通过分析相邻测量点间曲率的大小，评估材料的刚性程度，计算测量点的分散率区间；

所述神经网络模块用于根据测量数据的特征构建多层神经网络模型，对数据进行拟合，得到材料的粗糙度特征；

所述回归调校模块用于根据损耗对测量数据的影响值处理已测量点，并将处理后的测量点拟合为线性回归函数；

所述异常归类模块用于根据材料的粗糙度和线性回归函数，提取测量数据中的异常点，计算所有异常点的分散率，通过其是否位于分散率区间中，分离仪器异常点与材料异常点。

进一步的，所述损耗累积模块包括：标度调节单元和损耗表现单元；

所述标度调节单元用于获取仪器每次进行测量时测量点的变化率，从而得到仪器标度的调节频率，从而计算出每次标度调节对仪器带来的损耗；

所述损耗表现单元用于根据仪器的损耗与测量点的特征，折算出测量数据的偏移量函数。

进一步的，所述刚性测量模块包括：函数生成单元、曲率计算单元和刚性数据单元；

所述函数生成单元用于获取已采集的测量点，构建测量结果与测量次数的函数，使用自适应双指数模型平滑方法将其拟合，得到目标函数；

所述曲率计算单元用于将目标函数二次求导，计算每个测量点对应位置的曲率；

所述刚性数据单元用于根据测量点间曲率的变化特征，得到材料整体上的刚性系数，根据刚性系数计算测量点的分散率区间。

进一步的，所述神经网络模块包括：深度学习单元和模型构建单元；

所述深度学习单元用于根据仪器特征选取合适的神经网络，并将历史测量数据输入所述神经网络，对网络进行训练；

所述模型构建单元用于将当前测量数据输入训练完毕的神经网络，进行回归性的分类计算。

进一步的，所述回归调校模块包括：损耗排除单元和线性回归单元；

所述损耗排除单元用于根据偏移量函数修正已测量的测量点，校准仪器损耗；

所述线性回归单元用于根据神经网络的分类计算，将已测量的所有测量点拟合为线性回归方程。

进一步的，所述异常归类模块包括：异常点提取单元、分散率判定单元和数据清洗单元；

所述异常点提取单元用于根据材料的粗糙度判断异常阈值，将与线性回归方程间偏差大于阈值的测量点标记为异常测量点；

所述分散率判定单元用于计算异常测量点的分散率；

所述数据清洗单元用于通过分析异常点的分散率是否位于分散率区间中，分离仪器异常点与材料异常点。

一种基于数据分析的测量数据异常监管方法，包括以下步骤：

S100.测量前，读取设备的初始累积损耗，测量过程中，读取每个测量点的两个相邻测量点，计算三个测量点的变化率，得到仪器的损耗累加值；

S200.测量结束后，读取已测量部分的测量数据，构建测量结果与测量次数的函数，使用双指数模型平滑方法将其拟合，得到目标函数，通过计算目标函数二阶导数的总变异量，得到材料的刚性系数；

S300.根据步骤S100中每一个点的累积损耗，折算出测量数据的偏移量函数，分析偏移量函数的变化率，结合步骤S200中得到的刚性系数，计算出材料的粗糙度；

S400.根据仪器测量特征构建神经网络模型，将已测量数据与损耗函数输入神经网络进行线性回归拟合，得到测量数据的标准回归函数，并计算出测量点的分散率区间；

S500.计算每个测量点与标准回归函数的偏差值，将偏差值超过材料粗糙度的测量点标记为异常测量点，进一步计算每一个异常测量点的分散程度，将分散程度位于分散率区间的异常测量点标记为材料异常，其余标记为设备异常，对设备异常的测量点数据进行清洗后，将数据输出给用户。

进一步的，步骤S100包括：

步骤S101.读取测量设备的初始累积损耗R0，所述初始累积损耗由上一次测量后的记录得到，初始值为0，设置仪器的进样步距、进样速度与探头高度后开始测量；

步骤S102.测量过程中，仪器每测量一个点的数据，则获取这个点前后两个点的数据值，将这三个点记为点1、点2和点3，测量值分别记为a1、a2和a3，则其变化率W=（|a1-a2|+|a3-a2|）/2e，所述e为设备的进样速度；

步骤S103.计算设备的损耗累加值R：

；

其中T为设备的使用寿命，C为仪器的进样步距，h为仪器的探头高度；

则仪器在点2处的初始累积损耗Re=R0+∑R，其中∑R表示点2与本次测量中点2前所有测量点损耗累加值的和；

步骤S104，重复上述步骤，测量出每个测量点的累积损耗；

其中，第一个测量点与最后一个测量点的损耗累加值固定为0。

本发明能够通过分析三个相邻测量点的变化率，得到损耗表现基数与损耗累加值，并依靠累积算法判断仪器在测量过程中实际损耗对数据的影响值，对数据进行校准，能够有效避免仪器在长期使用过程中存在漂移或误差累积的情况，从而对测量数据造成影响。

进一步的，步骤S200包括：

步骤S201.测量完毕后，获取每个已采集测量点的测量值，以测量次数为横轴，测量值为纵轴建立直角坐标系，构建测量结果与测量次数的函数F0（x），其中x表示测量次数，且F0（x）＞0，所述F0（x）为表示测量点与测量值之间关系的散点函数；

步骤S202.使用双指数模型平滑方法将步骤S201中得到的函数F0（x）进行拟合，得到由平滑曲线构成的目标函数F（x）；

步骤S203.对F（x）进行二次求导，得到F（x）的一阶导函数f1(x)与二阶导函数f2（x）；

当f1(x)=0恒成立时，刚性系数固定为1，否则转到步骤S204；

步骤S204.通过计算目标函数二阶导数的总变异量，得到材料的刚性系数Y：

；

其中，m为测量的总次数，m≥1，且Y>0；所述刚性系数Y越低，代表材料的硬度越高。

本发明能够考虑到刚性材料的异常数据会有一个跳变的过程，而柔性材料测量数据的变化较为缓和，通过测量数据分析出材料的硬度，从而判断结果中的异常值是否为设备异常。

进一步的，步骤S300包括：

步骤S301.根据每一个测量点的测量值与累积损耗，计算测量过程中测量值的偏移量P：

；

其中，d为仪器示值误差的最大值，由仪器的出厂规格得到，a为该测量点处的测量值；

步骤S302.根据材料的刚性系数与步骤S102中得到的各点变化率计算材料表面的粗糙度U：

；

其中，Wi表示第i个测量点处的变化率；

该步骤能够确定筛选异常点时的阈值大小，在测量不同材料时，动态选取阈值大小，保证了测量数据的适应能力。

进一步的，步骤S400包括：

步骤S401.根据仪器特征选取合适的神经网络，并将该仪器的历史测量数据输入所述神经网络，对网络进行多层语义训练；

步骤S402.将每个测量点的测量值与偏差值输入训练完毕的神经网络，进行回归性的分类计算，将所有测量点拟合为线性回归函数，得到测量数据的标准回归函数Z（x）；

步骤S403.按以下公式，确定测量点的分散率特征值K：

；

其中，F0为F0（x）在定义域[1,m]内的均值，K>0；

若K>1，则测量点的分散率区间为(K，1-1/K)，若K≤1,则测量点的分散率区间为（0，K）；

该步骤通过计算回归性数据的离散程度，得到了测量数据在特定刚性系数下测量点的最大和最小聚集程度，位于聚集区间内的异常点，即可认为是由于材料缺陷而导致的测量异常。

进一步的，步骤S500包括：

步骤S501.获取误差函数V（x），所述V（x）=|F（x）-Z(x)|，将x的值从1到m逐一代入误差函数V（x），当V（x）≥U时，将x对应的测量点标记为异常测量点；

步骤S502.按以下公式计算每个异常测量点的分散率：

；

其中，W1表示该异常测量点前一个异常测量点的变化率，W2表示该异常测量点后一个异常测量点的变化率，V（x1）表示该异常测量点的前一个异常测量点的测量值，表示该异常测量点的后一个异常测量点的测量值；

步骤S503.根据分散程度对异常测量点进行分类，若异常点分散程度L的值位于步骤S403中得到的分散率区间内，将其标记为材料异常点，否则，若异常点分散程度L的值位于分散率区间外，将其标记为仪器异常点；

步骤S504.清洗掉测量数据中的仪器异常点，将标记测量数据中的材料异常点做好标记，并把处理后的测量数据发送给用户。

本发明能够对测量数据中的异常点进行分离与清洗，有效缓解了由于设备仪器故障、数据采集错误或实验操作失误等原因而产生的数据污染，有效克服了传统测量过程中，测量数据产生系统性偏差的问题，提高了测量的准确性。

与现有技术相比，本发明所达到的有益效果是：

1.本发明能够通过分析三个相邻测量点的变化率，得到损耗表现基数与损耗累加值，并依靠累积算法判断仪器在测量过程中实际损耗对数据的影响值，对数据进行校准，能够有效避免仪器在长期使用过程中存在漂移或误差累积的情况，从而对测量数据造成影响，也有助于帮助确定仪器进行维护和校准的时间，保持仪器的性能和准确度，及时发现并修复测量问题。

2.本发明能够考虑到刚性材料的异常数据会有一个跳变的过程，而柔性材料测量数据的变化较为缓和，通过测量数据分析出材料的硬度，从而判断结果中的异常值是否为设备异常，从而对测量数据中的异常点进行分离与清洗，有效缓解了由于设备仪器故障、数据采集错误或实验操作失误等原因而产生的数据污染，提高了测量的准确性。

3.本发明能够通过人工神经网络对测量数据进行连续性拟合，输入仪器的损耗与材料的刚性系数，从而得到材料的标准厚度模型，并从中分辨出异常数据，有效克服了传统测量过程中，测量数据产生系统性偏差的问题，使实际测量数据能够为测量人员带来更高的参考价值。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明一种基于数据分析的测量数据异常监管系统的结构示意图；

图2是本发明一种基于数据分析的测量数据异常监管方法的步骤示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供技术方案：一种基于数据分析的测量数据异常监管系统，包括：损耗累积模块、刚性测量模块、神经网络模块、回归调校模块和异常归类模块；

所述损耗累积模块包括：标度调节单元和损耗表现单元；

所述刚性测量模块包括：函数生成单元、曲率计算单元和刚性数据单元；

所述神经网络模块包括：深度学习单元和模型构建单元；

所述回归调校模块包括：损耗排除单元和线性回归单元；

所述异常归类模块包括：异常点提取单元、分散率判定单元和数据清洗单元；

所述分散率判定单元用于计算异常测量点的分散率；

如图2所示，一种基于数据分析的测量数据异常监管方法，包括以下步骤：

步骤S100包括：

步骤S103.计算设备的损耗累加值R：

；

步骤S104，重复上述步骤，测量出每个测量点的累积损耗；

步骤S200包括：

步骤S201.测量完毕后，获取每个已采集测量点的测量值，以测量次数为横轴，测量值为纵轴建立直角坐标系，构建测量结果与测量次数的函数F0（x），其中x表示测量次数，且F0（x）＞0；

步骤S202.使用双指数模型平滑方法将步骤S201中得到的函数进行拟合，得到由平滑曲线构成的目标函数F（x）；

当f1(x)=0恒成立时，刚性系数固定为1，否则转到步骤S204；

；

步骤S300包括：

；

其中，Wi表示第i个测量点处的变化率；

步骤S400包括：

步骤S403.按以下公式，确定测量点的分散率特征值K：

；

其中，F0为F0（x）在定义域[1,m]内的均值，K>0；

步骤S500包括：

步骤S502.按以下公式计算每个异常测量点的分散率：

；

实施例：

由机械测厚仪测量一块金属板的厚度，机械测量仪的进样步距、进样速度与探头高度分别为10mm、5mm/s和20mm，初始累积损耗为100mm，最大示值误差d=0.02mm，仪器测量杆的总调节寿命为1820mm，共测量8个点，测量数值分别为：2mm、2.02mm、2.05mm、1.98mm、2.01mm、2.02mm、2.03mm和2.01mm；

计算每个点的变化率，以点4为例，变化率W=（|a3-a4|+|a4-a5|）/2e=0.01，该点的损耗累积值R=2mm，进一步计算该点的偏差值P=0.014mm；

将所有测量点的数据构建为平滑函数，则计算得材料的刚性系数Y=0.64，进一步得到材料的粗糙度U=0.021；

用该仪器的历史测量数据训练神经网络，向神经网络中输入各点的测量值与偏差值，可以得到本次测量的线性回归函数Z（x），判断各点与回归函数间的误差分别为：0、0.022、0.048、0.023、0.011、0.022、0.031和0.021，进一步确定本次测量的分散率特征值K约为0.5，则分散率区间为（0,0.5）；

则将点2、点3、点4和点7标记为异常点，计算各点的分散程度可得，点4和点7位于分散度区间外，则将点2与点7标记为设备异常点，点2和点3为材料异常点，将标记后的数据发送给用户。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于数据分析的测量数据异常监管方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的一种基于数据分析的测量数据异常监管方法，其特征在于：步骤S100包括：

步骤S103.计算设备的损耗累加值R：

；

步骤S104，重复上述步骤，测量出每个测量点的累积损耗；

3.根据权利要求2所述的一种基于数据分析的测量数据异常监管方法，其特征在于：步骤S200包括：

当f1(x)=0恒成立时，刚性系数固定为1，否则转到步骤S204；

；

其中，m为测量的总次数，m≥1，且Y>0。

4.根据权利要求3所述的一种基于数据分析的测量数据异常监管方法，其特征在于：步骤S300包括：

；

其中，Wi表示第i个测量点处的变化率。

5.根据权利要求4所述的一种基于数据分析的测量数据异常监管方法，其特征在于：步骤S400包括：

步骤S403.按以下公式，确定测量点的分散率特征值K：

；

其中，F0为F0（x）在定义域[1,m]内的均值，K>0；

步骤S500包括：

步骤S502.按以下公式计算每个异常测量点的分散率：

；

6.一种基于数据分析的测量数据异常监管系统，其特征在于，所述系统包括以下模块：

损耗累积模块、刚性测量模块、神经网络模块、回归调校模块和异常归类模块；

7.根据权利要求6所述的一种基于数据分析的测量数据异常监管系统，其特征在于：

所述损耗累积模块包括：标度调节单元和损耗表现单元；

8.根据权利要求6所述的一种基于数据分析的测量数据异常监管系统，其特征在于：

9.根据权利要求6所述的一种基于数据分析的测量数据异常监管系统，其特征在于：

所述神经网络模块包括：深度学习单元和模型构建单元；

所述模型构建单元用于将当前测量数据输入训练完毕的神经网络，进行回归性的分类计算；

所述回归调校模块包括：损耗排除单元和线性回归单元；

10.根据权利要求6所述的一种基于数据分析的测量数据异常监管系统，其特征在于：

所述分散率判定单元用于计算异常测量点的分散率；