CN116011894A - 一种铝合金棒生产数据管理系统 - Google Patents
一种铝合金棒生产数据管理系统 Download PDFInfo
- Publication number
- CN116011894A CN116011894A CN202310307769.7A CN202310307769A CN116011894A CN 116011894 A CN116011894 A CN 116011894A CN 202310307769 A CN202310307769 A CN 202310307769A CN 116011894 A CN116011894 A CN 116011894A
- Authority
- CN
- China
- Prior art keywords
- data
- category
- production data
- moment
- production
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 227
- 229910000838 Al alloy Inorganic materials 0.000 title claims abstract description 45
- 238000013523 data management Methods 0.000 title claims abstract description 25
- 238000011156 evaluation Methods 0.000 claims abstract description 72
- 230000002159 abnormal effect Effects 0.000 claims abstract description 65
- 238000012937 correction Methods 0.000 claims abstract description 59
- 230000011218 segmentation Effects 0.000 claims abstract description 44
- 238000001125 extrusion Methods 0.000 claims abstract description 42
- 238000004220 aggregation Methods 0.000 claims abstract description 35
- 230000002776 aggregation Effects 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000012216 screening Methods 0.000 claims abstract description 13
- 230000008569 process Effects 0.000 claims abstract description 12
- 238000001514 detection method Methods 0.000 claims abstract description 11
- 238000007405 data analysis Methods 0.000 claims abstract description 5
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000013507 mapping Methods 0.000 claims description 9
- 238000000638 solvent extraction Methods 0.000 claims description 5
- 238000005192 partition Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims 1
- 230000005856 abnormality Effects 0.000 abstract description 13
- 238000012545 processing Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 26
- 238000009826 distribution Methods 0.000 description 16
- 230000008859 change Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000005482 strain hardening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Complex Calculations (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种铝合金棒生产数据管理系统,该系统包括:数据获取模块,用于获取铝合金棒挤压的过程中的生产数据;数据预处理模块,用于获取生产数据对应的局部聚集数据集合,获得相关性特征值,进而计算修正系数;数据分割模块,用于筛选出待选分割数据点,分别对生产数据进行二分类;数据分析模块,用于获取离散数据点和聚集数据点,计算第一类别评价指标和第二类别评价指标,进而获得综合类别评价指标;数据管理模块,用于筛选出最优分割数据点,对生产数据进行分割,构建孤立树组成孤立森林;根据孤立森林获得生产数据的异常检测结果。本发明提高了铝合金棒生产数据的异常检测精度。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种铝合金棒生产数据管理系统。
背景技术
挤压机作为铝合金型材生产线上的重要设备,其运行时的安全问题被广泛关注。在铝合金型材的挤压工艺中,挤压设备可能存在难以直接观察到的异常情况,若没有对异常情况进行及时的处理,极易引起其他相关的异常事件发生,从而对产品质量造成影响。因此,在对铝合金棒的挤压过程的生产数据进行数据管理时,对其生产数据进行异常检测显得尤为重要。
孤立森林算法是集成学习算法中一种典型的无监督异常检测算法,利用该算法对铝合金棒的挤压过程中的生产数据进行异常检测时,基于分割点生成孤立树。在传统的算法中往往是从随机选择的样本数据中随机选择数据点作为分割点生成孤立树。而分割点能够直接影响孤立树的生成质量,该算法的分割点的选取随机性较大,容易将正常数据误分割为异常数据,将异常数据误分割为正常数据,导致异常数据的识别精度较低。
发明内容
为了解决孤立森林算法的分割点的选取随机性较大,进而导致异常数据的识别精度较低的技术问题,本发明的目的在于提供一种铝合金棒生产数据管理系统,所采用的技术方案具体如下:
数据获取模块,用于获取铝合金棒进行挤压的过程中,在设定时间段内每个时刻的生产数据;
数据预处理模块,用于获取每个时刻的生产数据对应的局部聚集数据集合,根据每个时刻的生产数据与所述集合中的元素之间的差异得到每个时刻的生产数据的相关性特征值;根据所述相关性特征值、每个时刻的生产数据以及所述集合中的元素得到修正系数;
数据分割模块,用于利用修正系数对生产数据进行筛选得到待选分割数据点;利用待选分割数据点分别对生产数据进行二分类,得到第一类别和第二类别;所述第一类别的平均修正系数大于所述第二类别的平均修正系数;
数据分析模块,用于获取第一类别中的离散数据点和聚集数据点,根据离散数据点和聚集数据点对应的修正系数得到第一类别评价指标;根据两个类别内生产数据之间的差异得到第二类别评价指标;根据第一类别评价指标和第二类别评价指标得到每个待选分割数据点对应的综合类别评价指标;
数据管理模块,用于利用综合类别评价指标对待选分割数据点进行筛选得到最优分割数据点,根据最优分割数据点对生产数据进行分割,构建孤立树组成孤立森林;根据孤立森林获得生产数据的异常检测结果。
优选地,所述获取每个时刻的生产数据对应的局部聚集数据集合具体为:
每个时刻均对应第一设定数量种不同的生产数据,利用每个时刻所有生产数据的归一化值组成每个时刻的特征元组;将每个时刻的特征元组映射至空间内得到每个时刻对应的数据点;
将任意一个时刻对应的数据点记为目标数据点,计算除目标数据点外其他数据点与目标数据点之间的距离,将所有距离按照设定顺序进行排列,并按照排列顺序获取设定数量的其他数据点,构成目标数据点的局部聚集数据集合;所述目标数据点的局部聚集数据集合为该时刻的生产数据对应的局部聚集数据集合。
优选地,所述相关性特征值的获取方法具体为:
其中,表示第a个时刻的生产数据的相关性特征值,表示第a个时刻的生产数
据对应的局部聚集数据集合中元素的总数量,表示第a个时刻对应的数据点的特征元组
中第j个生产数据的数据值,表示集合中第i个数据点的特征元组中第j个生产数据的数
据值,表示集合中第i+1个数据点的特征元组中第j个生产数据的数据值,表示第a个
时刻的生产数据对应的时刻,表示集合中第i个数据点对应的时刻,表示集合中第i+1
个数据点对应的时刻,ε为超参数,表示特征元组中包含的生产数据数量。
优选地,所述修正系数的获取方法具体为:
对于任意一个时刻,获取该时刻对应的数据点与集合中每个数据点之间的距离,
计算该时刻对应的相关性特征值与集合中每个数据点对应的相关性特征值之间差值的绝对值,计算所述距离与差值的绝对值之间的乘积;对所有的乘积进行求和,以求和结果的归一化值作为该时刻的生产数据对应的修正系数。
优选地,所述获取第一类别中的离散数据点和聚集数据点具体为:
对于第一类别内任意一个时刻的生产数据,当该时刻的相邻两个时刻的生产数据均不在第一类别内或者只有一个相邻时刻的生产数据在第一类别内时,将所述任意一个时刻的生产数据记为离散数据点;将第一类别内所有时刻的生产数据除离散数据点之外的所有时刻的生产数据记为聚集数据点。
优选地,所述第一类别评价指标的获取方法具体为:
获取第一类别内离散数据点的数量与所有时刻的数量之间的比值,计算第一类别内所有离散数据点的修正系数的方差,以所述比值和方差的乘积作为离散系数;
获取第一类别内任意两个聚集数据点的修正系数的差值绝对值,并获取所述任意两个聚集数据点对应时刻的差值绝对值,计算两个差值绝对值之间的乘积的负相关映射值,对所有任意两个聚集数据点对应的所述负相关映射值求和得到聚集系数;
以所述离散系数和聚集系数的乘积作为第一类别评价指标;
所述第二类别评价指标的获取方法具体为:
获取第二类别中待选分割数据点的数量的倒数,根据第一类别和第二类别中所有生产数据之间的差异确定相关系数,以所述倒数和相关系数的乘积作为第二类别评价指标;所述差异与相关系数之间的关系为负相关关系。
优选地,所述综合类别评价指标的获取方法具体为:
以第一类别评价指标和第二类别评价指标的平均数作为待选分割数据点对应的综合类别评价指标。
优选地,所述利用修正系数对生产数据进行筛选得到待选分割数据点具体为:
将修正系数大于预设的判断阈值对应时刻的生产数据作为待选分割数据点。
优选地,所述利用综合类别评价指标对待选分割数据点进行筛选得到最优分割数据点具体为:
综合类别评价指标的最大值对应的待选分割数据点作为最优分割数据点。
优选地,所述根据最优分割数据点对生产数据进行分割,构建孤立树组成孤立森林具体为:
从所有时刻的生产数据中抽取设定数量个样本数据,放入树的根节点;对样本数据进行二分类分割,每次分割均获取样本数据中对应的最优分割数据点,将样本数据中小于最优分割数据点的数据放在当前节点的左子节点,将大于或等于最优分割数据点的数据放在当前节点的右子节点;不断构造新的子节点,直到满足设定规则时停止,得到孤立树组成孤立森林。
本发明实施例至少具有如下有益效果:
本发明首先获取铝合金棒在挤压过程中每个时刻的生产数据作为数据集;对每个时刻的生产数据进行分析,获取对应的局部聚集数据集合,包含了生产数据周围较为聚集的数据,进而可以根据生产数据与对应集合中元素之间的差异得到相关性特征值,即通过对生产数据与其周围较为聚集的数据之间的差异进行分析,利用相关性特征值表征生产数据变化趋势之间的相关性,根据相关性特征值获得修正系数,利用修正系数表征了生产数据与其周围较为聚集的数据的异常分布情况;然后筛选出待选分割数据点作为分割点对生产数据进行二分类分割,得到第一类别和第二类别,利用第一类别表示存在异常情况的数据所在类别,第二类别表示正常数据所在类别;进一步的,对每个待选分割数据点对应的分割效果进行评价,利用离散数据点表征可能存在异常情况的数据,利用聚集数据点表征为正常数据,通过对离散数据点和聚集数据点的修正系数进行分析,获得第一类别评价指标,进而通过对两个类别内生产数据之间的差异进行分析,获得第二类别评价指标,综合两个方面的评价结果得到综合类别评价指标;最后,基于分割效果对应的评价指标确定最优分割点,基于最优分割点对孤立树进行构建,减少了孤立树中无效节点的生成,降低了样本数据被误分割的可能性,提高了孤立树的生成质量,进而根据构建的孤立森林获得生产数据异常检测结果,避免了孤立森林算法的分割点对选取随机性较大的问题,提高了铝合金棒生产数据的异常检测精度与效率,使得能够对铝合金棒生产数据进行高效管理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明的一种铝合金棒生产数据管理系统的系统框图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种铝合金棒生产数据管理系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种铝合金棒生产数据管理系统的具体方案。
实施例:
本发明所针对的具体场景为:在生产铝合金棒时,需要对铝合金棒进行挤压成型,现有常采用铝合金型材挤压机将铝合金棒挤压成型。而挤压机设备可能存在难以直接观察到的异常情况,因此,在对铝合金棒的挤压过程的生产数据进行数据管理时,需要对其生产数据进行异常检测。
请参阅图1,其示出了本发明一个实施例提供的一种铝合金棒生产数据管理系统的系统框图,该系统包括:数据获取模块,数据预处理模块,数据分割模块,数据分析模块和数据管理模块。
数据获取模块,用于获取铝合金棒进行挤压的过程中,在设定时间段内每个时刻的生产数据。
首先,获取铝合金棒进行挤压的过程中,在设定时间段内每个时刻的生产数据,所述生产数据包括至少两种,即在同一个时刻下需要采集至少两种不同的生产数据。
具体地,完整的铝合金型材挤压工艺流程包括预热、挤压、压余、矫直、锯切、冷加工以及人工时效等步骤。在铝合金型材挤压过程中,对铝合金棒生产质量影响程度最大的生产数据一般为挤压机的挤压速度、压力和温度。
需要说明的是,在对铝合金型材进行挤压阶段,往往需要控制挤压速度,同时使用氮气控制温度,使铝合金型材在挤压杆推理的作用下从挤压筒的另一端的模具孔流出,得到与挤压模具孔形状尺寸相同的铝合金棒。故在挤压阶段挤压压力、挤压速度以及挤压温度被认为是保证铝合金棒质量的重要因素。
因此,在本实施例中,采集在对铝合金棒进行挤压的过程中,挤压速度、挤压压力和挤压温度作为生产数据。同时,将设定时间段的时间长度设置为30天,将两个时刻之间的时间间隔设置为1小时,实施者可根据实际情况进行设置。进一步的,在30天内每间隔一个小时的时刻下,采集挤压速度、挤压压力和挤压温度作为生产数据,进而每个时刻均对应了三种不同的生产数据。
数据预处理模块,用于获取每个时刻的生产数据对应的局部聚集数据集合,根据每个时刻的生产数据与所述集合中的元素之间的差异得到每个时刻的生产数据的相关性特征值;根据所述相关性特征值、每个时刻的生产数据以及所述集合中的元素得到修正系数。
首先,获取每个时刻的生产数据对应的局部聚集数据集合,具体地,每个时刻均对应第一设定数量种不同的生产数据,利用每个时刻所有生产数据的归一化值组成每个时刻的特征元组。在本实施例中,第一设定数量的取值为3,即每个时刻对应的三种不同的生产数据为挤压压力、挤压速度以及挤压温度,将三种数据的归一化值分别记为V,P和T,则每个时刻的特征元组可以表示为(V,P,T)。
将每个时刻的特征元组映射至空间内得到每个时刻对应的数据点;将任意一个时刻对应的数据点记为目标数据点,计算除目标数据点外其他数据点与目标数据点之间的距离,将所有距离按照设定顺序进行排列,并按照排列顺序获取设定数量的其他数据点,构成目标数据点的局部聚集数据集合;所述目标数据点的局部聚集数据集合为该时刻的生产数据对应的局部聚集数据集合。
在本实施例中,设定数量的取值为30,设定顺序为从小到大的顺序,即获取目标数据点在三维空间内距离从小到大排序得到的30个其他数据点,30个其他数据点构成了目标数据点的局部聚集数据集合。该集合内的元素为时刻对应的数据点,且这些数据点与目标数据点之间的距离较为接近。
对于每个时刻对应的数据点,若某一时刻对应的数据点存在异常情况,则在该时刻对应的数据点周围的数据点数量较少,进而存在异常情况的时刻的数据点对应的局部聚集数据集合中的数据点,与存在异常情况的时刻的数据点之间的距离之和较大。而当连续的时刻出现异常情况时,其中一个存在异常情况的时刻的数据点对应的局部聚集数据集合中的数据点,与所述其中一个存在异常情况的时刻的数据点之间的距离之和较小。
例如,第一种情况为:若第t个时刻的数据点存在异常情况,将第t个时刻的数据点记为目标数据点,该目标数据点为离散点时,说明目标数据点距离其他数据点较远,则距离该目标数据点较近的30个其他数据点与该目标数据点之间的距离之和就较大。
第二种情况为:若第t个、第t+1个、…、第t+m个时刻的数据点存在异常情况,其中m为连续异常的时刻个数,即从第t个时刻开始连续m个时刻的数据点出现异常情况,则在这m个时刻中数据点较为聚集。将m个时刻中的任意一个时刻的数据点记为目标数据点,距离该目标数据点较近的30个其他数据点与该目标数据点之间的距离之和就较小。
进一步的,基于数据点之间的距离之和对数据点周围数据点分布情况进行表征时,无法利用数据点周围数据点的分布情况对数据点的异常情况进行分析,因此,需要考虑局部数据点之间的数据关联性,利用数据关联性对数据点的分布情况进行准确的表征。
每个时刻的三种生产数据之间可能存在相关性特征,即随着挤压速度的增加,被挤压材料的变形剧烈程度增加,且胚料挤压压力增加,胚料和模具基础面之间的压力增加,产生了摩擦热,使得温度升高。
对于某些时刻的正常的生产数据,随着挤压速度的增加,另外两种生产数据也会随之增加,故正常的三种不同的生产数据的变化趋势存在一定的相似性。当某些时刻的生产数据出现异常情况时,例如挤压速度发生了异常变化,由于挤压速度的变化趋势发生异常,进而会对挤压压力和挤压温度造成干扰,使得挤压压力和挤压温度也发生异常变化,导致三种不同的生产数据的变化趋势与正常的生产数据之间存在差异。
基于此,根据每个时刻的生产数据与所述集合中的元素之间的差异得到每个时刻的生产数据的相关性特征值,所述相关性特征值的计算公式具体为:
其中,表示第a个时刻的生产数据的相关性特征值,表示第a个时刻的生产数
据对应的局部聚集数据集合中元素的总数量,表示第a个时刻对应的数据点的特征元组
中第j个生产数据的数据值,表示集合中第i个数据点的特征元组中第j个生产数据的数
据值,表示集合中第i+1个数据点的特征元组中第j个生产数据的数据值,表示第a个
时刻的生产数据对应的时刻,表示集合中第i个数据点对应的时刻,表示集合中第i+1
个数据点对应的时刻,ε为超参数,在本实施例中的取值为1,为了防止分母的取值为0,表
示特征元组中包含的生产数据数量。
表示第a个时刻的生产数据对应的数据点与对应的集合中第i个数据点
之间的数据值的差值,表示第a个时刻的生产数据对应的数据点与对应的集合中
第i+1个数据点之间的数据值的差值,这两个差值均反映了第a个时刻的生产数据与其局部
距离较近的数据点之间的数据值差值。若第a个时刻的生产数据是正常的数据,则这两个差
值之间的差异应当较小,则对应的相关性特征值的取值越大。
表示第a个时刻的生产数据对应的时刻与集合中第i个数据点对应的时刻
之间的差值,表示第a个时刻的生产数据对应的时刻与集合中第i+1个数据点对
应的时刻之间的差值,这两个差值均反映了第a个时刻的生产数据与其局部距离较近的数
据点之间的时间差值。
当两个数据点之间的时间差值越小时,对应的权重越大,即越需要关注数据点对
应的生产数据之间的差异情况,利用时间差值分别对数据值的差值进行赋权。即当
与的取值相同时,的取值较小,的取值较大,经过加权计算后,
时间较为接近的两个生产数据之间的差值的表征值越大,使得生产数据的差值之间的差异
较大,对应的相关性特征值的取值越小。
相关性特征值表征了每个时刻的数据点对应的特征元组中生产数据变化趋势之间的相关性。相关性特征值的取值越大,说明该时刻的数据点对应的特征元组中生产数据变化趋势的相关性越大。相关性特征值的取值越小,说明该时刻的数据点对应的特征元组中生产数据变化趋势的相关性越小。
最后,根据所述相关性特征值、每个时刻的生产数据以及所述集合中的元素得到修正系数,具体地,对于任意一个时刻,获取该时刻对应的数据点与集合中每个数据点之间的距离,计算该时刻对应的相关性特征值与集合中每个数据点对应的相关性特征值之间差值的绝对值,计算所述距离与差值的绝对值之间的乘积;对所有的乘积进行求和,以求和结果的归一化值作为该时刻的生产数据对应的修正系数,用公式表示为:
其中,表示第a个时刻的生产数据对应的修正系数,表示第a个时刻的生产数
据的相关性特征值,表示第a个时刻的生产数据对应的局部聚集数据集合中第i个数据
点的,表示第a个时刻的生产数据对应的局部聚集数据集合中元素的总数量,表示第a
个时刻对应的数据点与集合中第i个数据点之间的距离,Norm( )表示归一化函数。
需要说明的是,为了分析数据点的相关性特征值的变化情况,需要计算第a个时刻的生产数据对应的局部聚集数据集合中每个数据点对应的相关性特征值,其计算方法与第a个时刻的生产数据对应的数据点的相关性特征值的计算方法相同。
修正系数表征了每个时刻对应的数据点的周围距离较近的其他数据点的异常分布情况,利用数据点之间的相关性特征值之间的差异作为距离权重,使得相关性特征值差异越大,在使用距离表征异常分布情况时更加精确,解决了当挤压机连续多个时刻出现异常情况时,异常的数据点对应的距离之和较小,而导致误判的问题。
当挤压机连续多个时刻出现异常情况时,这些时刻对应的数据点与其对应的集合内数据点之间的距离较小,异常数据的局部分布密度较大,仅利用距离对数据的异常分布情况进行表征时,容易被误判为正常的数据。因此,当出现连续异常情况时,数据点对应的特征元组中的数据变化趋势之间的相关性被破坏,相关性特征值之间存在一定的差异,使得对应的修正系数的取值越大,说明该时刻对应的数据点周围数据点出现异常分布情况,进而说明该时刻对应的数据点为异常的数据点的可能性越大。
数据分割模块,用于利用修正系数对生产数据进行筛选得到待选分割数据点;利用待选分割数据点分别对生产数据进行二分类,得到第一类别和第二类别;所述第一类别的平均修正系数大于所述第二类别的平均修正系数。
需要说明的是,在本发明实施例中,采用孤立森林算法对生产数据进行异常检测,孤立森林算法是将样本数据与分割点进行比较,进而对样本数据进行分割,构建孤立树,基于孤立树获取数据的异常得分。然而孤立树算法在使用时,往往是对单类样本数据进行异常检测。当样本数据小于预设的分割点时,样本数据被划分为孤立树中当前节点的左侧子节点;当样本数据大于或等于分割点时,样本数据被划分为孤立树中当前节点的右侧子节点。而当分割点质量较差时,会将正常样本数据误分割为孤立点,进而影响后续的异常检测。
当某个时刻的生产数据对应的修正系数取值越大时,说明该时刻的生产数据越可能异常情况,将该时刻的生产数据对应的数据点作为分割点进行分割时,出现误分割的概率越小。
基于此,利用修正系数对生产数据进行筛选得到待选分割数据点,具体地,将修正系数大于预设的判断阈值对应时刻的生产数据作为待选分割数据点,在本实施例中,判断阈值的取值为0.8,实施者可根据具体实施场景进行设置。
在构建孤立森林的过程中,需要对样本数据进行多次二分类分割,当完成每次分割后,需要从剩余的样本数据中获取新的分割点,继续进行二分类分割。基于此,在本实施例中以对所有时刻的生产数据进行第一次二分类分割为例进行说明,将获得的所有待选分割数据点分别作为孤立森林算法中第一次二分类的分割点,对所有时刻的生产数据进行分割。
需要说明的是,在本实施例中,每个时刻对应三种不同的生产数据,三种不同的生产数据分别对应三个维度,将待选分割数据点对应的三种不同的生产数据分别作为三个维度下的分割点,当存在一个维度下的生产数据小于分割点时,将对应时刻的生产数据放入孤立树的左侧,当三个维度下的生产数据均大于或等于对应维度的分割点时,将对应时刻的生产数据放入孤立树的右侧,完成第一次二分类分割。
修正系数的取值越大,说明对应时刻的数据点周围数据点出现异常分布情况,进而说明该时刻对应的数据点为异常的数据点的可能性越大。
进一步的,基于修正系数获取二分类结果中的第一类别和第二类别,所述二分类结果是基于孤立森林算法得到的第一次分割结果,且第一类别的平均修正系数大于所述第二类别的平均修正系数,即第一类别表示存在异常情况的数据所在类别,第二类别表示正常数据所在类别。
具体地,计算两个内所有时刻的生产数据的修正系数的平均值,将类别中的平均修正系数较大的类别记为第一类别,将类别中平均修正系数较小的记为第二类别。
数据分析模块,用于获取第一类别中的离散数据点和聚集数据点,根据离散数据点和聚集数据点对应的修正系数得到第一类别评价指标;根据两个类别内生产数据之间的差异得到第二类别评价指标;根据第一类别评价指标和第二类别评价指标得到每个待选分割数据点对应的综合类别评价指标。
首先,对存在异常情况的类别进行分析,进而对利用待选分割数据点进行分类的效果进行评价,使得可以根据分类效果筛选出分类效果最好的待选分割数据点作为孤立森林算法中的分割点进行数据处理。
对于第一类别内的每个时刻的生产数据,其对应的采集时刻往往是存在一定差异的,即存在异常的生产数据之间时序上不连续的可能性较大,进而表示第一类别内的生产数据较为独立。对于第二类别内的每个时刻的生产数据,其对应的采集时刻往往是较为接近的,即正常的生产数据之间时序上连续的可能性较大。基于此,可以通过时间的连续性对第一类别内的生产数据进行筛选。
具体地,对于第一类别内任意一个时刻的生产数据,当该时刻的相邻两个时刻的生产数据均不在第一类别内或者只有一个相邻时刻的生产数据在第一类别内时,将所述任意一个时刻的生产数据记为离散数据点;将第一类别内所有时刻的生产数据除离散数据点之外的所有时刻的生产数据记为聚集数据点。
例如,对于第一类别内第t个时刻的生产数据,当第t-1个时刻和第t+1个时刻的生产数据均不在第一类别内时,或者当第t-1个时刻和第t+1个时刻的生产数据仅存在一个时刻的生产数据在第一类别内时,将第t个时刻的生产数据记为离散数据点,即离散数据点表征了在第一类类别中生产数据在时序上较不连续的数据。
然后,当第一类别内包含的离散数据点的数量越多,说明在第一类别内较为独立的数据较多,存在异常情况的数据较多,进而说明第一类别对应的分割效果较好。当第一类别内离散数据点的修正系数之间的差异越大,说明离散数据点周围的异常分布情况均不相同,进而说明离散数据点为异常数据的可能性越大,反映了第一类别对应的分割效果较好。
基于此,根据离散数据点和聚集数据点对应的修正系数得到第一类别评价指标,具体地,获取第一类别内离散数据点的数量与所有时刻的数量之间的比值,计算第一类别内所有离散数据点的修正系数的方差,以所述比值和方差的乘积作为离散系数;获取第一类别内任意两个聚集数据点的修正系数的差值绝对值,并获取所述任意两个聚集数据点对应时刻的差值绝对值,计算两个差值绝对值之间的乘积的负相关映射值,对所有任意两个聚集数据点对应的所述负相关映射值求和得到聚集系数;以所述离散系数和聚集系数的乘积作为第一类别评价指标,用公式表示为:
其中,表示第一类别评价指标,表示第一类别内离散数据点的数量;表示
所有时刻的数量,即所有时刻对应的数据点的总数量;表示第一类别内所有离散数据点
的修正系数的方差;表示第一类别内第u个聚集数据点的修正系数,表示第一类别内
第v个聚集数据点的修正系数,表示第一类别内第u个聚集数据点对应的时刻,表示第
一类别内第v个聚集数据点对应的时刻,表示第一类别内包含的所有聚集数据点,exp
( )表示以自然常数e为底的指数函数。
为离散系数,的取值越大,说明第一类别内离散数据点的数量越多,进而
说明较为独立的数据较多,存在异常情况的数据较多,对应的离散系数的取值越大,第一类
别评价指标的取值越大,说明对应的分割效果较好。的取值越大,说明第一类别离散数据
点的修正系数之间的差异越大,说明离散数据点周围的异常分布情况均不相同,进而说明
离散数据点为异常数据的可能性越大,对应的离散系数的取值越大,第一类别评价指标的
取值越大,说明对应的分割效果较好。
为聚集系数,反映了第一类别内两个
聚集数据点之间的修正系数的差异,其取值越小,说明聚集数据点周围的异常分布情况越
相似,对应的聚集系数取值越大,第一类别评价指标的取值越大,说明对应的分割效果较
好。反映了第一类别内两个聚集数据点之间的时刻差异,利用时刻差异使得时刻越
接近的聚集数据点的修正系数对异常分布情况进行判断的权重越大,提高判断精度。
通过对离散数据点的数量,以及聚集数据点的修正系数之间的相似性进行分析,得到对生产数据进行初步分割的效果评价,即第一类别指标表征了数据分割的效果。
进一步的,对第一类别和第二类别中的生产数据的相似性进行分析,若分割效果较好,则第一类别内存在的生产数据为异常数据,第二类别内存在的数据为正常数据,进而两个类别中的生产数据的相似性较小,数据差异较大。若分割效果较差,第一类别中可能存在正常数据,即正常数据被误分割为第一类别中,则在计算第一类别中的数据与第二类别中的数据之间的相似性时,会出现相似性较大的情况。
同时,待选分割数据点是修正系数取值较大的数据点,且待选分割数据点表示存在异常分布情况可能性较大的数据点,当第二类别中存在的待选分割数据点的数量较多时,说明正常类别中可能存在异常数据,即出现了误分割的情况,对应的分割效果较差。
基于此,根据两个类别内生产数据之间的差异得到第二类别评价指标,具体地,获取第二类别中待选分割数据点的数量的倒数,根据第一类别和第二类别中所有生产数据之间的差异确定差异系数,以所述倒数和差异系数的乘积作为第二类别评价指标;所述差异与差异系数之间的关系为正相关关系。
所述第二类别评价指标的计算公式具体为:
其中,表示第二类别评价指标,表示第二类别中包含待选分割数据点的数量,表示第一类别中包含的数据点,表示第二个类别中包含的数据点,表示第一类别
中第n个数据点的第一个生产数据的数据值,表示第一类别中第n个数据点的第二个生
产数据的数据值,表示第一类别中第n个数据点的第三个生产数据的数据值;表示第
二类别中第r个数据点的第一个生产数据的数据值,表示第二类别中第r个数据点的第
二个生产数据的数据值,表示第二类别中第r个数据点的第三个生产数据的数据值,φ
为超参数,为了防止分母的取值为0,在本实施例中的取值为1,实施者可根据具体实施场景
进行设置。
为差异系数,、和表示第一类别和第二类别中数据点对应生产数据之间的差异,该
差异越大,差异系数的取值越大,说明第一类别和第二类别中的数据越不相似,则出现误分
割的可能性越小,对应的第二类别评价指标的取值越大,说明对应的分割效果越好。
的取值越大,说明第二类别中待选分割数据点的数量越少,对应的第二类别评
价指标的取值越大,说明对应的分割效果越好。通过对类别之间的差异以及第二类别内待
选分割数据点的数量进行分析,得到对生产数据进行初步分割的效果评价,即第二类别指
标也表征了数据分割的效果。
最后,根据第一类别评价指标和第二类别评价指标得到待选分割数据点对应的综合类别评价指标,具体地,以第一类别评价指标和第二类别评价指标的平均数作为待选分割数据点对应的综合类别评价指标。
需要说明的是,利用每个待选分割数据点对所有时刻的生产数据进行二分类分割时,每个待选分割数据点均对应一个分类结果,需要分别计算每个分类结果对应的综合类别评价指标,利用综合类别评价指标表征每个待选分割数据点对应的分割效果,进而后续根据分割效果对待选分割数据点进行筛选。
数据管理模块,用于利用综合类别评价指标对待选分割数据点进行筛选得到最优分割数据点,根据最优分割数据点对生产数据进行分割,构建孤立树组成孤立森林;根据孤立森林获得生产数据的异常检测结果。
首先,综合类别评价指标的取值越大,说明利用对应的待选分割数据点进行二分类分割的效果越好,进而利用综合类别评价指标对待选分割数据点进行筛选得到最优分割数据点,具体地,将综合类别评价指标的最大值对应的待选分割数据点作为最优分割数据点。
最优分割数据点对应的分割效果最好,则可以将最优分割数据点作为孤立森林算法中的分割点,对数据进行孤立森林的构建。孤立森林算法为公知技术,在此只做简单的介绍。
具体地,从所有时刻的生产数据中随机抽取设定数量个样本数据,放入树的根节点;对样本数据进行二分类分割,每次分割均获取样本数据中对应的最优分割数据点,将样本数据中小于最优分割数据点的数据放在当前节点的左子节点,将大于或等于最优分割数据点的数据放在当前节点的右子节点;不断构造新的子节点,直到满足设定规则时停止,得到孤立树组成的孤立森林。
其中,所述设定规则具体为:(1)孤立树达到预设的生长高度;(2)样本数据分割至只有单个数据;(3)待分割的数据中不存在待选分割数据点;(4)待分割的数据中所有待选分割数据点对应的综合类别评价指标的取值小于设定阈值。
需要说明的是,当满足设定规则中四个条件中的一个条件,孤立树则停止构建,即设定规则中的条件为或的关系。
在本实施例中,在本实施例中设定阈值的取值为0.7,孤立树的生长高度可设置为L=ceiling(log(K)),其中K为随机抽取的样本数据点个数,ceiling( )为高度函数,log( )为以常数2为底的对数函数。设定数量的取值为500,同时在本发明实施例中将孤立树的数量设置为100,实施者可根据具体实施场景进行设置。
最后,获取到孤立森林后,可以计算每一颗孤立树中数据节点的异常得分,计算公式为孤立森林算法中的公知技术,在此不再过多介绍。而由于本发明实施例在生成孤立树时为有放回的抽取样本数据进行孤立树的构建,故对于某一数据节点可能存在不同的孤立树中,进而存在多个异常得分,则可选取异常得分最大值作为其最终的异常得分。
需要说明的是,在本实施例中,每一颗孤立树中的数据节点对应一个时刻的生产数据,进而数据节点的异常得分可以当作对应时刻的生产数据的异常值。
即根据孤立森林获取生产数据的异常值,利用异常值获得生产数据的异常检测结果,具体地,在孤立森林的所有孤立树中,将每个时刻的生产数据作为树节点的异常得分的最大值记为生产数据的异常值,进而根据异常值对每个时刻的生产数据的异常情况进行判断,基于异常得分判断数据的异常情况为公知技术,在此做简单的介绍。
如果数据节点的异常值接近于1,则认为此数据节点为生产数据中的异常点;如果数据节点的异常值远远小于0.5,接近于0,则认为此数据节点为生产数据中的正常点;如果所有数据节点的异常值接近于0.5,则认为可能没有异常点的存在。
其中,异常点表示数据节点对应时刻的生产数据为异常数据,正常点表示数据节点对应时刻的生产数据为正常数据。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种铝合金棒生产数据管理系统,其特征在于,该系统包括:
数据获取模块,用于获取铝合金棒进行挤压的过程中,在设定时间段内每个时刻的生产数据;
数据预处理模块,用于获取每个时刻的生产数据对应的局部聚集数据集合,根据每个时刻的生产数据与所述集合中的元素之间的差异得到每个时刻的生产数据的相关性特征值;根据所述相关性特征值、每个时刻的生产数据以及所述集合中的元素得到修正系数;
数据分割模块,用于利用修正系数对生产数据进行筛选得到待选分割数据点;利用待选分割数据点分别对生产数据进行二分类,得到第一类别和第二类别;所述第一类别的平均修正系数大于所述第二类别的平均修正系数;
数据分析模块,用于获取第一类别中的离散数据点和聚集数据点,根据离散数据点和聚集数据点对应的修正系数得到第一类别评价指标;根据两个类别内生产数据之间的差异得到第二类别评价指标;根据第一类别评价指标和第二类别评价指标得到每个待选分割数据点对应的综合类别评价指标;
数据管理模块,用于利用综合类别评价指标对待选分割数据点进行筛选得到最优分割数据点,根据最优分割数据点对生产数据进行分割,构建孤立树组成孤立森林;根据孤立森林获得生产数据的异常检测结果。
2.根据权利要求1所述的一种铝合金棒生产数据管理系统,其特征在于,所述获取每个时刻的生产数据对应的局部聚集数据集合具体为:
每个时刻均对应第一设定数量种不同的生产数据,利用每个时刻所有生产数据的归一化值组成每个时刻的特征元组;将每个时刻的特征元组映射至空间内得到每个时刻对应的数据点;
将任意一个时刻对应的数据点记为目标数据点,计算除目标数据点外其他数据点与目标数据点之间的距离,将所有距离按照设定顺序进行排列,并按照排列顺序获取设定数量的其他数据点,构成目标数据点的局部聚集数据集合;所述目标数据点的局部聚集数据集合为该时刻的生产数据对应的局部聚集数据集合。
4.根据权利要求1所述的一种铝合金棒生产数据管理系统,其特征在于,所述修正系数的获取方法具体为:
对于任意一个时刻,获取该时刻对应的数据点与集合中每个数据点之间的距离,
计算该时刻对应的相关性特征值与集合中每个数据点对应的相关性特征值之间差值的绝对值,计算所述距离与差值的绝对值之间的乘积;对所有的乘积进行求和,以求和结果的归一化值作为该时刻的生产数据对应的修正系数。
5.根据权利要求1所述的一种铝合金棒生产数据管理系统,其特征在于,所述获取第一类别中的离散数据点和聚集数据点具体为:
对于第一类别内任意一个时刻的生产数据,当该时刻的相邻两个时刻的生产数据均不在第一类别内或者只有一个相邻时刻的生产数据在第一类别内时,将所述任意一个时刻的生产数据记为离散数据点;将第一类别内所有时刻的生产数据除离散数据点之外的所有时刻的生产数据记为聚集数据点。
6.根据权利要求5所述的一种铝合金棒生产数据管理系统,其特征在于,所述第一类别评价指标的获取方法具体为:
获取第一类别内离散数据点的数量与所有时刻的数量之间的比值,计算第一类别内所有离散数据点的修正系数的方差,以所述比值和方差的乘积作为离散系数;
获取第一类别内任意两个聚集数据点的修正系数的差值绝对值,并获取所述任意两个聚集数据点对应时刻的差值绝对值,计算两个差值绝对值之间的乘积的负相关映射值,对所有任意两个聚集数据点对应的所述负相关映射值求和得到聚集系数;
以所述离散系数和聚集系数的乘积作为第一类别评价指标;
所述第二类别评价指标的获取方法具体为:
获取第二类别中待选分割数据点的数量的倒数,根据第一类别和第二类别中所有生产数据之间的差异确定相关系数,以所述倒数和相关系数的乘积作为第二类别评价指标;所述差异与相关系数之间的关系为负相关关系。
7.根据权利要求1所述的一种铝合金棒生产数据管理系统,其特征在于,所述综合类别评价指标的获取方法具体为:
以第一类别评价指标和第二类别评价指标的平均数作为待选分割数据点对应的综合类别评价指标。
8.根据权利要求1所述的一种铝合金棒生产数据管理系统,其特征在于,所述利用修正系数对生产数据进行筛选得到待选分割数据点具体为:
将修正系数大于预设的判断阈值对应时刻的生产数据作为待选分割数据点。
9.根据权利要求1所述的一种铝合金棒生产数据管理系统,其特征在于,所述利用综合类别评价指标对待选分割数据点进行筛选得到最优分割数据点具体为:
综合类别评价指标的最大值对应的待选分割数据点作为最优分割数据点。
10.根据权利要求1所述的一种铝合金棒生产数据管理系统,其特征在于,所述根据最优分割数据点对生产数据进行分割,构建孤立树组成孤立森林具体为:
从所有时刻的生产数据中抽取设定数量个样本数据,放入树的根节点;对样本数据进行二分类分割,每次分割均获取样本数据中对应的最优分割数据点,将样本数据中小于最优分割数据点的数据放在当前节点的左子节点,将大于或等于最优分割数据点的数据放在当前节点的右子节点;不断构造新的子节点,直到满足设定规则时停止,得到孤立树组成孤立森林。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310307769.7A CN116011894B (zh) | 2023-03-28 | 2023-03-28 | 一种铝合金棒生产数据管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310307769.7A CN116011894B (zh) | 2023-03-28 | 2023-03-28 | 一种铝合金棒生产数据管理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116011894A true CN116011894A (zh) | 2023-04-25 |
CN116011894B CN116011894B (zh) | 2023-06-02 |
Family
ID=86021403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310307769.7A Active CN116011894B (zh) | 2023-03-28 | 2023-03-28 | 一种铝合金棒生产数据管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116011894B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116304963A (zh) * | 2023-05-25 | 2023-06-23 | 山东省国土空间生态修复中心(山东省地质灾害防治技术指导中心、山东省土地储备中心) | 一种适用于地质灾害预警的数据处理系统 |
CN117113235A (zh) * | 2023-10-20 | 2023-11-24 | 深圳市互盟科技股份有限公司 | 一种云计算数据中心能耗优化方法及系统 |
CN117193432A (zh) * | 2023-09-15 | 2023-12-08 | 浙江迪弗莱包装科技股份有限公司 | 一种电磁加热辊加热控制方法及系统 |
CN117408734A (zh) * | 2023-12-15 | 2024-01-16 | 广东云百科技有限公司 | 基于物联网设备的客户信息智能管理系统 |
CN117556714A (zh) * | 2024-01-12 | 2024-02-13 | 济南海德热工有限公司 | 一种用于铝金属冶炼的预热管路温度数据异常分析方法 |
CN117574307A (zh) * | 2024-01-17 | 2024-02-20 | 广东云百科技有限公司 | 一种物联网数据的安全管理系统及方法 |
CN117892231A (zh) * | 2024-03-18 | 2024-04-16 | 天津戎军航空科技发展有限公司 | 一种碳纤维弹匣生产数据智能管理方法 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013114666A (ja) * | 2011-11-30 | 2013-06-10 | Ryosuke Kuriiwa | モデル予測制御のための差動計算機械 |
CN109871886A (zh) * | 2019-01-28 | 2019-06-11 | 平安科技(深圳)有限公司 | 基于谱聚类的异常点比例优化方法、装置及计算机设备 |
CN111598438A (zh) * | 2020-05-14 | 2020-08-28 | 哈尔滨工业大学(威海) | 基于分段拟合分析及评估的民航发动机气路异常检测方法 |
CN111931834A (zh) * | 2020-07-31 | 2020-11-13 | 广东工业大学 | 基于孤立森林算法的铝型材挤压过程流数据异常检测方法、设备及存储介质 |
CN112819230A (zh) * | 2021-02-04 | 2021-05-18 | 北京建筑大学 | 一种基于打卡数据的用户打卡地点预测方法及装置 |
CN112860671A (zh) * | 2021-01-19 | 2021-05-28 | 中国石油天然气集团有限公司 | 一种生产要素数据异常诊断方法及装置 |
CN113420073A (zh) * | 2021-08-23 | 2021-09-21 | 平安科技(深圳)有限公司 | 基于改进的孤立森林的异常样本检测方法及相关设备 |
CN113435547A (zh) * | 2021-08-27 | 2021-09-24 | 中国环境监测总站 | 一种水质指标融合数据异常检测方法及系统 |
CN114143095A (zh) * | 2021-12-01 | 2022-03-04 | 广东电网有限责任公司江门供电局 | 基于孤立森林的配电终端dtu入侵检测方法及系统 |
CN114398966A (zh) * | 2021-12-31 | 2022-04-26 | 北京久安世纪科技有限公司 | 一种基于堡垒机对用户画像进行预警的方法 |
CN114495137A (zh) * | 2022-04-15 | 2022-05-13 | 深圳高灯计算机科技有限公司 | 票据异常检测模型生成方法与票据异常检测方法 |
CN114757265A (zh) * | 2022-03-24 | 2022-07-15 | 南京邮电大学 | 一种针对大规模在线教育平台mooc数据集的异常检测方法 |
CN115081966A (zh) * | 2022-08-22 | 2022-09-20 | 南通俊朗智能科技有限公司 | 异常状态监控方法及应用该方法的铝合金挤压工艺控制器 |
CN115272027A (zh) * | 2022-06-28 | 2022-11-01 | 深圳市远景易云科技有限公司 | 一种用于双碳管理的低碳排放数据监测系统 |
CN115577275A (zh) * | 2022-11-11 | 2023-01-06 | 山东产业技术研究院智能计算研究院 | 一种基于lof和孤立森林的时序数据异常监测系统及方法 |
CN115828114A (zh) * | 2022-12-15 | 2023-03-21 | 南昌市普辉实业有限公司 | 一种铝型材挤压机能耗异常检测方法 |
-
2023
- 2023-03-28 CN CN202310307769.7A patent/CN116011894B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013114666A (ja) * | 2011-11-30 | 2013-06-10 | Ryosuke Kuriiwa | モデル予測制御のための差動計算機械 |
CN109871886A (zh) * | 2019-01-28 | 2019-06-11 | 平安科技(深圳)有限公司 | 基于谱聚类的异常点比例优化方法、装置及计算机设备 |
CN111598438A (zh) * | 2020-05-14 | 2020-08-28 | 哈尔滨工业大学(威海) | 基于分段拟合分析及评估的民航发动机气路异常检测方法 |
CN111931834A (zh) * | 2020-07-31 | 2020-11-13 | 广东工业大学 | 基于孤立森林算法的铝型材挤压过程流数据异常检测方法、设备及存储介质 |
CN112860671A (zh) * | 2021-01-19 | 2021-05-28 | 中国石油天然气集团有限公司 | 一种生产要素数据异常诊断方法及装置 |
CN112819230A (zh) * | 2021-02-04 | 2021-05-18 | 北京建筑大学 | 一种基于打卡数据的用户打卡地点预测方法及装置 |
CN113420073A (zh) * | 2021-08-23 | 2021-09-21 | 平安科技(深圳)有限公司 | 基于改进的孤立森林的异常样本检测方法及相关设备 |
CN113435547A (zh) * | 2021-08-27 | 2021-09-24 | 中国环境监测总站 | 一种水质指标融合数据异常检测方法及系统 |
CN114143095A (zh) * | 2021-12-01 | 2022-03-04 | 广东电网有限责任公司江门供电局 | 基于孤立森林的配电终端dtu入侵检测方法及系统 |
CN114398966A (zh) * | 2021-12-31 | 2022-04-26 | 北京久安世纪科技有限公司 | 一种基于堡垒机对用户画像进行预警的方法 |
CN114757265A (zh) * | 2022-03-24 | 2022-07-15 | 南京邮电大学 | 一种针对大规模在线教育平台mooc数据集的异常检测方法 |
CN114495137A (zh) * | 2022-04-15 | 2022-05-13 | 深圳高灯计算机科技有限公司 | 票据异常检测模型生成方法与票据异常检测方法 |
CN115272027A (zh) * | 2022-06-28 | 2022-11-01 | 深圳市远景易云科技有限公司 | 一种用于双碳管理的低碳排放数据监测系统 |
CN115081966A (zh) * | 2022-08-22 | 2022-09-20 | 南通俊朗智能科技有限公司 | 异常状态监控方法及应用该方法的铝合金挤压工艺控制器 |
CN115577275A (zh) * | 2022-11-11 | 2023-01-06 | 山东产业技术研究院智能计算研究院 | 一种基于lof和孤立森林的时序数据异常监测系统及方法 |
CN115828114A (zh) * | 2022-12-15 | 2023-03-21 | 南昌市普辉实业有限公司 | 一种铝型材挤压机能耗异常检测方法 |
Non-Patent Citations (18)
Title |
---|
DEGANG SUN: "An Efficient Anomaly Detection Framework for Electromagnetic Streaming Data", ICBDC \'19: PROCEEDINGS OF THE 4TH INTERNATIONAL CONFERENCE ON BIG DATA AND COMPUTINGMAY 2019 * |
FUQIANG FENG: "Detection of GPS Abnormal Data of Sanitation Vehicles Based on Isolation Forest Algorithm", 2022 INTERNATIONAL CONFERENCE ON DATA ANALYTICS, COMPUTING AND ARTIFICIAL INTELLIGENCE (ICDACAI) * |
LI SUN: "Detecting Anomalous User Behavior Using an Extended Isolation Forest Algorithm: An Enterprise Case Study", HTTPS://ARXIV.ORG/ABS/1609.06676 * |
MATHIEU GARCHERY: "On the influence of categorical features in ranking anomalies using mixed data", PROCEDIA COMPUTER SCIENCE * |
TL FEI: "Isolation Forest", 2008 EIGHTH IEEE INTERNATIONAL CONFERENCE ON DATA MINING * |
ZHIGUO DING: "An Anomaly Detection Approach Based on Isolation Forest Algorithm for Streaming Data using Sliding Window", IFAC PROCEEDINGS VOLUMES * |
凌莉: "融合孤立森林和局部离群因子的离群点检测方法", 计算机应用与软件 * |
吴宇: "基于改进Canopy-FCM和孤立森林算法的用户异常收视行为检测方法", 中国优秀硕士学位论文全文数据库信息科技辑 * |
周琨: "网络流量模型及异常检测技术研究", 中国博士学位论文全文数据库信息科技辑 * |
宋勇;蔡志平;: "大数据环境下基于信息论的入侵检测数据归一化方法", 武汉大学学报(理学版), no. 02 * |
慢行厚积: "异常检测-基于孤立森林算法Isolation-based Anomaly Detection-1-论文学习", Retrieved from the Internet <URL:https://www.cnblogs.com/wanghui-garcia/p/11460795.html> * |
李正飞: "中央空调系统多故障智能诊断策略及其迁移应用研究", 中国博士学位论文全文数据库工程科技Ⅱ辑 * |
王燕晋: "基于孤立森林算法的电力用户数据异常快速识别研究", 电子设计工程 * |
田野: "基于用户用电量的异常检测方法研究", 中国优秀硕士学位论文全文数据库工程科技Ⅱ辑 * |
畅炳陆: "舵机智能化故障诊断方法的研究", 中国优秀硕士学位论文全文数据库工程科技Ⅱ辑 * |
胡淼: "基于双特征和松弛边界的随机森林进行异常点检测", 计算机应用 * |
许志城: "基于孤立森林算法的挤压机流数据异常检测", 计算机应用与软件 * |
陈香松: "基于随机卷积核与孤立森林柱塞泵异常检测方法", 液压与气动 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116304963B (zh) * | 2023-05-25 | 2023-07-28 | 山东省国土空间生态修复中心(山东省地质灾害防治技术指导中心、山东省土地储备中心) | 一种适用于地质灾害预警的数据处理系统 |
CN116304963A (zh) * | 2023-05-25 | 2023-06-23 | 山东省国土空间生态修复中心(山东省地质灾害防治技术指导中心、山东省土地储备中心) | 一种适用于地质灾害预警的数据处理系统 |
CN117193432A (zh) * | 2023-09-15 | 2023-12-08 | 浙江迪弗莱包装科技股份有限公司 | 一种电磁加热辊加热控制方法及系统 |
CN117113235A (zh) * | 2023-10-20 | 2023-11-24 | 深圳市互盟科技股份有限公司 | 一种云计算数据中心能耗优化方法及系统 |
CN117113235B (zh) * | 2023-10-20 | 2024-01-26 | 深圳市互盟科技股份有限公司 | 一种云计算数据中心能耗优化方法及系统 |
CN117408734B (zh) * | 2023-12-15 | 2024-03-19 | 广东云百科技有限公司 | 基于物联网设备的客户信息智能管理系统 |
CN117408734A (zh) * | 2023-12-15 | 2024-01-16 | 广东云百科技有限公司 | 基于物联网设备的客户信息智能管理系统 |
CN117556714A (zh) * | 2024-01-12 | 2024-02-13 | 济南海德热工有限公司 | 一种用于铝金属冶炼的预热管路温度数据异常分析方法 |
CN117556714B (zh) * | 2024-01-12 | 2024-03-22 | 济南海德热工有限公司 | 一种用于铝金属冶炼的预热管路温度数据异常分析方法 |
CN117574307A (zh) * | 2024-01-17 | 2024-02-20 | 广东云百科技有限公司 | 一种物联网数据的安全管理系统及方法 |
CN117574307B (zh) * | 2024-01-17 | 2024-05-17 | 广东云百科技有限公司 | 一种物联网数据的安全管理系统及方法 |
CN117892231A (zh) * | 2024-03-18 | 2024-04-16 | 天津戎军航空科技发展有限公司 | 一种碳纤维弹匣生产数据智能管理方法 |
CN117892231B (zh) * | 2024-03-18 | 2024-05-28 | 天津戎军航空科技发展有限公司 | 一种碳纤维弹匣生产数据智能管理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116011894B (zh) | 2023-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116011894B (zh) | 一种铝合金棒生产数据管理系统 | |
CN110263846B (zh) | 基于故障数据深度挖掘及学习的故障诊断方法 | |
CN116861354A (zh) | 电力变压器监测数据的异常识别及模式区分方法及系统 | |
CN110738127A (zh) | 基于无监督深度学习神经网络算法的安全帽识别方法 | |
CN113887616A (zh) | 一种epg连接数的实时异常检测系统及方法 | |
CN108667684B (zh) | 一种基于局部向量点积密度的数据流异常检测方法 | |
CN112685459A (zh) | 一种基于K-means集群算法的攻击源特征识别方法 | |
CN115689040B (zh) | 基于卷积神经网络的交通事故严重程度预测方法及系统 | |
CN115099149A (zh) | 一种基于多重特征对比和随机森林算法的结果预测方法 | |
CN115758908A (zh) | 一种基于深度学习的报警泛滥情况下的报警在线预测方法 | |
CN111696670A (zh) | 一种基于深度森林的产前胎儿监护智能判读方法 | |
CN118194186A (zh) | 一种基于物联网的螺蛳肉饲料制作管理方法及系统 | |
CN116414095A (zh) | 数据驱动的中医药制造过程工艺参数优化方法 | |
CN117541626B (zh) | 基于深度学习的遥感影像变化检测方法 | |
CN117195006B (zh) | 一种鸡肉用兽药残留数据管理系统 | |
CN116561230B (zh) | 一种基于云计算的分布式存储与检索系统 | |
CN113523904A (zh) | 一种刀具磨损检测方法 | |
CN113919237B (zh) | 一种风机设备在线工况分割及故障诊断的方法 | |
CN108460119A (zh) | 一种使用机器学习提升技术支持效率的系统 | |
CN112465054B (zh) | 一种基于fcn的多变量时间序列数据分类方法 | |
CN110265151B (zh) | 一种基于ehr中异构时态数据的学习方法 | |
Cao et al. | Detecting Change Intervals with Isolation Distributional Kernel | |
CN114490645A (zh) | 一种用于电网结构化数据的自动机器学习方法 | |
Mendis et al. | The Effect of Fetal Heart Rate Segment Selection on Deep Learning Models for Fetal Compromise Detection | |
US8930362B2 (en) | System and method for streak discovery and prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Production Data Management System for Aluminum Alloy Bars Granted publication date: 20230602 Pledgee: Baoding Qingyuan Branch of Hebei Bank Co.,Ltd. Pledgor: Hebei Changfa Aluminum Co.,Ltd. Registration number: Y2024980020266 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right |