CN117238058B - 基于数据分析的汽车用起动机监测方法 - Google Patents

基于数据分析的汽车用起动机监测方法 Download PDF

Info

Publication number
CN117238058B
CN117238058B CN202311490494.1A CN202311490494A CN117238058B CN 117238058 B CN117238058 B CN 117238058B CN 202311490494 A CN202311490494 A CN 202311490494A CN 117238058 B CN117238058 B CN 117238058B
Authority
CN
China
Prior art keywords
data
points
point
window
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311490494.1A
Other languages
English (en)
Other versions
CN117238058A (zh
Inventor
曹向明
曹丹寒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Mingcheng Auto Parts Co ltd
Original Assignee
Wuxi Mingcheng Auto Parts Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Mingcheng Auto Parts Co ltd filed Critical Wuxi Mingcheng Auto Parts Co ltd
Priority to CN202311490494.1A priority Critical patent/CN117238058B/zh
Publication of CN117238058A publication Critical patent/CN117238058A/zh
Application granted granted Critical
Publication of CN117238058B publication Critical patent/CN117238058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及电子数字数据处理技术领域,具体涉及基于数据分析的汽车用起动机监测方法,包括:对多维起动数据进行采样和降维获得多个多维样本数据的标准成分;根据起动数据中的极值点数量以及数据点的差值获得噪声程度,利用噪声程度对标准成分进行修正,对修正后标准成分进行划分获得置信度,对数据点在孤立森林中的路径长度进行调整获得加权平均路径长度,利用加权平均路径长度对汽车的起动机进行监测。本发明通过对多维起动数据进行降维避免了冗余信息的干扰,通过对标准成分进行修正并对路径长度进行加权降低了起动数据中噪声对异常检测结果的干扰,提高了异常检测结果的准确性,使起动机异常报警更加可靠。

Description

基于数据分析的汽车用起动机监测方法
技术领域
本发明涉及电子数字数据处理技术领域,具体涉及基于数据分析的汽车用起动机监测方法。
背景技术
在汽车安全技术检验场景下,往往需要对汽车发动机的各项指标进行异常检测。而进行数据异常检测常用的一种方法为孤立森林算法。该方法是通过在原始数据随机抽取多组样本集,然后通过对多组样本集分别进行孤立树的构建,然后通过每组样本集中样本数据分割的次数得到异常得分,并且通过多组样本集中相同样本的异常得分得到最终的异常得分。在此过程中,由于样本集的获取方式是随机的,那么对于正常数据和异常数据差异较小或者样本集中异常样本占比太高的情况,那么计算出样本的异常得分是不准确的,从而导致个别孤立树中样本的异常得分出现偏差,进而导致异常检测结果出现错误。
现有技术的问题在于:传统的孤立森林算法在进行异常检测过程中其对样本集中数据的分布特征有一定的要求。当样本集中的异常数据和正常数据之间的差异不大时,其构建的孤立树不能很好的反应数据的异常与否,即可能出现异常数据的异常得分高,或者正常数据的异常得分低等问题。针对上述问题,本发明提出了基于数据分析的汽车用起动机监测方法。通过对汽车起动机多维数据进行主成分分析,然后对各样本集中数据的分布特征进行分析以及多维数据各自的变化特征得到各孤立树的置信度,利用孤立树的置信度对一个样本数据在各孤立树中得到的异常得分做出修正,从而得到最终各个样本数据的异常得分,得到更准确的异常检测结果。
发明内容
本发明提供基于数据分析的汽车用起动机监测方法,以解决现有的问题。
本发明的基于数据分析的汽车用起动机监测方法采用如下技术方案:
本发明一个实施例提供了基于数据分析的汽车用起动机监测方法,该方法包括以下步骤:
获取起动机的多维起动数据;
对多维起动数据进行采样和降维,获得多个多维样本数据以及多维样本数据的标准成分;
根据起动数据中的极值点数量以及数据点的差值获得噪声程度,利用噪声程度对标准成分进行修正获得修正后标准成分,对修正后标准成分进行划分获得置信度,结合置信度获得多维样本数据的任意数据点的加权平均路径长度;
利用加权平均路径长度对汽车的起动机进行监测。
进一步的,所述对多维起动数据进行采样和降维,获得多个多维样本数据以及多维样本数据的标准成分,包括的具体方法为:
首先,对多维起动数据中的时间点进行多次系统采样,每次系统采样后获得由若干个时间点形成的集合记为时间点集合,时间点集合中每个时间点都在所有起动数据中对应一个数据点,将时间点集合中所有时间点在所有起动数据中对应数据点形成的数据集合记为多维样本数据,获得多个多维样本数据;
然后,利用主成分分析算法对任意多维样本数据进行主成分分析,获得若干个主成分以及对应的贡献率,将贡献率最大的主成分记为对应多维样本数据的标准成分。
进一步的,所述根据起动数据中的极值点数量以及数据点的差值获得噪声程度,包括的具体方法为:
首先,构建长度为的窗口记为时间窗口,将任意起动数据中的任意数据点作为时间窗口的中心点,对起动数据进行遍历,分别获得差分数据段和窗口曲线,获取窗口曲线中极值点的数量;
然后,将第维的起动数据中第/>时刻对应窗口数据段的极值点数量记为第一数值,将第/>维的起动数据中第/>时刻对应差分数据段中所有数据点的方差记为第二数值,将第一数值与第二数值的乘积记为起动数据在第/>个时刻下的噪声程度。
进一步的,所述差分数据段和窗口曲线的具体获取方法为:
首先,获取时间窗口内的所有数据形成的序列记为窗口数据段,其中为预设的超参数,获取窗口数据段的一阶差分序列,记为差分数据段;一个数据点对应一个时刻,一个数据点对应一个窗口数据段和一个差分数据段;
然后,利用最小二乘法对窗口数据段进行曲线拟合,将得到的曲线记为窗口曲线,获取窗口曲线中的极值点数量,一个窗口曲线对应一个窗口数据段。
进一步的,所述利用噪声程度对标准成分进行修正获得修正后标准成分,包括的具体方法为:
根据相邻两个维度的起动数据在同时刻下对应噪声程度的差异获得噪声程度相似性;
将多维样本数据的第维起动数据中第/>时刻对应窗口数据段的噪声程度记为第四数值,将标准成分中第/>个时刻下数据点的数值与第四数值的比值,记为对应维度下的窗口修正参数;将所有维度下的窗口修正参数的累加值记为第五数值;
将噪声程度相似性与第五数值的乘积记为修正后标准成分中对应时刻下数据点的数值。
进一步的,所述根据相邻两个维度的起动数据在同时刻下对应噪声程度的差异获得噪声程度相似性,包括的具体方法为:
将多维样本数据的第维与第/>维起动数据中第/>时刻对应窗口数据段的噪声程度的差值绝对值记为第三数值,将所有相邻的两个维度的起动数据在第/>个时刻下对应第三数值的累加值记为噪声修正因子/>,将/>记为噪声程度相似性,其中/>表示以自然常数为底数的指数函数。
进一步的,所述对修正后标准成分进行划分获得置信度,包括的具体方法为:
首先,获取迭代增加的分割点对修正后标准成分进行划分,分别获得第一成分和第二成分;
然后,获取分割点在迭代增加过程中,任意一次迭代后分割点的优选度,具体计算方法为:
式中,表示分割点的优选度;/>和/>分别表示第一成分和第二成分中数据点的数量;/>和/>分别表示第一成分和第二成分中所有数据点的平均值,/>表示第一成分中第/>个数据点的数值;/>表示第二成分中第/>个数据点的数值;/>表示获取绝对值;
最后,获取分割点在迭代增加过程中所有大小的分割点对应的优先度,将所有优选度进行线性归一化获得归一化优选度,其归一化优选度的最大值记为置信度。
进一步的,所述获取迭代增加的分割点对修正后标准成分进行划分,分别获得第一成分和第二成分,包括的具体方法为:
对所有多维样本数据的修正后标准成分进行线性归一化,获得归一化标准成分,获取任意多维样本数据的归一化标准成分中最大值和最小值对应数据点分别记为最大数据点和最小数据点,将一个大小从最小数据点开始,并以步长B进行迭代增加的点作为分割点,分割点迭代增加到最大数据点停止迭代增加,利用分割点将归一化标准成分分割为两部分,分别记为第一成分和第二成分,其中B为预设的超参数。
进一步的,所述构建任意多维样本数据的孤立森林,获取任意数据点在孤立森林中的路径长度,利用置信度对路径长度进行加权获得多维样本数据的任意数据点的加权平均路径长度,包括的具体方法为:
首先,将任意多维样本数据作为孤立森林算法的输入,获取多维样本数据的任意数据点在孤立森林的孤立树中对应的路径长度,获取孤立森林中任意孤立树对多维样本数据的归一化标准成分进行划分时对应的置信度;
然后,获取多维样本数据的任意数据点在孤立森林中的加权平均路径长度,具体计算方法为:
式中,表示数据点的加权平均路径长度;/>表示包含数据点的孤立树的数量;/>表示数据点在第/>个孤立树中的路径长度;/>表示第/>个孤立树中的置信度。
进一步的,所述利用加权平均路径长度对汽车的起动机进行监测,包括的具体方法为:
首先,利用孤立森林算法结合加权平均路径长度获取多维起动数据中任意数据点的异常得分,将异常得分大于的数据点记为异常点,其中/>为预设的超参数;
然后,当出现异常点时汽车发出报警声音。
本发明的技术方案的有益效果是:通过分析起动数据的分布情况以及多维起动数据在窗口范围内的变化特征,并结合对多维样本数据降维后得到的标准成分进行划分时对应的置信度,通过置信度对数据点的路径长度进行加权获得多维样本数据的任意数据点的加权平均路径长度,通过对多维起动数据进行降维避免了冗余信息的干扰,通过对标准成分进行修正并利用置信度对数据点的路径长度进行加权降低了起动数据中噪声对异常检测结果的干扰,提高了异常检测结果的准确性,使起动机异常报警更加可靠。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于数据分析的汽车用起动机监测方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于数据分析的汽车用起动机监测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于数据分析的汽车用起动机监测方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于数据分析的汽车用起动机监测方法的步骤流程图,该方法包括以下步骤:
步骤S001:获取起动机的多维起动数据。
具体的,为了实现本实施例提出的基于数据分析的汽车用起动机监测方法,首先需要采集多维起动数据,具体过程为:
利用多种传感器采集汽车起动机的转速数据、温度数据、电压数据以及氧气含量数据,将转速数据、温度数据、电压数据以及氧气含量数据统称为起动数据,将转速数据、温度数据、电压数据以及氧气含量数据形成的数据集记为多维起动数据。
需要说明的是,汽车起动机的转速数据、温度数据、电压数据以及氧气含量数据分别可以利用转速传感器、温度传感器、电压传感器以及氧气传感器采集,本实施例预设传感器的采样频率为50Hz,将起动机在运行时间内10分钟作为多维起动数据的采样时间,具体采样频率和采样时间可根据实际情况进行调整,本实施例不进行具体限定。
至此,通过上述方法得到由多个起动数据形成的多维起动数据。
步骤S002:对多维起动数据进行采样和降维,获得多个多维样本数据以及多维样本数据的标准成分。
需要说明的是,孤立树的构建过程依赖于样本集中的数据分布特征,若数据分布越离散则构建的孤立树所输出的异常得分值越可信,而数据分布如果较为集中,则异常数据和正常数据很难被区分,导致正常数据和异常数据的异常得分值都会受到影响。因此,本实施例利用各个样本集的数据分布特征对各个孤立树中得到的样本异常得分值做出修正。同时在进行孤立数据的构建时要利用样本集的某个特征,本实施例通过主成分分析将多维数据进行数据降维,并利用主成分值的大小进行孤立树的构建,但是主成分分析是基于各个维度数据的方差计算而来,但噪声的存在可能会导致主成分的值发生偏差,因此需要对主成分做出修正。
需要说明的是,在多维数据中可能会存在一定冗余程度的维度或变量,该维度或变量在分析过程中不具有明显的区分特征,若分别对于多个维度数据进行特征提取,其对应的权重系数无法较好的确定,因此需要对多维度的数据去除冗余部分,以便于构建对应的孤立树。
具体的,首先,对多维起动数据中的时间点进行多次系统采样,每次系统采样后获得由若干个时间点形成的集合记为时间点集合,时间点集合中每个时间点都在所有起动数据中对应一个数据点,将时间点集合中所有时间点在所有起动数据中对应数据点形成的数据集合记为多维样本数据,获得多个多维样本数据。
需要说明的是,任意一个多维样本数据中任意时间点对应数据点的数量与多维起动数据的维数相同。
需要说明的是,根据经验预设系统采样的频率为每间隔100个时间点采样一次,可根据实际情况进行调整,本实施例不进行具体限定。
然后,利用主成分分析算法对任意多维样本数据进行主成分分析,获得若干个主成分以及对应的贡献率,将贡献率最大的主成分记为对应多维样本数据的标准成分。
需要说明的是,由于构建孤立树时需要比较数据的大小,而标准成分对起动数据的表征效果较好,因此本实施例采用标准成分进行孤立树的构建。
至此,通过上述方法得到任意多维样本数据对应的标准成分。
步骤S003:根据起动数据中的极值点以及数据点的差值,获得噪声程度,利用噪声程度对标准成分进行修正和划分,获得置信度,结合置信度获得多维样本数据的任意数据点的加权平均路径长度。
需要说明的是,由于起动数据中可能存在噪声,而噪音会导致标准成分中数据点的数值存在误差,因此需要分析标准程度以对标准成分进行修正。而孤立树置信度的计算则是通过数据分布的优选度计算而来,因为孤立树的构建过程为一次次分割的过程,那些密集度很高的点不要被分割多次才会停止,而比较稀疏的点则需要较少的分割次数,而密集度的高低则可通过优选度表征,所以优选度即可作为孤立树的置信度。
具体的,步骤(1),首先,构建长度为的窗口记为时间窗口,将任意起动数据中的任意数据点作为时间窗口的中心点,获取时间窗口内的所有数据形成的序列记为窗口数据段,其中/>为预设的超参数,获取窗口数据段的一阶差分序列,记为差分数据段;一个数据点对应一个时刻,一个数据点对应一个窗口数据段和一个差分数据段。
需要说明的是,根据经验预设超参数为11,可根据实际情况进行调整,本实施例不进行具体限定。
需要说明的是,差分数据段中数据点的数值为窗口数据段中相邻两个数据点的差值,差值的大小反映了窗口数据段中相邻数据点的数值变化量,因此差分数据段中数据点的方差可以表征对应窗口数据段的变化量的离散程度。
然后,利用最小二乘法对窗口数据段进行曲线拟合,将得到的曲线记为窗口曲线,获取窗口曲线中的极值点数量,一个窗口曲线对应一个窗口数据段。
需要说明的是,由于噪声点通常在局部范围内的数值变化较大且变化不规则,本实施例通过极值点和差分数据段分析数据中的噪声。
最后,获取起动数据在第个时刻下的噪声程度,具体计算方法为:
式中,表示第/>维起动数据中第/>时刻对应窗口数据段的噪声程度;/>表示第/>维的起动数据中第/>时刻对应窗口数据段的极值点数量;/>表示第/>维的起动数据中第/>时刻对应差分数据段中所有数据点的方差。
需要说明的是,窗口数据段内极值点的数量越多,表示在局部范围内数据的变化越频繁,其噪声程度越大,呈正相关关系。差分数据段中所有数据点的方差的大小,反映了数据变化的离散程度,方差越大则数据变化越离散,则起动数据的噪声程度越高。
步骤(2),利用噪声程度对任意多维样本数据的标准成分进行修正,获得修正后标准成分:
其中,表示修正后标准成分中第/>个时刻下数据点的数值;/>表示以自然常数为底数的指数函数;/>表示多维样本数据中包含起动数据的维数;/>表示多维样本数据的第/>维起动数据中第/>时刻对应窗口数据段的噪声程度;/>表示多维样本数据的第/>维起动数据中第/>时刻对应窗口数据段的噪声程度;/>表示获取绝对值;/>表示标准成分中第/>个时刻下数据点的数值。
需要说明的是,噪声修正因子表示多维起动数据中窗口数据段的噪声程度之间的差异,差值绝对值的累加值越大,表示多维起动数据中同时刻下窗口数据段的噪声程度之间的差异越大,则噪声程度相似性/>越小,噪声程度相似性越小表示该时刻下对应的噪声程度越不可信,即越不可能存在噪声,则对对应时刻下标准成分的数据点的数据越不能修正。窗口修正参数/>表示结合多维样本数据的第/>个维度下第/>时刻下窗口数据段的噪声程度,对标准成分的数据点进行修正。
需要说明的是,因为各个维度数据对主成分的贡献不同,因此利用各个维度下数据点的噪声程度对其做出修正,同时考虑到环境噪声的特点,如果某一时刻有噪声,那么多个维度下的数据都会产生噪声,体现在数据中为同一时刻下的每个数据点的噪声程度越相似,则其噪声程度越可信。
步骤(3),孤立森林中孤立树的算法逻辑为将数据分割为两类数据,若两类数据内数据点的数值越集中且类间差异越大,则异常数据和异常数据之间的差异越大且清晰,则得到的异常得分的可信度越高。则本实施例通过对修正后标准成分进行归一化,然后通过对归一化标准成分进行迭代,结合迭代过程获取孤立树的置信度。
首先,对所有多维样本数据的修正后标准成分进行线性归一化,获得归一化标准成分,获取任意多维样本数据的归一化标准成分中最大值和最小值对应数据点分别记为最大数据点和最小数据点,将一个大小从最小数据点开始,并以步长B进行迭代增加的点作为分割点,分割点迭代增加到最大数据点停止迭代增加,利用分割点将归一化标准成分分割为两部分,分别记为第一成分和第二成分,其中B为预设的超参数。
需要说明的是,根据经验预设超参数B为0.1,可根据实际情况进行调整,本实施例不进行具体限定。
然后,获取分割点在迭代增加过程中,任意一次迭代后分割点的优选度,具体计算方法为:
式中,表示分割点的优选度;/>和/>分别表示第一成分和第二成分中数据点的数量;/>和/>分别表示第一成分和第二成分中所有数据点的平均值,/>表示第一成分中第/>个数据点的数值;/>表示第二成分中第/>个数据点的数值;/>表示获取绝对值。
需要说明的是,和/>分别表示了第一成分和第二成分中数据点的聚集程度,聚集程度越大,两类数据内数据点的数值越相近,则分割点的优选度越高。表示第一成分和第二成分中所有数据点的平均值之间的差异,其差异越大,分割点的优选程度越高。
需要说明的是,第一成分和第二成分中数据点的聚集程度越高,且数据点的平均值差异越大,同时用两类数据的均值差表示两类数据之间的差异,均值差越大则表示两类数据之间的差异越大。
最后,获取分割点在迭代增加过程中所有大小的分割点对应的优先度,将所有优选度进行线性归一化获得归一化优选度,其归一化优选度的最大值记为置信度。
步骤(4),首先,将任意多维样本数据作为孤立森林算法的输入,获取多维样本数据的任意数据点在孤立森林的孤立树中对应的路径长度,获取孤立森林中任意孤立树对多维样本数据的归一化标准成分进行划分时对应的置信度。
需要说明的是,孤立森林算法为现有的异常检测算法,因此本实施例不进行赘述。
然后,获取多维样本数据的任意数据点在孤立森林中的加权平均路径长度,具体计算方法为:
式中,表示数据点的加权平均路径长度;/>表示包含数据点的孤立树的数量;/>表示数据点在第w个孤立树中的路径长度;/>表示第w个孤立树中的置信度。
至此,通过上述方法得到孤立森林中任意数据点的加权平均路径长度。
步骤S004:利用加权平均路径长度对汽车的起动机进行监测。
具体的,首先,利用孤立森林算法结合加权平均路径长度获取多维起动数据中任意数据点的异常得分,将异常得分大于Y的数据点记为异常点,其中Y为预设的超参数。
然后,当出现异常点时汽车发出报警声音。
需要说明的是,根据经验预设超参数Y为0.77,可根据实际情况进行调整,本实施例不进行具体限定。
至此,本实施例完成。
需要说明的是,本实施例中所用的模型仅用于表示负相关关系和约束模型输出的结果处于/>区间内,具体实施时,可替换成具有同样目的的其他模型,本实施例只是以/>模型为例进行叙述,不对其做具体限定,其中/>是指该模型的输入。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.基于数据分析的汽车用起动机监测方法,其特征在于,该方法包括以下步骤:
获取起动机的多维起动数据;
对多维起动数据进行采样和降维,获得多个多维样本数据以及多维样本数据的标准成分;
根据起动数据中的极值点数量以及数据点的差值获得噪声程度,利用噪声程度对标准成分进行修正获得修正后标准成分,对修正后标准成分进行划分获得置信度,构建任意多维样本数据的孤立森林,获取任意数据点在孤立森林中的路径长度,利用置信度对路径长度进行加权获得多维样本数据的任意数据点的加权平均路径长度;
利用加权平均路径长度对汽车的起动机进行监测;
所述对修正后标准成分进行划分获得置信度,包括的具体方法为:
首先,获取迭代增加的分割点对修正后标准成分进行划分,分别获得第一成分和第二成分;
然后,获取分割点在迭代增加过程中,任意一次迭代后分割点的优选度,具体计算方法为:
式中,表示分割点的优选度;/>和/>分别表示第一成分和第二成分中数据点的数量;/>和/>分别表示第一成分和第二成分中所有数据点的平均值,/>表示第一成分中第/>个数据点的数值;/>表示第二成分中第/>个数据点的数值;/>表示获取绝对值;
最后,获取分割点在迭代增加过程中所有大小的分割点对应的优先度,将所有优选度进行线性归一化获得归一化优选度,其归一化优选度的最大值记为置信度;
所述利用加权平均路径长度对汽车的起动机进行监测,包括的具体方法为:
首先,利用孤立森林算法结合加权平均路径长度获取多维起动数据中任意数据点的异常得分,将异常得分大于的数据点记为异常点,其中/>为预设的超参数;
然后,当出现异常点时汽车发出报警声音;
所述对多维起动数据进行采样和降维,获得多个多维样本数据以及多维样本数据的标准成分,包括的具体方法为:
首先,对多维起动数据中的时间点进行多次系统采样,每次系统采样后获得由若干个时间点形成的集合记为时间点集合,时间点集合中每个时间点都在所有起动数据中对应一个数据点,将时间点集合中所有时间点在所有起动数据中对应数据点形成的数据集合记为多维样本数据,获得多个多维样本数据;
然后,利用主成分分析算法对任意多维样本数据进行主成分分析,获得若干个主成分以及对应的贡献率,将贡献率最大的主成分记为对应多维样本数据的标准成分;
所述根据起动数据中的极值点数量以及数据点的差值获得噪声程度,包括的具体方法为:
首先,构建长度为的窗口记为时间窗口,将任意起动数据中的任意数据点作为时间窗口的中心点,对起动数据进行遍历,分别获得差分数据段和窗口曲线,获取窗口曲线中极值点的数量;
然后,将第维的起动数据中第/>时刻对应窗口数据段的极值点数量记为第一数值,将第维的起动数据中第/>时刻对应差分数据段中所有数据点的方差记为第二数值,将第一数值与第二数值的乘积记为起动数据在第/>个时刻下的噪声程度;
所述差分数据段和窗口曲线的具体获取方法为:
首先,获取时间窗口内的所有数据形成的序列记为窗口数据段,其中为预设的超参数,获取窗口数据段的一阶差分序列,记为差分数据段;一个数据点对应一个时刻,一个数据点对应一个窗口数据段和一个差分数据段;
然后,利用最小二乘法对窗口数据段进行曲线拟合,将得到的曲线记为窗口曲线,获取窗口曲线中的极值点数量,一个窗口曲线对应一个窗口数据段;
所述利用噪声程度对标准成分进行修正获得修正后标准成分,包括的具体方法为:
根据相邻两个维度的起动数据在同时刻下对应噪声程度的差异获得噪声程度相似性;
将多维样本数据的第维起动数据中第/>时刻对应窗口数据段的噪声程度记为第四数值,将标准成分中第/>个时刻下数据点的数值与第四数值的比值,记为对应维度下的窗口修正参数;将所有维度下的窗口修正参数的累加值记为第五数值;
将噪声程度相似性与第五数值的乘积记为修正后标准成分中对应时刻下数据点的数值;
所述根据相邻两个维度的起动数据在同时刻下对应噪声程度的差异获得噪声程度相似性,包括的具体方法为:
将多维样本数据的第维与第/>维起动数据中第/>时刻对应窗口数据段的噪声程度的差值绝对值记为第三数值,将所有相邻的两个维度的起动数据在第/>个时刻下对应第三数值的累加值记为噪声修正因子/>,将/>记为噪声程度相似性,其中/>表示以自然常数为底数的指数函数;
所述获取迭代增加的分割点对修正后标准成分进行划分,分别获得第一成分和第二成分,包括的具体方法为:
对所有多维样本数据的修正后标准成分进行线性归一化,获得归一化标准成分,获取任意多维样本数据的归一化标准成分中最大值和最小值对应数据点分别记为最大数据点和最小数据点,将一个大小从最小数据点开始,并以步长B进行迭代增加的点作为分割点,分割点迭代增加到最大数据点停止迭代增加,利用分割点将归一化标准成分分割为两部分,分别记为第一成分和第二成分,其中B为预设的超参数;
所述构建任意多维样本数据的孤立森林,获取任意数据点在孤立森林中的路径长度,利用置信度对路径长度进行加权获得多维样本数据的任意数据点的加权平均路径长度,包括的具体方法为:
首先,将任意多维样本数据作为孤立森林算法的输入,获取多维样本数据的任意数据点在孤立森林的孤立树中对应的路径长度,获取孤立森林中任意孤立树对多维样本数据的归一化标准成分进行划分时对应的置信度;
然后,获取多维样本数据的任意数据点在孤立森林中的加权平均路径长度,具体计算方法为:
式中,表示数据点的加权平均路径长度;/>表示包含数据点的孤立树的数量;/>表示数据点在第/>个孤立树中的路径长度;/>表示第/>个孤立树中的置信度。
CN202311490494.1A 2023-11-10 2023-11-10 基于数据分析的汽车用起动机监测方法 Active CN117238058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311490494.1A CN117238058B (zh) 2023-11-10 2023-11-10 基于数据分析的汽车用起动机监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311490494.1A CN117238058B (zh) 2023-11-10 2023-11-10 基于数据分析的汽车用起动机监测方法

Publications (2)

Publication Number Publication Date
CN117238058A CN117238058A (zh) 2023-12-15
CN117238058B true CN117238058B (zh) 2024-01-26

Family

ID=89098486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311490494.1A Active CN117238058B (zh) 2023-11-10 2023-11-10 基于数据分析的汽车用起动机监测方法

Country Status (1)

Country Link
CN (1) CN117238058B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117436005B (zh) * 2023-12-21 2024-03-15 山东汇力环保科技有限公司 一种环境空气自动监测过程中异常数据处理方法
CN117433591B (zh) * 2023-12-21 2024-02-27 河北省农林科学院农业信息与经济研究所 基于多传感器数据的自动化设备监测系统
CN117540220B (zh) * 2024-01-09 2024-04-05 巨洋神州科技集团有限公司 一种近零碳园区源网荷匹配方法及系统
CN117540328B (zh) * 2024-01-09 2024-04-02 山西众诚安信安全科技有限公司 一种煤矿噪声高精度测量过程中噪声处理方法
CN117538491B (zh) * 2024-01-09 2024-04-05 武汉怡特环保科技有限公司 一种站房空气质量智能监测方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852860A (zh) * 2019-11-15 2020-02-28 惠州大亚湾聚联信息科技有限公司 车辆维修报销行为异常检测方法、设备及存储介质
CN111666169A (zh) * 2020-05-13 2020-09-15 云南电网有限责任公司信息中心 一种基于改进的孤立森林算法和高斯分布的联合数据异常检测方法
CN113255733A (zh) * 2021-04-29 2021-08-13 西安交通大学 多模态数据缺失下的无监督异常检测方法
CN113645181A (zh) * 2021-06-21 2021-11-12 上海电力大学 一种基于孤立森林的分布式规约攻击检测方法及系统
CN115577275A (zh) * 2022-11-11 2023-01-06 山东产业技术研究院智能计算研究院 一种基于lof和孤立森林的时序数据异常监测系统及方法
CN115618294A (zh) * 2022-10-05 2023-01-17 吉林大学 一种车联网行驶大数据异常标记方法及电子设备
KR20230030542A (ko) * 2021-08-25 2023-03-06 주식회사 타키온테크 랜덤 컷 포레스트 알고리즘을 이용한 ai 기반의 설비 데이터 이상 감지 시스템과 그 방법
CN116933252A (zh) * 2023-07-28 2023-10-24 中国银行股份有限公司 一种安全监测方法、装置、设备及介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852860A (zh) * 2019-11-15 2020-02-28 惠州大亚湾聚联信息科技有限公司 车辆维修报销行为异常检测方法、设备及存储介质
CN111666169A (zh) * 2020-05-13 2020-09-15 云南电网有限责任公司信息中心 一种基于改进的孤立森林算法和高斯分布的联合数据异常检测方法
CN113255733A (zh) * 2021-04-29 2021-08-13 西安交通大学 多模态数据缺失下的无监督异常检测方法
CN113645181A (zh) * 2021-06-21 2021-11-12 上海电力大学 一种基于孤立森林的分布式规约攻击检测方法及系统
KR20230030542A (ko) * 2021-08-25 2023-03-06 주식회사 타키온테크 랜덤 컷 포레스트 알고리즘을 이용한 ai 기반의 설비 데이터 이상 감지 시스템과 그 방법
CN115618294A (zh) * 2022-10-05 2023-01-17 吉林大学 一种车联网行驶大数据异常标记方法及电子设备
CN115577275A (zh) * 2022-11-11 2023-01-06 山东产业技术研究院智能计算研究院 一种基于lof和孤立森林的时序数据异常监测系统及方法
CN116933252A (zh) * 2023-07-28 2023-10-24 中国银行股份有限公司 一种安全监测方法、装置、设备及介质

Also Published As

Publication number Publication date
CN117238058A (zh) 2023-12-15

Similar Documents

Publication Publication Date Title
CN117238058B (zh) 基于数据分析的汽车用起动机监测方法
CN111931601B (zh) 齿轮箱错误类别标签修正系统及方法
CN117436005B (zh) 一种环境空气自动监测过程中异常数据处理方法
CN111861272A (zh) 一种基于多源数据的复杂机电系统异常状态检测方法
CN117077044B (zh) 一种发电机用真空断路器故障判别方法及装置
CN116821809B (zh) 基于人工智能的生命体征数据采集系统
CN112598539B (zh) 一种风力发电机组风功率曲线优化计算及异常值检测方法
CN106897957B (zh) 一种基于pca和pso-elm的自动气象站实时数据质量控制方法
CN113298162A (zh) 一种基于K-means算法的桥梁健康监测方法及系统
CN115409131A (zh) 基于spc过程管控系统的生产线异常检测方法
CN113268730B (zh) 一种基于强化学习的智能电网虚假数据注入攻击检测方法
CN114151320A (zh) 一种压气机流动系统失稳的识别算法
US11593245B2 (en) System, device and method for frozen period detection in sensor datasets
CN115659323A (zh) 一种基于信息熵理论结合卷积神经网络的入侵检测方法
CN114004144A (zh) 一种航空发动机剩余使用寿命预测方法
CN113361932A (zh) 一种计量设备检定流水线预警方法、装置、设备及介质
CN117332341B (zh) 基于物联网的飞机轮挡数据智能管理方法及系统
CN117093947B (zh) 一种发电柴油机运行异常监测方法及系统
CN110244563A (zh) 一种神经网络内模控制器模型失配识别及在线更新方法
CN117034020B (zh) 一种基于cvae-gan模型的无人机传感器零样本故障检测方法
CN117473464B (zh) 基于大数据分析的企业环境治理数据处理系统
CN116595338B (zh) 基于物联网工程信息采集处理系统
CN113111575B (zh) 基于深度特征编码与混合高斯模型的燃机退化评估方法
CN117433591B (zh) 基于多传感器数据的自动化设备监测系统
CN117892214A (zh) 异常检测模型的构建方法、异常检测方法及异常检测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant