CN113483931B - 弓网接触力区段异常识别方法及装置 - Google Patents
弓网接触力区段异常识别方法及装置 Download PDFInfo
- Publication number
- CN113483931B CN113483931B CN202110752582.9A CN202110752582A CN113483931B CN 113483931 B CN113483931 B CN 113483931B CN 202110752582 A CN202110752582 A CN 202110752582A CN 113483931 B CN113483931 B CN 113483931B
- Authority
- CN
- China
- Prior art keywords
- contact force
- bow net
- net contact
- standard deviation
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01L—MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
- G01L5/00—Apparatus for, or methods of, measuring force, work, mechanical power, or torque, specially adapted for specific purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明提供了一种弓网接触力区段异常识别方法及装置,该方法包括:从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量;从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值;根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置;对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别。本发明可以自动识别弓网接触力区段异常,准确度高。
Description
技术领域
本发明属于铁路弓网的基础设施检测技术领域,涉及一种弓网接触力区段异常识别方法和装置。
背景技术
电气化铁路接触网状态对于铁路运行车辆安全状态起着至关重要的作用,当电气化铁路接触网状态出现异常时,铁路运行车辆处于危险状态,给人们生命安全带来危险。2019年开始,以6C系统中的高速弓网综合检测装置(1C)的检测数据为依据获得接触网运行质量指数(CDI)在全路范围内使用,其中,弓网接触力是一项重要指标,可反映接触网和受电弓机械振荡系统的质量。接触网悬挂弹性会直接影响到受电弓的取流质量,而受电弓对接触线的动态压力,也就是弓网接触力,则是接触网悬挂弹性的重要指标。弓网接触力区段异常是弓网接触力数据受外因干扰、内因缺陷而引起的区段性波动异常的总称。由于异常数据产生原因较为复杂,表现形式多样,目前主要根据专家经验采用人工筛查的方法来剔除异常值。这严重影响了弓网检测数据的分析效率,并且由于对专家经验的依赖性,处理结果存在较大的主观性。因此,找到一种弓网接触力检测数据中异常自动识别、剔除方法,对于接触网检测数据分析和接触网区段质量评价具有重要意义。
随着各种检测、监测手段和数据分析方法的不断进步,基于检测、监测数据的故障识别和安全预警已经成为保障各类基础设施和装备正常运行的重要方法。然而,由于外部环境变化和检测设备等原因,会出现检测数据不能反应设备真实状态的情况,通常称这类数据为异常数据。在进行后续的数据分析时如果没能及时的剔除异常数据,将会严重影响分析结果的可信度。因此,异常数据识别算法也成为数据分析领域的一个重要研究内容。
国内方面,有研究人员利用EEMD对弓网接触力多元检测数据进行IMF分解,采用局部相关系数评估检测数据IMF分量间的数据相关性。研究表明:接触压力数据中超过3倍标准差的数据包含了检测错误点、硬点和线路参数超标点,通过剔除记录错误点,保留硬点和弓网参数造成的超标点,可为更加准确评估弓网工况及分析接触线状态缺陷提供帮助,该研究忽略了不同检测车之间的差异性,将接触压力数据的阈值固定为3,因此在实际应用中推广性较差。另有研究人员对弓网接触力锚段中间位置某定位点相邻定位高差呈现倒“V”字形这一典型缺陷进行了动态检测数据横向对比与动静态检测数据交叉对比,并形成了检测-分析-维修-销号的闭环方案,但该研究的缺陷类别局限性较高,而且没有具体的算法设计的介绍。还有研究人员分析了导高不平顺,吊弦不受力,分段绝缘器不平顺,分相绝缘器不平顺这4种典型弓网接触力缺陷的形态、频次、波长等特征,采用小波相似性系数进行缺陷诊断,从而有效诊断产生弓网接触力缺陷的原因,但此方法未实现缺陷形态的自动识别,并对识别过程中产生的阈值不统一这一难题没有进行深入探究。有研究人员结合大数据技术,设计并实现了基于大数据的车载弓网监测系统,但对于弓网接触力数据的异常类别没有明确区分,并且对弓网接触力区段异常识别算法研究没有涉及。
国外方面,有研究人员研究了接触网波动与受电弓接触力波动的关系,分析了悬跨周期接触力波动,提出了减小接触力波动的方法,结果表明,受电弓高速运行时的接触力波动主要是由接触线不平度产生的接触线入射波在吊架上反射引起的。当列车速度接近接触线的波速时,这种影响变得非常大,提高接触线的波速或降低悬挂处的波动反射系数,可望有效地减小接触力波动;但该研究对弓网接触力异常波动的自动识别并为提及。另有研究人员从弓网接触力中提取的多种特征,通过仿真数据与统计方法,以选择最相关的特征来实现诊断功能。还有研究人员通过分析受电弓接触力在动态范围内的变化规律,提出了一种弓网接触力故障诊断方法,该方法分析了弓网接触力在动态范围内的变化规律,通过数学建模和实验测试,确定每种类别的故障都能在接触力波动形态中产生“特征”,从而形成基于特征变化对弓网接触力故障动态特性分析与识别方法;这些诊断与识别方法未对弓网接触力数据进行分解,因此识别结果受到趋势影响较大;该方法对不同检测车数据的弓网接触力数据标准差差异也欠缺考虑,因此识别精度难以提高。
因此,根据现有文献记载,在接触网与受电弓间接触力的检测方法、缺陷分析、诊断与整治等研究领域已经有了一定探索。但在弓网接触力数据异常区段的识别方向至今涉及甚少。
发明内容
本发明实施例提出一种弓网接触力区段异常识别方法,用以自动识别弓网接触力区段异常,准确度高,该方法包括:
从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量;
从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值;
根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置;
对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别。
本发明实施例提出一种弓网接触力区段异常识别装置,用以自动识别弓网接触力区段异常,准确度高,该装置包括:
弓网接触力数据高频分量获得模块,用于从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量;
标准差阈值确定模块,用于从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值;
异常区段起止位置确定模块,用于根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置;
异常类别确定模块,用于对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别。
本发明实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述弓网接触力区段异常识别方法。
本发明实施例还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述弓网接触力区段异常识别方法的计算机程序。
在本发明实施例中,从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量;从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值;根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置;对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别。在上述实施例中,从弓网动态检测数据中进行高频分量提取,从而剔除了弓网接触力数据趋势项的干扰;基于大量的历史弓网接触力数据高频分量,构建了概率密度分布,从而确定的标准差阈值的准确度更高;因此,整体区段异常识别的准确度非常高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中弓网接触力区段异常识别方法的流程图;
图2为本发明实施例中待分析的弓网接触力数据的示意图;
图3为本发明实施例中提取的待分析的弓网接触力数据高频分量的示意图;
图4为本发明实施例中确定诊断区段异常的标准差阈值的示意图;
图5为本发明实施例中待分析的弓网接触力数据高频分量的滑动标准差的示意图;
图6为本发明实施例中确定的弓网接触力异常区段起止位置的示意图;
图7为本发明实施例中特征聚类的结果示意图;
图8为本发明实施例中弓网接触力区段异常识别装置的示意图;
图9为本发明实施例中计算机设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本发明的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
图1为本发明实施例中弓网接触力区段异常识别方法的流程图,如图1所示,该方法包括:
步骤101,从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量;
步骤102,从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值;
步骤103,根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置;
步骤104,对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别。
在上述实施例中,从弓网动态检测数据中进行高频分量提取,从而剔除了弓网接触力数据趋势项的干扰;基于大量的历史弓网接触力数据高频分量,构建了概率密度分布,从而确定的标准差阈值的准确度更高;因此,整体区段异常识别的准确度非常高。
在步骤101中,从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量,离散小波变换是对连续小波变换的尺度、位移按照2的幂次进行离散化得到的。本发明将此方法运用在弓网接触力数据的分解中,以提取能够反映弓网接触力波动异常的高频分量。对于弓网接触力数据,高频成分相当重要,高频成分给出的是弓网接触力数据细节或差别,而低频成分往往蕴含着弓网接触力数据的趋势特征。对于弓网接触力受故障影响而产生的波动异常通常不会改变接触网与受电弓间压力的数据波动趋势,而是对细节或差别分量造成一定影响。因此,本发明利用这一特征,运用离散小波变换对弓网接触力数据进行分解,剔除弓网接触力数据波动趋势项的干扰,保留高频成分,通过对高频分量进行分析处理,从而更好的识别弓网接触力区段异常的位置。
在一实施例中,从待分析的弓网动态检测数据提取弓网接触力数据高频分量,包括:
从待分析的弓网动态检测数据中提取弓网接触力数据,所述弓网接触力数据包括四个通道的接触力数据、速度数据和公里标数据;
将提取出来的弓网接触力数据进行离散小波分解得到第一层小波系数;
对第一层小波系数进行高频分量的提取,获得弓网接触力数据高频分量。
在上述实施例中,弓网接触力数据有四个通道,四个通道分别表示,接触力1,接触力2,接触力3与接触力4。四个接触力间的波动存在一定的相关性。本发明在此环节对四个通道的接触力进行逐一检测。图2为本发明实施例中待分析的弓网接触力数据的示意图。图3为本发明实施例中提取的待分析的弓网接触力数据高频分量的示意图。正常情况下,弓网接触力数据取值范围在20到60之间,以三角波的方式进行周期性波动。经过离散小波分解的弓网接触力数据高频分量,取值在-2到+2之间且平稳性较高。由此可见,经过离散小波分解的弓网接触力数据高频分量滤除了原始波形的三角形波动趋势,使异常区段显示更明晰,有助于对弓网接触力数据的区段异常进行识别与定位。
在一实施例中,采用如下公式,将提取出来的弓网接触力数据进行离散小波分解得到第一层小波系数:
在一实施例中,对第一层小波系数进行高频分量的提取,获得弓网接触力数据高频分量,包括:
对弓网接触力数据通过低通滤波器得到第一层低频系数,通过高通滤波器得到第一层高频系数;
根据第一层低频系数、第一层高频系数,获得弓网接触力数据高频分量。
在一实施例中,采用如下公式,根据第一层低频系数、第一层高频系数,获得弓网接触力数据高频分量:
G和H分别表示低通滤波器的矩阵形式和高通滤波器的矩阵形式,G*为G的共轭矩阵,H*为H的共轭矩阵。
在上述实施例中,把第一层小波系数作为低频系数作为数据输入,得到弓网接触力第二层高频系数和第二次低频系数再把弓网接触力第二层低频系数作为下一层的输入数据,以此类推,直到满足设定的分解等级。在这里最原始的弓网接触力数据可以看作第0级低频系数,所以用表示。
在步骤102中,从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值。
概率密度分布可以反应特定概率取值对应的标准差数值。个别线路或者个别日期的数据不足以反映弓网接触力数据高频分量滑动标准差的概率分布,为了提高结果的可靠性,需要准备大量的历史弓网接触力数据高频分量的滑动标准差,以进行概率密度分布构建。
大量历史弓网动态检测数据可以采用如下方法获得:
按照检测车类别与检测日期,收集历史弓网动态检测数据,提取历史弓网接触力数据,对同一检测车不同线路的四个通道的历史弓网接触力数据分别进行首尾相接,合成成一个包含所有不同线路同一通道的历史弓网接触力数据的整体,然后按照前述高频分量提取方法,提取历史弓网接触力数据高频分量。
在一实施例中,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,包括:
将历史弓网接触力数据高频分量划分为多个区段;
计算每个区段的滑动标准差,确定每个区段的级频数;
根据每个区段的级频数,确定每个区段的频数;
根据多个区段的频数,构建概率密度分布。
在上述实施例中,采用如下公式计算每个区段的滑动标准差:
其中,σm为每个区段的滑动标准差;N为区段长度,μm为第个m区段的历史弓网接触力数据的平均值。
可见,每个区段的滑动标准差的取值范围即为段宽,每个区段中,数据的取值范围间隔相同。区段的滑动标准差越大,说明弓网接触力数据高频分量在这一区段相对区段均值的偏离程度就越大,也就是标准差较强,这是弓网接触力在这一区段发生异常的重要依据。
在一实施例中,采用如下公式,根据每个区段的级频数,确定每个区段的频数:
其中,Δfj为第j个区段的频数;ΔFj为第j个区段的级频数。
在上述公式中个,∑ΔFj即为滑动标准差数据总个数。
之后,根据多个区段的频数,构建概率密度分布,由于大部分弓网动态检测数据为正常数据,取概率密度分布中累积概率密度为99%的数值作为诊断区段异常的标准差阈值。图4为本发明实施例中确定诊断区段异常的标准差阈值的示意图。滑动标准差数值主要分布在0.8左右,分布右尾较细较长,且数据占比较小。选取右尾单边99%的阈值,即1.5,得到标准差阈值。
在步骤103中,根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置。
在一实施例中,根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置,包括:
将待分析的弓网接触力数据高频分量划分为多个区段;
对每个区段,若该区段的滑动标准差大于所述标准差阈值,将该区段标记为正常区段,否则,将该区段标记为异常区段;
对标记的异常区段进行一阶差分,确定标记的异常区段的起止位置;
对标记了起止位置且满足预设条件的异常区段进行合并;
对合并的异常区段进行起止位置调整,获得调整好的弓网接触力异常区段起止位置。
在上述实施例中,将待分析的弓网接触力数据高频分量划分为多个区段时,采用空间采样的方法,每1米采集4个点。以50米(200个点)为一个区段为例,对每个区段,若该区段的滑动标准差大于所述标准差阈值,将该区段标记为正常区段,标记为0,异常区段标记为1。如果连续多个区段均出现异常,则对这些区段进行连续为1的标记。对于前50米区段,其弓网接触力数据长度不足以达到滑动窗口的长度要求,因此我们对它进行0值填充。
对异常区段进行了标记后,整个线路的可以看作只包含标记为0的弓网接触力正常区段,和标记为1的弓网接触力异常区段两部分。对于标记的异常区段,用Lm表示。对标记的异常区段进行一阶差分,ΔLm=Lm+1-Lm。如果ΔLm=1,则该处被初步定为弓网接触力异常区段的起点Si′,如果ΔLm=-1,则该处被初步定为弓网接触力异常区段的终点Ei′。这样,便初步得到了弓网接触力异常区段起止位置,包括起始位置与终止位置。
由于引起弓网接触力区段异常的原因的种类繁多,其中一些原因可导致弓网接触力单值异常或者时断时续的区段异常。对于弓网接触力单值异常,由于它的影响区段一般较短(50米以内),但是由于它会造成弓网接触力高频分量滑动标准差在这一区段的整体波动异常,因此在本发明中,忽略此种弓网接触力单值异常。
即如果:
Ei′-Si′<200
则将Ei′与Si′两处标记删除。
对于时断时续的弓网接触力区段异常,如果只采用异常区段标记定位,会导致在实际弓网接触力异常区段整体范围内,出现大量起始位置与终止位置的标记。因此,在本发明中,对于弓网接触力区段异常的起点位置Si′,与上一个弓网接触力区段异常的终点位置Ei-1′,满足预设条件的异常区段进行合并,其中预设条件为两点距离小于50米,则将这两个区段进行合并。
即如果:
Si′-Ei-1′<200
则:
Si′=Si-1′
Ei′=Ei-1′
在对弓网接触力数据高频分量进行滑动标准差检测时,采用200个点作为固定的窗口长度。受到滑动窗长度的影响,弓网接触力区段异常位置范围可能会出现覆盖不全的情况,这种情况主要发生在起点之前50米,与终点之后50米。因此,在本发明中,在已经初步标记弓网接触力区段异常起止位置基础上,需要对合并的异常区段进行起止位置调整,即对任意弓网接触力区段异常起始位置Si′,对它向前移动200个点。对任意弓网接触力区段异常终止位置Ei′,对它向后移动200个点。
即:
Si=Si′-200
Ei=Ei′+200
这样,便得到了更加完整、全面的弓网接触力区段异常的起点位置Si与终点位置Ei的标记,也就是调整好的弓网接触力异常区段起止位置。
图5为本发明实施例中待分析的弓网接触力数据高频分量的滑动标准差的示意图,图6为本发明实施例中确定的弓网接触力异常区段起止位置的示意图。第一通道,第二通道,第四通道的数值都在1.5以内,属于正常区段。第三通道,大于标准差阈值的则被异常区段。因此,高频分量滑动标准差结合标准差阈值可以较好反应原始接触力波形区段异常。
在一实施例中,对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别,包括:
对弓网接触力数据高频分量的滑动标准差进行Z-score标准化处理;
计算Z-score标准化处理后的滑动标准差的偏度和峰度;
根据所述偏度和峰度,将Z-score标准化处理后的滑动标准差进行聚类;
根据聚类结果,确定弓网接触力区段异常类别。
在上述实施例中,采用如下公式,对弓网接触力数据高频分量的滑动标准差进行Z-score标准化处理:
在一实施例中,计算Z-score标准化处理后的滑动标准差的偏度和峰度,包括:
采用如下公式计算Z-score标准化处理后的滑动标准差的偏度:
采用如下公式计算Z-score标准化处理后的滑动标准差的峰度:
其中,偏度反应了分布的偏斜方向和程度,峰度反应了分布形态的陡缓程度。
在聚类之前,首先,需要确定类别数量,在一实施例中,根据所述偏度和峰度,将Z-score标准化处理后的滑动标准差进行聚类,包括:
根据所述偏度和峰度,确定最优簇心数量;
根据所述偏度和峰度、最优簇心数量,将弓网接触力数据高频分量的滑动标准差进行聚类。
在上述实施例中,最优簇心数量即为弓网接触力区段异常类别的数量。
在一实施例中,根据所述偏度和峰度,确定最优簇心数量,包括:
根据所述偏度和峰度,确定不同簇心数量下的特征聚类轮廓系数:
确定最接近于1的特征聚类轮廓系数对应的簇心数量为最优簇心数量。
上述实施例中,不同簇心数量下有不同的特征聚类轮廓系数,通过迭代计算,寻求不同簇心数量下,最接近于1的特征聚类轮廓系数,从而选择出最优簇心数量。
在一实施例中,采用根据所述偏度和峰度,确定不同簇心数量下的特征聚类轮廓系数:
其中,s为特征聚类轮廓系数;a为偏度与峰度特征样本与同一簇中所有其他样本点之间的平均距离;b为偏度与峰度特征样本与下一个最近簇中所有其他样本点之间的平均距离。a也可以称为以偏度与峰度为特征的样本与其自身所在的簇中的其他样本的相似度;b也可以称为以偏度与峰度为特征的样本与其他所在的簇中的其他样本的相似度。
特征聚类以偏度和峰度为输入特征,将Z-score标准化处理后的滑动标准差划分为若干个无交集的簇,在一个簇中的数据就认为是一类,它们在偏度和峰度两个特征上是有相似性的,其相似性通过偏度和峰度特征样本点(Z-score标准化处理后的滑动标准差)与簇心的欧几里得距离来度量,公式如下:
一个簇中所有偏峰到簇心的距离的平方和CSS为:
一个偏峰数据集中所有簇的簇内平方和相加,为整体平方和TCSS:
其中,xi为以偏度与峰度为特征的第i个样本点坐标,μi为第i个样本点所在簇内的簇心坐标。m为一个簇中的偏峰的个数,j为每个偏峰的编号,k为数据集中簇的个数。整体平方和越小,说明每个簇内偏峰越相似,特征聚类的效果越好。图7为本发明实施例中特征聚类的结果示意图,图7中的(a)为轮廓系数示意图,图7中的(b)为偏度和峰度示意图,可见最后数据分为三类,轮廓系数的整体平均值为0.75,分类结果良好。因此不同检测车,不同通道的弓网接触力高频分量滑动标准差合成数据的偏度与峰度特征相差很大,且同分类的标准差分布相似性较高。
最后,根据聚类结果,确定弓网接触力区段异常类别,异常类别是一级异常、二级异常等区段异常的更喜欢的分类。
综上所示,在本发明实施例提出的方法中,从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量;从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值;根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置;对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别。在上述实施例中,从弓网动态检测数据中进行高频分量提取,从而剔除了弓网接触力数据趋势项的干扰;基于大量的历史弓网接触力数据高频分量,构建了概率密度分布,从而确定的标准差阈值的准确度更高;因此,整体区段异常识别的准确度非常高,且适用性好,适用性强。另外,滑动标准差的概率密度分布可以直观地反应弓网接触力波动性的分布状况,分布右尾形态是选取区段异常标准差阈值的重要参考,因此,结合所选取出的标准差阈值与计算区段滑动标准差方法,识别区段异常准确性高。标准差概率密度分布特征聚类对数据进行了归一化处理,使偏度和峰度特征处在同一数量级上,提高了聚类数据特征的适用性。结合轮廓系数、寻求最优簇心数量提高了分类的准确性,使得确定弓网接触力区段异常类别的准确度非常高。
本发明实施例还提出一种弓网接触力区段异常识别装置,其原理与弓网接触力区段异常识别方法类似,这里不再赘述。
图8为本发明实施例中弓网接触力区段异常识别装置的示意图,如图8所示,该装置包括:
弓网接触力数据高频分量获得模块801,用于从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量;
标准差阈值确定模块802,用于从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值;
异常区段起止位置确定模块803,用于根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置;
异常类别确定模块803,用于对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别。
在一实施例中,弓网接触力数据高频分量获得模块具体用于:
从待分析的弓网动态检测数据中提取弓网接触力数据,所述弓网接触力数据包括四个通道的接触力数据、速度数据和公里标数据;
将提取出来的弓网接触力数据进行离散小波分解得到第一层小波系数;
对第一层小波系数进行高频分量的提取,获得弓网接触力数据高频分量。
在一实施例中,弓网接触力数据高频分量获得模块具体用于:
采用如下公式,将提取出来的弓网接触力数据进行离散小波分解得到第一层小波系数:
在一实施例中,弓网接触力数据高频分量获得模块具体用于:
对弓网接触力数据通过低通滤波器得到第一层低频系数,通过高通滤波器得到第一层高频系数;
根据第一层低频系数、第一层高频系数,获得弓网接触力数据高频分量。
在一实施例中,弓网接触力数据高频分量获得模块具体用于:
采用如下公式,根据第一层低频系数、第一层高频系数,获得弓网接触力数据高频分量:
G和H分别表示低通滤波器的矩阵形式和高通滤波器的矩阵形式,G*为G的共轭矩阵,H*为H的共轭矩阵。
在一实施例中,标准差阈值确定模块具体用于:
将历史弓网接触力数据高频分量划分为多个区段;
计算每个区段的滑动标准差,确定每个区段的级频数;
根据每个区段的级频数,确定每个区段的频数;
根据多个区段的频数,构建概率密度分布。
在一实施例中,标准差阈值确定模块具体用于:
采用如下公式,根据每个区段的级频数,确定每个区段的频数:
其中,Δfj为第j个区段的频数;ΔFj为第j个区段的级频数。
在一实施例中,异常区段起止位置确定模块具体用于:
将待分析的弓网接触力数据高频分量划分为多个区段;
对每个区段,若该区段的滑动标准差大于所述标准差阈值,将该区段标记为正常区段,否则,将该区段标记为异常区段;
对标记的异常区段进行一阶差分,确定标记的异常区段的起止位置;
对标记了起止位置且满足预设条件的异常区段进行合并;
对合并的异常区段进行起止位置调整,获得调整好的弓网接触力异常区段起止位置。
在一实施例中,异常类别确定模块具体用于:
对弓网接触力数据高频分量的滑动标准差进行Z-score标准化处理;
计算Z-score标准化处理后的滑动标准差的偏度和峰度;
根据所述偏度和峰度,将Z-score标准化处理后的滑动标准差进行聚类;
根据聚类结果,确定弓网接触力区段异常类别。
在一实施例中,异常类别确定模块具体用于:
采用如下公式计算Z-score标准化处理后的滑动标准差的偏度:
采用如下公式计算Z-score标准化处理后的滑动标准差的峰度:
在一实施例中,异常类别确定模块具体用于:
根据所述偏度和峰度,确定最优簇心数量;
根据所述偏度和峰度、最优簇心数量,将弓网接触力数据高频分量的滑动标准差进行聚类。
在一实施例中,异常类别确定模块具体用于:
根据所述偏度和峰度,确定不同簇心数量下的特征聚类轮廓系数:
确定最接近于1的特征聚类轮廓系数对应的簇心数量为最优簇心数量。
在一实施例中,异常类别确定模块具体用于:
其中,s为特征聚类轮廓系数;a为偏度与峰度特征样本与同一簇中所有其他样本点之间的平均距离;b为偏度与峰度特征样本与下一个最近簇中所有其他样本点之间的平均距离。
综上所述,在本发明实施例提出的装置中,从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量;从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值;根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置;对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别。在上述实施例中,从弓网动态检测数据中进行高频分量提取,从而剔除了弓网接触力数据趋势项的干扰;基于大量的历史弓网接触力数据高频分量,构建了概率密度分布,从而确定的标准差阈值的准确度更高;因此,整体区段异常识别的准确度非常高,且适用性好,适用性强。另外,滑动标准差的概率密度分布可以直观地反应弓网接触力波动性的分布状况,分布右尾形态是选取区段异常标准差阈值的重要参考,因此,结合所选取出的标准差阈值与计算区段滑动标准差方法,识别区段异常准确性高。标准差概率密度分布特征聚类对数据进行了归一化处理,使偏度和峰度特征处在同一数量级上,提高了聚类数据特征的适用性。结合轮廓系数、寻求最优簇心数量提高了分类的准确性,使得确定弓网接触力区段异常类别的准确度非常高。
本发明的实施例还提供一种计算机设备,图9为本发明实施例中计算机设备的示意图,该计算机设备能够实现上述实施例中的弓网接触力区段异常识别方法中全部步骤,所述计算机设备具体包括如下内容:
处理器(processor)901、存储器(memory)902、通信接口(CommunicationsInterface)903和通信总线904;
其中,所述处理器901、存储器902、通信接口903通过所述通信总线904完成相互间的通信;所述通信接口903用于实现服务器端设备、检测设备以及用户端设备等相关设备之间的信息传输;
所述处理器901用于调用所述存储器902中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的弓网接触力区段异常识别方法中的全部步骤。
本发明的实施例还提供一种计算机可读存储介质,能够实现上述实施例中的弓网接触力区段异常识别方法中全部步骤,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的弓网接触力区段异常识别方法的全部步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (16)
1.一种弓网接触力区段异常识别方法,其特征在于,包括:
从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量;
从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值;
根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置;
对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别。
2.如权利要求1所述的弓网接触力区段异常识别方法,其特征在于,从待分析的弓网动态检测数据提取弓网接触力数据高频分量,包括:
从待分析的弓网动态检测数据中提取弓网接触力数据,所述弓网接触力数据包括四个通道的接触力数据、速度数据和公里标数据;
将提取出来的弓网接触力数据进行离散小波分解得到第一层小波系数;
对第一层小波系数进行高频分量的提取,获得弓网接触力数据高频分量。
4.如权利要求2所述的弓网接触力区段异常识别方法,其特征在于,对第一层小波系数进行高频分量的提取,获得弓网接触力数据高频分量,包括:
对弓网接触力数据通过低通滤波器得到第一层低频系数,通过高通滤波器得到第一层高频系数;
根据第一层低频系数、第一层高频系数,获得弓网接触力数据高频分量。
6.如权利要求1所述的弓网接触力区段异常识别方法,其特征在于,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,包括:
将历史弓网接触力数据高频分量划分为多个区段;
计算每个区段的滑动标准差,确定每个区段的级频数;
根据每个区段的级频数,确定每个区段的频数;
根据多个区段的频数,构建概率密度分布。
8.如权利要求1所述的弓网接触力区段异常识别方法,其特征在于,根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置,包括:
将待分析的弓网接触力数据高频分量划分为多个区段;
对每个区段,若该区段的滑动标准差大于所述标准差阈值,将该区段标记为正常区段,否则,将该区段标记为异常区段;
对标记的异常区段进行一阶差分,确定标记的异常区段的起止位置;
对标记了起止位置且满足预设条件的异常区段进行合并;
对合并的异常区段进行起止位置调整,获得调整好的弓网接触力异常区段起止位置。
9.如权利要求1所述的弓网接触力区段异常识别方法,其特征在于,对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别,包括:
对弓网接触力数据高频分量的滑动标准差进行Z-score标准化处理;
计算Z-score标准化处理后的滑动标准差的偏度和峰度;
根据所述偏度和峰度,将Z-score标准化处理后的滑动标准差进行聚类;
根据聚类结果,确定弓网接触力区段异常类别。
11.如权利要求9所述的弓网接触力区段异常识别方法,其特征在于,根据所述偏度和峰度,将Z-score标准化处理后的滑动标准差进行聚类,包括:
根据所述偏度和峰度,确定最优簇心数量;
根据所述偏度和峰度、最优簇心数量,将弓网接触力数据高频分量的滑动标准差进行聚类。
12.如权利要求11所述的弓网接触力区段异常识别方法,其特征在于,根据所述偏度和峰度,确定最优簇心数量,包括:
根据所述偏度和峰度,确定不同簇心数量下的特征聚类轮廓系数:
确定最接近于1的特征聚类轮廓系数对应的簇心数量为最优簇心数量。
14.一种弓网接触力区段异常识别装置,其特征在于,包括:
弓网接触力数据高频分量获得模块,用于从待分析的弓网动态检测数据提取待分析的弓网接触力数据高频分量;
标准差阈值确定模块,用于从历史弓网动态检测数据中提取历史弓网接触力数据高频分量,对历史弓网接触力数据高频分量的滑动标准差构建概率密度分布,从构建的概率密度分布中确定滑动标准差阈值;
异常区段起止位置确定模块,用于根据待分析的弓网接触力数据高频分量的滑动标准差和所述滑动标准差阈值,确定弓网接触力异常区段起止位置;
异常类别确定模块,用于对弓网接触力数据高频分量的滑动标准差进行特征聚类,确定弓网接触力区段异常类别。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13任一项所述方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至13任一项所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110752582.9A CN113483931B (zh) | 2021-07-02 | 2021-07-02 | 弓网接触力区段异常识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110752582.9A CN113483931B (zh) | 2021-07-02 | 2021-07-02 | 弓网接触力区段异常识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113483931A CN113483931A (zh) | 2021-10-08 |
CN113483931B true CN113483931B (zh) | 2023-01-24 |
Family
ID=77939724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110752582.9A Active CN113483931B (zh) | 2021-07-02 | 2021-07-02 | 弓网接触力区段异常识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113483931B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117571184B (zh) * | 2024-01-17 | 2024-03-19 | 四川省公路规划勘察设计研究院有限公司 | 一种基于滑窗和聚类分析的桥梁结构索力识别方法及设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2001264610A1 (en) * | 2000-05-16 | 2002-02-14 | Children's Mercy Hospital | Single copy genomic hybridization probes and method of generating same |
JP2013205270A (ja) * | 2012-03-29 | 2013-10-07 | Railway Technical Research Institute | パンタグラフの異常検知方法 |
CN104634493A (zh) * | 2015-01-12 | 2015-05-20 | 西南交通大学 | 一种电气化铁路弓网接触压力不平顺诊断和定位方法 |
CN105403242A (zh) * | 2015-05-22 | 2016-03-16 | 华东交通大学 | 一种机车弓网硬点光电振动综合检测与gps定位方法及系统 |
JP2017175846A (ja) * | 2016-03-25 | 2017-09-28 | 公益財団法人鉄道総合技術研究所 | パンタグラフ異常検知方法及び検知装置 |
CN107655603A (zh) * | 2017-08-31 | 2018-02-02 | 六禾(厦门)智能科技有限公司 | 一种电力设备的智能化检测系统及其使用方法 |
CN110987348A (zh) * | 2019-12-19 | 2020-04-10 | 中国国家铁路集团有限公司 | 基于弓网动态响应的接触网硬点确定方法及装置 |
CN112414694A (zh) * | 2020-06-12 | 2021-02-26 | 北京航空航天大学 | 基于多元状态估计技术的设备多级异常状态识别方法及装置 |
CN112924071A (zh) * | 2021-02-08 | 2021-06-08 | 中车青岛四方机车车辆股份有限公司 | 受电弓接触力载荷处理方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NZ539223A (en) * | 2000-05-16 | 2006-10-27 | Childrens Mercy Hospital | Single copy genomic hybridization probes and method of generating same |
-
2021
- 2021-07-02 CN CN202110752582.9A patent/CN113483931B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2001264610A1 (en) * | 2000-05-16 | 2002-02-14 | Children's Mercy Hospital | Single copy genomic hybridization probes and method of generating same |
JP2013205270A (ja) * | 2012-03-29 | 2013-10-07 | Railway Technical Research Institute | パンタグラフの異常検知方法 |
CN104634493A (zh) * | 2015-01-12 | 2015-05-20 | 西南交通大学 | 一种电气化铁路弓网接触压力不平顺诊断和定位方法 |
CN105403242A (zh) * | 2015-05-22 | 2016-03-16 | 华东交通大学 | 一种机车弓网硬点光电振动综合检测与gps定位方法及系统 |
JP2017175846A (ja) * | 2016-03-25 | 2017-09-28 | 公益財団法人鉄道総合技術研究所 | パンタグラフ異常検知方法及び検知装置 |
CN107655603A (zh) * | 2017-08-31 | 2018-02-02 | 六禾(厦门)智能科技有限公司 | 一种电力设备的智能化检测系统及其使用方法 |
CN110987348A (zh) * | 2019-12-19 | 2020-04-10 | 中国国家铁路集团有限公司 | 基于弓网动态响应的接触网硬点确定方法及装置 |
CN112414694A (zh) * | 2020-06-12 | 2021-02-26 | 北京航空航天大学 | 基于多元状态估计技术的设备多级异常状态识别方法及装置 |
CN112924071A (zh) * | 2021-02-08 | 2021-06-08 | 中车青岛四方机车车辆股份有限公司 | 受电弓接触力载荷处理方法及装置 |
Non-Patent Citations (2)
Title |
---|
弓网动态接触压力测量方法研究;王亚春等;《铁道技术监督》;20141215(第12期);41-43 * |
弓网接触力缺陷特征与诊断研究;杨志鹏;《电气化铁道》;20181231;27-30 * |
Also Published As
Publication number | Publication date |
---|---|
CN113483931A (zh) | 2021-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110197588B (zh) | 一种基于gps轨迹数据的大货车驾驶行为评估方法及装置 | |
CN107451004B (zh) | 一种基于定性趋势分析的道岔故障诊断方法 | |
WO2017036363A1 (zh) | 光纤周界入侵信号的识别方法、装置及周界入侵报警系统 | |
CN105834835A (zh) | 一种基于多尺度主元分析的刀具磨损在线监测方法 | |
CN112232447A (zh) | 一种电力设备状态监测数据的完整样本集的构建方法 | |
CN109917777B (zh) | 基于混合多采样率概率主成分分析模型的故障检测方法 | |
CN112414694B (zh) | 基于多元状态估计技术的设备多级异常状态识别方法及装置 | |
CN113188807B (zh) | 一种abs结果自动判定算法 | |
CN115409131B (zh) | 基于spc过程管控系统的生产线异常检测方法 | |
CN110717472B (zh) | 基于改进的小波阈值去噪的故障诊断方法及系统 | |
CN113483931B (zh) | 弓网接触力区段异常识别方法及装置 | |
CN108168924B (zh) | 一种基于vmd和mfss模型的往复压缩机寿命预测方法 | |
CN113065702B (zh) | 基于st-seep分段法和时空arma模型的滑坡位移多线性预测方法 | |
CN113689594A (zh) | 一种新的汽车行驶工况构造方法 | |
CN106682835A (zh) | 一种数据驱动的复杂机电系统服役质量状态评估方法 | |
CN113610188A (zh) | 弓网接触力非区段异常识别方法及装置 | |
CN111353640B (zh) | 一种组合法风速预测模型构建方法 | |
CN111291918B (zh) | 平稳子空间外源矢量自回归的旋转机械退化趋势预测方法 | |
CN115409066A (zh) | 时间序列数据的异常检测方法、装置及计算机存储介质 | |
CN114871850A (zh) | 一种基于振动信号和bp神经网络的刀具磨损状态评估方法 | |
CN115859777A (zh) | 一种多故障模式下产品系统寿命预测的方法 | |
CN113283546B (zh) | 加热炉完整性管理集控装置的炉况异常报警方法及系统 | |
CN115206088A (zh) | 考虑动态交通流的城市快速路交通事故风险量化评估方法 | |
CN114563671A (zh) | 一种基于CNN-LSTM-Attention神经网络的高压电缆局部放电诊断方法 | |
CN115310499B (zh) | 一种基于数据融合的工业设备故障诊断系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |