CN113609934A

CN113609934A - 基于后缀树的故障信号特征提取方法、系统、装置及介质

Info

Publication number: CN113609934A
Application number: CN202110823448.3A
Authority: CN
Inventors: 岳夏; 王亚东; 张春良; 翁润庭; 朱厚耀; 李植鑫; 陆凤清
Original assignee: Guangzhou University
Current assignee: Guangzhou University
Priority date: 2021-07-21
Filing date: 2021-07-21
Publication date: 2021-11-05
Anticipated expiration: 2041-07-21
Also published as: CN113609934B

Abstract

本发明公开了一种基于后缀树的故障信号特征提取方法、系统、装置及介质，方法包括：获取待诊断的第一故障信号，对第一故障信号进行编码得到第一时域信号；通过后缀树算法对第一时域信号进行分解，得到多个故障波形信息和对应的时刻信息，根据故障波形信息和时刻信息构建第一后缀树；对第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，确定故障重复波形的重复时间序列；根据故障重复波形和/或重复时间序列确定第一故障信号的故障信号特征。本发明获取故障重复波形和重复时间序列两个不同尺度的信息，避免了傅里叶算法的混叠现象产生的误差，提高了故障信号特征提取的准确性和可靠性，可广泛应用于故障检测技术领域。

Description

基于后缀树的故障信号特征提取方法、系统、装置及介质

技术领域

本发明涉及故障检测技术领域，尤其是一种基于后缀树的故障信号特征提取方法、系统、装置及介质。

背景技术

现如今，对滚动轴承的故障诊断分析大多基于振动信号，而振动信号具有非线性、非平稳性等特点，利用它可获取充分表达信号特征的信息。现有技术中，对于振动信号的处理，一般采用傅里叶变换等进行时频转化方法，例如基于Daubechies小波变换的滚动轴承故障特征提取方法。这种方法在处理过程中会出现混叠现象从而产生误差，且该类误差由傅里叶算法原理产生，不可避免。

发明内容

本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。

为此，本发明实施例的一个目的在于提供一种基于后缀树的故障信号特征提取方法，该方法通过对时域信号进行分解，获取故障重复波形和重复时间序列两个不同尺度的信息，避免了傅里叶算法的混叠现象产生的误差，提高了故障信号特征提取的准确性，且故障重复波形和重复时间序列均可直接与动力学模型分析结果相结合，极大地增加了故障信号特征提取的可靠性。

本发明实施例的另一个目的在于提供一种基于后缀树的故障信号特征提取系统。

为了达到上述技术目的，本发明实施例所采取的技术方案包括：

第一方面，本发明实施例提供了一种基于后缀树的故障信号特征提取方法，包括以下步骤：

获取待诊断的第一故障信号，并对所述第一故障信号进行编码得到第一时域信号；

通过后缀树算法对所述第一时域信号进行分解，得到多个故障波形信息和对应的时刻信息，并根据所述故障波形信息和所述时刻信息构建第一后缀树；

对所述第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定所述故障重复波形的重复时间序列；

根据所述故障重复波形和/或所述重复时间序列确定所述第一故障信号的故障信号特征。

进一步地，在本发明的一个实施例中，所述对所述第一故障信号进行编码得到第一时域信号这一步骤，其具体为：

根据所述第一故障信号的幅值区间，通过平均分布或高斯分布按照预设的编码位数对所述第一故障信号进行残差编码，得到第一时域信号。

进一步地，在本发明的一个实施例中，所述对所述第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定所述故障重复波形的重复时间序列这一步骤，其具体包括：

从所述第一后缀树的根节点开始，通过深度优先的嵌套遍历算法对所述第一后缀树的各个节点进行遍历；

获取重复出现的故障波形信息作为故障重复波形，并确定所述故障重复波形对应的多个时刻信息；

根据所述故障重复波形对应的多个时刻信息确定所述故障重复波形的重复时间序列。

进一步地，在本发明的一个实施例中，所述通过深度优先的嵌套遍历算法对所述第一后缀树的各个节点进行遍历这一步骤，其具体包括：

创建与所述第一时域信号等长的重复时刻存储数组；

创建与所述第一后缀树的非叶节点数量一致的重复特征记录数组；

运行Depth_First嵌套函数，输入节点编号和父节点重复波形长度，输出重复时刻起始位置、重复波形长度、波形重复次数、节点重复字符串长度以及多个重复时刻；

其中，所述重复特征记录数组用于存储所述重复时刻起始位置、所述重复波形长度、所述波形重复次数以及所述节点重复字符串长度，所述重复时刻存储数组用于存储所述重复时刻。

进一步地，在本发明的一个实施例中，所述根据所述故障重复波形和/或所述重复时间序列确定所述第一故障信号的故障信号特征这一步骤，其具体为：

将所述故障重复波形作为所述第一故障信号的故障信号特征输出；

或，

将所述重复时间序列作为所述第一故障信号的故障信号特征输出；

或，

将多个所述重复时间序列的集合运算结果作为所述第一故障信号的故障信号特征输出，所述集合运算包括交集运算、并集运算以及补集运算中至少之一；

或，

根据所述故障重复波形和所述重复时间序列形成第一特征向量，并将所述第一特征向量作为所述第一故障信号的故障信号特征输出。

进一步地，在本发明的一个实施例中，所述故障信号特征提取方法还包括以下步骤：

获取超过预设的重复次数阈值的故障重复波形的最大重复长度，当所述最大重复长度大于等于预设的长度阈值且残差编码的次数小于等于预设的编码次数阈值，对残差编码的参数进行更新后再进行残差编码。

进一步地，在本发明的一个实施例中，所述故障信号特征提取方法还包括故障信号特征的可视化步骤，其具体为：

根据预设的重复长度范围，对所述故障重复波形和所述重复时间序列进行归一化处理，得到故障信号特征的可视化图像；

其中，所述可视化图像的横坐标表示时刻信息，所述可视化图像的纵坐标表示重复波形长度，所述可视化图像的像素点的色彩值表示对应时刻的数据在对应重复波形长度的故障重复波形中的参与程度。

第二方面，本发明实施例提出了一种基于后缀树的故障信号特征提取系统，包括：

第一时域信号确定模块，用于获取待诊断的第一故障信号，并对所述第一故障信号进行编码得到第一时域信号；

第一后缀树构建模块，用于通过后缀树算法对所述第一时域信号进行分解，得到多个故障波形信息和对应的时刻信息，并根据所述故障波形信息和所述时刻信息构建第一后缀树；

故障重复波形和重复时间序列确定模块，用于对所述第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定所述故障重复波形的重复时间序列；

故障信号特征确定模块，用于根据所述故障重复波形和/或所述重复时间序列确定所述第一故障信号的故障信号特征。

第三方面，本发明实施例提供了一种基于后缀树的故障信号特征提取装置，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行时，使得所述至少一个处理器实现上述的一种基于后缀树的故障信号特征提取方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其中存储有处理器可执行的程序，所述处理器可执行的程序在由处理器执行时用于执行上述的一种基于后缀树的故障信号特征提取方法。

本发明的优点和有益效果将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到：

本发明实施例获取待诊断的第一故障信号，并对第一故障信号进行编码得到第一时域信号，然后通过后缀树算法对第一时域信号进行分解得到多个故障波形信息和对应的时刻信息，并构建第一后缀树，再对第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定重复时间序列，从而根据故障重复波形和重复时间序列确定第一故障信号的故障信号特征。本发明实施例通过对时域信号进行分解，获取故障重复波形和重复时间序列两个不同尺度的信息，避免了傅里叶算法的混叠现象产生的误差，提高了故障信号特征提取的准确性，且故障重复波形和重复时间序列均可直接与动力学模型分析结果相结合，极大地增加了故障信号特征提取的可靠性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面对本发明实施例中所需要使用的附图作以下介绍，应当理解的是，下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例，对于本领域的技术人员来说，在无需付出创造性劳动的前提下，还可以根据这些附图获取到其他附图。

图1为本发明实施例提供的一种基于后缀树的故障信号特征提取方法的步骤流程图；

图2为本发明实施例提供的第一位置的后缀树示意图；

图3为本发明实施例提供的第二位置的后缀树示意图；

图4为本发明实施例提供的第三位置的后缀树示意图；

图5为本发明实施例提供的第四位置的后缀树示意图；

图6为本发明实施例提供的第五位置的后缀树示意图；

图7为本发明实施例提供的第六位置的后缀树的第一示意图；

图8为本发明实施例提供的第六位置的后缀树的第二示意图；

图9为本发明实施例提供的第六位置的后缀树的后缀连接示意图；

图10为本发明实施例提供的第六位置的后缀树的第三示意图；

图11为本发明实施例提供的第七位置的后缀树示意图；

图12为本发明实施例提供的第八位置的后缀树示意图；

图13为本发明实施例提供的第九位置的后缀树示意图；

图14为本发明实施例提供的第十位置的后缀树的第一示意图；

图15为本发明实施例提供的第十位置的后缀树的第二示意图；

图16为本发明实施例提供的第十位置的后缀树的第三示意图；

图17为本发明实施例提供的第十位置的后缀树的第四示意图；

图18为本发明实施例提供的第十位置的后缀树的第五示意图；

图19为本发明实施例提供的完整分解示意图；

图20为本发明实施例提供的叶节点顺序示意图；

图21为本发明实施例提供的一种基于后缀树的故障信号特征提取系统的结构框图；

图22为本发明实施例提供的一种基于后缀树的故障信号特征提取装置的结构框图。

具体实施方式

下面详细描述本发明的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。对于以下实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

在本发明的描述中，多个的含义是两个或两个以上，如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。此外，除非另有定义，本文所使用的所有的技术和科学术语与本技术领域的技术人员通常理解的含义相同。

参照图1，本发明实施例提供了一种基于后缀树的故障信号特征提取方法，具体包括以下步骤：

S101、获取待诊断的第一故障信号，并对第一故障信号进行编码得到第一时域信号；

具体地，运用传感器采集待诊断的第一故障信号f(n)，n为采样点数。单次处理的数据量要求至少包含2个关注信号的完整周期，一般应达到关注特征周期的3～5倍以上，以获取更多的故障重复特征。

进一步作为可选的实施方式，对第一故障信号进行编码得到第一时域信号这一步骤，其具体为：

根据第一故障信号的幅值区间，通过平均分布或高斯分布按照预设的编码位数对第一故障信号进行残差编码，得到第一时域信号。

具体地，按照待诊断的第一故障信号的幅值区间，依照平均分布或者高斯分布按预设编码位数对第一故障信号进行编码。

按照平均分布对第一故障信号进行编码的公式如下：

C₁(n)＝Int[(f(n)-f_1，min)*L_code/(f_1，max-f_1，min)]

按照高斯分布对第一故障信号进行编码的公式如下：

C₁(n)＝Int[IGD((f(n)-μ₁)/σ₁)*L_code]

其中，C₁(n)为n次采样数据对应的第一码带的编码值，也即第一时域信号，Int()为取整函数，L_code为预设的编码位数，f_1,max为第一故障信号的值域最大值，也即第一码带编码时的值域最大值，f_1,min为第一故障信号的值域最小值，也即第一码带编码时的值域最小值；μ₁为第一码带高斯分布均值，σ₁为第一码带的高斯分布方差，IGD为标准正态分布积分概率查表返回函数。

同时获得残差信号R₁(n)：R₁(n)＝f(n)-C₁(n)。

S102、通过后缀树算法对第一时域信号进行分解，得到多个故障波形信息和对应的时刻信息，并根据故障波形信息和时刻信息构建第一后缀树；

具体地，将编码后的C₁(n)进行后缀树重建。后缀树构建过程中遵循三个传递规则：

Relu1：当向根节点root插入新后缀时使用。active_node保持为root，active_edge被设置为即将被插入的新后缀的首字符，active_length减1。

Relu2：分裂(Split)一条边并且插入(Insert)一个新的节点时，如果该新节点不是当前步骤中创建的第一个节点，则将先前插入的节点与该新节点通过一个特殊的指针连接，称为后缀连接(Suffix Link)，在图示中通常以虚线绘制。

Relu3：当从active_node不为根节点root的节点分裂边时，沿着后缀连接(SuffixLink)的方向寻找节点，如果存在一个节点，则设置该节点为active_node；如果不存在，则设置active_node为root。active_edge和active_length保持不变。

下面对本发明实施例采用的后缀树算法进行介绍。存在一个原始数据列T＝t₁t₂...t_n，其中t_i(1≤i≤n+1)，n为数据长度，欲从t₁到t_n将原始数据依次分解为n+1个不重复子序列，第n+1个子序列为规定的终止符，用‘#’表示。为便于表达，相关符号说明如下：

O：(root)根节点，序列起点，无具体意义；

P：(acitve_piont)活动点，指定活动起始点；

N：(active_node)活动节点，指定某一子节点；

E：(active_edge)活动边，指定序列连接方向；

L：(active_edge)活动长度，指定序列移动的数据量；

R：(remainder)剩余后缀数，指明未连接的后缀的数目；

#：终止符；

Street(T)：最终分解结果。

从根节点O开始，从左到右依次分解原始数据序列，直到产生第n+1个序列。如下式：

STree(T)＝(F_i,f_i,g_i),i∈[1,n]

其中，F_i表示主边序列，f_i表示子边序列，g_i表示数据i的连接方式，包括活动点P和剩余后缀数R的取值。当数据处于t_i(1≤i≤n)位置时，通过如下传递方式，完成各条边的连接。

1)i＝1时

P₁＝(O,'F₁',1)，R＝1。起始位置选定根节点O；活动边E设为‘F₁’；活动长度L和剩余后缀数R设置为1，表明只需传入一个数据量。STree(T¹)＝(F₁,g₁)。

2)i＞1时

①

即t_i为STree(T^i-1)后新出现的数据，设置P_i＝(O,'F₁',i)，R＝i。直接连接在全部主边之后，从F₁开始迭代更新P_ik＝(O,'F_k',i-k+1)，其中k表示主边数目，k∈(0,i]，k＝k+1,R＝R-1，直至i＝k，停止更新P_ik。在对已有边进行延展后，创建一个新的主序列F^k+1，以根节点O作为起始点，以t_i作为其第一条边。STree(Tⁱ)＝(F_i,g_i)。

②t_i∈T^i-1，即t_i已经在前缀中出现，被视为重复数据。从主链F₁的第一个数据t₀开始，寻找与t_i重复的数据出现的位置，取j表示边长L。设置P_i＝(O,'F₁',j)，R＝1。由于未知t_i+1的数据特点，暂时只能取定活动点P_i和剩余后缀数R，并不能给出具体的数据序列的方向。由j可断定所有前j个主链中均存在与t_i重复的数据，因此，j从1开始，迭代更新P_ij＝(O,'F_j',i-j)，L∈(0,j]，L＝L-1，R＝1，每次更新中，主边续接t_i，R值不变，恒为1，只对t_i这一个数据量进行操作。此步骤可参考规则1，活动点为根节点，活动边设置为新后缀的初始数据，操作一次后，活动边长减1。该过程未创建新边。活动点的更新用于连接后缀数据，不能作为创建新边的标准。

③在第②步的前提下，创建子序列f_i，f_i均以活动点P_ij为起点，从主边F_j中分离，沿用主边F_j的前缀数据。子序列f_i中导入数据同主边F_j一致，将数据t_i续接在序列后即可。STree(Tⁱ)＝(F_i,f_i,g_i),i<n。

④建立后缀连接(Suffix Link)。重复数据t_i出现后，每一主边均会产生一个或多个子边节点P_Fi，如果该节点不是当前数据插入过程中创建的第一个节点P_F1，则将先前插入的节点与该新节点通过一个特殊的指针连接，称为后缀连接。

⑤当从N不为根节点O的节点分裂边时，沿着后缀连接(Suffix Link)的方向寻找节点，如果存在一个节点，则设置该节点为N；如果不存在，则设置N为O。E和L保持不变。

⑥循环上述②-⑤步，直到i＝n时，完成了所有数据的分解。

下面以创建abcabxabcd字符串的后缀树结构为例对本发明实施例的构建的后缀树做进一步说明。

(1)第一位置：从最左边的字符‘a’开始，创建一个根节点到叶节点的边，标签为[0,#]，表明子串序号从0开始，结尾在当前的结尾处，‘#’仅仅作为结尾符，表示末尾位置。

如图2所示为本发明实施例提供的第一位置的后缀树示意图，图中空心点表示根节点root，实心点表示该边终止符，[0,#]表示起始边的标签。

(2)第二位置：左边起第一个字符‘b’，由于a≠b，在扩展已有边a的同时，创建新边b。

如图3所示为本发明实施例提供的第二位置的后缀树示意图，ab边的标签依旧为[0,#]，和步骤(1)表示方法相同，但表示的含义发生改变，‘#’已经由第一位置更改到第二位置。b作为新的边，标签为[1,#]。

(3)第三位置：第一个字符‘c’，由于c≠a且c≠b，在给已有边增加位置的同时创建表示新后缀的边c。边c的标签值[2,#]。

如图4所示为本发明实施例提供的第三位置的后缀树示意图，每一个步骤增加一个单字符，工作量为O(1)，改变已有边的终止位置，或增加新边，因此，对于长度为n的字符串而言，时间复杂度为O(n)。

(4)第四位置：由原始字符串不难看出，从第四位置开始产生了重复字符。重复字符出现时，不再向根节点引出新边，而是在已有后缀中将其作为中间位置。第四位置已经出现在‘abca’开始的边中，设置活动点为(root,‘a’,1)，表示活动点是在根节点root开始，以‘a’向外指向该边的一个位置。剩余后缀数变为2。

如图5所示为本发明实施例提供的第四位置的后缀树示意图。

(5)第五位置：第二个字符‘b’，由于剩余后缀数的值为2，需要插入两个后缀‘ab’和‘b’。修改活动点为(root,‘a’,2)，将活动点位置移向第一个‘b’之后，剩余后缀数为3。该步骤中，依旧未创建新边。

如图6所示为本发明实施例提供的第五位置的后缀树示意图，‘ab’和‘b’均是重复子串，存在于[0,#]边的前缀中，对于后者‘b’，不考虑其插入状况，因为它的每一个后缀均会出现在[1,#]边中。

(6)第六位置：第一个字符‘x’。‘x’为插入的新字符，需要创建新边x，其标签为[3,#]。由于在当前位置时剩余后缀数的值为3，结合前面的重复字符，需要插入3个最终后缀‘abx’、‘bx’和‘x’。活动点位置在重复字符串‘ab’之后，插入一个内部节点处理‘abx’，remainder减为2。如图7所示为本发明实施例提供的第六位置的后缀树的第一示意图。

继续插入下一个后缀‘bx’,此处需参见Relu1。新的活动点为(root,‘b’,1)，活动点重新回到根节点，活动边选定为‘bx’的首字母b开始的边[1,#]，活动长度为1。再检查‘x’字符是否重复出现，可参考第二个‘a’字符的处理方式。该序列中第一次出现字符‘x’，需要分裂边并重新插入新的边x，标签为[3,#]。并将remainder更新为1，此时活动点为(root,‘x’,0)。如图8所示为本发明实施例提供的第六位置的后缀树的第二示意图。

如图9所示为本发明实施例提供的第六位置的后缀树的后缀连接示意图，后缀连接通过一条虚线来表示。如图10所示为本发明实施例提供的第六位置的后缀树的第三示意图。活动点的长度值为0，[3,#]边连接在根节点root上。

(7)第七位置：第三个字符‘a’，由于处于重复状态，仅更新active_point和remainder即可。活动点为(root,‘a’,1)，remainder＝2。如图11所示为本发明实施例提供的第七位置的后缀树示意图。

(8)第八位置：第三个字符‘b’，仍为重复状态，仅更新active_point和remainder。此时称ab边的节点为node1。活动点为(root,‘a’,2)，remainder＝3。如图12所示为本发明实施例提供的第八位置的后缀树示意图。

(9)第九位置：第二个字符‘c’，仍为重复状态，remainder为3，存在三个后缀，‘abc’、‘bc’和‘c’，活动点为(node1,‘c’,1)，remainder＝4。如图13所示为本发明实施例提供的第九位置的后缀树示意图。

(10)第十位置：第一个‘d’字符，当前remainder值为4，需插入四个后缀，‘abcd’、‘bcd’、‘cd’和‘d’。如图14所示为本发明实施例提供的第十位置的后缀树的第一示意图。

‘abcd’序列插入完成，remainder减为3。当节点分裂时，参看Relu1。活动点变化为(node2,‘c’,1)。开始处理下一个剩余后缀‘bcd’。需要将边‘cabxabcd’分裂，然后插入新的边d。根据Rule 2，需要在之前插入的节点与当前插入的节点间创建一条新的后缀连接。如图15所示为本发明实施例提供的第十位置的后缀树的第二示意图。

后缀连接(Suffix Link)能够重置活动点，使得对下一个后缀的插入操作仅需O(1)时间。从图15也可以看出‘ab’连接的是其后缀‘b’，而‘abc’连接的是其后缀‘bc’。

当前操作并没有完成，remainder是2，根据Rule3需要重新设置活动点。因为图15中的node2没有后缀连接(Suffix Link)，所以活动点被设置为root，也就是(root,‘c’,1)。remainder＝2。下一个插入操作‘cd’将从Root开始，寻找以‘c’为前缀的边‘cabxabcd’,引出下一次分裂。

如图16所示为本发明实施例提供的第十位置的后缀树的第三示意图，由于此处又创建了一个新的内部节点，依据Rule2，建立一条与前一个被创建内节点的后缀连接。

如图17所示为本发明实施例提供的第十位置的后缀树的第四示意图。remainder减为1，active_node为root，根据Rule1则活动点为(root,‘d’,0)。也就是说，仅需在根节点上插入一条‘d’新边。活动点为(root,‘d’,0)，remainder＝1。

如图18所示为本发明实施例提供的第十位置的后缀树的第五示意图，整个分解过程已经完成，加入终止符和子串序号。

如图19所示为本发明实施例提供的完整分解示意图，图19中分别展示了叶节点(数字)也非叶节点(三角形数字)各自创建的编号。

加入终止符后，总共分成11个子串，如下表1所示：

序号	字符串	类
			1	abcabxabcd#	主边
2	bcabxabcd#	主边
			3	cabxabcd#	主边
4	abxabcd#	子边
			5	bxabcd#	子边
6	xabcd#	主边
			7	abcd#	子边
8	bcd#	子边
			9	cd#	子边
10	d#	主边
			11	#	子边

表1

由表1可以清晰看出，原字符串可分解为若干个不重复子串，子串所能携带的信息量也不尽相同。后缀树分解，仅仅是对原数据的处理，完成了数据编码的再编排过程，以牺牲存储量来换取特征数据段的读取时间，完整保留了所有数据信号。

S103、对第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定故障重复波形的重复时间序列；

具体地，从根节点开始，利用深度优先的嵌套遍历算法获取重复性波形及其重复时刻作为故障特征。步骤S103具体包括以下步骤：

S1031、从第一后缀树的根节点开始，通过深度优先的嵌套遍历算法对第一后缀树的各个节点进行遍历；

S1032、获取重复出现的故障波形信息作为故障重复波形，并确定故障重复波形对应的多个时刻信息；

S1033、根据故障重复波形对应的多个时刻信息确定故障重复波形的重复时间序列。

进一步作为可选的实施方式，通过深度优先的嵌套遍历算法对第一后缀树的各个节点进行遍历这一步骤，其具体包括：

A1、创建与第一时域信号等长的重复时刻存储数组；

A2、创建与第一后缀树的非叶节点数量一致的重复特征记录数组；

A3、运行Depth_First嵌套函数，输入节点编号和父节点重复波形长度，输出重复时刻起始位置、重复波形长度、波形重复次数、节点重复字符串长度以及多个重复时刻；

其中，重复特征记录数组用于存储重复时刻起始位置、重复波形长度、波形重复次数以及节点重复字符串长度，重复时刻存储数组用于存储重复时刻。

具体地，算法伪代码如下：

Depth_First嵌套函数(简写为DF)：

输入：节点编号nNodeID，父节点重复波形长度nFatherNodeRepeatLength；

输出：重复时刻起始位置，重复波形长度nNodeRepeatLength，波形重复次数nWRIndex，重复时刻存储数组(全局变量)；

1：重复波形长度＝当前节点字符长度+父节点重复波形长度

2：记录节点重复时刻起始位置

3：按照节点编号访问该节点的第一个子节点

4：波形重复次数＝0

5：repeat

6：if子节点是非叶节点

7：递归调用子节点DF函数，获取子节点波形重复次数

8：波形重复次数＝波形重复次数+子节点波形重复次数

9：else//子节点是叶节点

10：波形重复次数＝波形重复次数+1

11：将叶节点编号填入重复时刻存储数组

12：end if

13：until所有子节点均已访问

14：return重复波形长度

深度优先算法：

1：创建与待处理信号等长的重复时刻存储数组；

2：创建与非叶节点数量一致的重复特征记录数组，包含如下信息：{重复波形字符串终止地址，节点重复字符串长度，重复时刻起始位置，波形重复次数}；

3：运行DF(根节点编号，0)//父节点重复波形长度为0；

4：获得故障的特征波形与对应重复时间序列的特征。

时频特征提取算法将后缀树算法中创建的节点仅遍历了一次。由于后缀树算法的复杂度为O(n)，所以时频特征提取算法的复杂度同样是O(n)。

下面以abcabxabcd字符串的后缀树结构为例，进一步说明本发明实施例时频特征提取算法的基本原理。

DF函数递归调用顺序如图20所示，依次为DF(0,0)，DF(1,0)，DF(3,2)，DF(4,1)，DF(2,0)，DF(5,0)，DF(0,0)，每条主边中，访问完叶节点均需回到父节点处，等待下一次节点搜索。

根据图18中非叶节点次序完成子序列特征数组，分解结果见表2，表3。

1	2	3	4	5	6	7	8	9	10	11
											a	b	c	a	b	x	a	b	c	d	#
1	7	4	2	8	5	3	9	6	10	11

表2

表2第1行为原字符串‘abcabxabcd’各字符编号，第2行为原字符串，第3行为提取后的重复性特征分解序列，其值对应图18中所示叶节点编号，也对应值所示采样点的时刻。该数组的存储量与原始数据长度一致，其最后一位始终对应字符串终止符，该位可以没有。

表3

表3中记录了每一个非叶节点的重复特征数组信息，包括重复特征波形终止点，重复特征波形长度ReLen，重复时间特征向量起始点Start_RTV，重复次数RepTimes。为了便于理解，表3中添加了节点编号NUM与节点字符串Node_str。表3中节点编号与节点字符串均与图18中标注一致，均可由后缀树算法直接获取。

S104、根据故障重复波形和/或重复时间序列确定第一故障信号的故障信号特征。

进一步作为可选的实施方式，根据故障重复波形和/或重复时间序列确定第一故障信号的故障信号特征这一步骤，其具体为：

将故障重复波形作为第一故障信号的故障信号特征输出；

或，

将重复时间序列作为第一故障信号的故障信号特征输出；

或，

将多个重复时间序列的集合运算结果作为第一故障信号的故障信号特征输出，集合运算包括交集运算、并集运算以及补集运算中至少之一；

或，

根据故障重复波形和重复时间序列形成第一特征向量，并将第一特征向量作为第一故障信号的故障信号特征输出。

具体地，对输出的故障信号特征的说明如下：

输出故障特征包含重复波形与重复时间序列两个信息。如表3中重复特征波形长度ReLen最大为3，对应重复特征波形终止点W_End为3，因此该特征的波形为表2第2行前3位所示的“abc”，而对应的重复时间序列特征为表2第3行从重复时间特征向量起始点Start_RTV即第1位开始的共重复次数RepTimes的2个序列，即“1,7”。因此重复波形长度为3采样点的故障特征为：

{“abc”，“1,7”}

同理，重复长度为2的特征有：

{“ab”，“1,7,4”}、{“bc”，“2,8”}

重复特征波形与重复时间序列可单独或共同作为故障特征用于后续故障诊断。结合动力学模型，也可将多个重复时间序列的交、并集及其补集等集合运算结果作为故障特征。其中某时刻最大波形重复长度越长意味着该时刻附近更长时间内的数据结构稳定性越好。当干扰近似白噪声时，该时刻的瞬时频率也相对越低。反之某时刻最大波形重复长度越短，意味该时刻数据结构越不稳定，该时刻的瞬时信号也越接近于突变或冲击信号。

进一步作为可选的实施方式，故障信号特征提取方法还包括以下步骤：

获取超过预设的重复次数阈值的故障重复波形的最大重复长度，当最大重复长度大于等于预设的长度阈值且残差编码的次数小于等于预设的编码次数阈值，对残差编码的参数进行更新后再进行残差编码。

具体地，检验超过预设重复次数波形的最大重复长度，如该长度小于预设值或者残差分析次数i大于预设值则终止分析。如该长度大于等于预设值且残差分析次数i小于等于预设值，则对第i次残差信号R_i(n)继续执行分解。

其中残差编码时参数修正的规则如下：

如果依照平均分布进行编码，则采用下式更新上下限：

如果依照高斯分布进行编码，则：

a)可重新依照平均分布进行残差编码，同样采用上式更新上下限。

b)依然依照高斯分布编码，采用下式更新参数：

μ_i＝0

再利用下式进行残差编码：

C_i(n)＝Int[(IGD((R_i-1(n)-μ_i)/σ_i)-0.5)*2*L_code]

进一步作为可选的实施方式，故障信号特征提取方法还包括故障信号特征的可视化步骤，其具体为：

根据预设的重复长度范围，对故障重复波形和重复时间序列进行归一化处理，得到故障信号特征的可视化图像；

其中，可视化图像的横坐标表示时刻信息，可视化图像的纵坐标表示重复波形长度，可视化图像的像素点的色彩值表示对应时刻的数据在对应重复波形长度的故障重复波形中的参与程度。

具体地，当需要时可将重复性特征分解序列与重复特征记录数组进行可视化输出。图像中横纵坐标均为采样点或采样点对应的时间，纵坐标表示重复特征波形的长度，其值为对应时刻数据在该码带下不同长度重复结构中的参与程度，以此来可视化输入信号的故障信号特征。

以上对本发明的方法步骤进行了说明，本发明实施例通过对时域信号进行分解，获取故障重复波形和重复时间序列两个不同尺度的信息，避免了傅里叶算法的混叠现象产生的误差，提高了故障信号特征提取的准确性，且故障重复波形和重复时间序列均可直接与动力学模型分析结果相结合，极大地增加了故障信号特征提取的可靠性。

与现有技术相比，本发明实施例还具有以下优点：

1)本发明实施例直接对时域信号进行分解，获取故障重复波形与重复时间序列两个不同尺度的信息，获取特征的物理含义明确，可解释性强。

2)本发明实施例计算复杂度为O(n)，运行速度快，普通台式机单一码带的处理能力可达到1M采样点/秒，特别适合高采样频率、多通道数据处理等大规模数据实时处理时的特征提取。

3)故障重复波形与重复时间序列均可直接与动力学模型分析结果比对，适用于非平稳故障，极大地增加了故障特征的可靠性。

4)本发明实施例也可用于大规模数据的离线特征分析，为迁移学习、数据挖掘或者后续故障诊断提供支持。

参照图21，本发明实施例提供了一种基于后缀树的故障信号特征提取系统，包括：

第一时域信号确定模块，用于获取待诊断的第一故障信号，并对第一故障信号进行编码得到第一时域信号；

第一后缀树构建模块，用于通过后缀树算法对第一时域信号进行分解，得到多个故障波形信息和对应的时刻信息，并根据故障波形信息和时刻信息构建第一后缀树；

故障重复波形和重复时间序列确定模块，用于对第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定故障重复波形的重复时间序列；

故障信号特征确定模块，用于根据故障重复波形和/或重复时间序列确定第一故障信号的故障信号特征。

上述方法实施例中的内容均适用于本系统实施例中，本系统实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

参照图22，本发明实施例提供了一种基于后缀树的故障信号特征提取装置，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当上述至少一个程序被上述至少一个处理器执行时，使得上述至少一个处理器实现上述的一种基于后缀树的故障信号特征提取方法。

上述方法实施例中的内容均适用于本装置实施例中，本装置实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

本发明实施例还提供了一种计算机可读存储介质，其中存储有处理器可执行的程序，该处理器可执行的程序在由处理器执行时用于执行上述一种基于后缀树的故障信号特征提取方法。

本发明实施例的一种计算机可读存储介质，可执行本发明方法实施例所提供的一种基于后缀树的故障信号特征提取方法，可执行方法实施例的任意组合实施步骤，具备该方法相应的功能和有益效果。

本发明实施例还公开了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行图1所示的方法。

在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或上述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，上述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(R AM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印上述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得上述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的上述描述中，参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施方式，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明，但本发明并不限于上述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种基于后缀树的故障信号特征提取方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于后缀树的故障信号特征提取方法，其特征在于，所述对所述第一故障信号进行编码得到第一时域信号这一步骤，其具体为：

3.根据权利要求1所述的一种基于后缀树的故障信号特征提取方法，其特征在于，所述对所述第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定所述故障重复波形的重复时间序列这一步骤，其具体包括：

4.根据权利要求3所述的一种基于后缀树的故障信号特征提取方法，其特征在于，所述通过深度优先的嵌套遍历算法对所述第一后缀树的各个节点进行遍历这一步骤，其具体包括：

创建与所述第一时域信号等长的重复时刻存储数组；

5.根据权利要求1所述的一种基于后缀树的故障信号特征提取方法，其特征在于，所述根据所述故障重复波形和/或所述重复时间序列确定所述第一故障信号的故障信号特征这一步骤，其具体为：

或，

6.根据权利要求2所述的一种基于后缀树的故障信号特征提取方法，其特征在于，所述故障信号特征提取方法还包括以下步骤：

7.根据权利要求1至6中任一项所述的一种基于后缀树的故障信号特征提取方法，其特征在于，所述故障信号特征提取方法还包括故障信号特征的可视化步骤，其具体为：

8.一种基于后缀树的故障信号特征提取系统，其特征在于，包括：

9.一种基于后缀树的故障信号特征提取装置，其特征在于，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1至7中任一项所述的一种基于后缀树的故障信号特征提取方法。

10.一种计算机可读存储介质，其中存储有处理器可执行的程序，其特征在于，所述处理器可执行的程序在由处理器执行时用于执行如权利要求1至7中任一项所述的一种基于后缀树的故障信号特征提取方法。