CN117478148A - 基于模式分析的风电机组运行状态划分方法 - Google Patents

基于模式分析的风电机组运行状态划分方法 Download PDF

Info

Publication number
CN117478148A
CN117478148A CN202311785349.6A CN202311785349A CN117478148A CN 117478148 A CN117478148 A CN 117478148A CN 202311785349 A CN202311785349 A CN 202311785349A CN 117478148 A CN117478148 A CN 117478148A
Authority
CN
China
Prior art keywords
data
sequence
differential
time sequence
sensor time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202311785349.6A
Other languages
English (en)
Inventor
马少立
李桂民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Qianhai Intelliunion Technology Development Co ltd
Original Assignee
Shenzhen Qianhai Intelliunion Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Qianhai Intelliunion Technology Development Co ltd filed Critical Shenzhen Qianhai Intelliunion Technology Development Co ltd
Priority to CN202311785349.6A priority Critical patent/CN117478148A/zh
Publication of CN117478148A publication Critical patent/CN117478148A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • H03M7/3086Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing a sliding window, e.g. LZ77
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F03MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
    • F03DWIND MOTORS
    • F03D17/00Monitoring or testing of wind motors, e.g. diagnostics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/46Conversion to or from run-length codes, i.e. by representing the number of consecutive digits, or groups of digits, of the same kind by a code word and a digit indicative of that kind
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/70Wind energy
    • Y02E10/72Wind turbines with rotation axis in wind direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Sustainable Development (AREA)
  • Sustainable Energy (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Mechanical Engineering (AREA)
  • Indication And Recording Devices For Special Purposes And Tariff Metering Devices (AREA)

Abstract

本发明涉及数据压缩技术领域,尤其涉及一种基于模式分析的风电机组运行状态划分方法,该方法获取风电机组运行过程中的传感器时序数据;获取传感器时序数据的最佳周期,以最佳周期为步长对传感器时序数据进行差分处理,得到对应的差分序列;根据预设的可变步长对差分序列中的数据进行调整,得到差分调整数据序列;利用游程编码对差分调整数据序列进行编码压缩,得到压缩数据包,在对风电机组的运行状态划分时,对压缩数据包进行解压分析,获取风电机组的运行状态,通过在有限的存储空间中存储更多的风电机组的传感器数据,提高了后续根据存储的传感器数据对风电机组的运行状态进行分析的准确性。

Description

基于模式分析的风电机组运行状态划分方法
技术领域
本发明涉及数据压缩技术领域,尤其涉及一种基于模式分析的风电机组运行状态划分方法。
背景技术
随着风能发电技术的不断发展,风电机组作为一种重要的可再生能源装置,在能源领域中得到广泛应用。为了确保风电机组的高效运行和维护,对其运行状态进行准确划分和监测变得至关重要。
其中,对风电机组的运行状态进行划分需要采集大量的传感器数据,从传感器数据中提取能够反映风电机组运行状态的特征,对提取的特征进行筛选,筛选出对于运行状态划分具有最大影响力的传感器数据,进而分析筛选出的大量传感器数据,并通过设定阈值确定风电机组的运行状态。由于风电机组的运行状态分析是建立在大量的历史传感器数据上的,历史传感器数据的存储量越大,分析的结果越准确,因此,如何在有限的存储空间中存储较多的风电机组的传感器数据,以保证风电机组的运行状态的分析准确性成为亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种基于模式分析的风电机组运行状态划分方法,以解决如何在有限的存储空间中存储较多的风电机组的传感器数据,以保证风电机组的运行状态的分析准确性的问题。
本发明实施例中提供了一种基于模式分析的风电机组运行状态划分方法,该风电机组运行状态划分方法包括以下步骤:
获取风电机组运行过程中的传感器时序数据;
根据所述传感器时序数据中的数据差异,获取对所述传感器时序数据进行平滑处理时的窗口大小,根据所述窗口大小对所述传感器时序数据进行平滑处理,得到平滑后的传感器时序数据;
根据所述平滑后的传感器时序数据中包含的数据总数量,获取所述传感器时序数据的最佳周期,以所述最佳周期为步长对所述传感器时序数据进行差分处理,得到对应的差分序列;
获取所述差分序列中每种数据的频率,得到最大频率,根据预设的可变步长和所述最大频率,对所述差分序列中的数据进行调整,得到差分调整数据序列;
利用游程编码对所述差分调整数据序列进行编码压缩,得到压缩数据包,在对所述风电机组的运行状态划分时,对所述压缩数据包进行解压分析,获取所述风电机组的运行状态。
进一步的,所述根据所述传感器时序数据中的数据差异,获取对所述传感器时序数据进行平滑处理时的窗口大小,包括:
针对所述传感器时序数据中的任一数据,以所述数据为滑窗中心,构建得到预设尺寸的滑窗,若所述滑窗中的中心数据均大于所述滑窗中的每个非中心数据,则将所述数据作为局部极大值数据,若所述滑窗中的中心数据均小于所述滑窗中的每个非中心数据,则将所述数据作为局部极小值数据;
遍历所述传感器时序数据中的所有数据,得到所述传感器时序数据中的所有局部极大值数据和局部极小值数据;
根据所述所有局部极大值数据和局部极小值数据,获取对所述传感器时序数据进行平滑处理时的窗口大小。
进一步的,所述根据所述所有局部极大值数据和局部极小值数据,获取对所述传感器时序数据进行平滑处理时的窗口大小,包括:
根据每个所述局部极大值数据在所述传感器时序数据中的位置,分别获取每两个相邻所述局部极大值数据之间的第一距离,计算所有第一距离的第一距离均值;
根据每个所述局部极小值数据在所述传感器时序数据中的位置,分别获取每两个相邻所述局部极小值数据之间的第二距离,计算所有第二距离的第二距离均值;
计算所述第一距离均值和所述第二距离均值之间的均值,对所述均值进行向下取整的结果作为对所述传感器时序数据进行平滑处理时的窗口大小。
进一步的,所述根据所述平滑后的传感器时序数据中包含的数据总数量,获取所述传感器时序数据的最佳周期,包括:
根据所述平滑后的传感器时序数据中包含的数据总数量获取划分窗口的尺寸范围;
针对任一尺寸的划分窗口,利用所述尺寸的划分窗口对所述平滑后的传感器时序数据进行分段,得到至少两个数据子段,针对任一相邻的两个数据子段,分别获取所述两个数据子段之间的每个相同位置处的两个数据的差值绝对值,计算所有差值绝对值的第一均值;
根据所有数据子段中的每两个相邻数据子段的第一均值,计算第一均值的平均值,对所述平均值进行负映射,对应得到的映射值作为所述尺寸的划分窗口的第一优选程度;
根据所述划分窗口的尺寸范围内的每个尺寸的划分窗口的第一优选程度,获取所述传感器时序数据的最佳周期。
进一步的,所述根据所述划分窗口的尺寸范围内的每个尺寸的划分窗口的第一优选程度,获取所述传感器时序数据的最佳周期,包括:
对比所述划分窗口的尺寸范围内的每个尺寸的划分窗口的第一优选程度,将最大第一优选程度对应的尺寸作为所述传感器时序数据的最佳周期。
进一步的,所述以所述最佳周期为步长对所述传感器时序数据进行差分处理,得到对应的差分序列,包括:
以所述最佳周期为步长对所述传感器时序数据进行一阶差分,得到初始差分序列;
将所述传感器时序数据中的第一个最佳周期对应的数据和所述初始差分序列组成差分序列。
进一步的,所述根据预设的可变步长和所述最大频率,对所述差分序列中的数据进行调整,得到差分调整数据序列,包括:
根据所述差分序列的长度获取预设的可变步长的取值范围,根据所述取值范围内每个可变步长的第二优选程度,获取最优步长;
利用所述最优步长获取所述差分序列中的标记数据,将所述最大频率对应的数据作为目标数据,获取所有标记数据中频率最大所对应的数据作为第一数据,将每个所述第一数据调整为所述目标数据,得到新差分序列;
将所述新差分序列作为所述差分序列,继续对所述差分序列中的标记数据进行调整,直至所述新差分序列对应的最大频率小于或等于所述差分序列对应的最大频率,则将所述新差分序列作为差分调整数据序列。
进一步的,所述根据所述取值范围内每个可变步长的第二优选程度,获取最优步长,包括:
针对所述取值范围的任一可变步长,利用所述可变步长获取所述差分序列中的标记数据,统计所述标记数据的总数量,统计所述标记数据中属于所述最大频率对应的数据的第一数量,统计所述标记数据中频率最大对应的数据的第二数量,根据所述总数量、所述第一数量和所述第二数量获取所述可变步长的第二优选程度;
根据所述取值范围内每个可变步长的第二优选程度,将最大第二优选程度对应的可变步长作为最优步长。
进一步的,所述根据所述总数量、所述第一数量和所述第二数量获取所述可变步长的第二优选程度,包括:
若所述第一数量与所述第二数量相等,则所述可变步长的第二优选程度为0;
若所述第一数量与所述第二数量不相等,则计算所述总数量与所述第一数量之间的第一比值,计算所述总数量与所述第二数量之间的第二比值,对所述第一比值进行负映射,得到对应的映射结果,将所述映射结果和所述第二比值之间的乘积作为所述可变步长的第二优选程度。
进一步的,所述根据所述差分序列的长度获取预设的可变步长的取值范围,包括:
将常数2作为所述可变步长的取值范围的下限,将对所述差分序列的二分之一长度进行向上取整后的结果作为所述可变步长的取值范围的上限。
本发明实施例与现有技术相比存在的有益效果是:
本发明获取风电机组运行过程中的传感器时序数据;根据所述传感器时序数据中的数据差异,获取对所述传感器时序数据进行平滑处理时的窗口大小,根据所述窗口大小对所述传感器时序数据进行平滑处理,得到平滑后的传感器时序数据;根据所述平滑后的传感器时序数据中包含的数据总数量,获取所述传感器时序数据的最佳周期,以所述最佳周期为步长对所述传感器时序数据进行差分处理,得到对应的差分序列;获取所述差分序列中每种数据的频率,得到最大频率,根据预设的可变步长和所述最大频率,对所述差分序列中的数据进行调整,得到差分调整数据序列;利用游程编码对所述差分调整数据序列进行编码压缩,得到压缩数据包,在对所述风电机组的运行状态划分时,对所述压缩数据包进行解压分析,获取所述风电机组的运行状态。其中,对传感器时序数据进行差分处理,使得对差分序列转换成二进制数据的长度会远远低于原始数据转换成二进制数据的长度,在后续进行编码压缩时能够提高压缩效率,考虑到游程编码在处理大量连续冗余数据时的处理效果较好,而传感器时序数据存在局部差异,导致差分序列中连续冗余数据的长度较短,因此,通过对差分序列进行调整,使得调整后得到的差分调整数据序列能够包含连续冗余数据尽可能长,以达到高效压缩的效果,从而能在有限的存储空间中存储更多的风电机组的传感器数据,提高了后续根据存储的传感器数据对风电机组的运行状态进行分析的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种基于模式分析的风电机组运行状态划分方法的方法流程图;
图2是本发明实施例所提供的一种对时序数据进行差分处理的示意图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。为了说明本发明的技术方案,下面通过具体实施例来进行说明。
参见图1,是本发明实施例一提供的一种基于模式分析的风电机组运行状态划分方法的方法流程图,如图1所示,该风电机组运行状态划分方法可以包括:
步骤S101,获取风电机组运行过程中的传感器时序数据。
获取风电机组在运行过程中的运行状态数据,对于监测、优化和维护风电机组至关重要。则对风电机组设置传感器,利用传感器采集风电机组的运行状态数据,具体的,基于设置的采样频率采集风电机组运行过程中的传感器数据,以得到预设时段内的传感器时序数据。其中,本发明实施例中,对采样频率和预设时段不做限制,实施者可根据实施场景设置。优选的,本发明实施例中,采样频率为1秒,预设时段为一天。
举例说明,一些常见的运行状态数据以及采集方法如下:
使用风速风向传感器(如Anemoment TriSonica Mini)实时监测风电机组的风速和风向;使用霍尔效应传感器或光电编码器(如HEDS-5540)监测风电机组的转子的旋转速度和方向;使用电流互感器和电压传感器(如CR Magnetics)测量发电机输出;使用PT100或Thermocouple类型的温度传感器监测不同部件的温度;使用加速度计传感器(如ADXL345)测量振动,使用声音传感器(如LM393声音传感器)监测噪声。
步骤S102,根据传感器时序数据中的数据差异,获取对传感器时序数据进行平滑处理时的窗口大小,根据窗口大小对传感器时序数据进行平滑处理,得到平滑后的传感器时序数据。
考虑到风电机组正常运行时,传感器采集的数据会呈现一定的周期性,即使数据局部存在差异,但大体的走势是相似的,且在计算机内进行存储的数据最终均会转换成二进制数据的形式,若对传感器时序数据进行差分处理,则差分后的数据转换成二进制数据的长度会远远低于原始数据转换成二进制数据的长度,从能够提高后续存储效率。
传感器采集的传感器时序数据的整体趋势上存在一定的周期性,但由于环境影响,采集的传感器数据间会存在细微的差异,但不会破坏传感器时序数据的整体趋势,在对传感器时序数据进行差分处理时,相邻周期间进行差分处理使得到的差分值会更趋近于0,因此,想要达到较好的差分效果需要先获取传感器时序数据的最佳周期。由于传感器时序数据存在细微的差异,会影响最佳周期的判断,故需要先对传感器时序数据进行平滑,平滑后的传感器时序数据不会破坏原本的趋势和走势,会将传感器时序数据的周期性体现的更明显。
本发明实施例中,在对传感器时序数据进行平滑处理时,选择滑动平均法进行平滑处理,由于滑动平均法较为依赖窗口大小的选择,比如:若数据存在较为明显的周期性,则选择最小周期作为平滑窗口大小的平滑效果最好,因此,根据传感器时序数据中的数据差异,获取对传感器时序数据进行平滑处理时的窗口大小。
优选的,所述根据所述传感器时序数据中的数据差异,获取对所述传感器时序数据进行平滑处理时的窗口大小,包括:
针对所述传感器时序数据中的任一数据,以所述数据为滑窗中心,构建得到预设尺寸的滑窗,若所述滑窗中的中心数据均大于所述滑窗中的每个非中心数据,则将所述数据作为局部极大值数据,若所述滑窗中的中心数据均小于所述滑窗中的每个非中心数据,则将所述数据作为局部极小值数据;
遍历所述传感器时序数据中的所有数据,得到所述传感器时序数据中的所有局部极大值数据和局部极小值数据;
根据所述所有局部极大值数据和局部极小值数据,获取对所述传感器时序数据进行平滑处理时的窗口大小。
在一实施方式中,以传感器时序数据中的第i个数据为例,以第i个数据为滑窗中心,建立3*1大小的滑窗,若滑窗内的中心数据均大于或均小于滑窗内的每个非中心数据,则将第i个数据进行标记,进一步的,若滑窗内的中心数据均大于滑窗内的每个非中心数据,则将第i个数据标记为局部极大值数据,若滑窗内的中心数据均小于滑窗内的每个非中心数据,则将第i个数据标记为局部极小值数据。同理,构建传感器时序数据中的每个数据的滑窗,能够获取传感器时序数据中的所有局部极大值数据和局部极小值数据,进而根据所有局部极大值数据和局部极小值数据,获取对传感器时序数据进行平滑处理时的窗口大小。
优选的,所述根据所述所有局部极大值数据和局部极小值数据,获取对所述传感器时序数据进行平滑处理时的窗口大小,包括:
根据每个所述局部极大值数据在所述传感器时序数据中的位置,分别获取每两个相邻所述局部极大值数据之间的第一距离,计算所有第一距离的第一距离均值;
根据每个所述局部极小值数据在所述传感器时序数据中的位置,分别获取每两个相邻所述局部极小值数据之间的第二距离,计算所有第二距离的第二距离均值;
计算所述第一距离均值和所述第二距离均值之间的均值,对所述均值进行向下取整的结果作为对所述传感器时序数据进行平滑处理时的窗口大小。
在一实施方式中,假设获取的每个局部极大值数据在传感器时序数据中的位置为,其中,/>表示第1个局部极大值数据的位置,/>表示第2个局部极大值数据的位置,/>表示第3个局部极大值数据的位置,/>表示第n个局部极大值数据的位置。获取每两个相邻局部极大值数据之间的第一距离/>,则所有局部极大值数据对应的第一距离序列为/>,同理,获取所有局部极小值数据对应的第二距离序列为/>,其中,m表示局部极小值数据的总数量。则根据第一距离序列和第二距离序列,计算得到对传感器时序数据进行平滑处理时的窗口大小,窗口大小的计算表达式为:
其中,L表示窗口大小,表示第一距离序列中的第i个第一距离,/>表示第二距离序列中的第j个第二距离,n-1表示第一距离序列的长度,m-1表示第二距离序列的长度,/>表示向下取整符号。
进一步的,在得到滑动平均法的窗口大小之后,根据该窗口大小,利用滑动平均法对传感器时序数据进行平滑处理,得到平滑后的传感器时序数据,其中,滑动平均法的步骤如下:
1、确定窗口大小:选择一个适当的窗口大小,它决定了参与平均计算的数据点数量。较大的窗口可以平滑较长周期的数据,但会延迟对突发变化的响应;较小的窗口对于较短周期的数据变化更敏感,但容易受到噪音的干扰。窗口大小的选择需要根据具体数据的性质和目标进行调整。
2、初始化滑动窗口:从时序数据的开头开始,选取窗口大小的连续数据点作为初始滑动窗口。
3、计算窗口内数据的平均值:对于初始滑动窗口内的数据点,计算它们的平均值作为平滑后的数值。
4、平滑处理:将平滑后的数值保存,然后滑动窗口向前移动一个数据点的距离,即丢弃最早的数据点,加入下一个新的数据点。
5、重复步骤3和4:重复进行步骤3和4,直到滑动窗口移动到时序数据的末尾,得到所有平滑后的数值。
需要说明的是,滑动平均法属于现有技术,此处不再详细赘述。
步骤S103,根据平滑后的传感器时序数据中包含的数据总数量,获取传感器时序数据的最佳周期,以最佳周期为步长对传感器时序数据进行差分处理,得到对应的差分序列。
本发明实施例中,在得到平滑后的传感器时序数据之后,为了后续达到较好的差分效果需要先获取传感器时序数据的最佳周期,因此,根据平滑后的传感器时序数据中包含的数据总数量,获取传感器时序数据的最佳周期。
优选的,所述根据所述平滑后的传感器时序数据中包含的数据总数量,获取所述传感器时序数据的最佳周期,包括:
根据所述平滑后的传感器时序数据中包含的数据总数量获取划分窗口的尺寸范围;
针对任一尺寸的划分窗口,利用所述尺寸的划分窗口对所述平滑后的传感器时序数据进行分段,得到至少两个数据子段,针对任一相邻的两个数据子段,分别获取所述两个数据子段之间的每个相同位置处的两个数据的差值绝对值,计算所有差值绝对值的第一均值;
根据所有数据子段中的每两个相邻数据子段的第一均值,计算第一均值的平均值,对所述平均值进行负映射,对应得到的映射值作为所述尺寸的划分窗口的第一优选程度;
根据所述划分窗口的尺寸范围内的每个尺寸的划分窗口的第一优选程度,获取所述传感器时序数据的最佳周期。
在一实施方式中,建立划分窗口,划分窗口可将平滑后的传感器时序数据分割为若干个数据子段。具体的,统计平滑后的传感器时序数据中所包含的数据总数量为R,对应设置划分窗口的尺寸范围为,针对任一尺寸的划分窗口,利用该尺寸的划分窗口对平滑后的传感器时序数据进行分段,得到至少两个数据子段,假设划分窗口的尺寸为2*1,则可将平滑后的传感器时序数据中的每两个数据组成一个数据子段,由于数据子段之间的长度相等,则当数据子段的长度不满足划分窗口尺寸时,对数据子段进行补零操作,进一步,针对任一两个相邻的数据子段,分别获取这两个相邻的数据子段之间的每个相同位置处的两个数据的差值绝对值,计算所有差值绝对值的第一均值b,进而根据所有数据子段中的每两个相邻数据子段的第一均值获取该尺寸的划分窗口的第一优选程度,则第一优选程度的计算表达式为:
其中,表示尺寸为r的划分窗口的第一优选程度,/>表示以自然常数e为底数的指数函数,M表示第一均值的数量,/>表示第k个第一均值。
需要说明的是,任一两个相邻的数据子段之间的第一均值越小,越说明该尺寸的划分窗口所划分的数据子段呈现周期性,对应该尺寸的划分窗口的第一优选程度越高。
进一步的,在根据上述任一尺寸的划分窗口的第一优选程度的获取方法,能够获取划分窗口的尺寸范围内的每个尺寸的划分窗口的第一优选程度,从而能够得到个第一优选程度,进而根据所述划分窗口的尺寸范围内的每个尺寸的划分窗口的第一优选程度,获取传感器时序数据的最佳周期,具体的,对比所述划分窗口的尺寸范围内的每个尺寸的划分窗口的第一优选程度,将最大第一优选程度对应的尺寸作为所述传感器时序数据的最佳周期。
在得到传感器时序数据的最佳周期之后,以最佳周期为步长对传感器时序数据进行差分处理,得到对应的差分序列,则以所述最佳周期为步长对所述传感器时序数据进行差分处理,得到对应的差分序列,包括:
以所述最佳周期为步长对所述传感器时序数据进行一阶差分,得到初始差分序列;
将所述传感器时序数据中的第一个最佳周期对应的数据和所述初始差分序列组成差分序列。
举例说明,参照图2,其为本发明实施例所提供的一种对时序数据进行差分处理的示意图,图2中的时序数据为[c1、c2、c3、c4、c5、c6、c7、c8、c9、c10、…、cN-3、cN-2、cN],最佳周期长度r为5,也即是图2中虚线中所包含的数据数量,则以最佳周期5为步长,分别计算c1和c6之间的差值t1、c2和c7之间的差值t2、c3和c8之间的差值t3、c4和c9之间的差值t4、c5和c10之间的差值t5,依次类推,得到差值t(N-r),将所有差值组成初始差值序列,同时将时序数据中的c1、c2、c3、c4、c5和初始差值序列组成差分序列[c1、c2、c3、c4、c5、t1、t2、t3、t4、t5、…、t(N-r-3)、t(N-r-2)、t(N-r-1)、t(N-r)]。
步骤S104,获取差分序列中每种数据的频率,得到最大频率,根据预设的可变步长和最大频率,对差分序列中的数据进行调整,得到差分调整数据序列。
游程编码在处理大量连续冗余的数据时的处理效果较好,但由于传感器时序数据存在局部差异性,导致连续冗余数据的长度较短,故通过对差分序列进行转换,令连续冗余的数据尽可能长,达到高效压缩的效果,则本发明实施例中,统计差分序列中每种数据的频率,并将所有的频率从大到小排序,得到频率序列,其中,频率序列记为,x表示差分序列中数据的类型数,其中,/>为最大频率。
为了使得差分序列中连续冗余的数据数量较多,本发明实施例期望将非最大频率对应的数据类型均转换为最大频率/>对应的数据,因此,通过增加或减少数据值来到到该目的。由于数据改变后还需要达到可还原的效果,则通过获取最优步长,将对应步长位置的数据值进行固定数值的改变,在达到改变贴近冗余的同时可还原,因此,根据预设的可变步长和最大频率,对差分序列中的数据进行调整,将调整后的差分序列作为差分调整数据序列。其中,差分调整数据序列的获取方法,包括:
根据所述差分序列的长度获取预设的可变步长的取值范围,根据所述取值范围内每个可变步长的第二优选程度,获取最优步长;
利用所述最优步长获取所述差分序列中的标记数据,将所述最大频率对应的数据作为目标数据,获取所有标记数据中频率最大所对应的数据作为第一数据,将每个所述第一数据调整为所述目标数据,得到新差分序列;
将所述新差分序列作为所述差分序列,继续对所述差分序列中的标记数据进行调整,直至所述新差分序列对应的最大频率小于或等于所述差分序列对应的最大频率,则将所述新差分序列作为差分调整数据序列。
在一实施方式中,将常数2作为可变步长的取值范围的下限,将差分序列的二分之一长度进行向上取整后的结果作为可变步长的取值范围的上限。在确定了可变步长的取值范围之后,进而根据取值范围内每个可变步长的第二优选程度,获取最优步长,利用最优步长获取差分序列中的标记数据,例如:最优步长为2,则差分序列中所有偶数位置上的数据为标记数据。在根据最优步长获取的所有标记数据中,非最大频率对应的数据类型的某种数据类型的数据的冗余程度最大,此时若将其转换为最大频率/>对应的数据类型,则可以大大增加差分序列的冗余程度,因此,将最大频率/>对应的数据作为目标数据,同时获取最优步长下的所有标记数据中频率最大的数据作为第一数据,并将所有第一数据调整为目标数据,从而得到了第一轮调整后的差分序列,并将调整后的差分序列作为新差分序列。然后,按照上述差分序列的调整方法,对新差分序列进行第二轮的调整,依次类推,直至当前调整后的差分序列中的最大频率/>小于或等于上一轮调整后的差分序列中的最大频率/>,迭代停止,并将当前调整后的差分序列作为差分调整数据序列。
优选的,所述根据所述取值范围内每个可变步长的第二优选程度,获取最优步长,包括:
针对所述取值范围的任一可变步长,利用所述可变步长获取所述差分序列中的标记数据,统计所述标记数据的总数量,统计所述标记数据中属于所述最大频率对应的数据的第一数量,统计所述标记数据中频率最大对应的数据的第二数量,根据所述总数量、所述第一数量和所述第二数量获取所述可变步长的第二优选程度;
根据所述取值范围内每个可变步长的第二优选程度,将最大第二优选程度对应的可变步长作为最优步长。
在一实施方式中,针对取值范围内的任一可变步长,得到利用该可变步长在差分序列中所获取的标记数据,在获取的标记数据中,最大频率对应的数据量越少且除最大频率/>对应的数据外的某种类型数据的个数越多,则该可变步长的第二优选程度越大,因此,统计该可变步长所获取的标记数据的总数量/>,同时,获取标记数据中属于最大频率对应的数据的第一数量/>,以及标记数据中频率最大对应的数据的第二数量/>,从而根据总数量/>、第一数量/>和第二数量/>获取该可变步长的第二优选程度。同理,获取取值范围内的每个可变步长的第二优选程度,选择第二优选程度最大所对应的可变步长作为最优步长。
优选的,所述根据所述总数量、所述第一数量和所述第二数量获取所述可变步长的第二优选程度,包括:
若所述第一数量与所述第二数量相等,则所述可变步长的第二优选程度为0;
若所述第一数量与所述第二数量不相等,则计算所述总数量与所述第一数量之间的第一比值,计算所述总数量与所述第二数量之间的第二比值,对所述第一比值进行负映射,得到对应的映射结果,将所述映射结果和所述第二比值之间的乘积作为所述可变步长的第二优选程度。
在一实施方式中,若,则说明该可变步长下得到的标记数据中属于最大频率/>对应的数据的数量最多,也即是标记数据中频率最大所对应的第一数据属于最大频率对应的数据,此时再将第一数据调整为目标数据没有意义,因此,令该可变步长的第二优选程度为0;反之,若/>,则可根据总数量、第一数量和第二数量获取该可变步长的第二优选程度,则第二优选程度的计算表达式为:
其中,表示可变步长为z的第二优选程度,/>表示以自然常数e为底数的指数函数,/>表示可变步长为z时的标记数据的总数量,/>表示标记数据中属于最大频率对应的数据的第一数量,/>表示标记数据中频率最大对应的数据的第二数量。
需要说明的是,在获取的标记数据中,最大频率对应的数据量越少且除最大频率/>对应的数据外的某种类型数据的个数越多,则该可变步长的第二优选程度越大。
举例说明:假设差分序列为112112112332112111222332112432122124343352252678,则最大频率对应的数据为1,数据类型包括1、2、3、4、5、6、7、8,共8类,由于差分序列中1最多,所以将其他数据尽可能转换成1后的差分序列会十分规整,连续冗余的数据最多,游程编码的效果更好,则对差分序列的调整过程包括:若可变步长为2,则可将差分序列中偶数位置处的数据作为标记数据,也即标记数据包括112132111232142214432568,由于差分序列中1的数量最多,则1作为目标数据,其次差分序列中2的数量最多,那么将2转换成1更容易,因此,对在步长为2下获取的标记数据进行统计分析,发现标记数据中1的数量最多,2的数量并是最多,则将1转换为1没有意义,故当标记数据中1的数量最多时,对应可变步长没有意义,则将可变步长为2的第二优选程度设置为0,且需要更换可变步长;进一步将可变步长调整为3,则标记数据包括2222212222243228,此时,该可变步长下的标记数据中2的数量最多,若将标记数据中的所有2都转换为1,则调整后的差分序列中会出现更多的1,从而说明可变步长为3时能够最大程度的增加冗余;若在第一轮调整过程中,可变步长为3的第二优选程度最大,则在将标记数据中的所有2转换为1后,得到新差分序列,在新差分序列的基础上,根据第一轮调整的方法继续对新差分序列进行第二轮的调整,以此类推,直到新差分序列中的最大频率无法变大时停止迭代,此时得到差分调整数据序列。
步骤S105,利用游程编码对差分调整数据序列进行编码压缩,得到压缩数据包,在对风电机组的运行状态划分时,对压缩数据包进行解压分析,获取风电机组的运行状态。
本发明实施例中,在对差分序列调整得到差分调整数据序列之后,采用游程编码对差分调整数据序列进行编码压缩,此时的差分调整数据序列的冗余程度很大,且差分调整数据序列中的差分值很小,十分利于游程编码的压缩处理,游程编码压缩完成后,得到压缩数据包。在对压缩数据包进行存储时建立码头,码头包含差分处理时的最佳周期、每轮的可变步长以及对应第一数据调整为目标数据的调整值,以便于后续解压还原得到原始数据。
将压缩数据包存储在系统中,当需要参考历史数据对风电机组的运行状态进行划分时,对压缩数据包进行解压,将解压数据进行还原得到原始的传感器时序数据,将原始的传感器时序数据输入到对应的数据分析模型中,以根据模型输出结果确定风电机组的运行状态。值得说明的是,如何通过还原后的传感器时序数据分析风电机组的运行状态不属于本发明的重点,此处不再详细赘述。
综上所述,本发明实施例获取风电机组运行过程中的传感器时序数据;根据传感器时序数据中的数据差异,获取对传感器时序数据进行平滑处理时的窗口大小,根据窗口大小对传感器时序数据进行平滑处理,得到平滑后的传感器时序数据;根据平滑后的传感器时序数据中包含的数据总数量,获取传感器时序数据的最佳周期,以最佳周期为步长对传感器时序数据进行差分处理,得到对应的差分序列;获取差分序列中每种数据的频率,得到最大频率,根据预设的可变步长和最大频率,对差分序列中的数据进行调整,得到差分调整数据序列;利用游程编码对差分调整数据序列进行编码压缩,得到压缩数据包,在对风电机组的运行状态划分时,对压缩数据包进行解压分析,获取风电机组的运行状态。其中,对传感器时序数据进行差分处理,使得对差分序列转换成二进制数据的长度会远远低于原始数据转换成二进制数据的长度,在后续进行编码压缩时能够提高压缩效率,考虑到游程编码在处理大量连续冗余数据时的处理效果较好,而传感器时序数据存在局部差异,导致差分序列中连续冗余数据的长度较短,因此,通过对差分序列进行调整,使得调整后得到的差分调整数据序列能够包含连续冗余数据尽可能长,以达到高效压缩的效果,从而能在有限的存储空间中存储更多的风电机组的传感器数据,提高了后续根据存储的传感器数据对风电机组的运行状态进行分析的准确性。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于模式分析的风电机组运行状态划分方法,其特征在于,所述风电机组运行状态划分方法包括:
获取风电机组运行过程中的传感器时序数据;
根据所述传感器时序数据中的数据差异,获取对所述传感器时序数据进行平滑处理时的窗口大小,根据所述窗口大小对所述传感器时序数据进行平滑处理,得到平滑后的传感器时序数据;
根据所述平滑后的传感器时序数据中包含的数据总数量,获取所述传感器时序数据的最佳周期,以所述最佳周期为步长对所述传感器时序数据进行差分处理,得到对应的差分序列;
获取所述差分序列中每种数据的频率,得到最大频率,根据预设的可变步长和所述最大频率,对所述差分序列中的数据进行调整,得到差分调整数据序列;
利用游程编码对所述差分调整数据序列进行编码压缩,得到压缩数据包,在对所述风电机组的运行状态划分时,对所述压缩数据包进行解压分析,获取所述风电机组的运行状态。
2.根据权利要求1所述的风电机组运行状态划分方法,其特征在于,所述根据所述传感器时序数据中的数据差异,获取对所述传感器时序数据进行平滑处理时的窗口大小,包括:
针对所述传感器时序数据中的任一数据,以所述数据为滑窗中心,构建得到预设尺寸的滑窗,若所述滑窗中的中心数据均大于所述滑窗中的每个非中心数据,则将所述数据作为局部极大值数据,若所述滑窗中的中心数据均小于所述滑窗中的每个非中心数据,则将所述数据作为局部极小值数据;
遍历所述传感器时序数据中的所有数据,得到所述传感器时序数据中的所有局部极大值数据和局部极小值数据;
根据所述所有局部极大值数据和局部极小值数据,获取对所述传感器时序数据进行平滑处理时的窗口大小。
3.根据权利要求2所述的风电机组运行状态划分方法,其特征在于,所述根据所述所有局部极大值数据和局部极小值数据,获取对所述传感器时序数据进行平滑处理时的窗口大小,包括:
根据每个所述局部极大值数据在所述传感器时序数据中的位置,分别获取每两个相邻所述局部极大值数据之间的第一距离,计算所有第一距离的第一距离均值;
根据每个所述局部极小值数据在所述传感器时序数据中的位置,分别获取每两个相邻所述局部极小值数据之间的第二距离,计算所有第二距离的第二距离均值;
计算所述第一距离均值和所述第二距离均值之间的均值,对所述均值进行向下取整的结果作为对所述传感器时序数据进行平滑处理时的窗口大小。
4.根据权利要求1所述的风电机组运行状态划分方法,其特征在于,所述根据所述平滑后的传感器时序数据中包含的数据总数量,获取所述传感器时序数据的最佳周期,包括:
根据所述平滑后的传感器时序数据中包含的数据总数量获取划分窗口的尺寸范围;
针对任一尺寸的划分窗口,利用所述尺寸的划分窗口对所述平滑后的传感器时序数据进行分段,得到至少两个数据子段,针对任一相邻的两个数据子段,分别获取所述两个数据子段之间的每个相同位置处的两个数据的差值绝对值,计算所有差值绝对值的第一均值;
根据所有数据子段中的每两个相邻数据子段的第一均值,计算第一均值的平均值,对所述平均值进行负映射,对应得到的映射值作为所述尺寸的划分窗口的第一优选程度;
根据所述划分窗口的尺寸范围内的每个尺寸的划分窗口的第一优选程度,获取所述传感器时序数据的最佳周期。
5.根据权利要求4所述的风电机组运行状态划分方法,其特征在于,所述根据所述划分窗口的尺寸范围内的每个尺寸的划分窗口的第一优选程度,获取所述传感器时序数据的最佳周期,包括:
对比所述划分窗口的尺寸范围内的每个尺寸的划分窗口的第一优选程度,将最大第一优选程度对应的尺寸作为所述传感器时序数据的最佳周期。
6.根据权利要求1所述的风电机组运行状态划分方法,其特征在于,所述以所述最佳周期为步长对所述传感器时序数据进行差分处理,得到对应的差分序列,包括:
以所述最佳周期为步长对所述传感器时序数据进行一阶差分,得到初始差分序列;
将所述传感器时序数据中的第一个最佳周期对应的数据和所述初始差分序列组成差分序列。
7.根据权利要求1所述的风电机组运行状态划分方法,其特征在于,所述根据预设的可变步长和所述最大频率,对所述差分序列中的数据进行调整,得到差分调整数据序列,包括:
根据所述差分序列的长度获取预设的可变步长的取值范围,根据所述取值范围内每个可变步长的第二优选程度,获取最优步长;
利用所述最优步长获取所述差分序列中的标记数据,将所述最大频率对应的数据作为目标数据,获取所有标记数据中频率最大所对应的数据作为第一数据,将每个所述第一数据调整为所述目标数据,得到新差分序列;
将所述新差分序列作为所述差分序列,继续对所述差分序列中的标记数据进行调整,直至所述新差分序列对应的最大频率小于或等于所述差分序列对应的最大频率,则将所述新差分序列作为差分调整数据序列。
8.根据权利要求7所述的风电机组运行状态划分方法,其特征在于,所述根据所述取值范围内每个可变步长的第二优选程度,获取最优步长,包括:
针对所述取值范围的任一可变步长,利用所述可变步长获取所述差分序列中的标记数据,统计所述标记数据的总数量,统计所述标记数据中属于所述最大频率对应的数据的第一数量,统计所述标记数据中频率最大对应的数据的第二数量,根据所述总数量、所述第一数量和所述第二数量获取所述可变步长的第二优选程度;
根据所述取值范围内每个可变步长的第二优选程度,将最大第二优选程度对应的可变步长作为最优步长。
9.根据权利要求8所述的风电机组运行状态划分方法,其特征在于,所述根据所述总数量、所述第一数量和所述第二数量获取所述可变步长的第二优选程度,包括:
若所述第一数量与所述第二数量相等,则所述可变步长的第二优选程度为0;
若所述第一数量与所述第二数量不相等,则计算所述总数量与所述第一数量之间的第一比值,计算所述总数量与所述第二数量之间的第二比值,对所述第一比值进行负映射,得到对应的映射结果,将所述映射结果和所述第二比值之间的乘积作为所述可变步长的第二优选程度。
10.根据权利要求7所述的风电机组运行状态划分方法,其特征在于,所述根据所述差分序列的长度获取预设的可变步长的取值范围,包括:
将常数2作为所述可变步长的取值范围的下限,将对所述差分序列的二分之一长度进行向上取整后的结果作为所述可变步长的取值范围的上限。
CN202311785349.6A 2023-12-25 2023-12-25 基于模式分析的风电机组运行状态划分方法 Withdrawn CN117478148A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311785349.6A CN117478148A (zh) 2023-12-25 2023-12-25 基于模式分析的风电机组运行状态划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311785349.6A CN117478148A (zh) 2023-12-25 2023-12-25 基于模式分析的风电机组运行状态划分方法

Publications (1)

Publication Number Publication Date
CN117478148A true CN117478148A (zh) 2024-01-30

Family

ID=89631538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311785349.6A Withdrawn CN117478148A (zh) 2023-12-25 2023-12-25 基于模式分析的风电机组运行状态划分方法

Country Status (1)

Country Link
CN (1) CN117478148A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117692012A (zh) * 2024-01-31 2024-03-12 陕西咸阳杜克普服装有限公司 一种智能睡袋温度数据远程监测传输方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117692012A (zh) * 2024-01-31 2024-03-12 陕西咸阳杜克普服装有限公司 一种智能睡袋温度数据远程监测传输方法
CN117692012B (zh) * 2024-01-31 2024-05-10 陕西咸阳杜克普服装有限公司 一种智能睡袋温度数据远程监测传输方法

Similar Documents

Publication Publication Date Title
CN117478148A (zh) 基于模式分析的风电机组运行状态划分方法
CN110705181B (zh) 基于卷积长短时记忆循环神经网络的滚动轴承剩余寿命预测方法
CN111368890A (zh) 故障检测方法及装置、信息物理融合系统
CN115659070A (zh) 一种基于nb-iot智能水表的水流量数据传输方法
CN116828070B (zh) 一种智慧电网数据优化传输方法
CN117271987A (zh) 一种配电设备环境状态数据智能采集处理方法
CN117235557A (zh) 基于大数据分析的电气设备故障快速诊断方法
CN116975008A (zh) 一种船舶气象监测数据优化存储方法
CN114900191A (zh) 一种对于旋转门算法压缩差动保护数据的改进算法
CN114819289A (zh) 预测方法、训练方法、装置、电子设备及存储介质
CN116296354A (zh) 汽轮机高调门流量特性实时监测及优化的系统及方法
CN117516670B (zh) 一种物联网超声波水表的数据智能监测方法
CN114969060A (zh) 一种工业设备时序数据压缩存储方法、装置
CN117459073B (zh) 一种热泵系统运行数据的智能管理方法
CN115695564B (zh) 一种物联网数据的高效传输方法
CN116743180B (zh) 一种储能电源数据智能存储方法
CN117365869A (zh) 一种风电机组桨叶扫塔故障的自适应预警策略设计方法
CN116362138A (zh) 基于大数据的人工智能园区碳监测方法
CN107102195B (zh) 智能变压器终端的电气量处理和网络传输方法
CN114739660A (zh) 齿轮箱健康监测方法及系统
CN113404651B (zh) 风力发电机组的数据异常检测方法和装置
CN111563543B (zh) 一种风电机组的风速-发电功率数据的清洗方法及装置
CN117113107B (zh) 一种转子压铸异常误差数据处理方法
CN116861204B (zh) 基于数字孪生的智能制造设备数据管理系统
Stokelj et al. Short and mid term hydro power plant reservoir inflow forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20240130