发明内容
本发明的示例性实施例在于提供一种海上风机故障诊断模型的样本数据的存储方法及设备,其能够解决现有技术存在的用于更新机组故障诊断模型的样本数据占用存储空间过大的问题。
根据本发明的示例性实施例,提供一种海上风机故障诊断模型的样本数据的存储方法,所述方法包括:随着海上风力发电机组的运行,对故障时刻的海上风力发电机组的全变量样本数据进行存储;确定是否满足用于海上风力发电机组故障诊断的机器学习模型的更新条件;当满足所述更新条件时,基于已存储的全变量样本数据,确定与所述故障诊断相关度最高的第一预定数量的特征变量,以构成第一特征变量集合;判断第一特征变量集合与第二特征变量集合中的元素是否完全相同,其中,上一次基于已存储的全变量样本数据确定的与所述故障诊断相关度最高的第一预定数量的特征变量构成第二特征变量集合;当确定完全相同时,使用已存储的特征变量样本数据和全变量样本数据,基于第一特征变量集合更新所述机器学习模型;当确定不相同时,使用已存储的全变量样本数据,基于第一特征变量集合更新所述机器学习模型,并删除已存储的特征变量样本数据;在本次更新完所述机器学习模型之后且在下次更新所述机器学习模型之前,当已存储的全变量样本数据的条数达到第一预设阈值时,按照第一特征变量集合中的各个特征变量,对已存储的全变量样本数据进行特征提取以得到特征变量样本数据并进行存储,并删除已被提取了特征的全变量样本数据。
可选地,基于第一特征变量集合更新所述机器学习模型的步骤包括:基于第一特征变量集合之中第二预定数量的特征变量更新所述机器学习模型,其中,第二预定数量小于第一预定数量。
可选地,基于第一特征变量集合之中第二预定数量的特征变量更新所述机器学习模型的步骤包括:选取第一特征变量集合之中与所述故障诊断相关度最高的第二预定数量的特征变量,并基于选取的特征变量训练所述机器学习模型;当训练出的机器学习模型的准确度满足准确度阈值时,将当前训练完的机器学习模型作为更新后的机器学习模型;当训练出的机器学习模型的准确度不满足准确度阈值时,调整模型相关参数后重新训练所述机器学习模型;当调整参数后训练出的机器学习模型的准确度满足准确度阈值时,将当前训练完的机器学习模型作为更新后的机器学习模型;当调整参数后训练出的机器学习模型的准确度不满足准确度阈值时,重复地从第一特征变量集合中重新选取第二预定数量的特征变量,并基于重新选取的特征变量训练所述机器学习模型,直到得到准确度满足准确度阈值的机器学习模型作为更新后的机器学习模型。
可选地,所述更新条件包括以下项之中的至少一项:所述机器学习模型诊断故障的准确度不满足准确度阈值;和/或,在上一次更新完所述机器学习模型之后,新存储的全变量样本数据的总条数超过第二预设阈值。
可选地,所述方法还包括:当不满足所述更新条件时,当已存储的全变量样本数据的条数达到第一预设阈值时,按照第二特征变量集合中的各个特征变量,对已存储的全变量样本数据进行特征提取以得到特征变量样本数据并进行存储,并删除已被提取了特征的全变量样本数据。
可选地,所述机器学习模型用于诊断的故障包括以下项之中的至少一项:发电机过温故障、叶轮转速超限故障、机头振动超限故障。
可选地,全变量样本数据包括通过所有数据采集通道采集的海上风力发电机组的运行数据。
根据本发明的另一示例性实施例,提供一种海上风机故障诊断模型的样本数据的存储设备,所述设备包括:全变量存储单元,随着海上风力发电机组的运行,对故障时刻的海上风力发电机组的全变量样本数据进行存储;更新判断单元,确定是否满足用于海上风力发电机组故障诊断的机器学习模型的更新条件;特征确定单元,当满足所述更新条件时,基于已存储的全变量样本数据,确定与所述故障诊断相关度最高的第一预定数量的特征变量,以构成第一特征变量集合;集合判断单元,判断第一特征变量集合与第二特征变量集合中的元素是否完全相同,其中,上一次基于已存储的全变量样本数据确定的与所述故障诊断相关度最高的第一预定数量的特征变量构成第二特征变量集合;更新单元,当确定完全相同时,使用已存储的特征变量样本数据和全变量样本数据,基于第一特征变量集合更新所述机器学习模型;当确定不相同时,使用已存储的全变量样本数据,基于第一特征变量集合更新所述机器学习模型,并删除已存储的特征变量样本数据;特征变量存储单元,在本次更新完所述机器学习模型之后且在下次更新所述机器学习模型之前,当已存储的全变量样本数据的条数达到第一预设阈值时,按照第一特征变量集合中的各个特征变量,对已存储的全变量样本数据进行特征提取以得到特征变量样本数据并进行存储,并删除已被提取了特征的全变量样本数据。
可选地,更新单元基于第一特征变量集合之中第二预定数量的特征变量更新所述机器学习模型,其中,第二预定数量小于第一预定数量。
可选地,更新单元执行以下处理:选取第一特征变量集合之中与所述故障诊断相关度最高的第二预定数量的特征变量,并基于选取的特征变量训练所述机器学习模型;当训练出的机器学习模型的准确度满足准确度阈值时,将当前训练完的机器学习模型作为更新后的机器学习模型;当训练出的机器学习模型的准确度不满足准确度阈值时,调整模型相关参数后重新训练所述机器学习模型;当调整参数后训练出的机器学习模型的准确度满足准确度阈值时,将当前训练完的机器学习模型作为更新后的机器学习模型;当调整参数后训练出的机器学习模型的准确度不满足准确度阈值时,重复地从第一特征变量集合中重新选取第二预定数量的特征变量,并基于重新选取的特征变量训练所述机器学习模型,直到得到准确度满足准确度阈值的机器学习模型作为更新后的机器学习模型。
可选地,所述更新条件包括以下项之中的至少一项:所述机器学习模型诊断故障的准确度不满足准确度阈值;和/或,在上一次更新完所述机器学习模型之后,新存储的全变量样本数据的总条数超过第二预设阈值。
可选地,特征变量存储单元当不满足所述更新条件时,当已存储的全变量样本数据的条数达到第一预设阈值时,按照第二特征变量集合中的各个特征变量,对已存储的全变量样本数据进行特征提取以得到特征变量样本数据并进行存储,并删除已被提取了特征的全变量样本数据。
可选地,所述机器学习模型用于诊断的故障包括以下项之中的至少一项:发电机过温故障、叶轮转速超限故障、机头振动超限故障。
可选地,全变量样本数据包括通过所有数据采集通道采集的海上风力发电机组的运行数据。
根据本发明的另一示例性实施例,提供一种存储有计算机程序的计算机可读存储介质,当所述计算机程序被处理器执行时实现如上所述的海上风机故障诊断模型的样本数据的存储方法。
根据本发明的另一示例性实施例,提供一种计算装置,所述计算装置包括:处理器;存储器,存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的海上风机故障诊断模型的样本数据的存储方法。
根据本发明示例性实施例的海上风机故障诊断模型的样本数据的存储方法及设备,一方面能够降低用于海上风力发电机组故障诊断的机器学习模型更新的样本数据所需的存储空间,从而降低对服务器的存储空间的占用,以降低服务器成本;另一方面,能够保障对用于海上风力发电机组故障诊断的机器学习模型的可靠更新,以满足对其的准确度要求。
将在接下来的描述中部分阐述本发明总体构思另外的方面和/或优点,还有一部分通过描述将是清楚的,或者可以经过本发明总体构思的实施而得知。
具体实施方式
现将详细参照本发明的实施例,所述实施例的示例在附图中示出,其中,相同的标号始终指的是相同的部件。以下将通过参照附图来说明所述实施例,以便解释本发明。
图1示出根据本发明示例性实施例的海上风机故障诊断模型的样本数据的存储方法的流程图。
这里,所述模型是用于海上风力发电机组故障诊断的机器学习模型。作为示例,所述机器学习模型用于诊断的故障可包括以下项之中的至少一项:发电机过温故障、叶轮转速超限故障、机头振动超限故障。应该理解,所述机器学习模型也可用于诊断海上风力发电机组的其他类型的故障,本发明对此不作限制。作为示例,所述机器学习模型可以是使用适当的机器学习算法构建的,例如,人工神经网络算法、模式识别算法等,本发明对此不作限制。
参照图1,在步骤S10,随着海上风力发电机组的运行,对故障时刻的海上风力发电机组的全变量样本数据进行存储。
换言之,在海上风力发电机组的整个运行过程中,均对发生所述机器学习模型所诊断的故障类型的故障时的海上风力发电机组的全变量样本数据进行存储,也即对故障数据记录进行存储。
作为示例,全变量样本数据可包括通过海上风力发电机组的所有数据采集通道采集的海上风力发电机组的运行数据。例如,数据采集通道可包括:机舱加速度采集通道、叶轮转速采集通道、输出功率采集通道等,本发明对此不作限制。作为示例,数据采集通道的采集周期可为毫秒级。
在步骤S20,确定是否满足用于海上风力发电机组故障诊断的机器学习模型的更新条件。
作为示例,所述更新条件可包括以下项之中的至少一项:所述机器学习模型诊断故障的准确度不满足准确度阈值;和/或,在上一次更新完所述机器学习模型之后,新存储的全变量样本数据的总条数超过第二预设阈值。
当在步骤S20确定满足所述更新条件时,执行步骤S30,基于已存储的全变量样本数据,确定与所述故障诊断相关度最高的第一预定数量的特征变量,以构成第一特征变量集合。
具体说来,基于当前存储的还未被处理成特征变量样本数据的全变量样本数据,确定与所述故障诊断相关度最高的第一预定数量的特征变量。应该理解,可通过各种适当的方法来基于已存储的全变量样本数据,确定与所述故障诊断相关度最高的第一预定数量的特征变量,例如,主成分分析法、相关性分析等。
在步骤S40,判断第一特征变量集合与第二特征变量集合中的元素是否完全相同。
这里,上一次(即,上一次执行步骤S30时)基于已存储(即,上一次执行步骤S30时已存储)的全变量样本数据确定的与所述故障诊断相关度最高的第一预定数量的特征变量构成第二特征变量集合。
当在步骤S40确定完全相同时,执行步骤S50,使用已存储的特征变量样本数据和全变量样本数据,基于第一特征变量集合更新所述机器学习模型。
应该理解,基于第一特征变量集合更新所述机器学习模型即:将按照第一特征变量集合之中全部或部分特征变量提取的数据作为所述机器学习模型的输入。
作为示例,可基于第一特征变量集合之中第二预定数量的特征变量更新所述机器学习模型,其中,第二预定数量小于第一预定数量。例如,可基于第一特征变量集合之中与所述故障诊断相关度最高的第二预定数量的特征变量更新所述机器学习模型。
应该理解,已被使用过用来更新机器学习模型的特征变量样本数据可被继续存储或当满足一定条件(例如,存储超过预定时长、已存储的特征变量样本数据的条数超过一定数量等)时被删除。
当在步骤S40确定不相同时,执行步骤S60,使用已存储的全变量样本数据,基于第一特征变量集合更新所述机器学习模型,并删除已存储的特征变量样本数据。
作为示例,可基于第一特征变量集合之中第二预定数量的特征变量更新所述机器学习模型,其中,第二预定数量小于第一预定数量。例如,可基于第一特征变量集合之中与所述故障诊断相关度最高的第二预定数量的特征变量更新所述机器学习模型。
在步骤S70,在本次更新完所述机器学习模型之后且在下次更新所述机器学习模型之前,当已存储的全变量样本数据的条数达到第一预设阈值时,按照第一特征变量集合中的各个特征变量,对已存储的全变量样本数据进行特征提取以得到特征变量样本数据并进行存储,并删除已被提取了特征的全变量样本数据。
相应地,在上一次更新完所述机器学习模型之后且在本次更新所述机器学习模型之前,当已存储的全变量样本数据的条数达到第一预设阈值时,按照第二特征变量集合中的各个特征变量,对已存储的全变量样本数据进行特征提取以得到特征变量样本数据并进行存储,并删除已被提取了特征的全变量样本数据。从而,当本次确定的与所述故障诊断相关度最高的第一预定数量的特征变量与上一次确定的相同时,可直接使用之前基于特征变量集合处理并存储的特征变量样本数据。
考虑到机组故障数据记录包括几百个全变量的毫秒级数据,但实际与所述故障诊断相关度高的能够用于建模的变量只占其中的一小部分,因此,本发明基于与所述故障诊断相关度来减少所存储的采集通道变量的数据以降低数据存储所占用的空间。并且,当第一特征变量集合与第二特征变量集合不同时(例如,机组整体运行工况发生变化),使得之前基于第二特征变量集合提取并存储的特征变量样本数据均不能被使用,但由于只有当已存储的全变量样本数据达到一定数量时才会被提取成特征变量样本数据进行存储,所以能够保证有未被处理的全变量样本数据供模型更新。
根据本发明的示例性实施例,可基于第一特征变量集合之中第二预定数量的特征变量更新所述机器学习模型,其中,第二预定数量小于第一预定数量。虽然在实际更新机器学习模型时,仅使用了第一特征变量集合中的部分特征变量(通常是相关度最高的第二预定数量的特征变量),但在更新完机器学习模型之后存储特征变量样本数据时,仍会按照第一特征变量集合中的全部特征变量进行提取并存储,目的是为了在一定程度上增加存储的特征变量样本数据的容错率,使得即使下一次更新机器学习模型时所使用的特征变量不全是本次所使用的特征变量,但只要全被包括在第一特征变量集合中,就可以使用之前基于第一特征变量集合提取并存储的特征变量样本数据。从而本发明既能够实现对用于模型更新的样本数据的压缩存储,也能够很大程度上保证有足够的样本数据用于模型更新。
作为示例,第一预设阈值的取值范围可为300~500。
当在步骤S20确定不满足所述更新条件时,执行步骤S80,当已存储的全变量样本数据的条数达到第一预设阈值时,按照第二特征变量集合中的各个特征变量,对已存储的全变量样本数据进行特征提取以得到特征变量样本数据并进行存储,并删除已被提取了特征的全变量样本数据。换言之,继续按照之前确定的第二特征变量集合来对全变量样本数据进行特征提取以得到特征变量样本数据进行存储。
此外,应该理解,第二特征变量集合的初始值(即,第一次执行所述方法时的第二特征变量集合)可为在创建所述机器学习模型时确定的与所述故障诊断相关度最高的第一预定数量的特征变量。
图2示出根据本发明示例性实施例的基于第一特征变量集合之中第二预定数量的特征变量更新机器学习模型的方法的流程图。应该理解,在执行步骤S50和步骤S60时均可使用该方法,仅是更新机器学习模型所使用的训练数据集不同。
参照图2,在步骤S101,选取第一特征变量集合之中与所述故障诊断相关度最高的第二预定数量的特征变量,并基于选取的特征变量训练所述机器学习模型。
在步骤S102,判断训练出的机器学习模型的准确度是否满足准确度阈值。
当在步骤S102确定训练出的机器学习模型的准确度满足准确度阈值时,执行步骤S103,将当前训练完的机器学习模型作为更新后的机器学习模型。
当在步骤S102确定训练出的机器学习模型的准确度不满足准确度阈值时,执行步骤S104,调整模型相关参数后重新训练所述机器学习模型。
作为示例,模型相关参数可包括以下项之中的至少一项:训练参数(例如,训练轮数)、机器学习算法的参数。
在步骤S105,判断调整参数后训练出的机器学习模型的准确度是否满足准确度阈值。
当在步骤S105确定调整参数后训练出的机器学习模型的准确度满足准确度阈值时,执行步骤S106,将当前训练完的机器学习模型作为更新后的机器学习模型。
当在步骤S105确定调整参数后训练出的机器学习模型的准确度不满足准确度阈值时,执行步骤S107,重复地从第一特征变量集合中重新选取第二预定数量的特征变量,并基于重新选取的特征变量训练所述机器学习模型,直到得到准确度满足准确度阈值的机器学习模型作为更新后的机器学习模型。
例如,可仅保留第一特征变量集合之中与所述故障诊断相关度最高的第二预定数量的特征变量之中的部分特征变量,再从第一特征变量集合中的除与所述故障诊断相关度最高的第二预定数量的特征变量以外的特征变量中选择一些特征变量,以实现从第一特征变量集合中重新选取第二预定数量的特征变量。
应该理解,可多次调整参数,当调整次数达到一定次数后,仍不能使机器学习模型的准确度满足准确度阈值,则执行步骤S107。
图3示出根据本发明示例性实施例的海上风机故障诊断模型的样本数据的存储设备的结构框图。
参照图3,根据本发明示例性实施例的存储用于模型更新的样本数据的设备包括:全变量存储单元10、更新判断单元20、特征确定单元30、集合判断单元40、更新单元50、以及特征变量存储单元60。
具体说来,全变量存储单元10用于随着海上风力发电机组的运行,对故障时刻的海上风力发电机组的全变量样本数据进行存储。
更新判断单元20用于确定是否满足用于海上风力发电机组故障诊断的机器学习模型的更新条件。
特征确定单元30用于当满足所述更新条件时,基于已存储的全变量样本数据,确定与所述故障诊断相关度最高的第一预定数量的特征变量,以构成第一特征变量集合。
集合判断单元40用于判断第一特征变量集合与第二特征变量集合中的元素是否完全相同,其中,上一次基于已存储的全变量样本数据确定的与所述故障诊断相关度最高的第一预定数量的特征变量构成第二特征变量集合。
更新单元50用于当确定完全相同时,使用已存储的特征变量样本数据和全变量样本数据,基于第一特征变量集合更新所述机器学习模型;当确定不相同时,使用已存储的全变量样本数据,基于第一特征变量集合更新所述机器学习模型,并删除已存储的特征变量样本数据。
特征变量存储单元60用于在本次更新完所述机器学习模型之后且在下次更新所述机器学习模型之前,当已存储的全变量样本数据的条数达到第一预设阈值时,按照第一特征变量集合中的各个特征变量,对已存储的全变量样本数据进行特征提取以得到特征变量样本数据并进行存储,并删除已被提取了特征的全变量样本数据。
作为示例,更新单元50可基于第一特征变量集合之中第二预定数量的特征变量更新所述机器学习模型,其中,第二预定数量小于第一预定数量。
作为示例,更新单元50可执行以下处理:选取第一特征变量集合之中与所述故障诊断相关度最高的第二预定数量的特征变量,并基于选取的特征变量训练所述机器学习模型;当训练出的机器学习模型的准确度满足准确度阈值时,将当前训练完的机器学习模型作为更新后的机器学习模型;当训练出的机器学习模型的准确度不满足准确度阈值时,调整模型相关参数后重新训练所述机器学习模型;当调整参数后训练出的机器学习模型的准确度满足准确度阈值时,将当前训练完的机器学习模型作为更新后的机器学习模型;当调整参数后训练出的机器学习模型的准确度不满足准确度阈值时,重复地从第一特征变量集合中重新选取第二预定数量的特征变量,并基于重新选取的特征变量训练所述机器学习模型,直到得到准确度满足准确度阈值的机器学习模型作为更新后的机器学习模型。
作为示例,所述更新条件可包括以下项之中的至少一项:所述机器学习模型诊断故障的准确度不满足准确度阈值;和/或,在上一次更新完所述机器学习模型之后,新存储的全变量样本数据的总条数超过第二预设阈值。
作为示例,特征变量存储单元60可当不满足所述更新条件时,当已存储的全变量样本数据的条数达到第一预设阈值时,按照第二特征变量集合中的各个特征变量,对已存储的全变量样本数据进行特征提取以得到特征变量样本数据并进行存储,并删除已被提取了特征的全变量样本数据。
作为示例,所述机器学习模型用于诊断的故障可包括以下项之中的至少一项:发电机过温故障、叶轮转速超限故障、机头振动超限故障。
作为示例,全变量样本数据可包括通过所有数据采集通道采集的海上风力发电机组的运行数据。
应该理解,根据本发明示例性实施例的海上风机故障诊断模型的样本数据的存储设备所执行的具体处理已经参照图1-2进行了详细描述,这里将不再赘述相关细节。
应该理解,根据本发明示例性实施例的海上风机故障诊断模型的样本数据的存储设备中的各个单元可被实现硬件组件和/或软件组件。本领域技术人员根据限定的各个装置所执行的处理,可以例如使用现场可编程门阵列(FPGA)或专用集成电路(ASIC)来实现各个装置。
本发明的示例性实施例提供一种存储有计算机程序的计算机可读存储介质,当所述计算机程序被处理器执行时实现如上述示例性实施例所述的海上风机故障诊断模型的样本数据的存储方法。该计算机可读存储介质是可存储由计算机系统读出的数据的任意数据存储装置。计算机可读存储介质的示例包括:只读存储器、随机存取存储器、只读光盘、磁带、软盘、光数据存储装置和载波(诸如经有线或无线传输路径通过互联网的数据传输)。
根据本发明的示例性实施例的计算装置包括:处理器(未示出)和存储器(未示出),其中,存储器存储有计算机程序,当所述计算机程序被处理器执行时,实现如上述示例性实施例所述的海上风机故障诊断模型的样本数据的存储方法。
虽然已表示和描述了本发明的一些示例性实施例,但本领域技术人员应该理解,在不脱离由权利要求及其等同物限定其范围的本发明的原理和精神的情况下,可以对这些实施例进行修改。