CN114818460A - 基于自动机器学习的实验室设备剩余使用寿命预测方法 - Google Patents
基于自动机器学习的实验室设备剩余使用寿命预测方法 Download PDFInfo
- Publication number
- CN114818460A CN114818460A CN202210216069.2A CN202210216069A CN114818460A CN 114818460 A CN114818460 A CN 114818460A CN 202210216069 A CN202210216069 A CN 202210216069A CN 114818460 A CN114818460 A CN 114818460A
- Authority
- CN
- China
- Prior art keywords
- machine learning
- data
- service life
- time sequence
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/04—Ageing analysis or optimisation against ageing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Abstract
本发明涉及一种基于自动机器学习的实验室设备剩余使用寿命预测方法,包括获取设备的原始时序信号数据;使用TSFRESH算法提取原始时序信号的时序特征;根据特征的权重系数对时序特征进行筛选,得到特征子集;使用层次任务规划网络为特征子集匹配机器学习管道;将特征子集输入机器学习管道,得到对应设备的剩余使用寿命。与现有技术相比,本发明具有预测结果更精确等优点。
Description
技术领域
本发明涉及故障预测与健康管理领域,尤其是涉及一种基于自动机器学习的实验室设备剩余使用寿命预测方法。
背景技术
随着科学技术的不断进步,工业水平的不断提高,政府、高校及其他企事业单位对实验室建设的重视程度与日俱增。先进的仪器设备和研究手段大幅提升了实验效率及研究领域,自动化、信息化已经成为实验室未来的重要发展趋势。应教育事业的发展需求,高校投入了更多的专项资金用于实验室的规划和建设。实验室仪器和设备的更新换代,对实验室管理也提出了更高的要求。如何能够高效、智能地实现实验室及设备管理,使其最大程度地发挥作用,是实验室管理中的一项重要课题。同时,为了确保实验工作的有序顺利进行,以及保障人身及财产安全,实验室的安全管理工作至关重要。由于高校实验室的设备众多、运行时间长、负荷大、人员密集,环境较为复杂,若一但发生事故,将产生较大的影响和危害。因此,运行维护和日常保养是实验室管理的重要工作。安全管理应以预防为主,从源头降低或杜绝事故发生的概率;提高设备的可靠性,延长设备的无故障运行时间,从而提高实验室的整体利用率。
在现有技术中,可通过对实验室设备的剩余使用寿命进行预测来对设备进行及时维护,但现有的预测方法无法实现对剩余使用寿命的精准预测,继而无法保证设备的可靠运行,实用性较差。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于自动机器学习的实验室设备剩余使用寿命预测方法。
本发明的目的可以通过以下技术方案来实现:
一种基于自动机器学习(AutoML)的实验室设备剩余使用寿命预测方法,包括以下步骤:
S1、获取设备的原始时序信号数据;
S2、使用时间序列特征提取(TSFRESH)算法提取原始时序信号的时序特征;
S3、根据特征的权重系数对时序特征进行筛选,得到特征子集;
S4、使用层次任务规划网络(HTN)为特征子集匹配机器学习管道;
S5、将特征子集输入机器学习管道,得到对应设备的剩余使用寿命(RUL)。
进一步地,所述机器学习管道包括预处理器和分类器,所述预处理器用于对特征子集进行数据预处理,所述分类器将预处理后的特征子集映射到预测算法上。
进一步地,得到机器学习管道后,使用超参数优化方法对机器学习管道的参数进行调优。
进一步地,所述超参数优化方法包括随机搜索、网格搜索或贝叶斯优化。
进一步地,所述步骤S3具体如下:
S31、使用假设检验法获取时序特征的评估结果;
S32、根据评估结果结合故障提取率获取特征的权重系数;
S33、根据权重系数大小对特征进行排序及筛选。
进一步地,所述步骤S31中,对于不同的时序特征采用不同的假设检验方法:
若特征和标签都是二分类的,则使用fisher检验;
若特征是二分类而标签是连续值,则使用K-S检验;
若特征是连续值而标签是二分类,则使用K-S检验或者曼-惠特尼U检验;
若特征和标签都是连续值,则使用kendall相关系数检验。
进一步地,使用非对称损失函数对预测结果进行评估。
进一步地,所述非对称损失函数L(Dtest)的表达式如下:
式中,N表示设备数量,ak为设备k的剩余寿命估计精度。
进一步地,设备的原始时序信号数据获取方法如下:
采集设备上传感器的原始数据,经过提取、变换和加载,组合成为便于分析的统一原始时序信号数据源。
进一步地,得到原始时序信号后使用数据清洗、数据集成、数据变换和数据归约对数据进行预处理。
与现有技术相比,本发明具有以下优点:
1、本发明获取了设备的时序信号数据,使用TSFRESH算法快速提取特征后,对特征进行了筛选,并使用层次任务规划网络自动匹配对应的机器学习管道,对特征进行处理并输入机器学习算法,得到设备剩余使用寿命的预测结果,实现了设备的有效维护。本发明结合了机器学习以及层次任务规划网络,预测的精度高,且计算复杂度低,适用于实时的维护需求。
2、本发明对于不同的时间序列特征及标签选用了不同的假设检验方法,使时间序列及其特征的相关性计算更精确,进一步提高了预测的精度。
3、由于高估剩余使用寿命比低估剩余使用寿命带来的后果更严重,本发明采用了非对称损失函数对预测结果进行评估,使得结果的优化方向更准确。
4、本发明对原始数据以及得到的特征均进行了数据的预处理整合,简化了计算,提高了预测的效率。
附图说明
图1为本发明的流程示意图。
图2为本发明的数据预处理流程示意图。
图3为本发明层次任务规划网络的应用原理示意图。
图4为本发明整体执行流程框图。
图5为本发明获取预测结果以及后续诊断流程框图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
本实施例提供了一种基于自动机器学习的实验室设备剩余使用寿命预测方法,如图1所示,具体包括以下步骤:
步骤S1、通过传感器获取并整合设备的原始时序信号数据;
步骤S2、使用TSFRESH算法采用多种时间序列表征方法提取原始时序信号的时序特征;
步骤S3、基于假设检验和过滤器获取特征的权重系数,根据特征的权重系数对时序特征进行筛选,得到特征子集;
步骤S4、使用层次任务规划网络为特征子集匹配机器学习管道;
步骤S5、将特征子集输入机器学习管道,得到对应设备的剩余使用寿命。
其中,步骤S1具体展开如下:
首先将传感器传输的数据应用异步队列的方式写入数据库中相应的数据表中,同一设备上的同一种传感器写入相同的表中,以自动增长的ID作为主标识,并且自动写入时间戳。然后操作多个一对一、一对多或多对多的关系表,将不同来源的数据整合在一起,通过各级标识将数据汇聚成所需的分析级别,即ETL过程,该过程使得数据更便于后续的计算和分析。
步骤S2具体展开如下:
首先,需要对数据进行预处理操作,以简化后续提取特征时的计算,主要内容包括数据清洗、数据集成、数据变换和数据规约。数据清洗主要是删除原始数据集中的无关数据、重复数据、异常数据以及噪声数据,采用拉格朗日插值法对缺失数据进行插补,如图2所示;数据集成主要处理来自多个数据源的不同形式的数据表达,将源数据从底层加以转换、提炼和集成,经过整合减少数据表达的冗余与不一致,从而提高数据挖掘的速度和质量;数据变换包括归一化、函数变换等,主要是对数据进行规范化处理,将数据转换成适当的形式,以适用于算法的需要;数据归约用于从源数据中得到数据集的归约表示,主要方法包括特征归约、样本归约和特征值归约,经归约后的数据所占空间变小,但信息量基本保持不变。
经过预处理后,由于数据和传感器以及设备相关,表现为长度不同的多元数据形式。因此采用TSFRESH算法进行时序信号特征的自动化提取。将设备表示为si,相对于传感器k,其测量值为相对于t的时间序列连续变量si,k(t)。设采样信息是一个长度为q的序列,表示为:si,k(t1),si,k(t2),...,si,k(tq)。设备数量为i=1,...,m个设备,平均每个设备的传感器数量为k=1,...,n,则时间序列的数量为m·n个。为了减少数据量,对时间序列进行提取,其构成的特征矩阵和目标向量是监督分类算法的基础。
步骤S3包括以下步骤:
步骤S31、使用假设检验法获取时序特征的评估结果;
步骤S32、根据评估结果结合故障提取率获取特征的权重系数;
步骤S33、根据权重系数大小对特征进行排序及筛选。
其中可具体展开如下:
在得到了所有的特征集合后,通过相关性分析过滤器过滤掉特征集合中的冗余特征。首先根据不同的时间序列采取不同的假设检验方法:如果特征和标签都是二分类的,则使用fisher检验;若特征是二分类而标签是连续值,则使用K-S检验;若特征是连续值而标签是二分类,则使用K-S检验或者曼-惠特尼U检验;若特征和标签都是连续值,则使用kendall相关系数检验。将Benjamini-Yekutieli过程作为过滤器,该过程是一种全局推理错误度量,用于控制参照故障提取率(false extraction rate,FER),其计算公式如下:
通过计算的FER值可确定所提取特征的权重系数w,并根据w对特征进行排序,根据排序结果确定是否保留此特征,不被保留的特征从特征集合中删除,得到特征子集。
步骤S4具体展开如下:
层次任务规划网络是一种智能规划技术,突破了以往规划技术。分层任务网络(HTN)是一个部分有序的任务集T。任务t(v0,...,vn)是一个带有参数列表的名称,这些参数是来自L的变量或常量。由操作符命名的任务被称为原子任务,否则是复杂任务。参数为常数的任务是基础。规划的目标是达到完成某一任务的集合,规划系统的输入包含一个实现目标的动作集合和一个分解任务的方法集合,规划的过程就是递归地将非原子任务分解成可以直接执行规划动作就能完成的原子任务,其原理如图3所示。
在本实施例中,层次任务规划网络的规划目标是找到一个机器学习管道,管道用于获取寿命的预测结果,由参数化预处理器和学习器组成,该管道将输入数据与采用处理方法相关联。这种情况下,可以应用两种类型的算法。预处理器处理对象包括降维方法、特征选择、插补、离散化、归一化等预处理方法。学习器将数据集映射到预测算法上。规划目标通常通过简化为标准图搜索问题来解决,如深度优先搜索、最佳优先搜索等算法,搜索空间元素(机器学习管道)和目标节点之间存在一一对应的关系。
本实施例采用最佳优先搜索算法来识别好的管道。最佳优先搜索算法通过为每个节点分配一个数字并在每次迭代中选择具有当前最佳(通常是最低)已知扩展值的节点来探索隐式给定的图。扩展意味着计算一个节点的所有后继节点。图描述由根节点、用于扩展的后继计算函数以及节点上的谓词组成,该谓词表明节点是否为目标节点。任务是找到一条从根到目标节点的路径,得分最小,最佳优先算法试图通过扩展得分最小的中间节点来找到这样的路径。
在获取机器学习管道后,可使用超参数优化采用工具Ray.tune对机器学习管道的参数进行优化,其集成了多种超参优化方法,包括随机搜索、网格搜索或贝叶斯优化等,根据从超参空间中取出的一组超参配置对其进行评估;每组超参配置组成的评估可称为一次Trail,并且Tune支持多个Trails并行运行。其中配置可以从Tune中生成,也可以从用户指定的搜索算法中获得。
给定一组带有标签的特征数据D,该任务包括将上述算法组合到管道C中,该管道将D作为输入,生成最优预测器ψ=C(D)并输出。该预测器的目标函数如下:
式中,App和Alearn分别表示参数化预处理和学习算法空间,loss(y,ψ(x))表示惩罚项,x表示历史数据,y表示预测结果,X和Y均为对应的数据集合,而P表示联合概率分布。
最终在步骤S5中,应用得到的最优预测器对设备的剩余使用寿命进行预测,预测数据可通过损失函数衡量。一般来说,低估剩余使用寿命带来的负面影响比高估剩余使用寿命要少,因为后者会导致故障,故障造成的损失要大于过早更换器件。因此,使用非对称损失函数进行问题描述。非对称损失函数L(Dtest)的表达式如下:
式中,N表示设备数量,ak为设备k的剩余寿命估计精度。
得到预测结果后,可使用平均绝对百分比误差作为评价性能的指标,并可生成预测设备剩余使用寿命的模型,并在自动建模过程中打印训练损失曲线,供用户监控其变化规律,最终呈现的整体流程框图如图4所示。
得到设备的剩余使用寿命预测结果后,可根据该结果对设备进行诊断、预后及健康管理,具体流程框图如图5所示。
本实施例还提供了一种基于自动机器学习的实验室设备剩余使用寿命预测装置,包括存储器和处理器;存储器,用于存储计算机程序;处理器执行上述基于自动机器学习的实验室设备剩余使用寿命预测方法。
本实施例又提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本实施例中提到的基于自动机器学习的实验室设备剩余使用寿命预测方法,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (10)
1.一种基于自动机器学习的实验室设备剩余使用寿命预测方法,其特征在于,包括以下步骤:
S1、获取设备的原始时序信号数据;
S2、使用TSFRESH算法提取原始时序信号的时序特征;
S3、根据特征的权重系数对时序特征进行筛选,得到特征子集;
S4、使用层次任务规划网络为特征子集匹配机器学习管道;
S5、将特征子集输入机器学习管道,得到对应设备的剩余使用寿命。
2.根据权利要求1所述的一种基于自动机器学习的实验室设备剩余使用寿命预测方法,其特征在于,所述机器学习管道包括预处理器和分类器,所述预处理器用于对特征子集进行数据预处理,所述分类器将预处理后的特征子集映射到预测算法上。
3.根据权利要求1所述的一种基于自动机器学习的实验室设备剩余使用寿命预测方法,其特征在于,得到机器学习管道后,使用超参数优化方法对机器学习管道的参数进行调优。
4.根据权利要求3所述的一种基于自动机器学习的实验室设备剩余使用寿命预测方法,其特征在于,所述超参数优化方法包括随机搜索、网格搜索或贝叶斯优化。
5.根据权利要求1所述的一种基于自动机器学习的实验室设备剩余使用寿命预测方法,其特征在于,所述步骤S3具体如下:
S31、使用假设检验法获取时序特征的评估结果;
S32、根据评估结果结合故障提取率获取特征的权重系数;
S33、根据权重系数大小对特征进行排序及筛选。
6.根据权利要求5所述的一种基于自动机器学习的实验室设备剩余使用寿命预测方法,其特征在于,所述步骤S31中,对于不同的时序特征采用不同的假设检验方法:
若特征和标签都是二分类的,则使用fisher检验;
若特征是二分类而标签是连续值,则使用K-S检验;
若特征是连续值而标签是二分类,则使用K-S检验或者曼-惠特尼U检验;
若特征和标签都是连续值,则使用kendall相关系数检验。
7.根据权利要求1所述的一种基于自动机器学习的实验室设备剩余使用寿命预测方法,其特征在于,使用非对称损失函数对预测结果进行评估。
9.根据权利要求1所述的一种基于自动机器学习的实验室设备剩余使用寿命预测方法,其特征在于,设备的原始时序信号数据获取方法如下:
采集设备上传感器的原始数据,经过提取、变换和加载,组合成为便于分析的统一原始时序信号数据源。
10.根据权利要求1所述的一种基于自动机器学习的实验室设备剩余使用寿命预测方法,其特征在于,得到原始时序信号后使用数据清洗、数据集成、数据变换和数据归约对数据进行预处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210216069.2A CN114818460A (zh) | 2022-03-07 | 2022-03-07 | 基于自动机器学习的实验室设备剩余使用寿命预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210216069.2A CN114818460A (zh) | 2022-03-07 | 2022-03-07 | 基于自动机器学习的实验室设备剩余使用寿命预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114818460A true CN114818460A (zh) | 2022-07-29 |
Family
ID=82528461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210216069.2A Pending CN114818460A (zh) | 2022-03-07 | 2022-03-07 | 基于自动机器学习的实验室设备剩余使用寿命预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114818460A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115330094A (zh) * | 2022-10-14 | 2022-11-11 | 成都秦川物联网科技股份有限公司 | 智慧燃气管道寿命预测方法、物联网系统、装置及介质 |
-
2022
- 2022-03-07 CN CN202210216069.2A patent/CN114818460A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115330094A (zh) * | 2022-10-14 | 2022-11-11 | 成都秦川物联网科技股份有限公司 | 智慧燃气管道寿命预测方法、物联网系统、装置及介质 |
US11898704B2 (en) | 2022-10-14 | 2024-02-13 | Chengdu Qinchuan Iot Technology Co., Ltd. | Methods and Internet of Things systems for smart gas pipeline life prediction based on safety |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Vrignat et al. | Sustainable manufacturing, maintenance policies, prognostics and health management: A literature review | |
Jurado et al. | Fuzzy inductive reasoning forecasting strategies able to cope with missing data: A smart grid application | |
Plathottam et al. | A review of artificial intelligence applications in manufacturing operations | |
Chen et al. | Adapipe: A recommender system for adaptive computation pipelines in cyber-manufacturing computation services | |
Velasco et al. | Trends and applications of machine learning in water supply networks management | |
CN111898673A (zh) | 一种基于emd与lstm的溶解氧含量预测方法 | |
KR20190072292A (ko) | 신체 성장 예측 모델링 장치 및 방법 | |
CN114818460A (zh) | 基于自动机器学习的实验室设备剩余使用寿命预测方法 | |
Mohanty et al. | The application of intelligent and soft-computing techniques to software engineering problems: a review | |
Varaprasad et al. | Stock Price Prediction using Machine Learning | |
Prasidis et al. | Handling uncertainty in predictive business process monitoring with Bayesian networks | |
Carbery et al. | A new data analytics framework emphasising pre-processing in learning AI models for complex manufacturing systems | |
Bond et al. | A hybrid learning approach to prognostics and health management applied to military ground vehicles using time-series and maintenance event data | |
Dudycz et al. | Advanced data analysis in multi-site enterprises. Basic problems and challenges related to the IT infrastructure | |
Morariu et al. | A distributed approach for machine learning in large scale manufacturing systems | |
Zhou et al. | Deep learning-based intelligent multilevel predictive maintenance framework considering comprehensive cost | |
Poornima et al. | Prediction of Water Consumption Using Machine Learning Algorithm | |
Riesener et al. | Methodology for Automated Master Data Management using Artificial Intelligence | |
Lara-Benítez et al. | On the performance of deep learning models for time series classification in streaming | |
CN113807704A (zh) | 一种城市轨道交通数据的智能算法平台构建方法 | |
Tahmasebi et al. | A data mining approach to predict companies’ financial distress | |
Katsouros et al. | A Bayesian approach for maintenance action recommendation | |
Alam et al. | Remaining useful life estimation using event data | |
Turkoglu et al. | Application of data mining in failure estimation of cold forging machines: An industrial research | |
Helgo | Deep Learning and Machine Learning Algorithms for Enhanced Aircraft Maintenance and Flight Data Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |