CN112464569A - 一种机器学习方法及系统 - Google Patents

一种机器学习方法及系统 Download PDF

Info

Publication number
CN112464569A
CN112464569A CN202011433273.7A CN202011433273A CN112464569A CN 112464569 A CN112464569 A CN 112464569A CN 202011433273 A CN202011433273 A CN 202011433273A CN 112464569 A CN112464569 A CN 112464569A
Authority
CN
China
Prior art keywords
algorithm
training
data
object model
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011433273.7A
Other languages
English (en)
Inventor
韩秀伟
王道广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Minglue Technology Co.,Ltd.
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN202011433273.7A priority Critical patent/CN112464569A/zh
Publication of CN112464569A publication Critical patent/CN112464569A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种机器学习方法及系统。机器学习方法包括:模型建立步骤:建立设备对象模型;数据存储步骤:mysql存储数据来源,将字段信息与设备对象模型映射关系、映射关系数据存储到MySql数据库中;算法管理步骤:将算法文件、配置文件打包上传,并根据所述配置文件的信息进行算法解析;训练任务创建步骤:新建训练任务并根据执行策略执行训练任务;预测任务创建步骤:新建预测任务根据执行策略执行预测任务。本发明提出了基于PHM数据建模的一站式机器学习平台,该平台立足于实际业务,为用户提供垂直领域场景化的解决方案,提高用户开发效率。

Description

一种机器学习方法及系统
技术领域
本申请涉及数据建模领域,尤其涉及一种机器学习方法及系统。
背景技术
继移动互联网后,人工智能(Artificial Intelligence,AI)站到了行业的风口上。无论是巨头厂商,还是业界新贵,都在大力研发AI技术,提升自己的技术竞争力,并为自家的业务赋能。机器学习作为AI技术的核心,是计算机智能化的基础。目前,机器学习已经带来很多应用,比如人脸识别、知识图谱等,各行业对机器学习都带有很高的期望,但与之矛盾的是,机器学习技术的应用门槛较高,每一步流程都需要专业知识,需要大量的时间对各流程进行优化。为了解决上述问题,构建一个集数据处理、算法上传、模型管理、任务训练/预测、在线预测服务等功能于一身的机器学习平台来辅助非算法开发人员,帮助其脱离繁琐的工程化开发,把有限的精力聚焦于机器学习一站式服务具有很强的现实意义和广泛的应用场景。通过机器学习平台,非算法工程师也可以立足于实际业务,搭建简单的机器学习模型,完成数据建模,解决用户所在垂直领域的业务需求。另外,在“智能制造2025”的大背景下,利用信息技术解决传统制造业中的痛点问题成为了当前的研究焦点。工业界和信息领域为解决设备故障与维修这一痛点,提出了故障预测与健康管理(PrognosticsHealth Management,PHM),其关键技术是基于机器学习进行故障诊断与预测。目前的机器学习平台为了降低使用门槛,对机器学习算法都进行了高度封装,而封装的算法只满足通用领域的需求,无法直接应对垂直领域的业务需求。
因此,针对以上现状,本发明提出一种机器学习方法及系统,本发明立足于公司内的实际需求进行了需求分析,明确了要解决的问题,并通过分析公司内部相关业务开发人员的需求,设计了平台的整体架构。通过方案解决流程图的形式对几大模块的主要功能进行了详细介绍,展示了几大模块的内部实现以及几大模块之间的协作关系。该平台针对PHM场景,建立一个支持多模型、多引擎的机器学习平台,为用户提供了从数据管理、算法管理、任务管理到平台服务的一站式全流程机器学习解决方案。该平台立足于实际业务,为用户提供垂直领域场景化的解决方案,提高用户开发效率。
发明内容
本申请实施例提供了一种机器学习方法及系统,以至少解决相关技术中主观因素影响的问题。
本发明提供了一种机器学习方法,包括:
模型建立步骤:建立设备对象模型;
数据存储步骤:封装大数据平台接口,调用所述接口将数据源信息存储到数据库中,配置所述设备对象模型的模型信息和字段信息的映射关系,并将所述映射关系和映射数据存储到所述数据库中;
算法管理步骤:上传算法,选择所述设备对象模型,上传算法文件及配置文件,根据所述配置文件中的信息解析算法参数,将所述算法参数存储到所述数据库中;
训练任务创建步骤:新建训练任务,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,根据时间范围从所述设备对象模型中选择实例数据后配置训练任务执行策略,并执行所述设备对象模型训练,将训练验证结果存储到所述数据库之后发布训练模型;
预测任务创建步骤:新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述预测算法参数定位所述设备对象模型并选择所述训练模型,发布所述预测任务,并按策略执行所述预测任务后存储预测结果。
上述的机器学习方法,所述模型建立步骤包括,建立设备对象模型,并添加所述设备对象模型的设备属性、测点数据信息。
上述的机器学习方法,所述数据存储步骤包括:
数据源存储步骤:封装大数据平台的influxdb的接口,调用所述influxdb接口将数据库名存储到MySql的数据源表中;
数据映射存储步骤:配置所述设备对象模型的属性、测点信息和所述字段信息的所述映射关系,并将所述映射关系和映射数据存储到所述MySql数据库中。
上述的机器学习方法,所述算法管理步骤包括:
算法上传步骤:上传算法,添加所述算法的属性,选择所述设备对象模型,并下载所述设备对象模型的数据,如需辅助文件则进行选择后打包上传算法文件、配置文件及辅助文件并保存到服务器中;
算法解析步骤:根据所述配置文件中信息解析所述算法参数,将所述算法参数与所述设备对象模型的所述测点数据信息进行对比,并将所述算法参数存储到所述数据库中。
上述的机器学习方法,所述训练任务创建步骤包括,新建训练任务,添加训练任务名称,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,并选择所述设备对象模型的实例数据时间范围,根据所述实例数据时间范围从所述设备对象模型中选择实例数据后所述训练任务配置执行策略并保存所述执行策略,根据所述执行策略进行所述设备对象模型的训练,并将训练验证结果存储到所述数据库中之后发布训练模型。
上述的机器学习方法,所述预测任务创建步骤包括,新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述算法参数定位所述设备对象模型,选择所述训练模型,如需输入预测结果数据时,需重复执行所述预测任务,选择前面第N次的预测结果,需要立即执行所述预测任务,选择一个预测结果,如无需输入所述预测结果时,需提供在线预测服务,执行所述预测任务,生成在线API服务供用户调用,无需提供所述在线预测服务时,保存所述预测任务后按策略执行所述预测任务,并进行所述设备对象模型的预测,存储预测结果。
本发明还提供一种机器学习系统,其特征在于,适用于上述所述的一种机器学习方法,包括:
模型建立单元:建立设备对象模型;
数据存储单元:封装大数据平台接口,调用所述接口将数据源信息存储到数据库中,配置所述设备对象模型的模型信息和字段信息的映射关系,并将所述映射关系和映射数据存储到所述数据库中;
算法管理单元:上传算法,选择所述设备对象模型,上传算法文件及配置文件,根据所述配置文件中的信息解析算法参数,将所述算法参数存储到所述数据库中;
训练任务创建单元:新建训练任务,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,根据时间范围从所述设备对象模型中选择实例数据后配置训练任务执行策略,并执行所述设备对象模型训练,将训练验证结果存储到所述数据库之后发布训练模型;
预测任务创建单元:新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述预测算法参数定位所述设备对象模型并选择所述训练模型,发布所述预测任务,并按策略执行所述预测任务后存储预测结果。
上述的机器学习系统,所述模型建立单元包括,建立设备对象模型,并添加所述设备对象模型的设备属性、测点数据信息。
上述的机器学习系统,所述数据存储单元包括:
数据源存储模块:封装大数据平台的influxdb的接口,调用所述influxdb接口将数据库名存储到MySql的数据源表中;
数据映射存储模块:配置所述设备对象模型的属性、测点信息和所述字段信息的所述映射关系,并将所述映射关系和映射数据存储到所述MySql数据库中。
上述的机器学习系统,所述算法管理单元包括:
算法上传模块:上传算法,添加所述算法的属性,选择所述设备对象模型,并下载所述设备对象模型的数据,如需辅助文件则进行选择后打包上传算法文件、配置文件及辅助文件并保存到服务器中;
算法解析模块:根据所述配置文件中信息解析所述算法参数,将所述算法参数与所述设备对象模型的所述测点数据信息进行对比,并将所述算法参数存储到所述数据库中。
上述的机器学习系统,所述训练任务创建单元包括,新建训练任务,添加训练任务名称,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,并选择所述设备对象模型的实例数据时间范围,根据所述实例数据时间范围从所述设备对象模型中选择实例数据后所述训练任务配置执行策略并保存所述执行策略,根据所述执行策略进行所述设备对象模型的训练,并将训练验证结果存储到所述数据库中之后发布训练模型。
上述的机器学习系统,所述预测任务创建单元包括,新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述算法参数定位所述设备对象模型,选择所述训练模型,如需输入预测结果数据时,需重复执行所述预测任务,选择前面第N次的预测结果,需要立即执行所述预测任务,选择一个预测结果,如无需输入所述预测结果时,需提供在线预测服务,执行所述预测任务,生成在线API服务供用户调用,无需提供所述在线预测服务时,保存所述预测任务后按策略执行所述预测任务,并进行所述设备对象模型的预测,存储预测结果。
相比于相关技术,本发明提出一种机器学习方法及系统,本发明立足于公司内的实际需求进行了需求分析,明确了要解决的问题,并通过分析公司内部相关业务开发人员的需求,设计了平台的整体架构。通过方案解决流程图的形式对几大模块的主要功能进行了详细介绍,展示了几大模块的内部实现以及几大模块之间的协作关系。该平台针对PHM场景,建立一个支持多模型、多引擎的机器学习平台,为用户提供了从数据管理、算法管理、任务管理到平台服务的一站式全流程机器学习解决方案。该平台立足于实际业务,为用户提供垂直领域场景化的解决方案,提高用户开发效率。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种机器学习方法架构图;
图2是根据本申请实施例的数据管理框架图;
图3是根据本申请实施例的算法管理框架图;
图4是根据本申请实施例的任务管理框架图;
图5是根据本申请实施例的一种机器学习方法流程图;
图6是根据本申请实施例的数据存储步骤流程图;
图7是根据本申请实施例的算法管理步骤流程图;
图8为本发明的一种机器学习系统的结构示意图;
图9是根据本申请实施例的电子设备的框架图。
其中,附图标记为:
模型建立单元:41;
数据存储单元:42;
算法管理单元:43;
训练任务创建单元:44;
预测任务创建单元:45;
数据源存储模块:421;
数据映射存储模块:422;
算法上传模块:431;
算法解析模块:432;
81:处理器;
82:存储器;
83:通信接口;
80:总线。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本发明基于数据建模,下面进行简要的介绍。
机器学习平台是近期兴起的一个概念,它可以将机器学习算法进行高度封装,并提供算法训练所需要的计算资源,降低了机器学习算法的使用门槛。目前商用的机器学习平台一般会支持数据处理、可视化建模、模型训练、模型管理、模型发布等功能,这些机器学习平台可以让用户不需要专业的算法知识,也不需要关注训练后续的运维工作,直接“傻瓜式”操作即可,这带来了一些负面作用,即封装的算法只满足通用业务的需求,面对垂直领域的需求则“捉襟见肘”,另外这些产品基本是高度定制,缺乏普遍适用性,无法接入更多的用户。针对目前机器学习平台的问题,本发明提出了一个基于PHM数据建模的一站式机器学习平台,该平台旨在对PHM场景提供从数据存储、数据处理、算法管理、模型训练、模型发布到模型上线的一站式全流程机器学习解决方案,降低机器学习模型的开发门槛和开发成本,并专业适配PHM场景,为PHM工程师解决训练资源、模型管理、服务运维等工程化方面的问题。
基于PHM数据建模的一站式机器学习平台由底向上分为数据引擎层、机器学习平台、业务应用层,数据引擎层:由公司的大数据平台小组负责,包括Spark、Flink、Kafka等大数据计算框架,为机器学习平台提供数据服务;机器学习平台:即本发明的核心功能,包括数据存储、算法管理、模型管理、任务管理以及模型在线服务等机器学习的全流程;数据存储提供多种数据库存储形式,算法管理提供PHM场景常用算法模块,模型管理负责训练模型的发布与版本控制,模型在线服务可以对外提供训练好的模型接口;业务应用层:针对PHM场景,本发明提供从模型训练、模型发布、模型预测到API预测的一站式全流程服务。本发明针于PHM领域,提出了基于PHM数据建模的一站式机器学习平台,旨在为PHM算法研发人员提供从数据治理、算法管理、模型训练、模型预测到模型服务的一站式全方位服务,整个平台的功能可以覆盖算法开发过程中的数据存储、算法上传、模型训练、模型发布、模型预测以及模型评估的全流程,另外模型服务提供API在线使用,用户可以通过简单配置将模型发布,利用接口的调用形式应用到自己的业务中。
本发明提出一种机器学习方法及系统,本发明提出一种机器学习方法及系统,本发明立足于公司内的实际需求进行了需求分析,明确了要解决的问题,并通过分析公司内部相关业务开发人员的需求,设计了平台的整体架构。通过方案解决流程图的形式对几大模块的主要功能进行了详细介绍,展示了几大模块的内部实现以及几大模块之间的协作关系。该平台针对PHM场景,建立一个支持多模型、多引擎的机器学习平台,为用户提供了从数据管理、算法管理、任务管理到平台服务的一站式全流程机器学习解决方案。该平台立足于实际业务,为用户提供垂直领域场景化的解决方案,提高用户开发效率。
下面将以数据建模为例对本申请实施例进行说明。
实施例一
本实施例提供了一种机器学习方法。请参照图1-图7,图1是根据本申请实施例的一种机器学习方法架构图;图2是根据本申请实施例的数据管理框架图;图3是根据本申请实施例的算法管理框架图;图4是根据本申请实施例的任务管理框架图;图5是根据本申请实施例的一种机器学习方法流程图;图6是根据本申请实施例的数据存储步骤流程图;图7是根据本申请实施例的算法管理步骤流程图,如图所示,一种机器学习方法包括如下步骤:
模型建立步骤S1:建立设备对象模型;
数据存储步骤S2:封装大数据平台接口,调用所述接口将数据源信息存储到数据库中,配置所述设备对象模型的模型信息和字段信息的映射关系,并将所述映射关系和映射数据存储到所述数据库中;
算法管理步骤S3:上传算法,选择所述设备对象模型,上传算法文件及配置文件,根据所述配置文件中的信息解析算法参数,将所述算法参数存储到所述数据库中;
训练任务创建步骤S4:新建训练任务,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,根据时间范围从所述设备对象模型中选择实例数据后配置训练任务执行策略,并执行所述设备对象模型训练,将训练验证结果存储到所述数据库之后发布训练模型;
预测任务创建步骤S5:新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述预测算法参数定位所述设备对象模型并选择所述训练模型,发布所述预测任务,并按策略执行所述预测任务后存储预测结果。
实施例中,所述模型建立步骤S1包括,建立设备对象模型,并添加所述设备对象模型的设备属性、测点数据信息。
具体的说,所述模型建立步骤S1中,首先建立设备对象模型,并添加其设备属性,比如设备ID、设备名称等,再添加其测点数据信息,比如温度、湿度、压强等,后面的步骤要针对该设备进行训练/预测。
实施例中,所述数据存储步骤S2包括:
数据源存储步骤S21:封装大数据平台的influxdb的接口,调用所述influxdb接口将数据库名存储到MySql的数据源表中;
数据映射存储步骤S22:配置所述设备对象模型的属性、测点信息和所述字段信息的所述映射关系,并将所述映射关系和映射数据存储到所述MySql数据库中。
具体的说,本发明的数据来自于IOT大数据平台(公司产品,提供数据服务),IOT大数据平台数据存储底层包含多种数据库,以influx数据库为例,下面介绍数据源存储、数据映射以及数据存储等过程的技术方案。首先封装大数据平台的influxdb的接口,然后调用influxdb接口将数据库名存储到MySql的数据源表,并根据表名进行更新或创建,该过程中使用了requests和pymysql库;通过pymysql库可以直接查询数据源表,并得到数据库和数据库中的数据表,另外通过封装的influxdb接口和数据表名可查询到该数据表下的所有字段信息;根据数据表的字段信息和上一步建立的设备对象模型信息,配置数据字段的映射关系并将其数据和映射关系存储到MySql数据库。
实施例中,所述算法管理步骤S3包括:
算法上传步骤S31:上传算法,添加所述算法的属性,选择所述设备对象模型,并下载所述设备对象模型的数据,如需辅助文件则进行选择后打包上传算法文件、配置文件及辅助文件并保存到服务器中;
算法解析步骤S32:根据所述配置文件中信息解析所述算法参数,将所述算法参数与所述设备对象模型的所述测点数据信息进行对比,并将所述算法参数存储到所述数据库中。
具体的说,算法管理步骤S3中,首先添加算法名称和算法描述,选择设备组,其中设备组数据来源于上一步存储的数据;将算法文件和配置文件打包上传,其中配置文件需要根据算法进行修改,其作用是辅助完成下一步的算法解析;如果需要辅助文件,则进行选择,最后保存算法进行算法解析;将上传的算法文件和配置文件保存到服务器,其中为了保证大文件不会大量使用系统内存,采用了f.chunks()循环存储的方式;使用zipfile库对文件进行解压缩,获得算法文件和配置文件;解析配置文件,获取算法文件的主函数文件和其函数入口,利用importlib库导入主函数,并通过inspect.signature获取算法的参数;如果算法解析的时间超过30s,则认为解析失败,其中时间监控是利用多线程实现;将算法参数与设备组测点放入集合中进行对比,当对比一致时,如果存在辅助文件,则将其存储到算法同目录,否则报错;将解析后的算法参数分类,存储到数据库,并反馈给前端页面。
实施例中,所述训练任务创建步骤S4包括,新建训练任务,添加训练任务名称,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,并选择所述设备对象模型的实例数据时间范围,根据所述实例数据时间范围从所述设备对象模型中选择实例数据后所述训练任务配置执行策略并保存所述执行策略,根据所述执行策略进行所述设备对象模型的训练,并将训练验证结果存储到所述数据库中之后发布训练模型。
具体的说,训练任务创建步骤S4中,首先添加任务名称、任务类型,选择步骤二上传的训练算法,并通过算法定位设备模型;选择设备模型下的某些设备实例和某个时间范围的设备实例数据作为训练数据;配置执行策略,包括定时执行和立即执行两种;保存任务,此时后台根据时间范围和设备实例ID下载设备数据到服务器,数据是执行步骤一后存储在MySql的设备数据;在服务器安装docker,将DS平台注2部署到容器中,并封装其接口,按照执行策略调用DS平台进行模型训练,并将得到的模型放置到模型文件夹;训练验证结果入库,发布模型。
实施例中,所述预测任务创建步骤S5包括,新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述算法参数定位所述设备对象模型,选择所述训练模型,如需输入预测结果数据时,需重复执行所述预测任务,选择前面第N次的预测结果,需要立即执行所述预测任务,选择一个预测结果,如无需输入所述预测结果时,需提供在线预测服务,执行所述预测任务,生成在线API服务供用户调用,无需提供所述在线预测服务时,保存所述预测任务后按策略执行所述预测任务,并进行所述设备对象模型的预测,存储预测结果。
具体的说,预测任务创建步骤S5中,首先添加预测任务,选择步骤二上传的预测算法,并选择已发布的模型,其中模型支持关键词搜索;根据业务的不同,选择新设备或之前的预测结果作为预测算法的数据输入;配置执行策略,包括定时执行、立即执行和在线服务三种;保存任务,后台下载预测数据,并利用DS平台进行模型预测,将预测的结果存为csv文件,并提供下载接口;如果是在线预测服务,后台自动部署一个Django服务,并利用Nginx进行反向代理,生成API供用户调用。
由此,本发明提出一种机器学习方法及系统,本发明立足于公司内的实际需求进行了需求分析,明确了要解决的问题,并通过分析公司内部相关业务开发人员的需求,设计了平台的整体架构。通过方案解决流程图的形式对几大模块的主要功能进行了详细介绍,展示了几大模块的内部实现以及几大模块之间的协作关系。该平台针对PHM场景,建立一个支持多模型、多引擎的机器学习平台,为用户提供了从数据管理、算法管理、任务管理到平台服务的一站式全流程机器学习解决方案。该平台立足于实际业务,为用户提供垂直领域场景化的解决方案,提高用户开发效率。
实施例二
请参照图8,图8为本发明的一种机器学习系统的结构示意图。如图8所示,发明的一种机器学习系统,适用于上述的机器学习方法,机器学习系统包括:
模型建立单元41:建立设备对象模型;
数据存储单元42:封装大数据平台接口,调用所述接口将数据源信息存储到数据库中,配置所述设备对象模型的模型信息和字段信息的映射关系,并将所述映射关系和映射数据存储到所述数据库中;
算法管理单元:上传算法,选择所述设备对象模型,上传算法文件及配置文件,根据所述配置文件中的信息解析算法参数,将所述算法参数存储到所述数据库中;
训练任务创建单元43:新建训练任务,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,根据时间范围从所述设备对象模型中选择实例数据后配置训练任务执行策略,并执行所述设备对象模型训练,将训练验证结果存储到所述数据库之后发布训练模型;
预测任务创建单元45:新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述预测算法参数定位所述设备对象模型并选择所述训练模型,发布所述预测任务,并按策略执行所述预测任务后存储预测结果。
在本实施例中,所述模型建立单元41包括,建立设备对象模型,并添加所述设备对象模型的设备属性、测点数据信息。
在本实施例中,所述数据存储单元42包括:
数据源存储模块421:封装大数据平台的influxdb的接口,调用所述influxdb接口将数据库名存储到MySql的数据源表中;
数据映射存储模块422:配置所述设备对象模型的属性、测点信息和所述字段信息的所述映射关系,并将所述映射关系和映射数据存储到所述MySql数据库中。
在本实施例中,所述算法管理单元43包括:
算法上传模块431:上传算法,添加所述算法的属性,选择所述设备对象模型,并下载所述设备对象模型的数据,如需辅助文件则进行选择后打包上传算法文件、配置文件及辅助文件并保存到服务器中;
算法解析模块432:根据所述配置文件中信息解析所述算法参数,将所述算法参数与所述设备对象模型的所述测点数据信息进行对比,并将所述算法参数存储到所述数据库中。
在本实施例中,所述训练任务创建单元44包括,新建训练任务,添加训练任务名称,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,并选择所述设备对象模型的实例数据时间范围,根据所述实例数据时间范围从所述设备对象模型中选择实例数据后所述训练任务配置执行策略并保存所述执行策略,根据所述执行策略进行所述设备对象模型的训练,并将训练验证结果存储到所述数据库中之后发布训练模型。
在本实施例中,所述预测任务创建单元45包括,新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述算法参数定位所述设备对象模型,选择所述训练模型,如需输入预测结果数据时,需重复执行所述预测任务,选择前面第N次的预测结果,需要立即执行所述预测任务,选择一个预测结果,如无需输入所述预测结果时,需提供在线预测服务,执行所述预测任务,生成在线API服务供用户调用,无需提供所述在线预测服务时,保存所述预测任务后按策略执行所述预测任务,并进行所述设备对象模型的预测,存储预测结果。
实施例三
结合图9所示,本实施例揭示了一种电子设备的一种具体实施方式。电子设备可以包括处理器81以及存储有计算机程序指令的存储器82。
具体地,上述处理器81可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器82可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器82可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器82可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器82可在数据处理装置的内部或外部。在特定实施例中,存储器82是非易失性(Non-Volatile)存储器。在特定实施例中,存储器82包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(RandomAccess Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为FPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EFPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器82可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器81所执行的可能的计算机程序指令。
处理器81通过读取并执行存储器82中存储的计算机程序指令,以实现上述实施例中的任意一种文件系统容量管理优化方法。
在其中一些实施例中,电子设备还可包括通信接口83和总线80。其中,如图9所示,处理器81、存储器82、通信接口83通过总线80连接并完成相互间的通信。
通信接口83用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。通信端口83还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线80包括硬件、软件或两者,将计算机设备的部件彼此耦接在一起。总线80包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(Control Bus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线80可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(Front Side Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线80可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
电子设备可连接机器学习系统,从而实现结合图1-图7描述的方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种机器学习方法,其特征在于,基于PHM数据建模,所述机器学习方法包括:
模型建立步骤:建立设备对象模型;
数据存储步骤:封装大数据平台接口,调用所述接口将数据源信息存储到数据库中,配置所述设备对象模型的模型信息和字段信息的映射关系,并将所述映射关系和映射数据存储到所述数据库中;
算法管理步骤:上传算法,选择所述设备对象模型,上传算法文件及配置文件,根据所述配置文件中的信息解析算法参数,将所述算法参数存储到所述数据库中;
训练任务创建步骤:新建训练任务,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,根据时间范围从所述设备对象模型中选择实例数据后配置训练任务执行策略,并执行所述设备对象模型训练,将训练验证结果存储到所述数据库之后发布训练模型;
预测任务创建步骤:新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述预测算法参数定位所述设备对象模型并选择所述训练模型,发布所述预测任务,并按策略执行所述预测任务后存储预测结果。
2.根据权利要求1所述的一种机器学习方法,其特征在于,所述模型建立步骤包括,建立设备对象模型,并添加所述设备对象模型的设备属性、测点数据信息。
3.根据权利要求1所述的一种机器学习方法,其特征在于,所述数据存储步骤包括:
数据源存储步骤:封装大数据平台的influxdb的接口,调用所述influxdb接口将数据库名存储到MySql的数据源表中;
数据映射存储步骤:配置所述设备对象模型的属性、测点信息和所述字段信息的所述映射关系,并将所述映射关系和映射数据存储到所述MySql数据库中。
4.根据权利要求1所述的一种机器学习方法,其特征在于,所述算法管理步骤包括:
算法上传步骤:上传算法,添加所述算法的属性,选择所述设备对象模型,并下载所述设备对象模型的数据,如需辅助文件则进行选择后打包上传算法文件、配置文件及辅助文件并保存到服务器中;
算法解析步骤:根据所述配置文件中信息解析所述算法参数,将所述算法参数与所述设备对象模型的所述测点数据信息进行对比,并将所述算法参数存储到所述数据库中。
5.根据权利要求1所述的一种机器学习方法,其特征在于,所述训练任务创建步骤包括,新建训练任务,添加训练任务名称,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,并选择所述设备对象模型的实例数据时间范围,根据所述实例数据时间范围从所述设备对象模型中选择实例数据后所述训练任务配置执行策略并保存所述执行策略,根据所述执行策略进行所述设备对象模型的训练,并将训练验证结果存储到所述数据库之后发布训练模型。
6.根据权利要求5所述的一种机器学习方法,其特征在于,所述预测任务创建步骤包括,新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述算法参数定位所述设备对象模型,选择所述训练模型,如需输入预测结果数据时,需重复执行所述预测任务,选择前面第N次的预测结果,需要立即执行所述预测任务,选择一个预测结果,如无需输入所述预测结果时,需提供在线预测服务,执行所述预测任务,生成在线API服务供用户调用,无需提供所述在线预测服务时,保存所述预测任务后按策略执行所述预测任务,并进行所述设备对象模型的预测,存储预测结果。
7.一种机器学习系统,其特征在于,基于PHM数据建模,适用于上述权利要求1-6所述的一种机器学习方法,包括:
模型建立单元:建立设备对象模型;
数据存储单元:封装大数据平台接口,调用所述接口将数据源信息存储到数据库中,配置所述设备对象模型的模型信息和字段信息的映射关系,并将所述映射关系和映射数据存储到所述数据库中;
算法管理单元:上传算法,选择所述设备对象模型,上传算法文件及配置文件,根据所述配置文件中的信息解析算法参数,将所述算法参数存储到所述数据库中;
训练任务创建单元:新建训练任务,选择训练任务类型、训练算法参数,通过所述训练算法参数定位所述设备对象模型,根据时间范围从所述设备对象模型中选择实例数据后配置训练任务执行策略,并执行所述设备对象模型训练,将训练验证结果存储到所述数据库之后发布训练模型;
预测任务创建单元:新建预测任务,添加预测任务属性,选择预测任务类型、预测算法参数,通过所述预测算法参数定位所述设备对象模型并选择所述训练模型,发布所述预测任务,并按策略执行所述预测任务后存储预测结果。
8.根据权利要求7所述的机器学习系统,其特征在于,所述模型建立单元包括,建立设备对象模型,并添加所述设备对象模型的设备属性、测点数据信息。
9.根据权利要求8所述的机器学习系统,其特征在于,所述数据存储单元包括:
数据源存储模块:封装大数据平台的influxdb的接口,调用所述influxdb接口将数据库名存储到MySql的数据源表中;
数据映射存储模块:配置所述设备对象模型的属性、测点信息和所述字段信息的所述映射关系,并将所述映射关系和映射数据存储到所述MySql数据库中。
10.根据权利要求9所述的机器学习系统,其特征在于,所述算法管理单元包括:
算法上传模块:上传算法,添加所述算法的属性,选择所述设备对象模型,并下载所述设备对象模型的数据,如需辅助文件则进行选择后打包上传算法文件、配置文件及辅助文件并保存到服务器中;
算法解析模块:根据所述配置文件中信息解析所述算法参数,将所述算法参数与所述设备对象模型的所述测点数据信息进行对比,并将所述算法参数存储到所述数据库中。
CN202011433273.7A 2020-12-10 2020-12-10 一种机器学习方法及系统 Pending CN112464569A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011433273.7A CN112464569A (zh) 2020-12-10 2020-12-10 一种机器学习方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011433273.7A CN112464569A (zh) 2020-12-10 2020-12-10 一种机器学习方法及系统

Publications (1)

Publication Number Publication Date
CN112464569A true CN112464569A (zh) 2021-03-09

Family

ID=74801020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011433273.7A Pending CN112464569A (zh) 2020-12-10 2020-12-10 一种机器学习方法及系统

Country Status (1)

Country Link
CN (1) CN112464569A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114358730A (zh) * 2021-12-31 2022-04-15 中煤科工集团信息技术有限公司 一种基于机器学习的煤炭业务处理方法及设备
CN115617819A (zh) * 2022-12-19 2023-01-17 思创数码科技股份有限公司 数据存储方法、系统、计算机设备及存储介质
CN118331968A (zh) * 2024-06-13 2024-07-12 浙江安联检测技术服务有限公司 一种基于智能化检测平台的数据储存方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018140365A1 (en) * 2017-01-24 2018-08-02 Siemens Aktiengesellschaft System and method for cognitive engineering technology for automation and control of systems
CN108510082A (zh) * 2018-03-27 2018-09-07 苏宁易购集团股份有限公司 对机器学习模型进行处理的方法及装置
WO2019144066A1 (en) * 2018-01-22 2019-07-25 Jack Copper Systems and methods for preparing data for use by machine learning algorithms
KR102092197B1 (ko) * 2019-09-17 2020-03-23 경기대학교 산학협력단 수리 가능한 시스템의 열화 분석 장치 및 방법
US20200133964A1 (en) * 2017-10-13 2020-04-30 Kpmg Llp System and method for analysis and determination of relationships from a variety of data sources
KR20200127719A (ko) * 2019-05-03 2020-11-11 한국콘베어공업주식회사 기계부품 고장예지 및 수명예측 시스템 및 이를 기반으로 한 b2b 유통 서비스 시스템
US20200380417A1 (en) * 2019-06-03 2020-12-03 Cerebri AI Inc. Distributed and redundant machine quality management

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018140365A1 (en) * 2017-01-24 2018-08-02 Siemens Aktiengesellschaft System and method for cognitive engineering technology for automation and control of systems
US20200133964A1 (en) * 2017-10-13 2020-04-30 Kpmg Llp System and method for analysis and determination of relationships from a variety of data sources
WO2019144066A1 (en) * 2018-01-22 2019-07-25 Jack Copper Systems and methods for preparing data for use by machine learning algorithms
CN108510082A (zh) * 2018-03-27 2018-09-07 苏宁易购集团股份有限公司 对机器学习模型进行处理的方法及装置
KR20200127719A (ko) * 2019-05-03 2020-11-11 한국콘베어공업주식회사 기계부품 고장예지 및 수명예측 시스템 및 이를 기반으로 한 b2b 유통 서비스 시스템
US20200380417A1 (en) * 2019-06-03 2020-12-03 Cerebri AI Inc. Distributed and redundant machine quality management
KR102092197B1 (ko) * 2019-09-17 2020-03-23 경기대학교 산학협력단 수리 가능한 시스템의 열화 분석 장치 및 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114358730A (zh) * 2021-12-31 2022-04-15 中煤科工集团信息技术有限公司 一种基于机器学习的煤炭业务处理方法及设备
CN115617819A (zh) * 2022-12-19 2023-01-17 思创数码科技股份有限公司 数据存储方法、系统、计算机设备及存储介质
CN118331968A (zh) * 2024-06-13 2024-07-12 浙江安联检测技术服务有限公司 一种基于智能化检测平台的数据储存方法及系统
CN118331968B (zh) * 2024-06-13 2024-09-03 浙江安联检测技术服务有限公司 一种基于智能化检测平台的数据储存方法及系统

Similar Documents

Publication Publication Date Title
CN112464569A (zh) 一种机器学习方法及系统
CN110162345B (zh) 一种应用程序访问方法、装置和存储介质
US20200334293A1 (en) Computation platform agnostic data classification workflows
WO2018171715A1 (zh) 适用神经网络处理器的自动化设计方法及系统
US10459979B2 (en) Graphically managing data classification workflows in a social networking system with directed graphs
US20180004835A1 (en) Data classification workflows implemented with dynamically modifiable directed graphs
CN110866589A (zh) 深度神经网络模型的运行方法、装置及框架
CN109902126B (zh) 支持hive自动分区的加载系统及其实现方法
CN109379398B (zh) 一种数据同步方法及装置
CN113220657B (zh) 数据处理方法、装置及计算机设备
US11681511B2 (en) Systems and methods for building and deploying machine learning applications
CN107798064A (zh) 页面处理方法、电子设备及计算机可读存储介质
CN115309562A (zh) 算子调用系统、算子生成方法,电子设备
CN111049889A (zh) 一种静态资源上传方法、装置、集成服务器和系统
US20230418730A1 (en) Test case generator using automation library of an information handling system
JP2012234260A (ja) 車両制御シミュレーションシステム
CN112631719B (zh) 数据预测模型调用方法、装置、设备和存储介质
CN103530369A (zh) 一种去重方法及系统
CN114064079A (zh) 算法应用元的打包方法及装置、设备、存储介质
CN107391257B (zh) 业务所需内存容量的预估方法、装置及服务器
CN115129460A (zh) 获取算子硬件时间的方法、装置、计算机设备和存储介质
CN116560968A (zh) 一种基于机器学习的仿真计算时间预测方法、系统及设备
JPWO2017135219A1 (ja) 設計支援装置、設計支援方法、および設計支援プログラム
CN116257404A (zh) 一种日志解析方法及计算设备
CN116993315A (zh) 冷源设备的运维方法、装置、计算设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230914

Address after: Room 401, 4th Floor, Building J, Yunmi City, No. 19 Ningshuang Road, Yuhuatai District, Nanjing City, Jiangsu Province, 210000

Applicant after: Nanjing Minglue Technology Co.,Ltd.

Address before: 100089 a1002, 10th floor, building 1, yard 1, Zhongguancun East Road, Haidian District, Beijing

Applicant before: MININGLAMP SOFTWARE SYSTEMS Co.,Ltd.

TA01 Transfer of patent application right