CN114416099B - 一种基于信息物理系统的模型集成方法及相关组件 - Google Patents
一种基于信息物理系统的模型集成方法及相关组件 Download PDFInfo
- Publication number
- CN114416099B CN114416099B CN202210073300.7A CN202210073300A CN114416099B CN 114416099 B CN114416099 B CN 114416099B CN 202210073300 A CN202210073300 A CN 202210073300A CN 114416099 B CN114416099 B CN 114416099B
- Authority
- CN
- China
- Prior art keywords
- file
- parameter value
- fmu
- machine learning
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010354 integration Effects 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000010801 machine learning Methods 0.000 claims abstract description 147
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000011161 development Methods 0.000 claims abstract description 15
- 238000003860 storage Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000007418 data mining Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000009776 industrial production Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000008093 supporting effect Effects 0.000 description 2
- 241000208140 Acer Species 0.000 description 1
- 241001143500 Aceraceae Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
- G06F9/44568—Immediately runnable code
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Stored Programmes (AREA)
Abstract
本申请公开了一种基于信息物理系统的模型集成方法及相关组件,包括:获取与待集成的机器学习模型对应的PMML文件;所述机器学习模型包括利用各种开发工具开发的算法模型;基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件;其中,所述FMU文件包含所述机器学习模型的语义描述信息;所述参数值文件包含所述机器学习模型的训练参数及其训练值;控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作。本申请能够实现模型批量自动集成,易用性强且集成效率高。
Description
技术领域
本发明涉及模型集成技术领域,特别涉及一种基于信息物理系统的模型集成方法、装置、设备及存储介质。
背景技术
信息物理系统CPS(Cyber-Physical Systems)将物理动力学与计算机和网络结合,通过模型组合的方式将物理过程的连续动态与软件模型集成在一起,能够对工业生产升级具有良好的支撑作用。信息物理系统注重实际建立物理模型,并通过图形可视化方式进行模块化的编排,在某些物理模型难以建立的情况下,对构建完整的信息物理模型构成影响。另一方面随着人工智能技术工具及技术的普及,我国培养了大量具有人工智能技术的人才,并将人工智能技术应用到各产业生产实践中,并积累了大量的机器学习模型,信息物理系统注重物理机理模型通过网络与实际物理系统,其已经在控制仿真等领域成功应用于生产实践中,包括回归、预测、仿真、优化等功能应用。
但实际现实物理中部分缺少物理机理模型,其中机器学习模型可以较好的弥补物理模型缺失的问题。但存在大量以不同开发语言及其框架系统进行开发机器学习模型,在现有信息物理系统中集成时出各组问题,导致机器学习模型与信息物理系统集成效率较低。例如,机器学习模型可能来自不同的开发环境,导致在集成时不同机器学习模型环境时需要单独安装部署;现有信息物理系统与机器学习模型需要开发定制接口才能集成,且与其他物理模型等图形模块化操作具有较大差异,易用性差,集成成本高;现有机器学习模型大多以文本方式,难以满足信息物理系统图形化模块与其他物理系统集成的方式。
因此,如何在易用性强且集成效率高的情况下实现机器学习模型的批量自动集成使本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于信息物理系统的模型集成方法、装置、设备及存储介质,能够实现模型批量自动集成,易用性强且集成效率高。其具体方案如下:
本申请的第一方面提供了一种基于信息物理系统的模型集成方法,包括:
获取与待集成的机器学习模型对应的PMML文件;其中,所述机器学习模型包括利用各种开发工具开发的算法模型;
基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件;其中,所述FMU文件包含所述机器学习模型的语义描述信息;所述参数值文件包含所述机器学习模型的训练参数及其训练值;
控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作。
可选的,所述基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件,包括:
根据预设语义规则对所述PMML文件进行解析得到与所述机器学习模型对应的XML文件及所述参数值文件;
根据所述预设语义规则对所述PMML文件进行转译得到编译环境下的可执行文件,并在所述编译环境下对所述可执行文件进行编译得到对应的二进制可执行文件;
将所述XML文件和所述二进制可执行文件压缩合成为与所述机器学习模型对应的所述FMU文件。
可选的,所述基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件之后,还包括:
将所述FMU文件和所述参数值文件分别存储至模型库和参数值库;其中,所述模型库中的所述FMU文件与所述参数值库中的所述参数值文件之间具有通过文件标识构建的映射关系;
相应的,所述控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,包括:
控制所述信息物理系统根据所述集成指令通过FMI接口分别从所述模型库和所述参数值库中获取所述FMU文件和参数值文件。
可选的,所述获取与待集成的机器学习模型对应的PMML文件之后,还包括:
判断所述模型库中是否存在与所述PMML文件对应的所述FMU文件,如果否,则执行基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件的步骤。
可选的,所述判断所述模型库中是否存在与所述PMML文件对应的所述FMU文件之后,还包括:
如果是,则判断所述参数值库中是否存在与所述PMML文件对应的所述参数值文件,如果否,则根据预设语义规则对所述PMML文件进行解析得到与所述机器学习模型对应的所述参数值文件;
通过文件标识的方式构建所述参数值文件与所述模型库中已经存在的与所述PMML文件对应的所述FMU文件之间的映射关系,并将所述参数值文件存储至所述参数值库。
可选的,所述在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作之后,还包括:
当集成后的所述机器学习模型的所述PMML文件中的所述训练参数或其训练值发生变化时,则从变化后的PMML文件中提取出对应的变化后的参数值文件,以利用变化后的参数值文件对集成后的所述机器学习模型进行更新。
可选的,所述利用变化后的参数值文件对集成后的所述机器学习模型进行更新,包括:
控制所述信息物理系统根据通过FMI接口获取变化后的参数值文件并对所述FMU运行环境进行重置;
在重置后的FMU运行环境中利用变化后的参数值文件对集成后的所述机器学习模型进行参数更新并实例化运行。
本申请的第二方面提供了一种基于信息物理系统的模型集成装置,包括:
获取模块,用于获取与待集成的机器学习模型对应的PMML文件;其中,所述机器学习模型包括利用各种开发工具开发的算法模型;
处理模块,用于基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件;其中,所述FMU文件包含所述机器学习模型的语义描述信息;所述参数值文件包含所述机器学习模型的训练参数及其训练值;
集成模块,用于控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作。
本申请的第三方面提供了一种电子设备,所述电子设备包括处理器和存储器;其中所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述基于信息物理系统的模型集成方法。
本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述基于信息物理系统的模型集成方法。
本申请中,先获取与待集成的机器学习模型对应的PMML文件;其中,所述机器学习模型包括利用各种开发工具开发的算法模型;然后基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件;其中,所述FMU文件包含所述机器学习模型的语义描述信息;所述参数值文件包含所述机器学习模型的训练参数及其训练值;最后控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作。可见,本申请将不同的机器学习模型转为统一的PMML文件,进一步再转化为对应的FMU文件和参数值文件,控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,在进行模型集成时,提供FMU统一运行环境运行所需集成模型的FMU文件和参数值文件,实现模型批量自动集成,易用性强且集成效率高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种基于信息物理系统的模型集成方法流程图;
图2为本申请提供的PMML标准的数据挖掘任务执行过程;
图3为本申请提供的一种具体的基于信息物理系统的模型集成架构图;
图4为本申请提供的一种具体的模型参数值表示意图;
图5为本申请提供的一种基于信息物理系统的模型集成装置结构示意图;
图6为本申请提供的一种基于信息物理系统的模型集成电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中,实际现实物理中部分缺少物理机理模型,其中机器学习模型可以较好的弥补物理模型缺失的问题。但存在大量以不同开发语言及其框架系统进行开发机器学习模型,在现有信息物理系统中集成时出各组问题,导致机器学习模型与信息物理系统集成效率较低。针对上述技术缺陷,本申请提供一种基于信息物理系统的模型集成方案,能够实现模型批量自动集成,易用性强且集成效率高。
图1为本申请实施例提供的一种基于信息物理系统的模型集成方法流程图。参见图1所示,该基于信息物理系统的模型集成方法包括:
S11:获取与待集成的机器学习模型对应的PMML文件;其中,所述机器学习模型包括利用各种开发工具开发的算法模型。
本实施例中,获取与待集成的机器学习模型对应的PMML文件。所述机器学习模型包括利用各种开发工具开发的算法模型。可以是根据需求重新开发的模型,开发人员可以利用自己擅长的方式进行机器学习模型的开发,并自动可成为扩充信息物理系统的功能块组件。也可以是现有的已经开发的机器学习模型,在此基础上利用机器学习模型的原生开发工具将机器学习模型导出为标准PMML标准文件。将现有大量已有机器学习模型批量自动转化,极大的扩充了信息物理系统的使用场景。例如,将不同Python框架开发的模型导出为统一PMML标准文件,并用采用一种Python机器学习框架加载PMML模型文件。
可以理解,PMML标准是数据挖掘过程的一个实例化标准,它按照数据挖掘任务执行过程,有序的定义了数据挖掘不同阶段的相关信息:头信息、数据字典、数据转换、模型表示、预测评价,具体如图2所示。支持PMML标准的大数据及机器学习软件包括有IBM的SPSS系列软件、Opera的Signal Hub、open data的Augustus、MicroStrategy Data MiningServices、SAS的SAS Enterprise Miner、RapidMiner with PMML Extension、Microsoft的SQL Server、R语言、scikit-learn、Keras、Apache Spark、TensorFlow等均支持导出PMML标准的数据模型文件。
S12:基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件;其中,所述FMU文件包含所述机器学习模型的语义描述信息;所述参数值文件包含所述机器学习模型的训练参数及其训练值。
本实施例中,在得到模型对应的PMML文件后,基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件。其中,所述FMU文件包含所述机器学习模型的语义描述信息,所述参数值文件包含所述机器学习模型的训练参数及其训练值。将PMML文件的模型与参数进行分离,实现处理转换。FMI标准功能模型接口(通用模型接口标准)用于将不同设备供应商提供的各种不同的行为模型设备与标准控制器的软件/硬件/模型进行半实物实时仿真测试。本实施例中,为了实现仿真工具间模型成果能够共享,主流数学建模仿真工具均支持导出符合FMI标准的FMU文件。FMI标准已经获得了众多工具支持,可将开发模型直接导出FMU,如数学建模工具Matlab/Simulik、Maple/MapleSim等,行业软件如西门子AMESim、Domyla等。同时具有开源工具可以方便将不同语言程序编译成为FMU文件,如将PythonFMU可将Python开发的模型转化为FMU,FMICodeGenerator可将C/C++开发的模型代码转化为FMU文件,FMU4j可以将java开发的模型代码转化为FMU文件。
本实施例由转换编译模块将所述PMML文件转化为符合FMI标准的FMU文件及模型参数值,如图3所示。转换编译模块的主要功能是为不同机器学习模型导出PMML文件(含有模型及训练参数)转换FMU文件及描述模型训练后的参数值,其中FMU文件含有可执行机器学习模型的二进制代码及描述输入、输出、模型参数及变量等信息的XML的FMU文件,模型参数值对应模型参数的训练值。
具体的,首先根据预设语义规则对所述PMML文件进行解析得到与所述机器学习模型对应的XML文件及所述参数值文件。解析模块根据默认语义规则或用户可配置的规则将PMML文件对应语义描述的字段转译为符合FMI标准的XML文件,其中包括PMML文件头信息(模型版权信息、描述性信息、产生工具,创建时间)与FMU中XML头信息映射关系、PMML文件中数据字典及评分结果中的变量信息(包括预测变量、目标变量、评分结果等转化为FMU的输入及输出变量信息、PMML文件中的模型的参数列表转换为FMU XML中的参数信息、PMML中的模型输入及输出信息转化为暴露的变量)。另外,解析模块还将PMML文件中各个变量及其对应的值,解析为模型参数值文件,包括主要的模型参数及参数值(PMML文件ID、头信息及对应的FMU文件ID信息等)。
接着根据所述预设语义规则对所述PMML文件进行转译得到编译环境下的可执行文件,并在所述编译环境下对所述可执行文件进行编译得到对应的二进制可执行文件。图3中代码转译模块的功能为利用某一语言框架将PMML转译为可执行代码,例如使用Python加载PMML文件使其成为可执行代码。代码编译模块将根据默认的语义规则及用户自定义规则,将其打包封装为FMU文件中可执行的二进制可执行代码,其中输入、输出、参数及变量均与XML文件相对应。由于生成的FMU文件均为FMI标准的Co-Simulation格式,打包镜像是需要把运行目标二进制文件的运行一同编译为二进制,并将其调用接口与标准一致。由于部分语言依赖于外部环境,因此需要将外部依赖环境与信息物理系统一致。
最后将所述XML文件和所述二进制可执行文件压缩合成为与所述机器学习模型对应的所述FMU文件。图3中合成压缩模块的功能将解析模块生成的XML文件及代码编译模块生成的二进制文件进行打包压缩,形成符合FMI标准的FMU文件。2)FMU文件自带编译运行环境(求解器),提供标准的接口,方便与第三方程序进行集成。
进一步的,在得到所述FMU文件和所述参数值文件后,将所述FMU文件和所述参数值文件分别存储至模型库和参数值库。由于机器学习模型的参数较多且由数据训练而来,同一模型可能对应不同训练数据,模型参数需要进行统一管理。所述模型库中的所述FMU文件与所述参数值库中的所述参数值文件之间具有通过文件标识构建的映射关系。图4所示为所述参数值库中的模型参数值表示例,一个FMU_ID(模型标识)对应一个机器学习模型,多个PMML_ID(参数值文件ID)可以对应一个机器学习模型。一般的,FMU文件与参数值文件可由原生信息物理系统管理或提供功能标识管理。
在此基础上,解析模块进行解析前需要将PMML文件信息与转译过的PMML功能进行匹配,如机器学习模型没有变化,则直接获取之前编译生成的FMU文件,只需要解析模型参数值。也即首先判断所述模型库中是否存在与所述PMML文件对应的所述FMU文件,如果否,则执行基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件的步骤。当PMML文件发生更新,传入参数自动更新模块时,自动更新模块根据PMML文件信息匹配模型库判断其是否编译过,如果没有则传入转换编译模块。如果不存在对应的所述FMU文件,则进一步判断所述参数值库中是否存在与所述PMML文件对应的所述参数值文件,如果否,则根据预设语义规则对所述PMML文件进行解析得到与所述机器学习模型对应的所述参数值文件。另外,还需要通过文件标识的方式构建所述参数值文件与所述模型库中已经存在的与所述PMML文件对应的所述FMU文件之间的映射关系,并将所述参数值文件存储至所述参数值库。
S13:控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作。
本实施例中,控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作。在前述实施例的基础上,控制所述信息物理系统根据所述集成指令通过FMI接口分别从所述模型库和所述参数值库中获取所述FMU文件和参数值文件。信息物理系统进行集成时,可以采用标准的FMI标准接口进行对接。上述过程通过运行调度模块执行,主要功能为加载并调度FMU文件、加载指定的机器学习模型参数。
模型首次运行流程如下:指定机器学习模型的FMU文件加载并实例化;设置求解器的运行参数;加载制定的参数值并初始化赋予为FMU实例的参数初值;根据需要从其他系统或数据库获取数值赋予模型输入;根据需要调用DoStep接口进行机器学习模型运算;根据需要获取机器学习模型FMU实例的运算输出。本实施例提供FMU统一运行环境提供现有信息物理系统集成调用,并实现不同机器学习模型能够自动标准化下发运行环境,并可以通过图形化方式进行集成及配置。
当模型运行后需要更新时,也即当集成后的所述机器学习模型的所述PMML文件中的所述训练参数或其训练值发生变化时,则从变化后的PMML文件中提取出对应的变化后的参数值文件,以利用变化后的参数值文件对集成后的所述机器学习模型进行更新。此时还需要控制所述信息物理系统根据通过FMI接口获取变化后的参数值文件并对所述FMU运行环境进行重置。在重置后的FMU运行环境中利用变化后的参数值文件对集成后的所述机器学习模型进行参数更新并实例化运行。当模型参数更新时可调用FMI标准接口重置(Reset)FMU运行环境,将更新后的机器学习模型参数赋予FMU运行实例的参数值后,重复上述集成步骤。
本实施例可借助参数自动更新模块实现上述更新功能,自动更新模块自动将更新后的机器学习模型的PMML文件的转化FMU文件或模型参数值加载模型库中,并根据执行需要更新后的模型参数值更新至对应的FMU运行实例。例如,信息物理系统对某机器学习模型FMU文件实例化调用后,参数自动更新模块可根据设置PMML文件通过转换编译模块提取模型参数,PMML文件信息配置找到对FMU模型文件,可通知信息物理系统对现有系统实例通过标准接口现有实例化模型更新参数。
本实施例中,信息物理系统同样可以通过原生FMI标准支持通过图形模块化的方式机器学习模型及模型参数及与物理机理模型混合编排运行。机器学习模型与其他物理模型操作界面及配置方式一致,可采集图形模块化方式进行拖拽组合进行集成,方便用户根据实际情况与物理模型搭配使用。信息物理系统也可以提供一致的FMU求解器实现提供信息物理系统调用。当模型训练需要更新时可以仅将参数进行更新。
可见,本申请实施例先获取与待集成的机器学习模型对应的PMML文件;其中,所述机器学习模型包括利用各种开发工具开发的算法模型;然后基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件;其中,所述FMU文件包含所述机器学习模型的语义描述信息;所述参数值文件包含所述机器学习模型的训练参数及其训练值;最后控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作。本申请实施例将不同的机器学习模型转为统一的PMML文件,进一步再转化为对应的FMU文件和参数值文件,控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,在进行模型集成时,提供FMU统一运行环境运行所需集成模型的FMU文件和参数值文件,实现模型批量自动集成,易用性强且集成效率高。
参见图5所示,本申请实施例还相应公开了一种基于信息物理系统的模型集成装置,包括:
获取模块11,用于获取与待集成的机器学习模型对应的PMML文件;其中,所述机器学习模型包括利用各种开发工具开发的算法模型;
处理模块12,用于基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件;其中,所述FMU文件包含所述机器学习模型的语义描述信息;所述参数值文件包含所述机器学习模型的训练参数及其训练值;
集成模块13,用于控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作。
可见,本申请实施例先获取与待集成的机器学习模型对应的PMML文件;其中,所述机器学习模型包括利用各种开发工具开发的算法模型;然后基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件;其中,所述FMU文件包含所述机器学习模型的语义描述信息;所述参数值文件包含所述机器学习模型的训练参数及其训练值;最后控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作。本申请实施例将不同的机器学习模型转为统一的PMML文件,进一步再转化为对应的FMU文件和参数值文件,控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,在进行模型集成时,提供FMU统一运行环境运行所需集成模型的FMU文件和参数值文件,实现模型批量自动集成,易用性强且集成效率高。
在一些具体实施例中,所述处理模块12,具体包括:
解析单元,用于根据预设语义规则对所述PMML文件进行解析得到与所述机器学习模型对应的XML文件及所述参数值文件;
转译单元,用于根据所述预设语义规则对所述PMML文件进行转译得到编译环境下的可执行文件;
编译单元,用于在所述编译环境下对所述可执行文件进行编译得到对应的二进制可执行文件;
压缩单元,用于将所述XML文件和所述二进制可执行文件压缩合成为与所述机器学习模型对应的所述FMU文件。
在一些具体实施例中,所述基于信息物理系统的模型集成装置,还包括:
第一存储模块,用于将所述FMU文件和所述参数值文件分别存储至模型库和参数值库;其中,所述模型库中的所述FMU文件与所述参数值库中的所述参数值文件之间具有通过文件标识构建的映射关系;
相应的,所述集成模块13,还用于控制所述信息物理系统根据所述集成指令通过FMI接口分别从所述模型库和所述参数值库中获取所述FMU文件和参数值文件;
第一判断模块,用于判断所述模型库中是否存在与所述PMML文件对应的所述FMU文件,如果否,则执行基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件的步骤;
第二判断模块,用于如果是,则判断所述参数值库中是否存在与所述PMML文件对应的所述参数值文件,如果否,则根据预设语义规则对所述PMML文件进行解析得到与所述机器学习模型对应的所述参数值文件;
第二存储模块,用于通过文件标识的方式构建所述参数值文件与所述模型库中已经存在的与所述PMML文件对应的所述FMU文件之间的映射关系,并将所述参数值文件存储至所述参数值库;
模型更新模块,用于当集成后的所述机器学习模型的所述PMML文件中的所述训练参数或其训练值发生变化时,则从变化后的PMML文件中提取出对应的变化后的参数值文件,以利用变化后的参数值文件对集成后的所述机器学习模型进行更新。
在一些具体实施例中,所述模型更新模块,具体还包括:
重置单元,用于控制所述信息物理系统根据通过FMI接口获取变化后的参数值文件并对所述FMU运行环境进行重置;
运行单元,用于在重置后的FMU运行环境中利用变化后的参数值文件对集成后的所述机器学习模型进行参数更新并实例化运行。
进一步的,本申请实施例还提供了一种电子设备。图6是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图6为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的基于信息物理系统的模型集成方法中的相关步骤。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222及数据223等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,以实现处理器21对存储器22中海量数据223的运算与处理,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的基于信息物理系统的模型集成方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据223可以包括电子设备20收集到的机器学习模型。
进一步的,本申请实施例还公开了一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器加载并执行时,实现前述任一实施例公开的基于信息物理系统的模型集成方法步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的基于信息物理系统的模型集成方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (9)
1.一种基于信息物理系统的模型集成方法,其特征在于,包括:
获取与待集成的机器学习模型对应的PMML文件;其中,所述机器学习模型包括利用各种开发工具开发的算法模型;
基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件;其中,所述FMU文件包含所述机器学习模型的语义描述信息;所述参数值文件包含所述机器学习模型的训练参数及其训练值;
控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作;
所述基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件包括:
根据预设语义规则对所述PMML文件进行解析得到与所述机器学习模型对应的XML文件及所述参数值文件;
根据所述预设语义规则对所述PMML文件进行转译得到编译环境下的可执行文件,并在所述编译环境下对所述可执行文件进行编译得到对应的二进制可执行文件;
将所述XML文件和所述二进制可执行文件压缩合成为与所述机器学习模型对应的所述FMU文件。
2.根据权利要求1所述的基于信息物理系统的模型集成方法,其特征在于,所述基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件之后,还包括:
将所述FMU文件和所述参数值文件分别存储至模型库和参数值库;其中,所述模型库中的所述FMU文件与所述参数值库中的所述参数值文件之间具有通过文件标识构建的映射关系;
相应的,所述控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,包括:
控制所述信息物理系统根据所述集成指令通过FMI接口分别从所述模型库和所述参数值库中获取所述FMU文件和参数值文件。
3.根据权利要求2所述的基于信息物理系统的模型集成方法,其特征在于,所述获取与待集成的机器学习模型对应的PMML文件之后,还包括:
判断所述模型库中是否存在与所述PMML文件对应的所述FMU文件,如果否,则执行基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件的步骤。
4.根据权利要求3所述的基于信息物理系统的模型集成方法,其特征在于,所述判断所述模型库中是否存在与所述PMML文件对应的所述FMU文件之后,还包括:
如果是,则判断所述参数值库中是否存在与所述PMML文件对应的所述参数值文件,如果否,则根据预设语义规则对所述PMML文件进行解析得到与所述机器学习模型对应的所述参数值文件;
通过文件标识的方式构建所述参数值文件与所述模型库中已经存在的与所述PMML文件对应的所述FMU文件之间的映射关系,并将所述参数值文件存储至所述参数值库。
5.根据权利要求1至4任一项所述的基于信息物理系统的模型集成方法,其特征在于,所述在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作之后,还包括:
当集成后的所述机器学习模型的所述PMML文件中的所述训练参数或其训练值发生变化时,则从变化后的PMML文件中提取出对应的变化后的参数值文件,以利用变化后的参数值文件对集成后的所述机器学习模型进行更新。
6.根据权利要求5所述的基于信息物理系统的模型集成方法,其特征在于,所述利用变化后的参数值文件对集成后的所述机器学习模型进行更新,包括:
控制所述信息物理系统根据通过FMI接口获取变化后的参数值文件并对所述FMU运行环境进行重置;
在重置后的FMU运行环境中利用变化后的参数值文件对集成后的所述机器学习模型进行参数更新并实例化运行。
7.一种基于信息物理系统的模型集成装置,其特征在于,包括:
获取模块,用于获取与待集成的机器学习模型对应的PMML文件;其中,所述机器学习模型包括利用各种开发工具开发的算法模型;
处理模块,用于基于预设规则对所述PMML文件进行处理得到与所述机器学习模型对应的符合FMI标准的FMU文件和参数值文件;其中,所述FMU文件包含所述机器学习模型的语义描述信息;所述参数值文件包含所述机器学习模型的训练参数及其训练值;
所述处理模块包括:
解析单元,用于根据预设语义规则对所述PMML文件进行解析得到与所述机器学习模型对应的XML文件及所述参数值文件;
转译单元,用于根据所述预设语义规则对所述PMML文件进行转译得到编译环境下的可执行文件;
编译单元,用于在所述编译环境下对所述可执行文件进行编译得到对应的二进制可执行文件;
压缩单元,用于将所述XML文件和所述二进制可执行文件压缩合成为与所述机器学习模型对应的所述FMU文件;
集成模块,用于控制信息物理系统根据集成指令通过FMI接口获取所述FMU文件和参数值文件,以在FMU运行环境中利用获取到的所述FMU文件和参数值文件对所述机器学习模型进行集成操作。
8.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;其中所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至6任一项所述的基于信息物理系统的模型集成方法。
9.一种计算机可读存储介质,其特征在于,用于存储计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1至6任一项所述的基于信息物理系统的模型集成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210073300.7A CN114416099B (zh) | 2022-01-21 | 2022-01-21 | 一种基于信息物理系统的模型集成方法及相关组件 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210073300.7A CN114416099B (zh) | 2022-01-21 | 2022-01-21 | 一种基于信息物理系统的模型集成方法及相关组件 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114416099A CN114416099A (zh) | 2022-04-29 |
CN114416099B true CN114416099B (zh) | 2023-11-28 |
Family
ID=81275482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210073300.7A Active CN114416099B (zh) | 2022-01-21 | 2022-01-21 | 一种基于信息物理系统的模型集成方法及相关组件 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114416099B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115437642B (zh) * | 2022-11-07 | 2024-05-14 | 深圳鲲云信息科技有限公司 | 一种模型编译方法、装置、电子设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109343857A (zh) * | 2018-08-22 | 2019-02-15 | 中国平安人寿保险股份有限公司 | 线上部署机器学习模型的方法、设备和存储介质 |
CN111917634A (zh) * | 2020-07-02 | 2020-11-10 | 西安交通大学 | 基于pmml的工业网关机器学习模型容器式部署系统及方法 |
CN112363694A (zh) * | 2020-11-10 | 2021-02-12 | 杭州和利时自动化有限公司 | Fmu文件及求解器运行环境与工业软件的集成方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190155588A1 (en) * | 2017-11-22 | 2019-05-23 | Jpmorgan Chase Bank, N.A. | Systems and methods for transforming machine language models for a production environment |
US11494672B2 (en) * | 2020-05-08 | 2022-11-08 | Sap Se | Cross in-database machine learning |
-
2022
- 2022-01-21 CN CN202210073300.7A patent/CN114416099B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109343857A (zh) * | 2018-08-22 | 2019-02-15 | 中国平安人寿保险股份有限公司 | 线上部署机器学习模型的方法、设备和存储介质 |
CN111917634A (zh) * | 2020-07-02 | 2020-11-10 | 西安交通大学 | 基于pmml的工业网关机器学习模型容器式部署系统及方法 |
CN112363694A (zh) * | 2020-11-10 | 2021-02-12 | 杭州和利时自动化有限公司 | Fmu文件及求解器运行环境与工业软件的集成方法 |
Non-Patent Citations (2)
Title |
---|
(瑞典)彼得·弗里松.Modelica多领域物理系统建模详解与精通[M].北京:航空工业出版社,2021,第1301-1303. * |
基于FMI的分布式联合仿真技术研究;王鸿亮;廉东本;徐久强;;计算机仿真(第04期);第262-267页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114416099A (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108388445B (zh) | 一种基于“平台+应用”模式的持续集成方法 | |
CN105022630B (zh) | 一种组件管理系统及组件管理方法 | |
US11667033B2 (en) | Systems and methods for robotic process automation | |
CN108319460B (zh) | 应用程序安装包的生成方法、装置、电子设备及存储介质 | |
CN112363694B (zh) | Fmu文件及求解器运行环境与工业软件的集成方法 | |
KR20040046463A (ko) | 서블릿 프로그램의 재사용 가능한 비즈니스 로직으로부터이제이비 컴포넌트를 생성하는 시스템 및 방법 | |
CN112363695B (zh) | Pmml文件及其运行时环境与工业软件的集成方法 | |
US20180089337A1 (en) | Creating an engineering project in an industrial automation environment | |
CN103186376A (zh) | 一种用于建立或更新软件开发环境的方法、装置和设备 | |
CN114416099B (zh) | 一种基于信息物理系统的模型集成方法及相关组件 | |
CN116414774A (zh) | 文件迁移方法、装置、设备及存储介质 | |
CN111158797A (zh) | 运行人工智能应用的方法、系统及引擎装置 | |
US20180032329A1 (en) | Customized runtime environment | |
KR20110130611A (ko) | 이기종 운영체제 계층 모듈에서 동작하는 웹기반어플리케이션의 연동이 가능한 모바일 단말기용 웹 플랫폼 유닛 | |
CN113360156B (zh) | 一种ios编译方法及相关设备 | |
CN113448689A (zh) | 运行期Dubbo协议转换装置及方法 | |
CN117234529A (zh) | 一种基于dsl解析资源生成api的方法 | |
CN117112341A (zh) | 一种基于asm字节码插桩的非入侵准实时监控方法及系统 | |
JP2003330756A (ja) | 監視制御ソフトウェアの構成管理方法 | |
CN115794214A (zh) | 应用模块元数据管理方法、设备、存储介质及装置 | |
CN113469284B (zh) | 一种数据分析的方法、装置及存储介质 | |
CN115729590A (zh) | 服务部署方法、装置、设备和计算机可读存储介质 | |
CN114116683A (zh) | 计算平台的多语法处理方法、设备及可读存储介质 | |
CN112148854B (zh) | 一种对话管理方法及装置 | |
WO2022123763A1 (ja) | コールグラフ作成装置、コールグラフ作成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |