CN110399597A - 模板提取系统、装置和方法 - Google Patents
模板提取系统、装置和方法 Download PDFInfo
- Publication number
- CN110399597A CN110399597A CN201810373069.7A CN201810373069A CN110399597A CN 110399597 A CN110399597 A CN 110399597A CN 201810373069 A CN201810373069 A CN 201810373069A CN 110399597 A CN110399597 A CN 110399597A
- Authority
- CN
- China
- Prior art keywords
- model
- template
- keyword
- knowledge
- instance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title abstract description 11
- 239000000284 extract Substances 0.000 claims abstract description 8
- 230000009466 transformation Effects 0.000 claims description 22
- 238000012546 transfer Methods 0.000 claims description 3
- 230000005477 standard model Effects 0.000 claims 1
- 230000007246 mechanism Effects 0.000 abstract description 7
- 238000005265 energy consumption Methods 0.000 abstract description 3
- 238000006073 displacement reaction Methods 0.000 description 26
- 230000035939 shock Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了模板提取系统、装置和方法,其中,包括:接收来自工业物联网中的复数个工业软件中的源知识,并将上述源知识信息转化为标准模型,所述标准模型包括统一格式的模型模板或模型实例;比较所述统一格式的模型模板或模型实例和知识库中的已有模板,从所述统一格式的模型模板或模型实例中提取新模板。本发明提供的模板提取机制是基于标准关键词组来自动获取模板的,其更加有效并功耗低。此外,本发明能够提供丰富的特定领域知识,其提供特定领域模板来支持工业应用。
Description
技术领域
本发明涉及工业物联网领域,尤其涉及一种模板提取系统、装置和方法。
背景技术
为了管理工业云平台中的大量资产(assets)、变量(variables)和数据(data),我们需要找到一种能够组织和配置上述输入源的信息,这部分工作如今大部分是人工完成的。领域特殊性(Domain specific)的模型模板在输入源组织和配置中非常重要,因其可以支持一些云应用,然而这些模板也大部分由人工来创建。
现有技术的模板提取机制存在一些缺陷。例如,由人工来配置引入了大量信息的输入源非常困难,并且效率低下,容易出现错误。再例如,模板创建需要熟悉不同特殊领域的技术专家,将知识从工业系统传输到网络源进行提取和传输也需要巨大的工作负担。
发明内容
本发明第一方面提供了模板提取方法,其中,包括如下步骤:接收来自工业物联网中的复数个工业软件中的源知识,并将上述源知识信息转化为标准模型,所述标准模型包括统一格式的模型模板或模型实例;比较所述统一格式的模型模板或模型实例和知识库中的已有模板,从所述统一格式的模型模板或模型实例中提取新模板。
进一步地,所述工业软件包括仿真软件、自动化软件。
进一步地,所述转化步骤还包括:调取关键词库中基于语义的标准关键词,并通过设定所述源知识信息中的关键词来将所述源知识信息转化为标准模型。
进一步地,在所述转化步骤还包括如下步骤:接收来自工业物联网中的复数个工业软件中的源知识,解析所述源知识,获取所述源知识中的每个关键词和所述关键词之间的关系,将每个关键词和所述关键词之间的关系构建为统一的语义模型;将所述关键词和关键词库中的标准关键词进行比较,在关键词组中找到标准关键词对所述关键词进行校准,输出基于标准关键词的语义模型;计算基于标准关键词的语义模型中的关键词在特定分类中的出现概率,基于所述出现概率对该基于标准关键词的语义模型进行分类,并输出具有分类信息的标准模型。
进一步地,在所述转化步骤中,当一个标准模型被定义为模板类型,则输出统一格式的模型模板,否则输出一个模型实例。
进一步地,所述提取步骤还包括:比较所述统一格式的模型实例和知识库中的已有模板,统计在一个所述统一格式的模型实例中出现至少两次的模型,获取能够重复使用的新模板。
进一步地,所述提取步骤还包括:比较所述统一格式的模型实例和知识库中的已有模板,如果在一个所述统一格式的模型实例中找到至少两个已有模板的结合,则获取所述两个已有模板的结合作为能够重复使用的新模板。
进一步地,其还包括如下步骤:比较所述统一格式的模型模板或模型实例中的关键词和知识库中的已有关键词,从所述统一格式的模型模板或模型实例中提取新关键词,并将该新关键词设置于一个关键词组中。
本发明第二方面提供了一种模板提取装置,其中,包括:知识转化模块,其接收来自工业物联网中的复数个工业软件中的源知识,并将上述源知识信息转化为标准模型,其中,所述标准模型包括统一格式的模型模板或模型实例;知识分析模块,其比较所述统一格式的模型模板或模型实例和知识库中的已有模板,从所述统一格式的模型模板或模型实例中提取新模板。
进一步地,所述工业软件包括仿真软件、自动化软件。
进一步地,所述转化步骤还包括:知识转化模块包括校准模块,所述校准模块调取关键词库中基于语义的标准关键词,并通过设定所述源知识信息中的关键词来将所述源知识信息转化为标准模型。
进一步地,知识转化模块包括:解析模块,其接收来自工业物联网中的复数个工业软件中的源知识,解析所述源知识,获取所述源知识中的每个关键词和所述关键词之间的关系,将每个关键词和所述关键词之间的关系构建为统一的语义模型;校准模块,其将所述关键词和关键词库中的标准关键词进行比较,在关键词组中找到标准关键词对所述关键词进行校准,输出基于标准关键词的语义模型;分类模块,其计算基于标准关键词的语义模型中的关键词在特定分类中的出现概率,基于所述出现概率对该基于标准关键词的语义模型进行分类,并输出具有分类信息的标准模型。
进一步地,当一个所述标准模型被定义为模板类型,则输出统一格式的模型模板,否则输出一个模型实例。
进一步地,知识分析模块还包括:实例分析模块,其比较所述统一格式的模型实例和知识库中的已有模板;统计模块,其统计在一个所述统一格式的模型实例中出现至少两次的模型,获取能够重复使用的新模板。
进一步地,知识分析模块还包括:实例分析模块,期比较所述统一格式的模型实例和知识库中的已有模板,统计模块,其统计在一个所述统一格式的模型实例中出现至少两个已有模板的结合,并获取所述两个已有模板的结合作为能够重复使用的新模板。
进一步地,知识分析模块还包括关键词分析模块,其比较所述统一格式的模型模板或模型实例中的关键词和知识库中的已有关键词,从所述统一格式的模型模板或模型实例中提取新关键词,并将该新关键词设置于一个关键词组中。
本发明第三方面还提供了一种模板提取系统,其中,包括:一个存储介质,其存储复数个指令;一个连接于所述存储介质的总线;一个耦合于所述总线的处理器,当所述处理器执行指令时,使得所述工业云中的协议配置系统执行根据本发明第一方面所述的模板提取。
本发明提供的模板提取机制是基于标准关键词组来自动获取模板的,其更加有效并功耗低。本发明能够从不同的软件获取模板并将它转化成基于标准关键词的标准模型,并且能够基于分析不同实例中的节点关系来学习隐含的节点关系。此外,本发明能够提供丰富的特定领域知识,其提供特定领域模板来支持工业应用。本发明能够应用于工业云平台来提供资源组织,其提供了高效、低功耗和更好的客户体验。
附图说明
图1是根据本发明一个具体实施例的模板提取装置的系统架构图;
图2是根据本发明一个具体实施例的模板示意图;
图3是根据本发明一个具体实施例的实例示意图;
图4是根据本发明一个具体实施例的模板提取装置的知识转化模块的功能结构示意图;
图5是根据本发明的一个具体实施例的模板提取装置的关键词库的结构示意图;
图6是根据本发明的一个具体实施例的模板提取装置的知识库的结构示意图;
图7是根据本发明一个具体实施例的模板提取方法的转化步骤中对一个源知识信息进行校准和分类步骤的示意图;
图8是根据本发明的一个具体实施例的模板提取装置的知识分析装置的功能示意图;
图9是根据本发明的一个具体实施例的模板提取装置的实例分析模块的从实例本身提取模板的示意图;
图10是根据本发明的一个具体实施例的模板提取装置的实例分析模块的通过合并已有的模板来获取模板的示意图。
具体实施方式
以下结合附图,对本发明的具体实施方式进行说明。
本发明提供了一种基于知识挖掘(knowledge mining)的自动模板提取机制,本发明可以从现场一些软件、数据源去提取可以重复使用的模型模板,以在创建新的模型模板时可以加速建模的过程。其中,一个典型的工业自动化系统主要是由自动软件来配置,并由仿真软件来建模的。因此,模型模板能够从这些软件来配置。本发明能够利用这些输出配置来获取模板,包括模板和实例的知识会被描述为标准的关键词设定,以便于和其他系统和项目功用模板。本发明使得模型提取机制更加容易和更有效率,而并非依赖于有经验的技术专家。
图1是根据本发明一个具体实施例的模板提取机制的系统架构图。如图1所示,模板提取装置100包括一个知识转化模块(Knowledge Converter)110和一个知识分析模块(Knowledge Analyzer)120,其中,知识转化模块110从仿真软件SS、自动软件AS和其他软件OS分别导入源知识,并将上述源知识信息转化为标准模型。关键词库130用于辅助知识转化模块110将实例和模板中的关键词标准化。知识分析模块120用于从所述标准模型中获取领域模板。知识库140中包括创建的新模板和新实例,已有的老模板和老实例以及统计信息。
具体地,本文所述的模板是包括至少两个节点和一个连接的模型,其中,每个节点代表着一个类型而并非一个实体。模板可以在不同的实例中被发现或者重复使用。图2示例性地示出了一个装配线驱动模板,例如福特汽车的装配线驱动模板。如图2所示,“Motor(发动机)”、“Gearbox(齿轮箱)”、“Roller(摩擦轮)”、“Vibration Sensor(震动传感器)”和“Displacement Sensor(位移传感器)”是节点。而上述节点之间的线表示彼此之间的连接,例如,节点“Motor”和节点“Vibration Sensor”以及节点“Roller”和节点“DisplacementSensor”之间的连接关系为“wearing(连接)”,节点“Gearbox”分别和节点“Motor”以及节点“Roller”之间的连接关系为“Driving(驱动)”。
具体地,本文所述的实例是描述了一个包括多个真实装置、多个变量以及它们之间的连接的系统模型,每个节点代表着实体而并非类型。图3示例性地示出了一个福特汽车的装配线驱动实例,如图3所示,“Motor1(发动机1)”、“Gearbox1(齿轮箱2)”、“Roller1(摩擦轮1)”、“Vibration Sensor1(震动传感器1)”、“Displacement Sensor1(位移传感器1)”、“Motor2(发动机2)”、“Gearbox2(齿轮箱2)”、“Roller2(摩擦轮2)”、“Vibration Sensor2(震动传感器2)”和“Displacement Sensor2(位移传感器2)”是真实装置。上述真实装置之间的连线代表真实装置之间的连接,例如,真实装置“Motor1”和真实装置“VibrationSensor1”以及真实装置“Roller1”和真实装置“Displacement Sensor1”之间的连接关系为“wearing(连接)”,真实装置“Gearbox1”分别和真实装置“Motor1”以及真实装置“Roller1”之间的连接关系为“Driving(驱动)”,真实装置“Motor2”和真实装置“Vibration Sensor2”以及真实装置“Roller2”和真实装置“Displacement Sensor2”之间的连接关系为“wearing(连接)”,真实装置“Gearbox2”分别和真实装置“Motor2”以及真实装置“Roller1”之间的连接关系为“Driving(驱动)”。如图3所示的福特汽车的装配线驱动具有两个两个发动机“Motor1”和“Motor2”,两个发动机“Motor1”和“Motor2”之间的关系是“next to(相邻)”。进一步地,两个发动机“Motor1”和“Motor2”分别直接或间接地连接着或者驱动着“Gearbox1(齿轮箱2)”、“Roller1(摩擦轮1)”、“Vibration Sensor1(震动传感器1)”、“DisplacementSensor1(位移传感器1)”和“Gearbox2(齿轮箱2)”、“Roller2(摩擦轮2)”、“VibrationSensor2(震动传感器2)”和“Displacement Sensor2(位移传感器2)”。并且,两个发动机“Motor1”和“Motor2”具有和“Rail(轨道)”之间的连线,连线的箭头指向是从轨道到电机,两个发动机“Motor1”和“Motor2”具有和真实装置轨道之间的关系为“hasDriver(具有驱动)”。所述“Rail”和“SkidLine”之间具有连线,两者之间的关系为“hasRail(具有轨道),连线的箭头指向是从“SkidLine”到“Rail”。
其中,本文所述的语义框架(SF,Semantic Framework)是作为本发明的关键词库130和知识库140的基本框架,其包括结构知识源(structured knowledge resource)、包括语义模型标准的知识,例如ISA-95和SSN(Semantic Sensor Network)。这些语义模型标准的知识通过不同的分类信息进行组织。具体地,语义框架包括两个主要组成,分别为核心(core)和知识包(Knowledge Package)。其中,一个典型的语义框架模型包括一个核心和所述核心连接的若干个知识包。其中,核心中的语义知识由语义本体标准(semanticontology standards)组成,语义本体标准描述了关于工业自动化系统的普遍知识。知识包中的知识由一个特定分类的模型组成。
其中,关键词库中的关键词和知识库的知识信息归属于一个或多个分类,并适应于框架。关键词库是由关键词组成的数据库,其中,所述关键词是由分类信息来组织的。一组关键词属于一个分类信息并包括许多词组,每个词组包括一个关键词以及和该关键词意思相近的多个关键词。具体地,一个词组中的关键词是标准词,而同一个词组中的另一个词就会被该标准次替换。例如,如果一个模型具有类型为“ElectricMotor”的节点,而该模型被归类于“Assembly Line”,因此,该节点“ElectricMotor”就会被替换为“Motor”。在排列以后,具有相似意义的节点会具有同样类型。
示例性地,图5是一个关键词库,其核心关键词组(Core Word Groups)包括控制系统(Control System)、车辆(Vehicle)和装配线(Assembly Line),其中,控制系统进一步地包括控制系统词组(Control System Word Groups),车辆进一步地包括车辆词组(VehicleWord Groups)。其中,装配线词组(Assembly Line Word Groups)进一步地包括电机词组和驱动词组,其中电机词组包括标准关键词“Motor”和其他关键词“ElectricMotor”“ElectricalMotor”“MotorEngine”,因此需要用标准关键词“Motor”替换其他同样意义的关键词“ElectricMotor”“ElectricalMotor”“MotorEngine”。驱动词组包括标准关键词“Drive”和其他关键词“Drives”和“Driving”,因此需要用标准关键词“Drive”替换其他同样意义的关键词“Drives”和“Driving”。
其中,本文所述的知识库是一个由语义标准、模板、实例和统计数据组成的数据库,其中,上述语义标准、模板、实例和统计数据组成的数据是由分类信息进行组织的。示例性地,图6示出了一个知识库,在核心(Core)中包括SSN(Semantic Sensor Network)语义传感网标准和QUDT,其中,“控制系统(Control System)”、“加工厂(Process Plant)”、“车辆(Vehicle)”和“装配线(Assembly Line)”为分类(Classification)。语义标准ISA-95被指派给控制系统分类,语义标准ISO-15926和控制系统实例(Control System Instance)被指派给加工厂分类,车辆实例(Vehicle Instance)和引擎模板(Engine Template)被指派给车辆分类,驱动模板(Driver Template)被指派给装配线分类,标准ISO-15926和制程模板(Process Template)被指派给加工厂分类。
本发明第一方面提供了一种模板提取方法,其中,包括如下步骤:
首先执行步骤S1,接收来自工业物联网中的不同类型工业软件中的源知识,并将上述源知识信息转化为标准模型,所述标准模型包括统一格式的模型模板或模型实例。其中,步骤S1是由图1中的知识转化模块110来执行的。
具体地,知识转化模块110的输入包括源知识信息,这些基于文本配置的源知识信息来自不同的软件,包括仿真软件SS、自动软件AS和其他软件OS。其中,来自仿真软件SS的源知识信息是软件中虚拟的设备之间的关系和运行的逻辑顺序等,来自自动软件AS的源知识信息是软件中现场设备真实的自动化逻辑和数据结构。其他软件OS是非标准软件,大都是自己开发的。知识转化模块110的输入还包括在语义框架中的关键词设定组织(KeywordSet Organized in SSF)。其中,知识转化模块110利用关键词设定将源知识信息转化为统一的标准模型。知识转化模块110的输出为标准模型,所述标准模型为统一格式的模型模板或模型实例,所述标准模型是用基于语义的标准关键词来描述的。这些输出模型模板或者模型实例还包括了领域分类信息(information of domain classifications)。知识转化模块110的输出还包括原始词汇,其是用于发送给知识分析模块120产生新词汇的。
如图4所示,一个典型的知识转化模块110包括一个解析模块(Parser Module)1102、一个校准模块(Alignment Module)1104和一个分类模块(Classification Module)1106。具体地,所述转化步骤S1还包括如下步骤:
步骤S11,接收来自工业物联网中的复数个工业软件中的源知识,解析所述源知识,获取所述源知识中的每个关键词和所述关键词之间的关系,将每个关键词和所述关键词之间的关系构建为统一的语义模型。其中,所述校准模块1104包括多个适配器,每个适配器对应一个设备端软件和不同格式的输入。具体地,根据本发明一个具体实施例,第一适配器1102a对应流程仿真软件SS1,第二适配器1102b对应PLM仿真软件SS2,第三适配器1102c对应自动化工程设计软件AS1,第四适配器1102d对应其他软件OS1。总之,上述软件分别输出源知识(专业知识)给解析模块1102中对应的多个适配器,不同的适配器对应不同的格式。多个适配器再通过解析器1102e对专业知识进行格式转化然后输出统一格式的知识信息给校准模块1104。具体地,第一适配器102a、第二适配器102b、第三适配器102c、第四适配器102d用于描述从某一工业软件传输的所述源知识中配置文件的模式(schema)或者语法(grammar)中的关键词和所述关键词之间的关系。解析模块1102利用上述适配器对特定的配置进行解析,并从所述配置中获取每个词和关系,然后将上述数据构建为一个语义模型。
步骤S12,将所述关键词和关键词库130中的标准关键词进行比较,在关键词组中找到标准关键词对所述关键词进行校准,输出基于标准关键词的语义模型。具体地,校准模块1104通过对模型里的元素进行关键词转化从而输出标准关键词的知识信息给分类模块1106。具体地,校准模块1104将从解析模块1102提取的关键词和关键词库130中的在语义框架中组织的关键词设定进行比较,并在词组中找到关键词。
步骤S13,计算基于标准关键词的语义模型中的关键词在特定分类中的出现概率,基于所述出现概率对该基于标准关键词的语义模型进行分类,并输出具有分类信息的标准模型。分类模块1106通过领域关键词对知识信息进行分类。具体地,分类模块1106计算一个分类中包括的关键词出现的次数和百分比,并获得出现最高几率的特定分类。也就是说,如果一个模型的关键词主要包括在一个分类中,这个关键词就属于这个分类。
进一步地,在所述转化步骤中,当一个标准模型被定义为模板类型,则输出统一格式的模型模板,否则输出一个模型实例。其中,知识转化模块110输出的是基于标准关键词的模板和实例(Templates or Instances in Standard Keywords),以及基于原始词的实例(Instances with original words)。其中,所述知识转化模块110的输出是基于标准关键词并具有分类信息的模型或者实例,并包括包括基于原始词的实例(10和30)。基于原始词的实例具有统一的格式但没有关键词校准。如果一个配置被明确地定义为模板类型,模型会被当成一个模板来输出,否则其就会按照一个实例输出。
图7是根据本发明一个具体实施例的模板提取方法的转化步骤中对一个源知识信息进行校准和分类步骤的示意图。如图7所示,从解析模块1102输出的语义模型10为一个具有基于原始词的语义模型,语义模型10包括三个节点“ElectricMotor”、“Gear-box”和“TransportRoller”。其中,三个节点的关系是:“ElectricMotor”驱动(Driving)“Gear-box”,“Gear-box”驱动(Drives)“TransportRoller”。语义模型10在经过校准步骤步骤S12后,输出了标准关键词的语义模型20。具体地,校准模块1104将语义模型10中的关键词“ElectricMotor”、“Gear-box”、“TransportRoller”、“Driving”和“Drives”和关键词库130中的标准关键词进行比较,在关键词组中找到标准关键词“Motor”、“Gearbox”、“Roller”、“Drive”分别对上述关键词“ElectricMotor”、“Gear-box”、“TransportRoller”、“Driving”和“Drives”进行替换,输出了标准关键词的语义模型20。其中,所述语义模型20包括包括三个节点“Motor”、“Gearbox”和“Roller”。其中,三个节点的关系是:“Motor”驱动(Drives)“Gearbox”,“Gearbox”驱动(Drives)“Roller”。然后,所述语义模型20通过分类步骤S13,输出具有分类信息的标准模型30。具体地,如图8所示,所述语义模型20的关键词主要出现在“Assembly Line”(装配线)这个分类中,因此这些关键词就属于“Assembly Line”这个分类(Classification)。其中,具有分类信息的标准模型30不仅包括上文所述的标准模型20的三个节点和三个节点之间的关系,还包括分类信息“Classification”和“Assembly Line”。
然后执行步骤S2,将所述统一格式的模型模板和知识库中模板进行比较,从标准模型中获取领域模板。其中,步骤S2是由知识分析模块120来执行的。如图8所示,知识分析模块120包括一个实例分析模块1201和一个关键词分析模块1202以及一个统计模块1203。其中,知识转化模块110输出的具有分类信息的标准模型30若为一个实例,则该具有分类信息的标准模型30通过所述实例分析模块1201分析,并基于对该实例和知识库140的分析提取模板,并将模板保存于所述知识库140中。其中,统计模块1203用于对统计结果进行计算,并将分析结果保存在知识库140中用于将来的分析。
具体地,实例分析模块1201可以用三种方式来提取模板,第一种提取方式为从实例本身提取模板,第二种方式为从实例和知识库提取模板,第三种方式为通过合并已有的模板来获取模板。
具体地,在第一种方式从实例本身提取模板中,比较所述统一格式的模型实例和知识库中的已有模板,统计在一个所述统一格式的模型实例中出现超过两次及以上的模型,获取能够重复使用的新模板。其中,每个模型不包括在任意其他模型中,每个模型包括一组节点和所述节点之间的连接关系。另外,将一个实例中出现超过两次的模型标记为模板。如图9所示,实例40为一个福特汽车的装配线驱动实例,其中,“Motor1(发动机1)”、“Gearbox1(齿轮箱2)”、“Roller1(摩擦轮1)”、“Vibration Sensor1(震动传感器1)”、“Displacement Sensor1(位移传感器1)”、“Motor2(发动机2)”、“Gearbox2(齿轮箱2)”、“Roller2(摩擦轮2)”、“Vibration Sensor2(震动传感器2)”和“Displacement Sensor2(位移传感器2)”是真实装置。上述真实装置之间的连线代表真实装置之间的连接,例如,真实装置“Motor1”和真实装置“Vibration Sensor1”以及真实装置“Roller1”和真实装置“Displacement Sensor1”之间的连接关系为“Wear(连接)”,真实装置“Gearbox1”分别和真实装置“Motor1”以及真实装置“Roller1”之间的连接关系为“Drive(驱动)”,真实装置“Motor2”和真实装置“Vibration Sensor2”以及真实装置“Roller2”和真实装置“Displacement Sensor2”之间的连接关系为“Wear(连接)”,真实装置“Gearbox2”分别和真实装置“Motor2”以及真实装置“Roller1”之间的连接关系为“Drive(驱动)”。实例40具有两个发动机“Motor1”和“Motor2”,两个发动机“Motor1”和“Motor2”之间的关系是“Next to(相邻)”。进一步地,两个发动机“Motor1”和“Motor2”分别直接或间接地连接着或者驱动着“Gearbox1(齿轮箱2)”、“Roller1(摩擦轮1)”、“Vibration Sensor1(震动传感器1)”、“Displacement Sensor1(位移传感器1)”和“Gearbox2(齿轮箱2)”、“Roller2(摩擦轮2)”、“Vibration Sensor2(震动传感器2)”和“Displacement Sensor2(位移传感器2)”。并且,两个发动机“Motor1”和“Motor2”具有和“Rail”之间的连线,连线的箭头指向是从轨道到电机,两个发动机“Motor1”和“Motor2”具有和真实装置“Rail”之间的关系为“hasDriver(具有驱动)”。所述“Rail”和“SkidLine”之间具有连线,两者之间的关系为“hasRail”(具有轨道),连线的箭头指向是从“SkidLine”到“Rail”。实例40经过实例分析模块1201的分析提取出了新模板50。所述新模板50包括一个装配线模板51和一个驱动模板52。其中,装配线模板具有两个节点“SkidLine”到“Rail”,两者之间的关系为“hasRail”(具有轨道),连线的箭头指向是从“SkidLine”到“Rail”。驱动模板具有包括包括五个节点“Motor”、“Gearbox”、“Roller”、“Vibration Sensor”、“Displacement Sensor”。其中,五个个节点的关系是:“Motor”驱动(Drive)“Gearbox”,“Gearbox”驱动(Drive)“Roller”,“Motor”连接(Wear)“Vibration Sensor”,“Roller”连接(Wear)“Displacement Sensor”。
具体地,在第二种方式从实例和知识库140提取模板中,首先从实例中切断(cutoff)符合任何模板的模型,其中,模板包括所有来自这个实例和知识库140的所有模板。然后,通过比较剩下的实例和知识库140中的实例找到出现了两次以上的模型。接着,将所述模型标注为模板。然后,切断(cut off)符合任何模板的模型,其中,模板包括所有来自这个实例和知识库140的所有模板。最后,标注剩下的单个模型为模板。
具体地,在第三种方式为通过合并已有的模板来获取模板中,比较所述统一格式的模型实例和知识库中的已有模板,如果在一个所述统一格式的模型实例中找到超过两个已有模板的结合,则获取所述两个已有模板的结合作为能够重复使用的新模板。并且,将这个结合标注为模板。如图10所示,实例70包括发动机“Motor1”,发动机“Motor1”直接或间接地连接着或者驱动着“Gearbox1(齿轮箱1)”、“Roller1(摩擦轮1)”、“Vibration Sensor1(震动传感器1)”。发动机“Motor1”具有和“Rail(轨道)”之间的连线,连线的箭头指向是从“Rail”到电机,发动机“Motor1”具有和真实装置“Rail”之间的关系为“hasDriver(具有驱动)”。所述“Rail”和“SkidLine”之间具有连线,两者之间的关系为“hasRail(具有轨道)”,连线的箭头指向是从“SkidLine”到“Rail”。其中,“Motor1”驱动(Drive)“Gearbox1”,“Gearbox1”驱动(Drive)“Roller1”,“Motor1”连接(Wear)“Vibration Sensor1”,“Roller1”连接(Wear)“Displacement Sensor1”。已存在的模板80包括驱动模板81和发动机连接模板82,其中,驱动模板81包括三个节点“Gearbox(齿轮箱)”、“Roller(摩擦轮)”、“Motor(发动机)”,其中,“Motor”驱动(Drive)“Gearbox”,“Gearbox”驱动(Drive)“Roller”。其中,发动机连接模板82包括两个节点“Motor(发动机)”和“Vibration Sensor(震动传感器)”,“Motor(发动机)”连接(Wear)“Vibration Sensor(震动传感器)”。实例70和已存在的模板80经过实例分析模块1201的分析提取出了新模板90。新模板90包括一个扩展驱动模板91,其中,包括四个节点“Gearbox(齿轮箱)”、“Roller(摩擦轮)”、“Motor(发动机)”和“Vibration Sensor(震动传感器)”。具体地,其中,“Motor”驱动(Drive)“Gearbox”,“Gearbox”驱动(Drive)“Roller”,“Motor(发动机)”连接(Wear)“Vibration Sensor(震动传感器)”。
本发明第一方面的一种模板提取方法比较还包括如下步骤:比较所述统一格式的模型模板或模型实例中的关键词和知识库中的已有关键词,从所述统一格式的模型模板或模型实例中提取新关键词,并将该新关键词设置于一个关键词组中。
其中,关键词分析模块1202分析了具有分类信息的标准模型30这个实例中的关键词并找到新关键词,然后将新关键词归结于一个词组。例如,当一个标准关键词“Motor”被频繁使用时,其被判断为一个关键词,如果另一个新的关键词“Emachine”与标准关键词“Motor”比较后具有相同的关系和相邻节点,但是“Emachine”比“Motor”出现的概率少,因此将新关键词“Emachine”设定于关键词“Motor”的关键词组中。新的关键词及其词组会被保存在关键词库130中。其中,保存在知识库140中的实例用于将来的分析。
统计模块1203用于对模板和关键词进行统计,并将所述统计结果输出至知识库140进行保存。也就是说,上文所述的步骤,任何相关于模板和关键词的统计都是由统计模板1203来完成的。下面分别举例进行说明。
名字 | 分类信息 | 总次数 | 平均次数 |
Process Template | ProcessPlant | 2 | 1 |
Engine Template | Vehicle | 6 | 2 |
表1统计模块1203对模板的统计示例
表1为统计模块1203对模板的统计示例,如表1所示,模板Process Template的分类信息为ProcessPlant,这个模板总共出现了2次,在某一实例中平均出现的次数为1。再例如,模板Engine Template的分类信息为Vehicle,这个模板总共出现了6次,在某一实例中平均出现的次数为2。
关键词 | 总次数 | 实例中出现次数 |
eMachine | 2 | 1 |
connect | 10 | 2 |
表1统计模块1203对关键词的统计示例
表2为统计模块1203对关键词统计示例,如表1所示,关键词eMachine在很多实例中总共出现了2次,在某几个实例中出现次数为1。再例如,关键词connect在很多实例中总共出现了10次,在某几个实例中出现次数为2。
其中,具有分类信息的标准模型(包括实例和模板)、统计结果(关键词统计和模板统计)都将保存在知识库140中。其中,实例和模板将链接至分类信息,统计结果会保存在数据库中。
本发明第二方面提供了一种模板提取装置,其中,包括:知识转化模块,其接收来自工业物联网中的复数个工业软件中的源知识,并将上述源知识信息转化为标准模型,其中,所述标准模型包括统一格式的模型模板或模型实例;知识分析模块,其比较所述统一格式的模型模板或模型实例和知识库中的已有模板,从所述统一格式的模型模板或模型实例中提取新模板。
进一步地,所述工业软件包括仿真软件、自动化软件。
进一步地,所述转化步骤还包括:知识转化模块包括校准模块,所述校准模块调取关键词库中基于语义的标准关键词,并通过设定所述源知识信息中的关键词来将所述源知识信息转化为标准模型。
进一步地,知识转化模块包括:解析模块,其接收来自工业物联网中的复数个工业软件中的源知识,解析所述源知识,获取所述源知识中的每个关键词和所述关键词之间的关系,将每个关键词和所述关键词之间的关系构建为统一的语义模型;校准模块,其将所述关键词和关键词库中的标准关键词进行比较,在关键词组中找到标准关键词对所述关键词进行校准,输出基于标准关键词的语义模型;分类模块,其计算基于标准关键词的语义模型中的关键词在特定分类中的出现概率,基于所述出现概率对该基于标准关键词的语义模型进行分类,并输出具有分类信息的标准模型。
进一步地,当一个所述标准模型被定义为模板类型,则输出统一格式的模型模板,否则输出一个模型实例。
进一步地,知识分析模块还包括:实例分析模块,其比较所述统一格式的模型实例和知识库中的已有模板;统计模块,其统计在一个所述统一格式的模型实例中出现至少两次的模型,获取能够重复使用的新模板。
进一步地,知识分析模块还包括:实例分析模块,期比较所述统一格式的模型实例和知识库中的已有模板,统计模块,其统计在一个所述统一格式的模型实例中出现至少两个已有模板的结合,并获取所述两个已有模板的结合作为能够重复使用的新模板。
进一步地,知识分析模块还包括关键词分析模块,其比较所述统一格式的模型模板或模型实例中的关键词和知识库中的已有关键词,从所述统一格式的模型模板或模型实例中提取新关键词,并将该新关键词设置于一个关键词组中。
本发明第三方面还提供了一种模板提取系统,其中,包括:一个存储介质,其存储复数个指令;一个连接于所述存储介质的总线;一个耦合于所述总线的处理器,当所述处理器执行指令时,使得所述工业云中的协议配置系统执行根据本发明第一方面所述的模板提取。
本发明提供的模板提取机制是基于标准关键词组来自动获取模板的,其更加有效并功耗低。本发明能够从不同的软件获取模板并将它转化成基于标准关键词的标准模型,并且能够基于分析不同实例中的节点关系来学习隐含的节点关系。此外,本发明能够提供丰富的特定领域知识,其提供特定领域模板来支持工业应用。本发明能够应用于工业云平台来提供资源组织,其提供了高效、低功耗和更好的客户体验。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。此外,不应将权利要求中的任何附图标记视为限制所涉及的权利要求;“包括”一词不排除其它权利要求或说明书中未列出的装置或步骤;“第一”、“第二”等词语仅用来表示名称,而并不表示任何特定的顺序。
Claims (17)
1.模板提取方法,其中,包括如下步骤:
接收来自工业物联网中的复数个工业软件中的源知识,并将上述源知识信息转化为标准模型,所述标准模型包括统一格式的模型模板或模型实例;
比较所述统一格式的模型模板或模型实例和知识库中的已有模板,从所述统一格式的模型模板或模型实例中提取新模板。
2.根据权利要求1所述的模型提取方法,其特征在于,所述工业软件包括仿真软件、自动化软件。
3.根据权利要求1所述的模型提取方法,其特征在于,所述转化步骤还包括:调取关键词库中基于语义的标准关键词,并通过设定所述源知识信息中的关键词来将所述源知识信息转化为标准模型。
4.根据权利要求1所述的模型提取方法,其特征在于,在所述转化步骤还包括如下步骤:
接收来自工业物联网中的复数个工业软件中的源知识,解析所述源知识,获取所述源知识中的每个关键词和所述关键词之间的关系,将每个关键词和所述关键词之间的关系构建为统一的语义模型;
将所述关键词和关键词库中的标准关键词进行比较,在关键词组中找到标准关键词对所述关键词进行校准,输出基于标准关键词的语义模型;
计算基于标准关键词的语义模型中的关键词在特定分类中的出现概率,基于所述出现概率对该基于标准关键词的语义模型进行分类,并输出具有分类信息的标准模型。
5.根据权利要求4所述的模型提取方法,其特征在于,在所述转化步骤中,当一个标准模型被定义为模板类型,则输出统一格式的模型模板,否则输出一个模型实例。
6.根据权利要求1所述的模型提取方法,其特征在于,所述提取步骤还包括:比较所述统一格式的模型实例和知识库中的已有模板,统计在一个所述统一格式的模型实例中出现至少两次的模型,获取能够重复使用的新模板。
7.根据权利要求1所述的模型提取方法,其特征在于,所述提取步骤还包括:比较所述统一格式的模型实例和知识库中的已有模板,如果在一个所述统一格式的模型实例中找到至少两个已有模板的结合,则获取所述两个已有模板的结合作为能够重复使用的新模板。
8.根据权利要求1所述的模型提取方法,其特征在于,其还包括如下步骤:比较所述统一格式的模型模板或模型实例中的关键词和知识库中的已有关键词,从所述统一格式的模型模板或模型实例中提取新关键词,并将该新关键词设置于一个关键词组中。
9.模板提取装置,其中,包括:
知识转化模块(110),其接收来自工业物联网中的复数个工业软件中的源知识,并将上述源知识信息转化为标准模型,其中,所述标准模型包括统一格式的模型模板或模型实例;
知识分析模块(120),其比较所述统一格式的模型模板或模型实例和知识库(140)中的已有模板,从所述统一格式的模型模板或模型实例中提取新模板。
10.根据权利要求9所述的模型提取装置,其特征在于,所述工业软件包括仿真软件、自动化软件。
11.根据权利要求8所述的模型提取装置,其特征在于,所述转化步骤还包括:知识转化模块(110)包括校准模块(1104),所述校准模块(1104)调取关键词库(130)中基于语义的标准关键词,并通过设定所述源知识信息中的关键词来将所述源知识信息转化为标准模型。
12.根据权利要求8所述的模型提取装置,其特征在于,知识转化模块(110)包括:
解析模块(1102),其接收来自工业物联网中的复数个工业软件中的源知识,解析所述源知识,获取所述源知识中的每个关键词和所述关键词之间的关系,将每个关键词和所述关键词之间的关系构建为统一的语义模型;
校准模块(1104),其将所述关键词和关键词库(130)中的标准关键词进行比较,在关键词组中找到标准关键词对所述关键词进行校准,输出基于标准关键词的语义模型;
分类模块(1106),其计算基于标准关键词的语义模型中的关键词在特定分类中的出现概率,基于所述出现概率对该基于标准关键词的语义模型进行分类,并输出具有分类信息的标准模型。
13.根据权利要求12所述的模型提取装置,其特征在于,当一个所述标准模型被定义为模板类型,则输出统一格式的模型模板,否则输出一个模型实例。
14.根据权利要求8所述的模型提取装置,其特征在于,知识分析模块(120)还包括:
实例分析模块(1201),其比较所述统一格式的模型实例和知识库(140)中的已有模板;
统计模块(1203),其统计在一个所述统一格式的模型实例中出现至少两次的模型,获取能够重复使用的新模板。
15.根据权利要求8所述的模型提取装置,其特征在于,知识分析模块(120)还包括:
实例分析模块(1201),期比较所述统一格式的模型实例和知识库(140)中的已有模板,
统计模块(1203),其统计在一个所述统一格式的模型实例中出现至少两个已有模板的结合,并获取所述两个已有模板的结合作为能够重复使用的新模板。
16.根据权利要求8所述的模型提取装置,其特征在于,知识分析模块(120)还包括关键词分析模块(1202),其比较所述统一格式的模型模板或模型实例中的关键词和知识库(140)中的已有关键词,从所述统一格式的模型模板或模型实例中提取新关键词,并将该新关键词设置于一个关键词组中。
17.模板提取系统,其中,包括:
一个存储介质,其存储复数个指令;
一个连接于所述存储介质的总线;
一个耦合于所述总线的处理器,当所述处理器执行指令时,使得所述工业云中的协议配置系统执行根据权利要求1至8任一项所述的模板提取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810373069.7A CN110399597B (zh) | 2018-04-24 | 2018-04-24 | 模板提取系统、装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810373069.7A CN110399597B (zh) | 2018-04-24 | 2018-04-24 | 模板提取系统、装置和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110399597A true CN110399597A (zh) | 2019-11-01 |
CN110399597B CN110399597B (zh) | 2023-11-17 |
Family
ID=68320269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810373069.7A Active CN110399597B (zh) | 2018-04-24 | 2018-04-24 | 模板提取系统、装置和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110399597B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113535955A (zh) * | 2021-07-16 | 2021-10-22 | 中国工商银行股份有限公司 | 一种日志快速归类方法及装置 |
CN117034901A (zh) * | 2023-10-10 | 2023-11-10 | 北京睿企信息科技有限公司 | 一种基于文本生成模板的数据统计系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101369265A (zh) * | 2008-01-14 | 2009-02-18 | 北京百问百答网络技术有限公司 | 一种自动生成问题的语义模板的方法和系统 |
CN106777970A (zh) * | 2016-12-15 | 2017-05-31 | 北京锐软科技股份有限公司 | 一种医疗信息系统数据模板化的集成系统及方法 |
CN107340999A (zh) * | 2017-01-09 | 2017-11-10 | 北京理工大学 | 软件自动化方法与系统以及构建自然语言理解库的方法 |
CN107832229A (zh) * | 2017-12-03 | 2018-03-23 | 中国直升机设计研究所 | 一种基于nlp的系统测试用例自动生成方法 |
US20210065569A1 (en) * | 2014-08-28 | 2021-03-04 | Ideaphora India Private Limited | System and method for providing an interactive visual learning environment for creation, presentation, sharing, organizing and analysis of knowledge on subject matter |
-
2018
- 2018-04-24 CN CN201810373069.7A patent/CN110399597B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101369265A (zh) * | 2008-01-14 | 2009-02-18 | 北京百问百答网络技术有限公司 | 一种自动生成问题的语义模板的方法和系统 |
US20210065569A1 (en) * | 2014-08-28 | 2021-03-04 | Ideaphora India Private Limited | System and method for providing an interactive visual learning environment for creation, presentation, sharing, organizing and analysis of knowledge on subject matter |
CN106777970A (zh) * | 2016-12-15 | 2017-05-31 | 北京锐软科技股份有限公司 | 一种医疗信息系统数据模板化的集成系统及方法 |
CN107340999A (zh) * | 2017-01-09 | 2017-11-10 | 北京理工大学 | 软件自动化方法与系统以及构建自然语言理解库的方法 |
CN107832229A (zh) * | 2017-12-03 | 2018-03-23 | 中国直升机设计研究所 | 一种基于nlp的系统测试用例自动生成方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113535955A (zh) * | 2021-07-16 | 2021-10-22 | 中国工商银行股份有限公司 | 一种日志快速归类方法及装置 |
CN113535955B (zh) * | 2021-07-16 | 2022-10-28 | 中国工商银行股份有限公司 | 一种日志快速归类方法及装置 |
CN117034901A (zh) * | 2023-10-10 | 2023-11-10 | 北京睿企信息科技有限公司 | 一种基于文本生成模板的数据统计系统 |
CN117034901B (zh) * | 2023-10-10 | 2023-12-08 | 北京睿企信息科技有限公司 | 一种基于文本生成模板的数据统计系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110399597B (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106777970B (zh) | 一种医疗信息系统数据模板化的集成系统及方法 | |
Huang et al. | A semantic analysis for internet of things | |
CN106934032A (zh) | 一种城市知识图谱构建方法及装置 | |
CN110399597A (zh) | 模板提取系统、装置和方法 | |
CN107102877A (zh) | 一种跨浏览器插件的自适应方法 | |
CN116010619A (zh) | 一种复杂装备知识图谱构建过程中的知识抽取方法 | |
CN110019315A (zh) | 一种用于数据血缘解析的方法和装置 | |
US20160300137A1 (en) | System for the computer-aided creation of rules for monitoring and/or diagnosing a technical plant | |
CN108804301A (zh) | 一种基于事件与故障记录数据的列车控制系统软件测试系统及方法 | |
CN109902215A (zh) | 一种交易匹配的方法及系统 | |
Ehring et al. | SMART standards-concept for the automated transfer of standard contents into a machine-actionable form | |
US20130326336A1 (en) | Generating semantic structured documents from text documents | |
Becker et al. | Hanfor: Semantic Requirements Review at Scale. | |
US20040102960A1 (en) | Process and system for generating knowledge code and converting knowledge code into text | |
US20140250146A1 (en) | Method for generating workflow from business specification | |
CN113392217B (zh) | 一种电力设备故障缺陷实体关系的抽取方法及装置 | |
CN105760274B (zh) | 一种动态激活与调整的日志解析方法和系统 | |
CN113779256A (zh) | 一种文件审核方法及系统 | |
CN114021544A (zh) | 产品合同的要素智能抽取和审核方法及系统 | |
KR101289166B1 (ko) | 엔지니어링 산출물 관리 시스템 및 이의 동작 방법 | |
Sasani et al. | Investigating the role of identified components on green human resource management and green supply chain with an approach to reducing environmental pollutants in Iran Khodro industry | |
Sabou | Learning Web Service Ontologies: Challenges, Achievements and Opportunities | |
CN116702778A (zh) | 一种基于医学专业规范文件的gpt模型训练方法和装置 | |
CN117610570A (zh) | 专家咨询智能系统及方法 | |
Park et al. | Technological Discontinuities and the R&D Strategy of Automobile Companies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |