CN112163430A - 面向mes系统的工业设备数据的本体融合方法和系统 - Google Patents
面向mes系统的工业设备数据的本体融合方法和系统 Download PDFInfo
- Publication number
- CN112163430A CN112163430A CN202011176479.6A CN202011176479A CN112163430A CN 112163430 A CN112163430 A CN 112163430A CN 202011176479 A CN202011176479 A CN 202011176479A CN 112163430 A CN112163430 A CN 112163430A
- Authority
- CN
- China
- Prior art keywords
- concept
- data
- similarity
- attribute
- equal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种面向MES系统的工业设备数据的本体融合方法和系统。所述本体融合方法和系统,采用相似度计算方法确定次体与主体中所有概念之间的相似度,并依据确定的相似度构造概念对。对于形成的概念对,利用属性包含度计算方法确定其属性包含度。根据概念对的相似度和属性包含度,判断概念对中的次体概念是否应当添加到主体当中。若应该添加,进一步判断次体概念与概念对中的主体概念间的具体关系。若不应该添加,则进一步采用基于次体结构的概念拓展方法将次体概念添加到主体概念中,以确保可以最大程度保留融合本体中次体的概念,进而能够在提高匹配正确率的同时,增加融合本体对原本体概念的保留度。
Description
技术领域
本发明涉及数据融合技术领域,特别是涉及一种面向MES系统的工业设备数据的本体融合方法和系统。
背景技术
在MES系统中,工业设备数据存在着多种表达和存储方式,包括用结构化二维表表达和存储的方式、用半结构化的XML文件表达和存储的方式、用非结构化的文档和图片表达和存储的方式等。用不同方式表达和存储的工业设备数据被称为“异构数据”。为了建立工业设备数据的领域本体,首先需要将不同数据源的异构数据分别建立局部本体,再将不同的局部本体融合成为领域本体。本体融合过程中需要对属性、概念进行匹配,现有的匹配方法主要分为两种——基于相似度的匹配方法和基于数据的匹配方法。基于相似度的匹配方法主要依赖于概念和属性的名称的语义相似度。基于数据的匹配方法主要依赖于属性在实例上的取值。
目前基于相似度的匹配方法对于名称语义相似度较高的概念和属性无法进行区分,进而会影响匹配的正确率,并且在进行融合时会丢弃一部分原本体的概念,对原本体概念的保留度较低。而基于数据的匹配方法对属性数据的要求非常高,即使数据的格式或取值范围稍有不同都可能会导致匹配失败,并且其完全抛弃了概念和属性的语义信息,在构建工业设备数据的本体时,即使工作在不同环境下的同一种设备,其数据的取值范围也会不同,导致此方法会有大量应该被匹配的概念和属性没有被匹配,对原本体概念的保留度也较低。
因此提供一种既计算其语义相似度,又采用基于数据匹配的方法计算其数据相似度,从而能够提高匹配的正确率和融合本体对原本体概念保留度的工业设备数据本体融合方法或系统,是本领域亟待解决的一个技术难题。
发明内容
本发明的目的是提供一种既能计算工业设备数据本体的语义相似度,又采用基于数据匹配的方法计算工业设备数据本体的数据相似度,从而能够提高匹配的正确率和融合本体对原本体概念保留度的面向MES系统的工业设备数据的本体融合方法和系统。
为实现上述目的,本发明提供了如下方案:
一种面向MES系统的工业设备数据的本体融合方法,包括:
获取待融合的工业设备数据本体,并将所述待融合的工业设备数据本体划分为主体和次体;
采用相似度计算法确定所述主体和所述次体中每一数据概念的相似度;所述相似度包括:数据属性相似度、对象属性相似度和概念语义相似度;
根据所述相似度构造概念对;所述概念对包括次体概念和主体概念;
采用属性包含度计算方法确定所述概念对的属性包含度;所述属性包含度为所述概念对中相同属性与不同属性间的数量比;
根据所述相似度、所述属性包含度,判断是否将所述概念对中的所述次体概念添加到所述主体概念中,得到第一判断结果;
若所述第一判断结果为是,则确定所述概念对中的所述次体概念与所述概念对中的主体概念间的关系;
若所述第一判断结果为否,则将所述次体概念存入未添加序列中,并采用基于次体结构的概念拓展方法将所述次体概念添加到所述主体概念中。
优选的,所述采用相似度计算法确定所述主体和所述次体中每一数据概念的相似度,具体包括:
其中,d1为主体数据概念中属性的数据、d2为次体数据概念中属性的数据,match(d1,d2)为主体属性中数据和次体属性中数据间相同数据元素的个数,num(d1)为主体数据概念中属性的数据的总个数,num(d2)为次体数据概念中属性的数据的总个数,Simdata(d1,d2)为相似度。
优选的,所述采用属性包含度计算方法确定所述概念对的属性包含度,具体包括:
按照数据类型将所述主体和所述次体分为五种数据序列,并将五种所述数据序列放入同一序列,以形成总序列;
获取序列阈值;
确定所述总序列中大于所述序列阈值的数据元素的个数,记为第一个数;所述第一个数即为所述主体和所述次体中相同的数据属性的数量;
确定所述数据序列中大于所述序列阈值的数据元素的个数,记为第二个数;所述第二个数即为所述主体和所述次体相同的对象属性的数量;
其中,Inc(Aj1,B1)为属性包含度,numA为主体的总数量、numB为次体的总数量,numdata为第一个数,numobj为第二个数。
优选的,若所述第一判断结果为是,则确定所述次体概念与所述主体概念间的关系,具体包括:
若所述相似度为1,所述属性包含度为1,则所述概念对中的次体概念作为所述主体概念的等价类添加到所述主体概念中;
若所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和等于所述主体属性的总数量,则所述次体概念作为主体概念的父类添加到主体概念中;
若所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且,所述第一个数和所述第二个数的和等于所述次体属性的总数量,则所述次体概念作为所述主体概念的子类添加到主体概念中;
若相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和等于所述次体属性的总数量,则所述次体概念作为所述主体概念的子类添加到主体概念中;
若所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和既不等于所述主体属性的总数量也不等于所述次体属性的总数量,则所述次体概念作为所述主体概念的父类的子类添加到主体概念中。
优选的,所述若所述第一判断结果为否,则将所述次体概念存入未添加序列中,并采用基于次体结构的概念拓展方法将所述次体概念添加到所述主体概念中,具体包括:
判断所述次体概念是否具有父类或子类,得到第二判断结果;
若所述第二判断结果为既不具有父类也不具有子类,则不对所述次体概念进行拓展,并将所述次体概念从所述未添加序列中删除;
若所述第二判断结果为具有父类或具有子类,则判断所述次体概念的父类或子类是否被添加到所述主体概念中,若所述父类或所述子类被添加到了所述主体概念中,则将所述次体概念添加到添加有其父类或子类的主体概念中,并与其父类或子类的关系保持不变,并将所述次体概念从所述未添加序列中删除;若所述父类或所述子类未被添加到所述主体概念中,则不进行扩展;
返回“判断所述次体概念是否具有父类或子类,得到第二判断结果”的步骤,直至所述未添加序列为空。
针对上述提供的面向MES系统的工业设备数据的本体融合方法,本发明还对应提供了如下本体融合系统:
一种面向MES系统的工业设备数据的本体融合系统,包括:
数据获取和划分模块,用于获取待融合的工业设备数据本体,并将所述待融合的工业设备数据本体划分为主体和次体;
相似度确定模块,用于采用相似度计算法确定所述主体和所述次体中每一数据概念的相似度;所述相似度包括:数据属性相似度、对象属性相似度和概念语义相似度;
概念对构造模块,用于根据所述相似度构造概念对;所述概念对包括次体概念和主体概念;
属性包含度确定模块,用于采用属性包含度计算方法确定所述概念对的属性包含度;所述属性包含度为所述概念对中相同属性与所有属性间的数量比;
判断模块,用于根据所述相似度、所述属性包含度,判断是否将所述概念对中的所述次体概念添加到所述主体概念中,得到第一判断结果;
关系确定模块,用于当所述第一判断结果为是时,确定所述概念对中的所述次体概念与所述概念对中的主体概念间的关系;
添加模块,用于当所述第一判断结果为否时,将所述次体概念存入未添加序列中,并采用基于次体结构的概念拓展方法将所述次体概念添加到所述主体概念中。
优选的,所述相似度确定模块,具体包括:
其中,d1为主体数据概念中属性的数据、d2为次体数据概念中属性的数据,match(d1,d2)为主体属性中数据和次体属性中数据间相同数据元素的个数,num(d1)为主体数据概念中属性的数据的总个数,num(d2)为次体数据概念中属性的数据的总个数,Simdata(d1,d2)为相似度。
优选的,所述属性包含度确定模块,具体包括:
总序列生成单元,用于按照数据类型将所述主体和所述次体分为五种数据序列,并将五种所述数据序列放入同一序列,以形成总序列;
序列阈值获取单元,用于获取序列阈值;
第一个数确定单元,用于确定所述总序列中大于所述序列阈值的数据元素的个数,记为第一个数;所述第一个数即为所述主体和所述次体中相同数据属性的数量;
第二个数确定单元,用于确定所述数据序列中大于所述序列阈值的数据元素的个数,记为第二个数;所述第二个数即为所述主体和所述次体中相同对象属性的数量;
其中,Inc(Aj1,B1)为属性包含度,numA为主体的总数量、numB为次体的总数量,numdata为第一个数,numobj为第二个数。
优选的,所述关系确定模块,具体包括:
第一关系确定单元,用于当所述相似度为1,所述属性包含度为1时,将所述概念对中的次体概念作为所述主体概念的等价类添加到所述主体概念中;
第二关系确定单元,用于当所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和等于所述主体属性的总数量时,将所述次体概念作为主体概念的父类添加到主体概念中;
第三关系确定单元,用于当所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且,所述第一个数和所述第二个数的和等于所述次体属性的总数量时,将所述次体概念作为所述主体概念的子类添加到主体概念中;
第四关系确定单元,用于当相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和等于所述次体属性的总数量时,将所述次体概念作为所述主体概念的子类添加到主体概念中;
第五关系确定单元,用于当所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和既不等于所述主体属性的总数量也不等于所述次体属性的总数量时,将所述次体概念作为所述主体概念的父类的子类添加到主体概念中。
优选的,所述添加模块,具体包括:
判断单元,用于判断所述次体概念是否具有父类或子类,得到第二判断结果;
第一执行单元,用于当所述第二判断结果为既不具有父类也不具有子类时,不对所述次体概念进行拓展,并将所述次体概念从所述未添加序列中删除;
第二执行单元,用于当所述第二判断结果为具有父类或具有子类时,判断所述次体概念的父类或子类是否被添加到所述主体概念中,若所述父类或所述子类被添加到了所述主体概念中,则将所述次体概念添加到添加有其父类或子类的主体概念中,并与其父类或子类的关系保持不变,并将所述次体概念从所述未添加序列中删除;若所述父类或所述子类未被添加到所述主体概念中,则不进行扩展;
循环执行单元,用于返回执行“判断所述次体概念是否具有父类或子类,得到第二判断结果”的步骤,直至所述未添加序列为空。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的面向MES系统的工业设备数据的本体融合方法和系统,采用相似度计算方法确定次体与主体中所有概念之间的相似度,并依据确定的相似度构造概念对。对于形成的概念对,利用属性包含度计算方法确定其属性包含度。根据概念对的相似度和属性包含度,判断概念对中的次体概念是否应当添加到主体当中。若应该添加,进一步判断次体概念与概念对中的主体概念间的具体关系。若不应该添加,则进一步采用基于次体结构的概念拓展方法将次体概念添加到主体概念中,以确保可以最大程度保留融合本体中次体的概念,进而能够在提高匹配正确率的同时,增加融合本体对原本体概念的保留度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的面向MES系统的工业设备数据的本体融合方法的流程图;
图2为本发明实施例提供的基于次体结构的概念扩展方法流程图;
图3为本发明实施例提供的整体工作流程图;
图4为本发明提供的面向MES系统的工业设备数据的本体融合系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种既能计算工业数据本体语义相似度,又采用基于数据匹配的方法计算工业数据本体的数据相似度,从而能够提高匹配的正确率和融合本体对原本体概念保留度的面向MES系统的工业设备数据的本体融合方法和系统。
本发明采用的本体的概念,为现有领域公知的一种概念化的明确的规范说明,其具体含义请参见文献“Han Jiawei,Kamber M.数据挖掘概念与技术[M].范明,孟小峰,译.2版.北京:机械工业出版社,2007:10-11.”,本发明在此不对本体进行解释说明。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明提供的面向MES系统的工业设备数据的本体融合方法的流程图,如图1所示,一种面向MES系统的工业设备数据的本体融合方法,包括:
步骤100:获取待融合的工业设备数据本体,并将待融合的工业设备数据本体划分为主体和次体。
其中,d1为主体数据概念中属性的数据、d2为次体数据概念中属性的数据,match(d1,d2)为主体属性中数据和次体属性中数据间相同数据元素的个数,num(d1)为主体数据概念中属性的数据的总个数,num(d2)为次体数据概念中属性的数据的总个数,Simdata(d1,d2)为相似度。
步骤102:根据相似度构造概念对。概念对包括次体概念和主体概念。
步骤103:采用属性包含度计算方法确定概念对的属性包含度。属性包含度为概念对中相同属性与所有属性间的数量比。
该步骤具体包括:按照数据类型将主体和次体分为五种数据序列,并将五种数据序列放入同一序列,以形成总序列。
获取序列阈值。
确定总序列中大于序列阈值的数据元素的个数,记为第一个数。第一个数即为主体和次体中相同数据属性的数量。
确定数据序列中大于序列阈值的数据元素的个数,记为第二个数。第二个数即为主体和次体中相同对象属性的数量。
其中,Inc(Aj1,B1)为属性包含度,numA为主体的总数量、numB为次体的总数量,numdata为第一个数,numobj为第二个数。
步骤104:根据相似度、属性包含度,判断是否将概念对中的次体概念添加到主体概念中,得到第一判断结果。
步骤105:若第一判断结果为是,则确定概念对中的次体概念与概念对中的主体概念间的关系。该步骤具体包括:
若相似度为1,属性包含度为1,则概念对中的次体概念作为主体概念的等价类添加到主体概念中。
若相似度大于等于0.6且小于等于1,属性包含度大于等于0.6且小于等于1,并且第一个数和第二个数的和等于主体属性的总数量,则次体概念作为主体概念的父类添加到主体概念中。
若相似度大于等于0.6且小于等于1,属性包含度大于等于0.6且小于等于1,并且,第一个数和第二个数的和等于次体属性的总数量,则次体概念概念作为主体概念的子类添加到主体概念中。
若相似度大于等于0.6且小于等于1,属性包含度大于等于0.6且小于等于1,并且第一个数和第二个数的和等于次体属性的总数量,则次体概念作为主体概念的子类添加到主体概念中。
若相似度大于等于0.6且小于等于1,属性包含度大于等于0.6且小于等于1,并且第一个数和第二个数的和既不等于主体属性的总数量也不等于次体属性的总数量,则次体概念作为主体概念的父类的子类添加到主体概念中。
步骤106:若第一判断结果为否,则将次体概念存入未添加序列中,并采用基于次体结构的概念拓展方法将次体概念添加到主体概念中。该过程具体包括:
判断次体概念是否具有父类或子类,得到第二判断结果。
若第二判断结果为既不具有父类也不具有子类,则不对次体概念进行拓展,并将次体概念从未添加序列中删除。
若第二判断结果为具有父类或具有子类,则判断次体概念的父类或子类是否被添加到主体概念中,若父类或子类被添加到了主体概念中,则将次体概念添加到添加有其父类或子类的主体概念中,并与其父类或子类的关系保持不变,并将次体概念从未添加序列中删除。若父类或子类未被添加到主体概念中,则不进行扩展。
返回“判断次体概念是否具有父类或子类,得到第二判断结果”的步骤,直至未添加序列为空。
其中,假设主体中含有m个概念,记为{A1,A2,...Am},次体中含有n个概念,记为{B1,B2,…Bn}。按顺序从次体中取出一个概念,并依次计算其与主体中所有概念之间的相似度,直到主体和次体之间所有概念的相似度都计算完毕。计算概念相似度需要计算数据属性相似度、对象属性相似度和概念语义相似度,最后将数据属性相似度、对象属性相似度和概念语义相似度加权计算得到相似度。在本发明中以一对概念A1和B1的相似度计算为例,对步骤101和步骤102的具体实施过程进行描述,具体如下:
步骤1、计算数据属性相似度
步骤1.1、将概念中的数据属性按照数据类型分类
概念中数据类型(数据属性的类型)主要包括xsd:boolean、xsd:integer、xsd:double、xsd:dateTime和xsd:string五种,将A1和B1所有的数据类型按照上述五种类型分类,分别得到A1和B1数据属性的5个子集,分别记为{A1int,A1double,A1bool,A1date,A1string}和{B1int,B1double,B1bool,B1date,B1string}。A1int为概念A1中的数据类型为xsd:integer的数据属性子集,其他数据属性依此类推,相同数据类型的数据属性子集构成一个子集对,最终得到5个数据属性子集对(五种数据序列),包括(A1int,B1int)、(A1double,B1double)、(A1bool,B1bool)、(A1date,B1date)、(A1string,B1string)。
步骤1.2、构造数据相似度矩阵
以数据属性数据子集对(A1int,B1int)为例,构造数据属性相似度矩阵。A1int={ad1int,ad2int,…adsint},B1int={bd1int,bd2int,…bdtint},其中ad1int,i∈[1,s],bdjint,j∈[1,t]均为数组,内部存储的数据是对应数据属性在所有实例中的取值集合。计算A1int与B1int之间所有的数组的相似度,一对数组的相似度采用公式(4)进行计算。
A1int与B1int之间所有的数组的相似度都计算完毕后,将相似度表示为相似度矩阵,如式(5)所示。
其它4个数据属性数据子集对的相似度矩阵构造方法与A1int与B1int的相似度矩阵构造方法相同,不再赘述。
步骤1.3、计算相似度
在步骤1.2构造的数据相似度矩阵中,每次取出最大的相似度sdij,之后删掉其所在行和列的所有元素得到新矩阵SD′,重复直到SD′为空,每次取得的相似度存入到序列d中,最终d={d1,d2,...dq},q=min(s,t)。由序列d,按照式(6)计算数据属性子集对(A1int,B1int)的相似度,其他数据子集对相似度计算与此相同,不再赘述。
经过计算得到了所有5个数据子集对的相似度,利用式(7)计算数据属性相似度。
步骤2、计算对象属性相似度
对象属性不需要按照数据类型分类。A1的对象属性表示为A1op={aop1,aop2,......)},其中,aopi为A1对应对象属性在所有实例上的取值集合,是一个数组,i=1,2…。B1op={bop1,bop2,.......}。其中bopi为B1对应对象属性在所有实例上的取值,是一个数组。
步骤2.1、构造对象属性相似度矩阵
对象属性相似度矩阵的构建方法与步骤1.2中构建数据子集对相似度矩阵的方法相同,不再赘述。得到对象属性数据相似度矩阵如式(8)所示。
步骤2.2、计算对象属性相似度
由步骤2.1中得到的相似度矩阵计算对象属性相似度。对象属性相似度计算方法与步骤1.3的数据属性子集的相似度计算方法一致,不再赘述。最后得到对象属性相似度Simobjprop(A1,B1)
步骤3、计算语义相似度
此步骤计算默认概念的名称为单个标准形式的单词,如果概念名称是以命名法命名的多个单词,则无法进行相似度计算,相似度记为0。设A1概念名称为单词name1,A2概念名称为单词name2,两个单词的相似度采用WordNet词典,采用式(9)进行计算
其中,len(c1,c2)为WordNet中词语节点c1和c2的路径距离,LCA(c1,c2)为c1和c2最小公共父节点,Depthmax代表WordNet语义树的最大深度,Depth(c)代表WordNet语义树中词语节点c距离根节点的深度,IC(c)代表词语c的信息量。IC(c)的计算公式如式(10)所示。
其中,hypo(c)代表WordNet语义树中词语节点C下位词节点的数量,Depth(w)代表词语节点c的一个下位词节点w距离根节点的深度。最终得到A1和B1的概念名称相似度记为Simname(A1,B1)。
步骤4、计算概念相似度
从步骤1、2和3分别得到两概念的数据属性相似度Simdataprop(A1,B1)、对象属性相似度Simobjprop(A1,B1)、概念名称相似度Simname(A1,B1),如果Simname(A1,B1)=0,则通过下式(11)计算概念A1和概念B1的概念相似度。
否则,则通过下式(12)计算概念相似度。
其它概念之间的相似度计算与概念A1和概念B1相似度计算的方法相同,不再赘述,到此为止,得到了两个本体之间所有概念的相似度。
步骤5、构造概念对
利用步骤4得到的所有概念之间的相似度,构造相似度矩阵如下式(13)所示。
从第一列到最后一列,每次取出第i列的最大值scji,之后删掉该列所有元素,得到新矩阵SC′,同时得到一个概念对(Aj,Bi),概念对的相似度为scji。最终得到n对概念对{(Aj1,B1),(Aj2,B2),...(Ajn,Bn)},ji∈[1,m],以及对应的n个相似度{SCj11,SCj22,...SCjnn}。
以步骤101和步骤102的具体实施过程为基础,本发明中采用属性包含度计算方法确定概念对的属性包含度的具体过程进一步细化为:
以步骤1.5得到了n对概念对中的其中一对概念对(Aj1,B1)为例,计算其属性包含度。属性包含度即为一对概念对的两个概念中,相同的属性数量占所有的属性数量的比值,属性包括数据属性和对象属性。
在步骤1.3中,在求取数据属性子集对相似度的过程中获得了序列d。由步骤1.1中的分析可知,一对概念的数据属性可以构造5个数据属性子集对,所以会产生5个序列d,将5个序列d的所有数据存入一个序列dall中,得到dall={d1,d2,...dn}。dall中所有大于0.8(序列阈值)的数据的个数即为两概念之间相同的数据属性的个数,记为numdata(第一个数)。
在步骤2.2计算对象属性相似度的过程中同样会得到从对象属性数据相似度矩阵得来的序列d,d={d1,d2,...dm}。序列d中大于0.8的数据的个数即为两概念之间相同的对象属性的个数,记为numobj(第二个数)。
概念Aj1的所有属性个数记为numA,概念B1的所有属性个数记为numB,概念对(Aj1,B1)的属性包含度公式如式(14)所示。
其他概念对包含度计算方法与概念对(Aj1,B1)的属性包含度计算方法相同,不再赘述。
进一步,在上述确定属性包含度的具体细化过程之后,本发明中依据以下规则进行关系的判断和处理:
由上述步骤101和步骤102的具体细化过程,可以得到主体和次体之间的所有概念对以及概念对的相似度。由步骤103的细化过程可以得到所有概念对的属性包含度。由相似度以及属性包含度,根据以下5条规则,判断次体概念是否应该添加到主体中,以及如果应该添加到主体中,其与概念对中的主体概念应该是什么关系。
规则1:如果相似度为1,属性包含度也为1,那么概念对中的次体概念应该作为主体概念的等价类添加到主体中。
规则2:如果相似度大于等于0.6小于等于1,且属性包含度大于等于0.6小于等于1,并且numdata+numobj=numA,那么次体概念应该作为主体概念的父类添加到主体中。
规则3:如果相似度大于等于0.6小于等于1,且属性包含度大于等于0.6小于等于1,并且numdata+numobj=numB,那么次体概念应该作为主体概念的子类添加到主体中。
规则4:如果相似度大于等于0.6小于等于1,且属性包含度大于等于0.6小于等于1,并且numdata+numobj=numB,那么次体概念应该作为主体概念的子类添加到主体中。
规则5:如果相似度大于等于0.6小于等于1,且属性包含度大于等于0.6小于等于1,并且numdata+numobj≠numA,numdata+numobj≠numB,那么次体的概念应该作为主体概念父类的子类添加到主体中。
规则6:如果以上5条规则都不满足,那么就不进行添加。
将未进行添加的次体概念存入未添加序列Cfail中,最终得到Cfail={Bn1,Bn2,...}。
如果得到的Cfail为空,说明所有次体概念都添加到了主体概念当中,则该步骤省略。否则对于Cfail中的所有元素按顺序依次查询其在次体概念中是否有父类和子类,如果都没有,则不进行拓展,并且将其从Cfail中取出。如果有父类,那么判断其父类是否已经添加到主体中,如果已经添加到主体中,那么将此次体概念作为其父类的子类添加到主体中,并将此次体概念从Cfail中取出。如果其父类没有添加到主体当中,或者其没有父类,则判断其是否含有子类。如果没有子类,则不进行拓展。如果有子类,则判断子类是否已经添加到主体概念当中,如果子类已经添加到主体概念当中,则该次体概念做为其子类的父类添加到主体概念,并将该次体概念从Cfail中取出。如果子类也没有添加到主体概念当中,则不进行拓展。当Cfail中所有概念都查询过一遍之后,判断本轮查询是否有次体概念被添加到主体概念中,如果没有则结束,否则判断此时Cfail是否为空,如果为空,则结束。否则进行下一轮查询。该过程的具体流程如图2所示。
下面提供一个具体实施案例进一步说明本发明的方案,本发明具体实施案例中以两种局部本体工业设备数据为例进行阐述,在具体应用时,本发明的方案也适用于多种工业设备数据。
在两个本体融合时,以其中一个本体作为主体,另一个本体作为次体。将次体当中所有概念按照本发明提出的方法在不改变主体原有概念之间的关系的基础上添加到主体当中,最终行成两本体的融合本体。首先按照本发明提出的相似度计算方法计算次体的所有概念与主体所有概念之间的相似度,并构造概念相似度矩阵。每一个次体的概念都存在一个与其相似度最大的主体概念,也就是相似度矩阵中每一列最大的数据对应的主体概念,将这两个概念作为一个概念对,矩阵中对应位置的数据即为两概念的相似度。其次,对于形成的概念对,需要利用本发明提出的属性包含度计算方法计算其属性包含度。根据、概念对的相似度和属性包含度,判断概念对中的次体概念是否应当添加到主体当中并且如果应该添加,其与概念对之中的主体概念应该具有什么关系。根据以上判断将次体中的概念添加到主体当中。最后,对于未被添加到主体的次体概念,利用本发明提出的基于次体结构的概念拓展方法将其添加到主体中,此方法能够最大程度保留融合本体中次体的概念。整体工作的流程图如图3所示。
此外,针对上述提供的面向MES系统的工业设备数据的本体融合方法,本发明还对应提供了如下本体融合系统:
如图4所示,本发明提供的面向MES系统的工业设备数据的本体融合系统,包括:
数据获取和划分模块1,用于获取待融合的工业设备数据本体,并将待融合的工业设备数据本体划分为主体和次体。
相似度确定模块2,用于采用相似度计算法确定主体和次体中每一数据概念的相似度。相似度包括:数据属性相似度、对象属性相似度和概念语义相似度。
概念对构造模块3,用于根据相似度构造概念对。概念对包括次体概念和主体概念。
属性包含度确定模块4,用于采用属性包含度计算方法确定概念对的属性包含度。属性包含度为概念对中相同属性与所有属性间的数量比。
判断模块5,用于根据相似度、属性包含度,判断是否将概念对中的次体概念添加到主体概念中,得到第一判断结果。
关系确定模块6,用于当第一判断结果为是时,确定概念对中的次体概念与概念对中的主体概念间的关系。
添加模块7,用于当第一判断结果为否时,将次体概念存入未添加序列中,并采用基于次体结构的概念拓展方法将次体概念添加到主体概念中。
作为本发明的一优选实施方式,上述相似度确定模块2具体包括:
其中,d1为主体数据概念中属性的数据、d2为次体数据概念中属性的数据,match(d1,d2)为主体属性中数据和次体属性中数据间相同数据元素的个数,num(d1)为主体数据概念中属性的数据的总个数,num(d2)为次体数据概念中属性的数据的总个数,Simdata(d1,d2)为相似度。
作为本发明的另一优选实施方式,上述属性包含度确定模块4具体包括:
总序列生成单元,用于按照数据类型将主体和次体分为五种数据序列,并将五种数据序列放入同一序列,以形成总序列。
序列阈值获取单元,用于获取序列阈值。
第一个数确定单元,用于确定总序列中大于序列阈值的数据元素的个数,记为第一个数。第一个数即为主体和次体中相同数据属性的数量。
第二个数确定单元,用于确定数据序列中大于序列阈值的数据元素的个数,记为第二个数。第二个数即为主体和次体中相同对象属性的数量。
其中,Inc(Aj1,B1)为属性包含度,numA为主体的总数量、numB为次体的总数量,numdata为第一个数,numobj为第二个数。
作为本发明的又一优选实施方式,上述关系确定模块6具体包括:
第一关系确定单元,用于当相似度为1,属性包含度为1时,将概念对中的次体概念作为主体概念的等价类添加到主体概念中。
第二关系确定单元,用于当相似度大于等于0.6且小于等于1,属性包含度大于等于0.6且小于等于1,并且第一个数和第二个数的和等于主体属性的总数量时,将次体概念作为主体概念的父类添加到主体概念中。
第三关系确定单元,用于当相似度大于等于0.6且小于等于1,属性包含度大于等于0.6且小于等于1,并且,第一个数和第二个数的和等于次体属性的总数量时,将次体概念作为主体概念的子类添加到主体概念中。
第四关系确定单元,用于当相似度大于等于0.6且小于等于1,属性包含度大于等于0.6且小于等于1,并且第一个数和第二个数的和等于次体属性的总数量时,将次体概念作为主体概念的子类添加到主体概念中。
第五关系确定单元,用于当相似度大于等于0.6且小于等于1,属性包含度大于等于0.6且小于等于1,并且第一个数和第二个数的和既不等于主体属性的总数量也不等于次体属性的总数量时,将次体概念作为主体概念的父类的子类添加到主体概念中。
作为本发明的再一优选实施方式,上述添加模块7具体包括:
判断单元,用于判断次体概念是否具有父类或子类,得到第二判断结果。
第一执行单元,用于当第二判断结果为既不具有父类也不具有子类时,不对次体概念进行拓展,并将次体概念从未添加序列中删除。
第二执行单元,用于当第二判断结果为具有父类或具有子类时,判断次体概念的父类或子类是否被添加到主体概念中,若父类或子类被添加到了主体概念中,则将次体概念添加到添加有其父类或子类的主体概念中,并与其父类或子类的关系保持不变,并将次体概念从未添加序列中删除。若父类或子类未被添加到主体概念中,则不进行扩展。
循环执行单元,用于返回执行“判断次体概念是否具有父类或子类,得到第二判断结果”的步骤,直至未添加序列为空。
综上,本发明提供的技术方案相对于现有技术具有以下优点:
1、相对于现有的本体融合方法,在对概念和属性进行匹配时,本发明匹配的正确率高。目前的概念和属性匹配的计算方法主要分为两种,其中一种主要依赖于名称的语义,其不能对语义相似度较高的属性进行区分,并且属性名称会存在多种形式的异构,经常导致相似度计算结果不准确,另一种方法主要依赖于数据,其完全不考虑概念名称的语义,导致很多应该匹配的概念没有得到匹配。本发明的优点主要来源于,属性相似度和属性包含度的计算,都主要依赖于属性的数据,而计算概念名称相似度时,依赖于语义。相比于传统的只采用语义相似度或只采用数据进行计算的方法,本发明对语义相似度较高的属性的区分能力较强,相似度计算结果更准确,匹配能力更强。
2、在融合时,本发明对局部本体在融合本体中的保留度高。该优点主要来源于基于次体结构的概念扩展方法。在进行概念相似度计算时,并不能保证计算结果一定能反映实际情况,既有可能两个概念之间非常相似,但是计算得来的相似度数值很低。所以仅仅依靠计算结果对本体进行融合会导致许多次体概念不能够添加到本体当中。本发明提供的基于次体结构的概念扩展方法,通过查询因计算结果而未被添加到主体当中的次概念在次体中是否具有已经被添加到主体当中的父类或子类,进而判断该概念是否应该被添加到主体当中,最大程度地保留了融合本体当中的次体概念。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种面向MES系统的工业设备数据的本体融合方法,其特征在于,包括:
获取待融合的工业设备数据本体,并将所述待融合的工业设备数据本体划分为主体和次体;
采用相似度计算法确定所述主体和所述次体中每一数据概念的相似度;所述相似度包括:数据属性相似度、对象属性相似度和概念语义相似度;
根据所述相似度构造概念对;所述概念对包括次体概念和主体概念;
采用属性包含度计算方法确定所述概念对的属性包含度;所述属性包含度为所述概念对中相同属性与不同属性间的数量比;
根据所述相似度、所述属性包含度,判断是否将所述概念对中的所述次体概念添加到所述主体概念中,得到第一判断结果;
若所述第一判断结果为是,则确定所述概念对中的所述次体概念与所述概念对中的主体概念间的关系;
若所述第一判断结果为否,则将所述次体概念存入未添加序列中,并采用基于次体结构的概念拓展方法将所述次体概念添加到所述主体概念中。
3.根据权利要求2所述的面向MES系统的工业设备数据的本体融合方法,其特征在于,所述采用属性包含度计算方法确定所述概念对的属性包含度,具体包括:
按照数据类型将所述主体和所述次体分为五种数据序列,并将五种所述数据序列放入同一序列,以形成总序列;
获取序列阈值;
确定所述总序列中大于所述序列阈值的数据元素的个数,记为第一个数;所述第一个数即为所述主体和所述次体中相同数据属性的数量;
确定所述数据序列中大于所述序列阈值的数据元素的个数,记为第二个数;所述第二个数即为所述主体和所述次体中相同对象属性的的数量;
其中,Inc(Aj1,B1)为属性包含度,numA为主体的总数量、numB为次体的总数量,numdata为第一个数,numobj为第二个数。
4.根据权利要求3所述的面向MES系统的工业设备数据的本体融合方法,其特征在于,所述若所述第一判断结果为是,则确定所述次体概念与所述主体概念间的关系,具体包括:
若所述相似度为1,所述属性包含度为1,则所述概念对中的次体概念作为所述主体概念的等价类添加到所述主体概念中;
若所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和等于所述主体属性的总数量,则所述次体概念作为主体概念的父类添加到主体概念中;
若所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且,所述第一个数和所述第二个数的和等于所述次体属性的总数量,则所述次体概念概念作为所述主体概念的子类添加到主体概念中;
若相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和等于所述次体属性的总数量,则所述次体概念作为所述主体概念的子类添加到主体概念中;
若所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和既不等于所述主体属性的总数量也不等于所述次体属性的总数量,则所述次体概念作为所述主体概念的父类的子类添加到主体概念中。
5.根据权利要求4所述的面向MES系统的工业设备数据的本体融合方法,其特征在于,所述若所述第一判断结果为否,则将所述次体概念存入未添加序列中,并采用基于次体结构的概念拓展方法将所述次体概念添加到所述主体概念中,具体包括:
判断所述次体概念是否具有父类或子类,得到第二判断结果;
若所述第二判断结果为既不具有父类也不具有子类,则不对所述次体概念进行拓展,并将所述次体概念从所述未添加序列中删除;
若所述第二判断结果为具有父类或具有子类,则判断所述次体概念的父类或子类是否被添加到所述主体概念中,若所述父类或所述子类被添加到了所述主体概念中,则将所述次体概念添加到添加有其父类或子类的主体概念中,并与其父类或子类的关系保持不变,并将所述次体概念从所述未添加序列中删除;若所述父类或所述子类未被添加到所述主体概念中,则不进行扩展;
返回“判断所述次体概念是否具有父类或子类,得到第二判断结果”的步骤,直至所述未添加序列为空。
6.一种面向MES系统的工业设备数据的本体融合系统,其特征在于,包括:
数据获取和划分模块,用于获取待融合的工业设备数据本体,并将所述待融合的工业设备数据本体划分为主体和次体;
相似度确定模块,用于采用相似度计算法确定所述主体和所述次体中每一数据概念的相似度;所述相似度包括:数据属性相似度、对象属性相似度和概念语义相似度;
概念对构造模块,用于根据所述相似度构造概念对;所述概念对包括次体概念和主体概念;
属性包含度确定模块,用于采用属性包含度计算方法确定所述概念对的属性包含度;所述属性包含度为所述概念对中相同属性与所有属性间的数量比;
判断模块,用于根据所述相似度、所述属性包含度,判断是否将所述概念对中的所述次体概念添加到所述主体概念中,得到第一判断结果;
关系确定模块,用于当所述第一判断结果为是时,确定所述概念对中的所述次体概念与所述概念对中的主体概念间的关系;
添加模块,用于当所述第一判断结果为否时,将所述次体概念存入未添加序列中,并采用基于次体结构的概念拓展方法将所述次体概念添加到所述主体概念中。
8.根据权利要求7所述的面向MES系统的工业设备数据的本体融合系统,其特征在于,所述属性包含度确定模块,具体包括:
总序列生成单元,用于按照数据类型将所述主体和所述次体分为五种数据序列,并将五种所述数据序列放入同一序列,以形成总序列;
序列阈值获取单元,用于获取序列阈值;
第一个数确定单元,用于确定所述总序列中大于所述序列阈值的数据元素的个数,记为第一个数;所述第一个数即为所述主体和所述次体中相同数据属性的数量;
第二个数确定单元,用于确定所述数据序列中大于所述序列阈值的数据元素的个数,记为第二个数;所述第二个数即为所述主体和所述次体中相同对象属性的数量;
其中,Inc(Aj1,B1)为属性包含度,numA为主体的总数量、numB为次体的总数量,numdata为第一个数,numobj为第二个数。
9.根据权利要求8所述的面向MES系统的工业设备数据的本体融合系统,其特征在于,所述关系确定模块,具体包括:
第一关系确定单元,用于当所述相似度为1,所述属性包含度为1时,将所述概念对中的次体概念作为所述主体概念的等价类添加到所述主体概念中;
第二关系确定单元,用于当所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和等于所述主体属性的总数量时,将所述次体概念作为主体概念的父类添加到主体概念中;
第三关系确定单元,用于当所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且,所述第一个数和所述第二个数的和等于所述次体属性的总数量时,将所述次体概念作为所述主体概念的子类添加到主体概念中;
第四关系确定单元,用于当相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和等于所述次体属性的总数量时,将所述次体概念作为所述主体概念的子类添加到主体概念中;
第五关系确定单元,用于当所述相似度大于等于0.6且小于等于1,所述属性包含度大于等于0.6且小于等于1,并且所述第一个数和所述第二个数的和既不等于所述主体属性的总数量也不等于所述次体属性的总数量时,将所述次体概念作为所述主体概念的父类的子类添加到主体概念中。
10.根据权利要求9所述的面向MES系统的工业设备数据的本体融合系统,其特征在于,所述添加模块,具体包括:
判断单元,用于判断所述次体概念是否具有父类或子类,得到第二判断结果;
第一执行单元,用于当所述第二判断结果为既不具有父类也不具有子类时,不对所述次体概念进行拓展,并将所述次体概念从所述未添加序列中删除;
第二执行单元,用于当所述第二判断结果为具有父类或具有子类时,判断所述次体概念的父类或子类是否被添加到所述主体概念中,若所述父类或所述子类被添加到了所述主体概念中,则将所述次体概念添加到添加有其父类或子类的主体概念中,并与其父类或子类的关系保持不变,并将所述次体概念从所述未添加序列中删除;若所述父类或所述子类未被添加到所述主体概念中,则不进行扩展;
循环执行单元,用于返回执行“判断所述次体概念是否具有父类或子类,得到第二判断结果”的步骤,直至所述未添加序列为空。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011176479.6A CN112163430B (zh) | 2020-10-29 | 2020-10-29 | 面向mes系统的工业设备数据的本体融合方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011176479.6A CN112163430B (zh) | 2020-10-29 | 2020-10-29 | 面向mes系统的工业设备数据的本体融合方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112163430A true CN112163430A (zh) | 2021-01-01 |
CN112163430B CN112163430B (zh) | 2022-10-18 |
Family
ID=73865025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011176479.6A Active CN112163430B (zh) | 2020-10-29 | 2020-10-29 | 面向mes系统的工业设备数据的本体融合方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112163430B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2902913A1 (fr) * | 2006-06-21 | 2007-12-28 | France Telecom | Procede et dispositif de codage d'une note de similarite semantique et spatiale entre concepts d'une ontologie memorisee sous forme de treillis numerote hierarchiquement |
CN101930462A (zh) * | 2010-08-20 | 2010-12-29 | 华中科技大学 | 一种综合的本体相似度检测方法 |
EP2469421A1 (en) * | 2010-12-23 | 2012-06-27 | British Telecommunications Public Limited Company | Method and apparatus for processing electronic data |
CN109558495A (zh) * | 2018-11-16 | 2019-04-02 | 重庆邮电大学 | 一种高效的领域本体语义相似度计算算法 |
CN109635119A (zh) * | 2018-10-25 | 2019-04-16 | 同济大学 | 一种基于本体融合的工业大数据集成系统 |
-
2020
- 2020-10-29 CN CN202011176479.6A patent/CN112163430B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2902913A1 (fr) * | 2006-06-21 | 2007-12-28 | France Telecom | Procede et dispositif de codage d'une note de similarite semantique et spatiale entre concepts d'une ontologie memorisee sous forme de treillis numerote hierarchiquement |
CN101930462A (zh) * | 2010-08-20 | 2010-12-29 | 华中科技大学 | 一种综合的本体相似度检测方法 |
EP2469421A1 (en) * | 2010-12-23 | 2012-06-27 | British Telecommunications Public Limited Company | Method and apparatus for processing electronic data |
CN109635119A (zh) * | 2018-10-25 | 2019-04-16 | 同济大学 | 一种基于本体融合的工业大数据集成系统 |
CN109558495A (zh) * | 2018-11-16 | 2019-04-02 | 重庆邮电大学 | 一种高效的领域本体语义相似度计算算法 |
Non-Patent Citations (10)
Title |
---|
XIAOBIN ZHANG; QIANQIAN SHEN: "A ontology semantic similarity algorithm between user"s context ontology", 《IEEE》 * |
XIAOBIN ZHANG; QIANQIAN SHEN: "A ontology semantic similarity algorithm between user"s context ontology", 《IEEE》, 15 June 2014 (2014-06-15) * |
XIN-FU LI; PENG YIN; MEI ZHENG: "An Improved Research Method about the Similarity Calculation of Ontology", 《IEEE》 * |
XIN-FU LI; PENG YIN; MEI ZHENG: "An Improved Research Method about the Similarity Calculation of Ontology", 《IEEE》, 19 December 2009 (2009-12-19) * |
刘惠临,周华平: "本体概念相似度加权综合计算模型", 《齐齐哈尔大学学报(自然科学版)》 * |
刘惠临,周华平: "本体概念相似度加权综合计算模型", 《齐齐哈尔大学学报(自然科学版)》, vol. 29, no. 04, 15 July 2013 (2013-07-15), pages 18 - 22 * |
楼雯,王慧,鞠源: "基于二值相似度计算的异构本体融合方法", 《情报学报》 * |
楼雯,王慧,鞠源: "基于二值相似度计算的异构本体融合方法", 《情报学报》, vol. 38, no. 6, 24 June 2016 (2016-06-24), pages 622 - 631 * |
顾逸之: "基于异构数据融合的实例本体生成及演化框架", 《CNKI优秀硕士学位论文全文库》 * |
顾逸之: "基于异构数据融合的实例本体生成及演化框架", 《CNKI优秀硕士学位论文全文库》, 16 February 2020 (2020-02-16) * |
Also Published As
Publication number | Publication date |
---|---|
CN112163430B (zh) | 2022-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10719662B2 (en) | Knowledge map-based question-answer method, device, and storage medium | |
US11227118B2 (en) | Methods, devices, and systems for constructing intelligent knowledge base | |
CN108292310B (zh) | 用于数字实体相关的技术 | |
Kim et al. | Similarity matching for integrating spatial information extracted from place descriptions | |
US11106736B1 (en) | Fuzzy search of graph database | |
US10289717B2 (en) | Semantic search apparatus and method using mobile terminal | |
US7827125B1 (en) | Learning based on feedback for contextual personalized information retrieval | |
US8090729B2 (en) | Large graph measurement | |
US8676807B2 (en) | Identifying location names within document text | |
US20190303141A1 (en) | Syntax Based Source Code Search | |
WO2017076263A1 (zh) | 融合知识库处理方法和装置及知识库管理系统、存储介质 | |
CN108681557B (zh) | 基于自扩充表示和相似双向约束的短文本主题发现方法及系统 | |
CN111563192B (zh) | 实体对齐方法、装置、电子设备及存储介质 | |
CN112115227A (zh) | 数据的查询方法、装置、电子设备及存储介质 | |
KR102292040B1 (ko) | 기계 독해 기반 지식 추출을 위한 시스템 및 방법 | |
Zhang et al. | Construction of ontology-based user model for web personalization | |
Xu et al. | Thread-based probabilistic models for expert finding in enterprise Microblogs | |
CN112163430B (zh) | 面向mes系统的工业设备数据的本体融合方法和系统 | |
CN111125332A (zh) | 计算词的tf-idf值的方法、装置、设备及存储介质 | |
CN114385827A (zh) | 面向会议知识图谱的检索方法 | |
Kang et al. | Ensemble mapper | |
Wang et al. | A graph-based approach for semantic similar word retrieval | |
CN114153352B (zh) | 一种移动应用图形用户界面变更的识别方法、系统及装置 | |
Bakillah et al. | SIM‐NET: A View‐Based Semantic Similarity Model for Ad Hoc Networks of Geospatial Databases | |
CN111767706B (zh) | 文本相似度的计算方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |