CN104239660B - 云制造模式下基于动态本体的知识融合方法 - Google Patents

云制造模式下基于动态本体的知识融合方法 Download PDF

Info

Publication number
CN104239660B
CN104239660B CN201310228160.7A CN201310228160A CN104239660B CN 104239660 B CN104239660 B CN 104239660B CN 201310228160 A CN201310228160 A CN 201310228160A CN 104239660 B CN104239660 B CN 104239660B
Authority
CN
China
Prior art keywords
knowledge
fragment
resource
ontology
dynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310228160.7A
Other languages
English (en)
Other versions
CN104239660A (zh
Inventor
刘继红
许文婷
占红飞
王宽
李波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201310228160.7A priority Critical patent/CN104239660B/zh
Publication of CN104239660A publication Critical patent/CN104239660A/zh
Application granted granted Critical
Publication of CN104239660B publication Critical patent/CN104239660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

一种针对云制造模式下基于动态本体的知识融合方法,属于先进制造技术领域现代制造技术的研究内容。本方法为云制造模式下分布异构资源的整合应用提供解决办法。该方法基于多领域本体构建的动态本体形成融合知识资源。首先对知识需求进行语义分析分析,获取领域术语关键词;然后根据关键词从多领域本体中发现相关的本体片段,并采对这些本体片段重组形成动态本体;在此基础上,利用动态本体术语对隐含在文档中的知识资源进行分析,获取以段落为代表的知识片段,计算其知识片段主题,并与动态本体进行关联,形成融合知识资源。本发明在一定程度上实现了分布在集团企业的多源异构知识资源进行统一接入与管理,并实现知识资源的动态融合,有效适应企业知识资源和知识需求的不断更新与变化。

Description

云制造模式下基于动态本体的知识融合方法
技术领域
本发明涉及一种云制造模式下基于动态本体的知识融合方法,属于计算机应用技术领域知识资源管理与应用方法的研究内容。
背景技术
云制造就是借鉴云计算的思想和“制造即服务”的理念,将“制造资源”代以“计算资源”,使各类制造资源虚拟化和制造能力服务化,提供面向制造企业的主动(active)、敏捷(agile)、聚合(aggregative)、全方位(all-aspects)的制造资源和制造能力服务,实现制造资源广域互联和按需共享。云制造采取包括云计算在内的当代信息技术前沿理念,支持制造业在广泛的网络资源环境下,为产品提供高附加值、低成本和全球化制造的服务,成为制造业的发展趋势。云制造中的制造资源不仅包括制造全生命周期活动中的各类制造设备(如机床、加工中心、计算设备等),也包括制造过程中的模型、数据、软件等各类知识资源。知识是作为集团企业云制造的核心支持,在制造资源接入、管理和全生命周期应用中,能够提供智能支持。在集团内部,为企业的设计仿真、加工制造、试样测试等业务问题提供知识服务。
但是,知识资源的分布异构特征突出:一方面,知识资源分布散落在不同的企业与部门,隐含在以往产品的模型、文档、规范标准以及相关领域专家的头脑和经验之中;另一方面,传统的知识库通过固化知识资源,再根据需求寻找匹配的知识,其相对固定的表达存储方式,虽能一定程度上完成满足知识需求,但众多知识库是针对具体应用独立设计,其扩展性和针对性和整合受到限制。因此,必须在先进的云制造模式基础上,对这些分布异构知识资源进行动态的组织管理,实现知识资源的融合应用。
发明内容
本专利针对分布异构知识资源,利用动态本体对散布的知识进行获取与组织,实现知识融合。本方法对不同的知识资源,如文本资源和KBE工具资源,利用本体进行语义描述,实现异构资源的封装,形成知识单元,作为融合知识的基础资源。
基于多领域本体对知识资源的组织,通过对具体的知识需求进行分析,利用Jena从多领域本体中发现与需求相关的本体片段,并进行片段重组,按需形成动态本体。利用针对具体知识需求形成的动态本体,作为知识融合的基础框架。利用Solr实现分布式知识资源的索引,基于动态本体术语概念对这些分布资源中的知识单元,特别是隐含在文本中的知识片段进行分析与获取,并利用动态本体的概念框架结构对知识单元进行整合,形成融合知识资源。
本方法针对具体知识需求从分布异构知识资源中发现并形成融合的知识资源,能够提升知识需求和知识服务之间的匹配程度。融合知识生成流程如图1所示。
附图说明
图1融合知识生成流程
图2动态本体构建流程
图3知识需求分词算法
图4本体片段发现流程
图5本体片段重组流程
图6知识单元获取与融合
具体实施方式
一、动态本体构建
多领域本体虽构建了广泛的知识网络,但知识需求往往集中在多本体中特定的知识网络节点或片段。动态本体是针对知识需求,从多领域本体中发现与需求相关的本体片段并重组这些片段形成的本体。
其具体实施步骤如图2所示,具体描述如下:
步骤1:知识需求分析
利用本体生成的术语词典,提取知识需求中的领域术语;其次利用常用语词典提取设计问题中的一般词,然后消除重复词元和被包含的词元,得到较符合设计人员需求意图的关键词元。由于领域本体中的术语都是领域常用概念,因此领域术语关键词通常是知识需求的核心词和主题词,通过识别领域术语关键词可以实现对知识需求的捕捉。
通过构建领域术语词典和通用词典实现基于词典的中文分词。领域术语词典就是领域本体库中的概念库,即领域术语词典中的术语就是领域本体模型中已规范好的术语;将自然语言中常用的词语构建成常用语词典;同时为了屏蔽明显无意义的词元(如“的”和“了”等)构建了屏蔽词典。基于这些词典,优先匹配最长词元构成双向匹配最大词长切分法。先利用领域术语词典从知识需求中提出领域术语,再对剩下的检索语句根据常用语词典提取一般词。如图3所示,首先,检索式分别经过正向匹配和逆向匹配两种分词方法;其次,对得到两种分词结果中的重复词元进行消重,得到一组没有重复词元的分词结果;第三,由于分词结果中可能出现一个词元是另一个词元的子字段,则消除该子字段,保留具有最大词长的词元。
通过分析,获得以关键词表达的知识需求。
步骤2:本体片段发现
在本体片段发现方面,包含多领域本体中顶层本体和各分领域本体的扩展,流程图4所示。
(1).顶层本体扩展。利用术语在顶层本体进行查询,获取概念所属专业领域和与其相映射的概念及对应的领域(如果存在映射概念)。首先利用Jena的OntModel获得顶层本体模型,然后到模型层获取词集概念。如果存在映射,利用OntModel.getClass获得概念所属领域(总体、气动、控制等)。查询概念的映射概念,通过三元组(S,P,O),构造双向的关联查询。如查询xxxx有关的映射概念,要构造(xxxx,null,null)和(null,null,xxxx)两个三元组(其中null代表不确定关系和概念)。利用OntModel.listStatement查询三元组,获取对应的关系及概念,以及概念所属的领域。
(2).领域本体扩展。在顶层本体扩展获取领域的基础上,分别到各个概念所属领域,获取:①本体层次(Hierarchy),也就是OWL描述中概念所属的Class,包括概念本身、具有Is_Sibling和Is_Synonym语义关联概念、映射概念三类概念所属的Class;②概念及关系,包含与输入概念具有直接关联关系(扩展一层)和映射概念具有直接关联的概念。
这样,获得以各自概念为中心的本体片段。
步骤3:本体片段重组
如图5所示,为本体片段重组流程。
(1).对各个本体片段的层次(Class)进行遍历,消去重复的Class,利用OntModel.createClass在本体中创建Class,并利用OntModel.addSubClass建立Class之间的层次关系。其中,动态本体的层次关系,以分词术语为顶层Class,扩展形成的Class均为子类SubClass。
(2).对各本体片段的概念进行遍历,消去重复的概念,并利用Individual.setOntClass将概念归属到相应的层次Class下。
(3).最后对片段内概念间的关系进行遍历,利用OntoModel.createStatement建立概念与概念之间的语义关系。
形成的动态本体具有本体的概念结构与概念,及其相互之间的语义关系。
二、基于动态本体的知识单元获取与融合
动态本体对知识需求进行了扩展,形成了融合知识的整体框架和相关概念术语及关系。针对分布式文档和KBE两类知识资源,利用动态本体和Solr实现知识融合。如图6所示,为知识融合及服务总体流程,利用动态本体获取知识单元,进行知识融合;利用Solr接入分布式知识资源,并提供知识检索和面向业务的知识主动推送服务。
步骤1:知识资源接入
知识资源分布在各公司与部门众多的业务系统中,需要对这些资源进行统一的接入,并实现相关的应用服务。一方面,利用Solr对分布式文件、数据库进行索引,包括分布式文档和KBE知识资源(描述),为知识融合构造有效的知识资源。另一方面,基于Solr的索引实现全企业知识检索和面向业务的知识主动推送服务,获取有效的融合知识资源。
步骤2:知识片段获取
在研发设计制造过程中产生的文档,都是按照一定的规范写作,如预研报告、设计方案等。而相关的知识资源就散落这些文档的局部,如某一章节、段落(一个句子的语义含义较少)中。本方法将具有一定主题语义内涵的段落,作为知识融合的知识片段。
利用向量空间模型(Vector Space Model,VSM)对知识片段进行数学量化描述。向量空间模型的基本思想是把文本表示成向量空间中的向量,利用向量之间的夹角余弦作为文本间相似性的度量。
表示文本片段,其中wk(1≤k≤n,[0≤wk≤1])表示某个术语在知识片段中的权重(wk=0表示无此术语)。则:
w=(w1,w2,…,wn) (1)
为知识片段的特征向量表示。
词频权值是根据特征词(动态本体术语)在知识片段中出现的频率来确定其重要程度的分类方法。设fk为第k个术语在知识片段中的频次。则:
计算所有段落的特征向量,形成所有片段的特征向量。
步骤3:知识片段分类
在知识片段主题的分析中,综合考虑知识片段内概念术语的词频和动态本体内概念术语的语义距离。综合计算某个概念术语在知识片段内的综合权重qk,并取max(q1,q2,…,qm)对应的概念作为知识片段的主题,并将该知识片段划分到对应的动态本体层次结构下,计算某个知识片段的主题,并将该知识片段划分到动态本体内对应的框架下,完成知识单元类别的划分。
其中:
qk=ak+wk (3)
ak是知识片段内该概念术语与其他所有概念术语最短距离(在动态本体内)归一化的结果。
dk是知识片段内,分解得到的概念术语与片段内其他术语的最短语义距离(在动态本体内)求和的值。
dki是概念到另一个概念的最短路径,m为知识片段分词得到的动态本体概念的总数。按照语义关系权重定义概念间的语义距离。如果概念间没有直接距离,利用概念间的关系权重累积得到语义距离。
获取到知识片段的主题,该片段就与对应的动态本体框架相关联,以动态本体形成融合的知识资源。

Claims (2)

1.一种云制造模式下基于动态本体的知识融合方法,所述方法包括融合知识形成流程、动态本体构建、知识需求分析、本体片段发现和重组、知识单元获取与融合,所述方法包括:
利用知识单元对异构的知识资源进行封装,形成具有一定语义的知识,包括以文本表达和以KBE工具为代表的知识资源,
通过对知识需求进行语义分析,以领域内相关术语作为分词的基础,获取领域内相关联的所述知识资源,其中,所述对知识需求进行语义分析包括:通过领域术语词典对知识需求进行语义分析,获取术语关键词;
动态构建本体,以能够针对具体知识需求重组所述知识资源并形成融合知识,建立知识需求和企业知识资源间较为全面的匹配,进而按需提供更具针对性的知识服务,
其中,
所述本体片段发现包括:通过获取的知识需求,在多领域本体中发现相关的本体片段;
所述本体片段重组包括:针对动态发现的所述本体片段,重组形成动态本体。
2.如权利要求1所述的方法,其中,
所述知识融合方法还包括:知识资源接入,对分布式的文件等各类资源进行索引;
所述知识融合方法还包括:知识片段获取,分析文档的特征向量,判断获取知识片段;
所述知识融合方法还包括:知识片段分类,通过分析知识片段的主题,建立知识片段与动态本体的关联,形成融合知识。
CN201310228160.7A 2013-06-08 2013-06-08 云制造模式下基于动态本体的知识融合方法 Active CN104239660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310228160.7A CN104239660B (zh) 2013-06-08 2013-06-08 云制造模式下基于动态本体的知识融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310228160.7A CN104239660B (zh) 2013-06-08 2013-06-08 云制造模式下基于动态本体的知识融合方法

Publications (2)

Publication Number Publication Date
CN104239660A CN104239660A (zh) 2014-12-24
CN104239660B true CN104239660B (zh) 2017-09-19

Family

ID=52227714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310228160.7A Active CN104239660B (zh) 2013-06-08 2013-06-08 云制造模式下基于动态本体的知识融合方法

Country Status (1)

Country Link
CN (1) CN104239660B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10146873B2 (en) * 2015-06-29 2018-12-04 Microsoft Technology Licensing, Llc Cloud-native documents integrated with legacy tools
CN105550302B (zh) * 2015-12-14 2018-07-24 广西师范大学 基于领域本体的分布式学习内容互操作系统
CN105912656B (zh) * 2016-04-07 2020-03-17 桂林电子科技大学 一种商品知识图谱的构建方法
CN107341142B (zh) * 2017-05-18 2020-08-21 辛柯俊 一种基于关键词提取分析的企业关系计算方法及系统
CN108549667B (zh) * 2018-03-23 2022-04-08 绍兴诺雷智信息科技有限公司 一种结构化工程设计知识的语义检索方法
CN109635119B (zh) * 2018-10-25 2023-08-04 同济大学 一种基于本体融合的工业大数据集成系统
CN109614467B (zh) * 2018-11-23 2023-05-23 北京仿真中心 一种基于片段相似度的知识关联与动态组织方法和系统
CN109800249B (zh) * 2018-12-24 2023-08-04 北京航天智造科技发展有限公司 基于工业服务云平台用户行为感知的知识服务方法和系统
CN110232088B (zh) * 2019-06-13 2021-03-26 华中师范大学 分类合并的方法及装置、存储介质
WO2022061518A1 (zh) * 2020-09-22 2022-03-31 西门子股份公司 用于生成和利用制造仿真模型的知识图谱的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777071A (zh) * 2010-01-08 2010-07-14 华中师范大学 用于构建教育技术领域本体库的术语标注系统
CN103118128A (zh) * 2013-02-22 2013-05-22 浪潮电子信息产业股份有限公司 一种基于本体的语义传感网系统

Also Published As

Publication number Publication date
CN104239660A (zh) 2014-12-24

Similar Documents

Publication Publication Date Title
CN104239660B (zh) 云制造模式下基于动态本体的知识融合方法
CN106919689B (zh) 基于术语释义知识单元的专业领域知识图谱动态构建方法
Do et al. Developing a BERT based triple classification model using knowledge graph embedding for question answering system
CN110334212A (zh) 一种基于机器学习的领域性审计知识图谱构建方法
CN110287494A (zh) 一种基于深度学习bert算法的短文本相似匹配的方法
CN101079024B (zh) 一种专业词表动态生成系统和方法
CN107341215A (zh) 一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法
CN106997341B (zh) 一种创新方案匹配方法、装置、服务器及系统
CN110781670B (zh) 基于百科知识库和词向量的中文地名语义消歧方法
CN105138864B (zh) 基于生物医学文献的蛋白质交互关系数据库构建方法
CN117290489B (zh) 一种行业问答知识库快速构建方法与系统
CN103049569A (zh) 基于向量空间模型的文本相似性匹配方法
CN102123172B (zh) 一种基于神经网络聚类优化的Web服务发现的实现方法
CN103440314A (zh) 一种基于Ontology的语义检索方法
CN102298642A (zh) 文本信息抽取方法和系统
CN110659357B (zh) 一种基于本体语义相似度的地理知识问答系统
Nikhil et al. A survey on text mining and sentiment analysis for unstructured web data
CN107038163A (zh) 一种面向海量互联网信息的文本语义建模方法
Dhar et al. Understanding the evolution of an emerging technological paradigm and its impact: The case of Digital Twin
CN109635272A (zh) 一种空中交通管理领域的本体交互模型构建方法
Jyothi et al. A study on big data modelling techniques
KR20230163983A (ko) 신경망 모델을 활용한 유사 특허 문헌 추출 방법 및 이를 제공하는 장치
KR20220074576A (ko) 마케팅 지식 그래프 구축을 위한 딥러닝 기반 신조어 추출 방법 및 그 장치
Khekare et al. Design of Automatic Key Finder for Search Engine Optimization in Internet of Everything
Qiu et al. NeuroSPE: A neuro‐net spatial relation extractor for natural language text fusing gazetteers and pretrained models

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant