CN102426578B - 一种智能语义网中本体概念模糊相似度度量方法 - Google Patents
一种智能语义网中本体概念模糊相似度度量方法 Download PDFInfo
- Publication number
- CN102426578B CN102426578B CN201110245928.2A CN201110245928A CN102426578B CN 102426578 B CN102426578 B CN 102426578B CN 201110245928 A CN201110245928 A CN 201110245928A CN 102426578 B CN102426578 B CN 102426578B
- Authority
- CN
- China
- Prior art keywords
- visa
- similarity
- concept
- subset
- subordinate function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004364 calculation method Methods 0.000 claims abstract description 4
- 239000012141 concentrate Substances 0.000 claims description 6
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 64
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于智能语义网中本体概念相似度度量领域,具体涉及一种智能语义网中本体概念模糊相似度度量方法。其包括以下步骤:A.将本体概念扩展成为解释集,所述解释集包括isA子集、relatedTo子集和nearTo子集;B.将本体概念的解释集扩展成模糊解释集;C.根据所述模糊解释集计算本体概念的相似度。本发明能够同时满足概念间相似度的三个特性,并支持复杂本体中子概念出现多父概念时相似度计算。
Description
技术领域
本发明属于智能语义网中本体概念相似度度量领域,具体涉及一种智能语义网中本体概念模糊相似度度量方法。
背景技术
自蒂姆·伯纳斯一李(Tim Berners-Lee)于2000年提出了“语义网(Semantic Web)”的概念后,有关语义网方面的研究与尝试便越来越多。语义网的目标,就是让“机器能够读懂万维网上的内容”。我们之所以能够读懂网页的内容,是因为我们首先共享了对各种词汇约定的意思,然后通过综合推理,得出句子、段落的意义。因此,机器要够理解人的意思,首先必须拥有一份与人类共享的、对词汇的理解的知识。目前人们使用的这份共享的知识,就是本体(ontology)。本体大致可以看成是一系列特定的词汇以及相关的假设或公式,这些假设或公式则是对词汇的解释。简单来讲,计算机科学中的本体,可以看成是概念(词汇)以及概念与概念之间的关系。
呈现于本体库中的概念,是人们用于提高搜索能力的重要工具,例如利用本体描述语言描述服务,提高服务的匹配效果;通过概念在本体库中的相互关系,提高论文检索的查全率和查准率;利用本体概念的综合推理,提高搜索能力。这些都涉及到概念的匹配问题。现有技术中有利用本体概念中的上下位关系(直接父子、直接子父、间接父子关系)把匹配分为Exact, Plug-in, subsume和fail四个等级,这种方法简单,实验结果也证明其较高的查准率,但是当同一等级内的概念较多的时候,无法进行更细致的区别。基于相似度的概念匹配算法通过计算两个本体概念间的相似度(一个介于0到1之间的数值)来获得更精确的匹配结果,相当于将匹配等级扩充到无限等级,从而可以迅速地判断最优匹配概念,很好地解决了区分度的问题。
概念之间的相似度度量通常必须满足以下的一些特性:一、概念的深度:两个概念的共同祖先的深度越深,说明他们共享的特征属性越多,他们的相似度越高;二、同一层概念的边的密度:密度越大,说明这一层分得越细,他们共享的特征也越多,相似度越高;三、相似度是不对称的:当两个概念之间存在父子关系时,考虑到当我们提到父概念时指的是子概念的概率往往大于当我们提到子概念时指的是父概念时的概率,因此,父概念对子概念的相似度要高于子概念对父概念的相似度。
目前基于本体概念相似度的计算主要有两种模型,一种是网络节点距离模型,主要的思想是把本体中的概念看成有向图的结点,概念之间的关系是则是有向图的边,直觉上结点之间的距离越小,他们的相似度就越高。为实现上面提到的三种特性,人们尝试了很多方法来为结点(也就是概念)与结点之间的边赋值(即关系的权重),但是目前还没有哪个公式可以很好地同时满足上述提及的三个特性。另一种模型是信息理论模型,其基本思想是利用两个概念之间的共享信息来反映它们之间的相似度。共享的信息越多,它们的相似度越大,具体实现时一般使用两个概念的最近共同祖先的信息容量来反映两个概念之间的共享信息。这种方法事实上只能解决上述提及的三个特性中的第一个特性—概念的深度,对于第二特性和第三特性则无法满足。另外,基于本体的相似度计算方法为了简化模型,往往把概念的层次结构定义得很分明,形成一棵严格的树形结构,这样模型的概念间相似度将很大程度上依赖于本体的构建,因此并不能很好地满足复杂的现实情况
发明内容
针对现有技术的缺点,本发明的目的是提供一种能够同时满足概念间相似度的三个特性,并支持复杂本体中子概念出现多个父概念时相似度计算的智能语义网中本体概念模糊相似度度量方法。
为实现上述目的,本发明的技术方案为:
一种智能语义网中本体概念模糊相似度度量方法,包括以下步骤:
A.将本体概念扩展成为解释集 ,所述解释集包括isA子集、relatedTo子集和nextTo子集;
其具体是,将与所述本体概念相关的本体概念分为三类,第一类本体概念是本体概念本身及所述本体概念以上的祖父概念集,将第一类本体概念存储在isA子集内,第二类本体概念是与所述本体概念有属性关系的本体概念及有属性关系的本体概念以上的祖父概念集,将第二类本体概念存储在relatedTo子集内,第三类本体概念是与该本体概念有同一父节点的兄弟概念集,将第三类本体概念存储在nextTo子集内;所述解释集表示如下:
B.将本体概念的解释集扩展成模糊解释集,所述模糊解释集包括分别与isA子集、relatedTo子集和nextTo子集相对应的双模糊集vIsA子集、vRelatedTo子集和vNextTo子集;其具体为:
所述模糊解释集表示如下:
;
C.根据所述模糊解释集计算本体概念的相似度;
将概念X、Y分别扩展成为模糊解释集、,其中X包含双模糊子集vIsA(X)、vNextTo(X)及vRelatedTo(X),Y包含双模糊子集vIsA(Y)、vNextTo(Y)及vRelatedTo(Y),通过分别计算双模糊子集vIsA(X)与vIsA(Y)的相似度、双模糊子集vNextTo(X)与vNextTo(Y)的相似度、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度,结合步骤A所述权重、、,计算得到概念X与概念Y的相似度为:
上述方案中,对于本体概念X,其各解释子集isA、nextTo、relatedTo对应的模糊解释子集vIsA、vNextTo、vRelatedTo的计算方式为:
;
上述方案中,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
在vIsA(X)中添加vIsA(Y)有而vIsA(X)中没有的元素,他们的真隶属度和假隶属度均为0,表示一个空集;在vIsA(Y)中添加vIsA(X)有而vIsA(Y)中没有的元素,同样,他们的真隶属度和假隶属度也均为0,令A= vIsA(X),B= vIsA(Y),则vIsA(X)与vIsA(Y)的相似度=,其中,n为双模糊集元素的个数,,,、分别是vIsA(X)的真隶属函数和假隶属函数,、分别是vIsA(Y)的真隶属函数和假隶属函数,此计算出来的相似度侧重的是支持度的差别,当时有=1;
上述方案中,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
上述方案中,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
上述方案中,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
上述方案中,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
上述方案中,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
上述方案中,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为::
上述方案中,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
A= vIsA(X),B= vIsA(Y),则vIsA(X)与vIsA(Y)的相似度=,其中p是一个参数,或,,,,,,,,,,,,,,,,,、分别是A的真隶属函数和假隶属函数,、分别是B的真隶属函数和假隶属函数;
与现有技术相比,本发明具有如下有益效果:
本发明利用双模糊集的相关理论并结合概念相似度的特性,将本体中的概念扩展成为一个模糊解释集,每一个模糊解释集都是一个带权重的双模糊集,然后再选用合适的双模糊集相似度计算方法来计算代表概念的双模糊集间的相似。本发明能够同时满足概念间相似度的三个特性,并支持复杂本体中子概念出现多个父概念时相似度计算,本发明进行计算时还考虑了子概念非继承于父概念的属性对相似度的影响。
附图说明
图1为本发明的总流程图。
具体实施方式
以下结合附图和实施例对本发明进行详细的描述。
其具体是,将与所述本体概念相关的本体概念分为三类,第一类本体概念是本体概念本身及所述本体概念以上的祖父概念集,将第一类本体概念存储在isA子集内,第二类本体概念是与所述本体概念有属性关系的本体概念及有属性关系的本体概念以上的祖父概念集,将第二类本体概念存储在relatedTo子集内,第三类本体概念是与该本体概念有同一父节点的兄弟概念集,将第三类本体概念存储在nextTo子集内;所述解释集表示如下:
B.将本体概念的解释集扩展成模糊解释集,所述模糊解释集包括分别与isA子集、relatedTo子集和nextTo子集相对应的双模糊集vIsA子集、vRelatedTo子集和vNextTo子集;其具体为:
所述模糊解释集表示如下:
C.根据所述模糊解释集计算本体概念的相似度;
将概念X、Y分别扩展成为模糊解释集、,其中X包含双模糊子集vIsA(X)、vNextTo(X)及vRelatedTo(X),Y包含双模糊子集vIsA(Y)、vNextTo(Y)及vRelatedTo(Y),通过分别计算双模糊子集vIsA(X)与vIsA(Y)的相似度、双模糊子集vNextTo(X)与vNextTo(Y)的相似度、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度,结合步骤A所述权重、、,计算得到概念X与概念Y的相似度为:
对于本体概念X,其各解释子集isA、nextTo、relatedTo对应的模糊解释子集vIsA、vNextTo、vRelatedTo的计算方式为:
本发明提供了8种针对本体概念的模糊解释集相似度的计算方式,如下所述:
第1种,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
在vIsA(X)中添加vIsA(Y)有而vIsA(X)中没有的元素,他们的真隶属度和假隶属度均为0,表示一个空集;在vIsA(Y)中添加vIsA(X)有而vIsA(Y)中没有的元素,同样,他们的真隶属度和假隶属度也均为0,令A= vIsA(X),B= vIsA(Y),则vIsA(X)与vIsA(Y)的相似度=,其中,n为双模糊集元素的个数,,,、分别是vIsA(X)的真隶属函数和假隶属函数,、分别是vIsA(Y)的真隶属函数和假隶属函数,此计算出来的相似度侧重的是支持度的差别,当时有=1;
同理,与上述计算vIsA(X)与vIsA(Y)的相似度一样的思路,计算双模糊子集vNextTo(X)与vNextTo(Y)的相似度、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度。
第2种,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
同理,与上述计算vIsA(X)与vIsA(Y)的相似度一样的思路,计算双模糊子集vNextTo(X)与vNextTo(Y)的相似度、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度。
第3种,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
同理,与上述计算vIsA(X)与vIsA(Y)的相似度一样的思路,计算双模糊子集vNextTo(X)与vNextTo(Y)的相似度、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度。
第4种,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
同理,与上述计算vIsA(X)与vIsA(Y)的相似度一样的思路,计算双模糊子集vNextTo(X)与vNextTo(Y)的相似度、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度。
第5种,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
同理,与上述计算vIsA(X)与vIsA(Y)的相似度一样的思路,计算双模糊子集vNextTo(X)与vNextTo(Y)的相似度、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度。
第6种,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
同理,与上述计算vIsA(X)与vIsA(Y)的相似度一样的思路,计算双模糊子集vNextTo(X)与vNextTo(Y)的相似度、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度。
第7种,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
同理,与上述计算vIsA(X)与vIsA(Y)的相似度一样的思路,计算双模糊子集vNextTo(X)与vNextTo(Y)的相似度、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度。
第8种,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
A= vIsA(X),B= vIsA(Y),则vIsA(X)与vIsA(Y)的相似度=,其中p是一个参数,或,,,,,,,,,,,,,,,,,、分别是A的真隶属函数和假隶属函数,、分别是B的真隶属函数和假隶属函数;
Claims (9)
1.一种智能语义网中本体概念模糊相似度度量方法,其特征在于,包括以下步骤:
其具体是,将与所述本体概念相关的本体概念分为三类,第一类本体概念是本体概念本身及所述本体概念以上的祖父概念集,将第一类本体概念存储在isA子集内,第二类本体概念是与所述本体概念有属性关系的本体概念及有属性关系的本体概念以上的祖父概念集,将第二类本体概念存储在relatedTo子集内,第三类本体概念是与该本体概念有同一父节点的兄弟概念集,将第三类本体概念存储在nextTo子集内;所述解释集表示如下:
B.将本体概念的解释集扩展成模糊解释集,所述模糊解释集包括分别与isA子集、relatedTo子集和nextTo子集相对应的双模糊集vIsA子集、vRelatedTo子集和vNextTo子集;其具体为:
所述模糊解释集表示如下:
对于本体概念X,其各解释子集isA、nextTo、relatedTo对应的模糊解释子集vIsA、vNextTo、vRelatedTo的计算方式为:
C.根据所述模糊解释集计算本体概念的相似度;
将概念X、Y分别扩展成为模糊解释集、,其中X包含双模糊子集vIsA(X)、vNextTo(X)及vRelatedTo(X),Y包含双模糊子集vIsA(Y)、vNextTo(Y)及vRelatedTo(Y),通过分别计算双模糊子集vIsA(X)与vIsA(Y)的相似度、双模糊子集vNextTo(X)与vNextTo(Y)的相似度、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度,结合步骤A所述权重、、,计算得到概念X与概念Y的相似度为:
2.根据权利要求1所述的智能语义网中本体概念模糊相似度度量方法,其特征在于,所述双模糊子集vIsA(X)与vIsA(Y)的相似度计算方法为:
在vIsA(X)中添加vIsA(Y)有而vIsA(X)中没有的元素,他们的真隶属度和假隶属度均为0,表示一个空集;在vIsA(Y)中添加vIsA(X)有而vIsA(Y)中没有的元素,同样,他们的真隶属度和假隶属度也均为0,令A= vIsA(X),B= vIsA(Y),则vIsA(X)与vIsA(Y)的相似=,其中,n为双模糊集元素的个数,,,、分别是vIsA(X)的真隶属函数和假隶属函数,、分别是vIsA(Y)的真隶属函数和假隶属函数,此计算出来的相似度侧重的是支持度的差别,当时有=1;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110245928.2A CN102426578B (zh) | 2011-08-25 | 2011-08-25 | 一种智能语义网中本体概念模糊相似度度量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110245928.2A CN102426578B (zh) | 2011-08-25 | 2011-08-25 | 一种智能语义网中本体概念模糊相似度度量方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102426578A CN102426578A (zh) | 2012-04-25 |
CN102426578B true CN102426578B (zh) | 2014-07-02 |
Family
ID=45960560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110245928.2A Expired - Fee Related CN102426578B (zh) | 2011-08-25 | 2011-08-25 | 一种智能语义网中本体概念模糊相似度度量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102426578B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440324A (zh) * | 2013-08-31 | 2013-12-11 | 华南理工大学 | 一种模糊本体描述方法和模糊本体建模方法 |
CN106611039A (zh) * | 2016-08-17 | 2017-05-03 | 四川用联信息技术有限公司 | 一种混合求解本体概念语义相似度的计算方法 |
CN110659350B (zh) * | 2019-09-24 | 2023-03-21 | 吉林大学 | 基于领域本体的语义搜索系统及搜索方法 |
CN111274400B (zh) * | 2020-01-20 | 2021-02-12 | 医惠科技有限公司 | 一种医学术语系统的构建方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894170A (zh) * | 2010-08-13 | 2010-11-24 | 武汉大学 | 基于语义关联网络的跨模信息检索方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8738636B2 (en) * | 2008-09-19 | 2014-05-27 | Yves Reginald JEAN-MARY | Ontology alignment with semantic validation |
-
2011
- 2011-08-25 CN CN201110245928.2A patent/CN102426578B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894170A (zh) * | 2010-08-13 | 2010-11-24 | 武汉大学 | 基于语义关联网络的跨模信息检索方法 |
Non-Patent Citations (2)
Title |
---|
宋玲等.概念与文档的语义相似度计算.《计算机工程与应用》.2008,(第35期),第163-167页. |
概念与文档的语义相似度计算;宋玲等;《计算机工程与应用》;20081231(第35期);第163-167页 * |
Also Published As
Publication number | Publication date |
---|---|
CN102426578A (zh) | 2012-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Taieb et al. | Ontology-based approach for measuring semantic similarity | |
CN107193858A (zh) | 面向多源异构数据融合的智能服务应用平台和方法 | |
CN104008165B (zh) | 一种基于网络拓扑结构和节点属性的社团检测方法 | |
CN102662931B (zh) | 一种基于协同神经网络的语义角色标注方法 | |
CN103500208B (zh) | 结合知识库的深层数据处理方法和系统 | |
CN109710769A (zh) | 一种基于胶囊网络的水军评论检测系统及方法 | |
CN109325231A (zh) | 一种多任务模型生成词向量的方法 | |
CN104239513A (zh) | 一种面向领域数据的语义检索方法 | |
CN104462053A (zh) | 一种文本内的基于语义特征的人称代词指代消解方法 | |
Sadr et al. | Unified topic-based semantic models: a study in computing the semantic relatedness of geographic terms | |
CN102426578B (zh) | 一种智能语义网中本体概念模糊相似度度量方法 | |
Shih et al. | Enhancement of domain ontology construction using a crystallizing approach | |
CN101587486A (zh) | 支持产品创新的设计知识的组织与应用方法 | |
CN103412878B (zh) | 基于领域知识地图社区结构的文档主题划分方法 | |
CN109614495A (zh) | 一种结合知识图谱和文本信息的相关公司挖掘方法 | |
CN108846000A (zh) | 一种基于超节点的常识语义图谱构建方法和装置以及基于连接预测的常识补全方法 | |
CN106372122A (zh) | 一种基于维基语义匹配的文档分类方法及系统 | |
CN109992784A (zh) | 一种融合多模态信息的异构网络构建和距离度量方法 | |
Mishra et al. | Big data: opportunities and challenges | |
CN105335510A (zh) | 文本数据高效搜索方法 | |
Liu et al. | Topic detection and tracking based on event ontology | |
Hakkani-Tür et al. | A weakly-supervised approach for discovering new user intents from search query logs | |
CN105160046A (zh) | 基于文本的数据检索方法 | |
CN105354264A (zh) | 一种基于局部敏感哈希的主题标签快速赋予方法 | |
CN109388706A (zh) | 一种问题细粒度分类方法、系统与装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140702 |