CN113569537B - 一种本体匹配修复方法和系统 - Google Patents

一种本体匹配修复方法和系统 Download PDF

Info

Publication number
CN113569537B
CN113569537B CN202111118124.6A CN202111118124A CN113569537B CN 113569537 B CN113569537 B CN 113569537B CN 202111118124 A CN202111118124 A CN 202111118124A CN 113569537 B CN113569537 B CN 113569537B
Authority
CN
China
Prior art keywords
matching
arc
node
conversion
ontology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111118124.6A
Other languages
English (en)
Other versions
CN113569537A (zh
Inventor
李炜卓
季秋
张松懋
漆桂林
周诗琪
付雪峰
孙哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202111118124.6A priority Critical patent/CN113569537B/zh
Publication of CN113569537A publication Critical patent/CN113569537A/zh
Application granted granted Critical
Publication of CN113569537B publication Critical patent/CN113569537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种本体匹配修复方法和系统,属于语义网中本体匹配修复技术领域。首先基于构建规则将本体与匹配转换至有向图中,根据专家在判断过程中对匹配做出的决策,利用基于图的推理技术完成对未标识匹配的自动更新,最后返回修复匹配。本发明基于图方法实施可有效降低推理算法复杂度,利用图推理技术自动更新未标识匹配弧的方式,显著减少专家判断匹配的次数,有助于将交互式匹配修复方法扩展到大型本体。

Description

一种本体匹配修复方法和系统
技术领域
本发明属于语义网中本体匹配修复技术领域,具体涉及一种在轻量级的本体语言(DL-Lite语言)下,基于图结构有效减少专家判断次数的交互式本体匹配修复方法。
背景技术
伴随着互联网数据规模的爆炸式增长,如何利用计算机快速、准确地自动获取网页上的信息成为技术难点。语义网的提出为这一难题提供了有效的解决思路。在语义网的层次结构中,本体作为知识表示的形式化工具扮演着承上启下的重要角色。它利用下层的技术组织结构化数据,同时又为上层提供推理等技术支持,是实现语义网中知识共享与重用的基础。此外,在远程监督、查询扩展及数据库的高效访问及知识推理等诸多重要任务中,本体扮演着极其重要的角色。特别是近年来,随着链接数据的开放与知识图谱技术的蓬勃发展,越来越多的研究人员致力于将知识图谱技术用于挖掘数据中的有用知识。本体作为知识图谱的语义框架,也在这些过程中受到了广泛的应用。
然而,由于人们往往根据不同的应用需求来构建本体,并且缺少统一的构建规范与标准,导致相同领域的本体在覆盖面、粒度、命名和结构方面存在较大差异,这种现象称为本体异构,这严重阻碍了语义网中知识的共享与重用。本体映射技术是解决这一问题的有效途径,它利用本体内部的信息与外部的资源来建立本体之间实体的对应关系,本体中实体间的这种对应关系称为本体匹配。伴随着本体自身规模的不断扩大,为了减少人工构建本体匹配的负担,本体映射技术开始从人工构建转为半自动构建与自动构建。
尽管研究人员已提出大量的本体映射系统并在实施过程中不断改进与完善,现有自动本体匹配修复的方法仍存在局限性。一方面,逻辑意义上本体中概念与角色的不可满足现象虽然由错误的匹配所引起,但并非所有错误的匹配都会导致这种现象的产生,这些匹配往往会在最终的修复结果中被保存下来。由于基于逻辑冲突的修复方法依赖于本体中定义的不相交公理,当这些不相交公理大量缺失或者不存在时,则会严重影响这些自动修复匹配方法的性能。另一方面,在修复的过程中,可能存在成千上万种候选的移除策略,这在大型且复杂本体(如:生物医学本体)的匹配修复任务中极为常见,尽管存在一些有效的启发式规则来引导错误匹配的移除,但仍然无法避免一些正确的匹配被识别为“错误”匹配而被移除。因此,这些启发式规则的准确性与完备性仍然无法得到保证。
错误的本体匹配会对语义网中术语推理、数据转换、点对点协作以及查询问答等应用产生消极的影响。因此,本体匹配的修复对提升本体映射结果的质量十分重要。为检测出更多的错误匹配、提高匹配的修复质量,需要具有领域知识的专家来对匹配进行手动修复。目前针对交互式匹配修复已有一些研究方法,但其中大多数都侧重于为专家提供更多信息以便他们做出更好的决策,如利用分布式描述逻辑(DDL)来检测和传播专家决策中正确匹配的影响,通过决策空间中定义的操作显著降低本体在推理时所需的开销等。尽管如此,决策空间的算法复杂度为
Figure 449276DEST_PATH_IMAGE001
,其实际应用时间开销仍较高。
发明内容
本发明旨在提供一种本体匹配修复方法,降低匹配修复方法的时间复杂度。
考虑到大部分大型本体(尤其是在生物医学领域)都是采用轻量级的本体语言(如:DL-Lite语言)进行描述的,因此利用图高效的推理特性,可以进一步将决策空间中相应的操作界定在
Figure 772941DEST_PATH_IMAGE002
时间复杂度内,这样也有助于将交互式匹配修复方法扩展到大型本体。
为实现该技术目的,本发明采用以下技术方案。
一种本体匹配修复方法,包括以下步骤:将各个本体转换成该本体对应的图,将本 体匹配转换为匹配弧,利用所述匹配弧连接两个子图形成一个集成图;初始化集成图的修 正状态与决策空间,所述修正状态包括弧和匹配弧,所述匹配弧分为正确匹配弧标识集合 和错误匹配弧标识集合;所述决策空间包括由修正状态计算得到的剩余未标识匹配弧集 合、集成图推理的蕴含算子
Figure 333104DEST_PATH_IMAGE003
与冲突算子
Figure 102215DEST_PATH_IMAGE004
在交互式本体匹配修复过程中,当专家对当前待决策匹配弧对应的匹配给出赞同操作或者否定操作时分别启动基于决策空间的赞同推理算法或者基于决策空间的否定推理算法,对剩余未标识匹配弧集合中匹配弧进行标记;
重复交互式本体匹配修复过程,直至所有匹配弧都被标记,确定最终正确匹配弧标识集合。
进一步地,给定两个本体,分别记作
Figure 323112DEST_PATH_IMAGE005
Figure 253897DEST_PATH_IMAGE006
,根据本体转换规则将各个本体转换成 该本体对应的图,所述本体对应的图包括由本体基础概念与原子属性通过转换规则转换而 来的节点,以及该本体内部根据各基础概念与原子属性之间包含于关系转换得到的弧;所 述集成图表示为
Figure 68400DEST_PATH_IMAGE007
,其中N为节点集合,E为弧集合,
Figure 393200DEST_PATH_IMAGE008
为匹配弧集合,弧与匹配 弧的表示均记作
Figure 734183DEST_PATH_IMAGE009
,其中
Figure 835869DEST_PATH_IMAGE010
为集成图中的节点。
据本体的转换规则将各个本体转换成该本体对应的图,所述本体的转换规则包括:
规则1:对于公理集合T中的每个原子概念C,将原子概念C转换为节点A,节点集合N 包含节点A,其中公理集合T
Figure 370624DEST_PATH_IMAGE011
k为当前选定的本体下标,i,j分别为各本 体的下标,T k 为当前选定的本体k的公理集合;
规则2:对于公理集合T中的每个原子属性R,
Figure 983002DEST_PATH_IMAGE012
为原子属性R的逆操作;
Figure 677027DEST_PATH_IMAGE013
为原子 属性R值域的取值概念;
Figure 388762DEST_PATH_IMAGE014
为原子属性R定义域的取值概念,将原子属性R转换为节点P, 将原子属性R的逆操作
Figure 744569DEST_PATH_IMAGE012
转换为节点
Figure 691796DEST_PATH_IMAGE015
;将原子属性R值域的取值概念
Figure 115693DEST_PATH_IMAGE016
转换为节点
Figure 355919DEST_PATH_IMAGE017
, 将原子属性R定义域的取值概念
Figure 694628DEST_PATH_IMAGE018
转换为节点
Figure 553869DEST_PATH_IMAGE019
N包含节点P
Figure 953976DEST_PATH_IMAGE020
Figure 443732DEST_PATH_IMAGE021
以及
Figure 971534DEST_PATH_IMAGE022
规则3:对于公理集合T中的每一条基础概念包含公理
Figure 589178DEST_PATH_IMAGE023
Figure 551449DEST_PATH_IMAGE024
,弧 的集合E包含弧
Figure 274423DEST_PATH_IMAGE025
Figure 384461DEST_PATH_IMAGE026
为基础概念
Figure 319925DEST_PATH_IMAGE027
转换的节点,通常由多个原子概念或者原子概念结 合原子属性构造而成,常用的构造符有
Figure 963134DEST_PATH_IMAGE028
Figure 686370DEST_PATH_IMAGE029
以及
Figure 397886DEST_PATH_IMAGE030
Figure 294298DEST_PATH_IMAGE031
表示基础概念
Figure 136221DEST_PATH_IMAGE027
的否定
Figure 528894DEST_PATH_IMAGE032
转换的 节点;
Figure 613525DEST_PATH_IMAGE033
为不同基础概念交集
Figure 749846DEST_PATH_IMAGE034
转换的节点。
Figure 478898DEST_PATH_IMAGE035
表示与原子概念C存在原子属性R 关系的概念集合
Figure 567772DEST_PATH_IMAGE036
转换的节点。
Figure 77382DEST_PATH_IMAGE037
分别为基础概念
Figure 689497DEST_PATH_IMAGE038
和基础概念
Figure 896226DEST_PATH_IMAGE039
转换的节点,“
Figure 866587DEST_PATH_IMAGE040
”为“包含于”关系;E为本体内部根据各节点之间“包含于”关系转换得到的弧的集合;
规则4:对于公理集合
Figure 299711DEST_PATH_IMAGE041
中的每一条基础概念包含公理
Figure 279299DEST_PATH_IMAGE042
Figure 80814DEST_PATH_IMAGE024
E包含弧
Figure 923874DEST_PATH_IMAGE043
,并且N包含节点
Figure 142497DEST_PATH_IMAGE044
Figure 221049DEST_PATH_IMAGE045
为基础概念
Figure 779201DEST_PATH_IMAGE046
的否定
Figure 652217DEST_PATH_IMAGE047
转换的节点,“
Figure 358136DEST_PATH_IMAGE048
”为“包含于”关系;
规则5:对于公理集合T中的每一条角色包含公理
Figure 133323DEST_PATH_IMAGE049
Figure 106833DEST_PATH_IMAGE024
E包含弧
Figure 652215DEST_PATH_IMAGE050
Figure 281648DEST_PATH_IMAGE051
Figure 937889DEST_PATH_IMAGE052
以及
Figure 31484DEST_PATH_IMAGE053
Figure 393108DEST_PATH_IMAGE054
Figure 73619DEST_PATH_IMAGE055
为原子属性
Figure 297664DEST_PATH_IMAGE056
和原子属性
Figure 419335DEST_PATH_IMAGE057
转换的节点,
Figure 805055DEST_PATH_IMAGE058
为原子属性
Figure 707283DEST_PATH_IMAGE056
的逆操作
Figure 344807DEST_PATH_IMAGE059
转换的节点,
Figure 938294DEST_PATH_IMAGE060
为原子 属性的逆操作
Figure 137325DEST_PATH_IMAGE061
转换的节点,
Figure 290963DEST_PATH_IMAGE062
为原子属性
Figure 92697DEST_PATH_IMAGE063
值域的取值概念
Figure 687496DEST_PATH_IMAGE064
转换的节点,
Figure 883860DEST_PATH_IMAGE065
为 原子属性
Figure 557417DEST_PATH_IMAGE066
值域的取值概念
Figure 808182DEST_PATH_IMAGE067
转换的节点,
Figure 821269DEST_PATH_IMAGE068
为原子属性
Figure 985272DEST_PATH_IMAGE069
定义域的取值概念
Figure 785606DEST_PATH_IMAGE070
转换的节点,
Figure 132405DEST_PATH_IMAGE071
为原子属性
Figure 560850DEST_PATH_IMAGE072
定义域的取值概念
Figure 272585DEST_PATH_IMAGE073
转换的节点;
规则6:对于公理集合T中的每一条角色包含公理
Figure 436849DEST_PATH_IMAGE074
Figure 757977DEST_PATH_IMAGE024
E包 含弧
Figure 11235DEST_PATH_IMAGE075
Figure 517041DEST_PATH_IMAGE076
Figure 527853DEST_PATH_IMAGE077
Figure 714990DEST_PATH_IMAGE078
,并且N包含节点
Figure 885071DEST_PATH_IMAGE079
Figure 177424DEST_PATH_IMAGE080
Figure 501964DEST_PATH_IMAGE081
以及
Figure 56573DEST_PATH_IMAGE082
Figure 189483DEST_PATH_IMAGE079
为原子属性
Figure 741819DEST_PATH_IMAGE083
的否定
Figure 350392DEST_PATH_IMAGE084
转换的节点,
Figure 545576DEST_PATH_IMAGE080
为原子属性
Figure 627932DEST_PATH_IMAGE083
的逆操作的否定
Figure 646442DEST_PATH_IMAGE085
转换的节点,
Figure 853563DEST_PATH_IMAGE081
为原子属性
Figure 186193DEST_PATH_IMAGE083
值域的取值概念的否定
Figure 185373DEST_PATH_IMAGE086
转换的节点,
Figure 250150DEST_PATH_IMAGE087
为原子属 性
Figure 776859DEST_PATH_IMAGE066
逆操作后值域的取值概念的否定
Figure 211382DEST_PATH_IMAGE088
转换的节点。
再进一步地,利用匹配的转换规则将本体匹配转换为匹配弧用来连接两个子图,所述匹配的转换规则包括:
规则7:对于每一个基础概念匹配
Figure 173391DEST_PATH_IMAGE089
,在
Figure 238430DEST_PATH_IMAGE090
上增加一条弧
Figure 308892DEST_PATH_IMAGE091
Figure 655428DEST_PATH_IMAGE092
为 本体匹配所对应的匹配弧集合,
Figure 301305DEST_PATH_IMAGE093
为本体
Figure 115675DEST_PATH_IMAGE094
中的基础概念
Figure 784685DEST_PATH_IMAGE095
转换的节点,
Figure 262809DEST_PATH_IMAGE096
为本体
Figure 825508DEST_PATH_IMAGE006
中 的基础概念
Figure 730885DEST_PATH_IMAGE097
转换的节点,
Figure 385726DEST_PATH_IMAGE098
表示本体
Figure 169005DEST_PATH_IMAGE005
中的基础概念
Figure 90606DEST_PATH_IMAGE099
包含于本体
Figure 606032DEST_PATH_IMAGE100
中 的基础概念
Figure 810486DEST_PATH_IMAGE101
的置信度为
Figure 663036DEST_PATH_IMAGE102
,其中
Figure 839808DEST_PATH_IMAGE102
为[0,1]之间的实数值;
规则8:对于每一个基础概念匹配
Figure 86987DEST_PATH_IMAGE103
,在匹配弧集合
Figure 76940DEST_PATH_IMAGE104
上增加一条弧
Figure 366802DEST_PATH_IMAGE105
Figure 961862DEST_PATH_IMAGE103
表示于本体
Figure 442260DEST_PATH_IMAGE106
中的基础概念
Figure 293410DEST_PATH_IMAGE107
包含于本体
Figure 956604DEST_PATH_IMAGE108
中的基础概念
Figure 701444DEST_PATH_IMAGE109
的置信度为
Figure 729574DEST_PATH_IMAGE102
,其中
Figure 136196DEST_PATH_IMAGE102
为[0,1]之间的实数值;
规则9:对于每一个基础概念匹配
Figure 399818DEST_PATH_IMAGE110
,在匹配弧集合
Figure 140110DEST_PATH_IMAGE111
上增加两条弧
Figure 899994DEST_PATH_IMAGE112
Figure 351835DEST_PATH_IMAGE113
Figure 527470DEST_PATH_IMAGE114
表示本体
Figure 748367DEST_PATH_IMAGE108
中的基础概念
Figure 634413DEST_PATH_IMAGE115
与本体
Figure 9768DEST_PATH_IMAGE116
基础概念
Figure 349614DEST_PATH_IMAGE117
是等价关系的置信度为
Figure 64498DEST_PATH_IMAGE102
;其中
Figure 729965DEST_PATH_IMAGE102
为[0,1]之间的实数值;
规则10:对于每一个原子属性匹配
Figure 327038DEST_PATH_IMAGE118
,在匹配弧集合
Figure 115914DEST_PATH_IMAGE111
上增加四条弧
Figure 311403DEST_PATH_IMAGE119
Figure 583990DEST_PATH_IMAGE120
Figure 107507DEST_PATH_IMAGE121
以及
Figure 553269DEST_PATH_IMAGE122
Figure 977166DEST_PATH_IMAGE123
为本体
Figure 984437DEST_PATH_IMAGE124
中的原子属性
Figure 550242DEST_PATH_IMAGE125
转换 的节点,
Figure 176526DEST_PATH_IMAGE126
本体
Figure 579564DEST_PATH_IMAGE127
中原子属性
Figure 131637DEST_PATH_IMAGE128
转换的节点,
Figure 754379DEST_PATH_IMAGE129
表示本体
Figure 876966DEST_PATH_IMAGE124
中的原子属性
Figure 134510DEST_PATH_IMAGE125
的逆操作
Figure 421266DEST_PATH_IMAGE130
转换节点,
Figure 436364DEST_PATH_IMAGE131
表示本体
Figure 732347DEST_PATH_IMAGE132
中的原子属性
Figure 713904DEST_PATH_IMAGE133
的逆操作
Figure 997993DEST_PATH_IMAGE134
转换的节点,
Figure 205114DEST_PATH_IMAGE135
表示本体
Figure 334482DEST_PATH_IMAGE124
中 的原子属性
Figure 441984DEST_PATH_IMAGE136
值域的取值概念
Figure 336122DEST_PATH_IMAGE137
转换的节点,
Figure 393989DEST_PATH_IMAGE138
表示本体
Figure 703879DEST_PATH_IMAGE139
中的原子属性
Figure 56100DEST_PATH_IMAGE140
值域的取 值概念
Figure 291778DEST_PATH_IMAGE141
转换的节点,
Figure 801388DEST_PATH_IMAGE142
表示本体
Figure 538138DEST_PATH_IMAGE108
中的原子属性
Figure 856118DEST_PATH_IMAGE143
定义域的取值概念
Figure 404909DEST_PATH_IMAGE144
转换的 节点,
Figure 136236DEST_PATH_IMAGE145
表示本体
Figure 286463DEST_PATH_IMAGE146
中的原子属性
Figure 613277DEST_PATH_IMAGE147
定义域的取值概念
Figure 426644DEST_PATH_IMAGE148
转换的节点。
Figure 206119DEST_PATH_IMAGE149
表示本体
Figure 723819DEST_PATH_IMAGE108
中的原子属性
Figure 520786DEST_PATH_IMAGE150
包含于本体
Figure 659381DEST_PATH_IMAGE151
中原子属性
Figure 365300DEST_PATH_IMAGE152
的置信度为
Figure 857330DEST_PATH_IMAGE102
,其中
Figure 394621DEST_PATH_IMAGE102
为[0, 1]之间的实数值;
规则11:对于每一个原子属性匹配
Figure 579484DEST_PATH_IMAGE153
,在匹配弧集合
Figure 796533DEST_PATH_IMAGE154
上增加四条 弧
Figure 921615DEST_PATH_IMAGE155
Figure 952894DEST_PATH_IMAGE156
Figure 669177DEST_PATH_IMAGE157
以及
Figure 254748DEST_PATH_IMAGE158
Figure 416477DEST_PATH_IMAGE159
表示本体
Figure 928361DEST_PATH_IMAGE160
中的原 子属性
Figure 195306DEST_PATH_IMAGE161
包含于本体
Figure 363113DEST_PATH_IMAGE108
中的原子属性
Figure 125271DEST_PATH_IMAGE162
的置信度为
Figure 694924DEST_PATH_IMAGE102
,其中
Figure 658069DEST_PATH_IMAGE102
为[0,1]之间的实数值;
规则12:对于每一个属性匹配
Figure 483812DEST_PATH_IMAGE163
,在匹配弧集合
Figure 285546DEST_PATH_IMAGE111
上增加八条弧
Figure 225818DEST_PATH_IMAGE164
Figure 828707DEST_PATH_IMAGE165
Figure 767844DEST_PATH_IMAGE166
Figure 747170DEST_PATH_IMAGE167
Figure 25836DEST_PATH_IMAGE168
Figure 924259DEST_PATH_IMAGE169
Figure 730453DEST_PATH_IMAGE170
以及
Figure 342831DEST_PATH_IMAGE171
Figure 36856DEST_PATH_IMAGE172
表示本体
Figure 483012DEST_PATH_IMAGE173
中的原子属性
Figure 832959DEST_PATH_IMAGE162
与本 体
Figure 780187DEST_PATH_IMAGE174
中原子属性
Figure 938504DEST_PATH_IMAGE175
是等价关系的置信度为
Figure 438450DEST_PATH_IMAGE102
,其中
Figure 449263DEST_PATH_IMAGE102
为[0,1]之间的实数值;
进一步地,所述集成图的修正状态表示为三元组
Figure 901979DEST_PATH_IMAGE176
,其中
Figure 806481DEST_PATH_IMAGE177
为匹配弧集合,
Figure 358554DEST_PATH_IMAGE178
为正确匹配弧标识集合,
Figure 214252DEST_PATH_IMAGE179
为错误匹配 弧标识集合,
Figure 706544DEST_PATH_IMAGE180
Figure 110893DEST_PATH_IMAGE181
并且
Figure 459966DEST_PATH_IMAGE182
;如果
Figure 6223DEST_PATH_IMAGE183
,那么基 于集成图的修正状态是完备的;修正状态的闭包记作
Figure 738424DEST_PATH_IMAGE184
其中
Figure 351939DEST_PATH_IMAGE185
,它表示基于正确匹配弧标识集合进行集成图的 传递必包操作,
Figure 245815DEST_PATH_IMAGE186
对于
Figure 780832DEST_PATH_IMAGE187
Figure 5857DEST_PATH_IMAGE188
,它表示基于错误匹配弧标识集 合进行图的传递必包操作,
Figure 113360DEST_PATH_IMAGE189
Figure 741918DEST_PATH_IMAGE190
表示集成图匹配弧集合中两条不同的匹配弧,
Figure 59505DEST_PATH_IMAGE191
表示 根据集合执行集成图的传递必包操作,
Figure 369395DEST_PATH_IMAGE192
泛指集成图中弧或者匹配弧集合;当修正状态 呈现闭包状态不再发生改变时,则基于决策空间的交互式本体匹配修复过程完成。
再进一步地,所述集成图的决策空间表示为:
Figure 721616DEST_PATH_IMAGE193
,其中
Figure 786655DEST_PATH_IMAGE194
表示剩余未标识匹配弧集合,
Figure 207184DEST_PATH_IMAGE195
,“
Figure 678355DEST_PATH_IMAGE196
”表示集合的差集操作,
蕴含算子的
Figure 527493DEST_PATH_IMAGE197
的定义为:若匹配弧
Figure 261969DEST_PATH_IMAGE198
蕴含匹配弧
Figure 55612DEST_PATH_IMAGE199
,记作
Figure 533736DEST_PATH_IMAGE200
,当且仅当
Figure 464477DEST_PATH_IMAGE201
成立,
Figure 933636DEST_PATH_IMAGE202
表示根据集合
Figure 104590DEST_PATH_IMAGE203
执行集成图的传递必包操作;
冲突算子
Figure 2051DEST_PATH_IMAGE204
的定义为:若匹配弧
Figure 419257DEST_PATH_IMAGE205
与匹配弧
Figure 495535DEST_PATH_IMAGE206
冲突,记作
Figure 372093DEST_PATH_IMAGE207
,当且仅当对于
Figure 755801DEST_PATH_IMAGE208
中 的某一条弧
Figure 729311DEST_PATH_IMAGE209
使得
Figure 150060DEST_PATH_IMAGE210
成立,
Figure 898267DEST_PATH_IMAGE211
Figure 23349DEST_PATH_IMAGE212
Figure 523470DEST_PATH_IMAGE213
均为匹配弧集合
Figure 3867DEST_PATH_IMAGE214
中匹配弧的通用表 示。
再进一步地,所述基于决策空间的赞同推理算法包括:输入为修正状态
Figure 356482DEST_PATH_IMAGE215
、决策空间
Figure 518211DEST_PATH_IMAGE216
和当前被专家赞同的匹配所转换的 匹配弧
Figure 30095DEST_PATH_IMAGE217
,将匹配弧
Figure 169477DEST_PATH_IMAGE218
加入至正确匹配弧标识集合
Figure 134022DEST_PATH_IMAGE219
中;循环遍历剩余未标识匹配弧集 合
Figure 851440DEST_PATH_IMAGE220
,对于剩余未标识匹配弧集合
Figure 93197DEST_PATH_IMAGE220
中各未标识的匹配弧
Figure 915397DEST_PATH_IMAGE221
,利用蕴含算子
Figure 570501DEST_PATH_IMAGE222
确定若匹配 弧
Figure 746136DEST_PATH_IMAGE223
包含于正确匹配弧标识集合
Figure 668830DEST_PATH_IMAGE219
的传递必包中,则说明匹配弧
Figure 897817DEST_PATH_IMAGE224
蕴含匹配弧
Figure 951136DEST_PATH_IMAGE225
,则将 匹配弧
Figure 25403DEST_PATH_IMAGE226
自动更新为正确的匹配弧加入正确匹配弧标识集合
Figure 864920DEST_PATH_IMAGE227
中,更新剩余未标识匹配 弧集合
Figure 638710DEST_PATH_IMAGE228
;循环遍历错误匹配弧标识集合
Figure 2827DEST_PATH_IMAGE208
中的匹配弧
Figure 910477DEST_PATH_IMAGE229
,对于剩余未标识匹配弧 集合中各未标识的匹配弧
Figure 715753DEST_PATH_IMAGE225
,利用冲突算子
Figure 248061DEST_PATH_IMAGE230
确定若匹配弧
Figure 161790DEST_PATH_IMAGE231
属于
Figure 217340DEST_PATH_IMAGE232
的传递必包中 或造成集成图存在匹配弧之间逻辑冲突,所述逻辑冲突为存在至少1个基础概念
Figure 969133DEST_PATH_IMAGE027
或者原子 属性
Figure 976403DEST_PATH_IMAGE233
为空集,记作
Figure 813647DEST_PATH_IMAGE234
或者
Figure 174352DEST_PATH_IMAGE235
,则将匹配弧
Figure 583249DEST_PATH_IMAGE236
自动更新为错误的匹配弧,加入错误匹 配弧标识集合
Figure 400901DEST_PATH_IMAGE237
中;最后返回更新后的决策空间,同时更新修正状态;
所述基于决策空间的否定推理算法包括:输入为修正状态
Figure 758064DEST_PATH_IMAGE238
、决策 空间
Figure 748891DEST_PATH_IMAGE239
和当前被专家否定的匹配所转换的匹配弧
Figure 648845DEST_PATH_IMAGE240
,首先将匹 配弧
Figure 496453DEST_PATH_IMAGE240
加入至错误匹配弧标识集合
Figure 544175DEST_PATH_IMAGE241
中,其次循环遍历剩余未标识匹配弧集合,对于剩 余未标识匹配弧集合
Figure 762796DEST_PATH_IMAGE242
中各未标识的匹配弧
Figure 406005DEST_PATH_IMAGE243
,利用所述蕴含算子
Figure 129241DEST_PATH_IMAGE222
确定若匹配弧
Figure 834898DEST_PATH_IMAGE244
包 含于
Figure 731310DEST_PATH_IMAGE245
的传递必包中,则说明匹配弧
Figure 573233DEST_PATH_IMAGE246
蕴含匹配弧
Figure 971765DEST_PATH_IMAGE247
,则将匹配弧
Figure 56396DEST_PATH_IMAGE248
自动更新为错 误的匹配弧,加入错误匹配弧标识集合
Figure 192717DEST_PATH_IMAGE249
中;最后返回更新后的决策空间,同时更新修正 状态。
再进一步地,基于扩展规则,根据本体之间的影响关系在两个子图之间增加影响 弧构成影响弧集合
Figure 921770DEST_PATH_IMAGE250
,所述影响弧记作
Figure 16502DEST_PATH_IMAGE251
,其中
Figure 526112DEST_PATH_IMAGE252
为集成图中的节点,增加 影响弧后的集成图表示为
Figure 138228DEST_PATH_IMAGE253
;所述扩展规则包括:
扩展规则1:对于每一个概念包含公理
Figure 542359DEST_PATH_IMAGE254
,节点的集合N包含节点AB、
Figure 575037DEST_PATH_IMAGE255
Figure 742582DEST_PATH_IMAGE256
Figure 722171DEST_PATH_IMAGE257
,弧的集合E包含弧
Figure 783405DEST_PATH_IMAGE258
Figure 190247DEST_PATH_IMAGE259
,影响弧集合
Figure 845088DEST_PATH_IMAGE260
包含
Figure 929500DEST_PATH_IMAGE261
以及
Figure 222072DEST_PATH_IMAGE262
,其中A为原子概念C转换的节点,B为基础概念D转换的节点,
Figure 563929DEST_PATH_IMAGE263
为原子属性R 值域的取值概念
Figure 66586DEST_PATH_IMAGE264
转换的节点,
Figure 886512DEST_PATH_IMAGE265
为原子属性R定义域的取值概念
Figure 797705DEST_PATH_IMAGE266
转换的节点,
Figure 546349DEST_PATH_IMAGE267
表示与原子概念C存在原子属性
Figure 52415DEST_PATH_IMAGE233
关系的概念集合
Figure 849601DEST_PATH_IMAGE268
转换的节点;
扩展规则2:对于每一个概念包含公理
Figure 943197DEST_PATH_IMAGE269
,节点的集合N包含节点AB
Figure 925059DEST_PATH_IMAGE270
Figure 776210DEST_PATH_IMAGE271
Figure 937938DEST_PATH_IMAGE272
,弧的集合E包含弧
Figure 449822DEST_PATH_IMAGE273
Figure 716768DEST_PATH_IMAGE274
,影响弧集合
Figure 618996DEST_PATH_IMAGE275
包含
Figure 381153DEST_PATH_IMAGE276
以及
Figure 950806DEST_PATH_IMAGE277
,其中,A为原子概念
Figure 382793DEST_PATH_IMAGE278
转换的节点,B为基础概念
Figure 333169DEST_PATH_IMAGE027
转换的节点,
Figure 275849DEST_PATH_IMAGE263
为原子属性R值域 的取值概念
Figure 192684DEST_PATH_IMAGE264
转换的节点,
Figure 687250DEST_PATH_IMAGE265
为原子属性
Figure 62605DEST_PATH_IMAGE233
定义域的取值概念
Figure 307511DEST_PATH_IMAGE266
转换的节点,
Figure 117335DEST_PATH_IMAGE279
表示 与原子概念
Figure 484600DEST_PATH_IMAGE278
存在原子属性
Figure 520820DEST_PATH_IMAGE233
的逆操作关系的概念集合
Figure 434331DEST_PATH_IMAGE280
转换的节点。
再进一步地,确定当前待决策匹配弧的方法包括:从剩余未标识匹配弧集合中选 取综合影响函数值最大的匹配弧作为当前待决策匹配弧
Figure 567503DEST_PATH_IMAGE281
,将所述当前待决策匹配弧对应 的匹配提供给专家进行决策,所述综合影响函数值的计算方法如下:
Figure 43352DEST_PATH_IMAGE282
其中
Figure 924459DEST_PATH_IMAGE283
表示赞同影响,
Figure 74948DEST_PATH_IMAGE284
表示否定影响,
Figure 764425DEST_PATH_IMAGE285
Figure 506116DEST_PATH_IMAGE286
Figure 360937DEST_PATH_IMAGE287
表示通过运算
Figure 485757DEST_PATH_IMAGE288
Figure 390259DEST_PATH_IMAGE289
Figure 4649DEST_PATH_IMAGE290
得到并且属于匹配弧集合
Figure 768337DEST_PATH_IMAGE177
的匹配弧的数 量;其中
Figure 759164DEST_PATH_IMAGE291
表示执行蕴含算子的操作,记作
Figure 783752DEST_PATH_IMAGE292
Figure 512586DEST_PATH_IMAGE289
表示执行蕴含算子的操作,记作
Figure 58842DEST_PATH_IMAGE293
Figure 885984DEST_PATH_IMAGE294
执行冲突算子,记作
Figure 404559DEST_PATH_IMAGE295
Figure 862216DEST_PATH_IMAGE296
为剩余未标识匹配弧集合
Figure 958086DEST_PATH_IMAGE297
中的匹配弧。
进一步地,初始化集成图的修正状态包括初始化正确匹配弧标识集合,具体包括:将两个本体所有的公理加入正确匹配弧标识集合中,并通过两条软化原则预先认定为可靠的匹配弧加入到正确匹配弧标识集合中,两条软化原则的具体定义如下:
原则1:可靠的匹配弧不应该造成集成图存在匹配弧之间逻辑冲突,所述逻辑冲突 为存在至少1个基础概念D或者原子属性R为空集,记作
Figure 792181DEST_PATH_IMAGE298
或者
Figure 893824DEST_PATH_IMAGE299
原则2:可靠的匹配弧应至少关联1个可靠的匹配弧,意味这两个的匹配弧
Figure 348814DEST_PATH_IMAGE300
Figure 371127DEST_PATH_IMAGE301
需要相互支持,相互支持(即相互关联)的定义为:对应的
Figure 913973DEST_PATH_IMAGE302
Figure 767660DEST_PATH_IMAGE303
之 间的关系,和
Figure 331234DEST_PATH_IMAGE304
Figure 17342DEST_PATH_IMAGE305
之间的关系相同;
Figure 989977DEST_PATH_IMAGE306
Figure 72072DEST_PATH_IMAGE307
分别为本体
Figure 104750DEST_PATH_IMAGE308
中的基础概念
Figure 600191DEST_PATH_IMAGE309
Figure 484839DEST_PATH_IMAGE310
转换的节点,
Figure 313118DEST_PATH_IMAGE311
Figure 908177DEST_PATH_IMAGE312
分别为本体
Figure 923537DEST_PATH_IMAGE313
中的基础概念
Figure 205352DEST_PATH_IMAGE314
Figure 262038DEST_PATH_IMAGE315
转换的节点,
Figure 839781DEST_PATH_IMAGE309
Figure 106552DEST_PATH_IMAGE314
Figure 162364DEST_PATH_IMAGE310
Figure 79417DEST_PATH_IMAGE316
之间具有相同的关系(如:
Figure 890378DEST_PATH_IMAGE317
Figure 254232DEST_PATH_IMAGE318
)。这些节点
Figure 612270DEST_PATH_IMAGE319
由转换规则1转换而来,它们对应为本体中
Figure 269647DEST_PATH_IMAGE308
中的 基础概念
Figure 687728DEST_PATH_IMAGE309
Figure 305922DEST_PATH_IMAGE310
与本体
Figure 258529DEST_PATH_IMAGE313
基础概念
Figure 708096DEST_PATH_IMAGE314
Figure 234762DEST_PATH_IMAGE315
,匹配弧
Figure 432262DEST_PATH_IMAGE320
Figure 164726DEST_PATH_IMAGE321
则是由规则7或 者规则9转换而来。
Figure 639439DEST_PATH_IMAGE317
为本体
Figure 900787DEST_PATH_IMAGE308
中的“包含于”关系,
Figure 857023DEST_PATH_IMAGE318
为本体
Figure 298237DEST_PATH_IMAGE313
中的“包含 于”关系。
本发明还提供了一种本体匹配修复系统,包括:集成图构建模块、初始化模块、专家标识模块以及交互式本体匹配修复模块;
所述集成图构建模块,用于将各个本体转换成该本体对应的图,将本体匹配转换为匹配弧,利用所述匹配弧连接两个子图形成一个集成图;
所述初始化模块,用于初始化集成图的修正状态与决策空间,所述修正状态包括 弧和匹配弧,所述匹配弧分为正确匹配弧标识集合和错误匹配弧标识集合;所述决策空间 包括由修正状态计算得到的剩余未标识匹配弧集合、集成图推理的蕴含算子
Figure 253555DEST_PATH_IMAGE222
与冲突算子
Figure 449919DEST_PATH_IMAGE004
所述专家标识模块,用于专家对当前待决策匹配弧对应的匹配给出赞同或否定操作;
所述交互式本体匹配修复模块,用于在交互式本体匹配修复过程中,当专家对当前待决策匹配弧对应的匹配给出赞同操作或者否定操作时分别启动基于决策空间的赞同推理算法或者基于决策空间的否定推理算法,对剩余未标识匹配弧集合中匹配弧进行标记;重复交互式本体匹配修复过程,直至所有匹配弧都被标记,确定最终正确匹配弧标识集合。
本发明所取得的有益技术效果:本发明考虑到大部分大型本体(尤其是在生物医学领域)都是采用轻量级的本体语言(如:DL-Lite语言)进行描述的,因此利用图高效的推理特性,可以进一步将决策空间中相应的操作界定在
Figure 264422DEST_PATH_IMAGE002
时间复杂度内,这样也有助于将交互式匹配修复方法扩展到大型本体;此外,根据专家在交互式过程中对匹配做出的各次决策,利用基于图的推理技术完成对未标识匹配的自动更新,从而显著地减少专家判断匹配的次数;
本发明提供的方法基于构建规则将DL-Lite语言描述的本体以及它们的匹配转换到有向图中,采用软化原则预先认定部分“可靠”的匹配,并考虑匹配顺序对专家决策数目的影响来设计基于图的影响函数以寻找最合适的匹配提供给专家判断。
附图说明
图1是本发明方法实施例基于图的交互式本体匹配修复框架图;
图2是本发明方法实施例基于本体及匹配的构建规则所构建的集成图。
具体实施方式
为进一步阐明本申请的技术方案,下面结合附图和具体实施方式,对本申请的实施方式作进一步地详细描述。应当指出的是,以下所述仅是本发明的优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
本实施例以两个会议本体(分别记作
Figure 245015DEST_PATH_IMAGE308
Figure 694319DEST_PATH_IMAGE313
)的知识片段为例,
Figure 858322DEST_PATH_IMAGE308
的知识片段分 别表达为:“元评审意见包含于评审意见”、“具有名字的定义域的取值概念包含于会议”、 “会议包含于常规作者的否定”、“论文摘要包含于会议文档”
Figure 956859DEST_PATH_IMAGE313
的知识片段分别表达为: “论文的作者包含于作者”、“具有名字的定义域的取值概念包含于作者”、“摘要包含于 档”。它们相应的公理描述形式表达如下:
元评审意见 i
Figure 5456DEST_PATH_IMAGE322
评审意见 i 论文的作者 j
Figure 138628DEST_PATH_IMAGE323
作者 j
Figure 213812DEST_PATH_IMAGE324
具有名字
Figure 501443DEST_PATH_IMAGE325
Figure 651933DEST_PATH_IMAGE326
会议 i
Figure 934884DEST_PATH_IMAGE324
具有名字
Figure 410996DEST_PATH_IMAGE327
Figure 920344DEST_PATH_IMAGE323
作者 j
会议 i
Figure 671262DEST_PATH_IMAGE328
Figure 271702DEST_PATH_IMAGE329
常规作者 i 摘要 j
Figure 823775DEST_PATH_IMAGE328
文档 j
论文摘要 i
Figure 446518DEST_PATH_IMAGE328
会议文档 i
它们之间的匹配如下:
匹配 1 =(常规作者 i ,作者 j ,
Figure 437345DEST_PATH_IMAGE330
,0.8)
匹配 2 =(论文的作者 j ,常规作者 i ,
Figure 337299DEST_PATH_IMAGE328
,0.7)
匹配 3 =(
Figure 653749DEST_PATH_IMAGE324
具有名字
Figure 877969DEST_PATH_IMAGE325
,
Figure 236269DEST_PATH_IMAGE324
具有名字
Figure 223685DEST_PATH_IMAGE331
,
Figure 946922DEST_PATH_IMAGE332
,0.8)
匹配 4 =(评审意见 i ,评审意见事件 j ,
Figure 42791DEST_PATH_IMAGE330
,0.6)
匹配 5 =(评审意见事件 j ,元评审意见 i ,
Figure 47525DEST_PATH_IMAGE328
,0.7)
匹配 6 =(会议文档 i ,文档 j ,
Figure 984389DEST_PATH_IMAGE330
,0.7)
匹配 7 =(论文摘要 i ,摘要 j ,
Figure 269457DEST_PATH_IMAGE330
,0.6)
其中匹配中关系“
Figure 698295DEST_PATH_IMAGE330
”、“
Figure 834616DEST_PATH_IMAGE328
”后紧跟的数值(如:0.8)为匹配的置信度。
为更方便地理解本申请,以下列出本申请涉及参数定义:
A为原子概念C转换的节点,B为基础概念D转换的节点,P为原子属性R转换的节点,
Figure 688302DEST_PATH_IMAGE333
为原子属性R的逆操作;
Figure 251877DEST_PATH_IMAGE334
为原子属性R值域的取值概念;
Figure 932126DEST_PATH_IMAGE335
为原子属性R定义域的取值 概念,
Figure 170340DEST_PATH_IMAGE336
为原子属性R的逆操作
Figure 320611DEST_PATH_IMAGE337
转换的节点;
Figure 494234DEST_PATH_IMAGE338
为原子属性R值域的取值概念
Figure 520834DEST_PATH_IMAGE339
转换的 节点,
Figure 500422DEST_PATH_IMAGE340
为原子属性R定义域的取值概念
Figure 702602DEST_PATH_IMAGE341
转换的节点;
Figure 607979DEST_PATH_IMAGE342
Figure 888919DEST_PATH_IMAGE343
分别为基础概念
Figure 899295DEST_PATH_IMAGE344
和基 础概念
Figure 457446DEST_PATH_IMAGE345
转换的节点;
Figure 330462DEST_PATH_IMAGE346
表示基础概念
Figure 36381DEST_PATH_IMAGE347
的否定,基础概念
Figure 793990DEST_PATH_IMAGE347
的否定
Figure 829817DEST_PATH_IMAGE348
转换为节点
Figure 844041DEST_PATH_IMAGE349
Figure 948175DEST_PATH_IMAGE350
Figure 869995DEST_PATH_IMAGE351
为原子属性
Figure 963590DEST_PATH_IMAGE352
和原子属性
Figure 319354DEST_PATH_IMAGE353
转换的节点,
Figure 734286DEST_PATH_IMAGE354
为原子属性
Figure 958332DEST_PATH_IMAGE352
的逆操作
Figure 80003DEST_PATH_IMAGE355
转换的 节点,
Figure 686563DEST_PATH_IMAGE356
为原子属性
Figure 916687DEST_PATH_IMAGE353
的逆操作
Figure 288631DEST_PATH_IMAGE357
转换的节点,
Figure 356819DEST_PATH_IMAGE358
为原子属性
Figure 680484DEST_PATH_IMAGE352
值域的取值概念
Figure 240648DEST_PATH_IMAGE359
转换的节点,
Figure 245644DEST_PATH_IMAGE360
为原子属性
Figure 970935DEST_PATH_IMAGE353
值域的取值概念
Figure 839403DEST_PATH_IMAGE361
转换的节点,
Figure 247382DEST_PATH_IMAGE362
为原子属性
Figure 492287DEST_PATH_IMAGE352
定义域的取值概念
Figure 770953DEST_PATH_IMAGE363
转换的节点,
Figure 669376DEST_PATH_IMAGE364
为原子属性
Figure 463852DEST_PATH_IMAGE353
定义域的取值概念
Figure 76230DEST_PATH_IMAGE365
转换的节 点;
Figure 770254DEST_PATH_IMAGE366
为原子属性
Figure 544306DEST_PATH_IMAGE353
的否定
Figure 566358DEST_PATH_IMAGE367
转换的节点,
Figure 779164DEST_PATH_IMAGE368
为原子属性
Figure 265378DEST_PATH_IMAGE353
的逆操作的否定
Figure 652409DEST_PATH_IMAGE369
转 换的节点,
Figure 991118DEST_PATH_IMAGE370
为原子属性
Figure 240571DEST_PATH_IMAGE371
值域的取值概念的否定
Figure 20440DEST_PATH_IMAGE372
转换的节点,
Figure 697146DEST_PATH_IMAGE373
为原子属性
Figure 257572DEST_PATH_IMAGE371
逆操作后值域的取值概念的否定
Figure 186082DEST_PATH_IMAGE374
转换的节点。
Figure 461204DEST_PATH_IMAGE375
为本体
Figure 279119DEST_PATH_IMAGE005
中的基础概念
Figure 497479DEST_PATH_IMAGE376
转换的节 点,
Figure 590200DEST_PATH_IMAGE377
为本体
Figure 905513DEST_PATH_IMAGE100
中的基础概念
Figure 799388DEST_PATH_IMAGE378
转换的节点。
Figure 396723DEST_PATH_IMAGE379
为本体
Figure 735212DEST_PATH_IMAGE094
中的原子属性
Figure 609759DEST_PATH_IMAGE380
转换的节点,
Figure 629908DEST_PATH_IMAGE382
为本体
Figure 716550DEST_PATH_IMAGE100
中原子属性
Figure 781589DEST_PATH_IMAGE383
转换的节点。
Figure 455979DEST_PATH_IMAGE384
表示本体
Figure 428614DEST_PATH_IMAGE094
中的原子属性
Figure 838605DEST_PATH_IMAGE380
的逆操作
Figure 510763DEST_PATH_IMAGE385
转换的 节点,
Figure 242090DEST_PATH_IMAGE386
表示本体
Figure 782531DEST_PATH_IMAGE100
中的原子属性
Figure 548492DEST_PATH_IMAGE387
的逆操作
Figure 131832DEST_PATH_IMAGE388
转换的节点,
Figure 412772DEST_PATH_IMAGE389
表示本体
Figure 101111DEST_PATH_IMAGE005
中的原 子属性
Figure 220115DEST_PATH_IMAGE380
值域的取值概念
Figure 860175DEST_PATH_IMAGE390
转换的节点,
Figure 64629DEST_PATH_IMAGE391
表示本体
Figure 58124DEST_PATH_IMAGE100
中的原子属性
Figure 111529DEST_PATH_IMAGE387
值域的取值 概念
Figure 860173DEST_PATH_IMAGE392
转换的节点,
Figure 224027DEST_PATH_IMAGE393
表示本体
Figure 909961DEST_PATH_IMAGE394
中的原子属性
Figure 239443DEST_PATH_IMAGE395
定义域的取值概念
Figure 329627DEST_PATH_IMAGE396
转换的节点,
Figure 72455DEST_PATH_IMAGE397
表示本体
Figure 240043DEST_PATH_IMAGE398
中的原子属性
Figure 125829DEST_PATH_IMAGE399
定义域的取值概念
Figure 13013DEST_PATH_IMAGE400
转换的节点。
Figure 679356DEST_PATH_IMAGE401
表示与原子概念C存 在原子属性R关系的概念集合
Figure 552765DEST_PATH_IMAGE402
转换的节点;
Figure 417690DEST_PATH_IMAGE403
表示与原子概念C存在原子属性R的逆 操作关系的概念集合
Figure 944618DEST_PATH_IMAGE404
转换的节点。
实施例1:本实施例提供一种本体匹配修复方法,包括如下步骤:
步骤1:在不损失任何信息的情况下,基于本体转换规则与将DL-Lite语言描述的本体转换到集成图中,并通过基于匹配的构建规则将匹配转换到图中获得相应的匹配弧。
本实施例中步骤1具体包括如下步骤:
步骤1.1:根据本体的转换规则,将本体
Figure 498922DEST_PATH_IMAGE005
Figure 64770DEST_PATH_IMAGE100
各自构建成两个子图
Figure 488929DEST_PATH_IMAGE405
Figure 91818DEST_PATH_IMAGE406
。其中节点
Figure 30955DEST_PATH_IMAGE407
由本体基础概念与原子属性通过转换 规则转换而来的,而边
Figure 338177DEST_PATH_IMAGE408
则表示节点之间的包含于关系。
步骤1.2:利用匹配的转换规则将匹配
Figure 793341DEST_PATH_IMAGE409
转换为匹配弧用来连接两个子图。这里新构建的图称之为集成图,记作
Figure 662071DEST_PATH_IMAGE410
,其中
Figure 321461DEST_PATH_IMAGE411
Figure 605942DEST_PATH_IMAGE412
分别对应子图
Figure 237650DEST_PATH_IMAGE413
Figure 339598DEST_PATH_IMAGE414
中所有的节点与所有的边,
Figure 361650DEST_PATH_IMAGE415
表示匹配弧集合,成为连接子图
Figure 497094DEST_PATH_IMAGE416
Figure 750352DEST_PATH_IMAGE417
的桥梁。
所述本体的转换规则包括:
规则1:对于
Figure 865945DEST_PATH_IMAGE418
中的每个原子概念C,N包含原子概念C转换的节点A;其中k为当前选定的本体下标,i,j分别为各本体的下标,T为公理集合,T k 为当前选定的本体k的公理集合;N为图中由本体基础概念与原子属性通过转换规则转换而来的节点集合;
规则2:对于
Figure 765505DEST_PATH_IMAGE418
中的每个原子属性R,原子属性R转换为节点PN包含 节点P
Figure 126210DEST_PATH_IMAGE020
Figure 732510DEST_PATH_IMAGE419
以及
Figure 176261DEST_PATH_IMAGE022
规则3:对于公理集合T中的每一条概念包含公理
Figure 241081DEST_PATH_IMAGE023
Figure 904012DEST_PATH_IMAGE420
E包含弧
Figure 663021DEST_PATH_IMAGE421
B为基础概念D转换的节点,通常由多个原子概念或者原子概念结合原子属性构 造而成,常用的构造符有
Figure 385995DEST_PATH_IMAGE422
Figure 496033DEST_PATH_IMAGE029
以及
Figure 697077DEST_PATH_IMAGE423
; “
Figure 272109DEST_PATH_IMAGE424
”为“包含于”关系;E为本体内部根据各节点之 间“包含于”关系转换得到的弧的集合;
规则4:对于
Figure 57662DEST_PATH_IMAGE041
中的每一条概念包含公理
Figure 91215DEST_PATH_IMAGE425
Figure 862993DEST_PATH_IMAGE420
E包含弧
Figure 563971DEST_PATH_IMAGE426
,并且
Figure 894327DEST_PATH_IMAGE427
包含节点
Figure 713378DEST_PATH_IMAGE428
Figure 855559DEST_PATH_IMAGE428
表示基础概念
Figure 584611DEST_PATH_IMAGE429
的否定
Figure 679344DEST_PATH_IMAGE430
转换的节点,“
Figure 188954DEST_PATH_IMAGE424
”为“包含于”关系;
规则5:对于T中的每一条角色包含公理
Figure 801070DEST_PATH_IMAGE431
E包含弧
Figure 7798DEST_PATH_IMAGE432
Figure 978159DEST_PATH_IMAGE433
Figure 428861DEST_PATH_IMAGE434
以及
Figure 408450DEST_PATH_IMAGE435
规则6:对于T中的每一条角色包含公理
Figure 204105DEST_PATH_IMAGE436
E 包含弧
Figure 47165DEST_PATH_IMAGE437
Figure 265788DEST_PATH_IMAGE438
Figure 609920DEST_PATH_IMAGE439
Figure 902492DEST_PATH_IMAGE440
,并且N包含节点
Figure 984629DEST_PATH_IMAGE441
Figure 487286DEST_PATH_IMAGE442
Figure 244895DEST_PATH_IMAGE443
以及
Figure 15143DEST_PATH_IMAGE444
所述匹配的转换规则包括:
规则7:对于每一个基础概念匹配
Figure 763787DEST_PATH_IMAGE089
,在匹配弧集合
Figure 393220DEST_PATH_IMAGE092
上增加一条弧
Figure 252723DEST_PATH_IMAGE091
Figure 402776DEST_PATH_IMAGE445
表示本体
Figure 322322DEST_PATH_IMAGE124
中的基础概念
Figure 173472DEST_PATH_IMAGE099
包含于本体
Figure 397518DEST_PATH_IMAGE100
中的基础概念
Figure 847085DEST_PATH_IMAGE101
的置信 度为
Figure 373750DEST_PATH_IMAGE102
,其中
Figure 275978DEST_PATH_IMAGE102
为[0,1]之间的实数值;
规则8:对于每一个基础概念匹配
Figure 309574DEST_PATH_IMAGE103
,在匹配弧集合
Figure 613648DEST_PATH_IMAGE104
上增加一条弧
Figure 45635DEST_PATH_IMAGE105
Figure 996011DEST_PATH_IMAGE103
表示于本体
Figure 938690DEST_PATH_IMAGE106
中的基础概念
Figure 595806DEST_PATH_IMAGE107
包含于本体
Figure 355951DEST_PATH_IMAGE108
中的基础概念
Figure 748885DEST_PATH_IMAGE446
的置信度为
Figure 993790DEST_PATH_IMAGE102
;其中
Figure 803614DEST_PATH_IMAGE102
为[0,1]之间的实数值;
规则9:对于每一个基础概念匹配
Figure 170879DEST_PATH_IMAGE447
,在匹配弧集合
Figure 472679DEST_PATH_IMAGE111
上增加两条弧
Figure 318013DEST_PATH_IMAGE448
Figure 513502DEST_PATH_IMAGE113
Figure 464053DEST_PATH_IMAGE114
表示本体
Figure 610738DEST_PATH_IMAGE449
中的基础概念
Figure 761228DEST_PATH_IMAGE115
与本体
Figure 185125DEST_PATH_IMAGE450
基础概念
Figure 192395DEST_PATH_IMAGE117
是等价关系的置信度为
Figure 701742DEST_PATH_IMAGE102
;其中
Figure 883020DEST_PATH_IMAGE102
为[0,1]之间的实数值;
规则10:对于每一个原子属性匹配
Figure 53101DEST_PATH_IMAGE118
,在匹配弧集合
Figure 667491DEST_PATH_IMAGE111
上增加四条弧
Figure 431179DEST_PATH_IMAGE451
Figure 422006DEST_PATH_IMAGE452
Figure 446594DEST_PATH_IMAGE453
以及
Figure 169568DEST_PATH_IMAGE454
Figure 721684DEST_PATH_IMAGE455
表示本体
Figure 814405DEST_PATH_IMAGE456
中的原子属 性
Figure 395297DEST_PATH_IMAGE457
包含于本体
Figure 525058DEST_PATH_IMAGE151
中原子属性
Figure 620928DEST_PATH_IMAGE458
的置信度为
Figure 625662DEST_PATH_IMAGE102
,其中
Figure 562525DEST_PATH_IMAGE102
为[0,1]之间的实数值;
规则11:对于每一个原子属性匹配
Figure 769514DEST_PATH_IMAGE459
,在匹配弧集合
Figure 729511DEST_PATH_IMAGE111
上增加四条弧
Figure 600252DEST_PATH_IMAGE460
Figure 188360DEST_PATH_IMAGE156
Figure 689617DEST_PATH_IMAGE157
以及
Figure 697762DEST_PATH_IMAGE158
Figure 935977DEST_PATH_IMAGE159
表示本体
Figure 758351DEST_PATH_IMAGE160
中的原子 属性
Figure 994291DEST_PATH_IMAGE128
包含于本体
Figure 552049DEST_PATH_IMAGE108
中的原子属性
Figure 436698DEST_PATH_IMAGE162
的置信度为
Figure 999397DEST_PATH_IMAGE102
;其中
Figure 904774DEST_PATH_IMAGE102
为[0,1]之间的实数值;
规则12:对于每一个属性匹配
Figure 795501DEST_PATH_IMAGE461
,在匹配弧集合
Figure 133773DEST_PATH_IMAGE111
上增加八条弧
Figure 754241DEST_PATH_IMAGE462
Figure 502623DEST_PATH_IMAGE463
Figure 769394DEST_PATH_IMAGE166
Figure 497310DEST_PATH_IMAGE167
Figure 736399DEST_PATH_IMAGE464
Figure DEST_PATH_IMAGE466A
Figure 802487DEST_PATH_IMAGE170
以及
Figure 494237DEST_PATH_IMAGE467
Figure 524379DEST_PATH_IMAGE468
表示本体
Figure 916177DEST_PATH_IMAGE173
中的原子属性
Figure 271941DEST_PATH_IMAGE162
与本 体
Figure 952452DEST_PATH_IMAGE469
中原子属性
Figure 6576DEST_PATH_IMAGE470
是等价关系的置信度为
Figure 456143DEST_PATH_IMAGE102
,其中
Figure 717229DEST_PATH_IMAGE102
为[0,1]之间的实数值;
根据上述规则,将两个会议本体
Figure 914730DEST_PATH_IMAGE173
Figure 647194DEST_PATH_IMAGE469
的公理与匹配转换至有向图中,如图2所 示。
步骤2:初始化集成图修正状态与决策空间,即将本体匹配的标识分为正确匹配弧标识集合和错误匹配弧标识集合,正确匹配弧标识集合和错误匹配弧标识集合共同组成总匹配弧标识集合。修正状态具体描述如下:
一个关于集成图
Figure 387486DEST_PATH_IMAGE471
中弧所对应的修正状态定义为一个三元组
Figure 445572DEST_PATH_IMAGE472
,其中
Figure 605069DEST_PATH_IMAGE473
Figure 46284DEST_PATH_IMAGE474
并且
Figure 204864DEST_PATH_IMAGE475
。如果
Figure 463545DEST_PATH_IMAGE476
,那么基 于图的修正状态是完备的。关于修正状态的闭包记作
Figure 12469DEST_PATH_IMAGE477
,其中
Figure 54112DEST_PATH_IMAGE185
Figure 395095DEST_PATH_IMAGE478
对于
Figure 756500DEST_PATH_IMAGE187
Figure 25677DEST_PATH_IMAGE188
Figure 700372DEST_PATH_IMAGE189
Figure 332079DEST_PATH_IMAGE190
表示集成图中两条不同的匹配弧。
决策空间具体描述如下:
给定一个基于图的修正状态
Figure 778235DEST_PATH_IMAGE479
,其中
Figure 190499DEST_PATH_IMAGE480
。基于图的决策空间
Figure 340989DEST_PATH_IMAGE193
包含一个尚未评估的匹配弧集合
Figure 505166DEST_PATH_IMAGE195
以及两 个二元关系
Figure 276551DEST_PATH_IMAGE197
(蕴含算子)与
Figure 349680DEST_PATH_IMAGE481
(冲突算子),它们分别使得
Figure 740079DEST_PATH_IMAGE200
当且仅当
Figure 644581DEST_PATH_IMAGE201
成立,
Figure 258971DEST_PATH_IMAGE482
当且仅当对于
Figure 273193DEST_PATH_IMAGE241
中的某一条弧
Figure 827802DEST_PATH_IMAGE483
使得
Figure 960712DEST_PATH_IMAGE210
成立。
步骤3:交互式匹配修复过程。当专家对当前待决策匹配弧对应的匹配给出赞同操 作时启动基于决策空间的赞同推理算法,利用所述蕴含算子
Figure 44206DEST_PATH_IMAGE197
、冲突算子
Figure 262566DEST_PATH_IMAGE481
以及当前被专家 赞同的匹配对应的匹配弧,结合正确匹配弧标识集合和错误匹配弧标识集合来完成对剩余 未标识匹配弧集合中匹配弧的状态更新;当专家对当前待决策匹配弧对应的匹配给出否定 操作时启动基于决策空间的否定推理算法,利用所述蕴含算子
Figure 588243DEST_PATH_IMAGE197
、冲突算子
Figure 342704DEST_PATH_IMAGE481
以及当前被专 家否定的匹配对应的匹配弧,结合正确匹配弧标识集合和错误匹配弧标识集合来完成对剩 余未标识匹配弧集合中匹配弧的状态更新;
重复交互式本体匹配修复过程,直至总匹配弧标识集合中的所有匹配弧都被标记,确定最终正确匹配弧标识集合。
本实施例中,所述基于决策空间的赞同推理算法包括:输入为修正状态
Figure 570335DEST_PATH_IMAGE479
、决策空间
Figure 902090DEST_PATH_IMAGE484
和当前被专家赞同的匹配所转换的匹配 弧
Figure 906824DEST_PATH_IMAGE189
,将匹配弧
Figure 404539DEST_PATH_IMAGE189
加入至正确匹配弧标识集合
Figure 970781DEST_PATH_IMAGE485
中;循环遍历剩余未标识匹配弧集合
Figure 22788DEST_PATH_IMAGE242
, 对于剩余未标识匹配弧集合
Figure 660574DEST_PATH_IMAGE242
中各未标识的匹配弧
Figure 882303DEST_PATH_IMAGE190
,利用蕴含算子
Figure 977035DEST_PATH_IMAGE197
确定若匹配弧
Figure 158749DEST_PATH_IMAGE190
包 含于正确匹配弧标识集合
Figure 895499DEST_PATH_IMAGE485
的传递必包中,则说明匹配弧
Figure 712014DEST_PATH_IMAGE189
蕴含匹配弧
Figure 947954DEST_PATH_IMAGE190
,则将匹配弧
Figure 980413DEST_PATH_IMAGE190
自动更新为正确的匹配弧加入正确匹配弧标识集合
Figure 632106DEST_PATH_IMAGE486
中,更新剩余未标识匹配弧集合
Figure 958919DEST_PATH_IMAGE242
;循环遍历错误匹配弧标识集合
Figure 536400DEST_PATH_IMAGE208
中的匹配弧
Figure 755023DEST_PATH_IMAGE487
,对于剩余未标识匹配弧集合中各 未标识的匹配弧
Figure 567996DEST_PATH_IMAGE190
,利用冲突算子
Figure 860568DEST_PATH_IMAGE481
确定若匹配弧
Figure 16741DEST_PATH_IMAGE483
属于
Figure 722660DEST_PATH_IMAGE488
的传递必包中或造成 集成图存在匹配弧之间逻辑冲突,所述逻辑冲突为存在至少1个基础概念D或者原子属性R 为空集,记作
Figure 214690DEST_PATH_IMAGE234
或者
Figure 250517DEST_PATH_IMAGE235
,则将匹配弧
Figure 671265DEST_PATH_IMAGE190
自动更新为错误的匹配弧,加入错误匹配弧标 识集合
Figure 894174DEST_PATH_IMAGE208
中;最后返回更新后的决策空间,同时更新修正状态;
所述基于决策空间的否定推理算法包括:输入为修正状态
Figure 461334DEST_PATH_IMAGE238
、决策 空间
Figure 56394DEST_PATH_IMAGE489
和当前被专家否定的匹配所转换的匹配弧
Figure 271213DEST_PATH_IMAGE490
,首先将匹 配弧
Figure 358249DEST_PATH_IMAGE491
加入至错误匹配弧标识集合
Figure 582294DEST_PATH_IMAGE241
中,其次循环遍历剩余未标识匹配弧集合,对于剩 余未标识匹配弧集合
Figure 31861DEST_PATH_IMAGE242
中各未标识的匹配弧
Figure 292947DEST_PATH_IMAGE190
,利用所述蕴含算子
Figure 750168DEST_PATH_IMAGE197
确定若匹配弧
Figure 889156DEST_PATH_IMAGE189
包含 于
Figure 754082DEST_PATH_IMAGE492
的传递必包中,则说明匹配弧
Figure 15430DEST_PATH_IMAGE190
蕴含匹配弧
Figure 575593DEST_PATH_IMAGE189
,则将匹配弧
Figure 141442DEST_PATH_IMAGE190
自动更新为错误的 匹配弧,加入错误匹配弧标识集合
Figure 565601DEST_PATH_IMAGE208
中;最后返回更新后的决策空间,同时更新修正状 态。
本实施例提供的本体匹配修复方法能在无任何信息的损失情况下将DL-Lite语言描述的本体以及它们的匹配基于构建规则编码到有向图中,由于决策空间上所有的更新操作均是在图上完成的,该算法的复杂度可以界定在
Figure 174349DEST_PATH_IMAGE002
内,较之已有交互式方法更为高效,也有助于将交互式匹配修复方法扩展到大型本体;该方法能高效地利用专家已做出的决策,根据决策空间完成对未标识匹配弧的自动更新。具体来说,由专家赞同匹配所推演出来的匹配会被赞同;而那些能推演出专家拒绝的匹配或者引起图不协调的匹配则会被拒绝,继而减少了专家判断的次数。
实施例2:在实施例1的基础上,本实施例了一种本体匹配修复方法,本实施例的方法框架图如图1所示,初始化集成图的修正状态包括初始化正确匹配弧标识集合,具体包括:将两个本体所有的公理加入正确匹配弧标识集合中,并通过两条软化原则预先认定为可靠的匹配弧加入到正确匹配弧标识集合中,两条软化原则的具体定义如下:
原则1:可靠的匹配弧不应该造成集成图存在匹配弧之间逻辑冲突,所述逻辑冲突 为存在至少1个基础概念D或者原子属性R为空集;需要说明的是,不造成“集成图”存在匹配 弧之间的逻辑冲突,这里的集成图指集成图
Figure 113486DEST_PATH_IMAGE493
或者集成图
Figure 92812DEST_PATH_IMAGE494
,在其他实施例中除了在子图之间添加匹配弧构成匹配弧集合
Figure 870013DEST_PATH_IMAGE111
,还包括根据本体之间 的影响关系在两个子图之间增加影响弧构成影响弧集合
Figure 535481DEST_PATH_IMAGE260
。具体增加影响弧的方法可参 照本申请中其他实施例内容,这里不再赘述。
增加影响弧后,影响弧之间也不能产生逻辑冲突,所述逻辑冲突同样定义为存在至少1个基础概念D或者原子属性R为空集;
原则2:可靠的匹配弧应至少关联1个可靠的匹配弧,意味这两个的匹配弧
Figure 804657DEST_PATH_IMAGE300
和匹配弧
Figure 479352DEST_PATH_IMAGE495
需要相互支持,匹配弧相互支持(即相互关联)定义为:
Figure 128637DEST_PATH_IMAGE496
Figure 73328DEST_PATH_IMAGE303
之间的关系,和
Figure 987058DEST_PATH_IMAGE304
Figure 308187DEST_PATH_IMAGE305
之间的关系相同;
Figure 92603DEST_PATH_IMAGE319
由规则1转换而来的节点,
Figure 208195DEST_PATH_IMAGE306
Figure 848036DEST_PATH_IMAGE307
分别为本体
Figure 474321DEST_PATH_IMAGE308
中的基础概念
Figure 815041DEST_PATH_IMAGE309
Figure 258792DEST_PATH_IMAGE310
转换的节点,
Figure 989856DEST_PATH_IMAGE311
Figure 777421DEST_PATH_IMAGE312
分别为本体
Figure 739692DEST_PATH_IMAGE313
中的基础概念
Figure 722386DEST_PATH_IMAGE314
Figure 566846DEST_PATH_IMAGE315
转换的节点,匹配弧
Figure 361364DEST_PATH_IMAGE497
Figure 348781DEST_PATH_IMAGE498
则是由规则7或者规则9转换而来。
该实施例的原始匹配和经两条软化原则处理后的匹配如表1所示。通过原则1可知匹配(常规作者 i ,作者 j ,
Figure 134334DEST_PATH_IMAGE499
,0.8)与(
Figure 167887DEST_PATH_IMAGE500
具有名字
Figure 674086DEST_PATH_IMAGE501
,
Figure 912081DEST_PATH_IMAGE500
具有名字
Figure 711279DEST_PATH_IMAGE502
,
Figure 795909DEST_PATH_IMAGE499
,0.8)是不可靠的匹配,因为它们会引起本体的不协调性。相对而言,(会议文档 i ,文档 j ,
Figure 932230DEST_PATH_IMAGE499
,0.7)与(论文摘要 i , j ,
Figure 395704DEST_PATH_IMAGE499
,0.6)中的概念在对应的本体中存在(论文摘要 i
Figure 21595DEST_PATH_IMAGE503
会议文档 i )与(摘要 j
Figure 453843DEST_PATH_IMAGE503
文档 j )的公理声明,可以得知这两个匹配相互支持。此外,它们不会造成集成图
Figure 629740DEST_PATH_IMAGE504
或者集成图
Figure 836468DEST_PATH_IMAGE505
匹配弧之间逻辑冲突。因此它们同时满足上述两条软化原则,均为可靠的匹配。
表1 该实施例的原始匹配和经步骤3处理后的匹配
Figure 10092DEST_PATH_IMAGE506
本实施例通过增加影响弧并采用软化原则预先认定部分“可靠”匹配,显著减少专家判断匹配的次数。
实施例3:在实施例2的基础上,本实施例中,可选地还包括:根据本体之间的影响 关系在两个子图之间增加影响弧,所述影响弧构成影响弧集合
Figure 36691DEST_PATH_IMAGE507
,所述影响弧记作
Figure 16280DEST_PATH_IMAGE251
,增加影响弧后的集成图表示为
Figure 952881DEST_PATH_IMAGE508
;所述扩展规则包括:
扩展规则1:对于每一个概念包含公理
Figure 660855DEST_PATH_IMAGE254
,节点的集合N包含节点AB
Figure 817161DEST_PATH_IMAGE255
Figure 833396DEST_PATH_IMAGE509
Figure 516181DEST_PATH_IMAGE257
,弧的集合E包含弧
Figure 264563DEST_PATH_IMAGE258
Figure 469017DEST_PATH_IMAGE259
,影响弧集合
Figure 587146DEST_PATH_IMAGE260
包含
Figure 226901DEST_PATH_IMAGE261
以及
Figure 37862DEST_PATH_IMAGE262
扩展规则2:对于每一个概念包含公理
Figure 401716DEST_PATH_IMAGE269
,节点的集合N包含节点AB
Figure 822071DEST_PATH_IMAGE270
Figure 151552DEST_PATH_IMAGE510
Figure 241737DEST_PATH_IMAGE511
,弧的集合E包含弧
Figure 984565DEST_PATH_IMAGE512
Figure 152153DEST_PATH_IMAGE513
,影响弧集合
Figure 772359DEST_PATH_IMAGE275
包含
Figure 659543DEST_PATH_IMAGE514
以及
Figure 997990DEST_PATH_IMAGE515
确定当前待决策匹配弧的方法包括:从剩余未标识匹配弧集合中选取综合影响函 数值最大的匹配弧作为当前待决策匹配弧
Figure 261612DEST_PATH_IMAGE281
,将所述当前待决策匹配弧对应的匹配提供给 专家进行决策,所述综合影响函数值的计算方法如下:
Figure 736324DEST_PATH_IMAGE282
其中
Figure 779365DEST_PATH_IMAGE283
表示赞同影响,
Figure 965627DEST_PATH_IMAGE284
表示否定影响,
Figure 406842DEST_PATH_IMAGE285
Figure 831001DEST_PATH_IMAGE286
Figure 558523DEST_PATH_IMAGE516
表示通过运算
Figure 871562DEST_PATH_IMAGE288
Figure 680249DEST_PATH_IMAGE289
Figure 260047DEST_PATH_IMAGE290
得到并且属于匹配弧集合
Figure 535301DEST_PATH_IMAGE177
的匹配弧的数 量;其中
Figure 460270DEST_PATH_IMAGE291
表示执行蕴含算子的操作,记作
Figure 807069DEST_PATH_IMAGE292
Figure 376459DEST_PATH_IMAGE289
表示执行蕴含算子的操作,记作
Figure 711363DEST_PATH_IMAGE517
Figure 234880DEST_PATH_IMAGE294
执行冲突算子,记作
Figure 409204DEST_PATH_IMAGE295
Figure 662461DEST_PATH_IMAGE296
为剩余未标识匹配弧集合
Figure 778054DEST_PATH_IMAGE297
中的匹配弧。
本实施例中,将具有最大影响的匹配弧提供给专家进行决策,定义综合影响函数来度量每个匹配在未决策之前的影响,匹配的影响主要包括基于该匹配所推演出来的匹配数量以及与它冲突匹配的匹配数量。在每次交互过程中,影响力最大的匹配将提供给专家来做出决定。如果匹配的关系是等价的,那么需要将其切分成两条匹配弧,再将这两者的影响力相加。本实施例考虑了匹配顺序对专家决策数目的影响,设计基于图的影响函数以寻找最合适的匹配提供给专家判断,从而进一步减少专家判断的次数。同时,该影响函数能动态地调节匹配的序列,较之静态影响函数的性能更好。
值得注意的是,具有最大影响的匹配弧并不一定是唯一的,可以通过匹配的权重进行进一步筛选。若匹配弧的综合影响等同于赞同影响,则选取权重最高的匹配弧,否则,选取权重最低的匹配弧。
本实施例中各次交互结果及自动更新结果如表2所示。第一列展示了交互的次数;第二列展示了由动态计算所得的各个匹配影响值,每次交互选取具有最大影响且未被标识的匹配弧提供给专家进行决策(在表格中已加粗显示);第三列给出了专家的决策;最后两列分别展示了每次循环中推理得到的匹配以及未标识的匹配。除去步骤2中软化原则预先认定的2个匹配,本实施例中需要专家决策的共有5个匹配,其中有2个匹配是专家判定的,其余3个均是通过基于决策空间的赞同推理算法、基于决策空间的否定推理算法自动决策的。
表2本实施例中各次交互结果及自动更新结果
Figure 677615DEST_PATH_IMAGE518
返回修复后的正确匹配。
作为本发明的一种改进方案,对于步骤4中匹配弧转换为匹配的具体方式为:对于匹配弧
Figure 366216DEST_PATH_IMAGE519
,若
Figure 910199DEST_PATH_IMAGE520
形如
Figure 88370DEST_PATH_IMAGE521
Figure 153190DEST_PATH_IMAGE522
形如
Figure 816122DEST_PATH_IMAGE523
,则转换为
Figure 575130DEST_PATH_IMAGE524
的形式,否则转换为
Figure 563684DEST_PATH_IMAGE525
的形式,其中
Figure 611405DEST_PATH_IMAGE526
为匹配弧的置信度,若同时存在
Figure 202661DEST_PATH_IMAGE527
Figure 473235DEST_PATH_IMAGE528
或者
Figure 196472DEST_PATH_IMAGE529
Figure 26762DEST_PATH_IMAGE530
,则统一转换为
Figure 532961DEST_PATH_IMAGE531
或者
Figure 765097DEST_PATH_IMAGE532
本实施例中修复后的正确匹配弧有<常规作者 i ,作者 j >,<作者 j ,常规作者 i >,< 文的作者 j ,常规作者 i >,<会议文档 i ,文档 j >,<文档 j ,会议文档 i >,<论文摘要 i ,摘要 j >,< j ,论文摘要 i >,可通过进步方案转换为原始匹配(常规作者 i ,作者 j ,
Figure 659235DEST_PATH_IMAGE533
,0.8),(论文的作 j ,常规作者 i ,
Figure 648925DEST_PATH_IMAGE534
,0.7),(会议文档 i ,文档 j ,
Figure 791106DEST_PATH_IMAGE533
,0.7),(论文摘要 i ,摘要 j ,
Figure 785737DEST_PATH_IMAGE533
,0.6)并进行 返回。
本发明提供的方法能在无任何信息损失下完成轻量级本体DL-Lite之间匹配的交互式修复。方法基于构建规则将DL-Lite语言描述的本体以及它们的匹配编码到有向图中,采用软化原则预先认定部分“可靠”的匹配,并考虑匹配顺序对专家决策数目的影响来设计基于图的影响函数以寻找最合适的匹配提供给专家判断。此外,根据专家在交互式过程中对匹配做出的各次决策,利用基于图的推理技术完成对未标识匹配的自动更新,从而显著地减少专家判断匹配的次数。
通过在国际本体匹配竞赛OAEI所关联的本体匹配修复任务的具体实验表明,该方法在节省专家的决策数目上是有效的,且优于已有的交互式匹配修复方法。
与以上实施例提供的一种本体匹配修复方法相对应地,本发明实施例还提供了一种本体匹配修复系统,其特征在于,包括:集成图构建模块、初始化模块、专家标识模块以及交互式本体匹配修复模块;
所述集成图构建模块,用于将各个本体转换成该本体对应的图,将本体匹配转换为匹配弧,利用所述匹配弧连接两个子图形成一个集成图;
所述初始化模块,用于初始化集成图的修正状态与决策空间,所述修正状态包括弧和匹配弧,所述匹配弧分为正确匹配弧标识集合和错误匹配弧标识集合;所述决策空间包括由修正状态计算得到的剩余未标识匹配弧集合、集成图推理的蕴含算子
Figure 21416DEST_PATH_IMAGE535
与冲突算子
Figure 826298DEST_PATH_IMAGE536
所述专家标识模块,用于专家对当前待决策匹配弧对应的匹配给出赞同或否定操作;
所述交互式本体匹配修复模块,用于在交互式本体匹配修复过程中,当专家对当前待决策匹配弧对应的匹配给出赞同操作或者否定操作时分别启动基于决策空间的赞同推理算法或者基于决策空间的否定推理算法,对剩余未标识匹配弧集合中匹配弧进行标记;重复交互式本体匹配修复过程,直至所有匹配弧都被标记,确定最终正确匹配弧标识集合。
进一步地,所述本体匹配修复系统还包括:待决策匹配弧确定模块,所述待决策匹配弧确定模块用于确定当前待决策匹配弧,具体执行的方法包括:从剩余未标识匹配弧集合中选取综合影响函数值最大的匹配弧作为当前待决策匹配弧
Figure 2196DEST_PATH_IMAGE537
,将所述当前待决策匹配弧对应的匹配提供给专家进行决策,所述综合影响函数值的计算方法如下:
Figure 349869DEST_PATH_IMAGE282
其中
Figure 851389DEST_PATH_IMAGE283
表示赞同影响,
Figure 278654DEST_PATH_IMAGE284
表示否定影响,
Figure 553515DEST_PATH_IMAGE285
Figure 53898DEST_PATH_IMAGE538
Figure 631379DEST_PATH_IMAGE516
表示通过运算
Figure 912318DEST_PATH_IMAGE288
Figure 194133DEST_PATH_IMAGE289
Figure 991100DEST_PATH_IMAGE290
得到并且属于匹配弧集合
Figure 631159DEST_PATH_IMAGE177
的匹配弧的数 量;其中
Figure 835614DEST_PATH_IMAGE291
表示执行蕴含算子的操作,记作
Figure 829108DEST_PATH_IMAGE292
Figure 599356DEST_PATH_IMAGE289
表示执行蕴含算子的操作,记作
Figure 518639DEST_PATH_IMAGE517
Figure 774171DEST_PATH_IMAGE294
执行冲突算子,记作
Figure 821891DEST_PATH_IMAGE295
Figure 213690DEST_PATH_IMAGE296
为剩余未标识匹配弧集合
Figure 631770DEST_PATH_IMAGE297
中的匹配弧。
在整个交互的过程中,通过待决策匹配弧确定模块从总匹配标识集合中选取具有最大影响且未被标识的匹配弧提供给专家进行决策。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种本体匹配修复方法,其特征在于,包括:将各个本体转换成该本体对应的图,所述本体对应的图包括由本体基础概念与原子属性通过转换规则转换而来的节点,以及该本体内部根据各本体基础概念与原子属性之间包含于关系转换得到的弧;所述集成图表示为
Figure 226378DEST_PATH_IMAGE001
,其中N为节点集合,E为弧的集合,
Figure 262467DEST_PATH_IMAGE002
为匹配弧集合,弧与匹配弧的表示均记作
Figure 216517DEST_PATH_IMAGE003
,其中
Figure 400373DEST_PATH_IMAGE004
为集成图中的节点,
Figure 504596DEST_PATH_IMAGE005
将本体匹配转换为匹配弧,利用所述匹配弧连接两个子图形成一个集成图;初始化集成图的修正状态与决策空间,所述修正状态包括弧和匹配弧,所述匹配弧分为正确匹配弧标识集合和错误匹配弧标识集合;所述决策空间包括由修正状态计算得到的剩余未标识匹配弧集合、集成图推理的蕴含算子
Figure 191929DEST_PATH_IMAGE006
与冲突算子
Figure 582459DEST_PATH_IMAGE007
在交互式本体匹配修复过程中,当专家对当前待决策匹配弧对应的匹配给出赞同操作或者否定操作时分别启动基于决策空间的赞同推理算法或者基于决策空间的否定推理算法,对剩余未标识匹配弧集合中的匹配弧进行标记;
重复交互式本体匹配修复过程,直至所有匹配弧都被标记,确定最终正确匹配弧标识集合。
2.根据权利要求1所述的一种本体匹配修复方法,其特征在于,根据本体转换规则将各个本体转换成该本体对应的图,所述本体转换规则包括:
规则1:对于公理集合T中的每个原子概念C,将原子概念C转换为节点A,节点集合N包含节点A,其中公理集合T
Figure 925716DEST_PATH_IMAGE008
k为当前选定的本体下标,i,j分别为各本体的下标,T k 为当前选定的本体k的公理集合;
规则2:对于公理集合T中的每个原子属性R
Figure 895946DEST_PATH_IMAGE009
为原子属性R的逆操作;
Figure 765681DEST_PATH_IMAGE010
为原子属性R值域的取值概念;
Figure 202479DEST_PATH_IMAGE011
为原子属性R定义域的取值概念,将原子属性R转换为节点P,将原子属性R的逆操作
Figure 95349DEST_PATH_IMAGE009
转换为节点
Figure 666007DEST_PATH_IMAGE012
;将原子属性R值域的取值概念
Figure 37DEST_PATH_IMAGE013
转换为节点
Figure 732369DEST_PATH_IMAGE014
,将原子属性R定义域的取值概念
Figure 118394DEST_PATH_IMAGE015
转换为节点
Figure 102531DEST_PATH_IMAGE016
N包含节点P
Figure 681280DEST_PATH_IMAGE017
Figure 787776DEST_PATH_IMAGE018
以及
Figure 327342DEST_PATH_IMAGE019
规则3:对于公理集合T中的每一条基础概念包含公理
Figure 239803DEST_PATH_IMAGE020
,弧的集合E包含弧
Figure 876321DEST_PATH_IMAGE021
Figure 825822DEST_PATH_IMAGE022
分别为基础概念
Figure 977318DEST_PATH_IMAGE023
和基础概念
Figure 303257DEST_PATH_IMAGE024
转换的节点,“
Figure 794281DEST_PATH_IMAGE025
”为“包含于”关系;
规则4:对于公理集合T中的每一条基础概念包含公理
Figure 39318DEST_PATH_IMAGE026
,弧的集合E包含弧
Figure 819055DEST_PATH_IMAGE027
Figure 11002DEST_PATH_IMAGE028
表示基础概念
Figure 153270DEST_PATH_IMAGE029
的否定
Figure 975733DEST_PATH_IMAGE030
转换的节点;
规则5:对于公理集合T中的每一条角色包含公理
Figure 39504DEST_PATH_IMAGE031
,弧的集合E包含弧
Figure 831879DEST_PATH_IMAGE032
Figure 704020DEST_PATH_IMAGE033
Figure 822018DEST_PATH_IMAGE034
以及
Figure 45189DEST_PATH_IMAGE035
Figure 578938DEST_PATH_IMAGE036
Figure 695799DEST_PATH_IMAGE037
分别为原子属性
Figure 860064DEST_PATH_IMAGE038
转换的节点和原子属性
Figure 429586DEST_PATH_IMAGE039
转换的节点,
Figure 761167DEST_PATH_IMAGE040
为原子属性
Figure 139058DEST_PATH_IMAGE041
的逆操作
Figure 270962DEST_PATH_IMAGE042
转换的节点,
Figure 593359DEST_PATH_IMAGE043
为原子属性
Figure 406595DEST_PATH_IMAGE044
的逆操作
Figure 701310DEST_PATH_IMAGE045
转换的节点,
Figure 800853DEST_PATH_IMAGE046
为原子属性
Figure 751491DEST_PATH_IMAGE047
值域的取值概念
Figure 430734DEST_PATH_IMAGE048
转换的节点,
Figure 376693DEST_PATH_IMAGE049
为原子属性
Figure 788083DEST_PATH_IMAGE050
值域的取值概念
Figure 85072DEST_PATH_IMAGE051
转换的节点,
Figure 974531DEST_PATH_IMAGE052
为原子属性
Figure 509417DEST_PATH_IMAGE053
定义域的取值概念
Figure 950763DEST_PATH_IMAGE054
转换的节点,
Figure 672731DEST_PATH_IMAGE055
为原子属性
Figure 365881DEST_PATH_IMAGE056
定义域的取值概念
Figure 552012DEST_PATH_IMAGE057
转换的节点;
规则6:对于公理集合T中的每一条角色包含公理
Figure 305204DEST_PATH_IMAGE058
,弧的集合E包含弧
Figure 514468DEST_PATH_IMAGE059
Figure 870363DEST_PATH_IMAGE060
Figure 786367DEST_PATH_IMAGE061
Figure 38357DEST_PATH_IMAGE062
Figure 531655DEST_PATH_IMAGE063
为原子属性
Figure 832186DEST_PATH_IMAGE064
的否定
Figure 670872DEST_PATH_IMAGE065
转换的节点,
Figure 156080DEST_PATH_IMAGE066
为原子属性
Figure 12041DEST_PATH_IMAGE067
的逆操作的否定
Figure 913001DEST_PATH_IMAGE068
转换的节点,
Figure 928230DEST_PATH_IMAGE069
为原子属性
Figure 194126DEST_PATH_IMAGE050
值域的取值概念的否定
Figure 599700DEST_PATH_IMAGE070
转换的节点,
Figure 366668DEST_PATH_IMAGE071
为原子属性
Figure 111770DEST_PATH_IMAGE072
逆操作后值域的取值概念的否定
Figure 673201DEST_PATH_IMAGE073
转换的节点。
3.根据权利要求2所述的一种本体匹配修复方法,其特征在于,利用匹配的转换规则将本体匹配转换为匹配弧,所述匹配的转换规则包括:
规则7:对于每一个基础概念匹配
Figure 566071DEST_PATH_IMAGE074
,在匹配弧集合
Figure 480937DEST_PATH_IMAGE075
上增加一条弧
Figure 470759DEST_PATH_IMAGE076
Figure 406354DEST_PATH_IMAGE077
为本体
Figure 458623DEST_PATH_IMAGE078
中的基础概念
Figure 567394DEST_PATH_IMAGE079
转换的节点,
Figure 614984DEST_PATH_IMAGE080
为本体
Figure 393584DEST_PATH_IMAGE081
中的基础概念
Figure 261046DEST_PATH_IMAGE082
转换的节点,
Figure 173507DEST_PATH_IMAGE083
表示本体
Figure 75604DEST_PATH_IMAGE084
中的基础概念
Figure 353002DEST_PATH_IMAGE085
包含于本体
Figure 379864DEST_PATH_IMAGE086
中的基础概念
Figure 316856DEST_PATH_IMAGE087
的置信度为
Figure 807881DEST_PATH_IMAGE088
规则8:对于每一个基础概念匹配
Figure 318496DEST_PATH_IMAGE089
,在匹配弧集合
Figure 832654DEST_PATH_IMAGE090
上增加一条弧
Figure 24601DEST_PATH_IMAGE091
Figure 432449DEST_PATH_IMAGE089
表示于本体
Figure 989332DEST_PATH_IMAGE092
中的基础概念
Figure 53103DEST_PATH_IMAGE093
包含于本体
Figure 845479DEST_PATH_IMAGE094
中的基础概念
Figure 311095DEST_PATH_IMAGE095
的置信度为
Figure 38880DEST_PATH_IMAGE088
规则9:对于每一个基础概念匹配
Figure 386684DEST_PATH_IMAGE096
,在匹配弧集合
Figure 186013DEST_PATH_IMAGE097
上增加两条弧与
Figure 771715DEST_PATH_IMAGE098
Figure 670401DEST_PATH_IMAGE099
Figure 708764DEST_PATH_IMAGE100
表示本体
Figure 311784DEST_PATH_IMAGE094
中的基础概念
Figure 548730DEST_PATH_IMAGE101
与本体
Figure 946213DEST_PATH_IMAGE102
基础概念
Figure 143977DEST_PATH_IMAGE103
是等价关系的置信度为
Figure 81846DEST_PATH_IMAGE088
规则10:对于每一个原子属性匹配
Figure 382420DEST_PATH_IMAGE104
,在匹配弧集合
Figure 357329DEST_PATH_IMAGE097
上增加四条弧
Figure 432602DEST_PATH_IMAGE105
Figure 111845DEST_PATH_IMAGE106
Figure 526645DEST_PATH_IMAGE107
以及
Figure 672456DEST_PATH_IMAGE108
Figure 172707DEST_PATH_IMAGE109
为本体
Figure 921221DEST_PATH_IMAGE084
中的原子属性
Figure 987266DEST_PATH_IMAGE110
转换的节点,
Figure 569557DEST_PATH_IMAGE111
本体
Figure 291525DEST_PATH_IMAGE112
中原子属性
Figure 374887DEST_PATH_IMAGE113
转换的节点,
Figure 99699DEST_PATH_IMAGE114
表示本体
Figure 446367DEST_PATH_IMAGE115
中的原子属性
Figure 186790DEST_PATH_IMAGE116
的逆操作
Figure 11526DEST_PATH_IMAGE117
转换的节点,
Figure 927530DEST_PATH_IMAGE118
表示本体
Figure 179520DEST_PATH_IMAGE119
中原子属性
Figure 938397DEST_PATH_IMAGE120
的逆操作
Figure 301245DEST_PATH_IMAGE121
转换的节点,
Figure 71755DEST_PATH_IMAGE122
表示本体
Figure 291384DEST_PATH_IMAGE084
中的原子属性
Figure 475241DEST_PATH_IMAGE123
值域的取值概念
Figure 313884DEST_PATH_IMAGE124
转换的节点,
Figure 272655DEST_PATH_IMAGE125
表示本体
Figure 928765DEST_PATH_IMAGE126
中原子属性
Figure 6442DEST_PATH_IMAGE127
值域的取值概念
Figure 711093DEST_PATH_IMAGE128
转换的节点,
Figure 580829DEST_PATH_IMAGE129
表示本体
Figure 345523DEST_PATH_IMAGE094
中原子属性
Figure 910496DEST_PATH_IMAGE116
定义域的取值概念
Figure 481155DEST_PATH_IMAGE130
转换的节点,
Figure 408659DEST_PATH_IMAGE131
表示本体
Figure 281937DEST_PATH_IMAGE081
中原子属性
Figure 396524DEST_PATH_IMAGE132
定义域的取值概念
Figure 505294DEST_PATH_IMAGE133
转换的节点;
Figure 224989DEST_PATH_IMAGE134
表示本体
Figure 128223DEST_PATH_IMAGE094
中的原子属性
Figure 730105DEST_PATH_IMAGE135
包含于本体
Figure 252353DEST_PATH_IMAGE136
中原子属性
Figure 951188DEST_PATH_IMAGE137
的置信度为
Figure 228586DEST_PATH_IMAGE088
规则11:对于每一个原子属性匹配
Figure 521027DEST_PATH_IMAGE138
,在匹配弧集合
Figure 909283DEST_PATH_IMAGE139
上增加四条弧
Figure 462624DEST_PATH_IMAGE140
Figure 848606DEST_PATH_IMAGE141
Figure 425081DEST_PATH_IMAGE142
以及
Figure 696923DEST_PATH_IMAGE143
Figure 308032DEST_PATH_IMAGE144
表示本体
Figure 599337DEST_PATH_IMAGE145
中的原子属性
Figure 725424DEST_PATH_IMAGE113
包含于本体
Figure 721062DEST_PATH_IMAGE094
中的原子属性
Figure 124362DEST_PATH_IMAGE146
的置信度为
Figure 914463DEST_PATH_IMAGE088
规则12:对于每一个原子属性匹配
Figure 262268DEST_PATH_IMAGE147
,在匹配弧集合
Figure 999280DEST_PATH_IMAGE097
上增加八条弧
Figure 319403DEST_PATH_IMAGE148
Figure 77143DEST_PATH_IMAGE149
Figure 53189DEST_PATH_IMAGE150
Figure 390630DEST_PATH_IMAGE151
Figure 361997DEST_PATH_IMAGE152
Figure DEST_PATH_IMAGE153
Figure 493901DEST_PATH_IMAGE154
以及
Figure 816298DEST_PATH_IMAGE155
Figure 957429DEST_PATH_IMAGE156
表示本体
Figure 658669DEST_PATH_IMAGE157
中的原子属性
Figure 289370DEST_PATH_IMAGE146
与本体
Figure 36747DEST_PATH_IMAGE158
中原子属性
Figure 653673DEST_PATH_IMAGE159
是等价关系的置信度为
Figure 802894DEST_PATH_IMAGE088
4.根据权利要求3所述的一种本体匹配修复方法,其特征在于,
所述集成图的修正状态表示为三元组
Figure 344777DEST_PATH_IMAGE160
,其中
Figure 517133DEST_PATH_IMAGE161
为正确匹配弧标识集合,
Figure 67DEST_PATH_IMAGE162
为错误匹配弧标识集合,
Figure 66112DEST_PATH_IMAGE163
Figure 976299DEST_PATH_IMAGE164
并且
Figure 635950DEST_PATH_IMAGE165
;如果
Figure 656996DEST_PATH_IMAGE166
,那么基于集成图的修正状态是完备的;修正状态的闭包记作
Figure 843126DEST_PATH_IMAGE167
其中
Figure 330740DEST_PATH_IMAGE168
,它表示基于正确匹配弧标识集合进行集成图的传递必包操作;
Figure 540004DEST_PATH_IMAGE169
对于
Figure 427058DEST_PATH_IMAGE170
Figure 77482DEST_PATH_IMAGE171
,它表示基于错误匹配弧标识集合进行集成图的传递必包操作,
Figure 595051DEST_PATH_IMAGE172
Figure 822770DEST_PATH_IMAGE173
为匹配弧集合
Figure 185618DEST_PATH_IMAGE174
中匹配弧的通用表示,
Figure 221707DEST_PATH_IMAGE175
Figure 644598DEST_PATH_IMAGE176
为两条不同的匹配弧,
Figure 625192DEST_PATH_IMAGE177
表示根据集合执行集成图的传递必包操作,
Figure 463835DEST_PATH_IMAGE178
泛指集成图中弧或者匹配弧集合,
Figure 416748DEST_PATH_IMAGE179
表示根据集合
Figure 72857DEST_PATH_IMAGE180
执行集成图的传递必包操作;
当修正状态呈现闭包状态不再发生改变时,则基于决策空间的交互式本体匹配修复过程完成。
5.根据权利要求4所述的一种本体匹配修复方法,其特征在于,所述集成图的决策空间表示为:
Figure 478431DEST_PATH_IMAGE181
其中
Figure 120765DEST_PATH_IMAGE182
表示剩余未标识匹配弧集合,
Figure 719062DEST_PATH_IMAGE183
,“
Figure 483756DEST_PATH_IMAGE184
”表示集合的差集操作,
所述蕴含算子
Figure 314308DEST_PATH_IMAGE185
的定义为:若匹配弧
Figure 88229DEST_PATH_IMAGE186
蕴含匹配弧
Figure 750155DEST_PATH_IMAGE187
,记作
Figure 482488DEST_PATH_IMAGE188
,当且仅当
Figure 800336DEST_PATH_IMAGE189
成立;
所述冲突算子
Figure 112369DEST_PATH_IMAGE190
的定义为:若匹配弧
Figure 425539DEST_PATH_IMAGE191
与匹配弧
Figure 797614DEST_PATH_IMAGE192
冲突,记作
Figure 602759DEST_PATH_IMAGE193
当且仅当对于错误匹配弧标识集合
Figure 452904DEST_PATH_IMAGE194
中的某一条匹配弧
Figure 886159DEST_PATH_IMAGE195
使得
Figure 101240DEST_PATH_IMAGE196
成立,
Figure 455998DEST_PATH_IMAGE197
为匹配弧集合
Figure 906570DEST_PATH_IMAGE198
中匹配弧的通用表示,匹配弧
Figure 69699DEST_PATH_IMAGE199
为与匹配弧
Figure 783577DEST_PATH_IMAGE191
和匹配弧
Figure 422368DEST_PATH_IMAGE192
不同的匹配弧。
6.根据权利要求5所述的一种本体匹配修复方法,其特征在于,
所述基于决策空间的赞同推理算法包括:输入为修正状态
Figure 879894DEST_PATH_IMAGE200
、决策空间
Figure 163108DEST_PATH_IMAGE201
和当前被专家赞同的匹配所转换的匹配弧
Figure 782308DEST_PATH_IMAGE202
,将匹配弧
Figure 648676DEST_PATH_IMAGE203
加入至正确匹配弧标识集合
Figure 581997DEST_PATH_IMAGE204
中;循环遍历剩余未标识匹配弧集合
Figure 47614DEST_PATH_IMAGE205
,对于剩余未标识匹配弧集合
Figure 634453DEST_PATH_IMAGE206
中各未标识的匹配弧
Figure 123203DEST_PATH_IMAGE207
,利用蕴含算子
Figure 656953DEST_PATH_IMAGE006
确定若匹配弧
Figure 39392DEST_PATH_IMAGE208
包含于正确匹配弧标识集合
Figure 265974DEST_PATH_IMAGE204
的传递必包中,则说明匹配弧
Figure 242021DEST_PATH_IMAGE209
蕴含匹配弧
Figure 313882DEST_PATH_IMAGE210
,则将匹配弧
Figure 550828DEST_PATH_IMAGE211
自动更新为正确的匹配弧加入正确匹配弧标识集合
Figure 620415DEST_PATH_IMAGE212
中,更新剩余未标识匹配弧集合
Figure 146075DEST_PATH_IMAGE213
;循环遍历错误匹配弧标识集合
Figure 818364DEST_PATH_IMAGE214
中的匹配弧
Figure 50763DEST_PATH_IMAGE215
,对于剩余未标识匹配弧集合中各未标识的匹配弧
Figure 415885DEST_PATH_IMAGE208
,利用冲突算子
Figure 163261DEST_PATH_IMAGE216
确定若匹配弧
Figure 780187DEST_PATH_IMAGE217
属于
Figure 726146DEST_PATH_IMAGE218
的传递必包中或造成集成图存在匹配弧之间逻辑冲突,所述逻辑冲突为存在至少1个基础概念D或者原子属性R为空集,记作
Figure 465432DEST_PATH_IMAGE219
或者
Figure 372208DEST_PATH_IMAGE220
,则将匹配弧
Figure 651880DEST_PATH_IMAGE221
自动更新为错误的匹配弧,加入错误匹配弧标识集合
Figure 921187DEST_PATH_IMAGE222
中;最后返回更新后的决策空间,同时更新修正状态;
所述基于决策空间的否定推理算法包括:输入为修正状态
Figure 503478DEST_PATH_IMAGE223
、决策空间
Figure 305342DEST_PATH_IMAGE224
和当前被专家否定的匹配所转换的匹配弧
Figure 326387DEST_PATH_IMAGE225
,首先将匹配弧
Figure 856726DEST_PATH_IMAGE225
加入至错误匹配弧标识集合
Figure 131DEST_PATH_IMAGE194
中,其次循环遍历剩余未标识匹配弧集合,对于剩余未标识匹配弧集合
Figure 209396DEST_PATH_IMAGE226
中各未标识的匹配弧
Figure 971815DEST_PATH_IMAGE227
,利用所述蕴含算子
Figure 746873DEST_PATH_IMAGE006
确定若匹配弧
Figure 733284DEST_PATH_IMAGE228
包含于
Figure 367528DEST_PATH_IMAGE229
的传递必包中,则说明匹配弧
Figure 527113DEST_PATH_IMAGE230
蕴含匹配弧
Figure 625519DEST_PATH_IMAGE231
,则将匹配弧
Figure 454935DEST_PATH_IMAGE232
自动更新为错误的匹配弧,加入错误匹配弧标识集合
Figure 904371DEST_PATH_IMAGE233
中;最后返回更新后的决策空间,同时更新修正状态。
7.根据权利要求6所述的一种本体匹配修复方法,其特征在于,基于扩展规则,根据本体之间的影响关系在两个子图之间增加影响弧,所述影响弧构成影响弧集合
Figure 602069DEST_PATH_IMAGE234
,所述影响弧记作
Figure 289402DEST_PATH_IMAGE235
,增加影响弧后的集成图表示为
Figure 945511DEST_PATH_IMAGE236
所述扩展规则包括:
扩展规则1:对于每一个概念包含公理
Figure 23189DEST_PATH_IMAGE237
,节点集合N包含节点AB
Figure 993419DEST_PATH_IMAGE238
Figure 863155DEST_PATH_IMAGE239
Figure 627848DEST_PATH_IMAGE240
,弧的集合E包含弧
Figure 458401DEST_PATH_IMAGE241
Figure 966743DEST_PATH_IMAGE242
,影响弧集合
Figure 696845DEST_PATH_IMAGE243
包含
Figure 632439DEST_PATH_IMAGE244
以及
Figure 950288DEST_PATH_IMAGE245
,其中A为原子概念C转换的节点,B为基础概念D转换的节点,
Figure 996742DEST_PATH_IMAGE246
为原子属性R值域的取值概念
Figure 841070DEST_PATH_IMAGE247
转换的节点,
Figure 213145DEST_PATH_IMAGE248
为原子属性R定义域的取值概念
Figure 80607DEST_PATH_IMAGE249
转换的节点,
Figure 868435DEST_PATH_IMAGE250
表示与原子概念C存在原子属性R关系的概念集合
Figure 504952DEST_PATH_IMAGE251
转换的节点;
扩展规则2:对于每一个概念包含公理
Figure 47929DEST_PATH_IMAGE252
,节点集合N包含节点AB
Figure 199425DEST_PATH_IMAGE253
Figure 853260DEST_PATH_IMAGE254
Figure 281967DEST_PATH_IMAGE255
,弧的集合E包含弧
Figure DEST_PATH_IMAGE256
Figure 589321DEST_PATH_IMAGE257
,影响弧集合
Figure 431375DEST_PATH_IMAGE258
包含
Figure 561005DEST_PATH_IMAGE259
以及
Figure 906536DEST_PATH_IMAGE260
,其中,
Figure 853632DEST_PATH_IMAGE261
表示与原子概念C存在原子属性R的逆操作关系的概念集合
Figure 917403DEST_PATH_IMAGE262
转换的节点。
8.根据权利要求7所述的一种本体匹配修复方法,其特征在于,确定当前待决策匹配弧的方法包括:从剩余未标识匹配弧集合中选取综合影响函数值最大的匹配弧作为当前待决策匹配弧
Figure 585145DEST_PATH_IMAGE263
,将所述当前待决策匹配弧对应的匹配提供给专家进行决策,所述综合影响函数值的计算方法如下:
Figure 44902DEST_PATH_IMAGE264
其中
Figure 897320DEST_PATH_IMAGE265
表示赞同影响,
Figure 386070DEST_PATH_IMAGE266
表示否定影响,
Figure 919820DEST_PATH_IMAGE267
Figure 302259DEST_PATH_IMAGE268
Figure 528841DEST_PATH_IMAGE269
表示通过运算
Figure 239308DEST_PATH_IMAGE270
Figure 576749DEST_PATH_IMAGE271
Figure 813695DEST_PATH_IMAGE272
、得到并且属于匹配弧集合
Figure 883282DEST_PATH_IMAGE174
的匹配弧的数量;其中
Figure 408942DEST_PATH_IMAGE273
表示执行蕴含算子的操作,记作
Figure 346811DEST_PATH_IMAGE274
Figure 641526DEST_PATH_IMAGE271
表示执行蕴含算子的操作,记作
Figure 616435DEST_PATH_IMAGE275
Figure 691707DEST_PATH_IMAGE276
执行冲突算子,记作
Figure 370950DEST_PATH_IMAGE277
Figure 457855DEST_PATH_IMAGE278
为剩余未标识匹配弧集合
Figure 993878DEST_PATH_IMAGE279
中的匹配弧。
9.根据权利要求3所述的一种本体匹配修复方法,其特征在于,初始化集成图的修正状态包括初始化正确匹配弧标识集合,具体包括:将两个本体所有的公理加入正确匹配弧标识集合中,并将通过两条软化原则预先认定为可靠的匹配弧加入到正确匹配弧标识集合中,两条软化原则的具体定义如下:
原则1:可靠的匹配弧不应该造成集成图存在匹配弧之间逻辑冲突,所述逻辑冲突为存在至少1个基础概念D或者原子属性R为空集,记作
Figure 228551DEST_PATH_IMAGE280
或者
Figure 383589DEST_PATH_IMAGE281
原则2:可靠的匹配弧应至少关联1个可靠的匹配弧,匹配弧
Figure 449634DEST_PATH_IMAGE282
和匹配弧
Figure 94241DEST_PATH_IMAGE283
相互关联的定义为:对应的
Figure 753893DEST_PATH_IMAGE284
Figure 780798DEST_PATH_IMAGE285
之间的关系,和
Figure 701349DEST_PATH_IMAGE286
Figure 720121DEST_PATH_IMAGE287
之间的关系相同;
Figure 929385DEST_PATH_IMAGE288
,节点
Figure 285280DEST_PATH_IMAGE289
由规则1转换而来的节点,
Figure 794759DEST_PATH_IMAGE290
为本体
Figure 46749DEST_PATH_IMAGE291
中的基础概念
Figure 680993DEST_PATH_IMAGE292
转换的节点,
Figure 43841DEST_PATH_IMAGE293
为本体
Figure 938985DEST_PATH_IMAGE291
中的基础概念
Figure 361876DEST_PATH_IMAGE285
转换的节点,
Figure 483415DEST_PATH_IMAGE294
为本体
Figure 181113DEST_PATH_IMAGE295
中的基础概念
Figure 399605DEST_PATH_IMAGE296
转化的节点,
Figure 993397DEST_PATH_IMAGE297
为本体
Figure 336654DEST_PATH_IMAGE298
中基础概念
Figure 306884DEST_PATH_IMAGE299
转换的节点,匹配弧
Figure 176620DEST_PATH_IMAGE300
Figure 613417DEST_PATH_IMAGE301
则是由规则7或者规则9转换而来。
10.一种本体匹配修复系统,其特征在于,包括:集成图构建模块、
初始化模块、专家标识模块以及交互式本体匹配修复模块;
所述集成图构建模块,用于将各个本体转换成该本体对应的图,将本体匹配转换为匹配弧,利用所述匹配弧连接两个子图形成一个集成图;所述本体对应的图包括由本体基础概念与原子属性通过转换规则转换而来的节点,以及该本体内部根据各本体基础概念与原子属性之间包含于关系转换得到的弧;所述集成图表示为
Figure 506287DEST_PATH_IMAGE001
,其中N为节点集合,E为弧的集合,
Figure 811366DEST_PATH_IMAGE002
为匹配弧集合,弧与匹配弧的表示均记作
Figure 410975DEST_PATH_IMAGE003
,其中
Figure 176648DEST_PATH_IMAGE004
为集成图中的节点,
Figure 619131DEST_PATH_IMAGE005
所述初始化模块,用于初始化集成图的修正状态与决策空间,所述修正状态包括弧和匹配弧,所述匹配弧分为正确匹配弧标识集合和错误匹配弧标识集合;所述决策空间包括由修正状态计算得到的剩余未标识匹配弧集合、集成图推理的蕴含算子
Figure 665584DEST_PATH_IMAGE006
与冲突算子
Figure 119699DEST_PATH_IMAGE007
所述专家标识模块,用于专家对当前待决策匹配弧对应的匹配给出赞同或否定操作;
所述交互式本体匹配修复模块,用于在交互式本体匹配修复过程中,当专家对当前待决策匹配弧对应的匹配给出赞同操作或者否定操作时分别启动基于决策空间的赞同推理算法或者基于决策空间的否定推理算法,对剩余未标识匹配弧集合中匹配弧进行标记;重复交互式本体匹配修复过程,直至所有匹配弧都被标记,确定最终正确匹配弧标识集合。
CN202111118124.6A 2021-09-24 2021-09-24 一种本体匹配修复方法和系统 Active CN113569537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111118124.6A CN113569537B (zh) 2021-09-24 2021-09-24 一种本体匹配修复方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111118124.6A CN113569537B (zh) 2021-09-24 2021-09-24 一种本体匹配修复方法和系统

Publications (2)

Publication Number Publication Date
CN113569537A CN113569537A (zh) 2021-10-29
CN113569537B true CN113569537B (zh) 2021-12-17

Family

ID=78174219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111118124.6A Active CN113569537B (zh) 2021-09-24 2021-09-24 一种本体匹配修复方法和系统

Country Status (1)

Country Link
CN (1) CN113569537B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101827125A (zh) * 2010-03-31 2010-09-08 吉林大学 语义Web服务本体及其应用
US20200320062A1 (en) * 2019-04-03 2020-10-08 Unitedhealth Group Incorporated Managing data objects for graph-based data structures

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101827125A (zh) * 2010-03-31 2010-09-08 吉林大学 语义Web服务本体及其应用
US20200320062A1 (en) * 2019-04-03 2020-10-08 Unitedhealth Group Incorporated Managing data objects for graph-based data structures

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Automatic Evaluation of Ontology Matchers;Iti Mathur 等;《ICTCS "16》;20160331;第1-6页 *
Fr'ed'eric Fürst 等.Axiom-Based Ontology Matching.《K-CAP "05: Proceedings of the 3rd international conference on Knowledge capture》.2005,第195-196页. *

Also Published As

Publication number Publication date
CN113569537A (zh) 2021-10-29

Similar Documents

Publication Publication Date Title
CN108959613B (zh) 一种面向rdf知识图谱的语义近似查询方法
Zhang et al. Reducing uncertainty of schema matching via crowdsourcing
CN104216894B (zh) 用于数据查询的方法和系统
JP2021099765A (ja) Aiによるデータガバナンスの最適化方法
US9892143B2 (en) Association index linking child and parent tables
CN107590139B (zh) 一种基于循环矩阵翻译的知识图谱表示学习方法
Verhaeghe et al. Extending compact-table to negative and short tables
WO2020103345A1 (zh) 会话流程处理方法、装置及计算机可读存储介质
CN104573039A (zh) 一种关系数据库的关键词查询方法
CN110442847B (zh) 基于代码仓库过程管理的代码相似性检测方法及装置
Rensink et al. Repotting the geraniums: on nested graph transformation rules
Anam et al. Adapting a knowledge-based schema matching system for ontology mapping
US9286570B2 (en) Property reactive modifications in a rete network
CN112905690A (zh) 一种基于超图的金融时序数据挖掘方法及系统
CN113569537B (zh) 一种本体匹配修复方法和系统
Bengtson et al. Psi-calculi in Isabelle
CN111831910A (zh) 一种基于异构网络的引文推荐算法
Asiler et al. Bb-graph: A subgraph isomorphism algorithm for efficiently querying big graph databases
Patras et al. A comparative evaluation of RDBMS and GDBMS for shortest path operations on pedestrian navigation data
Morsi Propositional calculus under adjointness
CN111858956B (zh) 知识图谱构建方法、装置、网络设备及存储介质
CN114116785A (zh) 一种基于最小属性割的分布式sparql查询优化方法
CN108776697B (zh) 一种基于谓词的多源数据集清洗方法
CN113449869A (zh) 一种易推理贝叶斯网络的学习方法
CN112819160A (zh) 一种神经网络模型的可视化方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20211029

Assignee: NANJING DAQO AUTOMATION TECHNOLOGY Co.,Ltd.

Assignor: NANJING University OF POSTS AND TELECOMMUNICATIONS

Contract record no.: X2022320000091

Denomination of invention: An ontology matching and repairing method and system

Granted publication date: 20211217

License type: Exclusive License

Record date: 20220607

EE01 Entry into force of recordation of patent licensing contract