CN102521241B - 一种半自动化学习式owl建模系统 - Google Patents

一种半自动化学习式owl建模系统 Download PDF

Info

Publication number
CN102521241B
CN102521241B CN201110357609.0A CN201110357609A CN102521241B CN 102521241 B CN102521241 B CN 102521241B CN 201110357609 A CN201110357609 A CN 201110357609A CN 102521241 B CN102521241 B CN 102521241B
Authority
CN
China
Prior art keywords
owl
module
model
inverted index
ontology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110357609.0A
Other languages
English (en)
Other versions
CN102521241A (zh
Inventor
王楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu United Industrial Limited by Share Ltd
Original Assignee
JIANGSU LIANZHU INDUSTRIAL CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU LIANZHU INDUSTRIAL CO LTD filed Critical JIANGSU LIANZHU INDUSTRIAL CO LTD
Priority to CN201110357609.0A priority Critical patent/CN102521241B/zh
Publication of CN102521241A publication Critical patent/CN102521241A/zh
Application granted granted Critical
Publication of CN102521241B publication Critical patent/CN102521241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种半自动化学习式OWL建模系统,其特征在于:其包括人工处理模块、倒排索引建库模块和OWL模型比较模块,其中:人工处理模块,以人工操作的方式建立OWL知识模型作为种子模型;倒排索引建库模块,从互联网上采集信息并将其转换成OWL本体实例,提取该OWL本体实例的本体元,建立本体元的倒排索引数据库;OWL模型比较模块,对种子模型和倒排索引数据库中的本体元进行比较,将属于同一知识领域的本体元的属性补充到种子模型中以完善种子模型。本发明的一种半自动化学习式OWL建模系统是将人工干预和自动学习结合起来,从而实现OWL建模时的自动化和精确性。为建立人类知识的计算机模型提供了一种极具操作性的解决思路。其具有高效、准确等优点。

Description

一种半自动化学习式OWL建模系统
技术领域
本发明属于计算机技术领域,具体涉及一种OWL建模系统。
背景技术
今天,计算机已经深入人类社会的每个角落,而且可以预见其将在人类文明发展进程中扮演越来越重要的角色。让计算机理解人类的知识,从而更加智能化地服务于人类是未来发展的方向。为了实现这个目的,人们做了许多尝试,例如:可以用知识结构重新构造互联网,即:语义互联网,它主要采用W3C的互联网本体语言(Ontology of Web Language,简称:OWL)建立语义网络。如果所有人都按OWL创建互联网,互联网本身就成为一个计算机可以在一定程度上“理解”的知识结构。在这个基础上软件工程师们可以为计算机设计一系列推理规则和引擎,在OWL语义网络上让计算机自己“理解”互联网信息内容,并做出正确的判断和操作。
OWL的构思代表了未来的发展方向,是对计算机能够读懂人类的知识的非常重要的尝试。沿这这个思路,我们可以构造计算机新的知识结构。它首先就需要解决的一个问题是对人类的知识进行建模,尤其是利用互联网的海量信息建立完善的OWL模型。这个过程应该是计算机自学习式的,同时又有人工处理的过程以进行适当的完善,只有这样才能避免巨大的人工工作量,同时为建立准确可靠的模型提供了可能。
发明内容
本发明提供了一种解决上述问题的方案,提供一种半自动化学习式、高效、准确的OWL建模系统。
基于以上思路,本发明的技术方案是提供一种半自动化学习式OWL建模系统,其特征在于:其包括人工处理模块、倒排索引建库模块和OWL模型比较模块,其中:
人工处理模块,以人工操作的方式建立OWL知识模型作为种子模型;
倒排索引建库模块,从互联网上采集信息并将其转换成OWL本体实例,提取该OWL本体实例的本体元,建立本体元的倒排索引数据库。本体元是最小的不可分解本体。倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置;
OWL模型比较模块,对种子模型和倒排索引数据库中的本体元进行比较,将属于同一知识领域的本体元的属性补充到种子模型中以完善种子模型。
优选的,其还包括OWL本体模型库,用于存储所述人工处理模块建立的种子模型和所述倒排索引建库模块转换后的OWL本体实例。
优选的,所述倒排索引建库模块包括以下模块:
原始文档管理系统,负责通过搜索引擎从互联网采集各种信息;
OWL本体转换模块,负责将原始文档管理系统采集的信息转换成OWL本体实例,并存入OWL本体实例库;
提炼OWL本体元模块,提炼OWL本体实例库中所有OWL本体实例的本体元;
本体实例倒排索引模块,建立提炼OWL本体元模块获得的本体元的倒排索引,并存入所述倒排索引数据库。
优选的,所述人工处理模块还包括辞典维护模块,负责建立并维护OWL本体辞典,所述OWL本体转换模块根据所述OWL本体辞典将原始文档管理系统采集的信息转换成OWL本体实例。
优选的,所述人工处理模块还包括OWL兼容性规则人工维护模块,负责建立和维护OWL兼容性规则库,所述OWL模型比较模块根据所述OWL兼容性规则库中的OWL兼容性规则对所述种子模型和倒排索引数据库中的本体元进行比较。
优选的,所述人工处理模块还包括疑难问题人工处理模块,负责处理所述OWL模型比较模块中的异常,并人工调整所述种子模型。
本发明的一种半自动化学习式OWL建模系统是将人工干预和自动学习结合起来,从而实现OWL建模时的自动化和精确性。为建立人类知识的计算机模型提供了一种极具操作性的解决思路。其具有高效、准确等优点。
附图说明
图1是本发明的一种半自动化学习式OWL建模系统的原理框架图。
具体实施方式
下面对本发明的具体实施方式作进一步详细的描述。
如图1所示,本发明的一种半自动化学习式OWL建模系统有以下部分组成:
1)         原始文档管理系统从搜索引擎采集来的互联网原始信息;
2)         OWL转换模块将原始文档管理系统提供的原始文档做OWL转换,并存入本体实例数据库;
3)         提炼OWL本体元模块从本体实例库每一个本体实例中提取本体元(即:最小的不可分解本体);
4)         本体实例倒排索引模块完成对本体元的倒排索引,并存入本体元倒排索引库;
5)         OWL模型比较模块,以人工建造的OWL种子模型为基础,对本体元倒排索引表中的每一个本体元进行比对,利用人工维护的兼容性规则判断哪些本体元属于种子模型的同一知识范畴,哪些需要向人工处理模块提问的,哪些与种子模型所涉及的知识无关。判断的标准分三个维度:
a)              定义(域)的判断和关系结构识别,即:两个对比的概念是否同一类概念,如果是,则它们是什么关系,比如:局部与整体、上下级、亲戚,等等;
b)              属性的判断和排序,即:两种属性是否属于同一范畴,如果是,要进行量化排序。比如:颜色:赤、橙、黄、绿、蓝、靛、紫;
c)              行为特征判断和排序,即:两种行为是否属于同类,如果是,要进行程度排序,比如:笑:微笑、…大笑;
6)         疑难问题人工处理模块受理OWL模型比较模块抛出的异常,人工调整模型;
7)         模型比较的合理结果和人工干预的结果送到模型更新模块对种子模型进行修改、升级,存入OWL模型库;
8)         兼容性规则模块负责人机交互,完成对兼容性规则的维护,结果存入兼容性规则库;
9)         OWL种子模型和OWL辞典库都是通过“OWL本体建模、辞典的人工维护”模块维护的,OWL知识模型和OWL辞典在OWL转换过程中也要用到。
具体来说,本发明的一种半自动化学习式OWL建模系统的主流程如下:
1、         知识管理员通过人工建模工具建立某个知识领域的种子模型;
2、         通过搜索引擎或其他信息采集手段获取知识信息,并存入原始文档管理系统;
3、         系统对原始信息做OWL本体实例转换、本体元倒排索引,并存入本体元倒排索引表;
4、         系统利用人工创建的种子模型与系统初步提炼的(存在倒排索引表中的)每一个本体元进行模型对比,在兼容性规则的帮助下,识别同类知识;
5、         把符合“合理知识”标准的本体元直接输出给OWL模型更新模块,把有“疑问”的知识提交人工处理模块,把无关的知识抛弃;
6、         知识管理员根据系统的提问,对知识模型做适当的调整,并输出给OWL模型更新模块;
7、         OWL模型更新模块负责修改、升级种子模型;
8、         不断重复步骤1到7,OWL知识模型就会越来越完善;
9、         需要时,人工调整兼容性规则、OWL辞典库、甚至OWL模型本身。
以上实施例仅为本发明其中的一种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。 

Claims (2)

1.一种半自动化学习式OWL建模系统,其特征在于:其包括人工处理模块、倒排索引建库模块和OWL模型比较模块,其中:
人工处理模块,以人工操作的方式建立OWL知识模型作为种子模型;
倒排索引建库模块,从互联网上采集信息并将其转换成OWL本体实例,提取该OWL本体实例的本体元,建立本体元的倒排索引数据库;
OWL模型比较模块,对种子模型和倒排索引数据库中的本体元进行比较,将属于同一知识领域的本体元的属性补充到种子模型中以完善种子模型,其还包括OWL本体模型库,用于存储所述人工处理模块建立的种子模型和所述倒排索引建库模块转换后的OWL本体实例;
所述人工处理模块还包括OWL兼容性规则人工维护模块,负责建立和维护OWL兼容性规则库,所述OWL模型比较模块根据所述OWL兼容性规则库中的OWL兼容性规则对所述种子模型和倒排索引数据库中的本体元进行比较;
所述人工处理模块还包括疑难问题人工处理模块,负责处理所述OWL模型比较模块中的异常,并人工调整所述种子模型;所述倒排索引建库模块包括以下模块:
原始文档管理系统,负责通过搜索引擎从互联网采集各种信息;
OWL本体转换模块,负责将原始文档管理系统采集的信息转换成OWL本体实例,并存入OWL本体实例库;
提炼OWL本体元模块,提炼OWL本体实例库中所有OWL本体实例的本体元;
本体实例倒排索引模块,建立提炼OWL本体元模块获得的本体元的倒排索引,并存入所述倒排索引数据库。
2.根据权利要求1所述的一种半自动化学习式OWL建模系统,其特征在于:所述人工处理模块还包括辞典维护模块,负责建立并维护OWL本体辞典,所述OWL本体转换模块根据所述OWL本体辞典将原始文档管理系统采集的信息转换成OWL本体实例。
CN201110357609.0A 2011-11-14 2011-11-14 一种半自动化学习式owl建模系统 Active CN102521241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110357609.0A CN102521241B (zh) 2011-11-14 2011-11-14 一种半自动化学习式owl建模系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110357609.0A CN102521241B (zh) 2011-11-14 2011-11-14 一种半自动化学习式owl建模系统

Publications (2)

Publication Number Publication Date
CN102521241A CN102521241A (zh) 2012-06-27
CN102521241B true CN102521241B (zh) 2014-05-14

Family

ID=46292163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110357609.0A Active CN102521241B (zh) 2011-11-14 2011-11-14 一种半自动化学习式owl建模系统

Country Status (1)

Country Link
CN (1) CN102521241B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881488B (zh) * 2015-06-05 2017-04-05 焦点科技股份有限公司 基于关系表的可配置信息抽取方法
CN108614828B (zh) * 2016-12-12 2020-12-29 北大方正集团有限公司 基于规则模板的语料分析方法及语料分析装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101393565A (zh) * 2008-11-07 2009-03-25 北京航空航天大学 基于本体的面向虚拟博物馆的搜索方法
CN101582073A (zh) * 2008-12-31 2009-11-18 北京中机科海科技发展有限公司 一种基于领域本体的智能检索系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8275803B2 (en) * 2008-05-14 2012-09-25 International Business Machines Corporation System and method for providing answers to questions

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101393565A (zh) * 2008-11-07 2009-03-25 北京航空航天大学 基于本体的面向虚拟博物馆的搜索方法
CN101582073A (zh) * 2008-12-31 2009-11-18 北京中机科海科技发展有限公司 一种基于领域本体的智能检索系统及方法

Also Published As

Publication number Publication date
CN102521241A (zh) 2012-06-27

Similar Documents

Publication Publication Date Title
US20210192389A1 (en) Method for ai optimization data governance
CN107609052A (zh) 一种基于语义三角的领域知识图谱的生成方法及装置
CN105912595A (zh) 一种关系数据库的数据起源收集方法
CN108389606A (zh) 一种电子病案首页的数据质量控制系统及其控制方法
CN106127395A (zh) 一种基于语义元模型的产品统一模型构建系统及构建方法
WO2023124191A1 (zh) 基于深度图匹配的医疗数据元自动化分类方法及系统
CN105808853B (zh) 一种面向工程应用的本体构建管理与本体数据自动获取方法
CN104699786A (zh) 一种语义智能搜索的通信网络投诉系统
CN104881427A (zh) 一种面向电网调控运行的数据血统分析方法
CN104268247A (zh) 一种基于模糊层次分析的主数据归集方法
CN102521241B (zh) 一种半自动化学习式owl建模系统
CN106372145A (zh) 一种大数据环境下基于本体语义的查询方法及系统
CN109816428A (zh) 一种基于大数据机器学习的用水量分析系统及方法
Shi et al. Human resources balanced allocation method based on deep learning algorithm
Lee A Study on Socio-technical System for Sustainability of the 4th Industrial Revolution: Machine Learning-based Analysis
CN115934969A (zh) 一种不可移动文物风险评估知识图谱构建方法
Xu Research on enterprise knowledge unified retrieval based on industrial big data
CN107301239A (zh) 一种数据库转换器及转换方法
CN102436467B (zh) 自学习式owl推理引擎
CN102521239B (zh) 一种基于owl的互联网问答信息匹配系统及其匹配方法
CN102508911B (zh) 基于学习式owl建模的网站知识结构分析系统
CN102436493A (zh) 一种基于学习式owl建模的产品服务模型生成系统
CN102521244A (zh) 一种基于学习式owl建模的用户资料分析系统
CN107992590A (zh) 一种有利于信息比对的大数据系统
CN107870898A (zh) 一种面向工程应用的领域语义网建模方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: 210006, 12 floor, Tong Tong Building, 501 South Zhongshan Road, Nanjing, Jiangsu

Patentee after: Jiangsu United Industrial Limited by Share Ltd

Address before: 210006, 12 floor, Tong Tong Building, 501 South Zhongshan Road, Nanjing, Jiangsu

Patentee before: Jiangsu Lianzhu Industrial Co.,Ltd.