CN105320717B

CN105320717B - 本体学习中的个体半自动构建方法

Info

Publication number: CN105320717B
Application number: CN201410562972.XA
Authority: CN
Inventors: 刘永坚; 白立华; 杨朝阳; 曾瑞; 李文忠; 涂瑞; 刘欢
Original assignee: Wuhan University of Technology WUT
Current assignee: WUHAN LIGONG DIGITAL COMMUNICATIONS ENGINEERING Co.,Ltd.
Priority date: 2014-10-22
Filing date: 2014-10-22
Publication date: 2019-11-26
Anticipated expiration: 2034-10-22
Also published as: CN105320717A

Abstract

本发明提供一种本体学习中的个体半自动构建方法。本方法步骤是根据原文书籍处理出的结构化数据，进行直接搜索，检索出构建个体时需要的数据属性信息，不仅填充了个体的数据属性信息，也有引文进行说明，增加其正确性和可信性。该方法的优点在于面对成百上千的个体数据，不用耗费大量的人力和时间整理归纳书籍中的信息，而是直接通过搜索书籍内容直接取得需要的信息，系统会将信息自动填充到对应的数据文本框，完成对个体的数据属性信息填充，同时也实现了人工编辑信息功能，对个体数据属性信息校对后能进行信息修正。

Description

本体学习中的个体半自动构建方法

技术领域

本发明涉及数字信息处理技术领域，尤其涉及到一种本体学习中的个体半自动构建方法。

背景技术

知识处理是信息技术发展的必然趋势，随着对知识应用要求越来越高，传统的知识数据库系统已经不能满足新的需求，所以将本体引用到知识工程中，将本体相关原理技术运用到知识库的开发中。

本体知识系统是20世纪70年代后期，专家系统、知识系统和知识密集型的信息系统的构建技术发展而形成知识工程，所建立的系统简称为知识系统（knowledge-basedsystems）。知识系统是人工智能学科最重要的工业化和商业化产物。知识系统用于辅助人们进行问题求解，如检测信用卡诈骗、加速船舶设计、辅助医疗诊断、使科学软件更加智能化、向全体决策人员提供金融服务、产品质量的评价和广告宣传、支持电子网络的服务恢复。

本体在知识库上的应用是在构建本体的基础上的，现有的大部分系统 ,都是靠手工输入大量的知识，但是本体的构建特别是个体的构建是一项繁琐的任务，因为手工方法费时、费力，需要大量的人力和时间，使得本体的构建成为一项艰巨的任务。如果知识库需要使用大量人工为本体录入大量的个体知识来构成庞大的知识库，这就导致了知识获取瓶颈，而且需要为几亿用户提供知识服务的系统若进行人工手动录入信息，那将是一个无法预估的工作量。因此,如何利用知识获取方法来降低本体构建的开销是一个很有意义的研究方向。

发明内容

本发明所要解决的技术问题是正对上述存在的技术不足，提供一种通过检索加工后的书籍内容，进行数据查找后确定需要的数据，并自动填充，来完成个体信息的录入，大大减少了人工劳力和时间，并且具备数据对比和修正的本体学习中的个体半自动构建方法。

本发明解决其技术问题所采用的技术方案是：

本体学习中的个体半自动构建方法，其特征在于，包括如下步骤：

人工编辑个体数据属性信息：将个体信息编为个体名称和数据属性名称，本体各个类的个体名称是用户自行定义的，填充数据属性信息时，在每个数据属性后面设置一个文本框，用来输入和显示该数据属性信息，用来表现信息的有序化。

利用电子工具对书籍进行加工处理，形成能够被识别并检索的类目和数据信息，与个体数据信息相匹配；

根据个体名称和数据属性搜索数据：在文本框后的自动检索功能，对加工处理后的信息针对个体名称和数据属性名称进行的信息检索。

词库匹配：将个体名称和数据属性名称在数据库词库中进行匹配，词库是提前将书籍内容进行处理形成的词库。

数据自动填充：当匹配程度达到一个阈值时，系统自动给出该个体的数据属性对应的数据，并填充到文本框，完成一个知识点。

关键字检索：当匹配程度达不到时，在检索框中输入要检索的信息，一般是个体名称或数据属性名称，系统根据关键字在数据库中的书籍内容数据中进行查找，然后将结果输出。

浏览并选择数据：在以上查找结果中选择需要的信息后，数据会自动填充到该属性的文本框，则形成了一个有引用信息的知识点。

信息校对：数据全部来自于系统数据库，是已经加工好的结构化书籍内容数据，并且为知识点提供信息支撑，保证数据的准确性。根据引用信息可以校对个体数据属性信息的正确与否。

信息修正：当填充的数据与引用信息不一致时，用户可以通过手动输入修改文本框中的数据，对个体数据属性信息进行修正。

本发明的原理是是根据原文书籍处理出的结构化数据，进行直接搜索，检索出构建个体时需要的数据属性信息，不仅填充了个体的数据属性信息，也有引文进行说明，增加其正确性和可信性。该方法的优点在于面对成百上千的个体数据，不用耗费大量的人力和时间整理归纳书籍中的信息，而是直接通过搜索书籍内容直接取得需要的信息，系统会将信息自动填充到对应的数据文本框，完成对个体的数据属性信息填充，同时也实现了人工编辑信息功能，对个体数据属性信息校对后能进行信息修正。

本发明的有益效果是：

本发明方法能够实现个体的半自动构建，大大降低繁重工作量，并且有书籍引用做支撑，增加其正确性。

附图说明

图1是本发明实施例的流程图。

具体实施方式

下面结合具体实施方式，对本发明作进一步的说明：

如图1所示的本体学习中的个体半自动构建方法，包括如下步骤：

编辑个体数据属性信息：将个体信息编为个体名称和数据属性名称，本体各个类的个体名称是用户自行定义的，填充数据属性信息时，在每个数据属性后面设置一个文本框，用来输入和显示该数据属性信息，用来表现信息的有序化。

利用工具对书籍进行加工处理，形成能够被识别并检索的类目和数据信息，与个体数据信息相匹配；

本发明的保护范围并不限于上述的实施例，显然，本领域的技术人员可以对本发明进行各种改动和变形而不脱离本发明的范围和精神。倘若这些改动和变形属于本发明权利要求及其等同技术的范围内，则本发明的意图也包含这些改动和变形在内。

Claims

1.本体学习中的个体半自动构建方法，其特征在于，包括如下步骤：

人工编辑个体数据属性信息：将个体信息编为个体名称和数据属性名称，本体各个类的个体名称是用户自行定义的，填充数据属性信息时，在每个数据属性后面设置一个文本框，用来输入和显示该数据属性信息，用来表现信息的有序化；

根据个体名称和数据属性搜索数据：在文本框后的自动检索功能，对加工处理后的信息针对个体名称和数据属性名称进行的信息检索；

词库匹配：将个体名称和数据属性名称在数据库词库中进行匹配，词库是提前将书籍内容进行处理形成的词库；

数据自动填充：当匹配程度达到一个阈值时，系统自动给出该个体的数据属性对应的数据，并填充到文本框，完成一个知识点；

关键字检索：当匹配程度达不到时，在检索框中输入要检索的信息，包括有个体名称或数据属性名称，系统根据关键字在数据库中的书籍内容数据中进行查找，然后将结果输出；

浏览并选择数据：在以上查找结果中选择需要的信息后，数据会自动填充到该属性的文本框，则形成了一个有引用信息的知识点；

信息校对：数据全部来自于系统数据库，是已经加工好的结构化书籍内容数据，并且为知识点提供信息支撑，保证数据的准确性；

根据引用信息可以校对个体数据属性信息的正确与否；