CN105320717B - 本体学习中的个体半自动构建方法 - Google Patents
本体学习中的个体半自动构建方法 Download PDFInfo
- Publication number
- CN105320717B CN105320717B CN201410562972.XA CN201410562972A CN105320717B CN 105320717 B CN105320717 B CN 105320717B CN 201410562972 A CN201410562972 A CN 201410562972A CN 105320717 B CN105320717 B CN 105320717B
- Authority
- CN
- China
- Prior art keywords
- data
- information
- individual
- attribute
- title
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种本体学习中的个体半自动构建方法。本方法步骤是根据原文书籍处理出的结构化数据,进行直接搜索,检索出构建个体时需要的数据属性信息,不仅填充了个体的数据属性信息,也有引文进行说明,增加其正确性和可信性。该方法的优点在于面对成百上千的个体数据,不用耗费大量的人力和时间整理归纳书籍中的信息,而是直接通过搜索书籍内容直接取得需要的信息,系统会将信息自动填充到对应的数据文本框,完成对个体的数据属性信息填充,同时也实现了人工编辑信息功能,对个体数据属性信息校对后能进行信息修正。
Description
技术领域
本发明涉及数字信息处理技术领域,尤其涉及到一种本体学习中的个体半自动构建方法。
背景技术
知识处理是信息技术发展的必然趋势,随着对知识应用要求越来越高,传统的知识数据库系统已经不能满足新的需求,所以将本体引用到知识工程中,将本体相关原理技术运用到知识库的开发中。
本体知识系统是20世纪70年代后期,专家系统、知识系统和知识密集型的信息系统的构建技术发展而形成知识工程,所建立的系统简称为知识系统(knowledge-basedsystems)。知识系统是人工智能学科最重要的工业化和商业化产物。知识系统用于辅助人们进行问题求解,如检测信用卡诈骗、加速船舶设计、辅助医疗诊断、使科学软件更加智能化、向全体决策人员提供金融服务、产品质量的评价和广告宣传、支持电子网络的服务恢复。
本体在知识库上的应用是在构建本体的基础上的,现有的大部分系统 ,都是靠手工输入大量的知识,但是本体的构建特别是个体的构建是一项繁琐的任务,因为手工方法费时、费力,需要大量的人力和时间,使得本体的构建成为一项艰巨的任务。如果知识库需要使用大量人工为本体录入大量的个体知识来构成庞大的知识库,这就导致了知识获取瓶颈,而且需要为几亿用户提供知识服务的系统若进行人工手动录入信息,那将是一个无法预估的工作量。因此,如何利用知识获取方法来降低本体构建的开销是一个很有意义的研究方向。
发明内容
本发明所要解决的技术问题是正对上述存在的技术不足,提供一种通过检索加工后的书籍内容,进行数据查找后确定需要的数据,并自动填充,来完成个体信息的录入,大大减少了人工劳力和时间,并且具备数据对比和修正的本体学习中的个体半自动构建方法。
本发明解决其技术问题所采用的技术方案是:
本体学习中的个体半自动构建方法,其特征在于,包括如下步骤:
人工编辑个体数据属性信息:将个体信息编为个体名称和数据属性名称,本体各个类的个体名称是用户自行定义的,填充数据属性信息时,在每个数据属性后面设置一个文本框,用来输入和显示该数据属性信息,用来表现信息的有序化。
利用电子工具对书籍进行加工处理,形成能够被识别并检索的类目和数据信息,与个体数据信息相匹配;
根据个体名称和数据属性搜索数据:在文本框后的自动检索功能,对加工处理后的信息针对个体名称和数据属性名称进行的信息检索。
词库匹配:将个体名称和数据属性名称在数据库词库中进行匹配,词库是提前将书籍内容进行处理形成的词库。
数据自动填充:当匹配程度达到一个阈值时,系统自动给出该个体的数据属性对应的数据,并填充到文本框,完成一个知识点。
关键字检索:当匹配程度达不到时,在检索框中输入要检索的信息,一般是个体名称或数据属性名称,系统根据关键字在数据库中的书籍内容数据中进行查找,然后将结果输出。
浏览并选择数据:在以上查找结果中选择需要的信息后,数据会自动填充到该属性的文本框,则形成了一个有引用信息的知识点。
信息校对:数据全部来自于系统数据库,是已经加工好的结构化书籍内容数据,并且为知识点提供信息支撑,保证数据的准确性。根据引用信息可以校对个体数据属性信息的正确与否。
信息修正:当填充的数据与引用信息不一致时,用户可以通过手动输入修改文本框中的数据,对个体数据属性信息进行修正。
本发明的原理是是根据原文书籍处理出的结构化数据,进行直接搜索,检索出构建个体时需要的数据属性信息,不仅填充了个体的数据属性信息,也有引文进行说明,增加其正确性和可信性。该方法的优点在于面对成百上千的个体数据, 不用耗费大量的人力和时间整理归纳书籍中的信息,而是直接通过搜索书籍内容直接取得需要的信息,系统会将信息自动填充到对应的数据文本框,完成对个体的数据属性信息填充,同时也实现了人工编辑信息功能,对个体数据属性信息校对后能进行信息修正。
本发明的有益效果是:
本发明方法能够实现个体的半自动构建,大大降低繁重工作量,并且有书籍引用做支撑,增加其正确性。
附图说明
图1是本发明实施例的流程图。
具体实施方式
下面结合具体实施方式,对本发明作进一步的说明:
如图1所示的本体学习中的个体半自动构建方法,包括如下步骤:
编辑个体数据属性信息:将个体信息编为个体名称和数据属性名称,本体各个类的个体名称是用户自行定义的,填充数据属性信息时,在每个数据属性后面设置一个文本框,用来输入和显示该数据属性信息,用来表现信息的有序化。
利用工具对书籍进行加工处理,形成能够被识别并检索的类目和数据信息,与个体数据信息相匹配;
根据个体名称和数据属性搜索数据:在文本框后的自动检索功能,对加工处理后的信息针对个体名称和数据属性名称进行的信息检索。
词库匹配:将个体名称和数据属性名称在数据库词库中进行匹配,词库是提前将书籍内容进行处理形成的词库。
数据自动填充:当匹配程度达到一个阈值时,系统自动给出该个体的数据属性对应的数据,并填充到文本框,完成一个知识点。
关键字检索:当匹配程度达不到时,在检索框中输入要检索的信息,一般是个体名称或数据属性名称,系统根据关键字在数据库中的书籍内容数据中进行查找,然后将结果输出。
浏览并选择数据:在以上查找结果中选择需要的信息后,数据会自动填充到该属性的文本框,则形成了一个有引用信息的知识点。
信息校对:数据全部来自于系统数据库,是已经加工好的结构化书籍内容数据,并且为知识点提供信息支撑,保证数据的准确性。根据引用信息可以校对个体数据属性信息的正确与否。
信息修正:当填充的数据与引用信息不一致时,用户可以通过手动输入修改文本框中的数据,对个体数据属性信息进行修正。
本发明的保护范围并不限于上述的实施例,显然,本领域的技术人员可以对本发明进行各种改动和变形而不脱离本发明的范围和精神。倘若这些改动和变形属于本发明权利要求及其等同技术的范围内,则本发明的意图也包含这些改动和变形在内。
Claims (1)
1.本体学习中的个体半自动构建方法,其特征在于,包括如下步骤:
人工编辑个体数据属性信息:将个体信息编为个体名称和数据属性名称,本体各个类的个体名称是用户自行定义的,填充数据属性信息时,在每个数据属性后面设置一个文本框,用来输入和显示该数据属性信息,用来表现信息的有序化;
利用电子工具对书籍进行加工处理,形成能够被识别并检索的类目和数据信息,与个体数据信息相匹配;
根据个体名称和数据属性搜索数据:在文本框后的自动检索功能,对加工处理后的信息针对个体名称和数据属性名称进行的信息检索;
词库匹配:将个体名称和数据属性名称在数据库词库中进行匹配,词库是提前将书籍内容进行处理形成的词库;
数据自动填充:当匹配程度达到一个阈值时,系统自动给出该个体的数据属性对应的数据,并填充到文本框,完成一个知识点;
关键字检索:当匹配程度达不到时,在检索框中输入要检索的信息,包括有个体名称或数据属性名称,系统根据关键字在数据库中的书籍内容数据中进行查找,然后将结果输出;
浏览并选择数据:在以上查找结果中选择需要的信息后,数据会自动填充到该属性的文本框,则形成了一个有引用信息的知识点;
信息校对:数据全部来自于系统数据库,是已经加工好的结构化书籍内容数据,并且为知识点提供信息支撑,保证数据的准确性;
根据引用信息可以校对个体数据属性信息的正确与否;
信息修正:当填充的数据与引用信息不一致时,用户可以通过手动输入修改文本框中的数据,对个体数据属性信息进行修正。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410562972.XA CN105320717B (zh) | 2014-10-22 | 2014-10-22 | 本体学习中的个体半自动构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410562972.XA CN105320717B (zh) | 2014-10-22 | 2014-10-22 | 本体学习中的个体半自动构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105320717A CN105320717A (zh) | 2016-02-10 |
CN105320717B true CN105320717B (zh) | 2019-11-26 |
Family
ID=55248116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410562972.XA Active CN105320717B (zh) | 2014-10-22 | 2014-10-22 | 本体学习中的个体半自动构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105320717B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073386B (zh) * | 2016-11-10 | 2021-08-13 | 北京国双科技有限公司 | 文本框优化方法及装置 |
-
2014
- 2014-10-22 CN CN201410562972.XA patent/CN105320717B/zh active Active
Non-Patent Citations (4)
Title |
---|
中文常识本体的半自动构建与应用;许斯渊;《中国优秀硕士学位论文全文数据库》;20130630;全文 * |
效应领域本体库自动填充方法研究;付秋实;《中国优秀硕士学位论文全文数据库》;20140415;第1-28页,附图4.6-4.9 * |
本体的半自动构建技术;苗壮;《解放军理工大学学报》;20060131;第7卷(第5期);全文 * |
面向语义网的领域本体半自动构建方法的研究;张囡囡;《中国优秀硕士学位论文全文数据库》;20080731;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN105320717A (zh) | 2016-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108573411B (zh) | 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法 | |
Trupthi et al. | Sentiment analysis on twitter using streaming API | |
US20190311025A1 (en) | Methods and systems for modeling complex taxonomies with natural language understanding | |
CN107609052A (zh) | 一种基于语义三角的领域知识图谱的生成方法及装置 | |
CN103970848B (zh) | 一种通用型互联网信息数据挖掘方法 | |
CN107368468A (zh) | 一种运维知识图谱的生成方法及系统 | |
CN109710851A (zh) | 基于互联网模式下多源数据分析的就业推荐方法及系统 | |
CN104376406A (zh) | 一种基于大数据的企业创新资源管理与分析系统和方法 | |
CN103279478A (zh) | 一种基于分布式互信息文档特征提取方法 | |
CN110321549B (zh) | 基于序列化学习、关系挖掘、时序分析的新概念挖掘方法 | |
CN110008330A (zh) | 智能客服设备的应答方法、装置、设备和存储介质 | |
CN110309271A (zh) | 智能知识学习及问答技术 | |
CN107015965A (zh) | 一种中文文本情感分析装置及方法 | |
CN114218333A (zh) | 一种地质知识图谱构建方法、装置、电子设备及存储介质 | |
CN106445914A (zh) | 微博情感分类器的构建方法及构建装置 | |
CN117151659A (zh) | 一种基于大语言模型的生态修复工程全生命周期追溯方法 | |
US11921754B2 (en) | Systems and methods for categorization of ingested database entries to determine topic frequency | |
CN110765276A (zh) | 知识图谱中的实体对齐方法及装置 | |
CN116702784B (zh) | 实体链接方法、装置、计算机设备和存储介质 | |
CN106775694B (zh) | 一种软件配置代码制品的层次分类方法 | |
CN105320715A (zh) | 基于本体的语义查询方法 | |
CN113139558B (zh) | 确定物品的多级分类标签的方法和装置 | |
CN105654125A (zh) | 一种视频相似度的计算方法 | |
Schmidts et al. | Schema Matching with Frequent Changes on Semi-Structured Input Files: A Machine Learning Approach on Biological Product Data. | |
CN105320717B (zh) | 本体学习中的个体半自动构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210205 Address after: 430223 Science Park of Wuhan University of technology, Donghu Development Zone, Wuhan City, Hubei Province Patentee after: WUHAN LIGONG DIGITAL COMMUNICATIONS ENGINEERING Co.,Ltd. Address before: 430070 Hubei Province, Wuhan city Hongshan District Luoshi Road No. 122 Patentee before: WUHAN University OF TECHNOLOGY |
|
TR01 | Transfer of patent right |