CN102930030A - 基于本体的智能语义文献检索推理系统 - Google Patents
基于本体的智能语义文献检索推理系统 Download PDFInfo
- Publication number
- CN102930030A CN102930030A CN2012104414401A CN201210441440A CN102930030A CN 102930030 A CN102930030 A CN 102930030A CN 2012104414401 A CN2012104414401 A CN 2012104414401A CN 201210441440 A CN201210441440 A CN 201210441440A CN 102930030 A CN102930030 A CN 102930030A
- Authority
- CN
- China
- Prior art keywords
- rule
- document
- user
- semantic
- intelligent semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于本体的智能语义文献检索推理系统,其特征在于所述系统包括:本体库,所述本体库构建有文献领域内关于文献的知识内容;规则库,采用规则获得关于文献新的属性与原有属性的逻辑关系;显示界面,用于提示用户进行输入操作,并将检索推理结果展示给用户。该系统可以避免用户常规检索的结果繁杂,难以获得有用的信息。
Description
技术领域
本发明属于数据智能处理分析技术领域,具体涉及一种基于本体的智能语义文献检索推理系统。
背景技术
传统的搜索不够智能,机器不能理解人类的语言,人机之间的交流困难,从而导致搜索出的信息不够准确。比如说烟灰色的水墨画,结果却是一个烟灰缸,等等。语义的搜索引擎,更加的智能化,可以给每个信息实例加上各式各样的标签,并读懂关键字之间的逻辑关系,大大增加了检索效率,但是目前语义的研究才处于起步阶段,各种技术都不是很成熟。
本体是一种知识库对领域事物的描述,带有语义性,可以说是另一种数据库。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。总的来说,构造本体可以实现某种程度的知识共享和重用,以及提高系统通讯、互操作、可靠性的能力。
数据的含义就是语义。简单的说,数据就是符号。数据本身没有任何意义,只有被赋予含义的数据才能够被使用,这时候数据就转化为了信息,而数据的含义就是语义。语义具有领域性特征,不属于任何领域的语义是不存在的。而语义异构则是指对同一事物在解释上所存在差异,也就体现为同一事物在不同领域中理解的不同。对于计算机科学来说,语义一般是指用户对于那些用来描述现实世界的计算机表示(即符号)的解释,也就是用户用来联系计算机表示和现实世界的途径。语义是对数据符号的解释,而语法则是对于这些符号之间的组织规则和结构关系的定义。对于信息集成领域来说,数据往往是通过模式(对于模式不存在或者隐含的非结构化和半结构化数据,往往需要在集成前定义出它们的模式)来组织的,数据的访问也是通过作用于模式来获得的,这时语义就是指模式元素(例如类、属性、约束等等)的含义,而语法则是模式元素的结构。
语义网是Semantic Web的中文名称。语义网就是能够根据语义进行判断的网络。简单地说,语义网是一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。
现有技术中对检索的个性化服务要求更多,而基于本体的语义检索大多停留在理论研究,真正实例很少。本发明因此而来。
发明内容
本发明目的在于提供一种基于本体的智能语义文献检索推理系统,解决了现有技术中海量数据进行搜索时,会耗费大量的时间等问题。
为了解决现有技术中的这些问题,本发明提供的技术方案是:
一种基于本体的智能语义文献检索推理系统,其特征在于所述系统包括:
本体库,所述本体库构建有文献领域内关于文献的知识内容;
规则库,采用规则获得关于文献新的属性与原有属性的逻辑关系;
显示界面,用于提示用户进行输入操作,并将检索推理结果展示给用户。
优选的,所述本体库包括文章、作者、出版社本体;本体的数据类型包括内容、标题、关键字,本体的对象属性包括引用,被引用属性。
优选的,所述规则库是对本体的对象属性规则的描述和说明,所加载的规则推理机为Reasoner推理机。
本发明的另一目的在于提供一种采用所述的智能语义文献检索推理系统进行展示的方法,其特征在于所述方法包括以下步骤:
(1)构建权利要求1所述的智能语义文献检索推理系统;
(2)用户在显示界面上输入需要检索的关键词,并进行检索查询;
(3)权利要求1所述的智能语义文献检索推理系统导入规则库,将与关键词相关的语义检索结果检索出来,并通过显示界面展示给用户。
本发明与现有技术相比,具有如下的有益效果:
本发明技术方案通过对本体库的建立,加载规则推理机,对文献相关信息进行查询检索,通过查询结果的综合,将与此文献相关的信息——共同引用了同一篇文献、被一篇文献引用等信息推荐给用户,可以避免用户常规检索的结果繁杂,难以获得有用的信息。
附图说明
下面结合附图及实施例对本发明作进一步描述:
图1为本发明技术方案采用所述的智能语义文献检索推理系统进行展示的方法流程图;
图2为本发明技术方案中智能语义检索推理系统本体库的框架结构图;
图3为本发明技术方案中智能语义检索推理系统本体库的另一框架结构图;
图4为本发明技术方案中智能语义检索推理系统本体库中各文献之间的相互引用关系。
图5为现有技术中旧模式下的文献检索展示的方法流程图。
具体实施方式
以下结合具体实施例对上述方案做进一步说明。应理解,这些实施例是用于说明本发明而不限于限制本发明的范围。实施例中采用的实施条件可以根据具体厂家的条件做进一步调整,未注明的实施条件通常为常规实验中的条件。
实施例
本实施例以图书馆文献系统为例,建立文献的知识领域模型。对这种个性化的基于本体的智能搜索进行探索,通过构建本体知识库,编写规则,实现语义检索,探索用户选择搜索规则的可行性。
本实施例的智能语义检索推理系统主要分三个模块:本体库、规则库、显示界面,以下具体介绍每个模块的具体功能:
(1)本体库:
通过查阅文献,与专家沟通,确定文献的知识领域。利用对对文献领域知识的理解,确定该领域内共同认可的属性,并从不同层次的形式化模式上给出这些词汇,术语和词汇间相互关系的明确定义。在这种基础上,构建了文献的只是库,包括Class:文章、作者、出版社;Datatype属性:内容、标题、关键字;Object属性:引用,被引用等;类的实例:文章、作者、出版社..。
本体库构建了Class、Datatype属性、Object属性之间的相互关系,比如作者jack对应了一篇文献article1,属于Sci出版社(class),此文献有内容、关键字、标题等(datatype属性),并且引用了article3和article4,被article5引用(object属性)。
本体库实际上就是一个知识领域,反映了在这个领域中各种实体与属性之间的复杂关系。
(2)规则库:
创建Object新属性:被同时引用,同时引用,并构建规则库,构建新建属性与之前属性的逻辑关系,利用规则,推理出各实例之间新的属性关系。
这是本发明所用到的推理规则:
1)[bothCiting:
(?a http://www.domain2.com#Citing ?c),
(?b http://www.domain2.com#Citing ?c),
notEqual(?a,?b)
->
(?a http://www.domain2.com#bothCiting ?b)]
//a引用c,b也引用c,且a、b不相等,则推出他们具有同时引用的关系a#bothCiting b。
2)[bothCited:
(?a http://www.domain2.com#Citing ?b),
(?a http://www.domain2.com#Citing ?c),
notEqual(?b,?c)
->
(?b http://www.domain2.com#bothCited ?c)]
//a引用b,a也引用c,且b、c不相等,则推出他们具有同时被引用的关系,b#bothCited c。
(3)显示界面:
利用j2ee技术,tomcat作为服务器,利用网页作为本发明的项目结果显示界面。
主界面是一个检索界面,包含检索项和检索值,可以选择标题、关键字、作者,进行检索;检索之后,点击搜索结果,可以查看文献详情,会显示编号、标题、关键字、作者、文献出处,内容,引用文献列表,被引用文献列表,同时引用文献列表、被同时引用文献列表。每一篇文献也对链接着它的详细信息。
其中本体库建立文献知识领域模型,规则库制定不同的推理规则,各模块耦合度很低,扩展性强,充分体现了基与本体的语义技术的优势。
首先,提出本体概念的目标是通过本体捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇,术语和词汇间相互关系的明确定义。这是基于本体的智能语义检索推理系统技术的最核心环节。
本实施例正是在这种基础上,提出了文献的知识领域,包括Class:文章、作者、出版社;Datatype属性:内容、标题、关键字;Object属性:引用,被引用等;类的实例:文章(5篇)、作者(3人)、出版社(1家),如图3所示..构建了文献的本体库,创建Object属性:被同时引用,同时引用,并构建规则库,推理出各实例之间新的属性关系,如图2~3所示。
本实施例所用的编辑本体的工具是Protégé3.4.7,Protégé提供了本体概念类,关系,属性和实例的构建,并且屏蔽了具体的本体描述语言,用户只需在概念层次上进行领域本体模型的构建。图4为各文献之间的相互引用关系。
构建推理规则,即:当a引用c,b引用c,且a不等于b时,则a、bbothciting;当a引用b,b引用c,且b不等于c时,则b、c bothcited。每篇文献都有它的引用文献,也知道它被谁引用,那么在本体库中本实施例构建了5篇文章的实例,并将其各种属性和各实例间关联一一对应;定义推理规则,如果一篇文章和另外一篇文章同时被第三者引用,则称他们为bothcited,如果这篇文章和另外一篇文章同时引用了第三篇文章,则称他们为bothciting。这样我们通过citing、cited、各实例间关联以及定义的规则,就可推出我们每篇文章的bothcited、bothciting属性,如表1、2所示。即验证了自定义规则的正确性与可行性。本实施例还可以编辑规则库,将规则选择权交给用户,用户就可以按照自己喜好选择自己希望的搜索方式。
表1为规则1的查询结果(手动推理结果):
表1规则1的手动推理结果
表2为规则1的查询结果(机器推理结果):
Article_1: | Bothciting | Article_1 | Article_3 | |
Bothcited | Article_2 | Article_4 | Article_5 | |
Article_2: | Bothciting | Article_1 | Article_3 | |
Bothcited | Article_1 | Article_4 | Article_5 | |
Article_3: | Bothciting | Article_1 | Article_2 | |
Article_4: | Bothcited | Article_1 | Article_2 | Article_5 |
Article_5: | Bothcited | Article_1 | Article_2 | Article_4 |
可以从图中看出,机器推理结果与人工推理结果相符,推理结果正确。
而之前的搜索模式,用户只能查看当下的文献内容以及相关信息,但是并不能给他们与此文献相关的信息,特别是现在信息时代,海量的文献数据,如果都是一个个去查看文献内容本身的话,是一项非常巨大的工程,就如图5旧模式下的搜索一样。
如图5所示,旧模式下,只能提供该文献的相关信息,比如内容、标题、关键字等,缺乏与其它相关文献之间的交互。在本发明中我们检索出了与此文献在具有足够的相关性的文献列表,这样给用户推荐了很有价值的信息,大大的方便了用户在海量资源中获取想要的资源。
上述实例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人是能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。
Claims (4)
1.一种基于本体的智能语义文献检索推理系统,其特征在于所述系统包括:
本体库,所述本体库构建有文献领域内关于文献的知识内容;
规则库,采用规则获得关于文献新的属性与原有属性的逻辑关系;
显示界面,用于提示用户进行输入操作,并将检索推理结果展示给用户。
2.根据权利要求1所述的基于本体的智能语义文献检索推理系统,其特征在于所述本体库包括文章、作者、出版社本体;本体的数据类型包括内容、标题、关键字,本体的对象属性包括引用,被引用属性。
3.根据权利要求1所述的基于本体的智能语义文献检索推理系统,其特征在于所述规则库是对本体的对象属性规则的描述和说明,所加载的规则推理机为Reasoner推理机。
4.一种采用权利要求1所述的智能语义文献检索推理系统进行展示的方法,其特征在于所述方法包括以下步骤:
(1)构建权利要求1所述的智能语义文献检索推理系统;
(2)用户在显示界面上输入需要检索的关键词,并进行检索查询;
(3)权利要求1所述的智能语义文献检索推理系统导入规则库,将与关键词相关的语义检索结果检索出来,并通过显示界面展示给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104414401A CN102930030A (zh) | 2012-11-08 | 2012-11-08 | 基于本体的智能语义文献检索推理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104414401A CN102930030A (zh) | 2012-11-08 | 2012-11-08 | 基于本体的智能语义文献检索推理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102930030A true CN102930030A (zh) | 2013-02-13 |
Family
ID=47644827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012104414401A Pending CN102930030A (zh) | 2012-11-08 | 2012-11-08 | 基于本体的智能语义文献检索推理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102930030A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744984A (zh) * | 2014-01-15 | 2014-04-23 | 北京理工大学 | 一种利用语义信息检索文档的方法 |
CN104361017A (zh) * | 2014-10-17 | 2015-02-18 | 同济大学 | 一种基于统一语义理解的交通信息处理方法 |
CN106777340A (zh) * | 2017-01-13 | 2017-05-31 | 腾讯科技(深圳)有限公司 | 一种标签的确定方法及相关设备 |
CN116244306A (zh) * | 2023-01-10 | 2023-06-09 | 江苏理工学院 | 基于知识组织语义关系的学术论文引文推荐方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101295303A (zh) * | 2007-04-28 | 2008-10-29 | 李树德 | 基于智能本体的知识搜索引擎及其实现方法 |
CN102609512A (zh) * | 2012-02-07 | 2012-07-25 | 北京中机科海科技发展有限公司 | 异构信息知识挖掘与可视化分析系统及方法 |
CN102622453A (zh) * | 2012-04-20 | 2012-08-01 | 北京邮电大学 | 基于本体的食品安全事件语义检索系统 |
-
2012
- 2012-11-08 CN CN2012104414401A patent/CN102930030A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101295303A (zh) * | 2007-04-28 | 2008-10-29 | 李树德 | 基于智能本体的知识搜索引擎及其实现方法 |
CN102609512A (zh) * | 2012-02-07 | 2012-07-25 | 北京中机科海科技发展有限公司 | 异构信息知识挖掘与可视化分析系统及方法 |
CN102622453A (zh) * | 2012-04-20 | 2012-08-01 | 北京邮电大学 | 基于本体的食品安全事件语义检索系统 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744984A (zh) * | 2014-01-15 | 2014-04-23 | 北京理工大学 | 一种利用语义信息检索文档的方法 |
CN103744984B (zh) * | 2014-01-15 | 2017-01-25 | 北京理工大学 | 一种利用语义信息检索文档的方法 |
CN104361017A (zh) * | 2014-10-17 | 2015-02-18 | 同济大学 | 一种基于统一语义理解的交通信息处理方法 |
CN104361017B (zh) * | 2014-10-17 | 2018-06-05 | 同济大学 | 一种基于统一语义理解的交通信息处理方法 |
CN106777340A (zh) * | 2017-01-13 | 2017-05-31 | 腾讯科技(深圳)有限公司 | 一种标签的确定方法及相关设备 |
CN116244306A (zh) * | 2023-01-10 | 2023-06-09 | 江苏理工学院 | 基于知识组织语义关系的学术论文引文推荐方法及系统 |
CN116244306B (zh) * | 2023-01-10 | 2023-11-03 | 江苏理工学院 | 基于知识组织语义关系的学术论文引文推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101566988A (zh) | 一种模糊语义搜索方法、系统及设备 | |
WO2014160379A1 (en) | Dimensional articulation and cognium organization for information retrieval systems | |
CN101894143A (zh) | 一种联邦检索及检索结果集成展现方法及系统 | |
CN109657072B (zh) | 一种应用于政府辅助决策的智能搜索web系统及方法 | |
CN103279458B (zh) | 一种领域本体的构建及实例化方法 | |
CN103440287A (zh) | 一种基于产品信息结构化的Web问答检索系统 | |
CN101350033B (zh) | 一种owl信息到关系数据库的转换方法及装置 | |
Del Gratta et al. | Converting the PAROLE SIMPLE CLIPS Lexicon into RDF with lemon | |
CN102930030A (zh) | 基于本体的智能语义文献检索推理系统 | |
Louhdi et al. | Transformation rules for building owl ontologies from relational databases | |
Zhang et al. | Construction of fuzzy ontologies from fuzzy XML models | |
Wagh et al. | Information retrieval based on semantic similarity using information content | |
Gunaratna et al. | Alignment and dataset identification of linked data in semantic web | |
Salast et al. | Olap2datacube: An ontowiki plug-in for statistical data publishing | |
Gupta et al. | Semantic query optimisation with ontology simulation | |
Behkamal et al. | Publishing Persian linked data; challenges and lessons learned | |
Tang et al. | Risk minimization based ontology mapping | |
Bagui et al. | Mapping rdf and rdf-schema to the entity relationship model | |
Dai et al. | Search Engine System Based on Ontology of Technological Resources. | |
Suryanarayana et al. | Stepping towards a semantic web search engine for accurate outcomes in favor of user queries: Using RDF and ontology technologies | |
CN102521239B (zh) | 一种基于owl的互联网问答信息匹配系统及其匹配方法 | |
Li et al. | User personalization mechanism in agentbased meta search engine | |
Wang et al. | A thesaurus and online encyclopedia merging method for large scale domain-ontology automatic construction | |
Varanka et al. | Topographic mapping data semantics through data conversion and enhancement | |
Wenting et al. | Research on semantic retrieval for communication ontology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130213 |
|
RJ01 | Rejection of invention patent application after publication |