CN102880625A - 一种基于族性检索的通用数据库检索新方法 - Google Patents

一种基于族性检索的通用数据库检索新方法 Download PDF

Info

Publication number
CN102880625A
CN102880625A CN2012101111163A CN201210111116A CN102880625A CN 102880625 A CN102880625 A CN 102880625A CN 2012101111163 A CN2012101111163 A CN 2012101111163A CN 201210111116 A CN201210111116 A CN 201210111116A CN 102880625 A CN102880625 A CN 102880625A
Authority
CN
China
Prior art keywords
retrieval
search
information
universal database
family
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101111163A
Other languages
English (en)
Inventor
张进飞
张少文
郑凌坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PCI Suntek Technology Co Ltd
Original Assignee
PCI Suntek Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PCI Suntek Technology Co Ltd filed Critical PCI Suntek Technology Co Ltd
Priority to CN2012101111163A priority Critical patent/CN102880625A/zh
Publication of CN102880625A publication Critical patent/CN102880625A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种基于族性检索的通用数据库检索的模型,并提出在该模型下的常用快速检索(Quick Search)、普通检索(General Search)和高级检索(Advanced Search)三种方法,另外还有保存检索历史的方法。该检索新方法的发明从学科分类角度检索所需信息,采用分类号检索或分类浏览。该检索方法的查全率较高,可以比较全面地获取与某一学科或专业相关的文献或信息。同时该检索方法的查准率较高,可以较迅速地获取某一特定文献或信息。

Description

一种基于族性检索的通用数据库检索新方法
技术领域
本发明涉及计算机搜索引擎组合优化技术领域。随着Internet上的信息量急剧增加,如何使用户获得有用的信息已成为Web信息检索研究急需解决的问题。文中提出了一种基于族性检索的通用数据库检索新方法,该方法综合了一系列措施,提高了搜索的精度又提高了搜索的效率。在数据库、WEB信息检索方面提供了高效精准的搜索引擎及搜索方法。 
背景技术
数据库搜索是建立在计算机长期的技术积累的基础之上,包括软件和服务,数据存储、数据仓库、智能检索、虚拟化技术、资源调度等关键技术。 
传统的数据库检索技术基于关键词匹配进行检索,往往存在查不全、查不准、检索质量不高的现象,特别是在网络信息时代,利用关键词匹配很难满足人们检索的要求。基于族性检索的通用数据库检索新方法采用分类号检索或分类浏览,同时采用分词词典、同义词典,同音词典改善检索效果,比如用户查询“云计算”,与“cloud computer”相关的信息也能检索出来;进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。另外,基于族性检索的通用数据库检索新方法还包括歧义信息和检索处理,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。 
发明内容
本发明基于模型。对通用数据库快速检索、普通检索、高级检索三个不同的检索途径的支持。 
为实现上述发明目的,本发明提供一种基于族性检索的通用数据库检索新方法。提供了多种数据库检索方式。 
快速检索(Quick Search)可以检索文章标题,作者摘要和关键词。可以通过使用AND,OR,NOT等逻辑运算符连接词或词组,一次性可检索最多达50个词或词组。 
普通检索(General Search),第一步可以通过对作者(Author)、团体作者(Group Author)、来源文献(Source Title)、地址(Address)、会议信息(Conference),以及通配符、布尔逻辑算符的设定来进行检索。 
高级检索(Advanced Search)页面允许检索者使用两个字符的字段标识符和集合号码建一个复杂的检索式,可以在同一个检索式中同时使用字段标识符和集合号。例如:检索者想要检索在2012年Washington,D.C召开的67nd Annual Meeting of the Transportation Research Board会议的有关IT systems的会议录,可以使用字段标识符组配检索的方式输入以下检索式:ts=intelligent transport*and cf=(transport*and Washington and 2012。 
智能识别,其特征在于,该检索方法可智能记忆,记忆检索历史、创建定题定时定量定范畴追踪(Saved Histories and Created Alerts),检索者可以将检索策略保存在本地计算机或者ISI的服务器上。保存在服务器上则允许检索者创建定题跟踪服务并更容易管理检索者的检索历史。该功能既可用于普通检索也可用于高级检索。 
保存检索历史并可同时创建定题服务。如果希望定题服务中包含前面所有的检索式,检索者必须将前面的检索结果集合组配起来创建一个新的检索式,例如检索集合#3,检索者可以在左侧的复选框中勾选并选用AND或者OR逻辑算符将其组配起来。如果检索者想获得检索历史中最后一个检索操作的定题服务,,检索者可以每周或者每月收到按照其检索式检索得到的检索结果,可以通过点击邮件中给出的超链接到Web of Science浏览全记录。 
检索者可以通过“管理检索历史和定题服务(Managing Histories and Alerts)”功能来对定题跟踪服务的类型、邮件格式、邮件发送频率、接收者邮件地址以及定题跟踪服务有效期等进行管理。 
在“记录标记与检索结果的处理(Marking and Processinf Records)”中,检索者可以对需要输出记录、需要的数据字段、输出选项进行不同的选择。 
实现异构数据库的跨库检索,传统的DBMS(数据库管理系统)已经很难解决。基于族性检索的通用数据库检索新方法进行异构数据库之间的连接和数据转换,接受用户对些数据库的并行交叉访问和查询,对查询结果进行融合处理并反馈给用户端。 
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。 
图1基于族性检索的通用数据库检索方法流程图为本发明模型的流程示意图: 
1.分析检索课题,针对检索的课题,进行智能设置。 
2.族性检索分析,系统自动进行智能族性检索分析,为检索精准缩小范围,提高检索性能。 
3.确定数据库类型: 
选择数据库,一是要看是否易于获取原文,二是要根据课题的文献需要量,三是要看数据库的收录年限。 
4.选择/设置检索关键字: 
数据库所设检索关键字多少不一,较为常用的有: 
a分类:利用分类名和分类号进行检索。检索结果:该类目所有文章。检索特征:全。 
b题名:利用篇名中的字、词或部分进行检索。检索结果:篇名中包含该字该词或该部分的所有文章。检索特征:准。 
c主题/关键词:利用反映文献内容的主题词进行检索。检索结果:包含该主题词(关键词)的所有文章。检索特征:全。 
d作者:利用作者姓名进行检索(全称或单字)。检索结果:该作者的所有文章。 
e出处:利用原文献的刊载处进行检索。检索结果:该刊载处刊登的所有文章。 
f全文关键词:利用文献题名和正文中的关键词进行检索。检索结果: 正文和标题中包含该关键词的所有文章(全文数据库设置)。检索特征:全;有一定的误检率。 
g全文自由词(任意词):利用任意字或词进行检索。检索结果:包含任意字或词的所有文章(全文数据库设置)。检索特征:全;误检率高;注意使用特征字词。 
h年份检索:利用年份进行检索。检索结果:该年份发表的所有文章;不单独使用。检索特征:新;具有针对性和限制性。 
5.选择/设置检索逻辑: 
在准确理解检索课题内容的基础上,提炼出能够确切反映课题内容的主题词,并选择出合适的检索词(关键词)。选择检索词应注意选择同义词和相关词,并适当控制检索词的内涵和外延。 
设置检索逻辑,选择逻辑算符。检索时要根据课题的需要,及时调节检索词之间的数量关系及逻辑组配关系。 
6.执行检索 
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。 
实施例,参见图1。 
在初次检索后出现的检索结果——概要(Serarch Result——Summary)页面,检索者可通过主题(标题、文摘、关键词和词组)在检索结果中进行二次检索,从而生成一个新的集合,而无须进行集合的组合便可提高检准率,并生成另一个检索结果页面。检索命中结果数目显示记录的条数也可以进行选择,检索者还可以以最新日期、相关度、第一作者字顺、来源文献名、会议名称等任一种排序方式对显示记录进行排序。同时点击检索结果概要显示页面的 “Analyze”可对检索结果进行分析。 
然后是提炼检索结果(Refine Results),检索者可以通过点击任意一个字段链接对检索结果进一步完善(出现频率最高的条目会在列表最上方,括号中的数字表示了出现在概要页面上的包含该条目的记录数)。 
再选中一检索结果点击显示其全记录(Full Record)页面,ISI Proceedings记录中的字段包括:标题(Title)、作者(Author)、参考文献(Cited References)、相关记录(Related Records)、会议信息(Conference Information)、作者地址(Adress)、摘要(Abstracts)、附加关键词(Keywords Plus)、作者关键词(Author Keyworks)、作者电子邮件地址(Author Email Adress)、学科分类(Subject Category)。检索者在此页面可以通过点击Citation Alert创建引文跟踪服务来跟踪这篇文章未来的被引用状况。基于内容的链接(View record in)连接到其它主题数据库看到专业的主题信息;如相关网站、相关互联网免费资源等。 

Claims (5)

1.一种基于族性检索的通用数据库检索新方法模型,其特征在于,包括:对通用数据库快速检索、普通检索、高级检索三个不同的检索途径的支持。
2.查全率较高,其特征在于,从学科分类角度检索所需信息,采用分类号检索或分类浏览,减少资源的碎片,提高资源的使用率,可以比较全面地获取与某一学科或专业相关的文献或信息。
3.查准率较高,其特征在于,通过族性检索智能自动分析判别搜索内容,确认并分类数据库类型,精准确定搜索目标,同时提供智能关键字设置及搜索逻辑智能设置,可以达到迅速地准确获取文献或信息的目标。
4.查询效率高,其特征在于,结合族性检索及智能分析、数据库精准分类,计算全局网络拓扑路径最小的全局最优解,减少网络通信的代价,提高搜索整体的性能。
5.智能识别,其特征在于,该检索方法可智能记忆,记忆检索历史、创建定题定时定量定范畴追踪(Saved Histories and Created Alerts),检索者可以将检索策略保存在本地计算机或者ISI的服务器上。保存在服务器上则允许检索者创建定题跟踪服务并更容易管理检索者的检索历史。该功能既可用于普通检索也可用于高级检索。
CN2012101111163A 2012-04-11 2012-04-11 一种基于族性检索的通用数据库检索新方法 Pending CN102880625A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101111163A CN102880625A (zh) 2012-04-11 2012-04-11 一种基于族性检索的通用数据库检索新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101111163A CN102880625A (zh) 2012-04-11 2012-04-11 一种基于族性检索的通用数据库检索新方法

Publications (1)

Publication Number Publication Date
CN102880625A true CN102880625A (zh) 2013-01-16

Family

ID=47481953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101111163A Pending CN102880625A (zh) 2012-04-11 2012-04-11 一种基于族性检索的通用数据库检索新方法

Country Status (1)

Country Link
CN (1) CN102880625A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106282A (zh) * 2013-02-27 2013-05-15 王义东 一种网页搜索与展示的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1845104A (zh) * 2006-05-22 2006-10-11 赵开灏 信息智能检索加工的系统和方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1845104A (zh) * 2006-05-22 2006-10-11 赵开灏 信息智能检索加工的系统和方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106282A (zh) * 2013-02-27 2013-05-15 王义东 一种网页搜索与展示的方法
CN103106282B (zh) * 2013-02-27 2016-01-13 王义东 一种网页搜索与展示的方法

Similar Documents

Publication Publication Date Title
US10261954B2 (en) Optimizing search result snippet selection
Becker et al. Identifying content for planned events across social media sites
US9864808B2 (en) Knowledge-based entity detection and disambiguation
Cafarella et al. Structured data on the web
Cheng et al. EntityRank: searching entities directly and holistically
US8375021B2 (en) Search engine data structure
US20020138465A1 (en) Apparatus for and method of searching and organizing intellectual property information utilizing a classification system
CN102930060B (zh) 一种数据库快速索引的方法及装置
US20080065632A1 (en) Server, method and system for providing information search service by using web page segmented into several inforamtion blocks
Wang et al. A web service discovery approach based on common topic groups extraction
CN104123366A (zh) 一种搜索方法及搜索服务器
Xu et al. Wikipedia‐based topic clustering for microblogs
US20070271228A1 (en) Documentary search procedure in a distributed system
CN112269816B (zh) 一种政务预约事项相关性检索方法
US20160041975A1 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
CN103559258A (zh) 基于云计算的网页排序方法
Yafooz et al. Managing unstructured data in relational databases
Jepsen et al. Characteristics of scientific Web publications: Preliminary data gathering and analysis
CN109783599A (zh) 基于多种存储介质的知识图谱检索方法及系统
Lin et al. Entity relation discovery from web tables and links
CN102880625A (zh) 一种基于族性检索的通用数据库检索新方法
Willis et al. Finding information in books: Characteristics of full‐text searches in a collection of 10 million books
CN105868406A (zh) 基于多数据库的专利检索系统
Berlocher et al. TopicRank: bringing insight to users
Vagena et al. Semantic search over XML document streams

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C05 Deemed withdrawal (patent law before 1993)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130116