CN1838123A - 一种基于固定关键词的信息搜索方法及系统 - Google Patents

一种基于固定关键词的信息搜索方法及系统 Download PDF

Info

Publication number
CN1838123A
CN1838123A CN 200610020538 CN200610020538A CN1838123A CN 1838123 A CN1838123 A CN 1838123A CN 200610020538 CN200610020538 CN 200610020538 CN 200610020538 A CN200610020538 A CN 200610020538A CN 1838123 A CN1838123 A CN 1838123A
Authority
CN
China
Prior art keywords
keyword
information
fixed
search
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610020538
Other languages
English (en)
Other versions
CN100447788C (zh
Inventor
花欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNB2006100205384A priority Critical patent/CN100447788C/zh
Publication of CN1838123A publication Critical patent/CN1838123A/zh
Application granted granted Critical
Publication of CN100447788C publication Critical patent/CN100447788C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于固定关键词分的信息搜索方法及系统,涉及信息搜索领域,特别涉及利用固定关键词来实现精确搜索的技术。本发明中,系统预先设定固定关键词集合,即集合中的每个关键词是对某一概念的固定表述,并且预先由系统管理员设定,而在系统使用者提交信息和搜索信息时,只能在该关键词集合中选取关键词。本发明的有益效果是,通过在信息提交系统时,将系统设定的所有相关的关键词都与其关联,当用户根据选择的系统设定的关键词进行搜索时,覆盖率和精确率可以达到百分之百,既不会漏掉搜索者所需要的信息,也不会搜出搜索者不需要的信息。

Description

一种基于固定关键词的信息搜索方法及系统
技术领域
本发明涉及信息搜索领域,特别涉及利用固定关键词来实现精确搜索的技术。
背景技术
随着电子信息技术和网络技术的不断发展,基于计算机或者计算机网络的信息检索越来越受到人们的青睐。目前常用的互联网搜索引擎系统,一般是通过用户输入搜索关键词,系统按照存储信息与搜索之间的关联程度由高到低返回搜索结果列表,用户在此列表中进一步查找和选取有用的信息。对于非常庞大的信息库,系统返回用户的搜索结果通常是非常庞大的,从而给用户进一步查找有用的信息造成了负担。尽管现有的不少搜索引擎在努力解决中文切词、上下文关联、排序等问题,但是总会有一些非用户期望的信息会出现在搜索结果中,这种情况屡见不鲜,如果冗余垃圾信息过多,不但淹没了有用信息,而且打击了搜索者的积极性。
另一方面,一般搜索引擎采用的是精确匹配算法,由于系统中建立的信息索引和用户输入的查询关键词不是基于同一标准,会造成信息遗漏问题;如在信息的全文搜索中所定义的很多关键词信息会有一些同义词,比如“营销”和“销售”、“流程”和“过程”、“协作”和“合作”等,如果系统在建立索引时没有充分考虑关键词的关联性,用户在搜索时一般直接输入关键词,如果用户在搜索时不掌握一定的搜索技巧,没有多次尝试查询关键词的同义词或近义词,则很可能遗漏掉属于搜索意图中的信息,最后的结果是一无所获,既废时又废力。
还有常见的一种树形目录结构的信息搜索方法,只能局限于固定结构沿某一分支进行选择,不能跨多分支多类别综合交叉选择关键词,所以不能够精确搜索,同时还会有大量冗余信息。
发明内容
本发明的目是解决现有信息搜索方法和系统中存在的上述问题,提出一种预设固定关键词的信息搜索方法以及搜索系统。
本发明采用的技术方案是:本发明提出一种基于固定关键词信息搜索方法,系统预先设定固定关键词集合,即集合中的每个关键词是对某一概念的固定表述,并且预先由系统管理员设定,而在系统使用者提交信息和搜索信息时,只能在该关键词集合中选取关键词;所述系统使用者提交信息时,在预先设定的固定关键词集合中选择与其有关联的任何一个或多个关键词;从而任何系统使用者搜索以上提交的任何信息时,只能通过在预先设定的固定关键词集合中选择任何一个或多个关键词进行搜索。
进一步的,系统对所述固定关键词集合中的关键词进行分类,以便于信息提交及搜索时选择。
进一步的,所述固定关键词中的每一个关键词用于代表某一相同概念或相同思想的所有相近表述用词。
进一步的,所述关键词集合中添加新的固定关键词或修改关键词,只能由系统管理员统一进行,所述系统使用者不能创建、修改、删除任何关键词。
更进一步的,所述信息按照被提交时选择的一个或多个关键词建立索引。
本发明还提出一种基于固定关键词的信息搜索系统,所述搜索系统存储于信息搜索系统服务器,可以对用户的搜索请求进行响应,根据搜索请求从一个被索引的信息集合中选取出相匹配的信息,所述用户是指使用计算机或计算机网络的用户;本系统包括:系统管理员预先设定的固定关键词集合记录模块,信息提交时在预先设定的固定关键词集合中选择关键词的信息提交模块,以及信息搜索时在预先设定的固定关键词集合中选择关键词的信息搜索模块和存储信息集合的存储模块。
进一步的,所述关键词集合中的每个关键词用于代表某一相同概念或相同思想的所有相近表述用词。
更进一步的,在关键词集合中添加新的固定关键词或修改关键词,只能由系统管理员统一进行,所述系统使用者不能创建、修改、删除任何关键词。
结合以上所述,系统将所述关键词集合中的关键词进行分类,以便于信息提交及搜索时选取。
本发明的有益效果是,克服了现有搜索引擎方法不能在庞大的信息海洋中精确查找用户所需信息的缺点,通过在信息提交系统时,将系统设定的所有相关的关键词都与其关联,当用户根据选择的系统设定的关键词进行搜索时,覆盖率和精确率可以达到百分之百,即不会漏掉搜索者所需要的信息,也不会搜出搜索者不需要的信息。
附图说明
图1是本发明固定关键词集合建立过程基本流程图。
图2是本发明基于固定关键词的信息提交过程基本流程图。
图3是本发明基于固定关键词的信息搜索过程基本流程图。
图4是本发明的硬件应用环境示意图。
图5是本发明基于固定关键词的信息搜索系统功能模块图。
具体实施方式
如图1所示是系统管理员预先建立固定关键词集合过程的基本流程图。首先在系统建立时,系统管理员确定代表不同概念的关键词集合,并将确定的关键词集合应用于系统。如图2所示基于固定关键词的信息提交过程流程图,系统使用者进入系统,然后确定系统关键词集合中和所提交信息有关联关系的关键词,选择所确定的关联关键词,系统建立信息和关联关键词的索引关系并存储信息。如图3是本发明基于固定关键词的信息搜索过程流程图,系统使用者进入系统,首先选择系统关键词集合中和所搜索信息有关联关系的关键词,完成关键词提交,系统返回搜索结果结束。以下结合具体实施例子进行说明。某系统结合自身业务需要,结合面向用户搜索信息的种类特点,按照多种分类方式抽取其中的关键词,组成分为多个层次的关键词集合。设定按照“信息主题”来分类的多层次的关键词“家庭生活”、“教育学习”,“娱乐休闲”、“时事科技”等,其中的每一个关键词下进一步设定分层次的相关关键词,如“家庭生活”关键词,下设“服装”、“居住”、“饮食”、“保健”等关键词,“服装”关键词下又可以设置“上衣”、“裤装”、“裙装”等关键词。同时系统还可以按照“地域位置”、“时间”类别来确定的关键词。即同一系统可以设置多个类别的多层次的关键词集合;关键词集合按照类别归纳列举后,任何一个关键词用复选框方式显示,可以选中或取消选中,每个多层次的关键词通过一个可折叠和展开的方式来显示;选择采用折叠方式显示关键词,是因为大信息量比较大的系统可能会有成千上万个关键词,如果简单地按关键词组分类从上到下陈列在一个窗口中会很拥挤,界面不够友好。当系统使用者提交信息到系统时,进入提交界面,在关键词选择窗口中可以选择任何对应的关键词。考虑到搜索用户可以精确检索该信息,信息提交选择关键词时可以选择与其有关联关系的任何类别任何层次下的任何关键词。用户在搜索信息时,进入搜索界面,搜索界面主要提供了根据关键词进行搜索,系统一般弹出关键词选择窗口,可以是和提交文档时的关键词选择同一个窗口,在任何类别任何层次的关键词集合中选择与搜索目的信息相关的任何关键词,选择结束后确认,系统将搜索到具有这些关键词索引的所有信息,返回给用户。系统管理员负责关键词集合的管理,可以新增、修改系统关键词。随着信息规模的发展,系统中可能不断增加新的关键词,超级管理员可以根据信息类型概念来确定新的关键词。
如图4所示信息搜索用户通过计算机网络和信息搜索系统服务器相连。搜索用户可以在本地的计算机上访问信息搜索系统。如图5,是本发明基于固定关键词的信息搜索系统功能模块图,即信息系统2,包括预设的固定关键词集合记录模块21,信息提交模块22,信息搜索模块23,以及信息集合存储模块24。关键词集合记录模块21中记录的系统建立时设定的的固定关键词集合,是从不同维度提炼出能代表不同信息概念的关键词,不同关键词代表一个概念;每个关键词又可以细分为不同概念的若干关键词;同时,每一个关键词并不代表信息中必须一字不差地包含同样的字眼,而是代表一种内容的分类和归并思想,即相同思想和相同概念的相近表述的固定表达为一个关键词。系统管理员负责关键词集合的管理,可以新增、修改系统关键词。随着信息规模的发展,系统中可能不断增加新的关键词,管理员可以根据信息类型来确定新的关键词。信息提交模块22,用于完成作为用户搜索对象的信息与系统设定关键词集合中关键词的关联关系;即完成选择系统中设定的关键词集合中所有能反映信息内容的关联关键词,通过建立索引保存该信息与所选择关键词的关联关系。信息搜索模块23,完成用户在系统中搜索某一信息时,通过从系统设定好的关键词集合中选取关键词,结合相应的索引算法,系统可以快速准确地查找到和用户选择的关键词建立起关联的信息。信息集合存储模块24用来存储作为用户搜索对象的集合,该集合中的每一条信息,系统已经建立和其和所选择关键词的关联信息。
以上列举了本发明的一个实施方式,本发明并不限于以上实施方式中的风格和操作方式。

Claims (9)

1、一种基于固定关键词的信息搜索方法,其特征在于,系统预先设定固定关键词集合,即集合中的每个关键词是对某一概念的固定表述,并且预先由系统管理员设定,而在系统使用者提交信息和搜索信息时,只能在该关键词集合中选取关键词;所述系统使用者提交信息时,在预先设定的固定关键词集合中选择与其有关联的任何一个或多个关键词;从而任何系统使用者搜索以上提交的任何信息时,只能通过在预先设定的固定关键词集合中选择任何一个或多个关键词进行搜索。
2、如权利要求1所述基于固定关键词的信息搜索方法,其特征在于,系统对所述固定关键词集合中的关键词进行分类,以便于信息提交及搜索时选择。
3、如权利要求1或2所述基于固定关键词的信息搜索方法,其特征在于,所述固定关键词中的每一个关键词用于代表某一相同概念或相同思想的所有相近表述用词。
4、如权利要求1或2所述基于固定关键词的信息搜索方法,其特征在于,在所述关键词集合中添加新的固定关键词或修改关键词,只能由系统管理员统一进行,所述系统使用者不能创建、修改、删除任何关键词。
5、如权利要求1或2所述基于固定关键词的信息搜索方法,其特征在于,所述信息按照被提交时选择的一个或多个关键词建立索引。
6、一种基于固定关键词的信息搜索系统,所述搜索系统存储于信息搜索系统服务器,可以对用户的搜索请求进行响应,根据搜索请求从一个被索引的信息集合中选取出相匹配的信息,所述用户是指使用计算机或计算机网络的用户;其特征在于,本系统包括系统管理员预先设定的固定关键词集合的记录模块,信息提交时在预先设定的固定关键词集合中选择关键词的信息提交模块,以及信息搜索时在预先设定的固定关键词集合中选择关键词的信息搜索模块和存储信息集合的存储模块。
7、如权利要求6所述基于固定关键词的信息搜索系统,其特征在于,所述关键词集合中的每个关键词用于代表某一相同概念或相同思想的所有相近表述用词。
8、如权利要求6所述基于固定关键词的信息搜索系统,其特征在于,在关键词集合中添加新的固定关键词或修改关键词,只能由系统管理员统一进行,所述系统使用者不能创建、修改、删除任何关键词。
9、如权利要求6-8任一项所述基于固定关键词的信息搜索系统,其特征在于,系统将所述关键词集合中的关键词进行分类,以便于信息提交及搜索时选取。
CNB2006100205384A 2006-03-22 2006-03-22 一种基于固定关键词的信息搜索方法及系统 Expired - Fee Related CN100447788C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100205384A CN100447788C (zh) 2006-03-22 2006-03-22 一种基于固定关键词的信息搜索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100205384A CN100447788C (zh) 2006-03-22 2006-03-22 一种基于固定关键词的信息搜索方法及系统

Publications (2)

Publication Number Publication Date
CN1838123A true CN1838123A (zh) 2006-09-27
CN100447788C CN100447788C (zh) 2008-12-31

Family

ID=37015519

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100205384A Expired - Fee Related CN100447788C (zh) 2006-03-22 2006-03-22 一种基于固定关键词的信息搜索方法及系统

Country Status (1)

Country Link
CN (1) CN100447788C (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008141564A1 (fr) * 2007-05-23 2008-11-27 Fengxian Li Système et procédé pour réaliser une recherche précise d'informations
CN102750278A (zh) * 2011-04-18 2012-10-24 腾讯科技(深圳)有限公司 信息的获取方法和装置
CN102902671A (zh) * 2011-07-25 2013-01-30 腾讯科技(深圳)有限公司 广告系统中的搜索方法和装置
CN103425763A (zh) * 2013-08-05 2013-12-04 微梦创科网络科技(中国)有限公司 基于sns的用户推荐方法及装置
CN102902671B (zh) * 2011-07-25 2016-12-14 深圳市世纪光速信息技术有限公司 广告系统中的搜索方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1287323A (zh) * 2000-08-03 2001-03-14 王纤巧 动态分类目录
CN1598816A (zh) * 2003-09-16 2005-03-23 崇越科技股份有限公司 自动产生关键词分类表的系统
CN1609848A (zh) * 2003-10-23 2005-04-27 肖宁 预先定义关键词的电子文档搜索方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008141564A1 (fr) * 2007-05-23 2008-11-27 Fengxian Li Système et procédé pour réaliser une recherche précise d'informations
CN102750278A (zh) * 2011-04-18 2012-10-24 腾讯科技(深圳)有限公司 信息的获取方法和装置
CN102750278B (zh) * 2011-04-18 2017-04-26 深圳市世纪光速信息技术有限公司 信息的获取方法和装置
CN102902671A (zh) * 2011-07-25 2013-01-30 腾讯科技(深圳)有限公司 广告系统中的搜索方法和装置
CN102902671B (zh) * 2011-07-25 2016-12-14 深圳市世纪光速信息技术有限公司 广告系统中的搜索方法和装置
CN103425763A (zh) * 2013-08-05 2013-12-04 微梦创科网络科技(中国)有限公司 基于sns的用户推荐方法及装置

Also Published As

Publication number Publication date
CN100447788C (zh) 2008-12-31

Similar Documents

Publication Publication Date Title
US10671676B2 (en) Multiple index based information retrieval system
US8255386B1 (en) Selection of documents to place in search index
US9864808B2 (en) Knowledge-based entity detection and disambiguation
US7761447B2 (en) Systems and methods that rank search results
Balog et al. Formal models for expert finding in enterprise corpora
JP5175005B2 (ja) 情報検索システムにおけるフレーズに基づく検索方法
JP4944406B2 (ja) フレーズに基づく文書説明の生成方法
US8171043B2 (en) Methods for improving the diversity of image search results
US8078629B2 (en) Detecting spam documents in a phrase based information retrieval system
JP4944405B2 (ja) 情報検索システムにおけるフレーズに基づくインデックス化方法
WO2010003129A2 (en) A method for efficiently supporting interactive, fuzzy search on structured data
CN104123366A (zh) 一种搜索方法及搜索服务器
CN100447788C (zh) 一种基于固定关键词的信息搜索方法及系统
Wang et al. Re-ranking search results using semantic similarity
Zhu et al. Can phrase indexing help to process non-phrase queries?
Boddu et al. Knowledge discovery and retrieval on World Wide Web using web structure mining
Hagen et al. Candidate document retrieval for web-scale text reuse detection
Nuray-Turan et al. Exploiting web querying for web people search in weps2
Sathya et al. Link based K-Means clustering algorithm for information retrieval
Mourad et al. In-Depth Métan-Search Engine
Takashita et al. Tag recommendation for flickr using web browsing behavior
Damien et al. Improve web search diversification with intent subtopic mining
Patil et al. The Role of Web Content Mining and Web Usage Mining in Improving Search Result Delivery
Zhang et al. Collective intelligence-based web page search: Combining folksonomy and link-based ranking strategy
Sumalatha et al. Information Retrieval using Semantic Web Browser-Personalized and Categorical Web Search

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081231

Termination date: 20140322