CN107180103A - 搜索更便捷快速的交互系统 - Google Patents

搜索更便捷快速的交互系统 Download PDF

Info

Publication number
CN107180103A
CN107180103A CN201710398348.4A CN201710398348A CN107180103A CN 107180103 A CN107180103 A CN 107180103A CN 201710398348 A CN201710398348 A CN 201710398348A CN 107180103 A CN107180103 A CN 107180103A
Authority
CN
China
Prior art keywords
data storehouse
incremental data
module
connects
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710398348.4A
Other languages
English (en)
Inventor
肖雪松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Bright Technology Co Ltd
Original Assignee
Chengdu Bright Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Bright Technology Co Ltd filed Critical Chengdu Bright Technology Co Ltd
Priority to CN201710398348.4A priority Critical patent/CN107180103A/zh
Publication of CN107180103A publication Critical patent/CN107180103A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了搜索更便捷快速的交互系统,包括交互模块和工作数据库,所述工作数据库连接一个临时增量数据库,所述临时增量数据库连接一个更新增量数据库,所述更新增量数据库连接一个筛选模块,所述筛选模块连接一个本地文件子系统,所述本地文件子系统连接一个分布式文件子系统,所述筛选模块与交互模块连接。

Description

搜索更便捷快速的交互系统
技术领域
本发明涉及一种系统,具体涉及搜索更便捷快速的交互系统。
背景技术
随着互联网的快速发展,人们正处于一个信息爆炸的时代。相对于过去的信息匮乏,面对现阶段海量的信息数据,对信息的筛选和过滤成为了衡量一个系统好坏的重要指标。同时,一个具有良好用户体验的系统,会将海量信息进行筛选和过滤,并将用户最感兴趣的信息展现在用户面前。在一定程度上,这大大增加了系统工作的效率,另一方面也节省了用户筛选信息的时间。搜索引擎的出现在一定程度上解决了信息筛选问题,但仅仅是搜索引擎是不够的。虽然搜索引擎可以帮助用户在输入关键词之后对海量信息进行筛选,从而在搜索结果中找寻所需的内容。以Google、Baidu为代表的搜索引擎已为人们熟知,它们都具有基于关键字、通用性较强等特点。但当用户无法准确描述自己的需求时,搜索引擎的搜索效果将受到很大影响,而用户将自己的需求和意图转化成关键词的过程本身就是一个并不轻松的过程。因此,推荐系统在一定程度上具有良好的引导和帮助用户找到所需内容的作用,使得用户在使用搜索系统的过程中具有良好的体验。
发明内容
本发明所要解决的技术问题是现有的用户搜索系统不能准确的把握用户想要搜索的内容,效率较低,目的在于提供搜索更便捷快速的交互系统,解决不能根据用户自身兴趣快速准确的提供搜索内容的问题。
本发明通过下述技术方案实现:
搜索更便捷快速的交互系统,包括交互模块和工作数据库,所述工作数据库连接一个临时增量数据库,所述临时增量数据库连接一个更新增量数据库,所述更新增量数据库连接一个筛选模块,所述筛选模块连接一个本地文件子系统,所述本地文件子系统连接一个分布式文件子系统,所述筛选模块与交互模块连接;
所述工作数据库为用于和当前用户兴趣内容做相似度比较,根据相似度排序储存资源的数据库;
所述更新增量数据库用于存储一个时间周期内网站更新的内容;
所述临时增量数据库用于存储接着上次爬取断点爬取到的内容;
所述交互模块用于分析用户的兴趣爱好,常输入关键字;
所述筛选模块用于筛选用户在更新增量数据库中交互模块中得到关键字;
所述本地文件子系统用于存储通过筛选模块中的网页数据;
所述分布式文件子系统,用于同步所述本地文件子系统中的网页数据。
所述的搜索更便捷快速的交互系统,所述本地文件子系统包括URL过滤器,所述URL过滤器用于对收集的网页数据进行重排。
所述的搜索更便捷快速的交互系统,所述URL过滤器为基于二进制数组bitSet的过滤器。
本发明与现有技术相比,具有如下的优点和有益效果:
1、本发明搜索更便捷快速的交互系统,本系统能准确的把握用户想要搜索的内容,根据用户日常搜索的内容找到用户的兴趣爱好,在通过搜索的内容首先推送用户兴趣爱好相关的内容,更加方便用户搜索,在获取需要的资源时更加快捷;
2、本发明搜索更便捷快速的交互系统,本系统的搜索的效率更高,有效过滤不必要的内容,搜索更加快速。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
如图1所示,本发明搜索更便捷快速的交互系统,包括交互模块和工作数据库,所述工作数据库连接一个临时增量数据库,所述临时增量数据库连接一个更新增量数据库,所述更新增量数据库连接一个筛选模块,所述筛选模块连接一个本地文件子系统,所述本地文件子系统连接一个分布式文件子系统,所述筛选模块与交互模块连接;
所述工作数据库为用于和当前用户兴趣内容做相似度比较,根据相似度排序储存资源的数据库;
所述更新增量数据库用于存储一个时间周期内网站更新的内容;
所述临时增量数据库用于存储接着上次爬取断点爬取到的内容;
所述交互模块用于分析用户的兴趣爱好,常输入关键字;
所述筛选模块用于筛选用户在更新增量数据库中交互模块中得到关键字;
所述本地文件子系统用于存储通过筛选模块中的网页数据;
所述分布式文件子系统,用于同步所述本地文件子系统中的网页数据。
所述本地文件子系统包括URL过滤器,所述URL过滤器用于对收集的网页数据进行重排。
所述URL过滤器为基于二进制数组bitSet的过滤器。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.搜索更便捷快速的交互系统,其特征在于,包括交互模块和工作数据库,所述工作数据库连接一个临时增量数据库,所述临时增量数据库连接一个更新增量数据库,所述更新增量数据库连接一个筛选模块,所述筛选模块连接一个本地文件子系统,所述本地文件子系统连接一个分布式文件子系统,所述筛选模块与交互模块连接;
所述工作数据库为用于和当前用户兴趣内容做相似度比较,根据相似度排序储存资源的数据库;
所述更新增量数据库用于存储一个时间周期内网站更新的内容;
所述临时增量数据库用于存储接着上次爬取断点爬取到的内容;
所述交互模块用于分析用户的兴趣爱好,常输入关键字;
所述筛选模块用于筛选用户在更新增量数据库中交互模块中得到关键字;
所述本地文件子系统用于存储通过筛选模块中的网页数据;
所述分布式文件子系统,用于同步所述本地文件子系统中的网页数据。
2.根据权利要求1所述的搜索更便捷快速的交互系统,其特征在于,所述本地文件子系统包括URL过滤器,所述URL过滤器用于对收集的网页数据进行重排。
3.根据权利要求2所述的搜索更便捷快速的交互系统,其特征在于,所述URL过滤器为基于二进制数组bitSet的过滤器。
CN201710398348.4A 2017-05-31 2017-05-31 搜索更便捷快速的交互系统 Pending CN107180103A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710398348.4A CN107180103A (zh) 2017-05-31 2017-05-31 搜索更便捷快速的交互系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710398348.4A CN107180103A (zh) 2017-05-31 2017-05-31 搜索更便捷快速的交互系统

Publications (1)

Publication Number Publication Date
CN107180103A true CN107180103A (zh) 2017-09-19

Family

ID=59835405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710398348.4A Pending CN107180103A (zh) 2017-05-31 2017-05-31 搜索更便捷快速的交互系统

Country Status (1)

Country Link
CN (1) CN107180103A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316832A (ja) * 2002-04-25 2003-11-07 Sekisui Chem Co Ltd 汎用解析システムおよび汎用解析処理プログラムならびに汎用解析処理プログラムを記録した記録媒体
US6701318B2 (en) * 1998-11-18 2004-03-02 Harris Corporation Multiple engine information retrieval and visualization system
KR20050086052A (ko) * 2004-02-24 2005-08-30 (주)윕스 인터넷을 이용한 특허검색서비스 제공방법
CN1932813A (zh) * 2006-10-08 2007-03-21 张弘 借助精选图片在视屏上的自动插播实现个性化信息交互的方法
US20110302145A1 (en) * 2010-06-08 2011-12-08 Optify, Inc. Recommending link placement opportunities
CN102314463A (zh) * 2010-07-07 2012-01-11 北京瑞信在线系统技术有限公司 分布式爬虫系统及其提取网页数据的方法
US20130060745A1 (en) * 2011-09-01 2013-03-07 Dean Steinbeck System, Method, Circuit and Associated Software for Locating and/or Uploading Data Objects
CN104809154A (zh) * 2015-03-19 2015-07-29 百度在线网络技术(北京)有限公司 用于资讯推荐的方法及装置
CN105320740A (zh) * 2015-09-22 2016-02-10 清华大学 微信文章以及公众号的获取方法及获取系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6701318B2 (en) * 1998-11-18 2004-03-02 Harris Corporation Multiple engine information retrieval and visualization system
JP2003316832A (ja) * 2002-04-25 2003-11-07 Sekisui Chem Co Ltd 汎用解析システムおよび汎用解析処理プログラムならびに汎用解析処理プログラムを記録した記録媒体
KR20050086052A (ko) * 2004-02-24 2005-08-30 (주)윕스 인터넷을 이용한 특허검색서비스 제공방법
CN1932813A (zh) * 2006-10-08 2007-03-21 张弘 借助精选图片在视屏上的自动插播实现个性化信息交互的方法
US20110302145A1 (en) * 2010-06-08 2011-12-08 Optify, Inc. Recommending link placement opportunities
CN102314463A (zh) * 2010-07-07 2012-01-11 北京瑞信在线系统技术有限公司 分布式爬虫系统及其提取网页数据的方法
US20130060745A1 (en) * 2011-09-01 2013-03-07 Dean Steinbeck System, Method, Circuit and Associated Software for Locating and/or Uploading Data Objects
CN104809154A (zh) * 2015-03-19 2015-07-29 百度在线网络技术(北京)有限公司 用于资讯推荐的方法及装置
CN105320740A (zh) * 2015-09-22 2016-02-10 清华大学 微信文章以及公众号的获取方法及获取系统

Similar Documents

Publication Publication Date Title
CN107145496B (zh) 基于关键词将图像与内容项目匹配的方法
TWI524193B (zh) 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法
CN108647276B (zh) 一种搜索方法
CN103810168A (zh) 检索应用的方法、装置及终端
CN101464897A (zh) 一种词匹配及信息查询方法及装置
CA2675216A1 (en) Method and system for information discovery and text analysis
CN102799610A (zh) 网络信息收藏方法及系统
CN103116635B (zh) 面向领域的暗网资源采集方法和系统
CN105468744A (zh) 一种实现税务舆情分析和全文检索的大数据平台
CN105528422A (zh) 一种主题爬虫处理方法及装置
CN107145497B (zh) 基于图像和内容的元数据选择与内容匹配的图像的方法
CN107766399A (zh) 用于使图像与内容项目匹配的方法和系统及机器可读介质
CN106294358A (zh) 一种信息的检索方法及系统
CN102314443A (zh) 搜索引擎的修正方法和系统
CN103744887A (zh) 一种用于人物搜索的方法、装置和计算机设备
CN103077254A (zh) 网页获取方法和装置
CN107463592A (zh) 用于将内容项目与图像匹配的方法、设备和数据处理系统
CN102508884A (zh) 热点事件与实时评论的获取方法及装置
CN102609539A (zh) 一种搜索方法和系统
CN105653576A (zh) 信息搜索的方法及装置、人工座席服务方法及系统
CN102737045A (zh) 一种相关度计算方法和装置
CN106021440A (zh) 一种搜索方法及装置
CN112417248A (zh) 寻址关键词的推荐方法、装置、模型、设备和存储介质
CN105786871A (zh) 基于搜索词的问答类搜索结果呈现方法和装置
CN103227791A (zh) 一种无线数据采集的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170919

RJ01 Rejection of invention patent application after publication