CN102402538A - 一种自动更新搜索网页的方法和装置 - Google Patents

一种自动更新搜索网页的方法和装置 Download PDF

Info

Publication number
CN102402538A
CN102402538A CN2010102817451A CN201010281745A CN102402538A CN 102402538 A CN102402538 A CN 102402538A CN 2010102817451 A CN2010102817451 A CN 2010102817451A CN 201010281745 A CN201010281745 A CN 201010281745A CN 102402538 A CN102402538 A CN 102402538A
Authority
CN
China
Prior art keywords
url
search
webpage
keyword
once
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102817451A
Other languages
English (en)
Inventor
袁林
赵黎斌
莫灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shiji Guangsu Information Technology Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN2010102817451A priority Critical patent/CN102402538A/zh
Publication of CN102402538A publication Critical patent/CN102402538A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

一种自动更新搜索网页的方法,该方法包括:以输入关键词进行搜索得到搜索网页,根据用户指令在所述搜索网页中确定网页地址URL,保存所述URL和所述URL对应的内容;当所述URL对应的内容发生变化,更新所述URL对应的内容得到所述URL最新对应的内容,保存所述URL最新对应的内容;由所述关键词再次进行搜索得到再次搜索网页,根据用户指令在所述再次搜索网页中确定URL,保存再次确定的URL和所述再次确定的URL对应的内容。本文还公开了一种自动更新搜索网页的装置。应用本发明实施例以后,能够自动辨别出更新后的搜索网页内容。

Description

一种自动更新搜索网页的方法和装置
技术领域
本发明涉及互联网技术领域,更具体地,涉及一种自动更新搜索网页的方法和装置。
背景技术
互联网的发展日新月异,网络中的内容多种多样且涉及的领域极广。在众多的网络内容中搜索所关注的内容并不是一件容易实现的事情。现有技术中,利用搜索引擎对网络中的内容进行关键词搜索,可以得到与关键词相关的网页。然而,网页内容随着时间迅速变化,以相同的关键词搜索,相关网页的数目在不同的时间搜索结果是不同的,用户难以辨认搜索结果是否是最新网页。
发明内容
本发明实施例提出一种自动更新搜索网页的方法,能够自动辨别出更新后的搜索网页。
本发明实施例还提出一种自动更新搜索网页的装置,能够自动辨别出更新后的搜索网页。
本发明实施例的技术方案如下:
一种自动更新搜索网页的方法,该方法包括:
以关键词进行搜索得到搜索网页,根据用户指令在所述搜索网页中确定网页地址URL,保存所述URL和所述URL对应的内容;
当所述URL对应的内容发生变化,更新所述保存的URL对应的内容,并保存所述URL最新对应的内容;
再次由所述关键词进行搜索得到再次搜索网页,根据用户指令在所述再次搜索网页中确定URL,保存再次确定的URL和所述再次确定的URL对应的内容。
所述以关键词进行搜索之前进一步包括,注册用户以注册用户名登录。
所述以关键词进行搜索之前进一步包括,非注册用户首先注册用户名,然后再以所述注册用户名登录。
所述URL对应的内容发生变化包括,抓取所述URL的状态信息,若所述状态信息发生变化则所述URL对应的内容发生变化。
所述状态信息包括更新时间、网页内容长度、网页编码格式、关键字数量统计和关键词上下文。
所述更新包括,标记所述URL,对带有标记的URL的内容进行更新得到所述URL最新对应的内容。
所述以关键词进行搜索得到搜索网页之后,所述根据用户的指令在所述搜索网页中确定URL之前进一步包括,显示其它用户以所述关键词进行搜索所确定的URL。
所述保存再次确定的URL后进一步包括,以表格的形式输出首次确定的URL和再次确定的URL,供其它用户以所述关键词进行搜索。
所述登录之前进一步包括,分类显示所述URL的关注排名。
一种自动更新搜索网页的装置,所述装置包括,
搜索模块,用于以关键词进行搜索得到搜索网页,由所述关键词再次进行搜索得到再次搜索网页;
确定模块,用于根据用户指令在搜索网页中确定网页地址URL,保存所述URL和所述URL对应的内容;根据用户指令在所述再次搜索网页中确定URL,保存再次确定的URL和所述再次确定的URL对应的内容;
更新模块,用于当所述URL对应的内容发生变化,更新所述URL对应的内容,并保存所述URL最新对应的内容。
所述装置进一步包括登录模块,用于验证用户名,以便注册用户成功登录。
所述装置进一步包括注册模块,用于注册用户名。
所述更新模块包括判断单元,用于抓取所述URL的状态信息,若所述状态信息发生变化则判断所述URL对应的内容发生变化。
所述更新模块进一步包括标记单元和控制单元,
所述标记单元,用于当判断所述URL对应的内容发生变化,标记所述URL;
所述控制单元,用于更新带有标记的URL的内容。
所述装置进一步包括显示模块,用于显示其它用户以所述关键词进行搜索所确定的URL。
所述装置进一步包括分享模块,当其它用户以所述关键词进行搜索时,用于输出所述确定模块确定的URL。
所述括显示模块,进一步用于分类显示所述URL的关注排名。
从上述技术方案中可以看出,在本发明实施例中,以输入关键词进行搜索得到搜索网页,根据用户指令在所述搜索网页中确定网页地址URL,保存所述URL和所述URL对应的内容;当所述URL对应的内容发生变化,更新并保存所述URL对应的最新内容;从而及时更新所保存的URL对应的内容。再次由所述关键词进行搜索得到再次搜索网页,根据用户指令在所述再次搜索网页中确定URL,保存再次确定的URL和所述再次确定的URL对应的内容。即利用相同的关键词再次进行搜索时,由用户指令确定增加的URL。采用上述技术方案,当辨别出更新后的搜索网页的内容,自动更新所确定URL对应的内容。
附图说明
图1为本发明实施例自动更新搜索网页的方法流程示意图;
图2为本发明实施例自动更新搜索网页的装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点表达得更加清楚明白,下面结合附图及具体实施例对本发明再作进一步详细的说明。
在本发明实施例中,充分利用关键词进行搜索,保存搜索到网页所对应的URL,并及时更新该URL对应的内容;然后,利用同样的关键词,再次进行搜索;在再次搜索网页中,由用户指令确定保存的增加网页对应的URL。采用上述技术方案,当辨别出搜索网页内容更新后,自动更新所确定URL对应的内容。用户不必频繁登陆相关网站查询网页内容的变化。
参见附图1是自动更新搜索网页的方法流程示意图,具体包括以下步骤:
步骤101、用户登录。
当用户是注册用户,则直接登录;当用户是非注册用户,则需要现进行注册,然后在登录。
用户通过编写注册用户名,输入验证码和设置的密码,以注册用户名。当成功注册用户名,只需要输入注册用户名和密码就可以登录。
当用户未登录时,还可以分类显示URL的关注排名。即任何用户都可以看到分类显示的当前URL的排名,URL的关注用户越多,则该URL的排名靠前。用户就可以迅速得知目前大家最关注的网页。
步骤102、关键词搜索。
用户输入关键词,根据该关键词进行搜索得到搜索网页。利用关键词搜索是现有技术,本文不再赘述。
步骤103、确定URL。
在根据用户输入的关键词进行搜索获得搜索网页后,此时还显示其它用户根据同样的关键词搜索所关注的URL。用户根据其它用户所关注的URL和自身的需求在搜索网页中确定URL,然后发出指令。保存用户确定的URL和其对应的内容。
步骤104、判断URL对应的内容发生变化。
抓取URL的状态信息,如果该状态信息中的任意一个参数发生变化,则判断URL发生变化。其中,URL的状态信息包括更新时间、网页内容长度、网页编码格式、关键字数量统计和关键词上下文。
更新时间就是指URL的状态信息更新时所记录的时间,若更新时间发生变化则意味着URL的状态信息发生变化。网页内容长度和网页编码格式均是记载网页的相关信息,若网页内容发生变化,则网页内容长度和网页编码根式都会发生相应的变化。关键词数量统计和关键词上下文的变化也代表网页内容的变化。
步骤105、更新URL对应的内容。
当用户确定的URL对应的网页内容发生变化后,首先标记URL,然后对带有标记的URL进行内容更新。即将由用户确定的URL对应的最新的内容替换其原有的内容,得到并保存URL最新对应的内容。
步骤106、关键词再次搜索。
根据步骤101中的关键词再次进行搜索,得到再次搜索网页。
步骤107、再次确定URL。
用户根据自身的需求,在再次搜索网页中确定增加的URL后,发送用户指令。保存用户再次确定的URL和其对应的内容。如果用户再次确定URL,则实行步骤108;否则,执行步骤109。
步骤108、增加URL。
将在步骤107中用户再次确定的URL增加到用户所确定URL的列表内。此时,用户所确定的URL的列表包括在步骤103所确定URL和在步骤107确定的URL。
步骤109、分享URL。
用户的URL分享至其它用户。即当其它用户以同样的关键词进行搜索时,输出该用户保存的URL。
参见附图2是自动更新搜索网页的装置结构示意图。
注册模块201,用于注册用户名。
登录模块202,用于验证用户名,以便注册用户成功登录。
搜索模块203,用于以输入关键词进行搜索得到搜索网页,由相同的关键词再次进行搜索得到再次搜索网页。
显示模块204,用于显示其它用户以相同关键词进行搜索所确定的URL,进一步用于分类显示所述URL的关注排名。。
确定模块205,用于根据用户指令在搜索网页中确定URL,保存该URL和该URL对应的内容;根据用户指令在再次搜索网页中确定URL,保存再次确定的URL和再次确定的URL对应的内容。
更新模块206,用于当URL对应的内容发生变化,更新URL对应的内容得到URL最新对应的内容,保存URL最新对应的内容。
分享模块207,当其它用户以相同关键词进行搜索时,用于输出确定模块203所确定的URL。
更新模块206包括:
判断单元2061,用于根据步骤104判断所述URL对应的内容发生变化。
标记单元2062,用于当URL对应的内容发生变化,标记URL;
控制单元2063,用于更新带有标记的URL的内容。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (17)

1.一种自动更新搜索网页的方法,其特征在于,该方法包括:
以关键词进行搜索得到搜索网页,根据用户指令在所述搜索网页中确定网页地址URL,保存所述URL和所述URL对应的内容;
当所述URL对应的内容发生变化,更新所述保存的URL对应的内容,并保存所述URL最新对应的内容;
再次由所述关键词进行搜索得到再次搜索网页,根据用户指令在所述再次搜索网页中确定URL,保存再次确定的URL和所述再次确定的URL对应的内容。
2.根据权利要求1所述自动更新搜索网页的方法,其特征在于,所述以关键词进行搜索之前进一步包括,注册用户以注册用户名登录。
3.根据权利要求1所述自动更新搜索网页的方法,其特征在于,所述以关键词进行搜索之前进一步包括,非注册用户首先注册用户名,然后再以所述注册用户名登录。
4.根据权利要求1所述自动更新搜索网页的方法,其特征在于,所述URL对应的内容发生变化包括,抓取所述URL的状态信息,若所述状态信息发生变化则所述URL对应的内容发生变化。
5.根据权利要求4所述自动更新搜索网页的方法,其特征在于,所述状态信息包括更新时间、网页内容长度、网页编码格式、关键字数量统计和关键词上下文。
6.根据权利要求1所述自动更新搜索网页的方法,其特征在于,所述更新包括,标记所述URL,对带有标记的URL的内容进行更新得到所述URL最新对应的内容。
7.根据权利要求1所述自动更新搜索网页的方法,其特征在于,所述以关键词进行搜索得到搜索网页之后,所述根据用户的指令在所述搜索网页中确定URL之前进一步包括,显示其它用户以所述关键词进行搜索所确定的URL。
8.根据权利要求1所述自动更新搜索网页的方法,其特征在于,所述保存再次确定的URL后进一步包括,以表格的形式输出首次确定的URL和再次确定的URL,供其它用户以所述关键词进行搜索。
9.根据权利要求2或3所述自动更新搜索网页的方法,其特征在于,所述登录之前进一步包括,分类显示所述URL的关注排名。
10.一种自动更新搜索网页的装置,其特征在于,所述装置包括,
搜索模块,用于以关键词进行搜索得到搜索网页,由所述关键词再次进行搜索得到再次搜索网页;
确定模块,用于根据用户指令在搜索网页中确定网页地址URL,保存所述URL和所述URL对应的内容;根据用户指令在所述再次搜索网页中确定URL,保存再次确定的URL和所述再次确定的URL对应的内容;
更新模块,用于当所述URL对应的内容发生变化,更新所述URL对应的内容,并保存所述URL最新对应的内容。
11.根据权利要求10所述自动更新搜索网页的装置,其特征在于,所述装置进一步包括登录模块,用于验证用户名,以便注册用户成功登录。
12.根据权利要求11所述自动更新搜索网页的装置,其特征在于,所述装置进一步包括注册模块,用于注册用户名。
13.根据权利要求10所述自动更新搜索网页的装置,其特征在于,所述更新模块包括判断单元,用于抓取所述URL的状态信息,若所述状态信息发生变化则判断所述URL对应的内容发生变化。
14.根据权利要求10或13所述自动更新搜索网页的装置,其特征在于,所述更新模块进一步包括标记单元和控制单元,
所述标记单元,用于当判断所述URL对应的内容发生变化,标记所述URL;
所述控制单元,用于更新带有标记的URL的内容。
15.根据权利要求10所述自动更新搜索网页的装置,其特征在于,所述装置进一步包括显示模块,用于显示其它用户以所述关键词进行搜索所确定的URL。
16.根据权利要求10所述自动更新搜索网页的装置,其特征在于,所述装置进一步包括分享模块,当其它用户以所述关键词进行搜索时,用于输出所述确定模块确定的URL。
17.根据权利要求15所述自动更新搜索网页的装置,其特征在于,所述括显示模块,进一步用于分类显示所述URL的关注排名。
CN2010102817451A 2010-09-13 2010-09-13 一种自动更新搜索网页的方法和装置 Pending CN102402538A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102817451A CN102402538A (zh) 2010-09-13 2010-09-13 一种自动更新搜索网页的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102817451A CN102402538A (zh) 2010-09-13 2010-09-13 一种自动更新搜索网页的方法和装置

Publications (1)

Publication Number Publication Date
CN102402538A true CN102402538A (zh) 2012-04-04

Family

ID=45884752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102817451A Pending CN102402538A (zh) 2010-09-13 2010-09-13 一种自动更新搜索网页的方法和装置

Country Status (1)

Country Link
CN (1) CN102402538A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765766A (zh) * 2015-02-28 2015-07-08 北京奇艺世纪科技有限公司 一种监测视频更新的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101004749A (zh) * 2006-12-26 2007-07-25 朱莉君 一种互联网用户交流平台的构建方法
CN101211340A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 基于客户端/服务端结构的动态网络爬行器
CN101432714A (zh) * 2004-09-14 2009-05-13 A9.Com公司 自动生成推荐链接的方法和设备
EP2570935A1 (en) * 2010-06-11 2013-03-20 ZTE Corporation Method for personalized meta-search and application terminal thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101432714A (zh) * 2004-09-14 2009-05-13 A9.Com公司 自动生成推荐链接的方法和设备
CN101004749A (zh) * 2006-12-26 2007-07-25 朱莉君 一种互联网用户交流平台的构建方法
CN101211340A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 基于客户端/服务端结构的动态网络爬行器
EP2570935A1 (en) * 2010-06-11 2013-03-20 ZTE Corporation Method for personalized meta-search and application terminal thereof

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765766A (zh) * 2015-02-28 2015-07-08 北京奇艺世纪科技有限公司 一种监测视频更新的方法和装置
CN104765766B (zh) * 2015-02-28 2019-05-24 北京奇艺世纪科技有限公司 一种监测视频更新的方法和装置

Similar Documents

Publication Publication Date Title
CN102663062B (zh) 一种处理搜索结果中无效链接的方法及装置
US20090319449A1 (en) Providing context for web articles
CN106462565A (zh) 在文档内更新文本
CN104484790A (zh) 一种物流业务的地址匹配方法及装置
US10621255B2 (en) Identifying equivalent links on a page
CN102662703A (zh) 一种应用程序插件加载方法及装置
CN103544213A (zh) 网站内容更新检测评价方法及系统
CN103514199A (zh) Poi数据处理方法及其装置、poi检索方法及其装置
CN102761627A (zh) 基于终端访问统计的云网址推荐方法及系统及相关设备
CN103578015A (zh) 一种商品属性导航的实现方法及装置
CN103294781A (zh) 一种用于处理页面数据的方法与设备
CN102164186A (zh) 一种实现云搜索服务的方法及系统
CN104391786A (zh) 网页自动化测试系统及其方法
CN104216992A (zh) 一种信息处理方法及装置
CN104462547A (zh) 一种可配置的网页数据采集的方法及系统
CN101441629A (zh) 一种非结构化网页信息的自动采集方法
CN102591874A (zh) 提示方法、终端和服务器
CN110309386B (zh) 一种网页爬取的方法和装置
CN104572832B (zh) 一种需求元模型构建方法及装置
CN103455938B (zh) 一种数据处理方法、装置及服务器设备
US9984161B2 (en) Accounting for authorship in a web log search engine
CN104424188A (zh) 对获取的网页数据进行更新的系统及方法
CN105138572A (zh) 获取用户标签的关联度权值的方法和装置
CN103841168A (zh) 数据副本更新方法及元数据服务器
CN102402538A (zh) 一种自动更新搜索网页的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD.

Effective date: 20131021

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518044 SHENZHEN, GUANGDONG PROVINCE TO: 518057 SHENZHEN, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20131021

Address after: 518057 Tencent Building, 16, Nanshan District hi tech park, Guangdong, Shenzhen

Applicant after: Shenzhen Shiji Guangsu Information Technology Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

RJ01 Rejection of invention patent application after publication

Application publication date: 20120404

RJ01 Rejection of invention patent application after publication