CN103020214B - 访问网站历史记录信息处理方法和设备 - Google Patents

访问网站历史记录信息处理方法和设备 Download PDF

Info

Publication number
CN103020214B
CN103020214B CN201210526433.1A CN201210526433A CN103020214B CN 103020214 B CN103020214 B CN 103020214B CN 201210526433 A CN201210526433 A CN 201210526433A CN 103020214 B CN103020214 B CN 103020214B
Authority
CN
China
Prior art keywords
website
history information
statistical table
network address
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210526433.1A
Other languages
English (en)
Other versions
CN103020214A (zh
Inventor
陈佃晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201210526433.1A priority Critical patent/CN103020214B/zh
Publication of CN103020214A publication Critical patent/CN103020214A/zh
Application granted granted Critical
Publication of CN103020214B publication Critical patent/CN103020214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了访问网站历史记录信息处理方法和设备,该设备包括历史记录信息存储器,存储访问网站的历史记录信息;输入接口,获取要进行处理的历史记录信息;统计信息存储器,存储预定统计表,预定统计表中记录了在预设时间段内访问次数超过预设阀值的网站的网址;判断器,对于获取的每条访问网站的历史记录信息,判断该网址是否在预定统计表中;第一清除器,在判断结果为否时清除该条历史记录信息;第二清除器,在判断结果为是时确定历史记录信息中的网站所属的网站类型,并根据清除规则来清除该条访问网站的历史记录信息;统计表更新器,根据网址更新预定统计表。本发明解决了在清除访问网站的历史记录信息时,无法将有用信息保留的问题。

Description

访问网站历史记录信息处理方法和设备
技术领域
本发明涉及计算机技术领域,具体涉及一种访问网站历史记录信息处理方法和设备。
背景技术
当通过浏览器访问网站时,浏览器中记录有访问网站的信息,此为访问网站的历史记录信息。该访问网站的历史记录信息,随着访问过的网站的不断增多,而不断增加。然而,计算机终端具有有限的存储资源,因此,需要对访问网站的历史记录信息进行清除。现有技术中的清除方式为在清除时,将历史记录信息全部清除。例如,当清除cookie信息,会将cookie文件中的全部信息清除。因此,现有技术中存在无法将访问网站的历史记录信息中的有用信息保留的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的访问网站历史记录信息处理方法和设备。
依据本发明的一个方面,提供了一种访问网站历史记录信息处理方法。该方法包括步骤:对于每条访问网站的历史记录信息,判断该历史记录信息中的网址是否在预定统计表中,如果不在预定统计表中,则清除该条访问网站的历史记录信息,如果在预定统计表中,则确定历史记录信息中的网站所属的网站类型,并根据与所确定的网站类型相对应的清除规则来清除该条访问网站的历史记录信息;统计对各个网站的访问次数,并在预定统计表中记录在预设时间段内访问次数超过预设阀值的网站的网址。
可选地,在判断该历史记录信息中的网址是否在预定统计表中之前,判断该历史记录信息中的网址是否存在于网站收藏夹中,如果存在,则不清除该条访问网站的历史记录信息。
可选地,访问网站的历史记录信息包括:在浏览器中访问过的网站URL信息和网站在浏览器中设置的cookie信息。
可选地,网站类型至少包括如下类型之一:社区网站类型、电商网站类型、搜索引擎类型和媒体网站类型。
可选地,与搜索引擎类型对应的清除规则包括:仅保留该访问网站的网站URL信息;与社区网站类型、电商网站类型和/或媒体网站类型对应的清除规则包括:保留该访问网站的网站URL信息以及保留该访问网站的cookie信息。
可选地,预定统计表中为每个网站记录该网站的域名以及对该网站的访问次数。并且,统计对各个网站的访问次数,并在预定统计表中记录在预设时间段内访问次数超过预设阀值的网站的网址的步骤包括:接收访问网站的网址,提取网址的域名,增加预定统计表中与该域名相对应的网站的访问次数,并定期删除预定统计表中预设时间段内访问次数小于预设阀值的网站。
可选地,判断该历史记录信息的网址是否在预定统计表中的步骤包括:将历史记录信息中的网址所包括的域名信息与预定统计表中的域名进行匹配,如果匹配成功,则该历史记录信息的网址在预定统计表中,否则,该网址不在预定统计表中。
依据本发明的一个方面,提供了一种访问网站历史记录信息处理设备,该设备包括:历史记录信息存储器,存储访问网站的历史记录信息;输入接口,耦接到历史记录信息存储器,以获取要进行处理的访问网站的历史记录信息;统计信息存储器,存储预定统计表,该预定统计表中记录了在预设时间段内访问次数超过预设阀值的网站的网址;判断器,耦接到输入接口,对于获取的每条访问网站的历史记录信息,判断该历史记录信息中的网址是否在预定统计表中,得出判断结果;第一清除器,耦接到判断器,在判断结果为该历史记录信息中的网址不在预定统计表中时,清除该条访问网站的历史记录信息;第二清除器,耦接到判断器,在判断结果为该历史记录信息中的网址在预定统计表中时,确定历史记录信息中的网站所属的网站类型,并根据与所确定的网站类型相对应的清除规则来清除该条访问网站的历史记录信息;统计表更新器,耦接到统计信息存储器,根据访问网站的网址更新预定统计表的内容。
可选地,判断器,还适于在判断该历史记录信息中的网址是否在预定统计表中之前,判断该历史记录信息中的网址是否存在于网站收藏夹中,如果存在,则不向第一或者第二清除器给出判断结果,以便不清除该条访问网站的历史记录信息。
可选地,统计表更新器适于:接收访问网站的网址,提取网址的域名,增加预定统计表中与该域名相对应的网站的访问次数,并定期删除预定统计表中预设时间段内访问次数小于预设阀值的网站。
可选地,判断器适于:将历史记录信息中的网址所包括的域名信息与预定统计表中的域名进行匹配,如果匹配成功,则判断结果为该历史记录信息的网址在预定统计表中,否则,判断结果为该历史记录信息的网址不在预定统计表中。
根据本发明的技术方案,在清除访问网站的历史记录信息时,根据预定统计表对访问网站的历史记录信息进行清除。当历史记录信息中的网址不在预定统计表中时,清除该条访问网站的历史记录信息;当历史记录信息中的网址在预定统计表中时,确定历史记录信息中的网站所属的网站类型,并根据与所确定的网站类型相对应的清除规则来清除该条访问网站的历史记录信息。因此,本发明可以根据预定统计表,确定对访问网站的历史记录信息是否全部清除,并且对于仅部分清除的访问网站的历史记录信息,还可以根据网站所属的网站类型,按不同的清除规则来清除该条访问网站的历史记录信息。
由此,本发明的技术方案能够针对每条访问网站的历史记录信息采用对应的清除策略,由此解决了在清除访问网站的历史记录信息时,无法将有用信息保留的问题,取得了能够对每条访问网站的历史记录信息进行个性化清理,进而能够既实现历史记录信息清理又保留有用信息的有益效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的访问网站历史记录信息处理设备的结构图;
图2示出了根据本发明一个实施例的访问网站历史记录信息处理方法的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参见图1,示出了根据本发明一个实施例的访问网站历史记录信息处理设备的结构图。该设备包括历史记录信息存储器100、统计信息存储器200、输入接口300、判断器400、第一清除器500、第二清除器600和统计表更新器700。
历史记录信息存储器100中存储访问网站的历史记录信息。举例而言,访问网站的历史记录信息包括:在浏览器中访问过的网站URL信息和网站在浏览器中设置的cookie信息。本实施例中,访问网站的历史记录信息不限于此,还可以按具体需要包括其他信息,在此没有特别限制。
统计信息存储器200中存储预定统计表。预定统计表中记录了在预设时间段内访问次数超过预设阀值的网站的网址。
统计表更新器700耦接到统计信息存储器200,根据访问网站的网址更新预定统计表的内容。具体而言,统计表更新器700接收访问网站的网址,提取网址的域名,增加预定统计表中与该域名相对应的网站的访问次数,并定期删除预定统计表中预设时间段内访问次数小于预设阀值的网站。
举例而言,统计信息存储器200中存储如下所示的预定统计表。预定统计表中每行与日期对应,该行中记录该日期内各个域名的访问次数。在举例中,预设时间段为最近7天,预设阀值为5。在预定统计表中,对于每个域名将最近7天的访问次数相加,得出该域名在7天内的总访问次数。
www.baidu.com t.sina.com qzone.com www.amzon.com......
2012-10-1 1 5 3 2......
2012-10-2 0 4 0 0............
0 0 0 1......
2012-10-7 1 4 3 0......
总计 2 13 6 3......
表一
其中,统计表更新器700检测浏览器地址栏,地址栏中每次输入URL并点击回车后,从地址栏的URL中提取一级域名,做一次写操作,增加预定统计表中该域名在当天的访问次数。例如,当前日期为2012年10月2日,统计表更新器700检测到浏览器地址栏中发生访问后,提取出地址栏中输入的URL的一级域名qzone.com。将日期2012年10月2日对应的行中与qzone.com对应的列的一项中访问次数加1。统计表更新器700还定期将总访问次数小于5的域名所在列从预定统计表中删除,以及将7天前记录的各个域名的访问次数删除,即将7天前的日期所对应的行删除。
输入接口300耦接到历史记录信息存储器100,以获取要进行处理的访问网站的历史记录信息。
判断器400耦接到输入接口300,判断该历史记录信息中的网址是否存在于网站收藏夹中,如果存在,则不向第一清除器500和第二清除器600给出判断结果,以便不清除该条访问网站的历史记录信息。
判断器400在判断出该历史记录信息中的网址不存在于网站收藏夹中后,对于获取的每条访问网站的历史记录信息,判断该历史记录信息中的网址是否在预定统计表中,得出判断结果。具体而言,判断器400将历史记录信息中的网址所包括的域名信息与预定统计表中的域名进行匹配,如果匹配成功,则判断结果为该历史记录信息的网址在预定统计表中,否则,判断结果为该历史记录信息的网址不在预定统计表中。
上述判断器400的操作仅为示例性说明,判断器400也可以直接判断历史记录信息中的网址是否在预定统计表中,而不判断历史记录信息中的网址是否存在于网站收藏夹中。
第一清除器500耦接到判断器400,在判断结果为该历史记录信息中的网址不在预定统计表中时,清除该条访问网站的历史记录信息。
第二清除器600耦接到判断器400,在判断结果为该历史记录信息中的网址在预定统计表中时,确定历史记录信息中的网站所属的网站类型,并根据与所确定的网站类型相对应的清除规则来清除该条访问网站的历史记录信息。
举例而言,网站类型至少包括如下类型之一:社区网站类型、电商网站类型、搜索引擎类型和媒体网站类型。
与搜索引擎类型对应的清除规则包括:仅保留该访问网站的网站URL信息。
与社区网站类型、电商网站类型和媒体网站类型对应的清除规则包括:保留该访问网站的网站URL信息以及保留该访问网站的cookie信息。
第二清除器600可以通过查找第二清除器600中存储的网站类型表来确定历史记录信息中的网站所属的网站类型,也可以通过云端查询,从云服务器中查找网站类型表来确定历史记录信息中的网站所属的网站类型。网站类型表如下所示。其中,每行对应一种网站类型,各列依据访问量排序,记录访问网站的一级域名。
表二
在该举例中,判断器400对于每条网站URL信息,例如“HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\TypedUrls“中的每项的数据,将每条网站URL信息中的一级域名与预定统计表中的域名进行匹配。如果匹配不成功,则由第一清除器500将该条网站URL信息清除,并且将该条网站URL相关的历史访问记录在浏览器中设置的cookie信息清除。如果匹配成功,则由第二清除器600根据网站的URL确定网站的类型,并根据类型来决定如何进行记录清除。在该举例中,对于社区网站类型、电商网站类型、搜索引擎类型和媒体网站类型,第二清除器600会保留网站URL信息。但是对于该条网站URL相关的历史访问记录在浏览器中设置的cookie信息,则由第二清除器600根据网站类型表确定网站所属的网站类型,如果所属的网站类型为搜索引擎类型,则清除该cookie信息,如果所属的网站类型为社区网站类型、电商网站类型或媒体网站类型,则保留该cookie信息。
以下以具体的某个网站为例,对本发明中设备进行详细说明。
每天在开启任意浏览器之前,统计表更新器700将统计信息存储器200中存储的预定统计表中7天前的记录删除,并删除最近7天内访问次数少于5的域名对应的记录。建立当天日期对应的行。当浏览器地址栏中输入www.renren.com,并点击回车后,增加预定统计表中www.renren.com的当天的访问次数。
在清除访问网站的历史信息记录时,输入接口300获取要进行处理的访问网站的历史记录信息。
判断器400对存储在“HKEY_CURRENT_USER\Software\Microsoft\InternetExplorer\TypedUrls”(对应于本发明中的历史记录信息存储器)中的与www.renren.com相关的数据进行判断,判断出数据中一级域名与预定统计表中www.renren.com匹配,第二清除器600通过查找网站类型表确定www.renren.com为社区网站类型,保留该条网站URL信息。
第二清除器随后在“%cookies%,%cookies%/low”中查找与renren.com相关的cookie信息,由于第二清除器600确定www.renren.com为社区网站类型,根据预定规则,保留该cookie信息。
上述设备包括历史记录信息存储器100、统计信息存储器200、输入接口300、判断器400、第一清除器500、第二清除器600和统计表更新器700的结构为一种可选的实现方式,本发明不限于此。特别地,统计表更新器700为可选装置。当实现对预定统计表进行自动更新时,选择在设备中包含统计表更新器700。当对预定统计表不进行自动更新,例如预定统计表为配置表时,设备可以不包括统计表更新器700。
参见图2,示出了根据本发明一个实施例的访问网站历史记录信息处理方法的流程图。本实施例中方法开始于步骤S210,在该步骤中,逐条读取访问网站的历史记录信息,对每条访问网站的历史记录信息进行清除处理。访问网站的历史记录信息包括:在浏览器中访问过的网站URL信息和网站在浏览器中设置的cookie信息。本实施例中,访问网站的历史记录信息不限于此,还可以按具体需要包括其他信息,在此没有特别限制。
对于每条访问网站的历史记录信息,首先执行步骤S220,判断该历史记录信息中的网址是否存在于网站收藏夹中,如果存在,则执行步骤S230,如果不存在,则执行步骤S240。在步骤S230中,不清除该条访问网站的历史记录信息,该方法结束。
在步骤S240中,判断该历史记录信息中的网址是否在预定统计表中,如果不在预定统计表中,则执行步骤S250,如果在预定统计表中,则执行步骤S260。具体而言,在步骤S240中,将历史记录信息中的网址所包括的域名信息与预定统计表中的域名进行匹配,如果匹配成功,则该历史记录信息的网址在预定统计表中,执行步骤S260。否则,该网址不在预定统计表中,执行步骤S250。在步骤S250中,清除该条访问网站的历史记录信息,该方法结束。
上述的步骤S220和步骤S230为本实施例中的可选步骤,本实施例中也可以在执行步骤S210之后直接执行步骤S240。在此种方式下,对每条历史记录信息中的网址是否存在于网站收藏夹中不做判断,直接判断每条历史记录信息中的网址是否在预定统计表中。
其中,本实施例中方法还可以包括统计对各个网站的访问次数,并在预定统计表中记录在预设时间段内访问次数超过预设阀值的网站的网址的步骤。具体而言,预定统计表中为每个网站记录该网站的域名以及对该网站的访问次数。在统计时,接收访问网站的网址,提取网址的域名,增加预定统计表中与该域名相对应的网站的访问次数,并定期删除预定统计表中预设时间段内访问次数小于预设阀值的网站。
举例而言,预定统计表如表一所示。预定统计表中每行与日期对应,该行中记录该日期内各个域名的访问次数。在该举例中,预设时间段为最近7天,预设阀值为5。在预定统计表中,对于每个域名将最近7天的访问次数相加,得出该域名在7天内的总访问次数。在统计各个网站的访问次数时,检测浏览器地址栏,地址栏中每次输入URL并点击回车后,从地址栏的URL中提取一级域名,做一次写操作,增加预定统计表中该域名在当天的访问次数。例如,当前日期为2012年10月2日,检测到浏览器地址栏中发生访问后,提取出地址栏中输入的URL的一级域名qzone.com。将日期2012年10月2日对应的行中与qzone.com对应的列的一项中访问次数加1。此外,在该举例中,方法定期将总访问次数小于5的域名所在列从预定统计表中删除,以及将7天前记录的各个域名的访问次数删除,即将7天前的日期所对应的行删除。由此,通过该举例中步骤,对预定统计表中的记录进行自动更新。
在步骤S260中,确定历史记录信息中的网站所属的网站类型,并根据与所确定的网站类型相对应的清除规则来清除该条访问网站的历史记录信息,该方法结束。
举例而言,网站类型至少包括如下类型之一:社区网站类型、电商网站类型、搜索引擎类型和媒体网站类型。
与搜索引擎类型对应的清除规则包括:仅保留该访问网站的网站URL信息。与社区网站类型、电商网站类型和媒体网站类型对应的清除规则包括:保留该访问网站的网站URL信息以及保留该访问网站的cookie信息。
在步骤S260中,可以通过查找本地存储的网站类型表来确定历史记录信息中的网站所属的网站类型,也可以通过云端查询,从云服务器中查找网站类型表来确定历史记录信息中的网站所属的网站类型。网站类型表如表二所示。其中,每行对应一种网站类型,各列依据访问量排序,记录访问网站的一级域名。
在进行清除时,在步骤S240中,对于每条网站URL信息,例如“HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\TypedUrls“中的每项的数据,将每条网站URL信息中的一级域名与预定统计表中的域名进行匹配。如果匹配不成功,则执行步骤S250。在步骤S250中将该条网站URL信息清除,并且将该条网站URL相关的历史访问记录在浏览器中设置的cookie信息清除。如果匹配成功,则执行步骤S260。在步骤S260中,根据网站的URL确定网站的类型,并根据类型来决定如何进行记录清除。在该举例中,对于社区网站类型、电商网站类型、搜索引擎类型和媒体网站类型,会保留网站URL信息。但是对于该条网站URL相关的历史访问记录在浏览器中设置的cookie信息,根据网站类型表确定网站所属的网站类型,如果所属的网站类型为搜索引擎类型,则清除该条cookie信息,如果所属的网站类型为社区网站类型、电商网站类型或媒体网站类型,则保留该条cookie信息。
以下以具体的某个网站为例,对本发明中方法进行详细说明。
每天在开启任意浏览器之前,将存储的预定统计表中7天前的记录删除,并删除最近7天内访问次数少于5的域名对应的记录。建立当天日期对应的行。当浏览器地址栏中输入www.renren.com,并点击回车后,增加预定统计表中www.renren.com的当天的访问次数。
在清除访问网站的历史信息记录时,获取要进行处理的访问网站的历史记录信息。
对“HKEY_CURRENT_USER\Software\Microsoft\InternetExplorer\TypedUrls”中与www.renren.com相关的数据进行判断,判断出数据中一级域名与预定统计表中www.renren.com匹配,则通过查找网站类型表确定www.renren.com为社区网站类型,保留该条网站URL信息。
随后在“%cookies%,%cookies%/low”中查找与renren.com相关的cookie信息,因为www.renren.com为社区网站类型,根据预定规则,保留该cookie信息。
通过本发明中技术方案,在清除访问网站的历史记录信息时,会将近期频繁访问的网站的历史记录信息根据访问网站的类型进行保留。在用户使用经常访问的网站时,不必因为历史记录信息被完全清除而重复输入信息,例如重复输入网站URL,登录信息、查看的新闻类型,以及购物车等信息。实现了对每条访问网站的历史记录信息的个性化清理,在节省存储空间的同时,更好地为用户使用提供便利。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的访问网站历史记录信息处理设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种访问网站历史记录信息处理方法,其中,访问网站的历史记录信息为:当通过浏览器访问网站时,浏览器中记录的访问网站的信息;包括步骤:
对于每条访问网站的历史记录信息,判断该历史记录信息中的网址是否在预定统计表中;其中所述预定统计表中,为每个网站记录该网站的域名以及对该网站的访问次数;
如果不在所述预定统计表中,则清除该条访问网站的历史记录信息;
如果在所述预定统计表中,则确定所述历史记录信息中的网站所属的网站类型,并根据与所确定的网站类型相对应的清除规则来清除该条访问网站的历史记录信息;
统计对各个网站的访问次数,并在预定统计表中记录在预设时间段内访问次数超过预设阀值的网站的网址;具体包括:接收访问网站的网址,提取网址的域名,增加所述预定统计表中与该域名相对应的网站的访问次数,并定期删除预定统计表中预设时间段内访问次数小于预设阀值的网站;
所述访问网站的历史记录信息包括:在浏览器中访问过的网站URL信息和网站在浏览器中设置的cookie信息。
2.根据权利要求1所述的方法,还包括步骤:
在判断该历史记录信息中的网址是否在预定统计表中之前,判断该历史记录信息中的网址是否存在于网站收藏夹中,如果存在,则不清除该条访问网站的历史记录信息。
3.根据权利要求1或2任一项所述的方法,其中,
所述网站类型至少包括如下类型之一:社区网站类型、电商网站类型、搜索引擎类型和媒体网站类型。
4.根据权利要求3所述的方法,其中,
与所述搜索引擎类型对应的清除规则包括:仅保留该访问网站的网站URL信息;
与所述社区网站类型、电商网站类型和/或媒体网站类型对应的清除规则包括:保留该访问网站的网站URL信息以及保留该访问网站的cookie信息。
5.根据权利要求1所述的方法,其中,
所述判断该历史记录信息的网址是否在预定统计表中的步骤包括:
将历史记录信息中的网址所包括的域名信息与预定统计表中的域名进行匹配,如果匹配成功,则该历史记录信息的网址在预定统计表中,否则,该网址不在预定统计表中。
6.一种访问网站历史记录信息处理设备,其中,访问网站的历史记录信息为:当通过浏览器访问网站时,浏览器中记录的访问网站的信息;该设备包括:
历史记录信息存储器,存储访问网站的历史记录信息;
输入接口,耦接到历史记录信息存储器,以获取要进行处理的访问网站的历史记录信息;
统计信息存储器,存储预定统计表,所述预定统计表中记录了在预设时间段内访问次数超过预设阀值的网站的网址;
判断器,耦接到输入接口,对于获取的每条访问网站的历史记录信息,判断该历史记录信息中的网址是否在预定统计表中,得出判断结果;
第一清除器,耦接到判断器,在判断结果为该历史记录信息中的网址不在预定统计表中时,清除该条访问网站的历史记录信息;
第二清除器,耦接到判断器,在判断结果为该历史记录信息中的网址在预定统计表中时,确定所述历史记录信息中的网站所属的网站类型,并根据与所确定的网站类型相对应的清除规则来清除该条访问网站的历史记录信息;
统计表更新器,耦接到统计信息存储器,根据访问网站的网址更新预定统计表的内容;具体包括:接收访问网站的网址,提取网址的域名,增加预定统计表中与该域名相对应的网站的访问次数,并定期删除预定统计表中预设时间段内访问次数小于预设阀值的网站;
所述访问网站的历史记录信息包括:在浏览器中访问过的网站URL信息和网站在浏览器中设置的cookie信息。
7.根据权利要求6所述的设备,其中,
所述判断器还适于在判断该历史记录信息中的网址是否在预定统计表中之前,判断该历史记录信息中的网址是否存在于网站收藏夹中,如果存在,则不向所述第一或者第二清除器给出判断结果,以便不清除该条访问网站的历史记录信息。
8.根据权利要求6或7所述的设备,其中,
所述网站类型至少包括如下类型之一:社区网站类型、电商网站类型、搜索引擎类型和媒体网站类型。
9.根据权利要求8所述的设备,其中,
与所述搜索引擎类型对应的清除规则包括:仅保留该访问网站的网站URL信息;
与所述社区网站类型、电商网站类型和/或媒体网站类型对应的清除规则包括:保留该访问网站的网站URL信息以及保留该访问网站的cookie信息。
10.根据权利要求6所述的设备,其中,
所述判断器适于:将历史记录信息中的网址所包括的域名信息与预定统计表中的域名进行匹配,如果匹配成功,则判断结果为该历史记录信息的网址在预定统计表中,否则,判断结果为该历史记录信息的网址不在预定统计表中。
CN201210526433.1A 2012-12-07 2012-12-07 访问网站历史记录信息处理方法和设备 Active CN103020214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210526433.1A CN103020214B (zh) 2012-12-07 2012-12-07 访问网站历史记录信息处理方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210526433.1A CN103020214B (zh) 2012-12-07 2012-12-07 访问网站历史记录信息处理方法和设备

Publications (2)

Publication Number Publication Date
CN103020214A CN103020214A (zh) 2013-04-03
CN103020214B true CN103020214B (zh) 2017-04-05

Family

ID=47968818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210526433.1A Active CN103020214B (zh) 2012-12-07 2012-12-07 访问网站历史记录信息处理方法和设备

Country Status (1)

Country Link
CN (1) CN103020214B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104216921B (zh) * 2013-06-05 2019-06-04 腾讯科技(深圳)有限公司 一种实现浏览器中快速链接的添加提示方法、装置及系统
CN103412901A (zh) * 2013-07-26 2013-11-27 北京奇虎科技有限公司 一种历史记录清理方法及装置
CN104281688B (zh) * 2014-10-10 2018-05-04 百度在线网络技术(北京)有限公司 一种用于浏览器的自动清理方法及装置
US20230185866A1 (en) * 2021-12-14 2023-06-15 Island Technology Inc. Deleting web browser data

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101364231A (zh) * 2008-09-27 2009-02-11 腾讯科技(深圳)有限公司 浏览器历史记录的整理方法及装置
CN102479192B (zh) * 2010-11-24 2018-01-12 上海掌门科技有限公司 通过电子书阅读器进行用户行为模式分析的系统和方法
CN102158365A (zh) * 2011-05-20 2011-08-17 北京邮电大学 一种网络日志挖掘中的用户聚类方法及系统
CN102222098A (zh) * 2011-06-20 2011-10-19 北京邮电大学 一种网页预取方法和系统
CN102254004A (zh) * 2011-07-14 2011-11-23 北京邮电大学 一种网络日志挖掘中的Web建模方法及系统

Also Published As

Publication number Publication date
CN103020214A (zh) 2013-04-03

Similar Documents

Publication Publication Date Title
CN102354315B (zh) 一种网址导航页面生成方法和装置
JP5782188B2 (ja) 広告掲載のためのシステム及び方法
JP5860456B2 (ja) 検索語重み付けの決定および利用
CN103886068B (zh) 用于互联网用户行为分析的数据处理方法和装置
US8312015B1 (en) Processor engine, integrated circuit and method therefor
CN103714119B (zh) 一种浏览器数据的处理方法和装置
JP2014501013A (ja) 製品情報のランク付け
US20130219281A1 (en) Processor engine, integrated circuit and method therefor
CN103020214B (zh) 访问网站历史记录信息处理方法和设备
CN102938766B (zh) 恶意网址提示方法和装置
CN102761627A (zh) 基于终端访问统计的云网址推荐方法及系统及相关设备
CN103412881A (zh) 提供搜索结果的方法及系统
CN109190014B (zh) 一种正则表达式生成方法、装置及电子设备
US20160350370A1 (en) Search results based on a search history
CN104699837B (zh) 网页配图选取方法、装置及服务器
CN103186666A (zh) 基于收藏进行搜索的方法、装置与设备
CN104391978A (zh) 用于浏览器的网页收藏处理方法及装置
CN102955859B (zh) 网页内容展现方法和装置
CN105574030A (zh) 一种信息搜索方法及装置
US20110029515A1 (en) Method and system for providing website content
US20150347423A1 (en) Methods for completing a user search
CN104899215A (zh) 数据处理方法、推荐源信息组织和信息推荐方法及装置
CN103036963B (zh) 清除访问网站的历史记录信息的方法和设备
CN101694656A (zh) 搜索请求方法、搜索方法、设备及系统
KR101556743B1 (ko) 웹 수집에 기반한 관심 정보 생성 장치 및 그 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220714

Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.