CN104573029B - 整理网页标签的方法及系统 - Google Patents

整理网页标签的方法及系统 Download PDF

Info

Publication number
CN104573029B
CN104573029B CN201510018278.6A CN201510018278A CN104573029B CN 104573029 B CN104573029 B CN 104573029B CN 201510018278 A CN201510018278 A CN 201510018278A CN 104573029 B CN104573029 B CN 104573029B
Authority
CN
China
Prior art keywords
web page
tags
page tag
classified
predetermined threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510018278.6A
Other languages
English (en)
Other versions
CN104573029A (zh
Inventor
俞健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510018278.6A priority Critical patent/CN104573029B/zh
Publication of CN104573029A publication Critical patent/CN104573029A/zh
Application granted granted Critical
Publication of CN104573029B publication Critical patent/CN104573029B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种整理网页标签的方法及系统,所述方法包括:判断网页标签的数量是否大于预定阈值;根据所述数量大于所述预定阈值的判断结果对所述网页标签进行归类;根据所述归类的结果显示所述网页标签。通过采用本发明可以使用户在打开很多网页标签时方便地浏览及切换网页标签。

Description

整理网页标签的方法及系统
技术领域
本发明涉及通信领域,更为具体而言,涉及整理网页标签的方法及系统。
背景技术
目前当用户浏览网页时,经常会打开很多网页而忘记关闭网页标签,导致其所打开的网页标签过多,在现有技术中通常会将用户所打开的网页标签全部展示出来,而造成网页标签的布局过于紧凑,单个网页标签的长度过短,而致使用户难以便捷地了解各个网页标签的具体网页内容,使得用户不能方便地浏览和切换网页标签。
发明内容
为有效地解决上述技术问题,本发明提供了一种整理网页标签的方法及系统。
一方面,本发明的实施方式提供了一种整理网页标签的方法,所述方法包括:
判断网页标签的数量是否大于预定阈值;
根据所述数量大于所述预定阈值的判断结果对所述网页标签进行归类;
根据所述归类的结果显示所述网页标签。
另一方面,本发明的实施方式还提供了一种整理网页标签的系统,所述系统包括:
判断模块,用于判断网页标签的数量是否大于预定阈值;
归类模块,用于根据所述判断模块所判断出的所述数量大于所述预定阈值的判断结果对所述网页标签进行归类;
显示模块,用于根据所述归类模块所归类出的结果显示所述网页标签。
实施本发明提供的整理网页标签的方法及系统可以使用户在打开很多网页标签时方便地浏览及切换网页标签。
附图说明
图1是根据本发明实施方式的一种整理网页标签的方法的流程图;
图2是根据本发明实施方式的根据域名对网页标签进行归类的示意图;
图3是根据本发明实施方式的根据域名首字母对网页标签进行归类的示意图;
图4是根据本发明实施方式的一种整理网页标签的系统的结构示意图。
具体实施方式
为使本发明的实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
图1是根据本发明实施方式的一种整理网页标签的方法的流程图。参见图1,所述方法包括:
S110:判断网页标签的数量是否大于预定阈值。
其中,在本发明的实施方式中,该预定阈值例如可以是10,当然不限于此,根据实际需要可以设定该预定阈值为5到15的范围内的任意数值。
S120:根据所述数量大于所述预定阈值的判断结果对所述网页标签进行归类。
S130:根据所述归类的结果显示所述网页标签。
其中,在本发明的实施方式中,该步骤S120可以包括,但不限于:根据所述网页标签的域名进行归类以生成第一标签组,其中归为同一个第一标签组的各网页标签的域名相同。
为解决根据域名进行归类后,未归入所述第一标签组的网页标签的数量仍大于所述预定阈值的这一可能情况,在本发明的一种优选的实施方式中,该步骤S120还可以包括:
统计未归为所述第一标签组的网页标签的数量;
判断所述统计出的未归为所述第一标签组的网页标签的数量是否大于所述预定阈值;
在所述统计出的未归为所述第一标签组的网页标签的数量大于所述预定阈值的条件下,根据所述域名的首字母对所述未归为所述第一标签组的网页标签进行归类以生成第二标签组,其中,归为同一个第二标签组的各网页标签的域名的首字母相同。
为解决根据域名的首字母进行归类后,仍未归为所述第一标签组以及所述第二标签组的网页标签的数量仍大于所述预定阈值的这一可能情况,在本发明的一种优选的实施方式中,该步骤S120还可以包括:
统计未归为所述第一标签组以及所述第二标签组的网页标签的数量;
判断所述统计出的未归为所述第一标签组以及所述第二标签组的网页标签的数量是否大于所述预定阈值;
在所述统计出的未归为所述第一标签组以及所述第二标签组的网页标签的数量大于所述预定阈值的条件下,统计所述未归为所述第一标签组以及所述第二标签组的网页标签的点击数,根据所述统计出的点击数对所述未归为所述第一标签组以及所述第二标签组的网页标签进行归类以生成第三标签组,其中归为同一个第三标签组的各网页标签的点击数相同。
此外,在本发明的实施方式中,该步骤S130可以包括:通过下拉式标签栏的方式显示归为一类的网页标签。
以下结合具体例子对本发明的实施方式进行具体说明。
用户通过浏览器访问网页,对用户所打开的网页标签进行计数。如果网页标签的数量超过预定阈值(例如可以是10,根据实际需要可以设定该预定阈值为5到15的范围内的任意数值),则对网页标签进行归类。以上只是示例,预定阈值可以根据实际需要选择任意合适的数值。归类的具体步骤如下:
a)按网页标签的域名进行归类,将同一类域名的网页标签合并成一个标签栏,该合并出的标签栏中的全部的网页标签组成第一标签组。
如图2所示,由于http://www.sina.com.cn、http://sports.sina.com.cn/global/、以及http://sports.sina.com.cn/g/laliga/2014-11-12/20047407233.shtml同属于新浪网站,域名均为sina.con.cn,因此将这三个网页标签归为一类,并形成一个下拉式的标签栏的以显示上述三个网页标签,在本发明的实施方式中,该下拉式标签栏默认为收缩,当鼠标悬停上去的时候进行展开;
b)如果对网页标签按域名进行归类后,未归为所述第一标签组的网页标签的数量还是大于所述预定阈值,则再按照网页标签的域名的首字母对未归为所述第一标签组的网页标签进行归类以生成第二标签组,其中归为同一个第二标签组的各网页标签的域名的首字母相同。
例如,如图3所示,由于http://www.sohu.com、http://www.sina.com以及http://superinternetoffers.com的域名的首字母均为s,因此将这三个网页标签归为一个第二标签组,并同样形成一个下拉式的标签栏以显示上述三个网页标签。
c)如果按域名的首字母对网页标签进行归类后,未归为所述第一标签组以及所述第二标签组的网页标签的数量还是大于所述预定阈值,则再根据点击数对未归为所述第一标签组以及所述第二标签组的网页标签进行归类以生成第三标签组,其中归为同一个第三标签组的各网页标签的点击数相同。具体地,每当用户切换网页标签的时候都需要点击该网页标签,每点击一次,做一次计数统计,将点击数相同的网页标签归为一个第三标签组,并同样以下拉式标签栏的形式进行显示。
图4是根据本发明实施方式的一种整理网页标签的系统的结构示意图。参见图4,该系统100包括:
判断模块110,用于判断网页标签的数量是否大于预定阈值。
其中,在本发明的实施方式中,该预定阈值例如可以是10,当然不限于此,根据实际需要可以设定该预定阈值为5到15的范围内的任意数值。
归类模块120,用于根据所述判断模块110所判断出的所述数量大于所述预定阈值的判断结果对所述网页标签进行归类。
显示模块130,用于根据所述归类模块120所归类出的结果显示所述网页标签。
其中,在本发明的实施方式中,该归类模块120可以包括,但不限于:域名归类单元,用于根据所述网页标签的域名进行归类以生成第一标签组。
为解决根据域名进行归类后,未归入所述第一标签组的网页标签的数量仍大于所述预定阈值的这一可能情况,在本发明的一种优选的实施方式中,该归类模块120还可以包括:
第一统计单元,用于统计未归为所述第一标签组的网页标签的数量;
第一判断单元,用于判断所述第一统计单元所统计出的未归为所述第一标签组的网页标签的数量是否大于所述预定阈值;
域名首字母归类单元,用于在所述第一判断单元判断出所述统计出的未归为所述第一标签组的网页标签的数量大于所述预定阈值的条件下,根据所述域名的首字母对所述未归为所述第一标签组的网页标签进行归类以生成第二标签组。
为解决根据域名的首字母进行归类后,仍未归为所述第一标签组以及所述第二标签组的网页标签的数量仍大于所述预定阈值的这一可能情况,在本发明的一种优选的实施方式中,该归类模块120还可以包括:
第二统计单元,用于统计未归为所述第一标签组以及所述第二标签组的网页标签的数量;
第二判断单元,用于判断所述第二统计单元所统计出的未归为所述第一标签组以及所述第二标签组的网页标签的数量是否大于所述预定阈值;
点击数归类单元,用于在所述第二判断单元判断出所述统计出的未归为所述第一标签组以及所述第二标签组的网页标签的数量大于所述预定阈值的条件下,统计所述未归为所述第一标签组以及所述第二标签组的网页标签的点击数,根据所述统计出的点击数对所述未归为所述第一标签组以及所述第二标签组的网页标进行归类以生成第三标签组。
此外,在本发明的实施方式中,该显示模块130可以包括:下拉显示单元,用于通过下拉式标签栏的方式显示归为一类的网页标签。
实施本发明提供的整理网页标签的方法及系统可以使用户在打开很多网页标签时方便地浏览及切换网页标签。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,智能手机或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。

Claims (4)

1.一种整理网页标签的方法,其特征在于,所述方法包括:
判断网页标签的数量是否大于预定阈值;
根据所述数量大于所述预定阈值的判断结果对所述网页标签进行归类;
根据所述归类的结果显示所述网页标签,其中,
对所述网页标签进行归类包括:
根据所述网页标签的域名进行归类以生成第一标签组,
统计未归为所述第一标签组的网页标签的数量,
判断所述统计出的未归为所述第一标签组的网页标签的数量是否大于所述预定阈值,
在所述统计出的未归为所述第一标签组的网页标签的数量大于所述预定阈值的条件下,根据所述域名的首字母对所述未归为所述第一标签组的网页标签进行归类以生成第二标签组,
统计未归为所述第一标签组以及所述第二标签组的网页标签的数量,
判断所述统计出的未归为所述第一标签组以及所述第二标签组的网页标签的数量是否大于所述预定阈值,
在所述统计出的未归为所述第一标签组以及所述第二标签组的网页标签的数量大于所述预定阈值的条件下,统计所述未归为所述第一标签组以及所述第二标签组的网页标签的点击数,根据所述统计出的点击数对所述未归为所述第一标签组以及所述第二标签组的网页标签进行归类以生成第三标签组。
2.如权利要求1所述的方法,其特征在于,根据所述归类的结果显示所述网页标签包括:
通过下拉式标签栏的方式显示归为一类的网页标签。
3.一种整理网页标签的系统,其特征在于,所述系统包括:
判断模块,用于判断网页标签的数量是否大于预定阈值;
归类模块,用于根据所述判断模块所判断出的所述数量大于所述预定阈值的判断结果对所述网页标签进行归类;
显示模块,用于根据所述归类模块所归类出的结果显示所述网页标签,其中,所述归类模块包括:
域名归类单元,用于根据所述网页标签的域名进行归类以生成第一标签组,
第一统计单元,用于统计未归为所述第一标签组的网页标签的数量,
第一判断单元,用于判断所述第一统计单元所统计出的未归为所述第一标签组的网页标签的数量是否大于所述预定阈值,
域名首字母归类单元,用于在所述第一判断单元判断出所述统计出的未归为所述第一标签组的网页标签的数量大于所述预定阈值的条件下,根据所述域名的首字母对所述未归为所述第一标签组的网页标签进行归类以生成第二标签组,
第二统计单元,用于统计未归为所述第一标签组以及所述第二标签组的网页标签的数量,
第二判断单元,用于判断所述第二统计单元所统计出的未归为所述第一标签组以及所述第二标签组的网页标签的数量是否大于所述预定阈值,
点击数归类单元,用于在所述第二判断单元判断出所述统计出的未归为所述第一标签组以及所述第二标签组的网页标签的数量大于所述预定阈值的条件下,统计所述未归为所述第一标签组以及所述第二标签组的网页标签的点击数,根据所述统计出的点击数对所述未归为所述第一标签组以及所述第二标签组的网页标进行归类以生成第三标签组。
4.如权利要求3所述的系统,其特征在于,所述显示模块包括:
下拉显示单元,用于通过下拉式标签栏的方式显示归为一类的网页标签。
CN201510018278.6A 2015-01-14 2015-01-14 整理网页标签的方法及系统 Active CN104573029B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510018278.6A CN104573029B (zh) 2015-01-14 2015-01-14 整理网页标签的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510018278.6A CN104573029B (zh) 2015-01-14 2015-01-14 整理网页标签的方法及系统

Publications (2)

Publication Number Publication Date
CN104573029A CN104573029A (zh) 2015-04-29
CN104573029B true CN104573029B (zh) 2017-12-19

Family

ID=53089091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510018278.6A Active CN104573029B (zh) 2015-01-14 2015-01-14 整理网页标签的方法及系统

Country Status (1)

Country Link
CN (1) CN104573029B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183853A (zh) * 2015-09-08 2015-12-23 百度在线网络技术(北京)有限公司 一种用于展现标签页的方法和装置
CN105354279A (zh) * 2015-10-30 2016-02-24 小米科技有限责任公司 显示网页的方法及装置
CN108363814B (zh) * 2018-03-15 2021-06-22 上海哔哩哔哩科技有限公司 标签设置方法、服务器及标签设置系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320393A (zh) * 2008-07-23 2008-12-10 腾讯科技(深圳)有限公司 网页分类显示方法及系统
CN102902788A (zh) * 2012-09-29 2013-01-30 北京奇虎科技有限公司 浏览器网页标签自动分组系统及方法
CN102937996A (zh) * 2012-11-26 2013-02-20 北京奇虎科技有限公司 一种浏览器标签管理系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320393A (zh) * 2008-07-23 2008-12-10 腾讯科技(深圳)有限公司 网页分类显示方法及系统
CN102902788A (zh) * 2012-09-29 2013-01-30 北京奇虎科技有限公司 浏览器网页标签自动分组系统及方法
CN102937996A (zh) * 2012-11-26 2013-02-20 北京奇虎科技有限公司 一种浏览器标签管理系统及方法

Also Published As

Publication number Publication date
CN104573029A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
CN103793388B (zh) 搜索结果的排序方法和装置
TWI582712B (zh) A method and a device for generating a page content
CN104685490B (zh) 结构化和非结构化数据自适应分组的系统和方法
CN103530299B (zh) 一种搜索结果的生成方法及装置
US11907644B2 (en) Detecting compatible layouts for content-based native ads
CN103885951A (zh) 一种图文信息的投放、生成方法及装置
CN105138703B (zh) 一种基于搜索引擎的网络搜索方法及电子设备
CN104573029B (zh) 整理网页标签的方法及系统
CN110287409B (zh) 一种网页类型识别方法及装置
CN103164521A (zh) 一种基于用户浏览和搜索行为的关键词计算方法及装置
CN104933191A (zh) 一种基于贝叶斯算法的垃圾评论识别方法、系统及终端
CN103377249A (zh) 关键词投放方法及系统
CN107193932A (zh) 信息推送方法和装置
CN107273391A (zh) 文书推荐方法和装置
CN103646341A (zh) 一种网站提供对象的推荐方法和装置
CN106919995A (zh) 一种判断用户群体流失倾向的方法及装置
CN110781497B (zh) 网页链接的检测方法及存储介质
CN105278977B (zh) 一种网页组件的加载方法和装置
CN107798558A (zh) 用户行为数据分析方法及服务器
CN106022860A (zh) 一种匹配方法及装置
Zhang et al. One-class classification of text streams with concept drift
López et al. Using the DOM tree for content extraction
CN107783983A (zh) 信息展示方法及装置
CN108279818A (zh) 关闭网页浮窗的方法、装置及用户终端
CN108268522A (zh) 网站栏目内容的展现方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant