CN103838768A - 一种信息分类的方法及装置 - Google Patents

一种信息分类的方法及装置 Download PDF

Info

Publication number
CN103838768A
CN103838768A CN201210486903.6A CN201210486903A CN103838768A CN 103838768 A CN103838768 A CN 103838768A CN 201210486903 A CN201210486903 A CN 201210486903A CN 103838768 A CN103838768 A CN 103838768A
Authority
CN
China
Prior art keywords
information
classification
collection
determining
website domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210486903.6A
Other languages
English (en)
Inventor
王万新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210486903.6A priority Critical patent/CN103838768A/zh
Publication of CN103838768A publication Critical patent/CN103838768A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Abstract

本发明适用于互联网技术领域,提供了一种信息分类的方法及装置,所述方法包括:获取待收藏信息的统一资源定位符URL;根据所获取的URL,确定所述待收藏信息所属的分类;将所述待收藏信息存储至所属的分类。通过本发明使得在查找某个收藏的信息时,可以从对应的分类中查找,提高查找的效率。

Description

一种信息分类的方法及装置
技术领域
本发明属于互联网技术领域,尤其涉及一种信息分类的方法及装置。
背景技术
在现有的微博和浏览器产品中,对用户所收藏的微博和浏览器书签在默认状态下是未分类的,用户如果需要查找某个微博或浏览器书签,需要从所收藏的微博或浏览器书签中逐项查找,效率较低。
发明内容
本发明实施例的目的在于提供一种信息分类的方法,以解决现有技术对用户所收藏的微博和浏览器书签未分类,导致查找效率低的问题。
本发明实施例是这样实现的,一种信息分类的方法,所述方法包括:
获取待收藏信息的统一资源定位符URL;
根据所获取的URL,确定所述待收藏信息所属的分类;
将所述待收藏信息存储至所属的分类。
本发明实施例的另一目的在于提供一种信息分类的装置,所述装置包括:
信息获取单元,用于获取待收藏信息的统一资源定位符URL;
分类确定单元,用于根据所述信息获取单元获取的URL,确定所述待收藏信息所属的分类;
第一存储单元,用于将所述待收藏信息存储至所述分类确定单元所确定的分类。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例根据所获取的URL确定待收藏信息所属的分类,再将所述待收藏信息存储至所属的分类,使得在查找某个收藏的信息例如微博或浏览器的书签签)时,可以从对应的分类中查找,提高查找的效率。尤其在收藏的信息较多时,通过分类查找可有效缩短查找的时间。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例提供的信息分类方法的现流程程;
图2是本发明第二实施例提供的信息分类装置的组成结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一:
图1示出了第一实施例提供的信息分类方法的实现流程,该方法过程详述如下:
在步骤S101中,获取待收藏信息的统一资源定位符符URL。
在本实施例中,在接收到收藏某个信息的指令后,获取待收藏信息的统一资源定位符(Uniform/Universal Rssurce Lcatrr,UR))。其中,所述收藏信息的指令可以是由用户输入的收藏命令触发,也可以是预先配置更新时限,在更新时限到时自动触发。所述待收藏信息包括但不限于微博和和/或浏览器的书签。
在步骤S102中,根据所获取的URL,确定所述待收藏信息所属的分类。
示例性的,在所述待收藏信息为微博时;
所述根据所获取的URL,确定所述待收藏信息所属的分类具体包括:
提取所述URL中的类别属性,其中,所述类别属性包括但不限于图片类属性(例如jpeg、jpg、png、bmp等图片格式)、音频类属性(例如mp3、wav、midi等音频格式)、视频类属性(例如mp4,mpeg4,3gp,flv,mkv,avi等视频格式)以及其他类属性。
根据所述类别属性,确定所述待收藏信息所属的分类。
例如,在所述类型属性为图片类属性,即所述URL以jpeg、jpg、png、bmp等图片格式的后缀结尾时,则确定所述待收藏信息所属的分类为图片类;若所述URL以mp3、wav、midi等音频格式的后缀结尾时,则确定所述待收藏信息所属的分类为音频类;若所述URL以mp4,mpeg4,3gp,flv,mkv,avi等视频格式的后缀结尾时,则确定所述待收藏信息所属的分类为视频类;若所述类型属性不属于图片类、音频类以及视频类时,则确定所述待收藏信息所属的分类为其他类。
示例性的,在所述待收藏信息为浏览器的书签时;
本实施例在所述根据所获取的URL,确定所述待收藏信息所属的分类的步骤之前,还包括:
存储网站域名及其所属分类的信息,并根据预定的时间间隔更新所述存储的信息。
在本实施例中,浏览器的书签分类是根据书签中的URL进行网站的分类,例如新闻类、小说阅读类、购物类、游戏类以及实用工具类等。在分类前,预先在浏览器所在客户端存储数量若干的网站域名及其所属分类的信息,并根据预定的时间间隔(例如7天/次)更新所述存储的信息。其中,存储的网站域名的数量可根据实际情况(例如客户端的性能、存储容量等)预先设定,在实际应用中,也可根据需求进行修改。
所述根据所获取的URL,确定所述待收藏信息所属的分类具体包括:
提取所述URL中的网站域名信息;
判断所存储的网站域名中是否存在所述提取的网站域名;
若存在,则根据所述存储的信息,确定所述提取的网站域名所属的分类;
若不存在,则将该网站域名更新至所述存储信息中,并为该网站域名设定一个所属的分类,以便于在后续收藏类似的信息时,可以将所述类似信息存储至所设定的分类。
优选的是,在所述待收藏信息为浏览器的书签时,本实施例在提取所述URL中的网站域名信息的同时,还提取所述URL中的类别属性,根据所提取的网站域名信息和类别属性确定所述待收藏信息所属的分类。
具体的是,提取所述URL中的网站域名信息以及类型属性;
判断所存储的网站域名中是否存在所述提取的网站域名;
若存在,则根据所述存储的信息,确定所述提取的网站域名所属的分类,再根据所述类别属性确定所述待收藏信息所属的分类的子类。其中,所述子类与所述类别属性对应,包括但不限于图片类、视频类、音频类及其他类。
例如,根据网站域名确定所述待收藏信息所属的分类为新闻类,再通过所述类别属性确定所述待收藏信息所属的分类的子类为图片类,则最终确定所述待收藏信息所属的分类为新闻类中的图片类。
在步骤S103中,将所述待收藏信息存储至所属的分类。
在本实施例中,由于对收藏的信息进行了分类,当用户需要查找某个收藏的信息(例如微博或浏览器的书签)时,可以直接从对应的分类中查找,而不需要从所有收藏的信息中查找,在收藏的信息较多时,通过分类查找可有效缩短查找的时间,提高查找的效率。
优选的是,为了进一步的提高查找效率,本实施例还包括:
在接收到查找请求信息时,弹出搜索框,根据所述搜索框中输入的关键词信息确定待查找信息所属分类,从所述所属分类中查找与所述关键词信息相关的信息。
在本实施例中,用户不需要手动去查找所需的信息,直接通过在所述搜索框中输入待查找信息的关键词信息,系统根据所述关键词信息,确定待查找信息所属分类,直接从所述所属分类中查找与所述关键词信息相关的信息。其中,所述关键词信息中可以包含分类信息,以便于快速的确定待查找信息所属的分类,例如用户需要查找所收藏的某个视频,可以输入该视频的名字,后面再加上所属分类,如“江南,视频”等。
实施例二:
图2示出了本发明第二实施例提供的信息分类装置的组成结构,为了便于说明,仅示出了与本发明实施例相关的部分。
该信息分类装置可以是运行于各终端设备内的软件单元、硬件单元或者软硬件相结合的单元,也可以作为独立的挂件集成到所述终端设备中或者运行于所述终端设备的应用系统中。
该信息分类装置包括信息获取单元21、分类确定单元22以及第一存储单元23。其中,各单元的具体功能如下:
信息获取单元21,用于获取待收藏信息的统一资源定位符URL;
分类确定单元22,用于根据所述信息获取单元21获取的URL,确定所述待收藏信息所属的分类;
第一存储单元23,用于将所述待收藏信息存储至所述分类确定单元22所确定的分类。
优选的是,所述待收藏信息包括微博和/或浏览器的书签。
进一步的,在所述待收藏信息为微博时,所述分类确定单元22具体包括:
第一提取模块221,用于提取所述URL中的类别属性;
第一确定模块222,用于根据所述提取模块221提取的类别属性,确定所述待收藏信息所属的分类。
进一步的,在所述待收藏信息为浏览器的书签时,
所述装置还包括:
第二存储单元24,用于存储网站域名及其所属分类的信息,并根据预定的时间间隔更新所述存储的信息。
进一步的,所述分类确定单元22具体包括:
第二提取模块223,用于提取所述URL中的网站域名信息;
判断模块224,用于判断所存储的网站域名中是否存在所述提取的网站域名;
第二确定模块225,用于在所述判断模块224判断结果为是时,根据所述存储的信息,确定所述提取的网站域名所属的分类。
进一步的,所述分类确定单元22具体包括:
第二提取模块223,提取所述URL中的网站域名信息以及类型属性;
判断模块224,判断所存储的网站域名中是否存在所述提取的网站域名;
第二确定模块225,用于在所述判断模块224判断结果为是时,则根据所述存储的信息,确定所述提取的网站域名所属的分类,再根据所述类别属性确定所述待收藏信息所属的分类的子类。
优选的是,所述类别属性包括图片类属性、音频类属性、视频类属性以及其他类属性。
进一步的,所述装置还包括:
查找单元25,用于在接收到查找请求信息时,弹出搜索框,根据所述搜索框中输入的关键词信息确定待查找信息所属分类,从所述所属分类中查找与所述关键词信息相关的信息。
本实施例提供的信息分类装置可以使用在前述对应的信息分类方法,详情参见上述信息分类方法实施例一的相关描述,在此不再赘述。
本领域技术人员可以理解为上述实施例二包括的各个单元、模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,实施例二中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
综上所述,本发明实施例根据所获取的URL确定待收藏信息所属的分类,再将所述待收藏信息存储至所属的分类,使得在查找(包括用户手动查找和系统自动查找)某个收藏的信息(例如微博或浏览器的书签)时,可以从对应的分类中查找,提高查找的效率。尤其在收藏的信息较多时,通过分类查找可有效缩短查找的时间。
本领域普通技术人员还可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,包括ROM/RAM、磁盘、光盘等。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明由所提交的权利要求书确定的专利保护范围。

Claims (16)

1.一种信息分类的方法,其特征在于,所述方法包括:
获取待收藏信息的统一资源定位符URL;
根据所获取的URL,确定所述待收藏信息所属的分类;
将所述待收藏信息存储至所属的分类。
2.如权利要求1所述的方法,其特征在于,所述待收藏信息包括微博和/或浏览器的书签。
3.如权利要求2所述的方法,其特征在于,在所述待收藏信息为微博时,所述根据所获取的URL,确定所述待收藏信息所属的分类具体包括:
提取所述URL中的类别属性;
根据所述类别属性,确定所述待收藏信息所属的分类。
4.如权利要求2所述的方法,其特征在于,在所述待收藏信息为浏览器的书签时,
在所述根据所获取的URL,确定所述待收藏信息所属的分类的步骤之前,还包括:
存储网站域名及其所属分类的信息,并根据预定的时间间隔更新所述存储的信息。
5.如权利要求4所述的方法,其特征在于,所述根据所获取的URL,确定所述待收藏信息所属的分类具体包括:
提取所述URL中的网站域名信息;
判断所存储的网站域名中是否存在所述提取的网站域名;
若存在,则根据所述存储的信息,确定所述提取的网站域名所属的分类。
6.如权利要求4所述的方法,其特征在于,所述根据所获取的URL,确定所述待收藏信息所属的分类具体包括:
提取所述URL中的网站域名信息以及类型属性;
判断所存储的网站域名中是否存在所述提取的网站域名;
若存在,则根据所述存储的信息,确定所述提取的网站域名所属的分类,再根据所述类别属性确定所述待收藏信息所属的分类的子类。
7.如权利要求3或6所述的方法,其特征在于,所述类别属性包括图片类属性、音频类属性、视频类属性以及其他类属性。
8.如权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到查找请求信息时,弹出搜索框,根据所述搜索框中输入的关键词信息确定待查找信息所属分类,从所述所属分类中查找与所述关键词信息相关的信息。
9.一种信息分类的装置,其特征在于,所述装置包括:
信息获取单元,用于获取待收藏信息的统一资源定位符URL;
分类确定单元,用于根据所述信息获取单元获取的URL,确定所述待收藏信息所属的分类;
第一存储单元,用于将所述待收藏信息存储至所述分类确定单元所确定的分类。
10.如权利要求9所述的装置,其特征在于,所述待收藏信息包括微博和/或浏览器的书签。
11.如权利要求10所述的装置,其特征在于,在所述待收藏信息为微博时,所述分类确定单元具体包括:
第一提取模块,用于提取所述URL中的类别属性;
第一确定模块,用于根据所述提取模块提取的类别属性,确定所述待收藏信息所属的分类。
12.如权利要求10所述的装置,其特征在于,在所述待收藏信息为浏览器的书签时,
所述装置还包括:
第二存储单元,用于存储网站域名及其所属分类的信息,并根据预定的时间间隔更新所述存储的信息。
13.如权利要求12所述的装置,其特征在于,所述分类确定单元具体包括:
第二提取模块,用于提取所述URL中的网站域名信息;
判断模块,用于判断所存储的网站域名中是否存在所述提取的网站域名;
第二确定模块,用于在所述判断模块判断结果为是时,根据所述存储的信息,确定所述提取的网站域名所属的分类。
14.如权利要求12所述的装置,其特征在于,所述分类确定单元具体包括:
第二提取模块,提取所述URL中的网站域名信息以及类型属性;
判断模块,判断所存储的网站域名中是否存在所述提取的网站域名;
第二确定模块,用于在所述判断模块判断结果为是时,则根据所述存储的信息,确定所述提取的网站域名所属的分类,再根据所述类别属性确定所述待收藏信息所属的分类的子类。
15.如权利要求11或14所述的装置,其特征在于,所述类别属性包括图片类属性、音频类属性、视频类属性以及其他类属性。
16.如权利要求9所述的装置,其特征在于,所述装置还包括:
查找单元,用于在接收到查找请求信息时,弹出搜索框,根据所述搜索框中输入的关键词信息确定待查找信息所属分类,从所述所属分类中查找与所述关键词信息相关的信息。
CN201210486903.6A 2012-11-26 2012-11-26 一种信息分类的方法及装置 Pending CN103838768A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210486903.6A CN103838768A (zh) 2012-11-26 2012-11-26 一种信息分类的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210486903.6A CN103838768A (zh) 2012-11-26 2012-11-26 一种信息分类的方法及装置

Publications (1)

Publication Number Publication Date
CN103838768A true CN103838768A (zh) 2014-06-04

Family

ID=50802278

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210486903.6A Pending CN103838768A (zh) 2012-11-26 2012-11-26 一种信息分类的方法及装置

Country Status (1)

Country Link
CN (1) CN103838768A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391936A (zh) * 2014-11-21 2015-03-04 百度在线网络技术(北京)有限公司 浏览器收藏夹中标签的处理方法和装置
CN104506450A (zh) * 2014-11-06 2015-04-08 小米科技有限责任公司 媒体资源反馈方法及装置
CN105450677A (zh) * 2014-06-30 2016-03-30 北京金山安全软件有限公司 数据的处理方法、装置及系统
CN108804482A (zh) * 2017-05-05 2018-11-13 北京搜狗科技发展有限公司 一种网页收藏方法及装置
CN109710860A (zh) * 2018-12-21 2019-05-03 武汉思普崚技术有限公司 一种url分类匹配的方法及装置
CN110059268A (zh) * 2018-12-27 2019-07-26 阿里巴巴集团控股有限公司 收藏对象类型的确定方法、装置和客户端设备
CN111638834A (zh) * 2020-04-27 2020-09-08 维沃移动通信有限公司 内容搜索方法及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070033516A1 (en) * 2005-08-03 2007-02-08 Aditya Khosla Enhanced favorites service for web browsers and web applications
CN101957848A (zh) * 2010-09-21 2011-01-26 伍帝州 一种浏览器导航的方法和装置
CN102298614A (zh) * 2011-07-29 2011-12-28 百度在线网络技术(北京)有限公司 一种确定网页收藏信息的收藏分类的方法、装置和设备
CN102508897A (zh) * 2011-11-03 2012-06-20 匡晓明 通用信息收藏的方法与系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070033516A1 (en) * 2005-08-03 2007-02-08 Aditya Khosla Enhanced favorites service for web browsers and web applications
CN101957848A (zh) * 2010-09-21 2011-01-26 伍帝州 一种浏览器导航的方法和装置
CN102298614A (zh) * 2011-07-29 2011-12-28 百度在线网络技术(北京)有限公司 一种确定网页收藏信息的收藏分类的方法、装置和设备
CN102508897A (zh) * 2011-11-03 2012-06-20 匡晓明 通用信息收藏的方法与系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105450677A (zh) * 2014-06-30 2016-03-30 北京金山安全软件有限公司 数据的处理方法、装置及系统
CN104506450A (zh) * 2014-11-06 2015-04-08 小米科技有限责任公司 媒体资源反馈方法及装置
CN104391936A (zh) * 2014-11-21 2015-03-04 百度在线网络技术(北京)有限公司 浏览器收藏夹中标签的处理方法和装置
CN104391936B (zh) * 2014-11-21 2018-04-13 百度在线网络技术(北京)有限公司 浏览器收藏夹中标签的处理方法和装置
CN108804482A (zh) * 2017-05-05 2018-11-13 北京搜狗科技发展有限公司 一种网页收藏方法及装置
CN109710860A (zh) * 2018-12-21 2019-05-03 武汉思普崚技术有限公司 一种url分类匹配的方法及装置
CN109710860B (zh) * 2018-12-21 2021-07-27 武汉思普崚技术有限公司 一种url分类匹配的方法及装置
CN110059268A (zh) * 2018-12-27 2019-07-26 阿里巴巴集团控股有限公司 收藏对象类型的确定方法、装置和客户端设备
CN111638834A (zh) * 2020-04-27 2020-09-08 维沃移动通信有限公司 内容搜索方法及电子设备

Similar Documents

Publication Publication Date Title
CN103838768A (zh) 一种信息分类的方法及装置
CN110083805B (zh) 一种将Word文件转换为EPUB文件的方法及系统
CN102693271B (zh) 一种网络信息推荐方法及系统
US8527490B2 (en) Structuring and searching data in a hierarchical confidence-based configuration
CN102270206A (zh) 一种有效网页内容的抓取方法及装置
US20080033938A1 (en) Keyword outputting apparatus, keyword outputting method, and keyword outputting computer program product
CN101620608A (zh) 信息采集方法及系统
CN102682082B (zh) 基于内容结构特征的网络Flash搜索系统及搜索方法
CN102214208B (zh) 一种基于非结构化文本生成结构化信息实体的方法与设备
CN101676907A (zh) 一种互联网资源定向获取方法及系统
US8645384B1 (en) Updating taxonomy based on webpage
CN103617266A (zh) 个性化扩展搜索方法及装置、系统
CN103729178A (zh) 一种浏览器多标签页的处理方法及系统
CN102567473A (zh) 网络信息检索系统及检索方法
CN104778271A (zh) 一种视频数据的缓存方法及装置
CN104503988A (zh) 搜索方法及装置
CN104035943B (zh) 存储数据的方法及相应服务器
CN103870494A (zh) 一种浏览器书签的设置方法、装置及终端
TWI609280B (zh) 在電子閱讀器環境中基於內容及物件元資料的搜尋
CN103810204A (zh) 一种信息查找的方法及装置
CN103577476B (zh) 网页浏览记录的处理方法及网页浏览装置
CN105404672A (zh) 网页数据存储和操作的系统及方法
CN104915435A (zh) 数据查询方法和装置
CN105138576A (zh) 一种用于在移动搜索中提供推荐输入序列的方法和装置
CN104881453A (zh) 一种识别网页类型的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140604

RJ01 Rejection of invention patent application after publication