CN102957721B - 一种用于基于标识信息对用户进行分类的设备和方法 - Google Patents

一种用于基于标识信息对用户进行分类的设备和方法 Download PDF

Info

Publication number
CN102957721B
CN102957721B CN201110243435.5A CN201110243435A CN102957721B CN 102957721 B CN102957721 B CN 102957721B CN 201110243435 A CN201110243435 A CN 201110243435A CN 102957721 B CN102957721 B CN 102957721B
Authority
CN
China
Prior art keywords
user
page
identification information
information
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110243435.5A
Other languages
English (en)
Other versions
CN102957721A (zh
Inventor
吕文先
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201110243435.5A priority Critical patent/CN102957721B/zh
Publication of CN102957721A publication Critical patent/CN102957721A/zh
Application granted granted Critical
Publication of CN102957721B publication Critical patent/CN102957721B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用于基于标识信息对用户进行分类的设备和方法,包括:获取用户通过用户设备发送的页面请求;根据所述页面请求,获取与所述页面请求相对应的标识信息;根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息。与现有技术相比,本发明获取与页面请求相对应的标识信息,并根据所述标识信息对大量用户进行分类,以便确定与所述页面请求相对应的用户类别信息。进一步地,将本发明应用于网络浏览与搜索应用等领域,可以基于得到的用户类别信息,向不同类别的用户提供不同的响应页面,在增强用户个性化体验的同时,也不断提升了网络应用的处理能力。

Description

一种用于基于标识信息对用户进行分类的设备和方法
技术领域
本发明涉及互联网技术领域,尤其涉及用于基于标识信息对用户进行分类的处理技术。
背景技术
随着互联网技术的发展和应用的普及,越来越多的互联网应用开始重视用户的个性化服务,以期给予用户更好的使用体验;但由于用户的基数过大,用户的个性化服务存在各种各样的困难,例如,无法获取用户的个性化信息,或者无法提供与用户相匹配的服务信息。例如,现有的网站,如大型的门户网站、搜索引擎主页等,在为用户提供网络服务时,一般直接根据用户通过用户设备发送的页面请求,获取与该页面请求相对应的响应页面,并将该响应页面提供给用户设备。然而,此时提供给用户设备的响应页面在诸如页面样式或页面内容上过于单一,不同类型的用户无法获得来自网站的个性化响应页面,例如,页面内容个性化、页面样式个性化。因而,当海量用户发送相同或相似的页面请求时,得到的响应页面可能并没有提供用户期望看到的页面信息,导致所提供的页面针对性较差。
有鉴于此,如何基于用户的页面请求对用户进行分类,从而使得用户获得个性化服务与更好的用户体验成为可能,是相关技术人员亟待解决的一项课题。
发明内容
本发明的目的是提供一种用于基于标识信息对用户进行分类的设备及其方法。
根据本发明的一个方面,提供一种用于基于标识信息对用户进行分类的方法,其中,该方法包括以下步骤:
a获取用户通过用户设备发送的页面请求;
b根据所述页面请求,获取与所述页面请求相对应的标识信息;
c根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息。
根据本发明的另一个方面,提供了一种用于基于标识信息对用户进行分类的设备,其中,所述设备包括:
第一获取装置,用于获取用户通过用户设备发送的页面请求;
第二获取装置,用于根据所述页面请求,获取与所述页面请求相对应的标识信息;
分类装置,用于根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息。
根据本发明的再一方面,提供了一种搜索引擎,包括如前述根据本发明另一个方面的基于标识信息对用户进行分类的设备。
与现有技术相比,本发明获取与页面请求相对应的标识信息,并根据所述标识信息对大量用户进行分类,以便确定与所述页面请求相对应的用户类别信息。进一步地,将本发明应用于网络浏览与搜索应用等领域,可以基于得到的用户类别信息,向不同类别的用户提供不同的响应页面,在增强用户个性化体验的同时,也不断提升了网络应用的处理能力。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种用于基于标识信息对用户进行分类的设备示意图;
图2示出根据本发明一个优选实施例的用于基于标识信息对用户进行分类的设备示意图;
图3示出根据本发明另一个方面的用于基于标识信息对用户进行分类的方法流程图;
图4示出根据本发明一个优选实施例的用于基于标识信息对用户进行分类的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的一种用于基于标识信息对用户进行分类的设备示意图。其中,所述分类设备1包括但不限于,单个网络服务器、多个网络服务器集、基于云计算的计算机集合等。在此,云可以由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
参照图1,所述分类设备1包括第一获取装置11、第二获取装置12和分类装置13。具体地,所述分类设备1的第一获取装置11获取用户通过用户设备发送的页面请求;然后,第二获取装置12根据所述第一获取装置11所获取的页面请求,获取与所述页面请求相对应的标识信息;最后,分类装置13根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息。
其中,第一获取装置11获取用户通过用户设备发送的页面请求。具体地,第一获取装置11通过页面技术,例如JSP、ASP、PHP等页面技术,获取用户通过所述用户设备发送的页面请求;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取用户通过用户设备发送的页面请求。在此,所述用户设备包括但不限于笔记本电脑、台式计算机、掌上电脑、智能手机等等。所述页面请求包括但不限于URL路径请求、超链接请求、用户查询序列等。例如,当用户发送用于访问百度主页的页面请求时,通过诸如键盘键入方式在浏览器地址栏输入www.baidu.com,或者在导航网站中通过鼠标点击“百度”超链接,然后所述第一获取装置11通过页面技术,例如JSP、ASP、PHP等页面技术,获取所述页面请求,以便为用户提供期望访问的百度主页。本领域技术人员应能理解上述获取用户通过用户设备发送的页面请求的方式仅为举例,其他现有的或今后可能出现的获取用户通过用户设备发送的页面请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
第二获取装置12根据所述页面请求,获取与所述页面请求相对应的标识信息。具体地,所述第一获取装置11获取用户通过用户设备发送的所述页面请求后,所述第二获取装置12根据所述页面请求,通过诸如查找所述数据包中相关字段的方式来获取与所述页面请求相对应的标识信息。在此,该标识信息包括但不限于cookie,标识代码,标识字符串等。以所述标识信息包括cookie为例,当所述第一获取装置11获取来自用户设备的页面请求后,所述第二获取装置12根据所述页面请求,查找所述页面请求相对应的数据包的头部字段,获取预先已分配且与所述页面请求相对应的cookie。本领域技术人员应能理解上述获取与所述页面请求相对应的标识信息的方式仅为举例,其他现有的或今后可能出现的获取与所述页面请求相对应的标识信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
分类装置13根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息。具体地,分类装置13根据第二获取装置12所获取的标识信息,对所述用户进行分类,例如,根据不同的标识信息,执行散列或取模等分类算法,确定所述用户的分类,以将海量用户划分为多个类。优选地,分类装置13根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息,其中,每一类对应于相应的响应样式,以便所述分类设备基于所述用户的类别信息来分配相应的响应样式。优选地,所述预设的分类算法包括以下至少任一项:
-散列算法;
-取模算法;
-随机数算法。
以所述预设的分类算法包括散列算法为例,分类装置13将用户发送的页面请求所对应的标识信息转换为一个散列值,并根据所述散列值将所述用户分至某一组,该组中的用户对应于同一用户类别。以所述预设的分类算法包括取模算法为例,若预定将所述多个用户划分为100类,则分类装置13将用户所对应的标识信息转换为一个整数值,诸如0-99中的任一整数值,然后将整数值相同的所有用户分至某一组,该组中的用户对应于同一用户类别。以所述预设的分类算法包括随机数算法为例,若预定将所述多个用户划分为100类,则分类装置13通过诸如使用Random函数,将用户所对应的标识信息转换为一个整数值,诸如0-99中的任一整数值,然后将整数值相同的所有用户分至某一组,该组中的用户对应于同一用户类别。本领域技术人员应能理解上述基于预设的分类算法,对所述用户进行分类的方式仅为举例,其他现有的或今后可能出现的基于预设的分类算法对所述用户进行分类的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,第一获取装置11、第二获取装置12和分类装置13是持续不断工作的。具体地,所述分类设备1的第一获取装置11获取用户通过用户设备发送的页面请求;然后,第二获取装置12根据所述第一获取装置11所获取的页面请求,获取与所述页面请求相对应的标识信息;最后,分类装置13根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息。在此,本领域技术人员应理解“持续”是指第一获取装置11、第二获取装置12和分类装置13分别按照设定的或实时调整的工作模式要求进行页面请求的获取、与该页面请求相对应的标识信息的获取,以及对所述用户进行分类,直至分类设备1在较长时间内停止获取所述用户通过用户设备发送的页面请求。
优选地,在上述图1描述的实施例的基础上,所述分类装置13还根据所述标识信息,基于所述预设的分类算法,结合所述用户的用户相关信息,对所述用户进行分类,以获得所述类别信息。具体地,所述分类装置13基于所述预设的分类算法对用户进行分类时,将所述第二获取装置12所获取的标识信息与所述用户的用户相关信息相结合,以获得相应的类别信息。更优选地,所述用户相关信息包括但不限于以下至少任一项:
a)所述用户的用户名;
b)所述用户设备的IP地址。
以所述用户相关信息包括所述用户的用户名为例,所述分类装置13基于所述预设的分类算法对用户进行分类时,将所述页面请求对应的标识信息和所述用户的用户名相结合,例如,同一用户在不同的用户设备上发送相同的页面请求时,所述第二获取装置12所获取的标识信息可能不同,通过引入所述用户的用户名,所述分类装置13将原本应当分到不同类别的同一用户调整为同一类别。以所述用户相关信息包括所述用户设备的IP地址为例,所述分类装置13基于所述预设的分类算法对用户进行分类时,将所述页面请求对应的标识信息和所述用户设备的IP地址相结合,例如,不同用户在同一用户设备上发送相同的页面请求时,所述第二获取装置12所获取的标识信息可能不同,通过引入所述用户设备的IP地址,所述分类装置13将原本应当分到不同类别的不同用户调整到同一类别中。本领域技术人员应能理解上述用户的用户相关信息仅为举例,其他现有的或今后可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述分类设备1还包括验证装置(未示出),所述验证装置对所述标识信息进行验证,然后所述分类装置13根据所述验证后的标识信息,基于所述预设的分类算法,对所述用户进行分类,以获得所述类别信息。具体地,所述第二获取装置12根据所述页面请求获取相应的标识信息后,所述验证装置通过诸如在标识信息数据库中进行匹配查询,对所述标识信息进行验证,并且在所述标识信息被验证为合法时,所述分类装置13根据所述验证后的标识信息,对所述用户进行分类。在此,所述标识信息数据库既可包含于所述分类设备1中,也可包含于与所述分类设备1通过网络相连接的第三方设备中。
图2示出根据本发明一个优选实施例的用于基于标识信息对用户进行分类的设备示意图。其中,所述分类设备1’包括但不限于,单个网络服务器、多个网络服务器集、基于云计算的计算机集合等,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
参照图2,所述分类设备1’包括第一获取装置11’、第二获取装置12’、分类装置13’、第三获取装置14’、第四获取装置15’和提供装置16’。具体地,第一获取装置11’获取用户通过用户设备发送的页面请求;第二获取装置12’根据所述页面请求,获取与所述页面请求相对应的标识信息,以及第三获取装置14’获取与所述页面请求相对应的页面相关信息;分类装置13’根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息;第四获取装置15’根据所述第三获取装置14’所获取的页面相关信息,结合所述分类装置13’获得的类别信息,获取与所述页面请求相对应的响应页面;提供装置16’将所述响应页面提供给所述用户设备。
在图2所示的分类设备1’中,第一获取装置11’、第二获取装置12’和分类装置13’分别与图1所示的第一获取装置11、第二获取装置12和分类装置13相同或相似,为描述简便起见,故此处不再赘述,并通过引用的方式包含于此。
第三获取装置14’获取与所述页面请求相对应的页面相关信息。具体地,第三获取装置14’根据所述页面请求,通过诸如在页面索引数据库或第三方设备的数据库中进行匹配查询,获取与所述页面请求相对应的页面相关信息,诸如所述页面请求相对应的页面样式或页面内容;然后,所述第四获取装置15’根据所述页面相关信息,结合所述类别信息,获取与所述页面请求相对应的响应页面,例如根据所述类别信息确定其对应的页面样式或页面内容,再根据所述页面样式或页面内容来确定所述响应页面;接着,提供装置16’将所述响应页面提供给所述用户设备。在此,所述页面相关信息包括以下至少任一项:
1)页面样式;
2)页面内容。
1)以所述页面相关信息包括页面样式为例,所述第三获取装置14’根据所述页面请求,通过诸如在页面索引数据库或第三方设备的数据库中进行匹配查询,获取与所述页面请求相对应的页面样式;然后,所述第四获取装置15’根据所述页面样式,结合所述类别信息,获取与所述页面请求相对应的响应页面;接着,提供装置16’将所述响应页面提供给所述用户设备。当所述响应页面提供给所述用户设备时,所述响应页面基于所述类别信息所对应的页面样式,根据不同用户的类别信息呈现出不同的页面样式,极大地提升了用户的个性化体验。
2)以所述页面相关信息包括页面内容为例,所述第三获取装置14’根据所述页面请求,通过诸如在页面索引数据库或第三方设备的数据库中进行匹配查询,获取与所述页面请求相对应的页面内容;然后,所述第四获取装置15’根据所述页面内容,结合所述类别信息,获取与所述页面请求相对应的响应页面;接着,提供装置16’将所述响应页面提供给所述用户设备。当所述响应页面提供给所述用户设备时,所述响应页面基于所述类别信息所对应的页面内容,根据不同用户的类别信息呈现出不同的页面内容,极大地提升了用户的个性化体验。优选地,将本发明应用于搜索引擎,不同用户在输入同一查询序列后,返回至所述用户的搜索结果在页面样式和/或页面内容上可根据这些用户各自的类别信息而改变,因此可增强用户与搜索引擎之间的交互性,提升用户的个性化搜索体验。
优选地,所述分类设备1’还包括第五获取装置17’,所述第五获取装置17’获取与所述响应页面相对应的用户反馈信息;然后所述第四获取装置15’根据所述页面相关信息,结合所述类别信息和所述用户反馈信息,获取所述响应页面。具体地,所述第五获取装置17’通过页面技术,例如JSP、ASP、PHP等页面技术,获取用户通过所述用户设备发送的与所述响应页面相对应的用户反馈信息;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取与所述响应页面相对应的用户反馈信息;然后,所述第四获取装置15’根据所述页面相关信息,结合所述类别信息和所述用户反馈信息,获取所述响应页面。在此,所述用户反馈信息包括不限于用户对所述响应页面的浏览记录、内容选择或页面样式的设置等。本领域技术人员应能理解上述获取与所述响应页面相对应的用户反馈信息的方式仅为举例,其他现有的或今后可能出现的获取与所述响应页面相对应的用户反馈信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,当所述页面请求包括所述用户的首次页面请求时,所述第二获取装置12’根据所述页面请求,分配与所述页面请求相对应的所述标识信息;然后,所述提供装置16’将所述响应页面与所分配的所述标识信息提供给所述用户设备。以所述标识信息包括cookie为例,当所述第一获取装置11’获取用户通过用户设备发送的首次页面请求时,所述第二获取装置12’根据所述首次页面请求,分配与所述首次页面请求相对应的所述cookie;然后,所述提供装置16’在提供所述响应页面的同时,将新分配的所述cookie一起提供给所述用户设备。
在一个优选实施例中(参照图2),所述分类设备1’还包括第六获取装置(未示出),所述第六获取装置根据所述类别信息在抽样数据库进行匹配查询,获取与所述类别信息相对应的抽样信息;然后,所述第四获取装置15’还根据所述页面相关信息,结合所述抽样信息,获取所述响应页面。以下参照图2对该优选实施例进行详细描述,其中,第一获取装置11获取用户通过用户设备发送的页面请求;第二获取装置12根据所述第一获取装置11所获取的页面请求,获取与所述页面请求相对应的标识信息;分类装置13根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息,其具体实现过程与前述参照图2所描述的实施例中第一获取装置11、第二获取装置12和分类装置13各自执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。在此,所述抽样数据库既可包含于所述分类设备1中,也可包含于与所述分类设备1通过网络相连接的第三方设备中。优选地,所述抽样信息包括以下至少任一项:
1)抽样区间;
2)样式名称。
1)以所述抽样信息包括抽样区间为例,所述第六获取装置根据所述类别信息在所述抽样数据库中进行匹配查询,获取与所述类别信息相对应的抽样区间,例如,若100类用户被划分至10个抽样区间,则第0-9类的用户对应于第1个抽样区间;第10-19类的用户对应于第2个抽样区间;以此类推,第90-99类的用户对应于第10个抽样区间,然后所述第四获取装置15’根据所述页面相关信息,结合所述抽样区间,获取所述响应页面。在此,每一抽样区间对应于不同的页面相关信息,包括不同的页面样式和/或不同的页面内容。
2)以所述抽样信息包括样式名称为例,所述第六获取装置根据所述类别信息在所述抽样数据库中进行匹配查询,获取与所述类别信息相对应的样式名称,例如,若100类用户被划分为对应于10种样式名称,则第0、10、20、...、90类的用户对应于第1种样式名称;第1、11、21、...、91类的用户对应于第2种样式名称;以此类推,第9、19、29、...、99类的用户对应于第10种样式名称,然后所述第四获取装置15’根据所述页面相关信息,结合所述样式名称,获取所述响应页面。在此,每一样式名称对应于不同的页面相关信息,包括不同的页面样式和/或不同的页面内容。本领域技术人员应能理解上述根据所述类别信息在抽样数据库进行匹配查询来获取与所述类别信息相对应的抽样信息的方式仅为举例,其他现有的或今后可能出现的根据所述类别信息在抽样数据库进行匹配查询来获取与所述类别信息相对应的抽样信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,在上述图2描述的实施例的基础上,所述分类装置13’还根据所述标识信息,基于所述预设的分类算法,结合所述用户的用户相关信息,对所述用户进行分类,以获得所述类别信息。具体地,所述分类装置13’基于所述预设的分类算法对用户进行分类时,将所述第二获取装置12’所获取的标识信息与所述用户的用户相关信息相结合,以获得相应的类别信息。更优选地,所述用户相关信息包括但不限于以下至少任一项:
a)所述用户的用户名;
b)所述用户设备的IP地址。
以所述用户相关信息包括所述用户的用户名为例,所述分类装置13’基于所述预设的分类算法对用户进行分类时,将所述页面请求对应的标识信息和所述用户的用户名相结合,例如,同一用户在不同的用户设备上发送相同的页面请求时,所述第二获取装置12’所获取的标识信息可能不同,通过引入所述用户的用户名,所述分类装置13’将原本应当分到不同类别的同一用户调整至同一类别。以所述用户相关信息包括所述用户设备的IP地址为例,所述分类装置13’基于所述预设的分类算法对用户进行分类时,将所述页面请求对应的标识信息和所述用户设备的IP地址相结合,例如,不同用户在同一用户设备上发送相同的页面请求时,所述第二获取装置12’所获取的标识信息可能不同,通过引入所述用户设备的IP地址,所述分类装置13’将原本应当分到不同类别的不同用户调整至同一类别。本领域技术人员应能理解上述用户的用户相关信息仅为举例,其他现有的或今后可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述分类设备1’还包括验证装置(未示出),所述验证装置对所述标识信息进行验证,然后所述分类装置13’根据所述验证后的标识信息,基于所述预设的分类算法,对所述用户进行分类,以获得所述类别信息。具体地,所述第二获取装置12’根据所述页面请求获取相应的标识信息后,所述验证装置通过诸如在标识信息数据库中进行匹配查询,对所述标识信息进行验证,并且在所述标识信息被验证为合法时,所述分类装置13’根据所述验证后的标识信息,对所述用户进行分类。在此,所述标识信息数据库既可包含于所述分类设备1’中,也可包含于与所述分类设备1’通过网络相连接的第三方设备中。
此外,上述用于基于标识信息对用户进行分类的设备可以与现有的搜索引擎相结合,构成一种新的搜索引擎,现有的搜索引擎可以采用已知的如百度、Google、Yahoo等搜索引擎。
图3示出根据本发明另一个方面的一种用于基于标识信息对用户进行分类的方法流程图。其中,用于对用户进行分类的分类设备包括但不限于,单个网络服务器、多个网络服务器集、基于云计算的计算机集合等。在此,云可以由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在步骤S1中,所述分类设备获取用户通过用户设备发送的页面请求。具体地,所述分类设备通过页面技术,例如JSP、ASP、PHP等页面技术,获取用户通过所述用户设备发送的页面请求;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取用户通过用户设备发送的页面请求。在此,所述用户设备包括但不限于笔记本电脑、台式计算机、掌上电脑、智能手机等等。所述页面请求包括但不限于URL路径请求、超链接请求、用户查询序列等。例如,当用户发送用于访问百度主页的页面请求时,通过诸如键盘键入方式在浏览器地址栏输入www.baidu.com,或者在导航网站中通过鼠标点击“百度”超链接,然后所述分类设备通过页面技术,例如JSP、ASP、PHP等页面技术,获取所述页面请求,以便为用户提供期望访问的百度主页。本领域技术人员应能理解上述获取用户通过用户设备发送的页面请求的方式仅为举例,其他现有的或今后可能出现的获取用户通过用户设备发送的页面请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S2中,所述分类设备根据所述页面请求,获取与所述页面请求相对应的标识信息。具体地,所述分类设备通过步骤S1获取用户通过用户设备发送的所述页面请求后,根据所述页面请求,通过诸如查找所述数据包中相关字段的方式来获取与所述页面请求相对应的标识信息。在此,该标识信息包括但不限于cookie,标识代码,标识字符串等。以所述标识信息包括cookie为例,所述分类设备通过步骤S1获取来自用户设备的页面请求后,根据所述页面请求,查找所述页面请求相对应的数据包的头部字段,获取预先已分配且与所述页面请求相对应的cookie。本领域技术人员应能理解上述获取与所述页面请求相对应的标识信息的方式仅为举例,其他现有的或今后可能出现的获取与所述页面请求相对应的标识信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S3中,所述分类设备根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息。具体地,所述分类设备根据步骤S2中所获取的标识信息,对所述用户进行分类,例如,根据不同的标识信息,执行散列或取模等分类算法,确定所述用户的分类,以将海量用户划分为多个类。优选地,所述分类设备根据所述标识信息,基于预设的分类算法,对所述用户进行分类,以获得所述用户的类别信息,其中,每一类对应于相应的响应样式,以便所述分类设备基于所述用户的类别信息来分配相应的响应样式。优选地,所述预设的分类算法包括以下至少任一项:
-散列算法;
-取模算法;
-随机数算法。
以所述预设的分类算法包括散列算法为例,在步骤S3中,所述分类设备将用户发送的页面请求所对应的标识信息转换为一个散列值,并根据所述散列值将所述用户分至某一组,该组中的用户对应于同一用户类别。以所述预设的分类算法包括取模算法为例,若预定将所述多个用户划分为100类,在步骤S3中,所述分类设备将用户所对应的标识信息转换为一个整数值,诸如0-99中的任一整数值,然后将整数值相同的所有用户分至某一组,该组中的用户对应于同一用户类别。以所述预设的分类算法包括随机数算法为例,若预定将所述多个用户划分为100类,在步骤S3中,所述分类设备通过诸如使用Random函数,将用户所对应的标识信息转换为一个整数值,诸如0-99中的任一整数值,然后将整数值相同的所有用户分至某一组,该组中的用户对应于同一用户类别。本领域技术人员应能理解上述基于预设的分类算法,对所述用户进行分类的方式仅为举例,其他现有的或今后可能出现的基于预设的分类算法对所述用户进行分类的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,在上述图3描述的实施例的基础上,所述分类设备还根据所述标识信息,基于所述预设的分类算法,结合所述用户的用户相关信息,对所述用户进行分类,以获得所述类别信息。具体地,所述分类设备基于所述预设的分类算法对用户进行分类时,将上述步骤S2所获取的标识信息与所述用户的用户相关信息相结合,以获得相应的类别信息。更优选地,所述用户相关信息包括但不限于以下至少任一项:
a)所述用户的用户名;
b)所述用户设备的IP地址。
以所述用户相关信息包括所述用户的用户名为例,所述分类设备基于所述预设的分类算法对用户进行分类时,将所述页面请求对应的标识信息和所述用户的用户名相结合,例如,同一用户在不同的用户设备上发送相同的页面请求时,所述分类设备在步骤S2中所获取的标识信息可能不同,通过引入所述用户的用户名,所述分类设备将原本应当分到不同类别的同一用户调整为同一类别。以所述用户相关信息包括所述用户设备的IP地址为例,所述分类设备基于所述预设的分类算法对用户进行分类时,将所述页面请求对应的标识信息和所述用户设备的IP地址相结合,例如,不同用户在同一用户设备上发送相同的页面请求时,所述分类设备在步骤S2中所获取的标识信息可能不同,通过引入所述用户设备的IP地址,所述分类设备将原本应当分到不同类别的不同用户调整到同一类别中。本领域技术人员应能理解上述用户的用户相关信息仅为举例,其他现有的或今后可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,该方法还包括步骤S9(未示出),在所述步骤S9中,所述分类设备对所述标识信息进行验证,然后根据所述验证后的标识信息,基于所述预设的分类算法,对所述用户进行分类,以获得所述类别信息。具体地,在步骤S2中,所述分类设备根据所述页面请求获取相应的标识信息后,通过诸如在标识信息数据库中进行匹配查询,对所述标识信息进行验证,并且在所述标识信息被验证为合法时,所述分类设备根据所述验证后的标识信息,对所述用户进行分类。在此,所述标识信息数据库既可包含于所述分类设备中,也可包含于与所述分类设备通过网络相连接的第三方设备中。
图4示出根据本发明一个优选实施例的用于基于标识信息对用户进行分类的方法流程图。其中,用于对用户进行分类的分类设备包括但不限于,单个网络服务器、多个网络服务器集、基于云计算的计算机集合等,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
参照图4,步骤S1’、步骤S2’和步骤S3’分别与图3所示的步骤S1、步骤S2和步骤S3相同或相似,为描述简便起见,故此处不再赘述,并通过引用的方式包含于此。
在步骤S4’中,所述分类设备获取与所述页面请求相对应的页面相关信息。具体地,所述分类设备根据所述页面请求,通过诸如在页面索引数据库或第三方设备的数据库中进行匹配查询,获取与所述页面请求相对应的页面相关信息,诸如所述页面请求相对应的页面样式或页面内容;然后,在步骤S5’中,所述分类设备根据所述页面相关信息,结合所述类别信息,获取与所述页面请求相对应的响应页面,例如根据所述类别信息确定其对应的页面样式或页面内容,再根据所述页面样式或页面内容来确定所述响应页面;接着,在步骤S6’中,所述分类设备将所述响应页面提供给所述用户设备。在此,所述页面相关信息包括以下至少任一项:
1)页面样式;
2)页面内容。
1)以所述页面相关信息包括页面样式为例,在步骤S4’中,所述分类设备根据所述页面请求,通过诸如在页面索引数据库或第三方设备的数据库中进行匹配查询,获取与所述页面请求相对应的页面样式;然后,在步骤S5’中,所述分类设备根据所述页面样式,结合所述类别信息,获取与所述页面请求相对应的响应页面;接着,在步骤S6’中,所述分类设备将所述响应页面提供给所述用户设备。当所述响应页面提供给所述用户设备时,所述响应页面基于所述类别信息所对应的页面样式,根据不同用户的类别信息呈现出不同的页面样式,极大地提升了用户的个性化体验。
2)以所述页面相关信息包括页面内容为例,在步骤S4’中,所述分类设备根据所述页面请求,通过诸如在页面索引数据库或第三方设备的数据库中进行匹配查询,获取与所述页面请求相对应的页面内容;然后,在步骤S5’中,所述分类设备根据所述页面内容,结合所述类别信息,获取与所述页面请求相对应的响应页面;接着,在步骤S6’中,所述分类设备将所述响应页面提供给所述用户设备。当所述响应页面提供给所述用户设备时,所述响应页面基于所述类别信息所对应的页面内容,根据不同用户的类别信息呈现出不同的页面内容,极大地提升了用户的个性化体验。优选地,将本发明应用于搜索引擎,不同用户在输入同一查询序列后,返回至所述用户的搜索结果在页面样式和/或页面内容上可根据这些用户各自的类别信息而改变,因此可增强用户与搜索引擎之间的交互性,提升用户的个性化搜索体验。
优选地,该方法还包括步骤S7’(未示出),在步骤S7’中,所述分类设备获取与所述响应页面相对应的用户反馈信息;然后利用所述步骤S5,,根据所述页面相关信息,结合所述类别信息和所述用户反馈信息,获取所述响应页面。具体地,所述分类设备通过页面技术,例如JSP、ASP、PHP等页面技术,获取用户通过所述用户设备发送的与所述响应页面相对应的用户反馈信息;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取与所述响应页面相对应的用户反馈信息;然后,所述分类设备根据所述页面相关信息,结合所述类别信息和所述用户反馈信息,获取所述响应页面。在此,所述用户反馈信息包括不限于用户对所述响应页面的浏览记录、内容选择或页面样式的设置等。本领域技术人员应能理解上述获取与所述响应页面相对应的用户反馈信息的方式仅为举例,其他现有的或今后可能出现的获取与所述响应页面相对应的用户反馈信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,当所述页面请求包括所述用户的首次页面请求时,在步骤S2’中,所述分类设备根据所述页面请求,分配与所述页面请求相对应的所述标识信息;然后,将所述响应页面与所分配的所述标识信息提供给所述用户设备。以所述标识信息包括cookie为例,所述分类设备通过步骤S1’获取用户通过用户设备发送的首次页面请求时,根据所述首次页面请求,分配与所述首次页面请求相对应的所述cookie;然后,在步骤S6’中,所述分类设备在提供所述响应页面的同时,将新分配的所述cookie一起提供给所述用户设备。
在一个优选实施例中(参照图4),该方法还包括步骤S8’(未示出),在步骤S8’中,所述分类设备根据所述类别信息在抽样数据库进行匹配查询,获取与所述类别信息相对应的抽样信息;然后,在步骤S5’中,所述分类设备还根据所述页面相关信息,结合所述抽样信息,获取所述响应页面。在此,所述抽样数据库既可包含于所述分类设备中,也可包含于与所述分类设备通过网络相连接的第三方设备中。优选地,所述抽样信息包括以下至少任一项:
1)抽样区间;
2)样式名称。
1)以所述抽样信息包括抽样区间为例,所述第六获取装置根据所述类别信息在所述抽样数据库中进行匹配查询,获取与所述类别信息相对应的抽样区间,例如,若100类用户被划分至10个抽样区间,则第0-9类的用户对应于第1个抽样区间;第10-19类的用户对应于第2个抽样区间;以此类推,第90-99类的用户对应于第10个抽样区间,然后所述第四获取装置15’根据所述页面相关信息,结合所述抽样区间,获取所述响应页面。在此,每一抽样区间对应于不同的页面相关信息,包括不同的页面样式和/或不同的页面内容。
2)以所述抽样信息包括样式名称为例,所述第六获取装置根据所述类别信息在所述抽样数据库中进行匹配查询,获取与所述类别信息相对应的样式名称,例如,若100类用户被划分为对应于10种样式名称,则第0、10、20、...、90类的用户对应于第1种样式名称;第1、11、21、...、91类的用户对应于第2种样式名称;以此类推,第9、19、29、...、99类的用户对应于第10种样式名称,然后所述第四获取装置15’根据所述页面相关信息,结合所述样式名称,获取所述响应页面。在此,每一样式名称对应于不同的页面相关信息,包括不同的页面样式和/或不同的页面内容。本领域技术人员应能理解上述根据所述类别信息在抽样数据库进行匹配查询来获取与所述类别信息相对应的抽样信息的方式仅为举例,其他现有的或今后可能出现的根据所述类别信息在抽样数据库进行匹配查询来获取与所述类别信息相对应的抽样信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,在上述图4描述的实施例的基础上,步骤S3’中,所述分类设备还根据所述标识信息,基于所述预设的分类算法,结合所述用户的用户相关信息,对所述用户进行分类,以获得所述类别信息。具体地,所述分类设备基于所述预设的分类算法对用户进行分类时,将步骤S2,所获取的标识信息与所述用户的用户相关信息相结合,以获得相应的类别信息。更优选地,所述用户相关信息包括但不限于以下至少任一项:
a)所述用户的用户名;
b)所述用户设备的IP地址。
以所述用户相关信息包括所述用户的用户名为例,所述分类设备基于所述预设的分类算法对用户进行分类时,将所述页面请求对应的标识信息和所述用户的用户名相结合,例如,同一用户在不同的用户设备上发送相同的页面请求时,所述分类设备在步骤S2’中所获取的标识信息可能不同,通过引入所述用户的用户名,所述分类设备将原本应当分到不同类别的同一用户调整至同一类别。以所述用户相关信息包括所述用户设备的IP地址为例,所述分类设备基于所述预设的分类算法对用户进行分类时,将所述页面请求对应的标识信息和所述用户设备的IP地址相结合,例如,不同用户在同一用户设备上发送相同的页面请求时,所述分类设备在步骤S2’中所获取的标识信息可能不同,通过引入所述用户设备的IP地址,所述分类设备将原本应当分到不同类别的不同用户调整至同一类别。本领域技术人员应能理解上述用户的用户相关信息仅为举例,其他现有的或今后可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,该方法还包括S9’(未示出),在步骤S9’中,所述分类设备对所述标识信息进行验证,然后根据所述验证后的标识信息,基于所述预设的分类算法,对所述用户进行分类,以获得所述类别信息。具体地,在步骤S2’中,所述分类设备根据所述页面请求获取相应的标识信息后,通过诸如在标识信息数据库中进行匹配查询,对所述标识信息进行验证,并且在所述标识信息被验证为合法时,所述分类设备根据所述验证后的标识信息,对所述用户进行分类。在此,所述标识信息数据库既可包含于所述分类设备中,也可包含于与所述分类设备通过网络相连接的第三方设备中。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (21)

1.一种计算机实现的用于基于标识信息对用户进行分类的方法,其中,该方法包括以下步骤:
a获取用户通过用户设备发送的页面请求;
b根据所述页面请求,获取与所述页面请求相对应的标识信息;
c基于对所述标识信息执行预设的分类算法的结果,对所述用户进行分类,以获得所述用户的类别信息;
其中,该方法还包括:
-获取与所述页面请求相对应的页面相关信息;
其中,所述方法还包括步骤:
v1根据所述页面相关信息,结合所述类别信息,获取与所述页面请求相对应的响应页面;
v2将所述响应页面提供给所述用户设备。
2.根据权利要求1所述的方法,其中,所述预设的分类算法包括以下至少任一项:
-散列算法;
-取模算法;
-随机数算法。
3.根据权利要求1或2所述的方法,其中,所述步骤c还包括:
-基于对所述标识信息执行所述预设的分类算法的结果,结合所述用户的用户相关信息,对所述用户进行分类,以获得所述类别信息。
4.根据权利要求3所述的方法,其中,所述用户相关信息包括以下至少任一项:
-所述用户的用户名;
-所述用户设备的IP地址。
5.根据权利要求1所述的方法,其中,该方法还包括:
-获取与所述响应页面相对应的用户反馈信息;
其中,所述步骤v1还包括:
-根据所述页面相关信息,结合所述类别信息和所述用户反馈信息,获取所述响应页面。
6.根据权利要求1或5所述的方法,其中,当所述页面请求包括所述用户的首次页面请求时,其中,所述步骤b还包括:
-根据所述页面请求,分配与所述页面请求相对应的所述标识信息;
其中,所述步骤v2还包括:
-将所述响应页面与所分配的所述标识信息提供给所述用户设备。
7.根据权利要求1所述的方法,其中,所述页面相关信息包括以下至少任一项:
-页面样式;
-页面内容。
8.根据权利要求1所述的方法,其中,所述方法还包括:
-根据所述类别信息在抽样数据库进行匹配查询,获取与所述类别信息相对应的抽样信息;
其中,所述步骤v1还包括:
-根据所述页面相关信息,结合所述抽样信息,获取所述响应页面。
9.根据权利要求8所述的方法,其中,所述抽样信息包括以下至少任一项:
-抽样区间;
-样式名称。
10.根据权利要求1所述的方法,其中,该方法还包括:
-对所述标识信息进行验证;
其中,所述步骤c还包括:
-根据所述验证后的标识信息,基于所述预设的分类算法,对所述用户进行分类,以获取所述类别信息。
11.一种用于基于标识信息对用户进行分类的设备,其中,所述设备包括:
第一获取装置,用于获取用户通过用户设备发送的页面请求;
第二获取装置,用于根据所述页面请求,获取与所述页面请求相对应的标识信息;
分类装置,用于基于对所述标识信息执行预设的分类算法的结果,对所述用户进行分类,以获得所述用户的类别信息;
其中,所述设备还包括第三获取装置,用于:
-获取与所述页面请求相对应的页面相关信息;
其中,所述设备还包括:
第四获取装置,用于根据所述页面相关信息,结合所述类别信息,获取与所述页面请求相对应的响应页面;
提供装置,用于将所述响应页面提供给所述用户设备。
12.根据权利要求11所述的设备,其中,所述预设的分类算法包括以下至少任一项:
-散列算法;
-取模算法;
-随机数算法。
13.根据权利要求11或12所述的设备,其中,所述分类装置还用于:
-基于对所述标识信息执行所述预设的分类算法的结果,结合所述用户的用户相关信息,对所述用户进行分类,以获得所述类别信息。
14.根据权利要求13所述的设备,其中,所述用户相关信息包括以下至少任一项:
-所述用户的用户名;
-所述用户设备的IP地址。
15.根据权利要求11所述的设备,其中,所述设备还包括:
第五获取装置,用于获取与所述响应页面相对应的用户反馈信息;
其中,所述第四获取装置还用于:
-根据所述页面相关信息,结合所述类别信息和所述用户反馈信息,获取所述响应页面。
16.根据权利要求11或15所述的设备,其中,当所述页面请求包括所述用户的首次页面请求时,其中,所述第二获取装置还用于:
-根据所述页面请求,分配与所述页面请求相对应的所述标识信息;
其中,所述提供装置还用于:
-将所述响应页面与所分配的所述标识信息提供给所述用户设备。
17.根据权利要求11所述的设备,其中,所述页面相关信息包括以下至少任一项:
-页面样式;
-页面内容。
18.根据权利要求11所述的设备,其中,所述设备还包括第六获取装置,用于:
-根据所述类别信息在抽样数据库进行匹配查询,获取与所述类别信息相对应的抽样信息;
其中,所述第四获取装置还用于:
-根据所述页面相关信息,结合所述抽样信息,获取所述响应页面。
19.根据权利要求18所述的设备,其中,所述抽样信息包括以下至少任一项:
-抽样区间;
-样式名称。
20.根据权利要求11所述的设备,其中,所述设备还包括验证装置,用于:
-对所述标识信息进行验证;
其中,所述分类装置还用于:
-根据所述验证后的标识信息,基于所述预设的分类算法,对所述用户进行分类,以获取所述类别信息。
21.一种搜索引擎,其中,该搜索引擎包括如权利要求11至20中任一项所述的用于基于标识信息对用户进行分类的设备。
CN201110243435.5A 2011-08-23 2011-08-23 一种用于基于标识信息对用户进行分类的设备和方法 Active CN102957721B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110243435.5A CN102957721B (zh) 2011-08-23 2011-08-23 一种用于基于标识信息对用户进行分类的设备和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110243435.5A CN102957721B (zh) 2011-08-23 2011-08-23 一种用于基于标识信息对用户进行分类的设备和方法

Publications (2)

Publication Number Publication Date
CN102957721A CN102957721A (zh) 2013-03-06
CN102957721B true CN102957721B (zh) 2017-05-24

Family

ID=47765944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110243435.5A Active CN102957721B (zh) 2011-08-23 2011-08-23 一种用于基于标识信息对用户进行分类的设备和方法

Country Status (1)

Country Link
CN (1) CN102957721B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104112235B (zh) * 2013-04-22 2018-05-29 中广核工程有限公司 核电项目经验反馈信息搜索的方法及系统
CN103577585B (zh) * 2013-11-08 2018-02-23 北京国双科技有限公司 互联网中用户的标识方法和装置
CN107342857B (zh) * 2017-07-04 2020-06-23 微鲸科技有限公司 分组方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6026433A (en) * 1997-03-17 2000-02-15 Silicon Graphics, Inc. Method of creating and editing a web site in a client-server environment using customizable web site templates
CN101382954A (zh) * 2008-09-25 2009-03-11 北京搜狗科技发展有限公司 提供网址收藏名称的方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983227A (en) * 1997-06-12 1999-11-09 Yahoo, Inc. Dynamic page generator

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6026433A (en) * 1997-03-17 2000-02-15 Silicon Graphics, Inc. Method of creating and editing a web site in a client-server environment using customizable web site templates
CN101382954A (zh) * 2008-09-25 2009-03-11 北京搜狗科技发展有限公司 提供网址收藏名称的方法及系统

Also Published As

Publication number Publication date
CN102957721A (zh) 2013-03-06

Similar Documents

Publication Publication Date Title
TWI463337B (zh) 用於實施於跨多搜尋引擎之結盟搜尋之方法及系統
US7953775B2 (en) Sharing tagged data on the internet
CN102955798B (zh) 一种基于搜索引擎的搜索方法及搜索服务器
US7386792B1 (en) System and method for collecting, storing, managing and providing categorized information related to a document object
CN103827863B (zh) 动态图像显示区域和在web搜索结果内的图像显示
CN103221951B (zh) 预测查询建议高速缓存
CN102521251B (zh) 个性化搜索直达的方法、实现该方法的装置和搜索服务器
CN104217031B (zh) 一种根据服务器搜索日志数据进行用户分类的方法和装置
US7958111B2 (en) Ranking documents
CN104077415B (zh) 搜索方法及装置
US20080172370A1 (en) Providing virtual really simple syndication (rss) feeds
CN104008139B (zh) 视频索引表的创建方法和装置,视频的推荐方法和装置
US20090234848A1 (en) System and method for ranking search results
WO2014107682A1 (en) Method and apparatus for generating webpage content
CN102855261A (zh) 一种用于确定视频权威值的方法与设备
US9135307B1 (en) Selectively generating alternative queries
CN102184185A (zh) 一种用于多媒体资源搜索的方法与设备
CN102037464A (zh) 具有最多点击的下一个对象的搜索结果
CN107103062A (zh) 一种网页推荐方法及系统
CN102214207A (zh) 一种用于对信息实体中的属性集合进行排序的方法与设备
US20180034853A1 (en) Method and device for providing authentication information on web page
US20090265314A1 (en) Secure file searching
US20070185827A1 (en) Reporting of search results
KR102298675B1 (ko) 블로그 마케팅 오토리포트 작성 시스템
US20140101249A1 (en) Systems and Methods for Managing and Presenting Information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant