发明内容
本发明的主要目的在于提供一种信息推送方法和装置,以解决现有技术中向用户推荐的兴趣偏好信息时不准确的问题。
为了实现上述目的,根据本发明实施例的一个方面,提供了一种信息推送方法。根据本发明的信息推送方法包括:获取用户的来源网站的属性信息,其中,所述来源网站为所述用户所浏览的上一个网站;根据所述属性信息确定所述来源网站的兴趣标签;查找所述兴趣标签所对应的推送信息;以及将所述推送信息推送给所述用户。
进一步地,根据所述属性信息确定所述来源网站的兴趣标签包括:从所述属性信息中解析所述来源网站的域名;从网站域名标签库中查找所述域名,其中,所述网站域名标签库中记录了域名和兴趣标签的对应关系;如果查找到所述域名,则查找与所述域名对应的兴趣标签;以及如果查找不到所述域名,则输出未查找到所述域名的提示信息。
进一步地,在输出未查找到所述域名的提示信息之后,所述信息推送方法还包括:提取所述来源网站的网站内容的特征高频词;获取关联有所述特征高频词和所述兴趣标签的用户兴趣高频词库;根据所述特征高频词从用户兴趣高频词库中查找所述来源网站的兴趣标签;以及将查找到的兴趣标签作为所述来源网站的兴趣标签。
进一步地,在获取用户的来源网站的属性信息之后,所述信息推送方法还包括:获取所述用户的IP地址;根据所述用户的IP地址所指示的地理位置划分包括所述地理位置的预定区域范围;收集所述预定区域范围内的用户的兴趣标签;以及从收集的兴趣标签中选择一个或多个兴趣标签作为所述用户的兴趣标签。
进一步地,收集的兴趣标签为多个兴趣标签,从收集的兴趣标签中选择一个或多个兴趣标签作为所述用户的兴趣标签包括:计算所述多个兴趣标签中每个兴趣标签所对应的用户的个数;按照所述多个兴趣标签所对应的用户的个数进行排序;以及对排序后的所述多个兴趣标签选择对应的用户的个数最多的兴趣标签作为所述用户的兴趣标签。
为了实现上述目的,根据本发明实施例的另一方面,提供了一种信息推送装置。根据本发明的信息推送装置包括:第一获取单元,用于获取用户的来源网站的属性信息,其中,所述来源网站为所述用户所浏览的上一个网站;第一确定单元,用于根据所述属性信息确定所述来源网站的兴趣标签;第一查找单元,用于查找所述兴趣标签所对应的推送信息;以及推送单元,用于将所述推送信息推送给所述用户。
进一步地,所述第一确定单元包括:解析模块,用于从所述属性信息中解析所述来源网站的域名;第一查找模块,用于从网站域名标签库中查找所述域名,其中,所述网站域名标签库中记录了域名和兴趣标签的对应关系;第二查找模块,用于在查找到所述域名时,查找与所述域名对应的兴趣标签;以及输出模块,用于在查找不到所述域名时,输出未查找到所述域名的提示信息。
进一步地,所述信息推送装置还包括:提取单元,用于在输出未查找到所述域名的提示信息之后,提取所述来源网站的网站内容的特征高频词;第二获取单元,用于获取关联有所述特征高频词和所述兴趣标签的用户兴趣高频词库;第二查找单元,用于根据所述特征高频词从用户兴趣高频词库中查找所述来源网站的兴趣标签;以及第二确定单元,用于将查找到的兴趣标签作为所述来源网站的兴趣标签。
进一步地,所述信息推送装置还包括:第三获取单元,用于在获取用户的来源网站的属性信息之后,获取所述用户的IP地址;划分单元,用于根据所述用户的IP地址所指示的地理位置划分包括所述地理位置的预定区域范围;收集单元,用于收集所述预定区域范围内的用户的兴趣标签;以及选择单元,用于从收集的兴趣标签中选择一个或多个兴趣标签作为所述用户的兴趣标签。
进一步地,收集的兴趣标签为多个兴趣标签,所述收集单元包括:计算单元,用于计算所述多个兴趣标签中每个兴趣标签所对应的用户的个数;排序单元,用于按照所述多个兴趣标签所对应的用户的个数进行排序;以及第三确定单元,用于对排序后的所述多个兴趣标签选择对应的用户的个数最多的兴趣标签作为所述用户的兴趣标签。
根据发明实施例,由于用户来源网站的内容在一定程度上体现了用户的兴趣关注点,通过分析用户的来源网站的兴趣标签可以体现用户的兴趣点,在没有用户的兴趣点的记录时,将来源网站的兴趣标签作为用户的兴趣点的体现,并将根据兴趣标签找到的推送信息推送给用户,使得推送的信息更加准确的符合用户的兴趣点,使得推送给用户的信息是针对该用户的个性化信息推送的信息,从而解决了现有技术由于仅推送热点信息而不考虑用户的个性化喜好而导致的向用户推荐的兴趣偏好信息不准确的问题,达到了提高向用户推荐的兴趣偏好信息更加准确的效果。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种信息推送方法。
图1是根据本发明实施例的信息推送方法的流程图。如图1所示,该信息推送方法包括如下步骤:
步骤S102,获取用户的来源网站的属性信息,其中,来源网站为用户所浏览的上一个网站;
步骤S104,根据属性信息确定来源网站的兴趣标签;
步骤S106,查找兴趣标签所对应的推送信息;
步骤S108,将推送信息推送给用户。
对于首次浏览网站的新用户来说,由于网站不知道该新用户兴趣信息,无法准确的为新用户推送信息,但是,通常用户浏览网站是从一个网站跳转到另外一个网站。例如,用户在浏览A网站的时候,通过A网站的链接跳转到B网站,那么,A网站就作为该用户的来源网站。
每个网站都有自己的属性,用来体现这个网站的内容属于哪个领域的,例如,有关汽车的内容的网站的属性为汽车,有关女性的网站的属性可以为化妆品、服装等。每个网站的属性可以为一个或者多个,还可以对一个网站的不同频道进行细分,例如,大型门户网站有很多频道,用一个属性信息是无法准确覆盖所有频道的属性信息,因此,可以分别获取不同的频道,甚至不同网页的属性信息。
根据属性信息确定来源网站的兴趣标签,例如,网站的属性为女性,那么兴趣标签可以是美妆、服装等,还可以是具体的化妆品的品牌。在确定了来源网站的兴趣标签之后,可以查找与该兴趣标签对应的推送信息,例如,查找化妆品的品牌,并将化妆品的信息推送给用户。
例如,用户从化妆品网站跳转到某网站的女性频道,通过分析来源网站确定来源网站的兴趣标签为化妆品,则女性频道推送的信息为化妆品的宣传的广告、美容等,如向用户推送A品牌的面霜、B品牌的眼霜等。
上述实施例,由于用户来源网站的内容在一定程度上体现了用户的兴趣关注点,通过分析用户的来源网站的兴趣标签可以体现用户的兴趣点,在没有用户的兴趣点的记录时,将来源网站的兴趣标签作为用户的兴趣点的体现,并将根据兴趣标签找到的推送信息推送给用户,使得推送的信息更加准确的符合用户的兴趣点,使得推送给用户的信息是针对该用户的个性化信息推送的信息。现有技术在网站没有新用户的历史浏览记录时,只能推荐近期热点产品,而推荐的产品却不一定是用户所需要的,使得在推荐系统冷启动时所推荐的产品并不准确,利用上述实施例解决了现有技术由于仅推送热点信息而不考虑用户的个性化喜好而导致的向用户推荐的兴趣偏好信息不准确的问题,达到了提高向用户推荐的兴趣偏好信息更加准确的效果。
具体地,根据属性信息确定来源网站的兴趣标签包括:从属性信息中解析来源网站的域名;从网站域名标签库中查找域名,其中,网站域名标签库中记录了域名和兴趣标签的对应关系;如果查找到域名,则查找与域名对应的兴趣标签;以及如果查找不到域名,则输出未查找到域名的提示信息。
在确定来源网站的兴趣标签时,可以根据网站的域名来解析。网站域名标签库中记录了域名和兴趣标签的对应关系,域名和兴趣标签的对应关系可以是根据网站的属性预先建立的网站域名标签库,利用域名在网站域名标签库中查找该网站域名所对应的兴趣标签,如果查找到该网站域名以及与该网站域名对应的兴趣标签,则将查找到的兴趣标签作为该网站域名的标签,也就是说根据该网站域名查找到的兴趣标签可以作为用户的兴趣标签,根据该兴趣标签查找的推送信息更加准确的贴近用户的兴趣点,从而提高了为用户推送信息的准确性。
进一步地,如果在网站域名标签库中没有查到网站域名,则可以对来源网站的内容进行分析,从而确定来源网站的兴趣标签以便进一步确定向用户推送的推送信息,在输出未查找到域名的提示信息之后,信息推送方法还包括:提取来源网站的网站内容的特征高频词;获取关联有特征高频词和兴趣标签的用户兴趣高频词库;根据特征高频词从用户兴趣高频词库中查找来源网站的兴趣标签;以及将查找到的兴趣标签作为来源网站的兴趣标签。
提取来源网站的内容的特征高频词,网站内容的特征高频词能够体现来源网站的属性,而该属性又能够体现浏览该网站的用户的兴趣标签,用户兴趣高频词库中的高频词与兴趣标签相对应,例如:来源网站的特征高频词为汽车品牌Z、汽车品牌X,则来源网站的兴趣标签为汽车,则向用户推送的信息可以为汽车相关的推送信息。
例如:通过监控分析“新用户”访问“本公司站点”的上一个网站站点性质和特征来分析用户的偏好。比如,如果用户A是由于在新浪网站女性频道点击了化妆品的关键词而来到我的站点的,我通过分析新浪网站女性频道的内容,比如,内容中包含大量的“女性话题”和“化妆品”相关的内容,那么我们就可以分析:
用户访问的新浪女性频道的页面是:“女性特征明显”,“化妆品特征明显”的,那么我们可以得出这个页面/站点是“女性化”,“化妆品的”。
由于用户访问了,新浪的“女性”“化妆品”的页面,而且还点击了该页面上的链接来到了我的站点,那么我们就认为这个新用户的偏好是跟“女性”和“化妆品”有比较好的关联的。
优选地,除了根据网站域名、网站内容的特征高频词来查找来源网站的兴趣标签来进行信息推送以外,还可以通过用户的IP地址来确定用户的兴趣标签来,在获取用户的来源网站的属性信息之后,信息推送方法还包括:获取用户的IP地址;根据用户的IP地址所指示的地理位置划分包括地理位置的预定区域范围;收集预定区域范围内的用户的兴趣标签;以及从收集的兴趣标签中选择一个或多个兴趣标签作为用户的兴趣标签。
确定用户的IP地址就能确定IP地址所指示的地理位置,然后以该地理位置为中心划分预定区域范围,并收集该预定区域范围内的用户的兴趣标签,由于通常用户的地理位置会体现用户的兴趣点,根据用户所在的地理区域内的用户的兴趣标签确定该用户的兴趣点。如,该用户的IP地址为北京地区的IP地址,则收集北京地区的所有用户的兴趣点,并对收集的多个兴趣点进行排序,按照具有该兴趣的人数来排队,当关注一个兴趣点的人数越多时,该兴趣点越有可能是该用户的兴趣点。其中,预定区域范围可以是10公里的范围内,当然还可以是更大的范围。
具体地,收集的兴趣标签为多个兴趣标签,从收集的兴趣标签中选择一个或多个兴趣标签作为用户的兴趣标签包括:计算多个兴趣标签中每个兴趣标签所对应的用户的个数;按照多个兴趣标签所对应的用户的个数进行排序;以及对排序后的多个兴趣标签选择对应的用户的个数最多的兴趣标签作为用户的兴趣标签。
由于人的社会性特征,人的关注点和需求偏好在一定程度上会呈现出地域性特征。比如,北京雾霾、奥运会期间,自然北京人对这些方面的商品比较感兴趣。即使对一个新用户来说,在毫无历史信息的情况下很难推测他的兴趣偏好,但是如果他周围的系统中的“老用户”在最近一段时间内感兴趣的商品程序出一定的共性特征,那么我们也有理由相信他会对这个商品有兴趣。所以,我们就通过移动设备位置信息和IP来找出用户位置,然后找出该位置附近其他“老用户”的最近的特征进行分析,然后根据“老用户”最近共性特征,推测新用户近期感兴趣的点。
例如,收集到北京地区所有用户的兴趣点为抢购、雾霾、限号、电影、美食等等,而这些兴趣点被关注的人数有多至少依次为雾霾、限号、抢购、美食、电影,则可以选择雾霾、限号作为用户的兴趣标签,并查找与雾霾和限号相关的内容推送给用户,也就是说可以选择收集到的一个或多个兴趣点作为用户的兴趣标签,并将兴趣标签相关的信息推送给用户。
通过上述实施例,根据用户所在的地理位置的预定区域内的多数用户的兴趣来确定用户的兴趣点,由于一个区域内的用户的兴趣点具有共性,因此,通过分析一个区域内的用户的兴趣标签来进行信息推送,避免单一的根据热点信息进行推送,解决现有技术中进行信息推送时不满足用户的兴趣点而导致的推送的信息不准确的问题。
本发明实施例还提供了一种信息推送装置。本发明实施例的信息推送装置可以用于执行本发明实施例所提供的信息推送方法,本发明实施例的信息推送方法也可以通过本发明实施例所提供的信息推送装置来执行。
图2是根据本发明实施例的信息推送装置的示意图。如图2所示,该信息推送装置包括:第一获取单元10、第一确定单元30、第一查找单元50和推送单元70。
第一获取单元10用于获取用户的来源网站的属性信息,其中,来源网站为用户所浏览的上一个网站;
第一确定单元30用于根据属性信息确定来源网站的兴趣标签;
第一查找单元50用于查找兴趣标签所对应的推送信息;以及
推送单元70用于将推送信息推送给用户。
对于首次浏览网站的新用户来说,由于网站不知道该新用户兴趣信息,无法准确的为新用户推送信息,但是,通常用户浏览网站是从一个网站跳转到另外一个网站。例如,用户在浏览A网站的时候,通过A网站的链接跳转到B网站,那么,A网站就作为该用户的来源网站。
每个网站都有自己的属性,用来体现这个网站的内容属于哪个领域的,例如,有关汽车的内容的网站的属性为汽车,有关女性的网站的属性可以为化妆品、服装等。每个网站的属性可以为一个或者多个,还可以对一个网站的不同频道进行细分,例如,大型门户网站有很多频道,用一个属性信息是无法准确覆盖所有频道的属性信息,因此,可以分别获取不同的频道,甚至不同网页的属性信息。
根据属性信息确定来源网站的兴趣标签,例如,网站的属性为女性,那么兴趣标签可以是美妆、服装等,还可以是具体的化妆品的品牌。在确定了来源网站的兴趣标签之后,可以查找与该兴趣标签对应的推送信息,例如,查找化妆品的品牌,并将化妆品的信息推送给用户。
例如,用户从化妆品网站跳转到某网站的女性频道,通过分析来源网站确定来源网站的兴趣标签为化妆品,则女性频道推送的信息为化妆品的宣传的广告、美容等,如向用户推送A品牌的面霜、B品牌的眼霜等。
上述实施例,由于用户来源网站的内容在一定程度上体现了用户的兴趣关注点,通过分析用户的来源网站的兴趣标签可以体现用户的兴趣点,在没有用户的兴趣点的记录时,将来源网站的兴趣标签作为用户的兴趣点的体现,并将根据兴趣标签找到的推送信息推送给用户,使得推送的信息更加准确的符合用户的兴趣点,使得推送给用户的信息是针对该用户的个性化信息推送的信息,从而解决了现有技术由于仅推送热点信息而不考虑用户的个性化喜好而导致的向用户推荐的兴趣偏好信息不准确的问题,达到了提高向用户推荐的兴趣偏好信息更加准确的效果。
具体地,第一确定单元包括:解析模块,用于从属性信息中解析来源网站的域名;第一查找模块,用于从网站域名标签库中查找域名,其中,网站域名标签库中记录了域名和兴趣标签的对应关系;第二查找模块,用于在查找到域名时,查找与域名对应的兴趣标签;以及输出模块,用于在查找不到域名时,输出未查找到域名的提示信息。
在确定来源网站的兴趣标签时,可以根据网站的域名来解析。网站域名标签库中记录了域名和兴趣标签的对应关系,域名和兴趣标签的对应关系可以是根据网站的属性预先建立的网站域名标签库,利用域名在网站域名标签库中查找该网站域名所对应的兴趣标签,如果查找到该网站域名以及与该网站域名对应的兴趣标签,则将查找到的兴趣标签作为该网站域名的标签,也就是说根据该网站域名查找到的兴趣标签可以作为用户的兴趣标签,根据该兴趣标签查找的推送信息更加准确的贴近用户的兴趣点,从而提高了为用户推送信息的准确性。
进一步地,如果在网站域名标签库中没有查到网站域名,则可以对来源网站的内容进行分析,从而确定来源网站的兴趣标签以便进一步确定向用户推送的推送信息,信息推送装置还包括:提取单元,用于在输出未查找到域名的提示信息之后,提取来源网站的网站内容的特征高频词;第二获取单元,用于获取关联有特征高频词和兴趣标签的用户兴趣高频词库;第二查找单元,用于根据特征高频词从用户兴趣高频词库中查找来源网站的兴趣标签;以及第二确定单元,用于将查找到的兴趣标签作为来源网站的兴趣标签。
提取来源网站的内容的特征高频词,网站内容的特征高频词能够体现来源网站的属性,而该属性又能够体现浏览该网站的用户的兴趣标签,用户兴趣高频词库中的高频词与兴趣标签相对应,例如:来源网站的特征高频词为汽车品牌Z、汽车品牌X,则来源网站的兴趣标签为汽车,则向用户推送的信息可以为汽车相关的推送信息。
优选地,除了根据网站域名、网站内容的特征高频词来查找来源网站的兴趣标签来进行信息推送以外,还可以通过用户的IP地址来确定用户的兴趣标签来,信息推送装置还包括:第三获取单元,用于在获取用户的来源网站的属性信息之后,获取用户的IP地址;划分单元,用于根据用户的IP地址所指示的地理位置划分包括地理位置的预定区域范围;收集单元,用于收集预定区域范围内的用户的兴趣标签;以及选择单元,用于从收集的兴趣标签中选择一个或多个兴趣标签作为用户的兴趣标签。
确定用户的IP地址就能确定IP地址所指示的地理位置,然后以该地理位置为中心划分预定区域范围,并收集该预定区域范围内的用户的兴趣标签,由于通常用户的地理位置会体现用户的兴趣点,根据用户所在的地理区域内的用户的兴趣标签确定该用户的兴趣点。如,该用户的IP地址为北京地区的IP地址,则收集北京地区的所有用户的兴趣点,并对收集的多个兴趣点进行排序,按照具有该兴趣的人数来排队,当关注一个兴趣点的人数越多时,该兴趣点越有可能是该用户的兴趣点。其中,预定区域范围可以是10公里的范围内,当然还可以是更大的范围。
具体地,收集的兴趣标签为多个兴趣标签,收集单元包括:计算单元,用于计算多个兴趣标签中每个兴趣标签所对应的用户的个数;排序单元,用于按照多个兴趣标签所对应的用户的个数进行排序;以及第三确定单元,用于对排序后的多个兴趣标签选择对应的用户的个数最多的兴趣标签作为用户的兴趣标签。
例如,收集到北京地区所有用户的兴趣点为抢购、雾霾、限号、电影、美食等等,而这些兴趣点被关注的人数有多至少依次为雾霾、限号、抢购、美食、电影,则可以选择雾霾、限号作为用户的兴趣标签,并查找与雾霾和限号相关的内容推送给用户,也就是说可以选择收集到的一个或多个兴趣点作为用户的兴趣标签,并将兴趣标签相关的信息推送给用户。
通过上述实施例,根据用户所在的地理位置的预定区域内的多数用户的兴趣来确定用户的兴趣点,由于一个区域内的用户的兴趣点具有共性,因此,通过分析一个区域内的用户的兴趣标签来进行信息推送,避免单一的根据热点信息进行推送,解决现有技术中进行信息推送时不满足用户的兴趣点而导致的推送的信息不准确的问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、移动终端、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。